Критические значения коэффициента стьюдента t критерия. T-критерий Стьюдента для зависимых выборок

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

Пермский государственный университет

Научно-образовательный центр

«Неравновесные переходы в сплошных средах»

Ю.К. Братухин, Г.Ф. Путин

ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Учебное пособие по лабораторному практикуму «Механика»

курса общей физики

Пермь 2003

ББК 22.253.3

УДК 531.7.08 (076.5)

Братухин Ю.К., Путин Г.Ф.

Б 87 Обработка экспериментальных данных: Учебное пособие по лабораторному практикуму «Механика» курса общей физики / Перм. ун-т. – Пермь, 2003. – 80 с.

ISBN 5–7944–0370 5

Пособие предназначено для студентов первого курса физических факультетов университетов, а также студентов других естественно-научных факультетов университетов и технических вузов, приступающих к работе в практикуме по общей физике. Оно составлено в соответствии с действующей программой курса общей физики как введение в курс лабораторных работ. Дается краткое изложение теории, относящееся ко всем заданиям, и описание несколько лабораторных работ, каждую из которых одновременно могут выполнять студенты всей группы. Формулировка задач предусматривает, чтобы исполнение большинства экспериментальных установок было простым и студенты, проделав опыты, сами могли предложить их усовершенствование или, при желании, воспроизвести дома. Поэтому пособие может быть использовано и для самостоятельной работы.

Табл. 10. Ил. 13. Библиогр. 12 назв.

Учебное пособие подготовлено при поддержке Научно-образовательного центра «Неравновесные переходы в сплошных средах»

Печатается по решению Ученого совета физического факультета Пермского университета

Рецензенты:

кафедра прикладной физики Пермского государственного технического университета;

доктор физико-математических наук, профессор А.Ф. Пшеничников

ISBN 5–7944–0370 5 Ó Ю.К.Братухин, Г.Ф.Путин, 2003

1. Правила обработки результатов измерений. . . . . . .5

1.1. Обработка результатов прямых измерений. . . . . . . . . . . . . . . 5

1.2. Обработка результатов косвенных измерений. . . . . . . . . . . . .9

2. Оформление отчетов о лабораторных работах. . 11

3. Введение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12

4. Виды измерений. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15

4.1. Измерение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15

4.2. Прямые измерения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15

4.3. Косвенные измерения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

5. Представление результатов измерений. . . . . . . . . . 16

5.1. Запись результата измерений. . . . . . . . . . . . . . . . . . . . . . . . . .16

5.2. Среднее значение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16

5.3. Истинное значение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17

5.4. Доверительный интервал. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

5.5. Коэффициент надежности. . . . . . . . . . . . . . . . . . . . . . . . . . . . .17

6. Виды погрешностей. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18

6.1. Абсолютная погрешность. . . . . . . . . . . . . . . . . . . . . . . . . . . . .18

6.2. Относительная погрешность. . . . . . . . . . . . . . . . . . . . . . . . . . .18

6.3. Систематическая ошибка. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

6.4. Случайная ошибка. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21

6.5. Промах. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

7. Погрешности измерительных приборов. . . . . . . . . . 23

7.1. Предельная ошибка прибора. . . . . . . . . . . . . . . . . . . . . . . . . . 23

7.2. Класс точности. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24

7.3. Ошибка прибора. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24

7.4. Ошибка округления. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .25

7.5. Суммарная ошибка измерения. . . . . . . . . . . . . . . . . . . . . . . . .25

8. Статистическая обработка результатов

измерений, содержащих случайную ошибку. . . .27

8.1.Обработка результатов прямых измерений. . . . . . . . . . . . . . .27

8.2. Распределение Гаусса. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

8.3. Метод Стьюдента. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31

8.4. Обработка результатов косвенных измерений. . . . . . . . . . . .33

9. Приближенные вычисления при обработке

экспериментальных данных. . . . . . . . . . . . . . . . . . . . . .37

9.1. Число значащих цифр при определении погрешности. . . . . 38

9.2. К вычислению суммарной ошибки измерения. . . . . . . . . . . . 40

9.3. О точности вычислений. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

10. Лабораторные работы по статистической

обработке результатов измерений. . . . . . . . . . . . . . . .42

10.1. Лабораторная работа. Изучение распределения случайной

величины. Газ Лоренца. . . . . . . . . . 44

10.2. Лабораторная работа. Экспериментальное определение

числа π. Игла Бюффона. . . . . . . . . . 55

10.3. Лабораторная работа. Моделирование измерений,

сопровождающихся большой случайной погрешностью. . . . . . . . 64

10.4. Лабораторная работа. Пример оценки погрешности

косвенных измерений. Определение плотности твердого тела. . . . . . . . . 70

10.5. Лабораторная работа. Определение плотности твердого

тела правильной геометрической формы. . . . . . . . . . . . . . . . . . . . . . . . 76

11. Как писать отчеты о лабораторных и

научно-исследовательских работах и

научные статьи. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

БИБЛИОГРАФИЧЕСКИЙ СПИСОК. . . . . . . . . . . . . . . . . . . . . . . 79

В главах 1, 2 кратко приведена последовательность шагов, обязательных при обработке и представлении экспериментальных данных и при оформлении отчетов о лабораторных работах. Подробное изложение этих вопросов содержится в разделах 3 – 11, составляющих основное содержание данного пособия.

1. ПРАВИЛА ОБРАБОТКИ РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ

При обработке результатов измерений предлагается следующий порядок действий.

1.1. Обработка результатов прямых измерений

Прямыми называются измерения, при которых искомая величина считывается непосредственно с прибора.

Пусть в одних и тех же условиях проделано n измерений некоторой физической величины x .

1. Записываем в таблицу в тетради результаты каждого из отдельных измерений x 1 , x 2 , ... x n .

2. Вычисляем среднее арифметическое значение <x > из n измерений

4. Определяем из таблицы 1.1.1 коэффициент Стьюдента t p , n для числа проведенных измерений n (и заданной надежности p = 0.95).

Таблица 1.1.1

Коэффициенты Стьюдента

p = 0.95

6. Вычисляем абсолютную погрешность прибора D пр по формуле

где ω – цена наименьшего деления прибора.

Погрешности прибора ∆ пр и округления ∆ окр для некоторых приборов, применяемых в лабораторном практикуме по механике, указаны в таблице 1.1.2 :

Таблица 1.1.2

Погрешности приборов

p = 0.95

8. Определяем суммарную абсолютную погрешность Dx опыта по формуле


.	(1.1.6) / (7.5.1)

При вычислении Dx по формуле (1.1.6) можно отбросить одну или две из погрешностей D пр и ∆ окр , если их величины вдвое или значительно меньше оставшихся.

9. Округляем абсолютную погрешность Dx (см. параграф 9.1):

Dx = 0.523 0.5 ;

Dx = 0.124 0.12 .

Здесь и в ряде следующих примеров значащие цифры подчеркнуты.

10. Записываем окончательный результат эксперимента в виде

и указываем единицы измерения.

Запись (1.1.7) означает, что истинное значение X измеряемой величины x лежит в доверительном интервале ( - Dx , <x > + Dx ) с вероятностью p , составляющей 95 %.

11. Округляем среднее значение <x > таким образом, чтобы погрешность Dx приходилась (см. параграф 9.1):

· на последний разряд среднего <x >, если Dx записано с одной значащей цифрой

· на два последних разряда среднего <x >, если Dx записано с двумя значащими цифрами

12. Определяем относительную погрешность Dx отн результата серии измерений


Dx отн = Dx/ <x >.	(1.1.10) / (6.2.1)

13. Записываем теоретическое, или табличное, или полученное в других исследованиях и т.д., значение изучаемой нами физической величины x . Приводим подробную ссылку на цитируемый источник.

Например: Табличное значение плотности алюминия при температуре 20° С

ρ = 2.69 г/см 3 .

См.: Таблицы физических величин: Справочник / Под ред. И.К. Кикоина. М.: Атомиздат. 1976. 1006 с. (таблица на с. 121).

14. Сравниваем полученный в наших экспериментах результат с данными предыдущего пункта 13. Если эти результаты значительно различаются, следует установить причины такого расхождения: проверить вычисления; повторить измерения для одного - двух характерных значений параметров.

15. Записываем вывод.

Например: В пределах погрешности эксперимента результаты наших измерений согласуются (не согласуются) с теоретическим, или табличным, или приведенным в цитируемой работе [N] значением. (Расхождение результатов может быть обусловлено следующими причинами: …, или следующими недостатками используемых приборов и методики эксперимента: …).

1.2. Обработка результатов косвенных измерений

Косвенными называются измерения, при которых интересующая нас величина z является функцией k (k 1) непосредственно измеряемых величин x 1 , x 2 ,…, x k :


z = z (x 1 , x 2 ,…, x k ).	(1.2.1)/(8.4.1)

При обработке результатов косвенных измерений наиболее распространен следующий способ.

1. Данные прямых измерений каждого из параметров x 1 , x 2 ,…, x k обрабатываем, как описано в параграфе 1.1:

· Вычисляем средние арифметические значения аргументов , , …, по формуле (1.1.1) ;

· Находим абсолютные погрешности Dx 1 , Dx 2 , …, Dx k измерений каждого из аргументов, пользуясь приведенными выше формулами (1.1.3) – (1.1.6) . При этом для всех аргументов задаем одно и то же значение надежности p = 0.95.

2. Результат косвенного измерения определяем, подставляя найденные средние , , …, от непосредственно измеренных величин в формулу для функции z

где - частные производные функции z , вычисляемые при значениях переменных x 1 = , x 2 = , …, x k = .

Результирующая погрешность Dz имеет ту же надежность p = 0.95.

При вычислении результирующей погрешности по формуле (1.2.3) следует пренебречь теми из слагаемых в подкоренном выражении, которые по крайней мере вдвое меньше оставшихся членов.

Еще один способ обработки результатов косвенных измерений описан далее в параграфе 8.4.

2. ОФОРМЛЕНИЕ ОТЧЕТОВ О ЛАБОРАТОРНЫХ РАБОТАХ

1. Каждая работа должна начинаться с новой страницы.

2. Заголовок работы должен быть выделен.

3. После заголовка необходимо записать краткое Введение, в котором должны быть отражены следующие моменты:

· постановка задачи, какое явление или какая зависимость будут исследованы, что ожидается получить в ходе выполнения работы;

· физические величины, которые будут измеряться в работе; каковы их размерности и единицы измерения;

· описание метода измерений, используемого в работе. При этом обязательно следует схематически нарисовать экспериментальную установку и написать рабочую формулу и формулы для вычисления погрешностей.

4. Экспериментальные результаты следует записывать только в рабочую тетрадь, в заранее заготовленные таблицы. Не следует использовать для этих целей черновики.

5. Если измеряемая величина зависит от внешних условий, например, от температуры или давления, необходимо записать условия эксперимента.

6. Окончательный результат следует записать в конце отчета с указанием доверительного интервала, коэффициента надежности, единиц измерения и внешних условий. Этот результат должен быть выделен.

7. Если возможно, полученный результат необходимо сравнить с имеющимися табличными данными, теоретическими расчетами или результатами экспериментов других авторов, обязательно приведя при этом ссылку на источник этих данных.

8. Если в измерениях содержатся систематические погрешности (например, сила трения, не учтенная в формулах), то указывать доверительный интервал не имеет смысла . В этом случае ограничиваются оценкой точности метода измерений.

9. Для характеристики качества результатов и используемого экспериментального метода рекомендуется всегда оценивать относительную погрешность результата.

10. Все записи в тетради должны быть датированы.

ВВЕДЕНИЕ

Основными задачами лабораторной практики являются:

· знакомство с приборами;

· приобретение опыта в проведении эксперимента;

· иллюстрация теоретических положений физики.

Очевидно, что ни один курс практических работ не сможет включить в себя всю теорию и познакомить со всеми приборами. Поэтому главная задача настоящего практикума - научиться:

· планировать эксперимент так, чтобы точность измерений соответствовала поставленным целям;

· учитывать возможность систематических ошибок и принимать меры для их устранения;

· анализировать результаты эксперимента и делать правильные выводы;

· оценивать точность окончательного результата;

· вести записи измерений и расчетов аккуратно, ясно и кратко.

Познакомиться с приемами практического проведения измерений, статистической обработки их результатов, с методами экспериментальных исследований и указаниями по оформлению результатов, составлению отчетов и написанию научных статей мы рекомендуем по книге Дж. Сквайрса «Практическая физика» .

Предлагаемый лабораторный практикум по механике как одному из разделов физики призван не столько сообщить читателю новые сведения – это уже выполнено школой – сколько помочь ему глубже понять существо более или менее известных фактов и их взаимосвязь. Эта основная наша цель непосредственно связана также с воспитанием творческих способностей и формированием самостоятельного мышления. Такое воспитание может формироваться на следующих основных направлениях: умение обобщать – индукция; умение применять теорию к конкретной задаче – дедукция и, пожалуй, самое важное – умение выявлять противоречия между теоретическими обобщениями и практикой – диалектика.

В теоретической картине, которая Вам преподносится на лекциях, рассматриваются те стороны реального мира, которые теория считает важными. Может получиться так, что Ваше знакомство с миром природы ограничится только этими сторонами, и Вы будете уверены, что это и есть весь реальный мир, а не отдельные его грани. К тому же в такой картине все так хорошо увязано, что легко утратить представление о том, какие усилия потребовались для ее создания. Лучшее лекарство от такой болезни – пойти в лабораторию и там убедиться в сложности реального мира.

Занимаясь экспериментальной физикой, Вы прежде всего узнаете, как трудно бывает проверить теорию, измерить то, что нужно, а не что-то иное, и научитесь преодолевать такие трудности. Вместе с тем, у Вас появится взгляд на физику в целом и на взаимоотношения между теорией и экспериментом.

Чтобы научить оформлению отчетов о научном исследовании (для Вас это обучение разбивается на этапы – лабораторные работы, студенческие научные семинары и конференции, участие в исследованиях кафедры), часть приводимых далее описаний лабораторных работ составлена в стиле статей в научных журналах. О том, как писать научные статьи, подробно говорится в книгах , , где даются практические советы, рекомендации и приводятся образцы. Мы здесь укажем только, что в таких описаниях будем придерживаться общепринятого разбиения статьи на следующие разделы:

· введение с постановкой задачи;

· описание экспериментальной установки и методики измерений;

· результаты эксперимента;

· их анализ и сопоставление с результатами других авторов;

· выводы.

Для всех физиков мира подобная манера изложения стала настолько неотъемлемым профессиональным навыком, что часто служит поводом для шуток и пародий – смотри, например, статьи П. Иордана и Р. де Кронига «Движение нижней челюсти у крупного рогатого скота в процессе пережевывания пищи» и Я. И. Френкеля «К квантовой теории танца» в книге . Не удержались от подобной шутки над штампами и над собой и авторы данного издания, поместив в разделе «Обсуждение результатов» совместной публикации в уважаемом академическом журнале дословную цитату из пародии «Инструкция для читателя научных статей» : «Если принять во внимание приближения, сделанные при анализе, согласие экспериментальных и теоретических результатов следует признать удовлетворительным», но, правда, опустив раскрытый в «Инструкции…» тайный смысл этой фразы: «Согласие вообще отсутствует» - в уверенности, что посвященные поймут этот смысл и без дополнительных разъяснений.

Для того чтобы продемонстрировать, насколько полезно, сообщая экспериментальные данные, указывать не только средние характеристики, но и доверительные интервалы, в пределах которых наиболее вероятно нахождение истинных значений измеряемых величин, а также показать, как могут соотноситься теоретические и экспериментальные результаты при изучении конкретных задач, приведем два графика из упомянутой статьи .

4. ВИДЫ ИЗМЕРЕНИЙ

Измерение

Измерением какой-либо физической величины называется операция, позволяющая узнать, во сколько раз измеряемая величина больше (или меньше) соответствующей величины, принятой за единицу.

Необходимо подчеркнуть, что такое сравнение с эталоном – измерение – должно выполняться в строго определенных условиях и вполне определенным образом. Например, измерение длины предмета предполагает, что эталон неподвижен по отношению к нему, а измерение продолжительности события производится по неподвижным часам. В этом смысле поучителен разбор Эйнштейном понятия одновременности, которое в классической физике не определялось вообще как a priori «очевидное».

Измерения разделяются на прямые и косвенные.

Прямые измерения

Прямыми называются такие измерения, при которых искомая величина сравнивается с единицей измерения непосредственно или при помощи измерительного прибора, проградуированного в соответствующих единицах. Примерами прямых измерений являются измерения длины линейкой или штангенциркулем; измерения масс на рычажных весах с помощью набора разновесов; измерения промежутков времени при помощи часов или секундомера, измерения температуры термометром, напряжения вольтметром и т.п. Значение измеряемой величины отсчитывается при этом по шкале прибора или определяется подсчетом мер, разновесов и т.д.

Косвенные измерения

Косвенными называются измерения, при которых искомая величина находится как функция нескольких непосредственно измеряемых величин. Примерами косвенных измерений могут служить: нахождение плотности твердого тела путем измерения его массы и объема; измерение вязкости жидкости по ее объемному расходу при истечении через круговой капилляр, длине и сечению этого капилляра; или по скорости падения в этой жидкости маленького шарика, его плотности и диаметру и т.п.

Метод позволяет проверить гипотезу о том, что средние значения двух генеральных совокупностей, из которых извлечены сравниваемые зависимые выборки, отличаются друг от друга. Допущение зависимости чаще всего значит, что признак измерен на одной и той же выборке дважды, например, до воздействия и после него. В общем же случае каждому представителю одной выборки поставлен в соответствие представитель из другой выборки (они попарно объединены) так, что два ряда данных положительно коррелируют друг с другом. Более слабые виды зависимости выборок: выборка 1 - мужья, выборка 2 - их жены; выборка 1 - годовалые дети, выборка 2 составлена из близнецов детей выборки 1, и т. д.

Проверяемая статистическая гипотеза, как и в предыдущем случае, Н 0: М 1 = М 2 (средние значения в выборках 1 и 2 равны).При ее отклонении принимается альтернативная гипотеза о том, что М 1 больше (меньше) М 2 .

Исходные предположения для статистической проверки:

□ каждому представителю одной выборки (из одной генеральной совокупности) поставлен в соответствие представитель другой выборки (из другой генеральной совокупности);

□ данные двух выборок положительно коррелируют (образуют пары);

□ распределение изучаемого признака и в той и другой выборке соответствует нормальному закону.

Структура исходных данных: имеется по два значения изучаемого признака для каждого объекта (для каждой пары).

Ограничения: распределения признака и в той, и в другой выборке должно существенно не отличаться от нормального; данные двух измерений, соответствующих той и другой выборке, положительно коррелируют.

Альтернативы: критерий Т-Вилкоксона, если распределение хотя бы для одной выборки существенно отличается от нормального; критерий t-Стьюдента для независимых выборок - если данные для двух выборок не коррелируют положительно.

Формула для эмпирического значения критерия t-Стьюдента отражает тот факт, что единицей анализа различий является разность (сдвиг) значений признака для каждой пары наблюдений. Соответственно, для каждой из N пар значений признака сначала вычисляется разность d i = х 1 i - x 2 i .

(3) где M d – средняя разность значений; σ d – стандартное отклонение разностей.

Пример расчета:

Предположим, в ходе проверки эффективности тренинга каждому из 8 членов группы задавался вопрос «Насколько часто твое мнение совпадаете мнением группы?» - дважды, до и после тренинга. Для ответов использовалась 10-балльная шкала: 1 - никогда, 5 - в половине случаев, 10 - всегда. Проверялась гипотеза о том, что в результате тренинга самооценка конформизма (стремления быть как другие в группе) участников возрастет (α = 0,05). Составим таблицу для промежуточных вычислений (таблица 3).

Таблица 3

Среднее арифметической для разности M d = (-6)/8= -0,75. Вычтем это значение из каждого d (предпоследний столбец таблицы).

Формула для стандартного отклонения отличается лишь тем, что вместо Х в ней фигурирует d.Подставляем все нужные значения, получаем

σ d = = 0,886.

Ш а г 1. Вычисляем эмпирическое значение критерия по формуле (3): средняя разность M d = -0,75; стандартное отклонение σ d = 0,886; t э = 2,39; df = 7.

Ш а г 2. Определяем по таблице критических значений критерия t-Стьюдента р-уровень значимости. Для df = 7 эмпирическое значение находится между критическими для р = 0,05 и р - 0,01. Следовательно, р < 0,05.

df	Р
0,05	0,01	0,001
	2,365	3,499	5,408

Ш а г 3. Принимаем статистическое решение и формулируем вывод. Статистическая гипотеза о равенстве средних значений отклоняется. Вывод: показатель самооценки конформизма участников после тренинга увеличился статистически достоверно (на уровне значимости р < 0,05).

К параметрическим методам относится и сравнение дисперсий двух выборок по критерию F-Фишера. Иногда этот метод приводит к ценным содержательным выводам, а в случае сравнения средних для независимых выборок сравнение дисперсий является обязательной процедурой.

Для вычисления F эмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая знаменателе.

Сравнение дисперсий . Метод позволяет проверить гипотезу о том, что дисперсии двух генеральных совокупностей, из которых извлечены сравниваемые выборки, отличаются друг от друга. Проверяемая статистическая гипотеза Н 0: σ 1 2 = σ 2 2 (дисперсия в выборке 1 равна дисперсии в выборке 2). При ее отклонении принимается альтернативная гипотеза о том, что одна дисперсия больше другой.

Исходные предположения : две выборки извлекаются случайно из разных генеральных совокупностей с нормальным распределением изучаемого признака.

Структура исходных данных: изучаемый признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из двух сравниваемых выборок.

Ограничения: распределения признака и в той, и в другой выборке существенно не отличаются от нормального.

Альтернатива методу: критерий Ливена (Levene"sTest), применение которого не требует проверки предположения о нормальности (используется в программе SPSS).

Формула для эмпирического значения критерия F-Фишера:

(4)

где σ 1 2 - большая дисперсия, a σ 2 2- меньшая дисперсия. Так как заранее не известно, какая дисперсия больше, то для определения р-уровня применяется Таблица критических значений для ненаправленных альтернатив. Если F э > F Kp для соответствующего числа степеней свободы, то р < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Пример расчета:

Детям давались обычные арифметические задания, после чего одной случайно выбранной половине учащихся сообщали, что они не выдержали испытания, а остальным - обратное. Затем у каждого ребенка спрашивали, сколько секунд ему потребовалось бы для решения аналогичной задачи. Экспериментатор вычислял разность между называемым ребенком временем и результатом выполненного задания (в сек.). Ожидалось, что сообщение о неудаче вызовет некоторую неадекватность самооценки ребенка. Проверяемая гипотеза (на уровне α = 0,005) состояла в том, что дисперсия совокупности самооценок не зависит от сообщений об удаче или неудаче (Н 0: σ 1 2=σ 2 2).

Были получены следующие данные:

Ш а г 1. Вычислим эмпирическое значение критерия и числа степеней свободы по формулам (4):

Шаг 2. По таблице критических значений критерия f-Фишера для ненаправленных альтернатив находим критическое значение для df числ = 11; df знам = 11. Однако критическое значение есть только для df числ = 10 и df знам = 12. Большее число степеней свободы брать нельзя, поэтому берем критическое значение для df числ = 10: Для р = 0,05 F Kp = 3,526; для р = 0,01 F Kp = 5,418.

Ш а г 3. Принятие статистического решения и содержательный вывод. Поскольку эмпирическое значение превышает критическое значение для р = 0,01 (и тем более - для р = 0,05), то в данном случае р < 0,01 и принимается альтернативная гипотеза: дисперсия в группе 1 превышает дисперсию в группе 2 (р < 0,01). Следовательно, после сообщения о неудаче неадекватность самооценки выше, чем после сообщения об удаче.

/ практикум-статистика / справочные материалы / значения t-критерия стьюдента

Значение t -критерия Стьюдента при уровне значимости 0,10, 0,05 и 0,01

ν – степени свободы вариации

Стандартные значения критерия Стьюдента

Число степеней свободы	Уровни значимости	Число степеней свободы	Уровни значимости

Таблица XI

Стандартные значения критерия Фишера, используемые для оценки достоверности различий между двумя выборками

Степени свободы	Уровень значимости	Степени свободы	Уровень значимости
Степени свободы		Степени свободы

t-Критерий Стьюдента

t-критерий Стьюдента - общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.

t -статистика строится обычно по следующему общему принципу: в числителе случайная величина с нулевым математическим ожиданием (при выполнении нулевой гипотезы), а в знаменателе - выборочное стандартное отклонение этой случайной величины, получаемое как квадратный корень из несмешенной оценки дисперсии.

История

Данный критерий был разработан Уильямом Госсетом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).

Требования к данным

Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение. В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий. Существуют, однако, альтернативы критерию Стьюдента для ситуации с неравными дисперсиями.

Требование нормальности распределения данных является необходимым для точного t {\displaystyle t} -теста. Однако, даже при других распределениях данных возможно использование t {\displaystyle t} -статистики. Во многих случаях эта статистика асимптотически имеет стандартное нормальное распределение - N (0 , 1) {\displaystyle N(0,1)} , поэтому можно использовать квантили этого распределения. Однако, часто даже в этом случае используют квантили не стандартного нормального распределения, а соответствующего распределения Стьюдента, как в точном t {\displaystyle t} -тесте. Асимптотически они эквивалентны, однако на малых выборках доверительные интервалы распределения Стьюдента шире и надежнее.

Одновыборочный t-критерий

Применяется для проверки нулевой гипотезы H 0: E (X) = m {\displaystyle H_{0}:E(X)=m} о равенстве математического ожидания E (X) {\displaystyle E(X)} некоторому известному значению m {\displaystyle m} .

Очевидно, при выполнении нулевой гипотезы E (X ¯) = m {\displaystyle E({\overline {X}})=m} . С учётом предполагаемой независимости наблюдений V (X ¯) = σ 2 / n {\displaystyle V({\overline {X}})=\sigma ^{2}/n} . Используя несмещенную оценку дисперсии s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) {\displaystyle s_{X}^{2}=\sum _{t=1}^{n}(X_{t}-{\overline {X}})^{2}/(n-1)} получаем следующую t-статистику:

t = X ¯ − m s X / n {\displaystyle t={\frac {{\overline {X}}-m}{s_{X}/{\sqrt {n}}}}}

При нулевой гипотезе распределение этой статистики t (n − 1) {\displaystyle t(n-1)} . Следовательно, при превышении значения статистики по абсолютной величине критического значения данного распределения (при заданном уровне значимости) нулевая гипотеза отвергается.

Двухвыборочный t-критерий для независимых выборок

Пусть имеются две независимые выборки объемами n 1 , n 2 {\displaystyle n_{1}~,~n_{2}} нормально распределенных случайных величин X 1 , X 2 {\displaystyle X_{1},~X_{2}} . Необходимо проверить по выборочным данным нулевую гипотезу равенства математических ожиданий этих случайных величин H 0: M 1 = M 2 {\displaystyle H_{0}:~M_{1}=M_{2}} .

Рассмотрим разность выборочных средних Δ = X ¯ 1 − X ¯ 2 {\displaystyle \Delta ={\overline {X}}_{1}-{\overline {X}}_{2}} . Очевидно, если нулевая гипотеза выполнена E (Δ) = M 1 − M 2 = 0 {\displaystyle E(\Delta)=M_{1}-M_{2}=0} . Дисперсия этой разности равна исходя из независимости выборок: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 {\displaystyle V(\Delta)={\frac {\sigma _{1}^{2}}{n_{1}}}+{\frac {\sigma _{2}^{2}}{n_{2}}}} . Тогда используя несмещенную оценку дисперсии s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 {\displaystyle s^{2}={\frac {\sum _{t=1}^{n}(X_{t}-{\overline {X}})^{2}}{n-1}}} получаем несмещенную оценку дисперсии разности выборочных средних: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 {\displaystyle s_{\Delta }^{2}={\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}}} . Следовательно, t-статистика для проверки нулевой гипотезы равна

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 {\displaystyle t={\frac {{\overline {X}}_{1}-{\overline {X}}_{2}}{\sqrt {{\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}}}}}}

Эта статистика при справедливости нулевой гипотезы имеет распределение t (d f) {\displaystyle t(df)} , где d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1) 2 / (n 1 − 1) + (s 2 2 / n 2) 2 / (n 2 − 1) {\displaystyle df={\frac {(s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2})^{2}}{(s_{1}^{2}/n_{1})^{2}/(n_{1}-1)+(s_{2}^{2}/n_{2})^{2}/(n_{2}-1)}}}

Случай одинаковой дисперсии

В случае, если дисперсии выборок предполагаются одинаковыми, то

V (Δ) = σ 2 (1 n 1 + 1 n 2) {\displaystyle V(\Delta)=\sigma ^{2}\left({\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}\right)}

Тогда t-статистика равна:

T = X ¯ 1 − X ¯ 2 s X 1 n 1 + 1 n 2 , s X = (n 1 − 1) s 1 2 + (n 2 − 1) s 2 2 n 1 + n 2 − 2 {\displaystyle t={\frac {{\overline {X}}_{1}-{\overline {X}}_{2}}{s_{X}{\sqrt {{\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}}}}}~,~~s_{X}={\sqrt {\frac {(n_{1}-1)s_{1}^{2}+(n_{2}-1)s_{2}^{2}}{n_{1}+n_{2}-2}}}}

Эта статистика имеет распределение t (n 1 + n 2 − 2) {\displaystyle t(n_{1}+n_{2}-2)}

Двухвыборочный t-критерий для зависимых выборок

Для вычисления эмпирического значения t {\displaystyle t} -критерия в ситуации проверки гипотезы о различиях между двумя зависимыми выборками (например, двумя пробами одного и того же теста с временным интервалом) применяется следующая формула:

T = M d s d / n {\displaystyle t={\frac {M_{d}}{s_{d}/{\sqrt {n}}}}}

где M d {\displaystyle M_{d}} - средняя разность значений, s d {\displaystyle s_{d}} - стандартное отклонение разностей, а n - количество наблюдений

Эта статистика имеет распределение t (n − 1) {\displaystyle t(n-1)} .

Проверка линейного ограничения на параметры линейной регрессии

С помощью t-теста можно также проверить произвольное (одно) линейное ограничение на параметры линейной регрессии, оцененной обычным методом наименьших квадратов. Пусть необходимо проверить гипотезу H 0: c T b = a {\displaystyle H_{0}:c^{T}b=a} . Очевидно, при выполнении нулевой гипотезы E (c T b ^ − a) = c T E (b ^) − a = 0 {\displaystyle E(c^{T}{\hat {b}}-a)=c^{T}E({\hat {b}})-a=0} . Здесь использовано свойство несмещенности МНК-оценок параметров модели E (b ^) = b {\displaystyle E({\hat {b}})=b} . Кроме того, V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c {\displaystyle V(c^{T}{\hat {b}}-a)=c^{T}V({\hat {b}})c=\sigma ^{2}c^{T}(X^{T}X)^{-1}c} . Используя вместо неизвестной дисперсии её несмещенную оценку s 2 = E S S / (n − k) {\displaystyle s^{2}=ESS/(n-k)} получаем следующую t-статистику:

T = c T b ^ − a s c T (X T X) − 1 c {\displaystyle t={\frac {c^{T}{\hat {b}}-a}{s{\sqrt {c^{T}(X^{T}X)^{-1}c}}}}}

Эта статистика при выполнении нулевой гипотезы имеет распределение t (n − k) {\displaystyle t(n-k)} , поэтому если значение статистики выше критического, то нулевая гипотеза о линейном ограничении отклоняется.

Проверка гипотез о коэффициенте линейной регрессии

Частным случаем линейного ограничения является проверка гипотезы о равенстве коэффициента b j {\displaystyle b_{j}} регрессии некоторому значению a {\displaystyle a} . В этом случае соответстующая t-статистика равна:

T = b ^ j − a s b ^ j {\displaystyle t={\frac {{\hat {b}}_{j}-a}{s_{{\hat {b}}_{j}}}}}

где s b ^ j {\displaystyle s_{{\hat {b}}_{j}}} - стандартная ошибка оценки коэффициента - квадратный корень из соответствующего диагонального элемента ковариационной матрицы оценок коэффициентов.

При справедливости нулевой гипотезы распределение этой статистики - t (n − k) {\displaystyle t(n-k)} . Если значение статистики по абсолютной величине выше критического значения, то отличие коэффициента от a {\displaystyle a} является статистически значимым (неслучайным), в противном случае - незначимым (случайным, то есть истинный коэффициент вероятно равен или очень близок к предполагаемому значению a {\displaystyle a})

Замечание

Одновыборочный тест для математических ожиданий можно свести к проверке линейного ограничения на параметры линейной регрессии. В одновыборочном тесте это «регрессия» на константу. Поэтому s 2 {\displaystyle s^{2}} регрессии это и есть выборочная оценка дисперсии изучаемой случайной величины, матрица X T X {\displaystyle X^{T}X} равна n {\displaystyle n} , а оценка «коэффициента» модели равна выборочному среднему. Отсюда и получаем выражение для t-статистики, приведенное выше для общего случая.

Аналогично можно показать, что двухвыборочный тест при равенстве дисперсий выборок также сводится к проверке линейных ограничений. В двухвыборочном тесте это «регрессия» на константу и фиктивную переменную, идентифицирующую подвыборку в зависимости от значения (0 или 1): y = a + b D {\displaystyle y=a+bD} . Гипотеза о равенстве математических ожиданий выборок может быть сформулирована как гипотеза о равенстве коэффициента b этой модели нулю. Можно показать, что соответствующая t-статистика для проверки этой гипотезы равна t-статистике, приведенной для двухвыборочного теста.

Также к проверке линейного ограничения можно свести и в случае разных дисперсий. В этом случае дисперсия ошибок модели принимает два значения. Исходя из этого можно также получить t-статистику, аналогичную приведенной для двухвыборочного теста.

Непараметрические аналоги

Аналогом двухвыборочного критерия для независимых выборок является U-критерий Манна - Уитни. Для ситуации с зависимыми выборками аналогами являются критерий знаков и T-критерий Вилкоксона

Литература

Student. The probable error of a mean. // Biometrika. 1908. № 6 (1). P. 1-25.

Ссылки

О критериях проверки гипотез об однородности средних на сайте Новосибирского государственного технического университета

t-критерий Стьюдента – общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.

1. История разработки t-критерия

Данный критерий был разработан Уильямом Госсетом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны, статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).

2. Для чего используется t-критерий Стьюдента?

t-критерий Стьюдента используется для определения статистической значимости различий средних величин. Может применяться как в случаях сравнения независимых выборок (например, группы больных сахарным диабетом и группы здоровых ), так и при сравнении связанных совокупностей (например, средняя частота пульса у одних и тех же пациентов до и после приема антиаритмического препарата ).

3. В каких случаях можно использовать t-критерий Стьюдента?

Для применения t-критерия Стьюдента необходимо, чтобы исходные данные имели нормальное распределение . В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства (гомоскедастичности) дисперсий .

При несоблюдении этих условий при сравнении выборочных средних должны использоваться аналогичные методы непараметрической статистики , среди которых наиболее известными являются U-критерий Манна - Уитни (в качестве двухвыборочного критерия для независимых выборок), а также критерий знаков и критерий Вилкоксона (используются в случаях зависимых выборок).

4. Как рассчитать t-критерий Стьюдента?

Для сравнения средних величин t-критерий Стьюдента рассчитывается по следующей формуле:

где М 1 - средняя арифметическая первой сравниваемой совокупности (группы), М 2 - средняя арифметическая второй сравниваемой совокупности (группы), m 1 - средняя ошибка первой средней арифметической, m 2 - средняя ошибка второй средней арифметической.

5. Как интерпретировать значение t-критерия Стьюдента?

Полученное значение t-критерия Стьюдента необходимо правильно интерпретировать. Для этого нам необходимо знать количество исследуемых в каждой группе (n 1 и n 2). Находим число степеней свободы f по следующей формуле:

f = (n 1 + n 2) - 2

После этого определяем критическое значение t-критерия Стьюдента для требуемого уровня значимости (например, p=0,05) и при данном числе степеней свободы f по таблице (см. ниже ).

Сравниваем критическое и рассчитанное значения критерия:

Если рассчитанное значение t-критерия Стьюдента равно или больше критического, найденного по таблице, делаем вывод о статистической значимости различий между сравниваемыми величинами.
Если значение рассчитанного t-критерия Стьюдента меньше табличного, значит различия сравниваемых величин статистически не значимы.

6. Пример расчета t-критерия Стьюдента

Для изучения эффективности нового препарата железа были выбраны две группы пациентов с анемией. В первой группе пациенты в течение двух недель получали новый препарат, а во второй группе - получали плацебо. После этого было проведено измерение уровня гемоглобина в периферической крови. В первой группе средний уровень гемоглобина составил 115,4±1,2 г/л, а во второй - 103,7±2,3 г/л (данные представлены в формате M±m ), сравниваемые совокупности имеют нормальное распределение. При этом численность первой группы составила 34, а второй - 40 пациентов. Необходимо сделать вывод о статистической значимости полученных различий и эффективности нового препарата железа.

Решение: Для оценки значимости различий используем t-критерий Стьюдента, рассчитываемый как разность средних значений, поделенная на сумму квадратов ошибок:

После выполнения расчетов, значение t-критерия оказалось равным 4,51. Находим число степеней свободы как (34 + 40) - 2 = 72. Сравниваем полученное значение t-критерия Стьюдента 4,51 с критическим при р=0,05 значением, указанным в таблице: 1,993. Так как рассчитанное значение критерия больше критического, делаем вывод о том, что наблюдаемые различия статистически значимы (уровень значимости р<0,05).