Параметрические и непараметрические методы статистики. Параметрические и непараметрические процедуры статистического анализа данных

Рассмотренная выше общая стратегия оценки статистических гипотез в первую очередь определяет применение так называемых параметрических методов математической статистики.

Параметрические методы основаны на некоторых, как правило, вполне вероятных предположениях о характере распределения случайной величины. Обычно параметрические методы, используемые в анализе экспериментальных данных, основаны на предположении нормальности распределения этих данных. Следствием такого предположения является необходимость оценки исследуемых параметров распределения. Так, в случае рассматриваемого далее t -теста Стьюдента такими оцениваемыми параметрами являются математическое ожидание и дисперсия. В ряде случаев делаются дополнительные предположения по поводу того, как параметры, характеризующие распределение случайной величины в разных выборках, соотносятся между собой. Так, в тесте Стьюдента, который часто используют для сравнения средних значений (математического ожидания) двух рядов данных на предмет их однородности или неоднородности, дополнительно делается предположение об однородности дисперсий распределения случайных величин в двух генеральных совокупностях, из которых эти данные были извлечены.

Достоинством методов параметрического анализа данных является тот факт, что они обладают достаточно высокой мощностью. Под мощностью теста имеют в виду его способность избегать ошибки второго рода, или β-ошибки. Чем меньше оказывается β-ошибка, тем выше мощность теста. Иными словами, мощность теста = 1 – β.

Высокая мощность параметрических тестов, или критериев, обусловлена тем, что данные методы требуют, чтобы имеющиеся данные были описаны в метрической шкале . Как известно, к метрическим шкалам относят интервальную шкалу и шкалу отношений, которую иногда еще называют абсолютной шкалой. Интервальная шкала позволяет исследователю выяснить не только отношения равенства или неравенства элементов выборки (как это позволяет сделать шкала наименований ) и не только отношения порядка (как это позволяет сделать шкала порядка ), но также и оценивать эквивалентность интервалов. Абсолютная шкала вдобавок к этому позволяет оценивать эквивалентность отношений между элементами множества, полученными в ходе измерения. Именно поэтому метрические шкалы относят к сильным измерительным шкалам. Благодаря этой силе параметрические методы позволяют более точно выразить различия в распределении случайной величины при условии истинности пулевых или альтернативных гипотез.

Следует также отметить, что в целом параметрические методы статистики более разработаны в теории математической статистики и поэтому применяются значительно шире. Практически любой экспериментальный результат может быть оценен с помощью какого-либо из этих методов. Именно такие методы и рассматриваются преимущественно в учебниках и руководствах по статистическому анализу данных.

В то же время трудности, связанные с использованием методов параметрического анализа в статистике, состоят в том, что в ряде случаев априорные предположения о характере распределения исследуемых случайных величин могут оказаться неверными. И эти случаи весьма характерны именно для психологических исследований в тех или иных ситуациях.

Так, если сравнивать две выборки с помощью t -теста Стьюдента, можно обнаружить, что распределение наших данных отличается от нормального, а дисперсии в двух выборках значительно разнятся. В этом случае использование параметрического теста Стьюдента может до некоторой степени исказить выводы, которые хочет сделать исследователь. Такая опасность увеличивается, если значения вычисленной статистики оказываются близкими к граничным значениям квантилей, которые используются для принятия или отвержения гипотез. В большинстве случаев, однако, как, например, в случае использования t -теста, некоторые отклонения от теоретически заданных предположений оказываются некритичными для надежного статистического вывода. В других случаях такие отклонения могут создавать серьезную угрозу такому выводу. Тогда исследователи могут разрабатывать специальные процедуры, которые могут скорректировать процедуру принятия решения по поводу истинности статистических гипотез. Назначение этих процедур состоит в том, чтобы обойти или смягчить слишком жесткие требования параметрических моделей используемой статистики.

Один из вариантов таких действий исследователя, когда он обнаруживает, что полученные им данные по своим параметрам отличаются от того, что задано в структурной модели используемого параметрического теста, может состоять в том, чтобы попытаться преобразовать эти данные к нужному виду. Например, как отмечалось в гл. 1, измеряя время реакции, можно избежать высокого значения асимметрии его распределения, если использовать для анализа логарифмы получаемых значений, а не сами значения времени реакции.

Другой вариант действий состоит в отказе от использования каких-либо априорно заданных предположений о характере распределения случайной величины в генеральной совокупности. А это означает отказ от параметрических методов математической статистики в пользу непараметрических.

Непараметрическими называют методы математической статистики, при которых не выдвигаются какие-либо априорные предположения о характере распределения исследуемых данных и не предполагается каких-либо допущений о соотношении параметров распределения анализируемых величин. В этом заключается главное достоинство этих методов.

В полной мере преимущество непараметрической статистики раскрывается тогда, когда результаты, полученные в эксперименте, оказываются представленными в более слабой неметрической шкале , представляя собой результаты ранжирования. Такая шкала называется шкалой порядка. Конечно, в ряде случаев исследователь может преобразовать эти данные к более сильной интервальной шкале, используя процедуры нормализации данных, но, как правило, оптимальным вариантом в этой ситуации является применение именно непараметрических тестов, специально созданных для статистического анализа.

Как правило, тесты непараметрической статистики предполагают оценивание имеющихся соотношений ранговых сумм в двух или более выборках, и на основании этого формулируется вывод о соотношении этих выборок. Примерами таких тестов являются критерий знаков, критерий знаковых рангов Уилкоксона, а также U-критерий Манна Уитни, которые используются в качестве аналога параметрического t -теста Стьюдента.

В то же время, если результаты измерения оказываются представленными в более сильной шкале, использование непараметрической статистики означает отказ от части информации, содержащейся в данных. Следствием этого является опасность возрастания ошибки второго рода, свойственной этим методам.

Таким образом, методы непараметрической статистики оказываются более консервативными по сравнению с методами параметрической статистики. Их использование грозит в большей мере ошибкой второго рода, т.е. ситуацией, когда исследователь, например, не может обнаружить отличия двух выборок, когда такие отличия на самом деле имеют место. Иными словами, такие методы оказываются менее мощными по сравнению с параметрическими методами. Поэтому использование параметрической статистики в анализе экспериментальных данных, отличающихся от простого ранжирования, как правило, является предпочтительным.

При решении вопросов построения моделей систем особую акту­альность имеет задача формирования исходной информации о парамет­рах элементов, входящих в состав системы. От точности и достовер­ности исходной информации зависит точность оценок анализируемых характеристик систем, точность расчетов по оптимизации стратегий функционирования и правил их обслуживания, решение проблем, связан­ных с прогнозированием поведения системы в будущем, и другие воп­росы. При формировании исходной информации о параметрах элемен­тов, как правило, за основу берется информация, получаемая в ходе проведения обследования систем и изучения опыта ее эксплуатации. Иными словами за основу берется информация о поведении комплек­тующих элементов системы в процессе ее функционирования.

Анализ исходных показателей элементов, узлов, составных частей, который производят на этапах эксплуатации, испытаний, конструкторс­ких разработок, выполняется в целях разрешения следующих вопросов:

    определения фактических значений исследуемых характеристик комплектующих элементов в условиях их реальной эксплуатации;

    выявления взаимосвязи изучаемых характеристик элементов и условий их эксплуатации, анализа влияния на исследуемые показатели вне­шних воздействий;

    прогнозирования поведения вновь создаваемого оборудования.

Таким образом, для решения указанных задач, в первую очередь,

необходимо организовать контроль за поведением оборудования в ре­альных условиях его эксплуатации. В дальнейшем информация, полу­чаемая в процессе эксплуатации объектов, используется для построе­ния моделей систем, в отношении которых проводится анализ.

При проведении экспериментальных исследований большую роль играет информация, полученная в результате наблюдений за объекта­ми, поведение которых имеет вероятностную природу. Изучение таких систем осуществляется по результатам реализации выходных парамет­ров, являющихся случайными величинами. Наиболее общей характе­ристикой, описывающей поведение одномерной случайной величины, является ее плотность распределения / (0- Зная плотность распреде­ления случайной величины, можно однозначно определить такие харак­теристики, как вероятность реализации некоторого события, интенсив­ность наступления события, среднее время между реализациями собы­тий и пр. Приведем формулы, позволяющие оценить соответствующие показатели.

Вероятность реализации события за время t определяется по фор­муле

Q{t) = F(t)=\f(t)dt.

На практике часто находит применение величина, определяемая через функцию распределения следующим образом:

Например, в теории надежности так определяется вероятность бе­зотказной работы.

Среднее время между реализациями событий определяется из соот­ношения

T a =]tf(f)dt=]p(t)dt.

Интенсивность наступления события можно определить по формуле

" _ /(f) _ ClF j t ) I _ dP (t) 1 P(t)dt P{t) dt Pit)"

Таким образом, зная плотность или функцию распределения случай­ной величины, можно перейти к определению характеристик сложной системы. На практике функция распределения бывает неизвестна. Ее приходится восстанавливать по статистическим данным реализации случайной величины. Поскольку статистика о результатах наблюдений всегда присутствует в ограниченном виде, восстановление функции распределения возможно с некоторой долей достоверности. Следова­тельно, если функция распределения оценена с определенной ошибкой,

урЫа

f - т ) 2 ^ 2а 2

" (х-т ) 2 ^ 2 а 2

Вычислим частные производные:

d P N (t,m, o ) _ 1

d m

d P N (t, т, О ) _ д а 2

г г \ т

2 о 2

\ /-J

то и вычисление характеристик системы будет также осуществляться с ошибкой.

Точность оценивания показателей сложных систем характеризует­ся величиной дисперсии. Пусть необходимо произвести оценивание не­которого показателя R(t). Покажем, как определяется дисперсия в его оценке. Будем считать, что показатель R(t ) определяется через функ­цию распределения. Пусть функция распределения зависит от двух па­раметров аир. Примерами двухпараметрических функций являются нормальное распределение, усеченное нормальное, логарифмически нормальное, гамма-распределение, распределение Вейбулла и ряд дру­гих. Итак, пусть F(t) = F(t, а, р). Соответственно оцениваемый показа­тель сложной системы можно представить как функционал от F(t) = F(t, а, р):

K(r) = K = K(f,a,p).

Разложим оценку R ( t) в ряд Тейлора в точке а, р и ограничимся тре­мя членами:

i(0 = K(0+^®(a-a)+^®(p-p).

К обеим частям данного выражения применим операцию вычисле­ния дисперсии

(t- m ) 2

ехр

Нормальное распределение

Плотность нормального закона распределения имеет вид

P n (t, m , о) = 1 -7=- J ехр

F n (t , т, о) = -у=- J ехр

(t-m )

2

Среднее время между реализациями событий определяется по форму­

(t- m) 2 2 a 2

где cov(a, Р) - ковариация между параметрами аир. Таким образом, для оценки дисперсии некоторого показателя необходимо определить ча­стные производные данного показателя по параметрам закона распре­деления и дисперсии в оценке параметров закона распределения.

Рассмотрим вопросы определения частных производных для пока­зателей, введенных выше для конкретных законов" распределения. Оп­ределение дисперсии оценок параметров законов распределения будет описано далее.

В качестве примера рассмотрим определение частных производных оцениваемого показателя по параметрам закона распределения для нормального закона.

Ґ ( t-m) 2 ^

2 с 2

Соответственно частные производные определяются как

d T N (m, a ) 1 7

-- - = - f=~ ехр

d m V2nab

d T N (m , o ) I

i t = Ф

f 2 ~\ m

2 0

\ /

И, наконец, для интенсивности наступления события имеем

X(t, т,о) = -

Одностороннее усеченное нормальное распределение

Плотность распределения усеченного нормального закона с одно­сторонним усечением слева в точке 0 имеет вид

/ (t-m ) 2 ^ 2 а 2

\ І2 по

(X - т) 2 2а 2

\І2по{

Выражения для частных производных имеют вид

dX N (t, m,a ) _ f N (t, m,a )" m (l -F N (t, m,o))-f N (t, m,o )[ l-F N (t, m,o )]" m m

2

d m

с = -

(*-Ю 2 2 Ъ

о yj2nb

, ., t-m I (t-m ) 2

f H (fW O ra =Ir=-T ex PV

Ґ , ч2 4 V

( t-m) 2

( 2 M т

2 а 2

\

7

\ / J

" a2

da 2

2

[( t-m ) 2 - a 2 ] 2л/2лст 3

(t-m )

d x

P (Щ ,Ь) = \- {

(t -m) 2 a 2

m 2O 2

\ =

(t - m) exp

m exp

2 2 по 3

Введем обозначения:

R = J ехр

J

Таким образом, представлены формулы для определения соответ­ствующих производных показателей по параметрам закона распреде­ления для нормального закона. Обобщением нормального закона рас­пределения является усеченное нормальное распределение. Рассмот­рим применение одностороннего усеченного нормального распределе­ния в задачах оценивания показателей сложных систем. В ряде задач системного анализа случайные параметры положительно определены. Примером могут служить задачи теории надежности, в которых слу­чайные параметры имеют область определения от 0 до например, наработка до отказа - величина положительно определенная. В этом случае нормальный закон распределения применять для описания дан­ных случайных величин неправомерно. В таких ситуациях применяют усеченное слева нормальное распределение. Рассмотрим данный слу­чай применительно к оцениванию показателей надежности.

(х-ц) 2 2 Ь

( х - У-У

dx ; Q = j exp

Соответствующие производные имеют вид

Ґ 2\ .Hl

2 Ъ

r," H

d b (Q-Rf

где соответствующие составляющие определяются по формулам

Среднее время между реализациями событий определяется по форму­ле

2 Ь 2

/ . .і \ (*-Ю

S / ч’ ^

л/тс л/тс фГ Г-М-

(Q-W b =^ exp

I^lb I- J l b Jb

Обозначим числитель через L.

Соответствующие производные вычисляются по формулам

Логарифмически-нормальное распределение

Логарифмически-нормальному закону распределения подчиняется случайная величина t, логарифм которой распределен по нормальному закону. Плотность распределения логарифмически-нормального закона имеет вид

КМЬ) _ i;q-% l Jf _ urz _______

"-!Li S )

/ 2 N .й! 2fc

ЩАМ KQ-Ul.

-^ , А,-ех Р

Функция распределения имеет вид

2 Ь 2

Наконец, интенсивность наступления событий равна

(*-10 2 В

2 Ь

где В = Ъ 1 .

Запишем формулы для определения показателей надежности

-M-) 2 2 Ъ

(x -\i .? 2 Ъ

dx -j exp о

Я„(*,И,Д) = I - Jexp

Введем обозначение

Соответствующие производные имеют вид

(*-Ю

M = ехр

2 \

( (I n f -H ) 2 В

Р лн (; , Н.Д ) _ 1 Эн - J l nB

P„Jt,\i,B) 1пг-н

Определим производные интенсивности по параметрам

dk yM (t,№) _ M^jQ-R )- (Q -RY 11 M ЭЦ (Q-R) 2 :

э в


( (г-н) м 2 Ь

Для определения средней наработки до отказа используют формулу

(г-ю 2

M 11 =-т^ехр

; (б-Л)"= ехр

и последнее выражение

Производные равны

дТ ля Ц , р , В ) 1 (в ,

Запишем выражение для вероятности безотказной работы

Выражение для определения интенсивности отказов имеет вид \J t, \i , B) = -

P B (t,a,b) = exp\

K a J

Вычислим производные данного выражения по параметрам распреде­ления:

<У2дВ I 2 В

Э P^(t,a,b) _ b да а

d P B (t, a , b ) _

Частные производные определяются из выражений

Э КЛ^В) _

^ 2

L tjbw в ехр|

(lnf - |X ) 2 2 В

где (/ лн (0)

7 B(a ^) = J ex P

(Inf-(X ) 2 2 В

Э T B (a,b)_~ r b(t

* (t" In

\d f , Э7в(а ^ э ь

дК»ЩВ) (0 ) " й (I - (0 )- /л. (I - F n J t))"

ЭВ 2

* п

Интенсивность отказа равна

(^ b -" , а

Производные по параметрам имеют вид

it, а, Ь )

(1 - F „„) = - I n Vii exp

_ (I n f - (X ) 2 В

Э^а, b ) Ь 2

Э Х в іа,Ь )_Ґ" Ь

да ~ а 2

д Ь а ь а

а ,

Распределение Вейбулла

Плотность распределения Вейбулла имеет вид

f B (t,a,b) = -(-

Гамма-распределение

Плотность гамма-распределения записывается следующим обра­

F B (t,a,b) = 1-ехр

Соответственно функция распределения имеет вид

х, а *

F r (t, X,а) = f х а ~ " exn (-Xx ) dx.

Вероятность безотказной работы вычисляется по формуле

P v (t , X , a) = I fехр(-Xx)dx.

Производные по параметрам равны

і і OcX a4 Jx a4 exp (-Xx) Jx-X a Jx a exp( -Xx)dx

Э Х г (г,а,Х ) _ (f r ( ‘Xa)) K - / r (f ,X, a ); Эа 2

J ехр(-Хх)(а - Xx)dx \

[!-,F r (ZAa)];=-

дР г (t, X , а) _ X 1

Па) і

дР ^да а) = ~ Г^а) I * а ~" ex P(-^t r (a)(ta ^ - 111 0 - Г"(а)]Жс, где Г(а) = J X a t a ~ " ехр(- Xt)dt =J Z a " 1 ехр(-г)<&; Г(а) = J г“"’ exp(-z) In z 4 z

Средняя наработка до отказа определяется по формуле

Г г (о,Х)= J^- e xp (-Xt)d i =~.

оГ(а)X

Соответствующие производные равны

дТ г (а,Х ) а дГ г ( а ,Х) _ 1 ЭХ. X 2 да ~Х"

Интенсивность отказов записывается

X a t a -" е хр (- Xt )

X r (t, а ) =

(f r (t , X ,a )) a = ^-y-^-[(X a InXf a "exp(- Xt)+X a t a 1 Infexp(-Xt))-

X 1 V a " 1 exp(-Xf)r„ (a)];

Г а ((X)X a Jjr a " 1 exp (-Xx) Jx-

t t X а In Xj X а ’ 1 exp (-Xx)dx +X a Jx a 1 Injfexp (-Xx)dx

Таким образом, получены выражения, позволяющие решать вопро­сы оценки точности в определении показателей сложных систем. Рас­смотрены наиболее часто используемые в системном анализе законы распределения. Получены формулы для определения основных показа­телей систем и вычислены первые частные производные показателей по параметрам соответствующих законов распределения. Следующим вопросом, который требует решения, является вопрос оценивания па­раметров выбранного закона распределения. Рассмотрим, как решает­ся данная задача.

Производные по параметрам определяются в виде

d X r ( t,a , X) _ (f r (t X а) ) \ -/ r (t , X,a) 2

где a ^ g " 1 «pW-X-r-exp(-Xr)

Статистические шкалы

Статистическая обработка данных исследования

Статистические данные применяются при обработке материалов психологических исследований для того, чтобы извлечь из тех количественных данных, которые получены в эксперименте, возможно больше полезной информации.

Применение тех или иных статистических методов определяется тем, к какой статистической шкале относится полученный материал.

Шкала наименований. К этой шкале относятся материалы, в которых изучаемые объекты отличаются друг от друга по их качеству, а порядок не важен. Например, распределение участников конференции. При статистической обработке таких материалов нужно считаться с тем, каким числом единиц представлен каждый объект.

Шкала порядка. Порядок следования объектов находится в центре внимания. К этой шкале в статистике относятся такие исследовательские материалы, в которых рассмотрению подлежат объекты, принадлежащие к одному или нескольким классам, но отличающиеся при сравнении одного с другим: больше – меньше, выше – ниже и т.п.

Проще всего показать типические особенности шкалы порядка, если обратиться к итогам любых спортивных соревнований. В них последовательно перечисляются участники, занявшие соответственно первое, второе, третье и прочие

по порядку места, а сведения о фактических достижениях спортсменов отходят на второй план, или отсутствуют.

Шкала интервалов. К ней относятся такие материалы, в которых дана количественная оценка изучаемого объекта в фиксированных единицах. Материалы, соответствующие шкале интервалов, должны иметь единицу измерения, которая была ба при всех повторных измерениях тождественной самой себе.

Шкала отношений. К этой шкале относятся материалы, в которых учитывается не только число фиксированных единиц, как в шкале интервалов, но и отношения полученных суммарных итогов между собой. Чтобы работать с такими отношениями, нужно иметь некую абсолютную точку, от которой и ведется отсчет.

Если данные, которыми располагает исследователь, при их внимательном рассмотрении лишь в незначительной степени расходятся с кривой нормального распределения Гаусса, то это дает право исследователю применять в статистической обработке параметрические методы, исходные положения которых основываются на нормальной кривой распределения Гаусса. Нормальное распределение называют параметрическим потому, что для построения и анализа кривой Гаусса достаточно иметь всего два параметра: среднее арифметическое, значение которого должно соответствовать высоте перпендикуляра, восстановленного в центре кривой, и так называемое среднее квадратическое, или стандартное, отклонение – величины, характеризующей размах колебаний данной кривой.

При невозможности применить параметрические методы, надлежит обратиться к непараметрическим.

Одним из факторов, ограничивающих применения статистических критериев, основанных на предположении нормальности, является объем выборки. До тех пор, пока выборка достаточно большая (например, 100 или больше наблюдений), можно считать, что выборочное распределение нормально, даже если нет уверенности в том, что распределение переменной в генеральной совокупности является нормальным. Тем не менее, если выборка мала, то параметрические критерии следует использовать только при наличии уверенности, что переменная действительно имеет нормальное распределение. Однако и для таких переменных нет способа проверить это предположение на малой выборке (статистические критерии проверки на нормальность эффективно начинают работать на выборке содержащей не менее чем 51 наблюдение).

Непараметрические методы наиболее приемлемы, когда объем выборок мал и данные отнесены к порядковым или номинальным шкалам. Если же эмпирических данных достаточно много (например, n>100), то часто не имеет смысла и даже видится некорректным использовать непараметрическую статистику. Если размер выборки очень мал (например, n=10 или меньше), то уровни значимости р для тех непараметрических критериев, которые используют нормальное приближение, можно рассматривать только как грубые оценки.



Применение критериев, основанных на предположении нормальности, кроме того, ограничено принадлежностью исследуемых признаков к определенной шкале измерений. Такие статистические методы, как, например, t-критерий Стьюдента (для зависимых и независимых выборок), линейная корреляция Пирсона, а также регрессионный, кластерный и факторный анализ предполагают, что исходные данные непрерывны (значения изучаемых переменных отнесены к интервальной шкале или шкале отношений). Однако имеются случаи, когда данные, скорее, просто ранжированы (измерены в порядковой шкале), чем измерены точно. Тогда целесообразным видится использовать такие статистические критерии, как, например, Т-критерий Вилкоксона, G-критерий знаков, U-критерий Манна‑Уитни, Z-критерий Валъда‑Волъфовица, ранговая корреляция Спирмена и др. На номинальных данных будут работать свои статистические методы, например, корреляция качественных признаков, ХИ-квадрат критерий, Q-критерий Кохрена и др. Выбор того или иного критерия сопряжен с гипотезой, которую выдвигает исследователь в ходе научных изысканий, и далее пытается ее доказать на эмпирическом уровне.

Итак, для каждого параметрического критерия имеется, по крайней мере, одна непараметрическая альтернатива. В общем, эти процедуры попадают в одну из следующих категорий: (1) оценка степени зависимости между переменными; (2) критерии различия для независимых выборок; (3) критерии различия для зависимых выборок.

Для оценки зависимости (взаимосвязи), или степени тесноты (плотности, силы) связи, вычисляют коэффициент корреляции Пирсона (r). Строго говоря, его применение имеет также ограничения, связанные, например, с типом шкалы, в которой измерены данные и нелинейностью зависимости. Поэтому в качестве альтернативы используются непараметрические, или так называемые ранговые коэффициенты корреляции (например, коэффициент ранговой корреляции Спирмена (ρ), статистики тау Кендалла (τ), Гамма (Gamma)), применяемые для порядковых (ранжированных) данных. Если имеется более двух переменных, то используют коэффициент конкордации Кендалла (Kendall Coeff. of Concordance). Он применяется, например, для оценки согласованности мнений независимых экспертов (например, баллов, выставленных одному и тому же испытуемому, участнику конкурса).

Если данные измерены в номинальной шкале, то их естественно представлять в таблицах сопряженности, в которых используется критерий ХИ‑квадрат Пирсона с различными вариациями и поправками на точность.

Различия между независимыми группами . Если имеются две выборки (например, юноши и девушки), которые нужно сравнить относительно некоторого среднего значения, например, креативного мышления, то можно использовать t-критерий для независимых выборок (t-test for independent samples). Непараметрическими альтернативами этому тесту являются критерий серий Валъда‑Волъфовица (Wald-Wolfowitz runs test), U-критерий Манна-Уитни (Mann‑Whitney U test) и двухвыборочный критерий Колмогорова-Смирнова (Kolmogorov‑Smirnov two‑sample test). Следует помнить, что двухвыборочный критерий Колмогорова-Смирнова чувствителен не только к различию в положении двух распределений, но также и к форме распределения. Фактически он чувствителен к любому отклонению от гипотезы однородности, но не указывает, с каким именно отклонением исследователь имеет дело.

Различия между зависимыми группами . Если надо сравнить две переменные, относящиеся к одной и той же выборке, например, показатели агрессивности одних и тех же испытуемых до и после коррекционной работы, то обычно используется t-критерий для зависимых выборок (t-test for dependent samples). Альтернативными непараметрическими тестами являются критерий знаков (Sign Test) и критерий Вилкоксона парных сравнений (Wilcoxon matched pair test). Критерий Вилкоксона предполагает, что можно ранжировать различия между сравниваемыми наблюдениями. Если этого сделать нельзя, то используют критерий знаков, который учитывает лишь знаки разностей сравниваемых величин.

Если рассматриваемые переменные категориальные (номинальные), то подходящим является ХИ-квадрат Макнемара (McNemar Chi-square). Если же имеются две категориальные переменные, то для оценки степени зависимости используют стандартные статистики и соответствующие критерии для таблиц сопряженности: ХИ-квадрат (Chi-square), ФИ-коэффициент (Phi-square), точный критерий Фишера (Fisher exact).

В ниже приведенной таблице представлены параметрические критерии и их непараметрические альтернативы с учетом следующих категорий: 1) оценка степени зависимости между переменными; 2) критерии различия.

Таблица 4.1 - Параметрические и непараметрические критерии

Параметрические критерии Непараметрические критерии
оценка зависимости (взаимосвязи)
коэффициент корреляции Пирсона (r) ранговые коэффициенты корреляции (коэффициент ранговой корреляции Спирмена ρ), статистики тау Кендалла (τ), Гамма (Gamma)); ХИ‑квадрат Пирсона (для номинальных данных)
различия между независимыми группами
t-критерий Стьюдента для независимых выборок (t-test for independent samples) Z-критерий серий Валъда‑Волъфовица (Wald-Wolfowitz runs test), U-критерий Манна-Уитни (Mann‑Whitney U test), двухвыборочный критерий Колмогорова-Смирнова (Kolmogorov-Smirnov two‑sample test)
различия между зависимыми группами
t-критерий Стьюдента для зависимых выборок (t-test for dependent samples) G-критерий знаков (Sign Test), T-критерий Вилкоксона парных сравнений (Wilcoxon matched pair test); ХИ-квадрат Макнемара (McNemar Chi-square), ХИ-квадрат (Chi-square), коэффициент ФИ-квадрат (Phi-square), точный критерий Фишера (Fisher exact) (для номинальных данных)

Если рассматривается более двух переменных, относящихся к одной и той же выборке (например, до коррекции, после коррекции-1 и после коррекции-2), то обычно используется дисперсионный анализ с повторными измерениями, который можно рассматривать как обобщение t-критерия для зависимых выборок, позволяющее увеличить чувствительность анализа. Английское сокращение дисперсионного анализа - ANOVA (Analysis of Variation). Дисперсионный анализ позволяет одновременно контролировать не только базовый уровень зависимой переменной, но и другие факторы, а также включать в план эксперимента более одной зависимой переменной. Альтернативными непараметрическими методами являются дисперсионный анализ Краскела-Уоллиса и медианный тест (Kruskal-Wallis ANOVA, median test), ранговый дисперсионный анализ Фридмана (Friedman ANOVA by Ranks).

Вопросы по непараметрическим критериям.

Статистический критерий – решающее правило, обеспечивающее принятие истинной и отклонение ложной гипотезы с высокой вероятностью Одновременно с этим статистический критерий – метод расчета определенного числа и само это число.

Параметрические критерии используются в случае, когда выборка является нормальной, при этом в расчет в данных критериях включены признаки вероятностного распределения признака, то есть средние и дисперсия. При этом предполагается, что данные непрерывны. К параметрическим критериям относятся: t-критерий Стьюдента, критерий хи-квадрат. Подходят для шкал интервальных отношений.

Непараметрические критерии используются, когда нельзя говорить о нормальном распределении, критерии основаны на оперировании рангами или частотами. К непараметрическим относятся критерий знаков, критерий Вилкоксона, критерий Манна-Уитни, Джонкхиер. Подходят для шкал, более слабых, чем интервальные.

Перед выбором критерия мы должны проверить выборку на нормальность.

Я понятия не имею, что написать по мерам среднего и мерам разброса, ибо судя по всему там все те же понятия дисперсии и бла бла прочего *_*

2. Методы проверки статистических гипотез: t-критерий,критерий Вилкоксона, критерий Манна-Уитни,Краскал-Уоллеса(условия применения, формулировка гипотез, распределения статистик, идея расчета)

t-критерий (Стьюдент) – применяется если выборка нормальная. Гипотезы формулируются таким образом:

1. формулируется H0

2. формулируется H1, альтернативная H0 (обычно она свидетельствует о взаимодействии признаков).

3. Выбирается статистика для выбора между двумя гипотезами

4. Для каждого уровня значимости α устанавливается критическая область, где а) попадание результата в эту область свидетельствует скорее об H1, чем об H0 б) вероятность попадания результата в эту область при H0 истинной равна α.

Вероятность допустимой ошибки первого рода α=0,05, если значение критерия по нашей выборке окажется больше t 0,05 , то мы принимает гипотезу H0, отвергаем гипотезу H1.

Для одной выборки

Для независимых выборок.

Критерий знаковых рангов Вилкоксона – рассматривает не значения чисел в выборке, а лишь их знаки. Критерий учитывает абсолютные величины членов выборки. Применяется в случае, когда выборка может не быть нормальной и когда требуется решить, имеет ли выборка существенно отличное от нуля среднее значение. Для применения требуется:

1) Установить уровень значимости α и найти соответствующий нижний квантиль Вилкоксона.


2) Расположить все члены выборки в порядке возрастания абсолютной величины, подписать под ними ранги.

3) Вычислить статистику Вилкоксона, для чего подсчитать сумму рангов, приписанных отрицательным членам выборки.

4) Сравнить полученную статистику с найденным ранее квантилем. Если эта сумма рангов меньше нижнего квантиля, мы отвергаем гипотезу H0, принимает гипотезу H1. Точно так же если сумма рангов всех положительных членов выборки больше верхнего квантиля, мы принимаем H1 и отвергаем H0.

Критерий Манна-Уитни (U) – критерий для независимых выборок, аналог t-критерия Стьюдента. Его эмпирическое значение показывает, насколько совпадают два ряда значений признака. Применяется когда выборка может не быть нормальной, сохраняется лишь требование подобия распределений, но они не обязаны быть нормальными + когда требуется решить проблему, можно ли утверждать о том. Что среднее значение экспериментальной выборки существенно выше среднего значения контрольной группы.

1) Записываем члены обеих выборок в порядке возрастания, выделяя при этом члены различных выборок по-разному.

2) Для каждого числа первой (контрольной) выборки подсчитываем, сколько чисел второй (экспериментальной) выборки расположено левее него. Если число первой выборки равно числу второй, то прибавляем 0,5. Получаем последовательной результатов и складываем ее.

3) Смотрим на выбранном нами уровне значимости нижний квантиль по Манну-Уитни. Если полученная нами сумма меньше нижнего квантиля, то отвергаем гипотезу H0, принимаем гипотезу H1.

Распределение Манна-Уитни симметрично (т.е. можно подсчитывает по обратной схеме и использовать верхнюю квантиль).

Критерий Краскал-Уоллеса – является непараметрическим аналогом однофакторного дисперсионного анализа для независимых выборок. Сходен с критерием Манна-Уитни. Оценивает степень совпадения нескольких рядов значений измененного признака. Основная идея – представление всех значений сравниваемых выборок в виде общей последовательности ранжированных значений с последующим вычислением среднего ранга для каждой из выборок.

Вычисляется после ранжирования.

N – суммарная численность всех выборок.

k – количество сравниваемых выборок.

R i – сумма рангов для конкретной выборки.

n i – численность выборки i.

Чем сильнее различаются выборки, тем больше вычислительное значение H, меньше p-уровень значимости. При отклонении нулевой статистической гипотезы принимается альтернативная о статистически достоверных различиях по данному признаку без конкретизации направления различий. (для направления необходим критерий Манна-Уитни, т.к. он для двух выборок, а этот для больше двух).