Манна уитни. U-критерий Манна-Уитни в дипломной, курсовой и магистерской работе по психологии

Критерий U Манна - Уитни

Назначение критерия. Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда п 1, п 2 > 3 или п Л = 2, п 2 > 5, и является более мощным, чем критерий Q Розенбаума.

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок. Эмпирическое значение критерия и отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше t/ 3Mn , тем более вероятно, что различия достоверны.

Гипотезы.

Уровень невербального интеллекта в группе студентов физиков выше, чем в группе студентов-психологов.

Графическое представление критерия U. Па рис. 7.25 представлены три из множества возможных вариантов соотношения двух рядов значений.

В варианте (а) второй ряд ниже первого, и ряды почти не перекрещиваются. Область наложения (S j) слишком мала, чтобы скрадывать различия между рядами. Есть шанс, что различия между ними достоверны. Точно определить это мы сможем с помощью критерия U.

В варианте (б) второй ряд тоже ниже первого, но и область перекрещивающихся значений у двух рядов достаточно обширна (5 2). Она может еще не достигать критической величины, когда различия придется признать несущественными. Но так ли это, можно определить только путем точного подсчета критерия U.

В варианте (в) второй ряд ниже первого, но область наложения настолько обширна (5 3), что различия между рядами скрадываются.

Рис. 7.25.

в двух выборках

Примечание. Перекрытием (5 t , S 2 , *$з) обозначены зоны возможного наложения. Ограничения критерия U.

  • 1. В каждой выборке должно быть не менее трех наблюдений: n v п 2 > 3; допускается, чтобы в одной выборке было два наблюдения, но тогда во второй их должно быть не менее 5.
  • 2. В каждой выборке должно быть не более 60 наблюдений; п л, п 2 щ, п 2 > 20 ранжирование становится достаточно трудоемким.

Вернемся к результатам обследования студентов физического и психологического факультетов Ленинградского университета с помощью методики Д. Векслера для измерения вербального и невербального интеллекта. С помощью критерия Q Розенбаума было с высоким уровнем значимости определено, что уровень вербального интеллекта в выборке студентов физического факультета выше. Попытаемся установить теперь, воспроизводится ли этот результат при сопоставлении выборок по уровню невербального интеллекта. Данные приведены в таблице.

2 ниже уровня признака в выборке 1 на достоверно значимом уровне. Чем меньше значения U, тем достоверность различий выше.

Теперь проделаем всю эту работу на материале нашего примера. В результате работы по 1-6 шагам алгоритма построим таблицу (табл. 7.4).

Таблица 7.4

Подсчет ранговых сумм по выборкам студентов физического и психологического факультетов

Студенты-физики (п = 14)

Студенты-психологи (п= 12)

Показатель невербального интеллекта

Средние 107,2

Общая сумма рангов: 165 + 186 = 351. Расчетная сумма по формуле (5.1) такова:

Равенство реальной и расчетной сумм соблюдено. Мы видим, что по уровню невербального интеллекта более «высоким» рядом окалывается выборка студентов-психологов. Именно на эту выборку приходится большая ранговая сумма: 186. Теперь мы готовы сформулировать статистические гипотезы:

Я 0: группа студентов-психологов не превосходит группу студентов- физиков по уровню невербального интеллекта;

Я,: группа студентов-психологов превосходит группу студентов-физи- ков по уровню невербального интеллекта.

В соответствии со следующим шагом алгоритма определяем эмпирическую величину U :

Поскольку в нашем случае п л * п 2 , подсчитаем эмпирическую величину U и для второй ранговой суммы (165), подставляя в формулу (7.4) соответствующее ей п х.:

По приложению 8 определяем критические значения для п л = 14, п 2 = 12:

Мы помним, что критерий U является одним из двух исключений из общего правила принятия решения о достоверности различий, а именно, мы можем констатировать достоверные различия, если {/ эмп U Kp 0 05 (при ^эмп = 60, и шп > U Kf) о,05).

Следовательно, Н 0 принимается следующей: группа студентов-психологов не превосходит группы студентов-физиков по уровню невербального интеллекта.

Обратим внимание на то, что для данного случая Q-критерий Розенбаума неприменим, так как размах вариативности в группе физиков шире, чем в группе психологов: и самое высокое, и самое низкое значения невербального интеллекта приходятся на группу физиков (см. табл. 7.4).

Настоящий статистический метод был предложен Фрэнком Вилкоксоном (см. фото) в 1945 году. Однако в 1947 году метод был улучшен и расширен Х. Б. Манном и Д. Р. Уитни, посему U-критерий чаще называют их именами.

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n 1 ,n 2 ≥3 или n 1 =2, n 2 ≥5, и является более мощным, чем критерий Розенбаума.

Описание U-критерия Манна-Уитни

Существует несколько способов использования критерия и несколько вариантов таблиц критических значений, соответствующих этим способам (Гублер Е. В., 1978; Рунион Р., 1982; Захаров В. П., 1985; McCall R., 1970; Krauth J., 1988).

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок (Welkowitz J. et al., 1982).

Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U эмп, тем более вероятно, что различия достоверны.

Гипотезы U - критерия Манна-Уитни

H 0 : Уровень признака в группе 2 не ниже уровня признака в группе 1.
H 1 : Уровень признака в группе 2 ниже уровня признака в группе 1.

Ограничения U-критерия Манна-Уитни

1. В каждой выборке должно быть не менее 3 наблюдений: n 1 ,n 2 ≥ З; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

2. В каждой выборке должно быть не более 60 наблюдений; n 1 , n 2 ≤ 60.

Автоматический расчет U-критерия Манна-Уитни

Шаг 1

Введите в первую колонку («Выборка 1») данные первой выборки, а во вторую колонку («Выборка 2») данные второй выборки. Данные вводятся по одному числу на строку; без пробелов, пропусков и т.д. Вводятся только цифры. Дробные числа вводятся со знаком «.» (точка). После заполнения колонок нажмите на кнопку «Шаг 2», чтобы произвести автоматический расчет U-критерия Манна-Уитни.

U-критерий Манна - Уитни (англ. Mann - Whitney U-test ) - статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.

Wilcoxon rank-sum test ). Реже: критерий числа инверсий.

История

Данный метод выявления различий между выборками был предложен в 1945 году Фрэнком Уилкоксоном (F. Wilcoxon H. B. Mann ) и Д. Р. Уитни (D. R. Whitney

Описание критерия

  1. В выборочных данных не должно быть совпадающих значений (все числа - разные) или таких совпадений должно быть очень мало (до 10).

Использование критерия

  1. Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг. Общее количество рангов получится равным: N = n 1 + n 2 , {\displaystyle N=n_{1}+n_{2},} где n 1 {\displaystyle n_{1}} - количество элементов в первой выборке, а n 2 {\displaystyle n_{2}} - количество элементов во второй выборке.
  2. Разделить единый ранжированный ряд на два, состоящие соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки, и отдельно - на долю элементов второй выборки. Определить большую из двух ранговых сумм (T x {\displaystyle T_{x}}), соответствующую выборке с n x {\displaystyle n_{x}} элементами.
  3. Определить значение U-критерия Манна - Уитни по формуле: U = n 1 ⋅ n 2 + n x ⋅ (n x + 1) 2 − T x . {\displaystyle U=n_{1}\cdot n_{2}+{\frac {n_{x}\cdot (n_{x}+1)}{2}}-T_{x}.}
  4. По таблице для избранного уровня статистической значимости определить критическое значение критерия для данных n 1 {\displaystyle n_{1}} и n 2 {\displaystyle n_{2}} . Если полученное значение U {\displaystyle U} меньше табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза). Если же полученное значение U {\displaystyle U} больше табличного, принимается нулевая гипотеза. Достоверность различий тем выше, чем меньше значение U {\displaystyle U} .
  5. При справедливости нулевой гипотезы критерий имеет математическое ожидание M (U) = n 1 ⋅ n 2 2 {\displaystyle M(U)={\frac {n_{1}\cdot n_{2}}{2}}} и дисперсию D (U) = n 1 ⋅ n 2 ⋅ (n 1 + n 2 + 1) 12 {\displaystyle D(U)={\frac {n_{1}\cdot n_{2}\cdot (n_{1}+n_{2}+1)}{12}}} и при достаточно большом объёме выборочных данных (n 1 > 19 , n 2 > 19) {\displaystyle (n_{1}>19,\;n_{2}>19)} распределён практически нормально.

Таблица критических значений

  • Расчет критических значений U-критерия Манна - Уитни для выборок больше 20 (N>20)(недоступная ссылка с 10-02-2017 )

Критерий Манна-Уитни: пример, таблица

Критерий в математической статистике - это строгое правило, в соответствии с которым гипотеза с определённым уровнем значимости принимается или отвергается. Чтобы построить его, необходимо найти определенную функцию. Она должна зависеть от конечных результатов эксперимента, то есть от эмпирически найденных значений. Именно эта функция будет являться инструментом оценки расхождения между выборками.

Статистически значимая величина. Общие сведения

Статистическая значимость – это величина, вероятность случайного возникновения которой очень мала. Незначительны также и более крайние ее показатели. Разницу называют статистически значимой в том случае, если существуют данные, вероятность появления которых незначительна, если утверждать, что эти расхождения не существуют. Но это не значит вовсе, что эта разница обязательно должна быть велика и значима.

Уровень статистической достоверности теста

Под данным термином следует понимать вероятность отклонения нулевой гипотезы в случае её истинности. Это также называется ошибкой первого рода или ложноположительным решением. В большинстве случаев процесс опирается на p-величину ("пи-величина"). Это накопленная вероятность при наблюдении за уровнем статистического критерия. Он, в свою очередь, насчитывается по выборке во время принятия нулевой гипотезы. Предположение будет отвергнуто, если эта p-величина будет меньше заявленного аналитиком уровня. От этого показателя зависит напрямую значимость тестовой величины: чем она меньше, тем, соответственно, и больше оснований отвергнуть гипотезу.
Уровень значимости, как правило, обозначается буквой б (альфа). Популярные показатели среди специалистов: 0,1%, 1%, 5% и 10%. Если, скажем, говорится, что шансы на совпадения равны 1 к 1000, то определённо речь идёт об уровне 0,1% статистической значимости случайной величины. Различные по значению б-уровни имеют свои плюсы и минусы. Если показатель меньше, то больше вероятность, что альтернативная гипотеза значимая. Хотя при этом возможен риск, что ложное нулевое предположение не будет отвергнуто. Можно сделать вывод, что выбор оптимального б-уровня зависит от баланса "значимость-мощность" или, соответственно, от компромисса вероятностей ложноположительного и ложноотрицательного решений. Синонимом "статистической значимости" в отечественной литературе является термин "достоверность".

Определение нулевой гипотезы

В математической статистике это предположение, проверяемое на согласованность с уже имеющимися в запасе эмпирическими данными. В большинстве случаев в качестве нулевой гипотезы берётся гипотеза о том, что корреляция между исследуемыми переменными отсутствует или что в изучаемых распределениях нет различий однородности. При стандартных исследованиях математик пытается опровергнуть нулевую гипотезу, то есть доказать, что она не согласована с экспериментально полученными данными. Причем должно иметь место и альтернативное предположение, которое принимается вместо нулевого.

Ключевое определение

Критерий U (Манна-Уитни) в математической статистике позволяет оценивать различия двух выборок. Они могут быть даны по уровню некоего признака, который измерен количественно. Этот метод идеален для оценки различий малых выборок. Этот простой критерий был предложен Фрэнком Уилкоксоном в 1945 году. А уже в 1947 году метод был пересмотрен и дополнен учёными Х. Б. Манном и Д. Р. Уитни, именами которых он и именуется по сей день. Критерий Манна-Уитни в психологии, математике, статистике и во многих других науках является одним из основополагающих элементов математического обоснования результатов теоретических исследований.

Описание

Критерий Манна-Уитни - относительно простой метод без параметров. Его мощность значительна. Она существенно выше, чем мощность Q-критерия Розенбаума. Метод оценивает, насколько мала область перекрёстных значений между выборками, а именно между ранжированными рядами значений первой и второй подборки. Чем значение критерия меньше, тем больше вероятность, что расхождения значений параметра достоверны. Чтобы корректно применить критерий U (Манна-Уитни), не стоит забывать о некоторых ограничениях. В каждой выборке должно быть как минимум 3 значения признака. Возможна ситуация, когда в одном случае значений два, но во втором обязательно тогда их должно быть хотя бы пять. В исследуемых выборках должно быть минимальное количество совпадающих показателей. Все числа должны быть разными в идеальном случае.

Использование

Как правильно использовать критерий Манна-Уитни? Таблица, которая составлена по данному методу, содержит определенные критические значения. Для начала нужно создать единый ряд из обеих сопоставленных выборок, который затем ранжируется. То есть элементы выстраиваются по степени нарастания признака, и меньший ранг присваивается меньшему значению. В итоге получим такое общее число рангов:

N = N1 + N2,

где величины N1 и N2 - количество единиц, содержащихся в первой и второй выборках соответственно. Далее единый ранжированный ряд значений делится на две категории. Единицы, соответственно, из первой и второй выборок. Теперь считается по очереди сумма рангов значений в первом и во втором рядах. Определяется большая из них (Tx), которая соответствует выборке с nx единицами. Чтобы использовать метод Уилкоксона далее, вычисляется его значение по следующей методике. Необходимо по таблице для выбранного уровня значимости выяснить критическое значение этого критерия для конкретно взятых N1 и N2.
Получившийся показатель может быть меньше или равен значению из таблицы. В этом случае констатируется значительное различие уровней признака в исследуемых выборках. Если полученное значение больше табличного, тогда нулевая гипотеза принимается. Когда производится расчет критерия Манна-Уитни, следует заметить, что если нулевая гипотеза справедлива, критерий будет иметь математическое ожидание, а также дисперсию. Отметим, что при достаточно больших объёмах данных выборок метод считается практически нормально распределенным. Достоверность различий тем выше, чем меньшее значение принимает критерий Манна-Уитни.

Значения критерия Пирсона (критерия)

  1. Таблицы вероятностей, связанных со значениями критерия Манна-Уитни.

Таблицы вероятностей, связанных со значениями критерия Манна-Уитни. Для экспе­римен­таль­но­го­ значения критерия (меньшего из двух значений) и объемов выборок находят вероятность того, что обе группы принадлежат одной генеральной совокупности. Таким образом, низкое значение вероятности, например, Р

    Таблица 3.

  1. Таблица 4.

  2. Таблица 5.

    1. Таблица 6.

  1. Таблица критических значений критерия Манна-Уитни для уровня значимости .

Если , то различие между выборками достоверно для , то есть нулевую гипотезу следует от­вергнуть.

N 2

N 1

2. U – критерий Манна-Уитни

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n1 и n2 больше или равны 3 (либо n1 = 2, а n2 тогда больше или равно 5.)

Метод определяет, достаточно ли мала зона пересекающихся значений между двумя рядами. Чем меньше эта область, тем более вероятно, что различия достоверны. Эмпирическое (фактически полученное) значение критерия U отражает то, насколько велика зона совпадения между рядами. Чем меньше Uэмп., тем более вероятно, что различия достоверны.

Гипотезы.

Но: Уровень признака в группе 2 не ниже уровня признака в группе 1.

Н1: Уровень признака в группе 2 ниже уровня признака в группе 1.

Ограничения критерия U.

1. В каждой выборке должно быть не менее 3 наблюдений или, в крайнем случае, допускается соотношение 2 к 5 или более.

2. В каждой выборке должно быть не более 60 наблюдений.

Алгоритм подсчета критерия U – Манна-Уитни.

1.Перенести все данные выборок на индивидуальные карточки (на которых цветом или как-то еще будет отражено, к какой из выборок принадлежит значение).

2. Разложить все карточки в общий ряд по мере нарастания признака, не считаясь с тем, к какой выборке они относятся.

3. Проранжировать (согласно алгоритму ранжирования) значения на карточках, приписывая меньшему значению меньший ранг. Всего рангов должно быть n1 + n2 (объем первой выборки + объем второй выборки).

4. Заново разложить карточки в два ряда, по признаку принадлежности к выборке 1 или выборке 2.

6. Определить большую из двух ранговых сумм.

7. Определить значение U по формуле:

8. Определить из таблиц критические значения U, в соответствии с этим, принять либо отклонить гипотезу Но.

3. Н – критерий Крускала - Уоллиса

Критерий Нприменяется для оценки различий по степени выраженности анализируемого признака одновременно между тремя, четырьмя и более выборками. Он позволяет выявить степень изменения признака в выборках, не указывая, однако, на направление этих изменений.

Критерий основан на том принципе, что чем меньше взаимопересечение выборок, тем выше уровень значимости Н эмп . Следует подчеркнуть, что в выборках может быть разное количество испытуемых, хотя в приведенных ниже задачах приводится равное число испытуемых в выборках.

Работа с данными начинается с того, что все выборки условно объединяются по порядку встречающихся величин в одну выборку и значениям этой объединенной выборки проставляются ранги. Затем полученные ранги проставляются исходным выборочным данным и по каждой выборке отдельно подсчитывается сумма рангов. Критерий построен на следующей идее – если различия между выборками незначимы, то и суммы рангов не будут существенно отличаться одна от другой и наоборот.

Величина Н эмп подсчитывается по формуле:

Н эмп

Где N – общее число членов в обобщенной выборке;

n i – число членов в каждой отдельной выборке;

–квадраты сумм рангов по каждой выборке.

При определении критических значений критерия применительно к четырем и более выборкам используют таблицу для критерия хи -квадрат, подсчитав предварительно число степеней свободы v для с = 4. Тогда v = с – 1 = 4 – 1=3..

Подчеркнем, что если использовать критерии, позволяющие сравнивать только два ряда значений, то полученный выше результат потребовал бы шести сравнений – первая выборка со второй, третьей и т.д.

Для использование критерия Н необходимо соблюдать следующие условия:

1. Измерение должно быть проведено в шкале порядка, интервалов или отношений.

2. Выборки должны быть незагисимыми.

3. Допускается разное число испытуемых в сопоставляемых выборках.

4. При сопоставлении трех выборок допускается, чтобы в одной из них было n = 3, а в двух других n = 2. Однако в таком случае различия могут быть зафиксированы лишь на 5 % уровне значимости.

5. Таблица 9 Приложения предусмотрена только для трех выборок и {n 1n 2, n З}, £ 5, то есть максимальное число испытуемых во всех трех выборках может быть меньше и равно 5.

6. При большем числе выборок и разном количестве испытуемых в каждой выборке следует пользоваться таблицей для критерия хи -квадрат. В этом случае число степеней свободы при этом определяется по формуле: v = с – 1, где с – количество сопоставляемых выборок.

U-критерий Манна - Уитни это:

U-критерий Манна - Уитни

U-критерий Манна - Уитни

U-критерий Манна - Уитни (англ. Mann - Whitney U-test ) - статистический критерий, используемый для оценки различий между двумя выборками по уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.

Другие названия: критерий Манна - Уитни - Уилкоксона (англ. Mann - Whitney - Wilcoxon, MWW ), критерий суммы рангов Уилкоксона (англ. Wilcoxon rank-sum test ) или критерий Уилкоксона - Манна - Уитни (англ. Wilcoxon - Mann - Whitney test ).

История

Данный метод выявления различий между выборками был предложен в 1945 году Френком Уилкоксоном (F. Wilcoxon ). В 1947 году он был существенно переработан и расширен Х. Б. Манном (H. B. Mann ) и Д. Р. Уитни (D. R. Whitney ), по именам которых сегодня обычно и называется.

Описание критерия

Простой непараметрический критерий. Мощность критерия выше, чем у Q-критерия Розенбаума.

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны.

Ограничения применимости критерия

  1. В каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было два значения, но во второй тогда не менее пяти.
  2. В выборочных данных не должно быть совпадающих значений (все числа - разные) или таких совпадений должно быть очень мало.

Использование критерия

Для применения U-критерия Манна - Уитни нужно произвести следующие операции.

  • Автоматический расчет U-критерия Манна - Уитни

Таблица критических значений

  • Таблица критических значений U-критерия Манна - Уитни
  • Critical Values for the Mann - Whitney U-Test.

См. также

  • Критерий Краскела - Уоллиса - многомерное обобщение U-критерия Манна - Уитни.

Литература

  • Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. - 1947. - № 18. - P. 50-60.
  • Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. - 1945. - P. 80-83.
  • Гублер Е. В., Генкин А. А. Применение непараметрических критериев статистики в медико-биологических исследованиях. - Л., 1973.
  • Сидоренко Е. В. Методы математической обработки в психологии. - С-Пб., 2002.

Wikimedia Foundation. 2010.

  • U-954
  • U-точка женщины

Смотреть что такое "U-критерий Манна - Уитни" в других словарях:

    U-критерий Манна - U критерий Манна Уитни (англ. Mann Whitney U test) статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять… … Википедия

    U-критерий Манна-Уитни - (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми … Википедия

    Критерий Манна-Уитни

    Критерий Манна-Уитни-Вилкоксона - U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

    Критерий Манна-Уитни-Уилкоксона - U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

    критерий Манна Уитни - - Тематики электросвязь, основные понятия EN Mann Whitney U test … Справочник технического переводчика

    Критерий Вилкоксона-Манна-Уитни - U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

    Критерий Уилкоксона-Манна-Уитни - U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

    Критерий суммы рангов Вилкоксона - U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

    Критерий суммы рангов Уилкоксона - U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

Книги

  • Статистика и котики, Владимир Савельев. Из этой книги вы узнаете, что такое дисперсия и стандартное отклонение, как найти t-критерий Стьюдента и U-критерий Манна-Уитни, для чего используются регрессионный и факторный анализы,… Подробнее Купить за 280 руб электронная книга

U-критерий является ранговым , поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Другие названия: критерий Манна-Уитни-Уилкоксона (Mann-Whitney-Wilcoxon, MWW), критерий суммы рангов Уилкоксона (Wilcoxon rank-sum test) или критерий Уилкоксона-Манна-Уитни (Wilcoxon-Mann-Whitney test, WMW).

Примеры задач

Пример 1. Первая выборка - это пациенты, которых лечили препаратом А. Вторая выборка - пациенты, которых лечили препаратом Б. Значения в выборках - это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.) Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.

Пример 2. Первая выборка - это поля, обработанные агротехническим методом А. Вторая выборка - поля, обработанные агротехническим методом Б. Значения в выборках - это урожайность. Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.

Пример 3. Первая выборка - это дни, когда в супермаркете проходила промо-акция типа А (красные ценники со скидкой). Вторая выборка - дни промо-акции типа Б (каждая пятая пачка бесплатно). Значения в выборках - это показатель эффективности промо-акции (объём продаж, либо выручка в рублях). Требуется выяснить, какой из типов промо-акции более эффективен.

Описание критерия

Заданы две выборки .

Дополнительные предположения:

Иногда ошибочно считают, что U-критерий проверяет нулевую гипотезу равенства медиан в двух выборках. Существуют распределения, для которых гипотеза верна, но их медианы различны.

U-критерий можно применять для проверки гипотезы сдвига в качестве альтернативной , где - некоторая константа, отличная от нуля. При этой альтернативе U-критерий является состоятельным . Его целесообразно применять, если одним и тем же прибором проводятся две серии измерений двух значений некоторой физической величины. При этом функция распределения описывает погрешности измерения одного значения, а - другого. Однако во многих приложениях (в частности, эконометрических) нет особых оснований предполагать, что распределение второй выборки лишь сдвигается, но не меняется каким-либо иным образом.

U-критерий является непараметрическим аналогом критерия Стьюдента . Если выборки нормальные , то для проверки гипотезы сдвига предпочтительно применить более мощный критерий Стьюдента.

История

Данный метод выявления различий между выборками был предложен в 1945 году Френком Уилкоксоном. В 1947 году он был существенно переработан и расширен Манном и Уитни, по именам которых сегодня обычно и называется.

Литература

  1. Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. - 1947, №18. - Pp. 50-60.
  2. Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. 1945. - Pp. 80–83.
  3. Орлов А. И. Эконометрика. - М.: Экзамен, 2003. - 576 с. (§4.5 Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона?)
  4. Кобзарь А. И. Прикладная математическая статистика. - М.: Физматлит, 2006. - 816 с.

Критерий Манна-Уитни представляет непараметрическую альтернативу t -критерия для независимых выборок. Преимущество его состоит в том, что мы отказываемся от предположения нормальности распределения и одинаковых дисперсий. Необходимо, чтобы данные были измерены как минимум в порядковой шкале.

STATISTICA предполагает, что данные расположены тем же образом, что в и t -критерии для независимых выборок. Файл должен содержать кодовую (независимую) переменную, имеющую, по крайней мере, два разных кода для однозначной идентификации принадлежности каждого наблюдения к определенной группе.

Предположения и интерпретация. Критерий Манна-Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Интерпретация теста по существу похожа на интерпретацию результатов t -критерия для независимых выборок, за исключением того, что U критерий вычисляется, как сумма индикаторов попарного сравнения элементов первой выборки с элементами второй выборки. U критерий - наиболее мощная (чувствительная) непараметрическая альтернатива t-критерия для независимых выборок ; фактически, в некоторых случаях он имеет даже большую мощность, чем t -критерий.

Если объем выборки больше 20, то распределение выборки для U статистики быстро сходится к нормальному распределению (см. Siegel, 1956). Поэтому вместе с U статистикой будут показаны z значение (для нормального распределения и соответствующее p -значение.

Точные вероятности для малых выборок. Для выборок малого объема STATISTICA вычислит точную вероятность, связанную с соответствующей U статистикой. Эта вероятность основана на подсчете всех возможных значений U при заданном количестве наблюдений в двух выборках (см. Dinneen & Blakesley, 1973). Программа сообщит (в последнем столбце таблицы результатов) значение 2 * p, где p равно 1 минус кумулятивная (односторонняя) вероятность соответствующей U статистики. Заметим, что это обычно не приводит к большой недооценке статистической значимости соответствующих эффектов (см. Siegel, 1956).

Статистика критерия выглядит следующим образом.

где W - статистика Вилкоксона , предназначенная для проверки этой же гипотезы

в противном случае

Таким образом, статистика U считает общее число тех случаев, в которых элементы второй выборки превосходят элементы первой выборки. Если гипотеза верна, то

Критерий Манна-Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Интерпретация теста по существу похожа на интерпретацию результатов t -критерия для независимых выборок, за исключением того, что U критерий вычисляется, как сумма индикаторов попарного сравнения элементов первой выборки с элементами второй выборки. U критерий - наиболее мощная (чувствительная) непараметрическая альтернатива t -критерия для независимых выборок; фактически, в некоторых случаях он имеет даже большую мощность, чем t -критерий.

Если объем выборки больше 20, то распределение выборки для U статистики быстро сходится к нормальному распределению. Поэтому, вместе с U статистикой, будут показано z значение (для нормального распределения) и соответствующее p -значение.

Подробные инструкции по поводу того, как использовать критерий, вы можете найти дальше в части, касающейся примера применения.

Пример

Проверим гипотезу о принадлежности сравниваемых независимых выборок к одной и той же генеральной совокупности с помощью непараметрического U-критерия Манна-Уитни. Сравним результаты, полученные в примере Основные статистики и t-критерий Стьюдента для 2-го и 3-го столбцов таблицы по критерию Стьюдента, с результатами непараметрического сравнения.

Для расчета U-критерия Уилкоксона расположим варианты сравниваемых выборок в порядке возрастания в один обобщенный ряд и присвоим вариантам обобщенного ряда ранги от 1 до n1 + n2. Первая строка представляет собой варианты первой выборки, вторая - второй выборки, третья - соответствующие ранги в обобщенном ряду:





















Надо обратить внимание, что если имеются одинаковые варианты, им присваивается средний ранг, однако значение последнего ранга должно быть равно n1 + n2 (в нашем случае 20). Это правило используют для проверки правильности ранжирования.

Отдельно для каждой выборки рассчитываем суммы рангов их вариант R1 и R2. В нашем случае:

R1 = 1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69

R2 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141

Для проверки правильности вычислений можно воспользоваться другим правилом: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). В нашем случае R1 + R2 = 210.

Статистика U1 = 69 - 10*11/2 = 14; U2 = 141 - 10*11/2 = 86.

Для проверки одностороннего критерия выбираем минимальную статистику U1 = 14 и сравниваем ее с критическим значением для n1 = n2 = 10 и уровня значимости 1%, равным 19.

Так как вычисленное значение критерия меньше табличного, нулевая гипотеза отвергается на выбранном уровне значимости, и различия между выборками признаются статистически значимыми. Таким образом, вывод о существовании различий, сделанный с помощью параметрического критерия Cтьюдента, подтверждается с помощью данного непараметрического метода.