Manna Whitney. Mann-Whitney U-criterion sa thesis, kurso at master's work sa psychology

Criterion U Mann - Whitney

Pagtatalaga ng pamantayan. Ang pamantayan ay idinisenyo upang masuri ang mga pagkakaiba sa pagitan dalawa mga sample sa pamamagitan ng antas anumang katangian na maaaring mabilang. Ito ay nagpapahintulot sa iyo na makilala sa pagitan ng maliit mga sample kung kailan P 1, n 2 > 3 o p L \u003d 2, p 2\u003e 5, at mas makapangyarihan kaysa sa pamantayan Q Rosenbaum.

Tinutukoy ng pamamaraang ito kung ang lugar ng magkasanib na mga halaga sa pagitan ng dalawang serye ay sapat na maliit. Naaalala namin na tinatawag namin ang 1st row (sample, group) na hilera ng mga halaga kung saan ang mga halaga, ayon sa isang paunang pagtatantya, ay mas mataas, at ang 2nd row ay ang isa kung saan sila ay dapat na mas mababa.

Kung mas maliit ang crossover area, mas malamang na iyon pagkakaiba maaasahan. Ang mga pagkakaibang ito ay minsang tinutukoy bilang mga pagkakaiba sa lokasyon dalawang sample. Ang empirical na halaga ng criterion ay nagpapakita kung gaano kalaki ang zone of coincidence sa pagitan ng mga row. Kaya ang mas kaunti t/ 3Mn , lalo na ito ay malamang na ang mga pagkakaiba maaasahan.

Hypotheses.

Ang antas ng non-verbal intelligence sa pangkat ng mga mag-aaral sa pisika ay mas mataas kaysa sa grupo ng mga mag-aaral sa sikolohiya.

Graphical na representasyon ng isang criterionU. Pa fig. Ang 7.25 ay nagpapakita ng tatlo sa maraming posibleng opsyon para sa ratio ng dalawang serye ng mga halaga.

Sa opsyon (a), ang pangalawang hilera ay mas mababa kaysa sa una, at ang mga hilera ay halos hindi nagsalubong. Overlay area ( S j) masyadong maliit upang itago ang mga pagkakaiba sa pagitan ng mga hilera. May pagkakataon na ang mga pagkakaiba sa pagitan nila ay makabuluhan. Matukoy natin ito nang eksakto gamit ang criterion U.

Sa variant (b), ang pangalawang hilera ay mas mababa din kaysa sa una, ngunit ang lugar ng magkakapatong na mga halaga para sa dalawang hilera ay medyo malawak (5 2). Maaaring hindi pa ito umabot sa isang kritikal na halaga, kapag ang mga pagkakaiba ay kailangang kilalanin bilang hindi gaanong mahalaga. Ngunit kung ito ay gayon ay maaari lamang matukoy sa pamamagitan ng eksaktong pagkalkula ng pamantayan U.

Sa opsyon (c), ang pangalawang row ay mas mababa kaysa sa una, ngunit ang overlap ay napakalawak (5 3) na ang mga pagkakaiba sa pagitan ng mga row ay natatakpan.

kanin. 7.25.

sa dalawang sample

Tandaan. Ang overlap (5 t , S 2 , *$z) ay nagpapahiwatig ng mga lugar ng posibleng overlap. Mga paghihigpit sa pamantayanU.

  • 1. Ang bawat sample ay dapat maglaman ng hindi bababa sa tatlong obserbasyon: n v p 2 > 3; pinapayagan na mayroong dalawang obserbasyon sa isang sample, ngunit pagkatapos ay dapat mayroong hindi bababa sa 5 sa mga ito sa pangalawa.
  • 2. Ang bawat sample ay dapat maglaman ng hindi hihigit sa 60 obserbasyon; p l, p 2 w, n 2 > 20 ranking ay nagiging medyo matrabaho.

Bumalik tayo sa mga resulta ng isang survey ng mga mag-aaral ng pisikal at sikolohikal na faculties ng Leningrad University gamit ang pamamaraan ni D. Veksler para sa pagsukat ng verbal at non-verbal intelligence. Gamit ang criterion Q Rosenbaum, natukoy na may mataas na antas ng kahalagahan na mas mataas ang antas ng verbal intelligence sa sample ng mga mag-aaral ng Faculty of Physics. Subukan natin ngayon na itatag kung ang resulta ay muling ginawa kapag naghahambing ng mga sample ayon sa antas ng non-verbal intelligence. Ang data ay ibinigay sa talahanayan.

2 ay mas mababa sa antas ng katangian sa sample 1 sa isang makabuluhang antas. Mas maliit ang halaga ikaw, mas mataas ang kahalagahan ng mga pagkakaiba.

Ngayon gawin natin ang lahat ng gawaing ito sa materyal ng ating halimbawa. Bilang resulta ng trabaho sa 1-6 na hakbang ng algorithm, bubuo kami ng talahanayan (Talahanayan 7.4).

Talahanayan 7.4

Pagkalkula ng mga kabuuan ng ranggo para sa mga sample ng mga mag-aaral ng mga pisikal at sikolohikal na faculty

Mga mag-aaral sa pisika (P = 14)

Mga mag-aaral ng sikolohiya (n= 12)

Non-verbal intelligence score

Average 107.2

Ang kabuuang halaga ng mga ranggo: 165 + 186 = 351. Ang kinakalkula na halaga ayon sa formula (5.1) ay ang mga sumusunod:

Ang pagkakapantay-pantay ng tunay at tinantyang mga halaga ay sinusunod. Nakikita namin na sa mga tuntunin ng antas ng non-verbal intelligence, ang isang sample ng mga mag-aaral sa sikolohiya ay mas "mas mataas". Ito ang sample na ito na nagsasaalang-alang para sa isang malaking kabuuan ng ranggo: 186. Ngayon handa na kaming magbalangkas ng mga istatistikal na hypotheses:

Sarili 0: ang isang pangkat ng mga mag-aaral sa sikolohiya ay hindi nahihigitan ng isang pangkat ng mga mag-aaral sa pisika sa mga tuntunin ng di-berbal na katalinuhan;

Ako: isang grupo ng mga mag-aaral sa sikolohiya ang higit na mahusay sa isang pangkat ng mga mag-aaral sa pisika sa mga tuntunin ng di-berbal na katalinuhan.

Alinsunod sa susunod na hakbang ng algorithm, tinutukoy namin ang empirical na halaga U :

Dahil sa aming kaso p l * p 2, kalkulahin ang empirical na halaga U at para sa pangalawang ranggo na kabuuan (165), pinapalitan sa formula (7.4) ang katumbas p x.:

Ayon sa Appendix 8, tinutukoy namin ang mga kritikal na halaga para sa p l = 14, n 2 = 12:

Naaalala namin na ang pamantayan U ay isa sa dalawang pagbubukod sa pangkalahatang tuntunin para sa pagpapasya kung ang mga pagkakaiba ay makabuluhan, ibig sabihin, maaari nating sabihin ang mga makabuluhang pagkakaiba kung (/ emp U Kp 0 05 (sa temp = 60, at sp > U Kf) tungkol sa, 05).

Kaya naman, H 0 ay kinuha bilang mga sumusunod: ang pangkat ng mga mag-aaral sa sikolohiya ay hindi nahihigitan ang pangkat ng mga mag-aaral sa pisika sa mga tuntunin ng antas ng di-berbal na katalinuhan.

Bigyang-pansin natin ang katotohanan na para sa kasong ito ang Rosenbaum Q-criterion ay hindi naaangkop, dahil ang saklaw ng pagkakaiba-iba sa pangkat ng mga physicist ay mas malawak kaysa sa pangkat ng mga psychologist: pareho ang pinakamataas at pinakamababang halaga ng hindi- nahuhulog ang verbal intelligence sa grupo ng mga physicist (tingnan ang Talahanayan 7.4).

Ang istatistikal na pamamaraang ito ay iminungkahi ni Frank Wilcoxon (tingnan ang larawan) noong 1945. Gayunpaman, noong 1947, ang pamamaraan ay pinahusay at pinalawak ni H. B. Mann at D. R. Whitney, kaya ang U-test ay mas karaniwang tinutukoy ng kanilang mga pangalan.

Ang criterion ay idinisenyo upang masuri ang mga pagkakaiba sa pagitan ng dalawang sample sa mga tuntunin ng antas ng anumang katangian, na sinusukat sa dami. Binibigyang-daan ka nitong tukuyin ang mga pagkakaiba sa pagitan ng maliliit na sample kapag n 1 ,n 2 ≥3 o n 1 =2, n 2 ≥5, at mas malakas kaysa sa Rosenbaum test.

Paglalarawan ng Mann-Whitney U test

Mayroong ilang mga paraan upang gamitin ang criterion at ilang mga opsyon para sa mga talahanayan ng mga kritikal na halaga na tumutugma sa mga pamamaraang ito (Gubler E. V., 1978; Runion R., 1982; Zakharov V. P., 1985; McCall R., 1970; Krauth J., 1988 ).

Tinutukoy ng pamamaraang ito kung ang lugar ng magkasanib na mga halaga sa pagitan ng dalawang serye ay sapat na maliit. Naaalala namin na tinatawag namin ang 1st row (sample, group) na hilera ng mga halaga kung saan ang mga halaga, ayon sa isang paunang pagtatantya, ay mas mataas, at ang 2nd row ay ang isa kung saan sila ay dapat na mas mababa.

Kung mas maliit ang crossover area, mas malamang na maging makabuluhan ang mga pagkakaiba. Minsan ang mga pagkakaibang ito ay tinatawag na mga pagkakaiba sa lokasyon ng dalawang sample (Welkowitz J. et al., 1982).

Ang empirical na halaga ng U criterion ay nagpapakita kung gaano kalaki ang zone ng coincidence sa pagitan ng mga row. Samakatuwid, ang mas maliit na U emp, mas malamang na ang mga pagkakaiba ay makabuluhan.

Hypotheses U - Mann-Whitney test

H0: Ang antas ng katangian sa pangkat 2 ay hindi mas mababa kaysa sa antas ng katangian sa pangkat 1.
H1: Ang antas ng katangian sa pangkat 2 ay mas mababa kaysa sa antas ng katangian sa pangkat 1.

Mga limitasyon ng pagsubok sa Mann-Whitney U

1. Ang bawat sample ay dapat maglaman ng hindi bababa sa 3 obserbasyon: n 1 ,n 2 ≥ З; pinapayagan na mayroong 2 obserbasyon sa isang sample, ngunit pagkatapos ay dapat mayroong hindi bababa sa 5 sa mga ito sa pangalawa.

2. Ang bawat sample ay dapat maglaman ng hindi hihigit sa 60 obserbasyon; n 1 , n 2 ≤ 60.

Awtomatikong pagkalkula ng Mann-Whitney U-test

Hakbang 1

Ilagay ang data mula sa unang sample sa unang column (“Sample 1”) at ang data mula sa pangalawang sample sa pangalawang column (“Sample 2”). Ang data ay ipinasok ng isang numero sa bawat linya; walang mga puwang, gaps, atbp. Mga numero lamang ang ipinasok. Ang mga fractional na numero ay ipinasok na may "." (tuldok). Pagkatapos punan ang mga column, mag-click sa "Step 2" na buton upang awtomatikong kalkulahin ang Mann-Whitney U-test.

Mann-Whitney U-test(Ingles) Mann-Whitney U-test) ay isang istatistikal na pagsubok na ginagamit upang suriin ang mga pagkakaiba sa pagitan ng dalawang independiyenteng sample sa mga tuntunin ng antas ng anumang katangian, na sinusukat sa dami. Binibigyang-daan kang makakita ng mga pagkakaiba sa halaga ng isang parameter sa pagitan ng maliliit na sample.

Wilcoxon rank-sum test ). Hindi gaanong karaniwan: ang criterion para sa bilang ng mga inversion.

Kwento

Ang pamamaraang ito para sa pag-detect ng mga pagkakaiba sa pagitan ng mga sample ay iminungkahi noong 1945 ni Frank Wilcoxon ( F. WilcoxonH. B. Mann) at D. R. Whitney ( D. R. Whitney

Paglalarawan ng criterion

  1. Dapat ay walang tumutugmang mga halaga sa sample na data (lahat ng mga numero ay iba) o dapat mayroong napakakaunting mga tugma (hanggang 10).

Paggamit ng Criterion

  1. Mag-compile ng isang solong ranggo na serye mula sa parehong pinaghambing na mga sample, inaayos ang kanilang mga elemento ayon sa antas ng paglago ng feature at nagtatalaga ng mas mababang ranggo sa mas mababang halaga. Ang kabuuang bilang ng mga ranggo ay magiging katumbas ng: N = n 1 + n 2 , (\displaystyle N=n_(1)+n_(2),) kung saan ang n 1 (\displaystyle n_(1)) ay ang bilang ng mga elemento sa unang sample, at n 2 (\displaystyle n_(2)) - ang bilang ng mga elemento sa pangalawang sample.
  2. Hatiin ang isang solong ranggo na serye sa dalawa, na binubuo ng mga unit ng una at pangalawang sample, ayon sa pagkakabanggit. Kalkulahin nang hiwalay ang kabuuan ng mga ranggo na nahulog sa bahagi ng mga elemento ng unang sample, at hiwalay - sa bahagi ng mga elemento ng pangalawang sample. Tukuyin malaki ng dalawang rank sums (T x (\displaystyle T_(x))) na tumutugma sa isang sample na may n x (\displaystyle n_(x)) na mga elemento.
  3. Tukuyin ang halaga ng Mann-Whitney U-test gamit ang formula: U = n 1 ⋅ n 2 + n x ⋅ (n x + 1) 2 − T x . (\displaystyle U=n_(1)\cdot n_(2)+(\frac (n_(x)\cdot (n_(x)+1))(2))-T_(x).)
  4. Gamit ang talahanayan para sa napiling antas ng istatistikal na kahalagahan, tukuyin ang kritikal na halaga ng pamantayan para sa data n 1 (\displaystyle n_(1)) at n 2 (\displaystyle n_(2)) . Kung ang natanggap na halaga ay U (\displaystyle U) mas maliit tabular o katumbas nito, kung gayon ang pagkakaroon ng isang makabuluhang pagkakaiba sa pagitan ng antas ng tampok sa mga isinasaalang-alang na mga sample ay kinikilala (isang alternatibong hypothesis ay tinatanggap). Kung ang resultang halaga U (\displaystyle U) ay mas malaki kaysa sa halaga ng talahanayan, tinatanggap ang null hypothesis. Mas mataas ang kahalagahan ng mga pagkakaiba, mas maliit ang halaga ng U (\displaystyle U) .
  5. Kung totoo ang null hypothesis, ang criterion ay may inaasahan M (U) = n 1 ⋅ n 2 2 (\displaystyle M(U)=(\frac (n_(1)\cdot n_(2))(2)) ) at pagkakaiba D (U) = n 1 ⋅ n 2 ⋅ (n 1 + n 2 + 1) 12 (\displaystyle D(U)=(\frac (n_(1)\cdot n_(2)\cdot (n_) (1)+ n_(2)+1))(12))) at may sapat na malaking halaga ng sample na data (n 1 > 19 , n 2 > 19) (\displaystyle (n_(1)>19,\; Ang n_(2)>19 )) ay ipinamamahagi nang halos normal.

Talaan ng mga kritikal na halaga

  • Pagkalkula ng mga kritikal na halaga ng Mann-Whitney U-test para sa mga sample na higit sa 20 (N>20) (downlink mula 10-02-2017 )

Mann-Whitney test: halimbawa, talahanayan

Ang criterion sa mathematical statistics ay isang mahigpit na tuntunin ayon sa kung saan tinatanggap o tinatanggihan ang hypothesis na may tiyak na antas ng kahalagahan. Upang maitayo ito, kailangan mong makahanap ng isang tiyak na function. Dapat itong nakadepende sa mga huling resulta ng eksperimento, iyon ay, sa mga empirically found value. Ang function na ito ang magiging tool para sa pagtatasa ng pagkakaiba sa pagitan ng mga sample.

Istatistikong makabuluhang halaga. Pangkalahatang Impormasyon

Ang kabuluhan ng istatistika ay isang dami na malamang na hindi mangyari sa pamamagitan ng pagkakataon. Ang mga mas matinding tagapagpahiwatig nito ay hindi rin gaanong mahalaga. Ang isang pagkakaiba ay sinasabing makabuluhan ayon sa istatistika kung may mga data na malamang na hindi mangyari, kung ipagpalagay na ang mga pagkakaibang ito ay hindi umiiral. Ngunit hindi ito nangangahulugan na ang pagkakaibang ito ay dapat na malaki at makabuluhan.

Ang antas ng istatistikal na kahalagahan ng pagsusulit

Ang terminong ito ay dapat na maunawaan bilang ang posibilidad ng pagtanggi sa null hypothesis kung ito ay totoo. Tinatawag din itong Type I error o false positive na desisyon. Sa karamihan ng mga kaso, ang proseso ay umaasa sa isang p-value ("pi-value"). Ito ang pinagsama-samang posibilidad kapag sinusunod ang antas ng pamantayang istatistika. Ito naman, ay kinakalkula mula sa sample sa oras ng pagtanggap ng null hypothesis. Ang pagpapalagay ay tatanggihan kung ang p-value na ito ay mas mababa sa antas na idineklara ng analyst. Ang kahalagahan ng halaga ng pagsubok ay direktang nakasalalay sa tagapagpahiwatig na ito: mas maliit ito, mas maraming dahilan upang tanggihan ang hypothesis, ayon sa pagkakabanggit.
Ang antas ng kahalagahan ay karaniwang tinutukoy ng titik b (alpha). Mga sikat na tagapagpahiwatig sa mga espesyalista: 0.1%, 1%, 5% at 10%. Kung, sabihin nating, sinabi na ang mga pagkakataon ng pagkakataon ay 1 sa 1000, kung gayon tiyak na pinag-uusapan natin ang antas ng 0.1% ng istatistikal na kahalagahan ng isang random na variable. Ang iba't ibang b-level ay may mga kalamangan at kahinaan. Kung mas mababa ang marka, mas malamang na maging makabuluhan ang alternatibong hypothesis. Gayunpaman, may panganib na ang maling null na hula ay hindi tatanggihan. Mahihinuha na ang pagpili ng pinakamainam na b-level ay nakasalalay sa balanse ng "significance-power" o, nang naaayon, sa trade-off ng mga probabilidad ng maling positibo at maling negatibong mga desisyon. Ang kasingkahulugan ng "statistical significance" sa domestic literature ay ang terminong "reliability".

Null Hypothesis Definition

Sa mathematical statistics, ito ay isang assumption na sinusubok para sa consistency ng empirical data na nasa stock na. Sa karamihan ng mga kaso, ang null hypothesis ay ang hypothesis na walang ugnayan sa pagitan ng mga variable na pinag-aaralan o na walang mga pagkakaiba sa homogeneity sa mga distribusyon na pinag-aaralan. Sa karaniwang pananaliksik, sinusubukan ng isang mathematician na pabulaanan ang null hypothesis, iyon ay, upang patunayan na hindi ito pare-pareho sa pang-eksperimentong data. Bukod dito, dapat mayroong isang alternatibong palagay, na kinuha sa halip na ang zero one.

Pangunahing Kahulugan

Ang U criterion (Mann-Whitney) sa mathematical statistics ay nagpapahintulot sa iyo na suriin ang mga pagkakaiba sa pagitan ng dalawang sample. Maaari silang ibigay ayon sa antas ng ilang katangian, na sinusukat sa dami. Ang pamamaraang ito ay perpekto para sa pagtantya ng mga pagkakaiba sa maliliit na sample. Ang simpleng pamantayang ito ay iminungkahi ni Frank Wilcoxon noong 1945. At noong 1947, ang pamamaraan ay binago at dinagdagan ng mga siyentipiko na sina H. B. Mann at D. R. Whitney, na ang mga pangalan ay tinawag hanggang ngayon. Ang Mann-Whitney criterion sa psychology, mathematics, statistics at marami pang ibang agham ay isa sa mga pangunahing elemento ng mathematical substantiation ng mga resulta ng theoretical research.

Paglalarawan

Ang pagsubok ng Mann-Whitney ay isang medyo simpleng pamamaraan na walang mga parameter. Ang kapangyarihan nito ay makabuluhan. Ito ay mas mataas kaysa sa kapangyarihan ng Rosenbaum Q-test. Sinusuri ng pamamaraan kung gaano kaliit ang lugar ng mga cross value sa pagitan ng mga sample, lalo na sa pagitan ng ranggo na serye ng mga halaga ng una at pangalawang set. Kung mas maliit ang halaga ng pamantayan, mas malamang na maaasahan ang mga pagkakaiba sa halaga ng parameter. Upang mailapat nang tama ang pamantayang U (Mann-Whitney), hindi dapat kalimutan ng isa ang tungkol sa ilang mga limitasyon. Ang bawat sample ay dapat maglaman ng hindi bababa sa 3 mga halaga ng tampok. Posible na sa isang kaso mayroong dalawang halaga, ngunit sa pangalawang kaso ay dapat mayroong hindi bababa sa lima sa kanila. Sa mga pinag-aralan na sample, dapat mayroong pinakamababang bilang ng mga tumutugmang tagapagpahiwatig. Ang lahat ng mga numero ay dapat na naiiba sa perpektong.

Paggamit

Paano gamitin nang tama ang Mann-Whitney test? Ang talahanayan na pinagsama-sama ng paraang ito ay naglalaman ng ilang mga kritikal na halaga. Ang unang hakbang ay ang gumawa ng isang serye mula sa parehong mga tugmang sample, na pagkatapos ay niraranggo. Iyon ay, ang mga elemento ay naka-linya ayon sa antas ng paglago ng katangian, at ang isang mas mababang ranggo ay itinalaga sa isang mas mababang halaga. Bilang resulta, nakukuha namin ang sumusunod na kabuuang bilang ng mga ranggo:

N = N1 + N2,

kung saan ang mga halaga ng N1 at N2 ay ang bilang ng mga yunit na nilalaman sa una at pangalawang sample, ayon sa pagkakabanggit. Dagdag pa, ang isang solong ranggo na serye ng mga halaga ay nahahati sa dalawang kategorya. Mga yunit, ayon sa pagkakabanggit, mula sa una at pangalawang sample. Ngayon ang kabuuan ng mga ranggo ng mga halaga sa una at pangalawang hilera ay kinakalkula sa turn. Ang pinakamalaki sa kanila (Tx) ay tinutukoy, na tumutugma sa isang sample na may mga nx unit. Upang magamit pa ang pamamaraang Wilcoxon, ang halaga nito ay kinakalkula sa pamamagitan ng sumusunod na pamamaraan. Kinakailangang malaman mula sa talahanayan para sa napiling antas ng kahalagahan ang kritikal na halaga ng pamantayang ito para sa partikular na kinuhang N1 at N2.
Ang resultang tagapagpahiwatig ay maaaring mas mababa sa o katumbas ng halaga mula sa talahanayan. Sa kasong ito, nakasaad ang isang makabuluhang pagkakaiba sa mga antas ng katangian sa mga pinag-aralan na sample. Kung ang nakuhang halaga ay mas malaki kaysa sa halaga ng talahanayan, ang null hypothesis ay tinatanggap. Kapag kinakalkula ang Mann-Whitney test, dapat tandaan na kung ang null hypothesis ay totoo, ang pagsubok ay magkakaroon ng mean pati na rin ang pagkakaiba. Tandaan na para sa sapat na malalaking volume ng sample na data, ang pamamaraan ay itinuturing na halos normal na ipinamamahagi. Ang kahalagahan ng mga pagkakaiba ay mas mataas, mas mababa ang halaga ng Mann-Whitney test.

Mga halaga ng criterion ng Pearson (criterion)

  1. Mga talahanayan ng mga probabilidad na nauugnay sa mga halaga ng pagsubok ng Mann-Whitney.

Mga talahanayan ng mga probabilidad na nauugnay sa mga halaga ng pagsubok ng Mann-Whitney. Para sa pang-eksperimentong halaga ng criterion (ang mas maliit sa dalawang halaga) at mga laki ng sample, hanapin ang posibilidad na ang parehong grupo ay kabilang sa parehong pangkalahatang populasyon. Kaya, ang isang mababang halaga ng posibilidad, halimbawa, P

    Talahanayan 3

  1. Talahanayan 4

  2. Talahanayan 5

    1. Talahanayan 6

  1. Talaan ng mga kritikal na halaga ng pagsubok ng Mann-Whitney para sa antas ng kahalagahan.

Kung , kung gayon ang pagkakaiba sa pagitan ng mga sample ay makabuluhan para sa , ibig sabihin, ang null hypothesis ay dapat tanggihan.

N 2

N 1

2. U - Mann-Whitney test

Ang criterion ay idinisenyo upang masuri ang mga pagkakaiba sa pagitan ng dalawang sample sa mga tuntunin ng antas ng anumang katangian, na sinusukat sa dami. Binibigyang-daan ka nitong makita ang mga pagkakaiba sa pagitan ng maliliit na sample kapag ang n1 at n2 ay mas malaki sa o katumbas ng 3 (o n1 = 2, at ang n2 ay mas malaki sa o katumbas ng 5.)

Tinutukoy ng pamamaraan kung ang lugar ng magkakapatong na mga halaga sa pagitan ng dalawang serye ay sapat na maliit. Ang mas maliit na lugar na ito, mas malamang na ang mga pagkakaiba ay makabuluhan. Ang empirical (aktwal na nakuha) na halaga ng U criterion ay nagpapakita kung gaano kalaki ang zone ng coincidence sa pagitan ng mga row. Ang mas mababang Uemp., mas malamang na ang mga pagkakaiba ay makabuluhan.

Hypotheses.

Ngunit: Ang antas ng katangian sa pangkat 2 ay hindi mas mababa kaysa sa antas ng katangian sa pangkat 1.

H1: Ang antas ng katangian sa pangkat 2 ay mas mababa kaysa sa antas ng katangian sa pangkat 1.

Mga limitasyon ng pamantayang U.

1. Dapat mayroong hindi bababa sa 3 obserbasyon sa bawat sample o, sa matinding kaso, pinapayagan ang ratio na 2 hanggang 5 o higit pa.

2. Dapat ay hindi hihigit sa 60 obserbasyon sa bawat sample.

Algorithm para sa pagkalkula ng criterion U - Mann-Whitney.

1. Ilipat ang lahat ng sample na data sa mga indibidwal na card (kung saan ito ay makikita sa kulay o sa ibang paraan kung saan sa mga sample nabibilang ang halaga).

2. Ilatag ang lahat ng mga card sa isang karaniwang hilera habang tumataas ang karatula, hindi alintana kung saang sample sila kabilang.

3. Ranggo (ayon sa algorithm ng pagraranggo) ang mga halaga sa mga card, na nagtatalaga ng mas mababang ranggo sa mas mababang halaga. Dapat ay mayroong n1 + n2 na ranggo sa kabuuan (ang laki ng unang sample + ang laki ng pangalawang sample).

4. Muling ayusin ang mga card sa dalawang hanay, batay sa pag-aari sa sample 1 o sample 2.

6. Tukuyin ang mas malaki sa dalawang rank sums.

7. Tukuyin ang halaga ng U sa pamamagitan ng formula:

8. Tukuyin mula sa mga talahanayan ang mga kritikal na halaga ng U, alinsunod dito, tanggapin o tanggihan ang hypothesis No.

3. H - Kruskal - Wallis na pamantayan

Ang H criterion ay ginagamit upang masuri ang mga pagkakaiba sa kalubhaan ng nasuri na katangian nang sabay-sabay sa pagitan ng tatlo, apat o higit pang mga sample. Pinapayagan ka nitong tukuyin ang antas ng pagbabago sa katangian sa mga sample, nang hindi ipinapahiwatig, gayunpaman, ang direksyon ng mga pagbabagong ito.

Ang criterion ay batay sa prinsipyo na mas maliit ang overlap ng mga sample, mas mataas ang antas ng kahalagahan. H emp . Dapat bigyang-diin na maaaring may ibang bilang ng mga paksa sa mga sample, bagama't sa mga gawain sa ibaba, isang pantay na bilang ng mga paksa sa mga sample ang ibinibigay.

Ang pagtatrabaho sa data ay nagsisimula sa katotohanan na ang lahat ng mga sample ay kondisyon na pinagsama sa pagkakasunud-sunod ng mga nagaganap na halaga sa isang sample, at ang mga halaga ng pinagsamang sample na ito ay niraranggo. Pagkatapos, ang mga nakuhang ranggo ay ikinakabit sa orihinal na sample na data, at ang kabuuan ng mga ranggo ay kinakalkula nang hiwalay para sa bawat sample. Ang pamantayan ay batay sa sumusunod na ideya - kung ang mga pagkakaiba sa pagitan ng mga sample ay hindi gaanong mahalaga, kung gayon ang mga kabuuan ng mga ranggo ay hindi mag-iiba nang malaki sa isa't isa at vice versa.

Halaga H emp kinakalkula ng formula:

H emp

saan N ay ang kabuuang bilang ng mga miyembro sa pangkalahatang sample;

n i ay ang bilang ng mga miyembro sa bawat indibidwal na sample;

ay ang mga parisukat ng mga kabuuan ng mga ranggo para sa bawat sample.

Kapag tinutukoy ang mga kritikal na halaga ng criterion para sa apat o higit pang mga sample, gamitin ang talahanayan para sa criterion hee-square, na dati nang nakalkula ang bilang ng mga antas ng kalayaan v para sa c = 4. Pagkatapos v = c - 1 = 4 – 1=3..

Binibigyang-diin namin na kung gagamit kami ng pamantayan na nagpapahintulot sa amin na ihambing ang dalawang serye lamang ng mga halaga, kung gayon ang resulta na nakuha sa itaas ay mangangailangan ng anim na paghahambing - ang unang sample sa pangalawa, pangatlo, atbp.

Upang gamitin ang pamantayan H ang mga sumusunod na kondisyon ay dapat matugunan:

1. Ang pagsukat ay dapat gawin sa isang sukat ng pagkakasunud-sunod, mga pagitan o mga ratio.

2. Dapat na independyente ang mga sample.

3. Pinahihintulutan ang ibang bilang ng mga paksa sa inihambing na mga sample.

4. Kapag naghahambing ng tatlong sample, pinapayagan na ang isa sa mga ito ay naglalaman n = 3, at sa iba pang dalawa n = 2. Gayunpaman, sa kasong ito, ang mga pagkakaiba ay maaaring maitala lamang sa 5% na antas ng kahalagahan.

5. Ang Talahanayan 9 ng Appendix ay ibinigay para lamang sa tatlong sample at ( n 1n 2, n H), £ 5, ibig sabihin, ang maximum na bilang ng mga paksa sa lahat ng tatlong sample ay maaaring mas mababa sa at katumbas ng 5.

6. Sa mas malaking bilang ng mga sample at ibang bilang ng mga paksa sa bawat sample, dapat mong gamitin ang talahanayan para sa criterion hee-parisukat. Sa kasong ito, ang bilang ng mga antas ng kalayaan ay tinutukoy ng formula: v = may- 1, saan may- ang bilang ng mga katugmang sample.

Ang Mann-Whitney U-test ay:

Mann-Whitney U-test

Mann-Whitney U-test

Mann-Whitney U-test(Ingles) Mann-Whitney U-test) ay isang istatistikal na pamantayan na ginagamit upang suriin ang mga pagkakaiba sa pagitan ng dalawang sample sa mga tuntunin ng antas ng ilang katangian, na sinusukat sa dami. Binibigyang-daan kang makakita ng mga pagkakaiba sa halaga ng isang parameter sa pagitan ng maliliit na sample.

Iba pang mga pangalan: Mann-Whitney-Wilcoxon test Mann-Whitney-Wilcoxon, MWW), ang Wilcoxon rank sum test (eng. Wilcoxon rank-sum test) o ang Wilcoxon-Mann-Whitney test (eng. Wilcoxon - Mann - Whitney test).

Kwento

Ang pamamaraang ito ng pag-detect ng mga pagkakaiba sa pagitan ng mga sample ay iminungkahi noong 1945 ni Frank Wilcoxon ( F. Wilcoxon). Noong 1947 ito ay lubos na binago at pinalawak ni H. B. Mann ( H. B. Mann) at D. R. Whitney ( D. R. Whitney), kung saan ang mga pangalan ay karaniwang tinatawag ngayon.

Paglalarawan ng criterion

Isang simpleng nonparametric na pagsubok. Ang kapangyarihan ng pagsubok ay mas mataas kaysa sa Rosenbaum Q-test.

Tinutukoy ng pamamaraang ito kung ang lugar ng magkakapatong na mga halaga sa pagitan ng dalawang serye (ang ranggo na serye ng mga halaga ng parameter sa unang sample at pareho sa pangalawang sample) ay sapat na maliit. Ang mas maliit na halaga ng criterion, mas malamang na ang mga pagkakaiba sa pagitan ng mga halaga ng parameter sa mga sample ay makabuluhan.

Mga Limitasyon sa Pagkakagamit ng Pamantayan

  1. Ang bawat isa sa mga sample ay dapat maglaman ng hindi bababa sa 3 mga halaga ng tampok. Pinapayagan na sa isang sample mayroong dalawang halaga, ngunit sa pangalawa mayroong hindi bababa sa lima.
  2. Dapat ay walang tumutugmang mga halaga sa sample na data (lahat ng mga numero ay naiiba) o dapat mayroong napakakaunting mga tugma.

Paggamit ng Criterion

Upang mailapat ang Mann-Whitney U-test, kailangan mong gawin ang mga sumusunod na operasyon.

  • Awtomatikong pagkalkula ng Mann-Whitney U-test

Talaan ng mga kritikal na halaga

  • Talaan ng mga kritikal na halaga ng Mann-Whitney U-test
  • Mga Kritikal na Halaga para sa Mann - Whitney U-Test.

Tingnan din

  • Ang Kruskal-Wallis test ay isang multivariate generalization ng Mann-Whitney U-test.

Panitikan

  • Mann H.B., Whitney D.R. Sa isang pagsubok kung ang isa sa dalawang random na variable ay stochastically mas malaki kaysa sa isa. // Mga Annals ng Mathematical Statistics. - 1947. - Hindi. 18. - P. 50-60.
  • Wilcoxon F. Mga Indibidwal na Paghahambing ayon sa Mga Paraan ng Pagraranggo. // Biometrics Bulletin 1. - 1945. - P. 80-83.
  • Gubler E. V., Genkin A. A. Application ng non-parametric statistics criteria sa biomedical research. - L., 1973.
  • Sidorenko E.V. Mga pamamaraan ng pagproseso ng matematika sa sikolohiya. - St. Petersburg, 2002.

Wikimedia Foundation. 2010.

  • U-954
  • U-point na mga babae

Tingnan kung ano ang "Mann-Whitney U-test" sa ibang mga diksyunaryo:

    Mann U-test- U test Mann Whitney (eng. Mann Whitney U test) ay isang istatistikal na pagsubok na ginagamit upang masuri ang mga pagkakaiba sa pagitan ng dalawang independiyenteng sample sa mga tuntunin ng antas ng anumang katangian, na sinusukat sa dami. Binibigyang-daan kang tukuyin ang ... ... Wikipedia

    Mann-Whitney U na pagsubok- (Eng. Mann Whitney U test) non-parametric statistical test na ginagamit upang masuri ang mga pagkakaiba sa pagitan ng dalawang sample sa mga tuntunin ng antas ng anumang katangian, na sinusukat sa dami. Binibigyang-daan kang tukuyin ang mga pagkakaiba sa halaga ng isang parameter sa pagitan ng maliit na ... Wikipedia

    Pagsusulit sa Mann-Whitney

    Pagsusulit ng Mann-Whitney-Wilcoxon- Ang Mann Whitney U test ay isang non-parametric statistical test na ginagamit upang masuri ang mga pagkakaiba sa pagitan ng dalawang sample sa mga tuntunin ng antas ng anumang katangian, na sinusukat sa dami. Binibigyang-daan kang tukuyin ang mga pagkakaiba sa kahulugan ... Wikipedia

    Pagsusulit ng Mann-Whitney-Wilcoxon- Ang Mann Whitney U test ay isang non-parametric statistical test na ginagamit upang masuri ang mga pagkakaiba sa pagitan ng dalawang sample sa mga tuntunin ng antas ng anumang katangian, na sinusukat sa dami. Binibigyang-daan kang tukuyin ang mga pagkakaiba sa kahulugan ... Wikipedia

    Pagsusulit ni Mann Whitney- - Mga paksa sa telekomunikasyon, mga pangunahing konsepto EN Mann Whitney U test ... Gabay ng teknikal na tagasalin

    Pagsusulit sa Wilcoxon-Mann-Whitney- Ang Mann Whitney U test ay isang non-parametric statistical test na ginagamit upang masuri ang mga pagkakaiba sa pagitan ng dalawang sample sa mga tuntunin ng antas ng anumang katangian, na sinusukat sa dami. Binibigyang-daan kang tukuyin ang mga pagkakaiba sa kahulugan ... Wikipedia

    Pagsusulit sa Wilcoxon-Mann-Whitney- Ang Mann Whitney U test ay isang non-parametric statistical test na ginagamit upang masuri ang mga pagkakaiba sa pagitan ng dalawang sample sa mga tuntunin ng antas ng anumang katangian, na sinusukat sa dami. Binibigyang-daan kang tukuyin ang mga pagkakaiba sa kahulugan ... Wikipedia

    Wilcoxon rank sum test- Ang Mann Whitney U test ay isang non-parametric statistical test na ginagamit upang masuri ang mga pagkakaiba sa pagitan ng dalawang sample sa mga tuntunin ng antas ng anumang katangian, na sinusukat sa dami. Binibigyang-daan kang tukuyin ang mga pagkakaiba sa kahulugan ... Wikipedia

    Wilcoxon rank sum test- Ang Mann Whitney U test ay isang non-parametric statistical test na ginagamit upang masuri ang mga pagkakaiba sa pagitan ng dalawang sample sa mga tuntunin ng antas ng anumang katangian, na sinusukat sa dami. Binibigyang-daan kang tukuyin ang mga pagkakaiba sa kahulugan ... Wikipedia

Mga libro

  • Mga istatistika at mga selyo, Vladimir Savelyev. Mula sa aklat na ito matututunan mo kung ano ang pagkakaiba-iba at karaniwang paglihis, kung paano hanapin ang t-test ng Estudyante at Mann-Whitney U-test, kung anong regression at factor analysis ang ginagamit, ... More Buy for 280 rubles e-book

Ang U-criterion ay isang ranggo, kaya ito ay invariant kaugnay ng anumang monotone transformation ng sukatan ng pagsukat.

Iba pang mga pangalan: Mann-Whitney-Wilcoxon test (Mann-Whitney-Wilcoxon, MWW), Wilcoxon rank-sum test o Wilcoxon-Mann-Whitney test (WMW).

Mga halimbawa ng gawain

Halimbawa 1 Ang unang sample ay ang mga pasyente na ginagamot ng gamot A. Ang pangalawang sample ay ang mga pasyente na ginagamot ng gamot B. Ang mga halaga sa mga sample ay ilang mga katangian ng pagiging epektibo ng paggamot (ang antas ng metabolite sa dugo, temperatura tatlong araw pagkatapos ng pagsisimula ng paggamot, ang tagal ng paggaling, ang bilang ng mga kama sa ospital). araw, atbp.) Kinakailangang malaman kung may makabuluhang pagkakaiba sa bisa ng mga gamot A at B, o ang mga pagkakaiba ay puro random at ipinaliwanag sa pamamagitan ng "natural" na pagkakaiba-iba ng napiling katangian.

Halimbawa 2 Ang unang sample ay ang mga patlang na ginagamot sa pamamaraang pangkultura A. Ang pangalawang sample ay ang mga patlang na ginagamot sa pamamaraang pangkultura B. Ang mga halaga sa mga sample ay ang ani. Kinakailangang malaman kung ang isa sa mga pamamaraan ay mas epektibo kaysa sa isa, o kung ang mga pagkakaiba sa ani ay dahil sa mga random na kadahilanan.

Halimbawa 3 Ang unang sample ay ang mga araw kung kailan ginanap ang isang uri ng promosyon (mga pulang tag ng presyo na may diskwento) sa supermarket. Ang pangalawang sample ay ang mga araw ng uri ng promosyon B (bawat ikalimang pack ay libre). Ang mga halaga sa mga sample ay isang tagapagpahiwatig ng pagiging epektibo ng promosyon (dami ng benta, o kita sa rubles). Kinakailangang malaman kung anong uri ng promosyon ang mas epektibo.

Paglalarawan ng criterion

Dalawang sample ang ibinigay.

Mga karagdagang hula:

Minsan ay nagkakamali na isinasaalang-alang na ang U-test ay sumusubok sa null hypothesis ng pantay na median sa dalawang sample. May mga distribusyon kung saan totoo ang hypothesis, ngunit magkaiba ang kanilang median.

Maaaring gamitin ang U-criterion upang subukan ang shift hypothesis bilang isang kahalili , kung saan ang ilang hindi-zero na pare-pareho. Sa alternatibong ito, pare-pareho ang U-test. Maipapayo na gamitin ito kung ang dalawang serye ng mga sukat ng dalawang halaga ng isang tiyak na pisikal na dami ay isinasagawa gamit ang parehong instrumento. Sa kasong ito, inilalarawan ng function ng pamamahagi ang mga error sa pagsukat ng isang halaga, at isa pa. Gayunpaman, sa maraming mga aplikasyon (sa partikular na ekonomiya) walang partikular na dahilan upang ipalagay na ang pamamahagi ng pangalawang sample ay nagbabago lamang, ngunit hindi nagbabago sa anumang iba pang paraan.

Ang U-test ay isang non-parametric analogue ng Student's t-test. Kung normal ang mga sample, mas mainam na ilapat ang mas malakas na t-test ng Estudyante upang subukan ang shift hypothesis.

Kwento

Ang pamamaraang ito ng pag-detect ng mga pagkakaiba sa pagitan ng mga sample ay iminungkahi noong 1945 ni Frank Wilcoxon. Ito ay lubos na binago at pinalawak noong 1947 nina Mann at Whitney, kung saan ang mga pangalan ay karaniwang tinutukoy ngayon.

Panitikan

  1. Mann H.B., Whitney D.R. Sa isang pagsubok kung ang isa sa dalawang random na variable ay stochastically mas malaki kaysa sa isa. // Mga Annals ng Mathematical Statistics. - 1947, No. 18. - Pp. 50-60.
  2. Wilcoxon F. Mga Indibidwal na Paghahambing ayon sa Mga Paraan ng Pagraranggo. // Biometrics Bulletin 1. 1945. - Pp. 80–83.
  3. Orlov A.I. Econometrics. - M.: Pagsusulit, 2003. - 576 p. (§4.5 Anong mga hypotheses ang maaaring masuri gamit ang two-sample na Wilcoxon test?)
  4. Kobzar A.I. Inilapat na mga istatistika ng matematika. - M.: Fizmatlit, 2006. - 816 p.

Pagsusulit sa Mann-Whitney kumakatawan sa isang non-parametric na alternatibo sa t-test para sa mga independiyenteng sample. Ang bentahe nito ay ang pag-abandona natin sa pagpapalagay ng normal na distribusyon at pantay na pagkakaiba-iba. Mahalaga na ang data ay masusukat kahit man lang sa ordinal na sukat.

Ipinapalagay ng STATISTICA na ang data ay nakaayos sa parehong paraan tulad ng sa at t-test para sa mga independiyenteng sample. Ang file ay dapat maglaman ng isang code (independiyente) na variable na may hindi bababa sa dalawang magkaibang mga code upang natatanging matukoy kung ang bawat obserbasyon ay kabilang sa isang partikular na grupo.

Mga pagpapalagay at interpretasyon. Pagsusulit sa Mann-Whitney Ipinapalagay na ang mga variable na pinag-uusapan ay sinusukat kahit man lang sa isang ordinal na sukat (ranked). Ang interpretasyon ng pagsusulit ay mahalagang katulad ng interpretasyon ng mga resulta ng t-test para sa mga independiyenteng sample, maliban na ang U test ay kinakalkula bilang ang kabuuan ng mga indicator ng pairwise na paghahambing ng mga elemento ng unang sample sa mga elemento ng pangalawang sample. U test - ang pinakamakapangyarihan (sensitibo) na hindi parametric na alternatibo t-test para sa mga independiyenteng sample; sa katunayan, sa ilang mga kaso ito ay mas malakas kaysa sa t-test.

Kung ang laki ng sample ay higit sa 20, ang sample distribution para sa U statistic ay mabilis na nagko-converge sa isang normal na distribution (tingnan ang Siegel, 1956). Samakatuwid, kasama ang istatistika ng U, ang z value (para sa isang normal na distribusyon) at ang katumbas na p-value ay ipapakita.

Mga eksaktong probabilidad para sa maliliit na sample. Para sa maliliit na sample, kakalkulahin ng STATISTICA ang eksaktong probabilidad na nauugnay sa kaukulang istatistika ng U. Ang posibilidad na ito ay batay sa pagbibilang ng lahat ng posibleng halaga ng U para sa isang naibigay na bilang ng mga obserbasyon sa dalawang sample (tingnan ang Dinneen & Blakesley, 1973). Iuulat ng programa (sa huling column ng talahanayan ng mga resulta) ang halaga na 2 * p, kung saan ang p ay katumbas ng 1 minus ang pinagsama-samang (one-tailed) na posibilidad ng kaukulang istatistika ng U. Tandaan na ito ay karaniwang hindi humahantong sa isang malaking underestimation ng istatistikal na kahalagahan ng mga nauugnay na epekto (tingnan ang Siegel, 1956).

Ganito ang hitsura ng istatistika ng pagsubok.

saan W- mga istatistika Wilcoxon dinisenyo upang subukan ang parehong hypothesis

kung hindi

Kaya ang mga istatistika U binibilang ang kabuuang bilang ng mga kaso kung saan ang mga elemento ng pangalawang sample ay higit sa mga elemento ng unang sample. Kung tama ang hypothesis, kung gayon

Pagsusulit sa Mann-Whitney Ipinapalagay na ang mga variable na pinag-uusapan ay sinusukat kahit man lang sa isang ordinal na sukat (ranked). Ang interpretasyon ng pagsusulit ay mahalagang kapareho ng interpretasyon ng mga resulta t-pamantayan para sa mga independiyenteng sample, maliban na ang U criterion ay kinakalkula bilang kabuuan ng mga indicator ng pairwise na paghahambing ng mga elemento ng unang sample sa mga elemento ng pangalawang sample. U test - ang pinakamakapangyarihan (sensitibo) na hindi parametric na alternatibo t-pamantayan para sa mga independiyenteng sample; sa katunayan, sa ilang mga kaso ito ay may higit na kapangyarihan kaysa t-pamantayan.

Kung ang laki ng sample ay higit sa 20, ang sample distribution para sa U statistic ay mabilis na nagko-converge sa isang normal na distribution. Samakatuwid, kasama ang istatistika ng U, ang halaga ng z (para sa isang normal na distribusyon) at ang katumbas p-ibig sabihin.

Ang mga detalyadong tagubilin sa kung paano gamitin ang pamantayan ay makikita sa ibang pagkakataon sa seksyon ng halimbawa ng aplikasyon.

Halimbawa

Subukan natin ang hypothesis na ang inihambing na mga independyenteng sample ay nabibilang sa parehong pangkalahatang populasyon gamit ang nonparametric Mann-Whitney U-test. Ihambing natin ang mga resultang nakuha sa halimbawang Basic Statistics at Student's t-test para sa 2nd at 3rd column ng Student's t-test table sa mga resulta ng nonparametric na paghahambing.

Upang kalkulahin ang Wilcoxon U-test, inaayos namin ang mga variant ng mga inihambing na sample sa pataas na pagkakasunud-sunod sa isang pangkalahatang serye at nagtatalaga ng mga ranggo mula 1 hanggang n1 + n2 sa mga variant ng pangkalahatang serye. Ang unang linya ay kumakatawan sa mga variant ng unang sample, ang pangalawa - ang pangalawang sample, ang pangatlo - ang kaukulang mga ranggo sa pangkalahatang serye:





















Dapat tandaan na kung mayroong magkaparehong mga pagpipilian, sila ay itinalaga ng isang average na ranggo, ngunit ang halaga ng huling ranggo ay dapat na katumbas ng n1 + n2 (sa aming kaso, 20). Ginagamit ang panuntunang ito upang suriin kung tama ang pagraranggo.

Hiwalay para sa bawat sample, kinakalkula namin ang kabuuan ng mga ranggo ng kanilang mga variant ng R1 at R2. Sa kaso natin:

R1 = 1 + 2.5 + 2.5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69

R2 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19.5 + 19.5 = 141

Upang suriin ang kawastuhan ng mga kalkulasyon, maaari kang gumamit ng isa pang panuntunan: R1 + R2 = 0.5 * (n1 + n2) * (n1 + n2 + 1). Sa aming kaso, R1 + R2 = 210.

Statistics U1 = 69 - 10*11/2 = 14; U2 \u003d 141 - 10 * 11/2 \u003d 86.

Upang subukan ang one-tailed test, pipiliin namin ang minimum na istatistika na U1 = 14 at ihambing ito sa kritikal na halaga para sa n1 = n2 = 10 at ang 1% na antas ng kabuluhan na katumbas ng 19.

Dahil ang kinakalkula na halaga ng criterion ay mas mababa kaysa sa tabular, ang null hypothesis ay tinatanggihan sa napiling antas ng kahalagahan, at ang mga pagkakaiba sa pagitan ng mga sample ay itinuturing na makabuluhang istatistika. Kaya, ang konklusyon tungkol sa pagkakaroon ng mga pagkakaiba, na ginawa gamit ang parametric Student's test, ay nakumpirma gamit ang non-parametric na pamamaraang ito.