Parametrické a neparametrické metódy štatistiky. Parametrické a neparametrické postupy pre štatistickú analýzu údajov

Všeobecná stratégia vyhodnocovania štatistických hypotéz diskutovaná vyššie primárne určuje použitie takzvaných parametrických metód matematickej štatistiky.

Parametrické metódy vychádzajú z nejakých, spravidla dosť pravdepodobných predpokladov o charaktere rozdelenia náhodnej premennej. Parametrické metódy používané pri analýze experimentálnych údajov sú zvyčajne založené na predpoklade, že distribúcia týchto údajov je normálna. Dôsledkom tohto predpokladu je potreba odhadnúť sledované distribučné parametre. Teda v prípade nasledovného t -Studentský test takými odhadovanými parametrami sú matematické očakávania a rozptyl. V niektorých prípadoch sa robia ďalšie predpoklady o tom, ako parametre charakterizujúce distribúciu náhodnej premennej v rôznych vzorkách navzájom korelujú. V Studentovom teste, ktorý sa často používa na porovnanie priemerných hodnôt (očakávaní) dvoch radov údajov na ich homogenitu alebo heterogenitu, sa teda robí dodatočný predpoklad o homogenite disperzií distribúcie náhodných premenných v dve všeobecné populácie, z ktorých boli tieto údaje extrahované.

Výhodou metód parametrickej analýzy dát je skutočnosť, že majú pomerne vysoký výkon. Pod testovacia sila mať na pamäti jeho schopnosť vyhnúť sa chybám druhého druhu, čiže β-chybám. Čím menšia je β-chyba, tým vyššia je sila testu. Inými slovami, skúšobný výkon = 1 - β.

Vysoká sila parametrických testov alebo kritérií je spôsobená skutočnosťou, že tieto metódy vyžadujú, aby boli dostupné údaje opísané v metrická stupnica. Ako viete, metrické stupnice zahŕňajú intervalovú stupnicu a pomerovú stupnicu, ktorá sa niekedy nazýva aj absolútna stupnica. Intervalová stupnica umožňuje výskumníkovi zistiť nielen vzťahy rovnosti či nerovnosti prvkov vzorky (ako to umožňuje menná stupnica ) a nielen príkazové vzťahy (ako to umožňuje objednávková stupnica ), ale aj vyhodnocovať ekvivalenciu intervalov. Absolútna mierka okrem toho umožňuje vyhodnotiť ekvivalenciu vzťahov medzi prvkami súboru získaných počas merania. Preto sa metrické váhy označujú ako silné meracie váhy. Vďaka tejto sile umožňujú parametrické metódy presnejšie vyjadrenie rozdielov v rozdelení náhodnej premennej, za predpokladu pravdivosti guľky alebo alternatívnych hypotéz.

Treba tiež poznamenať, že vo všeobecnosti sú parametrické metódy štatistiky rozvinutejšie v teórii matematickej štatistiky, a preto sa používajú oveľa širšie. Pomocou ktorejkoľvek z týchto metód možno vyhodnotiť takmer každý experimentálny výsledok. Práve o týchto metódach sa uvažuje najmä v učebniciach a príručkách o štatistickej analýze údajov.

Ťažkosti spojené s používaním metód parametrickej analýzy v štatistike zároveň spočívajú v tom, že v niektorých prípadoch sa apriórne predpoklady o povahe distribúcie skúmaných náhodných premenných môžu ukázať ako nesprávne. A tieto prípady sú pre psychologický výskum v určitých situáciách veľmi typické.

Ak teda porovnáme dve vzorky pomocou t -Test študenta, môžete zistiť, že distribúcia našich údajov sa líši od normálneho a rozdiely v dvoch vzorkách sa výrazne líšia. V tomto prípade môže použitie parametrického Studentovho testu do určitej miery skresliť závery, ktoré chce výskumník vyvodiť. Toto nebezpečenstvo sa zvyšuje, ak sa ukáže, že hodnoty vypočítanej štatistiky sú blízko hraničným hodnotám kvantilov, ktoré sa používajú na prijatie alebo zamietnutie hypotéz. Vo väčšine prípadov však, ako napríklad v prípade použitia t -test, niektoré odchýlky od teoreticky daných predpokladov nie sú kritické pre spoľahlivé štatistické vyvodzovanie. V iných prípadoch môžu takéto odchýlky predstavovať vážnu hrozbu pre takýto záver. Potom môžu výskumníci vyvinúť špeciálne postupy, ktoré môžu upraviť postup rozhodovania o pravdivosti štatistických hypotéz. Účelom týchto postupov je obísť alebo zmierniť príliš prísne požiadavky parametrických modelov používaných štatistík.

Jednou z možností takéhoto konania výskumníka, keď zistí, že dáta, ktoré dostal, sa svojimi parametrami líšia od toho, čo je špecifikované v štrukturálnom modeli použitého parametrického testu, môže byť pokus o transformáciu týchto dát do požadovanej podoby. Napríklad, ako je uvedené v kap. 1, pri meraní reakčného času je možné vyhnúť sa vysokej hodnote asymetrie jeho rozloženia, ak sa na analýzu použijú logaritmy získaných hodnôt, a nie samotné hodnoty reakčného času.

Ďalšou možnosťou je odmietnuť použiť akékoľvek apriórne predpoklady o charaktere distribúcie náhodnej premennej vo všeobecnej populácii. A to znamená odmietnutie parametrických metód matematickej štatistiky v prospech neparametrických.

Neparametrické sa nazývajú metódy matematickej štatistiky, v ktorých sa nerobia žiadne apriórne predpoklady o charaktere rozloženia skúmaných údajov a ani sa nepredpokladajú pomery distribučných parametrov analyzovaných hodnôt. Toto je hlavná výhoda týchto metód.

Výhoda neparametrickej štatistiky sa naplno prejaví, keď sú výsledky získané v experimente prezentované v slabšej forme. nemetrická stupnica, predstavujúce výsledky hodnotenia. Takáto mierka je tzv objednávková stupnica. Samozrejme, v niektorých prípadoch môže výskumník tieto údaje previesť na silnejšiu intervalovú škálu pomocou postupov normalizácie údajov, ale spravidla je v tejto situácii najlepšou možnosťou použiť neparametrické testy špeciálne navrhnuté na štatistickú analýzu.

Testy neparametrickej štatistiky spravidla zahŕňajú odhad dostupných pomerov poradových súčtov v dvoch alebo viacerých vzorkách a na základe toho sa formuluje záver o pomere týchto vzoriek. Príklady takýchto testov sú znakový test, Wilcoxon podpísaný hodnotový test, ako aj Mannov U-test whitney, ktoré sa používajú ako analógia parametrických t - Študentský test.

Zároveň, ak sú výsledky merania prezentované v silnejšej škále, použitie neparametrickej štatistiky znamená odmietnutie niektorých informácií obsiahnutých v údajoch. Dôsledkom toho je nebezpečenstvo zvýšenia chýb druhého druhu, ktoré sú vlastné týmto metódam.

Metódy neparametrickej štatistiky sú teda konzervatívnejšie ako metódy parametrickej štatistiky. Ich použitie hrozí vo väčšej miere chybou druhého druhu, t.j. situácia, keď výskumník napríklad nedokáže zistiť rozdiely medzi dvoma vzorkami, keď k takýmto rozdielom skutočne dochádza. Inými slovami, takéto metódy sa ukázali byť menej výkonné ako parametrické metódy. Preto sa vo všeobecnosti uprednostňuje použitie parametrickej štatistiky pri analýze experimentálnych údajov iných ako jednoduché hodnotenie.

Pri riešení otázok budovania modelov systémov je obzvlášť dôležitá úloha generovania počiatočných informácií o parametroch prvkov, ktoré tvoria systém. Presnosť a spoľahlivosť počiatočných informácií určuje presnosť odhadov analyzovaných charakteristík systémov, presnosť výpočtov pre optimalizáciu stratégií fungovania a pravidiel ich údržby, riešenie problémov súvisiacich s predpovedaním správania systému v budúcnosti. a ďalšie problémy. Pri vytváraní počiatočných informácií o parametroch prvkov sa spravidla vychádzajú z informácií získaných pri skúmaní systémov a pri štúdiu skúseností s jeho prevádzkou. Inými slovami, za základ sa berú informácie o správaní komponentov systému v procese jeho prevádzky.

Analýza počiatočných ukazovateľov prvkov, zostáv, komponentov, ktorá sa vykonáva vo fázach prevádzky, testovania, vývoja dizajnu, sa vykonáva s cieľom vyriešiť tieto problémy:

    stanovenie skutočných hodnôt študovaných charakteristík komponentov v podmienkach ich skutočnej prevádzky;

    identifikácia vzťahu medzi študovanými charakteristikami prvkov a ich prevádzkovými podmienkami, analýza vplyvu na študované ukazovatele vonkajších vplyvov;

    predpovedanie správania novovytvorených zariadení.

Aby sa teda tieto problémy vyriešili, v prvom rade

je potrebné organizovať kontrolu nad správaním zariadenia v reálnych podmienkach jeho prevádzky. V budúcnosti sa informácie získané počas prevádzky objektov použijú na zostavenie modelov systémov, pre ktoré sa analýza vykonáva.

Pri vykonávaní experimentálnych štúdií zohrávajú dôležitú úlohu informácie získané ako výsledok pozorovaní objektov, ktorých správanie má pravdepodobnostný charakter. Štúdium takýchto systémov sa uskutočňuje podľa výsledkov implementácie výstupných parametrov, ktorými sú náhodné veličiny. Najvšeobecnejšou charakteristikou popisujúcou správanie sa jednorozmernej náhodnej premennej je jej hustota rozdelenia / (0- Pri znalosti hustoty rozdelenia náhodnej premennej možno jednoznačne určiť také charakteristiky, ako je pravdepodobnosť realizácie nejakej udalosti, intenzita výskyt udalosti, priemerný čas medzi realizáciami udalostí atď. Uvádzame vzorce , ktoré umožňujú vyhodnotiť zodpovedajúce ukazovatele.

Pravdepodobnosť udalosti, ktorá nastane v priebehu času t sa určuje podľa vzorca

Q(t) = F(t)=\f(t)dt.

V praxi sa množstvo definované prostredníctvom distribučnej funkcie často používa takto:

Napríklad v teórii spoľahlivosti sa takto definuje pravdepodobnosť bezporuchovej prevádzky.

Zo vzťahu sa určí priemerný čas medzi realizáciami udalostí

Ta =]tf(f)dt=]p(t)dt.

Intenzita výskytu udalosti môže byť určená vzorcom

"_/(f)_ClFjt) ja _ dP(t) 1 P(t)dt P(t)dt Pit)"

Keď teda poznáme hustotu alebo distribučnú funkciu náhodnej premennej, môžeme pristúpiť k určovaniu charakteristík komplexného systému. V praxi je distribučná funkcia často neznáma. Musí sa obnoviť podľa štatistických údajov implementácie náhodnej premennej. Keďže štatistiky o výsledkoch pozorovaní sú vždy prítomné v obmedzenej forme, obnovenie distribučnej funkcie je možné s určitou mierou spoľahlivosti. Ak sa teda distribučná funkcia odhaduje s určitou chybou,

ura

f (X - t ) 2 ^ 2a 2

" (x-t ) 2 ^ 2 a 2

Vypočítajme parciálne derivácie:

dPN(t, m,o) _ 1

dm

d P N (t, t, O) _ da 2

r r \t

2 o 2

\ /-J

potom sa výpočet charakteristík systému vykoná aj s chybou.

Presnosť odhadu ukazovateľov zložitých systémov je charakterizovaná veľkosťou rozptylu. Nech je potrebné odhadnúť nejaký ukazovateľ R(t). Ukážme, ako sa rozptyl určuje v jeho odhade. Budeme predpokladať, že ukazovateľ R(t ) sa určuje prostredníctvom distribučnej funkcie. Nechajte distribučnú funkciu závisieť od dvoch parametrov vzduchu. Príkladmi dvojparametrových funkcií sú normálne rozdelenie, skrátené normálne, log-normálne, gama rozdelenie, Weibullovo rozdelenie a množstvo ďalších. Tak nech F(t) = F(t, a, r). V súlade s tým môže byť odhadovaný indikátor komplexného systému reprezentovaný ako funkcionál F(t) = F(t, a, r):

K(r) = K = K(f,a,p).

Rozložme odhad R ( t) do Taylorovho radu v bode a, p a obmedzíme sa na tri pojmy:

i(0 = K(0+^®(a-a)+^®(p-p).

Na obe časti tohto výrazu aplikujeme operáciu výpočtu rozptylu

(t-m) 2

-t exp

Normálne rozdelenie

Hustota zákona normálneho rozdelenia má tvar

Pn(t, m, o)= 1 -7=- J exp

Fn(t, potom)= -y=- J exp

(t-m)

2o 2

Priemerný čas medzi realizáciami udalostí je určený formou

(t- m) 2 2 a 2

kde cov(a, P) je kovariancia medzi parametrami vzduchu. Na odhad rozptylu určitého ukazovateľa je teda potrebné určiť parciálne derivácie tohto ukazovateľa vzhľadom na parametre distribučného zákona a rozptyl pri odhade parametrov distribučného zákona.

Zvážte problematiku stanovenia parciálnych derivátov pre ukazovatele zavedené vyššie pre konkrétne distribučné zákony Stanovenie rozptylu odhadov parametrov distribučných zákonov bude popísané nižšie.

Ako príklad uveďme definíciu parciálnych derivátov odhadovaného ukazovateľa vzhľadom na parametre distribučného zákona pre normálny zákon.

Ґ ( t-m) 2 ^

2 od 2

V súlade s tým sú parciálne deriváty definované ako

dTN(m,a) 1 7

-- - = - f=~ exp

d m V2nab

dTN(m, o) ja

it= F

f 2 ~\ m

2 0

\ /

A nakoniec, čo sa týka intenzity akcie, máme

X(t, t, o) = -

Jednostranné skrátené normálne rozdelenie

Hustota rozdelenia skráteného normálneho zákona s jednostranným skrátením vľavo v bode 0 má tvar

/ (t-m ) 2 ^ 2 a 2

\ І2na

(X - t) 2 2a 2

\І2po(

Výrazy pre parciálne deriváty majú tvar

dX N (t, m,a ) _ f N (t, m,a )" m (l -F N (t, m,o))-f N (t, m,o )[ l-F N (t, m,o )]" m m

2

dm

s = -

(*-YU 2 2 Kommersant

oyj2nb

, ., t-m ja ( t-m ) 2

f H (fW Ora=Ir=-T ex PV

Ґ , h2 4 V

( t-m) 2

( 2 mil t

2 a 2

\

2s 7

\ /J

"a2

da 2

2

[( t-m ) 2 - a 2 ] 2l/2lst 3

(t-m)

dX

P(SCH,b) = \-{

(t -m) 2a 2

m20 2

\ =

(t-m)exp

m exp

2 2 na 3

Predstavme si notáciu:

R= J exp

J

Takto sú uvedené vzorce na určenie zodpovedajúcich odvodených ukazovateľov pre parametre distribučného zákona pre normálny zákon. Zovšeobecnením normálneho rozdelenia je skrátené normálne rozdelenie. Uvažujme o použití jednostranne skráteného normálneho rozdelenia v problémoch odhadu ukazovateľov zložitých systémov. V mnohých problémoch systémovej analýzy sú náhodné parametre pozitívne definované. Príkladom sú problémy teórie spoľahlivosti, v ktorých náhodné parametre majú doménu definície od 0 do, napríklad prevádzkový čas do zlyhania je kladná definitívna hodnota. V tomto prípade je nezákonné použiť zákon normálneho rozdelenia na opis týchto náhodných premenných. V takýchto situáciách sa používa vľavo skrátené normálne rozdelenie. Uvažujme tento prípad vo vzťahu k odhadu ukazovateľov spoľahlivosti.

(x-c) 2 2 b

( X - U-U

dx; Q= jexp

Zodpovedajúce deriváty majú tvar

Ґ 2\ .hl

2 Kommersant

r,"H

db(Q-Rf

kde zodpovedajúce zložky sú určené vzorcami

Priemerný čas medzi realizáciami udalostí je určený vzorcom

2 b 2

/ . .і \ (*-YU

S / h‘ ^

l/ts l/ts fG G-M-

(QW b =^exp

I^lbja-Jlb Jb

Označme čitateľa cez L.

Zodpovedajúce deriváty sa vypočítajú podľa vzorcov

log-normálne rozdelenie

Logaritmicky normálne rozdelenie sa riadi náhodnou premennou t, ktorého logaritmus je rozdelený podľa normálneho zákona. Hustota rozdelenia logaritmicko-normálneho zákona má tvar

KMY) _ i;q-%l Jf_urz _______

"-! Li S)

/ 2 N.! 2fc

SHAMKQ Ul.

-^ , A, -ex R

Distribučná funkcia má tvar

2 b 2

Napokon intenzita výskytu udalostí sa rovná

(*-10 2 AT

2 b

kdeAT= Kommersant 1 .

Napíšme vzorce na určenie ukazovateľov spoľahlivosti

(X -M-) 2 2 Kommersant

(X -\i .? 2 Kommersant

dx-jexpo

I „(*, I, D) \u003d I - Jeexp

Zavádzame notáciu

Zodpovedajúce deriváty majú tvar

(*-YU

M= exp

2 \

( (janf-H) 2 AT

Rln(; , N.D) _ 1 En - JlnB

P „Jt,\i,B) 1pg-n

Určme derivácie intenzity vzhľadom na parametre

nevieyM(t,№) _ M^jQ-R)- (Q-RY 11 M EC(Q-R) 2 :

uhv


( (Pán) m 2 b

Na určenie stredného času do zlyhania použite vzorec

(Pani. 2

M 11 =-m^exp

; (b-l)"= exp

a posledný výraz

Deriváty sú rovnaké

dtlaC, R, AT) 1 (v ,

Napíšme výraz pre pravdepodobnosť bezporuchovej operácie

Výraz na určenie poruchovosti má tvar \Jt,\i, b) = -

P B (t, a, b) = exp\

KaJ

Vypočítajme deriváty tohto výrazu vzhľadom na distribučné parametre:

<У2дВ I 2 AT

E P^(t,a,b) _ b áno a

dPB(t,a, b) _

Čiastkové derivácie sa určujú z výrazov

E CL^V) _

^ 2

L tjbw v exp|

(lnf- |X) 2 2 AT

kde (/ln(0)

7 B(a ^) = J ex P

(Inf-(X) 2 2 AT

E T B (a, b)_~ r b(t

* (t"In

\df, E7v(a ^ e b

dK»ShV) (0 ) " th (ja - (0 )- / l. (ja- F n J t))"

EV 2

* P

Miera zlyhania je

(^ b-" , a

Deriváty vzhľadom na parametre majú tvar

to,a,b)

(1 - F„„) = - I n Vii exp

_ (Inf- (X) 2 AT

E ^a,b) b 2

E Xvia, b)_Ґ" b

áno~a 2

dbaba

a ,

Weibullova distribúcia

Hustota Weibullovho rozdelenia má tvar

f B (t,a,b) = -(-

Rozdelenie gama

Hustota rozdelenia gama je napísaná nasledovne

F B (t, a, b) = 1-exp

Podľa toho má distribučná funkcia tvar

x, a *

Fr(t,X,a) = fXa~ " exn(-Xx) dx.

Pravdepodobnosť bezporuchovej prevádzky sa vypočíta podľa vzorca

P v (t , X , a) = I fexp(-Xx)dx.

Deriváty s ohľadom na parametre sú

і і OcX a4 Jx a4 exp (-Xx) Jx-X a J X a exp ( -Xx)dx

EXG(g,a,X) _ (f r ( „Xa)) K - / r(f,X,a); Ea 2

J exp(-Xx)(a - Xx) dx \

[!-,F r (ZAa)];=-

DR G (t, X , a) _ X 1

Pa) i

DR ^áno a) = ~ G^a) I * a ~" ex P(-^t r (a)(ta ^ - 111 0 - Г"(а)]Жс, kde Г(а) = J X a t a ~ " exp (- Xt)dt \u003d J Z a " 1 exp (-r)<&; Г(а) = J г“"’ exp(-z) In z 4 z

Stredný čas do zlyhania je určený vzorcom

G r (o, X) \u003d J ^ - exp(-Xt)di =~.

oG(a) X

Zodpovedajúce deriváty sú

dt G (Oh ) adG G ( a ,X) _ 1 EH.X 2 Áno~X"

Zaznamenáva sa miera zlyhania

X a t a -" exp (- xt )

Xr(t,a,X) =

(f r (t , X ,a )) a = ^-y-^-[(X a InXf a "exp (- Xt) + X a t a 1 Infexp(-Xt))-

X1Va"1exp(-Xf)r„(a)];

G a ((X)X a Jjr a "1 exp (-Xx) Jx-

t tX a V Xj X a ’ 1 exp (-Xx)dx +X a Jx a 1 Injfexp (-Xx)dx

Takto sa získajú výrazy, ktoré umožňujú riešiť problémy hodnotenia presnosti pri určovaní ukazovateľov zložitých systémov. Zohľadňujú sa distribučné zákony najčastejšie používané v systémovej analýze. Získajú sa vzorce na určenie hlavných ukazovateľov systémov a vypočítajú sa prvé parciálne derivácie ukazovateľov vzhľadom na parametre príslušných distribučných zákonov. Ďalšou otázkou, ktorú je potrebné riešiť, je otázka odhadu parametrov zvoleného distribučného zákona. Pozrime sa, ako je tento problém vyriešený.

Deriváty s ohľadom na parametre sú definované ako

d X r ( t,a , X) _ (fr(tX a) ) \ -/ r(t, X,a) 2

kde a^ g" 1 "pW-X-r-exp(-Xr)

Štatistické stupnice

Štatistické spracovanie výskumných údajov

Štatistické údaje sa využívajú pri spracovaní psychologických výskumných materiálov s cieľom vyťažiť z kvantitatívnych údajov získaných v experimente čo najviac užitočných informácií.

O použití určitých štatistických metód rozhoduje, do akej štatistickej škály prijatý materiál patrí.

Menná stupnica. Táto mierka zahŕňa materiály, v ktorých sa študované predmety od seba líšia svojou kvalitou a poradie nie je dôležité. Napríklad rozdelenie účastníkov konferencie. Pri štatistickom spracovaní takýchto materiálov treba brať do úvahy počet jednotiek, ktoré každý objekt predstavuje.

Objednávková stupnica. V centre pozornosti je poradie objektov. Táto škála v štatistike zahŕňa také výskumné materiály, v ktorých predmety patriace do jednej alebo viacerých tried podliehajú posudzovaniu, ale pri porovnaní sa líšia: viac - menej, vyššie - nižšie atď.

Najjednoduchší spôsob, ako ukázať typické znaky poradovej stupnice, je pozrieť sa na výsledky akejkoľvek športovej súťaže. Postupne uvádzajú účastníkov, ktorí obsadili prvé, druhé, tretie a ďalšie miesto.

v poradí podľa miesta a informácie o skutočných úspechoch športovcov ustupujú do pozadia alebo chýbajú.

Intervalová stupnica. Zahŕňa také materiály, v ktorých je kvantitatívne hodnotenie skúmaného objektu uvedené v pevných jednotkách. Materiály zodpovedajúce stupnici intervalov musia mať mernú jednotku, ktorá bola rovnaká pre všetky opakované merania.

Vzťahová škála. Táto stupnica zahŕňa materiály, ktoré zohľadňujú nielen počet pevných jednotiek , ako v stupnici intervalov, ale aj pomery celkových výsledkov získaných medzi sebou. Na prácu s takýmito vzťahmi potrebujete mať nejaký absolútny bod, od ktorého sa odpočítavanie vedie.

Ak sa výskumníkovi dostupné údaje pri bližšom skúmaní len mierne líšia od Gaussovej krivky normálneho rozdelenia, dáva to výskumníkovi právo použiť pri štatistickom spracovaní parametrické metódy, ktorých počiatočné ustanovenia vychádzajú z krivky Gaussovho normálneho rozdelenia. . Normálne rozdelenie sa nazýva parametrické, pretože na zostrojenie a analýzu Gaussovej krivky stačí mať iba dva parametre: aritmetický priemer, ktorého hodnota by mala zodpovedať výške kolmice obnovenej v strede krivky, a takzvaná odmocnina alebo štandardná odchýlka, hodnota, ktorá charakterizuje rozsah fluktuácií tejto krivky.

Ak nie je možné použiť parametrické metódy, je potrebné prejsť na neparametrické metódy.

Jedným z faktorov limitujúcich aplikáciu štatistických testov založených na predpoklade normality je veľkosť vzorky. Pokiaľ je vzorka dostatočne veľká (napríklad 100 alebo viac pozorovaní), rozdelenie vzorky možno považovať za normálne, aj keď nie je isté, že rozdelenie premennej v populácii je normálne. Ak je však vzorka malá, potom by sa parametrické testy mali použiť len vtedy, ak existuje istota, že premenná je skutočne normálne rozložená. Avšak ani pre takéto premenné neexistuje spôsob, ako otestovať tento predpoklad na malej vzorke (štatistické testy normality efektívne začnú pracovať na vzorke obsahujúcej aspoň 51 pozorovaní).

Neparametrické metódy sú najvhodnejšie, keď je veľkosť vzorky malá a údaje sú na ordinálnych alebo nominálnych mierkach. Ak existuje veľa empirických údajov (napríklad n>100), potom často nedáva zmysel a dokonca sa zdá nesprávne používať neparametrické štatistiky. Ak je veľkosť vzorky veľmi malá (napríklad n=10 alebo menej), potom úrovne p-významnosti pre tie neparametrické testy, ktoré používajú normálnu aproximáciu, možno považovať len za hrubé odhady.



Aplikácia kritérií založených na predpoklade normality je limitovaná aj tým, že študované znaky patria do určitej meracej škály. Štatistické metódy, ako je napríklad Studentov t-test (pre závislé a nezávislé vzorky), Pearsonova lineárna korelácia, ako aj regresná, zhluková a faktorová analýza predpokladajú, že zdrojové údaje sú spojité (hodnoty skúmaných premenných súvisia s intervalovou alebo pomerovou stupnicou) . Existujú však prípady, keď sú údaje jednoducho zoradené (merané na ordinálnej stupnici), a nie presne merané. Potom sa javí ako vhodné použiť také štatistické kritériá, ako je napríklad Wilcoxonov T-test, G-test znakov, Mann-Whitneyho U-test, Wald-Wolfowitzov Z-test, Spearmanova poradová korelácia atď. Štatistické metódy budú fungovať na nominálnych údajoch, napríklad korelácia kvalitatívnych znakov, chí-kvadrát test, Cochranov Q-test atď. Výber konkrétneho kritéria je spojený s hypotézou, ktorú výskumník predkladá v priebehu vedeckého výskumu, a potom sa to snaží dokázať na empirickej úrovni.

Takže pre každé parametrické kritérium existuje aspoň jedna neparametrická alternatíva. Vo všeobecnosti tieto postupy spadajú do jednej z nasledujúcich kategórií: (1) posúdenie stupňa závislosti medzi premennými; (2) kritériá rozdielov pre nezávislé vzorky; (3) kritériá pre rozdiel pre závislé vzorky.

Na posúdenie závislosti (vzťahu), alebo stupeň tesnosti (hustota, pevnosť) spoja vypočítajte Pearsonov korelačný koeficient (r). Presnejšie povedané, jeho použitie má aj obmedzenia spojené napríklad s typom škály, v ktorej sa údaje merajú, a nelinearitou závislosti. Preto sa ako alternatíva používajú neparametrické alebo takzvané koeficienty poradovej korelácie (napr. Spearmanov koeficient poradovej korelácie (ρ), Kendallova štatistika tau (τ), Gamma (Gamma)), používané pre ordinálne (poradové) údaje. Ak existujú viac ako dve premenné, použije sa Kendall Coeff. of Concordance. Používa sa napríklad na posúdenie konzistentnosti názorov nezávislých odborníkov (napríklad body udelené rovnakému subjektu, účastníkovi súťaže).

Ak sú údaje merané v nominálnej mierke, potom je prirodzené prezentovať ich v kontingenčných tabuľkách, ktoré využívajú Pearsonov chí-kvadrát test s rôznymi variáciami a úpravami pre presnosť.

Rozdiely medzi nezávislými skupinami. Ak existujú dve vzorky (napríklad chlapci a dievčatá), ktoré je potrebné porovnať s ohľadom na nejakú strednú hodnotu, napríklad kreatívne myslenie, potom môžete použiť t-test pre nezávislé vzorky (t-test pre nezávislé vzorky) . Neparametrickými alternatívami k tomuto testu sú Wald-Wolfowitzov test, Mann-Whitney U test a Kolmogorov-Smirnov dvojvzorkový test. Je potrebné pripomenúť, že dvojvýberový Kolmogorov-Smirnovov test je citlivý nielen na rozdiel v polohe dvoch distribúcií, ale aj na tvar distribúcie. V skutočnosti je citlivý na akúkoľvek odchýlku od hypotézy homogenity, ale neuvádza, s ktorou odchýlkou ​​sa výskumník zaoberá.

Rozdiely medzi závislými skupinami. Ak je potrebné porovnať dve premenné týkajúce sa tej istej vzorky, napríklad indikátory agresivity tých istých subjektov pred a po nápravnej práci, potom sa zvyčajne používa t-test pre závislé vzorky. Alternatívne neparametrické testy sú Sign Test a Wilcoxonov párový test. Wilcoxonov test naznačuje, že je možné zoradiť rozdiely medzi porovnávanými pozorovaniami. Ak to nie je možné, použije sa znamienkové kritérium, ktoré berie do úvahy len znamienka rozdielov medzi porovnávanými hodnotami.

Ak sú uvažované premenné kategorické (nominálne), potom je vhodný McNemarov chí-kvadrát. Ak existujú dve kategorické premenné, potom sa na posúdenie stupňa závislosti použijú štandardné štatistiky a príslušné kritériá pre kontingenčné tabuľky: Chí-kvadrát, Phi-kvadrát, Fisherov exaktný test.

Nasledujúca tabuľka predstavuje parametrické testy a ich neparametrické alternatívy, berúc do úvahy nasledujúce kategórie: 1) posúdenie miery závislosti medzi premennými; 2) kritériá rozdielov.

Tabuľka 4.1 - Parametrické a neparametrické kritériá

Parametrické kritériá Neparametrické testy
hodnotenie závislosti (vzťahy)
Pearsonov korelačný koeficient (r) koeficienty poradovej korelácie (Spearmanov koeficient poradovej korelácie ρ), Kendallova štatistika tau (τ), Gamma (Gamma)); Pearsonov chí-kvadrát (pre nominálne údaje)
rozdiely medzi nezávislými skupinami
Študentov t-test pre nezávislé vzorky (t-test pre nezávislé vzorky) Wald-Wolfowitz vykonáva test Z-test, Mann-Whitney U test, Kolmogorov-Smirnov dvojvýberový test
rozdiely medzi závislými skupinami
Študentov t-test pre závislé vzorky (t-test pre závislé vzorky) G-test znakov (Sign Test), T-test Wilcoxonových párových porovnaní (Wilcoxonov párový test); McNemar Chi-kvadrát, Chi-kvadrát, Phi-kvadrát, Fisherovo presné (pre nominálne údaje)

Ak sa zvažujú viac ako dve premenné z tej istej vzorky (napríklad pred úpravou, po úprave-1 a po úprave-2), potom sa zvyčajne používa analýza rozptylu opakovaných meraní, ktorú možno považovať za zovšeobecnenie t-testu pre závislé vzorky na zvýšenie citlivosti analýzy. Anglická skratka pre analýzu rozptylu je ANOVA (Analysis of Variation). Analýza rozptylu vám umožňuje súčasne kontrolovať nielen základnú úroveň závislej premennej, ale aj ďalšie faktory, ako aj zahrnúť do plánu experimentu viac ako jednu závislú premennú. Alternatívnymi neparametrickými metódami sú Kruskal-Wallisova analýza rozptylu a test mediánu (Kruskal-Wallis ANOVA, test mediánu), Friedmanova poradová analýza rozptylu (Friedman ANOVA by Ranks).

Otázky o neparametrických kritériách.

Štatistické kritérium - rozhodovacie pravidlo, ktoré s vysokou pravdepodobnosťou zabezpečuje prijatie pravdivej a zamietnutie nesprávnej hypotézy.Štatistické kritérium je zároveň metódou na výpočet určitého čísla a tohto čísla samotného.

Parametrické kritériá sa používajú, keď je vzorka normálna, pričom výpočet v týchto kritériách zahŕňa znaky rozdelenia pravdepodobnosti znaku, teda priemer a rozptyl. To predpokladá, že údaje sú nepretržité. Medzi parametrické testy patria: Studentov t-test, chí-kvadrát test. Vhodné pre stupnice intervalových pomerov.

Neparametrické testy sa používajú vtedy, keď nemožno hovoriť o normálnom rozdelení, testy sú založené na práci s radmi alebo frekvenciami. Medzi neparametrické patria znamienkový test, Wilcoxonov test, Mann-Whitney test a Jonkheer. Vhodné pre váhy slabšie ako intervalové.

Pred výberom kritéria musíme skontrolovať normalitu vzorky.

Nemám tušenie, čo napísať, pokiaľ ide o priemerné a rozptylové miery, pretože zjavne existujú rovnaké pojmy rozptylu a bla bla iné veci *_*

2. Metódy testovania štatistických hypotéz: t-test, Wilcoxonov test, Mann-Whitney test, Kruskal-Wallace test (podmienky aplikácie, formulácia hypotéz, rozdelenia štatistík, myšlienka výpočtu)

t-test (Student) – používa sa, ak je vzorka normálna. Hypotézy sú formulované takto:

1. Formuluje sa H0

2. Formuluje sa H1, alternatíva H0 (zvyčajne označuje interakciu znakov).

3. Štatistika je vybraná na výber medzi dvoma hypotézami

4. Pre každú hladinu významnosti α je stanovená kritická oblasť, kde a) výsledok spadajúci do tejto oblasti označuje H1 a nie H0 b) pravdepodobnosť, že výsledok spadá do tejto oblasti pri H0 true, je rovná α.

Pravdepodobnosť prijateľnej chyby prvého druhu α=0,05, ak je hodnota kritéria v našej vzorke väčšia ako t 0,05, potom prijmeme hypotézu H0, zamietneme hypotézu H1.

Pre jednu vzorku

Pre nezávislé vzorky.

Wilcoxonov podpísaný poradový test nezohľadňuje hodnoty čísel vo vzorke, ale iba ich znamienka. Kritérium zohľadňuje absolútne hodnoty členov vzorky. Používa sa, keď vzorka nemusí byť normálna a keď je potrebné rozhodnúť, či vzorka má výrazne nenulový priemer. Aplikácia vyžaduje:

1) Nastavte hladinu významnosti α a nájdite zodpovedajúci nižší Wilcoxonov kvantil.


2) Usporiadajte všetkých členov vzorky vo vzostupnom poradí absolútnej hodnoty, podpíšte poradie pod nimi.

3) Vypočítajte Wilcoxonovu štatistiku, pre ktorú vypočítame súčet poradí priradených negatívnym členom vzorky.

4) Porovnajte získané štatistiky s predtým zisteným kvantilom. Ak je tento súčet poradí menší ako dolný kvantil, zamietneme hypotézu H0 a prijmeme hypotézu H1. Podobne, ak je súčet poradí všetkých pozitívnych členov vzorky väčší ako horný kvantil, akceptujeme H1 a zamietneme H0.

Mann-Whitney test (U) je test pre nezávislé vzorky, analóg Studentovho t-testu. Jeho empirická hodnota ukazuje, ako sa dva riadky hodnôt atribútov zhodujú. Používa sa vtedy, keď vzorka nemusí byť normálna, je zachovaná len požiadavka podobnosti rozdelení, ale nemusia byť normálne + keď je potrebné vyriešiť úlohu, dá sa to tvrdiť. Že priemerná hodnota experimentálnej vzorky je výrazne vyššia ako priemerná hodnota kontrolnej skupiny.

1) Zapisujeme členy oboch vzoriek vo vzostupnom poradí, pričom členy rôznych vzoriek zvýrazníme rôznymi spôsobmi.

2) Pre každé číslo prvej (kontrolnej) vzorky vypočítame, koľko čísel druhej (experimentálnej) vzorky sa nachádza naľavo od nej. Ak sa číslo prvej vzorky rovná číslu druhej, pridajte 0,5. Získame konzistentné výsledky a spočítame ich.

3) Pozeráme sa na hladinu významnosti, ktorú sme zvolili pre nižší kvantil podľa Mann-Whitneyho. Ak je nami prijatý súčet menší ako dolný kvantil, tak zamietneme hypotézu H0, prijmeme hypotézu H1.

Mann-Whitneyho rozdelenie je symetrické (t. j. môžete počítať spätne a použiť horný kvantil).

Kruskal-Wallace test je neparametrický analóg jednosmernej analýzy rozptylu pre nezávislé vzorky. Podobne ako Mann-Whitney test. Posudzuje stupeň zhody niekoľkých sérií hodnôt zmenenej charakteristiky. Hlavnou myšlienkou je prezentovať všetky hodnoty porovnávaných vzoriek ako spoločnú postupnosť zoradených hodnôt, po ktorej nasleduje výpočet priemerného poradia pre každú zo vzoriek.

Vypočítané po hodnotení.

N je celkový počet všetkých vzoriek.

k je počet porovnávaných vzoriek.

R i je súčet hodnotení pre konkrétnu vzorku.

n i – veľkosť vzorky i.

Čím viac sa vzorky líšia, tým väčšia je výpočtová hodnota H, tým nižšia je úroveň p-významnosti. Keď sa zamietne nulová štatistická hypotéza, prijme sa alternatívna hypotéza o štatisticky významných rozdieloch v tomto znaku bez určenia smeru rozdielov. (pre smer je potrebný Mann-Whitney test, pretože je na dve vzorky a tento je na viac ako dve).