Analýza výpočtu rozptylu poradie predmetu obdobia drog. Snovanie efektných priadzí s predpriadkovým efektom

Analýza rozptylu je štatistická metóda určená na posúdenie vplyvu rôznych faktorov na výsledok experimentu, ako aj na následné plánovanie podobných experimentov.

Spočiatku (1918) analýzu rozptylu vyvinul anglický matematik a štatistik R.A. Fisher spracovať výsledky agrotechnických pokusov na identifikáciu podmienok na získanie maximálneho výnosu rôznych odrôd plodín.

Pri nastavovaní experimentu musia byť splnené nasledujúce podmienky:

    Každý variant pokusu musí byť vykonaný na niekoľkých pozorovacích jednotkách (skupiny zvierat, terénne úseky atď.)

    Rozdelenie jednotiek pozorovania medzi varianty zážitku by malo byť náhodné, nie zámerné.

Analýza rozptylu využíva F-kritérium(kritérium R.A. Fishera), ktoré predstavuje pomer dvoch rozptylov:

kde d je skutočnosť, d je faktorová (medziskupinová) a zvyšková (vnútroskupinová) disperzia na jeden stupeň voľnosti.

Faktoriálne a reziduálne rozptyly sú odhady rozptylu populácie vypočítané z údajov vzorky, pričom sa berie do úvahy počet stupňov voľnosti variácie.

Faktorový (medziskupinový) rozptyl vysvetľuje variáciu výsledného znaku pod vplyvom skúmaného faktora.

Reziduálny (vnútroskupinový) rozptyl vysvetľuje variáciu efektívneho atribútu vplyvom iných faktorov (s výnimkou vplyvu študovaného faktora).

V súčte faktorové a reziduálne rozptyly dávajú celkový rozptyl, ktorý vyjadruje vplyv všetkých faktorových charakteristík na efektívny.

Postup na vykonanie analýzy rozptylu:

1. Experimentálne údaje sa zapíšu do výpočtovej tabuľky a určia sa súčty a priemerné hodnoty v každej skupine skúmanej populácie, ako aj celkové množstvo a priemerná hodnota za celú populáciu (tabuľka 1).

stôl 1

Hodnota výsledného atribútu pre i-tú jednotku

v j-tej skupine, x ij

Počet pozorovaní, f j

Priemer (skupinový a celkový), x j

x 11, x 12, ..., x 1 n

x 21, x 22, ..., x 2 n

x m1, x m2, …, x mn

Celkový počet pozorovaní n vypočítané ako súčet počtu pozorovaní f j v každej skupine:

Ak je počet prvkov vo všetkých skupinách rovnaký, potom celkový priemer sa nachádza zo skupiny priemerov ako jednoduchý aritmetický priemer:

Ak je počet prvkov v skupinách iný, potom celkový priemer vypočítané podľa vzorca aritmetického váženého priemeru:

2. Stanoví sa celkový rozptyl D bežné ako súčet štvorcových odchýlok jednotlivých hodnôt výsledného atribútu z celkového priemeru :

3. Vypočíta sa faktoriálny rozptyl (medzi skupinami). D skutočnosť ako súčet štvorcových odchýlok priemeru skupiny z celkového priemeru vynásobené počtom pozorovaní:

4. Stanoví sa hodnota zvyškového (vnútroskupinového) rozptylu D ost ako rozdiel medzi celk D bežné a faktoriál D skutočnosť disperzie:

5. Počet stupňov voľnosti faktoriálu
rozptyl ako rozdiel medzi počtom skupín m a jednotka:

6. Stanoví sa počet stupňov voľnosti pre zvyškovú disperziu
ako rozdiel medzi počtom hodnôt jednotlivých znakov n a počet skupín m:

7. Vypočíta sa hodnota rozptylu faktorov na jeden stupeň voľnosti d skutočnosť ako pomer rozptylu faktorov D skutočnosť na počet stupňov voľnosti faktoriálového rozptylu
:

8. Stanoví sa hodnota zvyškového rozptylu na jeden stupeň voľnosti d ost ako pomer reziduálneho rozptylu D ost na počet stupňov voľnosti zvyškovej disperzie
:

9. Stanoví sa vypočítaná hodnota F-kritéria F-kalkul ako pomer faktoriálového rozptylu na stupeň voľnosti d skutočnosť na zvyškovú disperziu na jeden stupeň voľnosti d ost :

10. Podľa tabuľky Fisherovho F-kritéria, berúc do úvahy hladinu významnosti prijatú v štúdii, ako aj berúc do úvahy stupne voľnosti pre faktoriálne a reziduálne rozptyly, sa zistila teoretická hodnota F tabuľky .

5% hladina významnosti zodpovedá 95% hladine pravdepodobnosti, 1% - 99% hladine pravdepodobnosti. Vo väčšine prípadov sa používa 5% hladina významnosti.

teoretická hodnota F tabuľky na danej hladine významnosti sa určujú z tabuliek na priesečníku riadku a stĺpca zodpovedajúcich dvom stupňom voľnosti rozptylov:

na linke - zvyškové;

podľa stĺpca - faktoriál.

11. Výsledky výpočtov sú uvedené v tabuľke (tabuľka 2).

Analýza rozptylu

Kurz v disciplíne: "Systémová analýza"

Účinkujúci študent gr. 99 ISE-2 Žbanov V.V.

Štátna univerzita v Orenburgu

Fakulta informačných technológií

Katedra aplikovanej informatiky

Orenburg-2003

Úvod

Účel práce: zoznámiť sa s takou štatistickou metódou, akou je analýza rozptylu.

Analýza rozptylu (z latinského Dispersio - disperzia) je štatistická metóda, ktorá umožňuje analyzovať vplyv rôznych faktorov na skúmanú premennú. Metódu vyvinul biológ R. Fisher v roku 1925 a pôvodne slúžila na vyhodnotenie pokusov v rastlinnej výrobe. Neskôr sa ukázal všeobecný vedecký význam disperznej analýzy pre experimenty v psychológii, pedagogike, medicíne atď.

Účelom analýzy rozptylu je testovať významnosť rozdielu medzi priemermi porovnaním rozptylov. Rozptyl meraného atribútu je rozložený na nezávislé pojmy, z ktorých každý charakterizuje vplyv konkrétneho faktora alebo ich interakciu. Následné porovnanie takýchto pojmov nám umožňuje vyhodnotiť významnosť každého skúmaného faktora, ako aj ich kombináciu /1/.

Ak je pravdivá nulová hypotéza (o rovnosti priemerov vo viacerých skupinách pozorovaní vybraných zo všeobecnej populácie), odhad rozptylu spojeného s vnútroskupinovou variabilitou by mal byť blízky odhadu medziskupinového rozptylu.

Pri realizácii prieskumu trhu často vyvstáva otázka porovnateľnosti výsledkov. Napríklad pri vykonávaní prieskumov spotreby určitého produktu v rôznych regiónoch krajiny je potrebné vyvodiť závery, ako sa údaje prieskumu líšia alebo nelíšia od seba. Nemá zmysel porovnávať jednotlivé ukazovatele, a preto sa postup porovnávania a následného hodnotenia vykonáva podľa niektorých priemerných hodnôt a odchýlok od tohto priemerného hodnotenia. Študuje sa variácia vlastnosti. Rozptyl možno brať ako mieru variácie. Disperzia σ 2 je miera variácie definovaná ako priemer odchýlok štvorca znaku.

V praxi často vznikajú úlohy všeobecnejšieho charakteru - úlohy kontroly významnosti rozdielov priemerov viacerých vzoriek. Napríklad je potrebné vyhodnotiť vplyv rôznych surovín na kvalitu produktov, vyriešiť problém vplyvu množstva hnojív na úrodu poľnohospodárskych produktov.

Niekedy sa analýza rozptylu používa na stanovenie homogenity niekoľkých populácií (rozptyly týchto populácií sú rovnaké podľa predpokladu; ak analýza rozptylu ukazuje, že matematické očakávania sú rovnaké, potom sú populácie v tomto zmysle homogénne). Homogénne populácie je možné spojiť do jednej a získať tak o nej úplnejšie informácie, a teda aj spoľahlivejšie závery /2/.

1 Analýza rozptylu

1.1 Základné pojmy analýzy rozptylu

V procese pozorovania skúmaného objektu sa kvalitatívne faktory menia svojvoľne alebo vopred určeným spôsobom. Konkrétna implementácia faktora (napríklad určitý teplotný režim, vybrané zariadenie alebo materiál) sa nazýva úroveň faktora alebo metóda spracovania. Model ANOVA s pevnými úrovňami faktorov sa nazýva model I, model s náhodnými faktormi sa nazýva model II. Zmenou faktora je možné skúmať jeho vplyv na veľkosť odozvy. V súčasnosti bola pre modely I vyvinutá všeobecná teória analýzy rozptylu.

V závislosti od počtu faktorov, ktoré určujú variáciu výsledného znaku, sa analýza rozptylu delí na jednofaktorovú a viacfaktorovú.

Hlavné schémy na usporiadanie počiatočných údajov s dvoma alebo viacerými faktormi sú:

Krížová klasifikácia, charakteristická pre modely I, v ktorej sa pri plánovaní experimentu kombinuje každá úroveň jedného faktora s každou gradáciou iného faktora;

Hierarchická (vnorená) klasifikácia, charakteristická pre model II, v ktorej každá náhodne vybraná hodnota jedného faktora zodpovedá vlastnej podmnožine hodnôt druhého faktora.

Ak sa súčasne skúma závislosť odpovede od kvalitatívnych a kvantitatívnych faktorov, t.j. faktorov zmiešaného charakteru, potom sa používa kovariančná analýza /3/.

Tieto modely sa teda navzájom líšia v spôsobe výberu úrovní faktora, čo samozrejme primárne ovplyvňuje možnosť zovšeobecnenia získaných experimentálnych výsledkov. Pre analýzu rozptylu jednofaktorových experimentov nie je rozdiel medzi týmito dvoma modelmi taký významný, ale pri viacrozmernej analýze rozptylu môže byť veľmi dôležitý.

Pri vykonávaní analýzy rozptylu musia byť splnené nasledujúce štatistické predpoklady: bez ohľadu na úroveň faktora majú hodnoty odozvy normálny (Gaussov) distribučný zákon a rovnaký rozptyl. Táto rovnosť disperzií sa nazýva homogenita. Zmena spôsobu spracovania teda ovplyvňuje iba polohu náhodnej premennej odozvy, ktorá je charakterizovaná strednou hodnotou alebo mediánom. Preto všetky pozorovania odozvy patria do rodiny posunov normálnych rozdelení.

O technike ANOVA sa hovorí, že je „robustná“. Tento termín, ktorý používajú štatistici, znamená, že tieto predpoklady možno do určitej miery porušiť, no napriek tomu sa dá technika použiť.

Keď nie je známy zákon rozdelenia hodnôt odozvy, používajú sa neparametrické (najčastejšie poradové) metódy analýzy.

Analýza rozptylu je založená na rozdelení rozptylu na časti alebo komponenty. Variáciu spôsobenú vplyvom faktora, ktorý je základom zoskupenia, charakterizuje medziskupinová disperzia σ 2 . Je to miera variácie čiastočných priemerov pre skupiny okolo spoločného priemeru a je určená vzorcom:

,

kde k je počet skupín;

nj je počet jednotiek v j-tej skupine;

Súkromný priemer pre j-tú skupinu;

Celkový priemer za populáciu jednotiek.

Variáciu vplyvom iných faktorov charakterizuje v každej skupine vnútroskupinová disperzia σ j 2 .

.

Existuje vzťah medzi celkovým rozptylom σ 0 2, vnútroskupinovým rozptylom σ 2 a medziskupinovým rozptylom:

σ 0 2 = + σ 2 .

Vnútroskupinový rozptyl vysvetľuje vplyv faktorov nezohľadňovaných pri zoskupovaní a medziskupinový rozptyl vysvetľuje vplyv zoskupovacích faktorov na priemer skupiny /2/.

1.2 Jednosmerná analýza rozptylu

Jednofaktorový disperzný model má tvar:

x ij = μ + F j + ε ij, (1)

kde х ij je hodnota skúmanej premennej získaná na i-tej úrovni faktora (i=1,2,...,т) s j-tým poradovým číslom (j=1,2,... ,n);

F i je účinok v dôsledku vplyvu i-tej úrovne faktora;

ε ij je náhodná zložka, alebo porucha spôsobená vplyvom nekontrolovateľných faktorov, t.j. variácie v rámci jednej úrovne.

Základné predpoklady pre analýzu rozptylu:

Matematické očakávanie poruchy ε ij sa rovná nule pre ľubovoľné i, t.j.

M(e ij) = 0; (2)

Poruchy ε ij sú vzájomne nezávislé;

Rozptyl premennej x ij (alebo poruchy ε ij) je konštantný pre

akékoľvek i, j, t.j.

D(e ij) = a2; (3)

Premenná x ij (alebo porucha ε ij) má normálny zákon

distribúcie N(0;σ 2).

Vplyv úrovní faktorov môže byť buď fixný alebo systematický (Model I) alebo náhodný (Model II).

Nech je napríklad potrebné zistiť, či sú medzi šaržami výrobkov výrazné rozdiely z hľadiska nejakého kvalitatívneho ukazovateľa, t.j. skontrolovať vplyv na kvalitu jedného faktora - šarže produktov. Ak sú do štúdie zahrnuté všetky šarže surovín, potom je vplyv úrovne takéhoto faktora systematický (model I) a zistenia sú aplikovateľné len na tie jednotlivé šarže, ktoré boli zapojené do štúdie. Ak zahrnieme len náhodne vybranú časť strán, tak vplyv faktora je náhodný (model II). V multifaktoriálnych komplexoch je možný zmiešaný model III, v ktorom majú niektoré faktory náhodné úrovne, zatiaľ čo iné sú fixné.

Nech je m šarží produktov. Z každej šarže sa vybralo n 1, n 2, ..., n m produktov (pre jednoduchosť sa predpokladá, že n 1 =n 2 =...=n m = n). Hodnoty indikátora kvality týchto produktov sú uvedené v matici pozorovania:

x 11 x 12 … x 1n

x 21 x 22 … x 2n

………………… = (x ij), (i = 1,2, …, m; j = 1,2, …, n).

x m 1 x m 2 … x mn

Je potrebné skontrolovať význam vplyvu šarží výrobkov na ich kvalitu.

Ak predpokladáme, že prvky riadkov matice pozorovania sú číselné hodnoty náhodných premenných X 1 , X 2 ,..., X m , vyjadrujúce kvalitu produktov a majúce zákon normálneho rozdelenia s matematickými očakávaniami, respektíve a 1 ,a 2 ,...,a m a identické rozptyly σ 2 , potom sa tento problém redukuje na testovanie nulovej hypotézy H 0: a 1 =a 2 =...= a m , uskutočnenej v analýze rozptyl.

Spriemerovanie cez nejaký index je označené hviezdičkou (alebo bodkou) namiesto indexu, potom priemerný indikátor kvality produktov i-tej šarže alebo skupinový priemer pre i-tu úroveň faktora bude brať forma:

kde i * je priemerná hodnota v stĺpcoch;

Ij je prvok matice pozorovania;

n je veľkosť vzorky.

A celkový priemer:

. (5)

Súčet štvorcových odchýlok pozorovaní x ij od celkového priemeru ** vyzerá takto:

2 = 2 + 2 +

2 2 . (6)

Q \u003d Q 1 + Q 2 + Q 3.

Posledný člen je nula

keďže súčet odchýlok hodnôt premennej od jej priemeru sa rovná nule, t.j.

2 =0.

Prvý výraz možno napísať takto:

Výsledkom je identita:

Q = Q 1 + Q 2, (8)

kde - celkový alebo celkový súčet štvorcových odchýlok;

- súčet druhých mocnín odchýlok skupiny od celkového priemeru alebo medziskupinový (faktoriálny) súčet druhých mocnín odchýlok;

- súčet štvorcových odchýlok pozorovaní od skupinových priemerov alebo vnútroskupinový (reziduálny) súčet štvorcových odchýlok.

Rozšírenie (8) obsahuje hlavnú myšlienku analýzy rozptylu. Vo vzťahu k uvažovanému problému rovnosť (8) ukazuje, že celková variácia indikátora kvality, meraná súčtom Q, pozostáva z dvoch komponentov - Q 1 a Q 2, charakterizujúcich variabilitu tohto indikátora medzi dávkami (Q 1 ) a variabilita v rámci šarží (Q 2), charakterizujúca rovnakú variáciu pre všetky šarže pod vplyvom nezohľadnených faktorov.

Pri analýze rozptylu sa neanalyzujú samotné súčty štvorcových odchýlok, ale takzvané stredné štvorce, čo sú nezaujaté odhady zodpovedajúcich rozptylov, ktoré sa získajú vydelením súčtu štvorcových odchýlok zodpovedajúcim počtom stupňov slobody.

Počet stupňov voľnosti je definovaný ako celkový počet pozorovaní mínus počet rovníc, ktoré s nimi súvisia. Preto pre stredný štvorec s 1 2, ktorý je nestranným odhadom medziskupinového rozptylu, je pri jeho výpočte použitý počet stupňov voľnosti k 1 =m-1, keďže m skupinových priemerov prepojených jednou rovnicou (5). A pre stredný štvorec s22, čo je nezaujatý odhad vnútroskupinového rozptylu, je počet stupňov voľnosti k2=mn-m, pretože vypočíta sa pomocou všetkých mn pozorovaní prepojených m rovníc (4).

takto:

Ak nájdeme matematické očakávania stredných štvorcov a dosadíme do ich vzorcov výraz xij (1) cez parametre modelu, dostaneme:

(9)

pretože berúc do úvahy vlastnosti matematického očakávania

a

(10)

Pre model I s pevnými úrovňami faktora F i (i=1,2,...,m) sú hodnoty nenáhodné, preto

M(S) = 2/(m-1) + a2.

Hypotéza H 0 nadobúda tvar F i = F * (i = 1,2,...,m), t.j. vplyv všetkých úrovní faktora je rovnaký. Ak je táto hypotéza pravdivá

M(S)= M(S)= a2.

Pre náhodný model II je výraz F i vo výraze (1) náhodná hodnota. Označuje to rozptylom

dostaneme z (9)

(11)

a ako v modeli I

Tabuľka 1.1 predstavuje všeobecný pohľad na výpočet hodnôt pomocou analýzy rozptylu.

Tabuľka 1.1 - Základná tabuľka analýzy rozptylu

Zložky rozptylu

Súčet štvorcov

Počet stupňov voľnosti

Stredne štvorcový

Stredné štvorcové očakávanie

medziskupina

vnútroskupinová

Hypotéza H 0 bude mať tvar σ F 2 =0. Ak je táto hypotéza pravdivá

M(S)= M(S)= a2.

V prípade jednofaktorového komplexu pre model I aj model II sú stredné štvorce S 2 a S 2 nestranné a nezávislé odhady rovnakého rozptylu σ 2 .

Následne sa testovanie nulovej hypotézy H 0 zredukovalo na testovanie významnosti rozdielu medzi nezaujatými odhadmi vzorky S a S rozptylu σ 2 .

Hypotéza H 0 je zamietnutá, ak skutočne vypočítaná hodnota štatistiky F = S/S je väčšia ako kritická hodnota F α: K 1: K 2 , určená na hladine významnosti α s počtom stupňov voľnosti k 1 = m-1 a k2 = mn-m a akceptované, ak F< F α: K 1: K 2 .

Fisherovo F rozdelenie (pre x > 0) má nasledujúcu funkciu hustoty (pre = 1, 2, ...; = 1, 2, ...):

kde - stupne voľnosti;

G - funkcia gama.

Vo vzťahu k tomuto problému vyvrátenie hypotézy H 0 znamená prítomnosť významných rozdielov v kvalite produktov rôznych šarží na uvažovanej hladine významnosti.

Na výpočet súčtu štvorcov Q 1 , Q 2 , Q je často vhodné použiť nasledujúce vzorce:

(12)

(13)

(14)

tie. vo všeobecnosti nie je potrebné zisťovať samotné priemery.

Postup jednosmernej analýzy rozptylu teda spočíva v testovaní hypotézy H 0, že existuje jedna skupina homogénnych experimentálnych údajov oproti alternatíve, že takýchto skupín je viac. Homogenita sa týka rovnakosti priemerov a odchýlok v akejkoľvek podmnožine údajov. V tomto prípade môžu byť odchýlky vopred známe aj neznáme. Ak existuje dôvod domnievať sa, že známy alebo neznámy rozptyl meraní je rovnaký v celom súbore údajov, potom sa úloha jednosmernej analýzy rozptylu redukuje na štúdium významnosti rozdielu v priemeroch v skupinách údajov / 1/.

1.3 Viacrozmerná disperzia analýza

Okamžite je potrebné poznamenať, že neexistuje žiadny zásadný rozdiel medzi viacrozmernou a jednofaktorovou analýzou rozptylu. Multivariačná analýza nemení všeobecnú logiku rozptylovej analýzy, len ju trochu komplikuje, keďže okrem zohľadnenia vplyvu každého z faktorov na závislú premennú samostatne by sa mal posudzovať aj ich kombinovaný účinok. Nová vec, ktorú multivariačná analýza rozptylu prináša do analýzy údajov, sa teda týka najmä schopnosti hodnotiť medzifaktorovú interakciu. Stále je však možné hodnotiť vplyv každého faktora samostatne. V tomto zmysle je postup viacrozmernej analýzy rozptylu (vo variante jeho počítačového využitia) nepochybne ekonomickejší, keďže len v jednom behu rieši dva problémy naraz: odhaduje sa vplyv každého z faktorov a ich interakcia / 3/.

Všeobecná schéma dvojfaktorového experimentu, ktorého údaje sa spracúvajú analýzou rozptylu, je takáto:



Obrázok 1.1 - Schéma dvojfaktorového experimentu

Údaje podrobené viacrozmernej analýze rozptylu sú často označené podľa počtu faktorov a ich úrovní.

Za predpokladu, že v uvažovanom probléme kvality rôznych m šarží boli výrobky vyrobené na rôznych t strojoch a je potrebné zistiť, či existujú významné rozdiely v kvalite výrobkov pre každý faktor:

A - šarža produktov;

B - stroj.

Výsledkom je prechod k problému dvojfaktorovej analýzy rozptylu.

Všetky údaje sú uvedené v tabuľke 1.2, v ktorej sú riadky - úrovne A i faktora A, stĺpce - úrovne Bj faktora B a v zodpovedajúcich bunkách tabuľky sú hodnoty indikátora kvality produktu x ijk (i = 1,2, ..., m; j = 1,2,..., 1; k = 1,2,..., n).

Tabuľka 1.2 - Ukazovatele kvality produktu

x 11l ,…,x 11k

x 12l ,…,x 12k

x 1jl ,…,x 1jk

x 1ll ,…,x 1lk

x 2 1l ,…,x 2 1k

x 22l ,…,x 22k

x 2jl ,…,x 2jk

x 2ll ,…,x 2lk

x i1l ,…,x i1k

x i2l ,…,x i2k

xijl ,…,xijk

xjll,…,xjlk

x m1l ,…,x m1k

x m2l ,…,x m2k

xmjl,…,xmjk

x mll ,…,x mlk

Dvojfaktorový disperzný model má tvar:

x ijk =μ+F i +G j +I ij +ε ijk , (15)

kde x ijk je hodnota pozorovania v bunke ij s číslom k;

μ - všeobecný priemer;

F i - účinok v dôsledku vplyvu i-tej hladiny faktora A;

G j - účinok v dôsledku vplyvu j-tej hladiny faktora B;

I ij - účinok v dôsledku interakcie dvoch faktorov, t.j. odchýlka od priemeru pozorovaní v bunke ij od súčtu prvých troch členov v modeli (15);

ε ijk - porucha spôsobená variáciou premennej v rámci jednej bunky.

Predpokladá sa, že ε ijk má normálne rozdelenie N(0; с 2) a všetky matematické očakávania F * , G * , I i * , I * j sa rovnajú nule.

Skupinové priemery sa nachádzajú podľa vzorcov:

V bunke:

podľa riadku:

podľa stĺpca:

celkový priemer:

Tabuľka 1.3 predstavuje všeobecný pohľad na výpočet hodnôt pomocou analýzy rozptylu.

Tabuľka 1.3 - Základná tabuľka analýzy rozptylu

Zložky rozptylu

Súčet štvorcov

Počet stupňov voľnosti

Stredné štvorce

Medziskupina (faktor A)

Medziskupina (faktor B)

Interakcia

Reziduálny

Overenie nulových hypotéz HA, HB, HAB o absencii vplyvu faktorov A, B na uvažovanú premennú a ich interakcie AB sa vykonáva porovnaním pomerov , , (pre model I s pevnými úrovňami faktorov) alebo pomerov , , (pre náhodný model II) so zodpovedajúcimi tabuľkovými hodnotami F - Fisher-Snedecorovo kritérium. Pre zmiešaný model III sa testovanie hypotéz týkajúcich sa faktorov s pevnými úrovňami vykonáva rovnakým spôsobom ako v modeli II a pre faktory s náhodnými úrovňami ako v modeli I.

Ak n=1, t.j. s jedným pozorovaním v bunke sa potom nedajú testovať všetky nulové hypotézy, keďže z celkového súčtu štvorcových odchýlok vypadne zložka Q3 a s ňou aj stredná štvorica, keďže v tomto prípade nemôže byť reč o interakcii faktory.

Z hľadiska výpočtovej techniky je na nájdenie súčtu štvorcov Q 1, Q 2, Q 3, Q 4, Q účelnejšie použiť vzorce:

O 3 \u003d O - O 1 - O 2 - O 4.

Odchýlka od základných predpokladov analýzy rozptylu - normalita rozloženia skúmanej premennej a rovnosť rozptylov v bunkách (ak nie je nadmerná) - významne neovplyvňuje výsledky analýzy rozptylu s rovnaký počet pozorovaní v bunkách, ale môžu byť veľmi citlivé, ak ich počet nie je rovnaký. Okrem toho pri nerovnakom počte pozorovaní v bunkách sa zložitosť prístroja na analýzu rozptylu prudko zvyšuje. Preto sa odporúča navrhnúť schému s rovnakým počtom pozorovaní v bunkách a ak chýbajú údaje, kompenzovať ich priemernými hodnotami ostatných pozorovaní v bunkách. V tomto prípade by sa však pri výpočte počtu stupňov voľnosti /1/ nemalo brať do úvahy umelo zavedené chýbajúce údaje.

2 Aplikácia ANOVA v rôznych procesoch a štúdiách

2.1 Využitie analýzy rozptylu pri štúdiu migračných procesov

Migrácia je zložitý spoločenský jav, ktorý do značnej miery určuje ekonomické a politické aspekty spoločnosti. Štúdium migračných procesov je spojené s identifikáciou faktorov záujmu, spokojnosti s pracovnými podmienkami a hodnotením vplyvu získaných faktorov na medziskupinový pohyb obyvateľstva.

λ ij = c i q ij a j ,

kde λ ij je intenzita prechodov z pôvodnej skupiny i (výstup) do novej skupiny j (vstup);

c i – možnosť a schopnosť opustiť skupinu i (c i ≥0);

q ij – atraktívnosť novej skupiny v porovnaní s pôvodnou (0≤q ij ≤1);

a j – dostupnosť skupiny j (a j ≥0).

ν ij ≈ n i λ ij =n i c i q ij a j . (šestnásť)

V praxi je pre jednotlivca pravdepodobnosť p presunu do inej skupiny malá a veľkosť uvažovanej skupiny n je veľká. V tomto prípade platí zákon zriedkavých udalostí, to znamená, že limita ν ij je Poissonovo rozdelenie s parametrom μ=np:

.

Keď sa μ zvyšuje, distribúcia sa blíži k normálu. Transformovanú hodnotu √ν ij možno považovať za normálne rozloženú.

Ak vezmeme logaritmus výrazu (16) a vykonáme potrebné zmeny premenných, potom môžeme získať analýzu modelu rozptylu:

ln√ν ij =½lnν ij =½(lnn i +lnc i +lnq ij +lna j)+ε ij,

X i,j =2ln√ν ij -lnn i -lnq ij,

Xi,j =Ci +Aj +ε.

Hodnoty Ci a A j umožňujú získať obojsmerný model ANOVA s jedným pozorovaním na bunku. Inverzná transformácia z C i a A j vypočíta koeficienty ci a a j.

Pri vykonávaní analýzy rozptylu by sa ako hodnoty efektívnej funkcie Y mali brať nasledujúce hodnoty:

X \u003d (X 1,1 + X 1,2 +: + X mi, mj) / mimj,

kde mimj je odhad matematického očakávania X i,j ;

X mi a X mj - počet výstupných a vstupných skupín.

Úrovne faktora I budú mi výstupné skupiny, úrovne faktora J budú mj vstupné skupiny. Mi=mj=m sa predpokladá. Problém vzniká testovaním hypotéz H I a H J o rovnosti matematických očakávaní hodnoty Y na úrovniach I i a na úrovniach J j , i,j=1,…,m. Testovanie hypotéz H I je založené na porovnávaní hodnôt nezaujatých odhadov rozptylu s I 2 a s o 2 . Ak je hypotéza H I správna, potom hodnota F (I) = s I 2 /s o 2 má Fisherovo rozdelenie s počtom stupňov voľnosti k 1 =m-1 a k 2 =(m-1)(m- 1). Pre danú hladinu významnosti α sa nájde pravotočivý kritický bod x pr, α cr. Ak číselná hodnota F (I) veličiny spadá do intervalu (x pr, α kr, +∞), potom je hypotéza H I zamietnutá a predpokladá sa, že faktor I ovplyvňuje efektívnu vlastnosť. Miera tohto vplyvu sa na základe výsledkov pozorovaní meria výberovým koeficientom determinácie, ktorý ukazuje, aký podiel rozptylu výsledného znaku vo vzorke je spôsobený vplyvom faktora I. Ak F ( ja)

2.2 Princípy matematickej a štatistickej analýzy údajov z biomedicínskeho výskumu

V závislosti od úlohy, objemu a charakteru materiálu, typu údajov a ich vzťahov existuje možnosť výberu metód matematického spracovania v štádiách predbežného (na posúdenie charakteru rozloženia v skúmanej vzorke), ako aj v etapách matematického spracovania. záverečná analýza v súlade s cieľmi štúdie. Mimoriadne dôležitým aspektom je overenie homogenity vybraných pozorovacích skupín vrátane kontrolných, ktoré môže vykonať buď expert, alebo metódami viacrozmernej štatistiky (napríklad pomocou zhlukovej analýzy). Prvým krokom je však zostavenie dotazníka, ktorý poskytuje štandardizovaný popis charakteristík. Najmä pri vykonávaní epidemiologických štúdií, kde je potrebná jednota v chápaní a popisovaní rovnakých symptómov rôznymi lekármi, vrátane zohľadnenia rozsahov ich zmien (závažnosti). Ak existujú výrazné rozdiely v registrácii počiatočných údajov (subjektívne hodnotenie povahy patologických prejavov rôznymi odborníkmi) a nemožnosť ich zjednotenia v štádiu zhromažďovania informácií, potom môže dôjsť k takzvanej kovariantnej korekcii. vykonať, čo zahŕňa normalizáciu premenných, t.j. odstránenie abnormalít ukazovateľov v dátovej matici. „Koordinácia názorov“ sa vykonáva s prihliadnutím na špecializáciu a skúsenosti lekárov, čo následne umožňuje porovnávať výsledky nimi získaného vyšetrenia medzi sebou. Na tento účel možno použiť viacrozmernú analýzu rozptylu a regresnú analýzu.

Znaky môžu byť buď rovnakého typu, čo je zriedkavé, alebo rôznych typov. Tento pojem označuje ich rozdielne metrologické hodnotenie. Kvantitatívne alebo číselné znaky sú znaky merané na určitej stupnici a na stupniciach intervalov a pomerov (I skupina znakov). Kvalitatívne, hodnotiace alebo bodové hodnotenie sa používa na vyjadrenie lekárskych termínov a konceptov, ktoré nemajú číselné hodnoty (napríklad závažnosť stavu) a merajú sa na stupnici poradia (skupina znakov II). Klasifikácia alebo nominálna (napríklad povolanie, krvná skupina) - tieto sa merajú v stupnici mien (skupina III znakov).

V mnohých prípadoch sa pokúša analyzovať extrémne veľké množstvo vlastností, ktoré by mali pomôcť zvýšiť informačný obsah prezentovanej vzorky. Voľba užitočných informácií, to znamená implementácia výberu vlastností, je však absolútne nevyhnutná operácia, pretože na vyriešenie akéhokoľvek problému klasifikácie je potrebné vybrať informácie nesúce informácie, ktoré sú užitočné pre túto úlohu. V prípade, že to výskumník z nejakého dôvodu neuskutoční sám alebo neexistujú dostatočne podložené kritériá na zmenšenie rozmeru priestorového znaku zo zmysluplných dôvodov, boj proti informačnej redundancii sa už uskutočňuje formálnymi metódami tzv. posúdenie obsahu informácií.

Analýza rozptylu umožňuje určiť vplyv rôznych faktorov (podmienok) na študovaný znak (jav), čo sa dosiahne rozkladom celkovej variability (rozptyl vyjadrený ako súčet štvorcových odchýlok od všeobecného priemeru) na jednotlivé komponenty spôsobené vplyvom rôznych zdrojov variability.

Pomocou analýzy rozptylu sa hrozby choroby skúmajú v prítomnosti rizikových faktorov. Koncept relatívneho rizika berie do úvahy vzťah medzi pacientmi s určitým ochorením a tými, ktorí ho nemajú. Hodnota relatívneho rizika umožňuje určiť, koľkokrát sa v jeho prítomnosti zvýši pravdepodobnosť ochorenia, čo možno odhadnúť pomocou nasledujúceho zjednodušeného vzorca:

kde a je prítomnosť znaku v študijnej skupine;

b - absencia vlastnosti v študijnej skupine;

c - prítomnosť znaku v porovnávacej skupine (kontrola);

d - absencia znamienka v porovnávacej skupine (kontrola).

Atribút rizikové skóre (rA) sa používa na posúdenie podielu chorobnosti spojenej s daným rizikovým faktorom:

,

kde Q je frekvencia znaku označenia rizika v populácii;

r" - relatívne riziko.

Identifikácia faktorov podieľajúcich sa na vzniku (prejave) ochorenia, t.j. rizikové faktory je možné realizovať rôznymi spôsobmi, napríklad hodnotením obsahu informácií s následným zoraďovaním znakov, ktoré však nevypovedá o kumulatívnom efekte zvolených parametrov, na rozdiel od použitia regresie, faktorových analýz, metódy teórie rozpoznávania vzorov, ktoré umožňujú získať „symptomatické komplexy“ rizikových faktorov. Sofistikovanejšie metódy navyše umožňujú analyzovať nepriame vzťahy medzi rizikovými faktormi a chorobami /5/.

2.3 Pôdny biologický test

Rôzne škodliviny, ktoré sa dostávajú do agrocenózy, v nej môžu prechádzať rôznymi premenami, pričom zvyšujú svoj toxický účinok. Z tohto dôvodu sa ukázali ako nevyhnutné metódy integrálneho hodnotenia kvality komponentov agrocenózy. Štúdie sa uskutočnili na základe viacrozmernej analýzy rozptylu v 11-poľnom striedaní plodín s obilím a trávou. V experimente bol sledovaný vplyv nasledujúcich faktorov: úrodnosť pôdy (A), systém hnojenia (B), systém ochrany rastlín (C). Úrodnosť pôdy, systém hnojenia a systém ochrany rastlín sa skúmali v dávkach 0, 1, 2 a 3. Základné možnosti predstavovali tieto kombinácie:

000 - počiatočná úroveň plodnosti bez použitia hnojív a prípravkov na ochranu rastlín pred škodcami, chorobami a burinami;

111 - priemerná úroveň úrodnosti pôdy, minimálna dávka hnojív, biologická ochrana rastlín pred škodcami a chorobami;

222 - počiatočná úroveň úrodnosti pôdy, priemerná dávka hnojív, chemická ochrana rastlín pred burinou;

333 - vysoká úrodnosť pôdy, vysoká dávka hnojív, chemická ochrana rastlín pred škodcami a chorobami.

Študovali sme možnosti, kde je prítomný iba jeden faktor:

200 - plodnosť:

020 - hnojivá;

002 - prípravky na ochranu rastlín.

Rovnako ako možnosti s inou kombináciou faktorov - 111, 131, 133, 022, 220, 202, 331, 313, 311.

Cieľom štúdie bolo štúdium inhibície chloroplastov a koeficientu okamžitého rastu, ako indikátorov znečistenia pôdy, v rôznych variantoch multifaktoriálneho experimentu.

Inhibícia fototaxie chloroplastov žaburinky bola študovaná v rôznych pôdnych horizontoch: 0–20, 20–40 cm. Podiel na celkovom rozptyle úrodnosti pôdy bol 39,7 %, systémy hnojív - 30,7 %, systémy ochrany rastlín - 30,7 %.

Na štúdium kombinovaného účinku faktorov na inhibíciu fototaxie chloroplastov sa použili rôzne kombinácie experimentálnych variantov: v prvom prípade - 000, 002, 022, 222, 220, 200, 202, 020, v druhom prípade - 111, 333, 331, 313, 133, 311, 131.

Výsledky obojsmernej analýzy rozptylu naznačujú významný vplyv interagujúcich systémov hnojív a ochrany rastlín na rozdiely vo fototaxii pre prvý prípad (podiel na celkovom rozptyle bol 10,3 %). V druhom prípade bol zistený významný vplyv interagujúceho systému úrodnosti pôdy a hnojív (53,2 %).

Trojstranná analýza rozptylu ukázala v prvom prípade významný vplyv interakcie všetkých troch faktorov. Podiel na celkovom rozptyle bol 47,9 %.

Okamžitý rastový koeficient bol študovaný v rôznych variantoch pokusu 000, 111, 222, 333, 002, 200, 220. Prvá etapa testovania bola pred aplikáciou herbicídov na porasty ozimnej pšenice (apríl), druhá etapa bola po r. aplikácia herbicídov (máj) a posledná bola v čase zberu (júl). Predchodcovia - slnečnica a kukurica na zrno.

Výskyt nových lístkov bol pozorovaný po krátkej lag fáze s obdobím celkového zdvojnásobenia čerstvej hmotnosti 2-4 dni.

V kontrole a v každom variante sa na základe získaných výsledkov vypočítal koeficient okamžitého prírastku populácie r a následne sa vypočítal čas zdvojnásobenia počtu lístkov (t zdvojnásobenie).

t sa zdvojnásobí \u003d ln2 / r.

Výpočet týchto ukazovateľov prebiehal v dynamike s rozborom pôdnych vzoriek. Analýza údajov ukázala, že čas zdvojnásobenia populácie žaburinky pred obrábaním pôdy bol najkratší v porovnaní s údajmi po obrábaní pôdy a v čase zberu. V dynamike pozorovaní je zaujímavejšia odozva pôdy po aplikácii herbicídu a v čase zberu. V prvom rade interakcia s hnojivami a úroveň úrodnosti.

Niekedy môže byť získanie priamej reakcie na aplikáciu chemických prípravkov komplikované interakciou prípravku s hnojivami, organickými aj minerálnymi. Získané údaje umožnili sledovať dynamiku odozvy aplikovaných prípravkov, vo všetkých variantoch s chemickými prostriedkami ochrany, kde dochádza k pozastaveniu rastu indikátora.

Údaje jednosmernej analýzy rozptylu ukázali významný vplyv každého ukazovateľa na rýchlosť rastu žaburinky v prvej fáze. V druhej fáze bol vplyv rozdielov v úrodnosti pôdy 65,0 %, v systéme hnojív a systéme ochrany rastlín po 65,0 %. Faktory vykazovali výrazné rozdiely medzi variantom 222 a variantom 000, 111, 333, priemer z hľadiska koeficientu okamžitého rastu.V tretej etape bol podiel na celkovom rozptyle úrodnosti pôdy 42,9 %, systémy hnojív a ochrana rastlín systémy – každý po 42,9 %. Významný rozdiel bol zaznamenaný v priemerných hodnotách možností 000 a 111, možností 333 a 222.

Študované vzorky pôdy z možností terénneho monitoringu sa navzájom líšia z hľadiska inhibície fototaxie. Bol zaznamenaný vplyv faktorov plodnosti, systém hnojenia a prípravky na ochranu rastlín s podielmi 30,7 a 39,7 % pri jednofaktorovej analýze, pri dvojfaktorovej a trojfaktorovej analýze bol zaznamenaný spoločný vplyv faktorov.

Analýza experimentálnych výsledkov ukázala nevýznamné rozdiely medzi pôdnymi horizontmi z hľadiska indikátora inhibície fototaxie. Rozdiely sú vyznačené priemernými hodnotami.

Vo všetkých variantoch, kde sú prípravky na ochranu rastlín, sú pozorované menej zmeny polohy chloroplastov a zastavenie rastu žaburinky /6/.

2.4 Chrípka spôsobuje zvýšenú produkciu histamínu

Vedci z Detskej nemocnice v Pittsburghu (USA) získali prvý dôkaz, že hladina histamínu sa zvyšuje s akútnymi respiračnými vírusovými infekciami. Napriek tomu, že histamín sa už predtým predpokladal, že hrá úlohu pri nástupe symptómov akútnych respiračných infekcií horných dýchacích ciest.

Vedcov zaujímalo, prečo veľa ľudí používa antihistaminiká, ktoré sú v mnohých krajinách zaradené do kategórie OTC, na samoliečbu „prechladnutia“ a prechladnutia. dostupné bez lekárskeho predpisu.

Účelom tejto štúdie bolo určiť, či je produkcia histamínu zvýšená počas experimentálnej infekcie vírusom chrípky A.

Vírus chrípky A bol intranazálne injikovaný 15 zdravým dobrovoľníkom a potom sa pozoroval vývoj infekcie. Denne v priebehu ochorenia sa od dobrovoľníkov odoberala ranná časť moču a potom sa stanovil histamín a jeho metabolity a vypočítalo sa celkové množstvo histamínu a jeho metabolitov vylúčené za deň.

Ochorenie sa rozvinulo u všetkých 15 dobrovoľníkov. Analýza rozptylu potvrdila signifikantne vyššiu hladinu histamínu v moči na 2. – 5. deň vírusovej infekcie (p<0,02) - период, когда симптомы «простуды» наиболее выражены. Парный анализ показал, что наиболее значительно уровень гистамина повышается на 2 день заболевания. Кроме этого, оказалось, что суточное количество гистамина и его метаболитов в моче при гриппе примерно такое же, как и при обострении аллергического заболевания.

Výsledky tejto štúdie slúžia ako prvý priamy dôkaz, že hladiny histamínu sú zvýšené pri akútnych respiračných infekciách /7/.

Analýza rozptylu v chémii

Disperzná analýza je súbor metód na určenie disperzie, t.j. charakteristík veľkosti častíc v disperzných systémoch. Disperzná analýza zahŕňa rôzne metódy na určenie veľkosti voľných častíc v kvapalnom a plynnom prostredí, veľkosti pórových kanálov v jemne poréznych telesách (v tomto prípade sa namiesto pojmu disperzia používa ekvivalentný pojem pórovitosti), ako aj špecifická plocha povrchu. Niektoré z metód disperznej analýzy umožňujú získať úplný obraz o distribúcii častíc podľa veľkosti (objemu), zatiaľ čo iné poskytujú len priemernú charakteristiku disperzie (pórovitosť).

Do prvej skupiny patria napríklad metódy na určenie veľkosti jednotlivých častíc priamym meraním (sitová analýza, optická a elektrónová mikroskopia) alebo nepriamymi údajmi: rýchlosť usadzovania častíc vo viskóznom prostredí (analýza sedimentácie v gravitačnom poli a tzv. v centrifúgach), veľkosť impulzov elektrického prúdu, vznikajúcich pri prechode častíc cez otvor v nevodivej prepážke (konduktometrická metóda).

Druhá skupina metód kombinuje odhad priemernej veľkosti voľných častíc a určenie špecifickej plochy povrchu práškov a poréznych teliesok. Priemerná veľkosť častíc sa zisťuje intenzitou rozptýleného svetla (nefelometria), ultramikroskopom, difúznymi metódami a pod., špecifický povrch sa zisťuje adsorpciou plynov (pár) alebo rozpustených látok, priepustnosťou plynov, rýchlosťou rozpúšťania, a iné metódy. Nižšie sú uvedené limity použiteľnosti rôznych metód analýzy rozptylu (veľkosti častíc v metroch):

Sitová analýza - 10 -2 -10 -4

Sedimentačná analýza v gravitačnom poli - 10 -4 -10 -6

Konduktometrická metóda - 10 -4 -10 -6

Mikroskopia - 10 -4 -10 -7

Spôsob filtrácie - 10 -5 -10 -7

Odstreďovanie - 10 -6 -10 -8

Ultracentrifugácia - 10 -7 -10 -9

Ultramikroskopia - 10 -7 -10 -9

Nefelometria - 10 -7 -10 -9

Elektrónová mikroskopia - 10 -7 -10 -9

Difúzna metóda - 10 -7 -10 -10

Disperzná analýza je široko používaná v rôznych oblastiach vedy a priemyselnej výroby na posúdenie disperzie systémov (suspenzie, emulzie, sóly, prášky, adsorbenty atď.) s veľkosťou častíc od niekoľkých milimetrov (10-3 m) do niekoľkých nanometrov (10 -9 m) /8/.

2.6 Využívanie priamej zámernej sugescie v bdelom stave v metóde výchovy k telesným vlastnostiam

Fyzická príprava je základnou stránkou športového tréningu, pretože vo väčšej miere ako iné aspekty tréningu sa vyznačuje fyzickou záťažou, ktorá ovplyvňuje morfologické a funkčné vlastnosti tela. Úspešnosť technickej prípravy, obsah taktiky športovca, realizácia osobných vlastností v procese tréningu a súťaže závisí od úrovne fyzickej zdatnosti.

Jednou z hlavných úloh telesnej výchovy je výchova k pohybovým vlastnostiam. V tejto súvislosti je potrebné vyvinúť pedagogické nástroje a metódy, ktoré umožnia zohľadňovať vekové charakteristiky mladých športovcov, ktoré si zachovávajú zdravie, nevyžadujú dodatočný čas a zároveň stimulujú rast fyzických kvalít a ako výsledok, športového ducha. Využitie verbálneho heteroinfluencie v tréningovom procese v primárnych tréningových skupinách je jednou z perspektívnych oblastí výskumu tejto problematiky.

Analýza teórie a praxe implementácie inšpiratívneho verbálneho heterovplyvu odhalila hlavné rozpory:

Dôkaz o efektívnom využívaní špecifických metód verbálneho heteroovplyvňovania v tréningovom procese a praktickej nemožnosti ich využitia trénerom;

Uznanie priamej zámernej sugescie (ďalej len DSP) v bdelom stave ako jednej z hlavných metód verbálneho heteroovplyvňovania v pedagogickej činnosti trénera a chýbajúce teoretické zdôvodnenie metodických znakov jej využitia v športovej príprave, a najmä v procese výchovy k fyzickým vlastnostiam.

V súvislosti so zistenými rozpormi a nedostatočným rozvojom problém využitia systému metód verbálneho heteroovplyvňovania v procese výchovy fyzických kvalít športovcov predurčil účel štúdia - rozvíjať racionálne cielené metódy PPV v bdelom stave, rozvíjať racionálne cielené metódy PPV v bdelom stave. prispievanie k skvalitňovaniu procesu výchovy pohybových vlastností na základe hodnotenia psychického stavu, prejavov a dynamiky fyzických kvalít džudistov základných tréningových skupín.

S cieľom otestovať a zistiť účinnosť experimentálnych metód PPV pri rozvoji fyzických kvalít zápasníkov v džude sa uskutočnil porovnávací pedagogický experiment, ktorého sa zúčastnili štyri skupiny – tri experimentálne a jedna kontrolná. V prvej experimentálnej skupine (EG) bola použitá technika PPV M1, v druhej - technika PPV M2, v tretej - technika PPV M3. V kontrolnej skupine (CG) neboli metódy PPV použité.

Na zistenie efektívnosti pedagogického vplyvu metód PPV v procese výchovy fyzických kvalít medzi džudistami bola vykonaná jednofaktorová analýza rozptylu.

Miera vplyvu metodiky PPV M1 v procese vzdelávania:

Výdrž:

a) po treťom mesiaci bola 11,1 %;

Rýchlostné schopnosti:

a) po prvom mesiaci - 16,4 %;

b) po druhom - 26,5 %;

c) po treťom - 34,8 %;

a) po druhom mesiaci - 26,7 %;

b) po treťom - 35,3 %;

Flexibilita:

a) po treťom mesiaci - 20,8 %;

a) po druhom mesiaci hlavného pedagogického experimentu bola miera ovplyvnenia metodikou 6,4 %;

b) po treťom - 10,2 %.

Následne boli zistené výrazné zmeny v ukazovateľoch úrovne rozvoja fyzických vlastností metódou PPV M1 v rýchlostných schopnostiach a sile, miera vplyvu metódy je v tomto prípade najväčšia. Najmenší vplyv metodiky bol zistený v procese výchovy vytrvalosti, flexibility a koordinačných schopností, čo dáva dôvod hovoriť o nedostatočnej efektívnosti využívania metódy PPV M1 pri výchove týchto vlastností.

Miera vplyvu metodiky PPV M2 v procese vzdelávania:

Vytrvalosť

a) po prvom mesiaci experimentu - 12,6 %;

b) po druhom - 17,8 %;

c) po treťom - 20,3 %.

Rýchlostné schopnosti:

a) po treťom mesiaci tréningov - 28 %.

a) po druhom mesiaci - 27,9 %;

b) po treťom - 35,9 %.

Flexibilita:

a) po treťom mesiaci tréningov - 14,9 %;

Koordinačné schopnosti – 13,1 %.

Získaný výsledok jednosmernej ANOVA tohto EG nám umožňuje dospieť k záveru, že metóda PPV M2 je najúčinnejšia v rozvoji vytrvalosti a sily. Je menej efektívny v procese rozvoja ohybnosti, rýchlosti a koordinačných schopností.

Miera vplyvu metodiky PPV M3 v procese vzdelávania:

Výdrž:

a) po prvom mesiaci experimentu 16,8 %;

b) po druhom - 29,5 %;

c) po treťom - 37,6 %.

Rýchlostné schopnosti:

a) po prvom mesiaci - 26,3 %;

b) po druhom - 31,3 %;

c) po treťom - 40,9 %.

a) po prvom mesiaci - 18,7 %;

b) po druhom - 26,7 %;

c) po treťom - 32,3 %.

Flexibilita:

a) po prvom - nie sú žiadne zmeny;

b) po druhom - 16,9 %;

c) po treťom - 23,5 %.

Koordinačné schopnosti:

a) po prvom mesiaci nenastali žiadne zmeny;

b) po druhom - 23,8 %;

c) po treťom - 91 %.

Jednofaktorová analýza rozptylu teda ukázala, že použitie techniky PPV M3 v prípravnom období je v procese výchovy fyzických kvalít najefektívnejšie, keďže po každom mesiaci pedagogického experimentu sa miera jej vplyvu zvyšuje. /9/.

2.7 Zmiernenie akútnych psychotických symptómov u pacientov so schizofréniou s atypickým antipsychotikom

Účelom štúdie bolo študovať možnosť použitia rispoleptu na zmiernenie akútnej psychózy u pacientov s diagnostikovanou schizofréniou (paranoidný typ podľa ICD-10) a schizoafektívnou poruchou. Zároveň bol ako hlavné sledované kritérium použitý indikátor trvania pretrvávania psychotických symptómov pri farmakoterapii rispoleptom (hlavná skupina) a klasickými antipsychotikami.

Hlavnými cieľmi štúdie bolo určiť ukazovateľ dĺžky trvania psychózy (tzv. net psychosis), ktorý bol chápaný ako zachovanie produktívnych psychotických symptómov od začiatku užívania antipsychotík, vyjadrený v dňoch. Tento ukazovateľ bol vypočítaný zvlášť pre skupinu s risperidónom a zvlášť pre skupinu s klasickými antipsychotikami.

Spolu s tým bola vytýčená úloha určiť podiel redukcie produktívnych symptómov pod vplyvom risperidónu v porovnaní s klasickými antipsychotikami v rôznych obdobiach terapie.

Celkovo bolo sledovaných 89 pacientov (42 mužov a 47 žien) s akútnymi psychotickými symptómami v rámci paranoidnej formy schizofrénie (49 pacientov) a schizoafektívnej poruchy (40 pacientov).

Prvá epizóda a trvanie ochorenia do 1 roka boli zaznamenané u 43 pacientov, zatiaľ čo v ostatných prípadoch boli v čase štúdie zaznamenané následné epizódy schizofrénie s trvaním ochorenia viac ako 1 rok.

Terapiu risspoleptom absolvovalo 29 ľudí, medzi ktorými bolo 15 pacientov s takzvanou prvou epizódou. Terapiu klasickými neuroleptikami absolvovalo 60 ľudí, medzi ktorými bolo 28 ľudí s prvou epizódou. Dávka rispoleptu sa pohybovala v rozmedzí od 1 do 6 mg denne a v priemere bola 4±0,4 mg/deň. Risperidón sa užíval výlučne perorálne po jedle raz denne večer.

Terapia klasickými antipsychotikami zahŕňala použitie trifluoperazínu (triftazínu) v dennej dávke do 30 mg intramuskulárne, haloperidolu v dennej dávke do 20 mg intramuskulárne, triperidolu v dennej dávke do 10 mg perorálne. Prevažná väčšina pacientov počas prvých dvoch týždňov užívala klasické antipsychotiká ako monoterapiu, po ktorej v prípade potreby (pri zachovaní bludných, halucinačných alebo iných produktívnych symptómov) prešli na kombináciu viacerých klasických antipsychotík. Ako hlavný liek zároveň zostalo neuroleptikum s výrazným elektívnym anti-bludným a antihalucinačným účinkom (napríklad haloperidol alebo triftazín), liek s výrazným hypnosedatívnym účinkom (chlórpromazín, tizercín, chlórprotixén v dávkach až 50-100 mg/deň) sa k nemu pridávalo večer.

V skupine užívajúcej klasické antipsychotiká bolo plánované užívanie anticholinergných korektorov (Parkopan, Cyclodol) v dávkach do 10-12 mg/deň. Korektory boli predpísané v prípade objavenia sa zreteľných extrapyramídových vedľajších účinkov vo forme akútnej dystónie, drogovo vyvolaného parkinsonizmu a akatízie.

V tabuľke 2.1 sú uvedené údaje o dĺžke trvania psychózy pri liečbe rispoleptom a klasickými antipsychotikami.

Tabuľka 2.1 - Trvanie psychózy ("čisté psychózy") pri liečbe rispoleptom a klasickými antipsychotikami

Ako vyplýva z údajov v tabuľke, pri porovnaní dĺžky trvania psychózy počas terapie klasickými antipsychotikami a risperidónom dochádza k takmer dvojnásobnému skráteniu trvania psychotických symptómov pod vplyvom rispoleptu. Je významné, že ani faktory sériového počtu záchvatov, ani charakter obrazu vedúceho syndrómu neovplyvnili túto hodnotu trvania psychózy. Inými slovami, trvanie psychózy bolo určené výlučne faktorom terapie, t.j. záviselo od typu použitého lieku, bez ohľadu na sériové číslo záchvatu, trvanie ochorenia a povahu vedúceho psychopatologického syndrómu.

Na potvrdenie získaných zákonitostí bola vykonaná dvojfaktorová analýza rozptylu. Zároveň sa postupne brala do úvahy interakcia terapeutického faktora a poradového čísla záchvatu (1. štádium) a interakcia terapeutického faktora a povahy vedúceho syndrómu (2. štádium). Výsledky analýzy rozptylu potvrdili vplyv faktora terapie na trvanie psychózy (F=18,8) pri absencii vplyvu faktora počtu záchvatov (F=2,5) a faktora typu psychopatologického syndrómu (F=1,7). ). Dôležité je, že chýbal aj spoločný vplyv terapeutického faktora a počtu atakov na trvanie psychózy, ako aj spoločný vplyv terapeutického faktora a faktora psychopatologického syndrómu.

Výsledky analýzy rozptylu teda potvrdili vplyv iba faktora aplikovaného antipsychotika. Rispolept jednoznačne viedol k skráteniu trvania psychotických symptómov v porovnaní s tradičnými antipsychotikami asi 2-krát. Dôležité je, že tento účinok bol dosiahnutý aj napriek perorálnemu podávaniu rispoleptu, pričom klasické antipsychotiká sa u väčšiny pacientov používali parenterálne /10/.

2.8 Osnovanie efektných priadzí s efektom rovingov

Štátna technologická univerzita Kostroma vyvinula novú tvarovanú štruktúru závitu s variabilnými geometrickými parametrami. V tomto smere vzniká problém spracovania efektnej priadze v prípravnej výrobe. Táto štúdia bola venovaná procesu skrúcania na otázky: výber typu napínača, ktorý dáva minimálne rozloženie napätia a vyrovnanie napätia, závity rôznych lineárnych hustôt pozdĺž šírky osnovného hriadeľa.

Predmetom výskumu je ľanová priadza štyroch variantov lineárnej hustoty od 140 do 205 tex. Bola študovaná práca napínacích zariadení troch typov: porcelánová umývačka, dvojzónová NS-1P a jednozónová NS-1P. Experimentálna štúdia napätia snovacích nití bola vykonaná na snovacom stroji SP-140-3L. Rýchlosť snovania, hmotnosť brzdových kotúčov zodpovedala technologickým parametrom snovania priadze.

Na štúdium závislosti napätia tvarovej nite na geometrických parametroch počas skrútenia bola vykonaná analýza dvoch faktorov: X 1 - priemer účinku, X 2 - dĺžka účinku. Výstupnými parametrami sú napätie Y 1 a kolísanie napätia Y 2 .

Výsledné regresné rovnice zodpovedajú experimentálnym údajom na hladine významnosti 0,95, pretože vypočítané Fisherovo kritérium pre všetky rovnice je menšie ako tabuľkové.

Na určenie miery vplyvu faktorov X 1 a X 2 na parametre Y 1 a Y 2 bola vykonaná analýza rozptylu, ktorá ukázala, že priemer účinku má väčší vplyv na úroveň a kolísanie napätia. .

Porovnávacia analýza získaných tensogramov ukázala, že minimálne šírenie napätia pri skrúcaní tejto priadze zabezpečuje dvojzónové napínacie zariadenie NS-1P.

Zistilo sa, že so zvýšením lineárnej hustoty zo 105 na 205 tex poskytuje zariadenie NS-1P zvýšenie úrovne napätia iba o 23%, zatiaľ čo porcelánová umývačka - o 37%, jednozónová NS-1P - o 53 %.

Pri formovaní osnovných hriadeľov vrátane tvarovaných a "hladkých" nití je potrebné individuálne nastavovať napínač tradičnou metódou /11/.

2.9 Sprievodná patológia s úplnou stratou zubov u starších a senilných ľudí

Študovala sa epidemiologicky úplná strata zubov a sprievodná patológia staršej populácie žijúcej v domovoch dôchodcov na území Čuvašska. Vyšetrenie sa uskutočnilo stomatologickou prehliadkou a vyplnením štatistických kariet u 784 osôb. Výsledky analýzy ukázali vysoké percento úplnej straty zubov, ktorú zhoršuje všeobecná patológia tela. To charakterizuje skúmanú kategóriu populácie ako skupinu so zvýšeným zubným rizikom a vyžaduje si revíziu celého systému ich stomatologickej starostlivosti.

U starších ľudí je výskyt dvojnásobný a v starobe šesťnásobne vyšší v porovnaní s výskytom u mladších ľudí.

Hlavnými chorobami starších a senilných ľudí sú choroby obehovej sústavy, nervovej sústavy a zmyslových orgánov, dýchacích orgánov, tráviacich orgánov, kostí a pohybových orgánov, novotvary a úrazy.

Účelom štúdie je rozvíjať a získavať informácie o sprievodných ochoreniach, účinnosti protetiky a potrebe ortopedickej liečby starších a senilných ľudí s úplnou stratou zubov.

Celkovo bolo vyšetrených 784 ľudí vo veku od 45 do 90 rokov. Pomer žien a mužov je 2,8:1.

Vyhodnotenie štatistického vzťahu pomocou korelačného koeficientu Pearsonových radov umožnilo stanoviť vzájomný vplyv absencie zubov na sprievodnú chorobnosť s úrovňou spoľahlivosti p=0,0005. Starší pacienti s úplnou stratou zubov trpia chorobami charakteristickými pre starobu, a to cerebrálnou aterosklerózou a hypertenziou.

Analýza rozptylu ukázala, že v skúmaných podmienkach zohráva rozhodujúcu úlohu špecifickosť ochorenia. Úloha nozologických foriem v rôznych vekových obdobiach sa pohybuje od 52-60%. Najväčší štatisticky významný vplyv na absenciu zubov majú choroby tráviaceho systému a diabetes mellitus.

Vo všeobecnosti sa skupina pacientov vo veku 75-89 rokov vyznačovala veľkým počtom patologických ochorení.

V tejto štúdii bola vykonaná porovnávacia štúdia výskytu komorbidít u pacientov s úplnou stratou zubov v staršom a senilnom veku, ktorí žijú v domovoch dôchodcov. U ľudí tejto vekovej skupiny bolo odhalené vysoké percento chýbajúcich zubov. U pacientov s úplnou adentiou sa pozorujú komorbidity charakteristické pre tento vek. Medzi vyšetrovanými osobami sa najčastejšie vyskytovala ateroskleróza a hypertenzia. Štatisticky významný je vplyv na stav ústnej dutiny ochorení ako sú ochorenia tráviaceho traktu a diabetes mellitus, podiel ostatných nozoologických foriem sa pohyboval v rozmedzí 52-60 %. Použitie analýzy rozptylu nepotvrdilo významnú úlohu pohlavia a bydliska na indikátoroch stavu ústnej dutiny.

Na záver teda treba poznamenať, že analýza distribúcie sprievodných ochorení u osôb s úplnou absenciou zubov v staršom a senilnom veku ukázala, že táto kategória občanov patrí do osobitnej skupiny obyvateľstva, ktorá by mala dostávať adekvátne zubné starostlivosti v rámci existujúcich stomatologických systémov /12/ .

3 Analýza rozptylu v kontexte štatistických metód

Štatistické metódy analýzy sú metodikou merania výsledkov ľudskej činnosti, to znamená premeny kvalitatívnych charakteristík na kvantitatívne.

Hlavné kroky v štatistickej analýze:

Zostavenie plánu zberu počiatočných údajov - hodnoty vstupných premenných (X 1 ,...,X p), počet pozorovaní n. Tento krok sa vykonáva, keď je experiment aktívne naplánovaný.

Získanie počiatočných údajov a ich vloženie do počítača. V tomto štádiu sa vytvoria polia čísel (x 1i ,..., x pi ; y 1i ,..., y qi), i=1,..., n, kde n je veľkosť vzorky.

Primárne štatistické spracovanie údajov. V tejto fáze sa vytvorí štatistický popis uvažovaných parametrov:

a) konštrukcia a analýza štatistických závislostí;

b) korelačná analýza je určená na vyhodnotenie významnosti vplyvu faktorov (X 1 ,...,X p) na odozvu Y;

c) analýza rozptylu sa používa na vyhodnotenie vplyvu nekvantitatívnych faktorov (X 1 ,...,X p) na odpoveď Y s cieľom vybrať z nich najdôležitejšie;

d) regresná analýza je určená na určenie analytickej závislosti odpovede Y na kvantitatívnych faktoroch X;

Interpretácia výsledkov v zmysle zadanej úlohy /13/.

Tabuľka 3.1 ukazuje štatistické metódy, ktorými sa riešia analytické problémy. Zodpovedajúce bunky tabuľky obsahujú frekvencie použitia štatistických metód:

Označenie "-" - metóda sa nepoužije;

Označenie "+" - metóda je použitá;

Označenie "++" - metóda je široko používaná;

Označenie "+++" - aplikácia metódy je obzvlášť zaujímavá /14/.

Analýza rozptylu, podobne ako Studentov t-test, vám umožňuje vyhodnotiť rozdiely medzi priemermi vzoriek; na rozdiel od t-testu však nemá žiadne obmedzenia na počet porovnávaných priemerov. Namiesto toho, aby sme sa pýtali, či sa dva priemery vzorky líšia, môžeme posúdiť, či sa líšia dva, tri, štyri, päť alebo k priemery.

ANOVA umožňuje zaoberať sa dvoma alebo viacerými nezávislými premennými (vlastnosťami, faktormi) súčasne, pričom sa vyhodnocuje nielen vplyv každej z nich samostatne, ale aj účinky interakcie medzi nimi /15/.


Tabuľka 3.1 - Aplikácia štatistických metód pri riešení analytických problémov

Analytické úlohy vznikajúce v oblasti obchodu, financií a manažmentu

Metódy deskriptívnej štatistiky

Metódy overovania štatistických hypotéz

Metódy regresnej analýzy

Metódy disperznej analýzy

Metódy viacrozmernej analýzy

Metódy diskriminačnej analýzy

cluster-nogo

Analytické metódy

schopnosť prežitia

Analytické metódy

a predpoveď

časové rady

Úlohy horizontálnej (časovej) analýzy

Úlohy vertikálnej (štrukturálnej) analýzy

Úlohy analýzy trendov a prognóz

Úlohy analýzy relatívnych ukazovateľov

Úlohy komparatívnej (priestorovej) analýzy

Úlohy faktorovej analýzy

Pre väčšinu zložitých systémov platí Paretov princíp, podľa ktorého 20% faktorov určuje vlastnosti systému o 80%. Prvoradou úlohou riešiteľa simulačného modelu je preto eliminovať nepodstatné faktory, čo umožňuje zmenšiť rozmer problému optimalizácie modelu.

Analýza rozptylu hodnotí odchýlku pozorovaní od celkového priemeru. Potom sa variácia rozdelí na časti, z ktorých každá má svoju vlastnú príčinu. Zvyšná časť variácie, ktorá nemôže súvisieť s podmienkami experimentu, sa považuje za jej náhodnú chybu. Na potvrdenie významnosti sa používa špeciálny test – F-štatistika.

Analýza rozptylu určuje, či existuje účinok. Regresná analýza vám umožňuje predpovedať odozvu (hodnotu cieľovej funkcie) v určitom bode v priestore parametrov. Bezprostrednou úlohou regresnej analýzy je odhadnúť regresné koeficienty /16/.

Príliš veľké veľkosti vzoriek sťažujú štatistické analýzy, preto má zmysel veľkosť vzorky zmenšiť.

Aplikáciou analýzy rozptylu je možné identifikovať významnosť vplyvu rôznych faktorov na skúmanú premennú. Ak sa vplyv niektorého faktora ukáže ako nevýznamný, potom je možné tento faktor vylúčiť z ďalšieho spracovania.

Makroekonometristi musia byť schopní vyriešiť štyri logicky odlišné problémy:

Popis údajov;

Makroekonomická prognóza;

štrukturálne odvodenie;

Analýza politiky.

Popísať údaje znamená popísať vlastnosti jedného alebo viacerých časových radov a oznámiť tieto vlastnosti širokému okruhu ekonómov. Makroekonomické prognózovanie znamená predpovedanie chodu ekonomiky, zvyčajne dva až tri roky alebo menej (hlavne preto, že je príliš ťažké predpovedať v dlhších horizontoch). Štrukturálna inferencia znamená kontrolu, či sú makroekonomické údaje v súlade s konkrétnou ekonomickou teóriou. Makroekonometrická analýza politiky postupuje niekoľkými smermi: na jednej strane sa hodnotí vplyv hypotetickej zmeny nástrojov politiky (napríklad daňovej sadzby alebo krátkodobej úrokovej miery) na ekonomiku, na druhej strane sa hodnotí vplyv posudzuje sa zmena pravidiel politiky (napríklad prechod na nový režim menovej politiky). Empirický makroekonomický výskumný projekt môže zahŕňať jednu alebo viacero z týchto štyroch úloh. Každý problém je potrebné riešiť tak, aby boli zohľadnené korelácie medzi časovými radmi.

V 70. rokoch sa tieto problémy riešili rôznymi metódami, ktoré, ak sa posudzovali z moderných pozícií, boli z viacerých dôvodov nedostatočné. Na opísanie dynamiky jednotlivých radov stačilo jednoducho použiť jednorozmerné modely časových radov a na opísanie spoločnej dynamiky dvoch sérií stačilo použiť spektrálnu analýzu. Neexistoval však spoločný jazyk vhodný na systematický popis spoločných dynamických vlastností niekoľkých časových radov. Ekonomické prognózy sa robili buď pomocou zjednodušených modelov autoregresného kĺzavého priemeru (ARMA) alebo pomocou veľkých štrukturálnych ekonometrických modelov, ktoré boli v tom čase populárne. Štrukturálna inferencia bola založená buď na malých modeloch s jednou rovnicou alebo na veľkých modeloch, ktorých identifikácia bola dosiahnutá prostredníctvom nesprávne podložených vylučovacích obmedzení a ktoré zvyčajne nezahŕňali očakávania. Analýza politiky štrukturálnych modelov závisela od týchto identifikujúcich predpokladov.

Napokon, nárast cien v 70. rokoch mnohí vnímali ako veľkú prekážku pre veľké modely, ktoré sa v tom čase používali na vytváranie politických odporúčaní. To znamená, že nastal správny čas na vznik nového makroekonometrického konštruktu, ktorý by mohol vyriešiť tieto mnohé problémy.

V roku 1980 vznikla takáto konštrukcia - vektorové autoregresie (VAR). Na prvý pohľad VAR nie je nič iné ako zovšeobecnenie jednorozmernej autoregresie na prípad s viacerými premennými a každá rovnica vo VAR nie je ničím iným ako jednoduchou regresiou najmenších štvorcov jednej premennej na oneskorené hodnoty samotnej a ostatných premenných vo VAR. Tento zdanlivo jednoduchý nástroj však umožnil systematicky a vnútorne konzistentne zachytiť bohatú dynamiku viacrozmerných časových radov a štatistický súbor nástrojov, ktorý sprevádza VAR, sa ukázal byť pohodlný a, čo je veľmi dôležité, ľahko interpretovateľný.

Existujú tri rôzne modely VAR:

Znížená forma VAR;

Rekurzívny VAR;

Štrukturálne VAR.

Všetky tri sú dynamické lineárne modely, ktoré spájajú aktuálne a minulé hodnoty vektora Yt n-rozmerného časového radu. Redukovaná forma a rekurzívne VAR sú štatistické modely, ktoré nepoužívajú žiadne ekonomické úvahy okrem výberu premenných. Tieto VAR sa používajú na popis údajov a prognóz. Štrukturálny VAR zahŕňa obmedzenia odvodené z makroekonomickej teórie a tento VAR sa používa na štrukturálne odvodenie a analýzu politiky.

Vyššie uvedená forma VAR vyjadruje Yt ako distribuované minulé oneskorenie plus sériovo nekorelovaný chybový člen, to znamená, že zovšeobecňuje jednorozmernú autoregresiu na prípad vektorov. Matematicky redukovaná forma modelu VAR je systém n rovníc, ktoré možno zapísať v maticovej forme takto:

kde  je n l vektor konštánt;

A 1 , A 2 , ..., A p je n n koeficientových matíc;

 t je nl vektor sériovo nekorelovaných chýb, o ktorých sa predpokladá, že majú strednú hodnotu nula a kovariančnú maticu .

Chyby  t v (17) sú neočakávanou dynamikou v Y t, zostávajúce po zohľadnení lineárneho rozloženého oneskorenia minulých hodnôt.

Odhad parametrov redukovaného formulára VAR je jednoduchý. Každá z rovníc obsahuje rovnaké regresory (Y t–1 ,...,Y t–p) a medzi rovnicami nie sú žiadne vzájomné obmedzenia. Efektívny odhad (metóda maximálnej pravdepodobnosti s úplnými informáciami) je teda zjednodušený na obvyklé najmenšie štvorce aplikované na každú z rovníc. Chybovú kovariančnú maticu možno primerane odhadnúť pomocou vzorovej kovariančnej matice získanej zo zvyškov LSM.

Jedinou jemnosťou je určiť dĺžku oneskorenia p, ale to sa dá urobiť pomocou informačného kritéria, ako je AIC alebo BIC.

Na úrovni maticových rovníc vyzerajú rekurzívne a štrukturálne VAR rovnako. Tieto dva modely VAR explicitne berú do úvahy simultánne interakcie medzi prvkami Yt, čo znamená pridanie simultánneho člena na pravú stranu rovnice (17). V súlade s tým sú rekurzívne a štrukturálne VAR reprezentované v tejto všeobecnej forme:

kde  - vektor konštánt;

B 0,..., Bp - matice;

 t - chyby.

Prítomnosť matice B 0 v rovnici znamená možnosť súčasnej interakcie medzi n premennými; to znamená, že B 0 vám umožňuje, aby tieto premenné súvisiace s rovnakým časovým bodom boli definované spoločne.

Rekurzívny VAR možno odhadnúť dvoma spôsobmi. Rekurzívna štruktúra poskytuje súbor rekurzívnych rovníc, ktoré možno odhadnúť pomocou metódy najmenších štvorcov. Ekvivalentná metóda odhadu je taká, že rovnice redukovaného tvaru (17), uvažované ako systém, sa vynásobia zľava dolnou trojuholníkovou maticou.

Metóda odhadu štrukturálnej VAR závisí od toho, ako presne je B 0 identifikovaný. Prístup čiastočných informácií zahŕňa použitie metód odhadu jednej rovnice, ako sú dvojkrokové metódy najmenších štvorcov. Úplný informačný prístup zahŕňa použitie metód viacrovnicového odhadu, ako sú trojkrokové metódy najmenších štvorcov.

Buďte si vedomí množstva rôznych typov VAR. Redukovaná forma VAR je jedinečná. Toto poradie premenných v Y t zodpovedá jedinému rekurzívnemu VAR, ale existuje n! takéto objednávky, t.j. n! rôzne rekurzívne VAR. Počet štrukturálnych VAR – teda súborov predpokladov, ktoré identifikujú simultánne vzťahy medzi premennými – je obmedzený iba vynaliezavosťou výskumníka.

Keďže matice odhadovaných koeficientov VAR sa ťažko interpretujú priamo, výsledky odhadov VAR sú zvyčajne reprezentované nejakou funkciou týchto matíc. K takejto štatistike rozkladu predpovedných chýb.

Rozšírenia rozptylu predpovedných chýb sa počítajú hlavne pre rekurzívne alebo štrukturálne systémy. Tento rozklad rozptylu ukazuje, aká dôležitá je chyba v j-tej rovnici na vysvetlenie neočakávaných zmien v i-tej premennej. Keď sú chyby VAR rovnicovo nekorelované, rozptyl chyby prognózy na h periódy dopredu možno zapísať ako súčet komponentov vyplývajúcich z každej z týchto chýb /17/.

3.2 Faktorová analýza

Faktorová analýza sa v modernej štatistike chápe ako súbor metód, ktoré na základe reálnych vzťahov vlastností (alebo objektov) umožňujú identifikovať latentné zovšeobecňujúce charakteristiky organizačnej štruktúry a mechanizmu vývoja javov a procesov. v štúdiu.

Kľúčový je pojem latencie v definícii. Znamená to implicitnosť charakteristík zverejnených pomocou metód faktorovej analýzy. Najprv sa zaoberáme súborom elementárnych znakov X j, ich interakcia predpokladá prítomnosť určitých príčin, špeciálnych podmienok, t.j. existenciu niektorých skrytých faktorov. Posledné z nich vznikajú ako výsledok zovšeobecnenia elementárnych znakov a pôsobia ako integrované charakteristiky alebo znaky, ale vyššej úrovne. Prirodzene, korelovať môžu nielen triviálne znaky X j, ale aj samotné pozorované objekty N i, takže hľadanie latentných faktorov je teoreticky možné podľa údajov o vlastnostiach aj objektoch.

Ak sa objekty vyznačujú dostatočne veľkým počtom elementárnych znakov (m > 3), potom je logický aj ďalší predpoklad - o existencii hustých zhlukov bodov (znakov) v priestore n objektov. Nové osi zároveň zovšeobecňujú nie znaky X j , ale objekty n i a latentné faktory F r spoznáme podľa zloženia pozorovaných objektov:

F r = c 1 n 1 + c 2 n 2 + ... + c N n N,

kde c i je hmotnosť objektu n i vo faktore F r .

V závislosti od toho, ktorý z vyššie uvedených typov korelácie - elementárne znaky alebo pozorované objekty - sa študuje vo faktorovej analýze, sa rozlišujú R a Q - technické metódy spracovania údajov.

Názov R-techniky je objemová analýza dát podľa m znakov, výsledkom čoho je r lineárnych kombinácií (skupín) znakov: F r =f(X j), (r=1..m). Analýza podľa blízkosti (spojenia) n pozorovaných objektov sa nazýva Q-technika a umožňuje určiť r lineárnych kombinácií (skupín) objektov: F=f(n i), (i = l .. N).

V súčasnosti sa v praxi viac ako 90% problémov rieši pomocou R-techniky.

Súbor metód faktorovej analýzy je v súčasnosti pomerne rozsiahly, zahŕňa desiatky rôznych prístupov a techník spracovania dát. Aby sme sa mohli zamerať na správny výber metód vo výskume, je potrebné prezentovať ich vlastnosti. Všetky metódy faktorovej analýzy rozdeľujeme do niekoľkých klasifikačných skupín:

Metóda hlavnej zložky. Presne povedané, nie je klasifikovaná ako faktorová analýza, hoci s ňou má veľa spoločného. Špecifické je po prvé, že v priebehu výpočtových postupov sa súčasne získajú všetky hlavné komponenty a ich počet sa na začiatku rovná počtu elementárnych znakov. Po druhé, predpokladá sa možnosť úplného rozkladu disperzie elementárnych znakov, inými slovami, jej úplné vysvetlenie prostredníctvom latentných faktorov (generalizovaných znakov).

Metódy faktorovej analýzy. Rozptyl základných znakov tu nie je úplne vysvetlený, uznáva sa, že časť rozptylu zostáva nerozpoznaná ako charakteristika. Faktory sa zvyčajne vyčleňujú postupne: prvý, ktorý vysvetľuje najväčší podiel variácie elementárnych znakov, potom druhý, ktorý vysvetľuje menšiu časť rozptylu, druhý po prvom latentnom faktore, tretí atď. Proces extrakcie faktorov sa môže v ktoromkoľvek kroku prerušiť, ak sa rozhodne o dostatočnosti podielu vysvetľovaného rozptylu elementárnych znakov alebo pri zohľadnení interpretovateľnosti latentných faktorov.

Metódy faktorovej analýzy by sa mali ďalej rozdeliť do dvoch tried: zjednodušené a moderné aproximačné metódy.

Jednoduché metódy faktorovej analýzy sú spojené najmä s počiatočným teoretickým vývojom. Majú obmedzené možnosti identifikácie latentných faktorov a aproximácie faktorových riešení. Tie obsahujú:

Jednofaktorový model. Umožňuje vám vybrať len jeden všeobecný latentný a jeden charakteristický faktor. Pre možno existujúce ďalšie latentné faktory sa predpokladá ich nevýznamnosť;

bifaktorový model. Umožňuje ovplyvniť variáciu elementárnych charakteristík nie jedného, ​​ale niekoľkých latentných faktorov (zvyčajne dvoch) a jedného charakteristického faktora;

centroidná metóda. V ňom sú korelácie medzi premennými považované za zhluk vektorov a latentný faktor je geometricky reprezentovaný ako vyrovnávací vektor prechádzajúci stredom tohto zhluku. : Metóda umožňuje identifikovať niekoľko latentných a charakteristických faktorov, po prvýkrát je možné korelovať faktoriálne rozhodnutie s pôvodnými údajmi, t.j. vyriešiť aproximačný problém v najjednoduchšej forme.

Moderné aproximačné metódy často predpokladajú, že prvé, približné riešenie už bolo nejakým spôsobom nájdené a toto riešenie sa optimalizuje s následnými krokmi. Metódy sa líšia zložitosťou výpočtov. Tieto metódy zahŕňajú:

skupinová metóda. Riešenie je založené na nejakým spôsobom vopred zvolených skupinách elementárnych prvkov;

Metóda hlavných faktorov. Najbližšie je k metóde hlavných komponentov, rozdiel spočíva v predpoklade existencie znakov;

Maximálna pravdepodobnosť, minimálne rezíduá, a-faktorová analýza, kanonická faktorová analýza, všetko optimalizácia.

Tieto metódy umožňujú sústavne zlepšovať skôr nájdené riešenia založené na použití štatistických techník na odhad náhodnej premennej alebo štatistických kritérií a vyžadujú si veľké množstvo časovo náročných výpočtov. Najsľubnejšia a najpohodlnejšia pre prácu v tejto skupine je metóda maximálnej pravdepodobnosti.

Hlavnou úlohou, ktorá sa rieši rôznymi metódami faktorovej analýzy, vrátane metódy hlavných komponentov, je kompresia informácií, prechod z množiny hodnôt podľa m elementárnych znakov s množstvom informácií n x m na obmedzený množina prvkov faktorovej matice mapovania (m x r) alebo matice faktorov latentných hodnôt pre každý pozorovaný objekt rozmeru n x r, a zvyčajne r< m.

Metódy faktorovej analýzy tiež umožňujú vizualizovať štruktúru skúmaných javov a procesov, čo znamená určiť ich stav a predpovedať ich vývoj. Nakoniec údaje z faktorovej analýzy poskytujú základ pre identifikáciu objektu, t.j. riešenie problému rozpoznávania obrazu.

Metódy faktorovej analýzy majú vlastnosti, ktoré sú veľmi atraktívne pre ich použitie ako súčasť iných štatistických metód, najčastejšie v korelačno-regresnej analýze, zhlukovej analýze, multivariantnom škálovaní a pod. /18/.

3.3 Párová regresia. Pravdepodobnostná povaha regresných modelov.

Ak vezmeme do úvahy problém analýzy výdavkov na jedlo v skupinách s rovnakým príjmom, napríklad 10 000 $ (x), potom ide o deterministickú hodnotu. Ale Y – podiel týchto peňazí vynaložených na jedlo – je náhodný a môže sa z roka na rok meniť. Preto pre každého i-tého jednotlivca:

kde ε i - náhodná chyba;

α a β sú konštanty (teoreticky), hoci sa môžu líšiť model od modelu.

Predpoklady pre párovú regresiu:

X a Y sú lineárne príbuzné;

X je nenáhodná premenná s pevnými hodnotami;

- ε - chyby sú normálne rozdelené N(0,σ 2);

- .

Obrázok 3.1 ukazuje párový regresný model.

Obrázok 3.1 - Párový regresný model

Tieto predpoklady popisujú klasický lineárny regresný model.

Ak má chyba nenulovú strednú hodnotu, pôvodný model bude ekvivalentný novému modelu a inému zachyteniu, ale s nulovou strednou hodnotou chyby.

Ak sú splnené predpoklady, potom ide o odhady najmenších štvorcov a sú účinnými lineárnymi nezaujatými odhadmi

Ak určíme:

skutočnosť, že matematické očakávanie a rozptyl koeficientov budú nasledovné:

Kovariancia koeficientov:

Ak potom sú tiež normálne rozdelené:

Z toho vyplýva, že:

Variácia β je úplne určená variáciou ε;

Čím vyšší je rozptyl X, tým lepší je odhad β.

Celková disperzia je určená vzorcom:

Rozptyl odchýlok v tejto forme je nestranný odhad a nazýva sa štandardná chyba regresie. N-2 - možno interpretovať ako počet stupňov voľnosti.

Analýza odchýlok od regresnej priamky môže poskytnúť užitočnú mieru toho, ako dobre odhadnutá regresia odráža skutočné údaje. Dobrá regresia je taká, ktorá vysvetľuje významnú časť rozptylu v Y, a naopak, zlá regresia nesleduje väčšinu výkyvov v pôvodných údajoch. Je intuitívne jasné, že každá ďalšia informácia zlepší model, to znamená zníži nevysvetlený podiel variácie Y. Na analýzu regresného modelu sa rozptyl rozloží na zložky a určí sa koeficient determinácie R2.

Pomer dvoch rozptylov je rozdelený podľa F-distribúcie, t.j. ak skontrolujeme štatistickú významnosť rozdielu medzi rozptylom modelu a rozptylom rezíduí, môžeme dospieť k záveru, že R 2 je významný.

Testovanie hypotézy o rovnosti rozptylov týchto dvoch vzoriek:

Ak platí hypotéza H 0 (rovnosť rozptylov viacerých vzoriek), t má F-distribúciu s (m 1 ,m 2)=(n 1 -1,n 2 -1) stupňami voľnosti.

Po vypočítaní F-pomeru ako pomeru dvoch disperzií a jeho porovnaní s tabuľkovou hodnotou môžeme konštatovať, že R 2 /2/, /19/ je štatisticky významný.

Záver

Moderné aplikácie analýzy rozptylu pokrývajú širokú škálu problémov v ekonómii, biológii a technológii a zvyčajne sa interpretujú v zmysle štatistickej teórie odhaľovania systematických rozdielov medzi výsledkami priamych meraní vykonávaných za určitých meniacich sa podmienok.

Vďaka automatizácii analýzy rozptylu môže výskumník vykonávať rôzne štatistické štúdie pomocou počítačov, pričom trávi menej času a úsilia na výpočty údajov. V súčasnosti existuje veľa softvérových balíkov, ktoré implementujú prístroj na analýzu disperzie. Najbežnejšie softvérové ​​produkty sú:

Väčšina štatistických metód je implementovaná v moderných štatistických softvérových produktoch. S rozvojom algoritmických programovacích jazykov bolo možné vytvárať ďalšie bloky na spracovanie štatistických údajov.

ANOVA je výkonná moderná štatistická metóda na spracovanie a analýzu experimentálnych údajov v psychológii, biológii, medicíne a iných vedách. Veľmi úzko súvisí so špecifickou metodikou plánovania a vykonávania experimentálnych štúdií.

Analýza rozptylu sa používa vo všetkých oblastiach vedeckého výskumu, kde je potrebné analyzovať vplyv rôznych faktorov na skúmanú premennú.

Bibliografia

1 Kremer N.Sh. Teória pravdepodobnosti a matematická štatistika. M.: Jednota - Dana, 2002.-343s.

2 Gmurman V.E. Teória pravdepodobnosti a matematická štatistika. - M .: Vyššia škola, 2003.-523s.

4 www.conf.mitme.ru

5 www.pedklin.ru

6 www.webcenter.ru

7 www.infections.ru

8 www.encycl.yandex.ru

9 www.infosport.ru

10 www.medtrust.ru

11 www.flax.net.ru

12 www.jdc.org.il

13 www.big.spb.ru

14 www.bizcom.ru

15 Gusev A.N. Disperzná analýza v experimentálnej psychológii. - M .: Výchovno-metodický zberateľ "Psychológia", 2000.-136.

17 www.econometrics.exponenta.ru

18 www.optimizer.by.ru

V praxi lekárov pri vykonávaní biomedicínskeho, sociologického a experimentálneho výskumu je potrebné zistiť vplyv faktorov na výsledky štúdia zdravotného stavu obyvateľstva pri hodnotení odbornej činnosti a účinnosti inovácií.

Existuje množstvo štatistických metód, ktoré umožňujú určiť silu, smer, vzorce vplyvu faktorov na výsledok vo všeobecnej alebo vzorkovej populácii (výpočet kritéria I, korelačná analýza, regresia, Χ 2 - (kritérium Pearsonovej zhody, Analýza rozptylu bola vyvinutá a navrhnutá anglickým vedcom, matematikom a genetikom Ronaldom Fisherom v 20. rokoch 20. storočia.

Analýza rozptylu sa častejšie používa vo vedeckých a praktických štúdiách verejného zdravia a zdravotnej starostlivosti na štúdium vplyvu jedného alebo viacerých faktorov na výslednú vlastnosť. Je založený na princípe „odraz rozmanitosti hodnôt faktora(ov) na rozmanitosť hodnôt výsledného atribútu“ a stanovuje silu vplyvu faktora(ov) v vzorové populácie.

Podstatou metódy analýzy rozptylu je meranie jednotlivých rozptylov (celkové, faktorové, reziduálne) a ďalej určenie sily (podielu) vplyvu skúmaných faktorov (posúdenie úlohy každého z faktorov, resp. ich kombinovaný vplyv). ) na výsledných atribútoch.

Analýza rozptylu- ide o štatistickú metódu na hodnotenie vzťahu medzi faktormi a výkonnostnými charakteristikami v rôznych skupinách, náhodne vybraných, na základe určenia rozdielov (diverzity) v hodnotách charakteristík. Analýza rozptylu je založená na analýze odchýlok všetkých jednotiek skúmanej populácie od aritmetického priemeru. Ako miera odchýlok sa berie disperzia (B) - priemerná štvorec odchýlok. Odchýlky spôsobené vplyvom atribútu faktora (faktora) sa porovnávajú s veľkosťou odchýlok spôsobených náhodnými okolnosťami. Ak sú odchýlky spôsobené atribútom faktora významnejšie ako náhodné odchýlky, potom sa predpokladá, že faktor má významný vplyv na výsledný atribút.

Aby sa vypočítal rozptyl hodnoty odchýlky každej možnosti (každej zaregistrovanej číselnej hodnoty atribútu) od aritmetického priemeru, na druhú. Tým sa zbavíte negatívnych znakov. Potom sa tieto odchýlky (rozdiely) spočítajú a vydelia počtom pozorovaní, t.j. priemerné odchýlky. Takto sa získajú hodnoty disperzie.

Dôležitou metodologickou hodnotou pre aplikáciu analýzy rozptylu je správne zostavenie vzorky. V závislosti od cieľa a cieľov môžu byť selektívne skupiny náhodne vytvorené nezávisle od seba (kontrolné a experimentálne skupiny na štúdium nejakého indikátora, napríklad vplyvu vysokého krvného tlaku na rozvoj mŕtvice). Takéto vzorky sa nazývajú nezávislé.

Často sa výsledky expozície faktorom študujú v rovnakej vzorkovej skupine (napríklad u tých istých pacientov) pred a po expozícii (liečba, prevencia, rehabilitačné opatrenia), takéto vzorky sa nazývajú závislé.

Analýza rozptylu, pri ktorej sa kontroluje vplyv jedného faktora, sa nazýva jednofaktorová analýza (jednorozmerná analýza). Pri štúdiu vplyvu viac ako jedného faktora sa používa viacrozmerná analýza rozptylu (multivariačná analýza).

Faktorové znaky sú znaky, ktoré ovplyvňujú skúmaný jav.
Efektívne znaky sú tie znaky, ktoré sa menia pod vplyvom faktorových znakov.

Na vykonanie analýzy rozptylu možno použiť kvalitatívne (pohlavie, povolanie) aj kvantitatívne charakteristiky (počet injekcií, pacienti na oddelení, počet dní na lôžku).

Metódy disperznej analýzy:

  1. Metóda podľa Fishera (Fisher) - kritérium F (hodnoty F, pozri prílohu č. 1);
    Metóda sa aplikuje pri jednosmernej analýze rozptylu, kedy sa kumulatívny rozptyl všetkých pozorovaných hodnôt rozloží na rozptyl v rámci jednotlivých skupín a rozptyl medzi skupinami.
  2. Metóda „všeobecného lineárneho modelu“.
    Je založená na korelačnej alebo regresnej analýze používanej v multivariačnej analýze.

V biomedicínskom výskume sa zvyčajne používajú iba jednofaktorové, maximálne dvojfaktorové disperzné komplexy. Multifaktorové komplexy možno skúmať postupnou analýzou jedno- alebo dvojfaktorových komplexov izolovaných z celej pozorovanej populácie.

Podmienky na použitie analýzy rozptylu:

  1. Úlohou štúdie je určiť silu vplyvu jedného (až 3) faktorov na výsledok alebo určiť silu kombinovaného vplyvu rôznych faktorov (pohlavie a vek, fyzická aktivita a výživa atď.).
  2. Skúmané faktory by mali byť navzájom nezávislé (nesúvisiace). Napríklad nemožno skúmať kombinovaný účinok pracovných skúseností a veku, výšky a hmotnosti detí atď. na výskyte obyv.
  3. Výber skupín pre štúdiu sa uskutočňuje náhodne (náhodný výber). Organizácia disperzného komplexu s implementáciou princípu náhodného výberu možností sa nazýva randomizácia (v preklade z angličtiny - náhodný), t.j. vybrané náhodne.
  4. Môžu sa použiť kvantitatívne aj kvalitatívne (atributívne) znaky.

Pri vykonávaní jednosmernej analýzy rozptylu sa odporúča (podmienka nevyhnutná pre aplikáciu):

  1. Normalita rozdelenia analyzovaných skupín alebo zhoda vzorových skupín so všeobecnými populáciami s normálnym rozdelením.
  2. Nezávislosť (neprepojenosť) rozloženia pozorovaní v skupinách.
  3. Prítomnosť frekvencie (opakovania sa) pozorovaní.

Normálnosť rozdelenia je určená Gaussovou (De Mavourovou) krivkou, ktorú možno opísať funkciou y \u003d f (x), keďže ide o jeden z distribučných zákonov používaných na aproximáciu popisu javov, ktoré sú náhodné, pravdepodobnostnej povahy. Predmetom biomedicínskeho výskumu je fenomén pravdepodobnostného charakteru, normálne rozdelenie v takýchto štúdiách je veľmi časté.

Princíp aplikácie metódy analýzy rozptylu

Najprv sa sformuluje nulová hypotéza, to znamená, že sa predpokladá, že skúmané faktory nemajú žiadny vplyv na hodnoty výsledného atribútu a výsledné rozdiely sú náhodné.

Potom určíme, aká je pravdepodobnosť získania pozorovaných (alebo silnejších) rozdielov za predpokladu, že je pravdivá nulová hypotéza.

Ak je táto pravdepodobnosť malá*, potom zamietneme nulovú hypotézu a dospejeme k záveru, že výsledky štúdie sú štatisticky významné. To ešte neznamená, že vplyv skúmaných faktorov bol dokázaný (ide predovšetkým o plánovanie výskumu), ale stále je málo pravdepodobné, že výsledok je spôsobený náhodou.
__________________________________
* Maximálna prijateľná pravdepodobnosť zamietnutia skutočnej nulovej hypotézy sa nazýva hladina významnosti a označuje sa α = 0,05.

Keď sú splnené všetky podmienky na aplikáciu analýzy rozptylu, rozklad celkového rozptylu matematicky vyzerá takto:

D gen. = D fakt + D zvyšok. ,

D gen. - celkový rozptyl pozorovaných hodnôt (variant), charakterizovaný rozptylom variantu od celkového priemeru. Meria variáciu vlastnosti v celej populácii pod vplyvom všetkých faktorov, ktoré túto variáciu spôsobili. Celkovú diverzitu tvoria medziskupinové a vnútroskupinové;

D fact - faktoriálny (medziskupinový) rozptyl, charakterizovaný rozdielom priemerov v každej skupine a závisí od vplyvu študovaného faktora, ktorým je každá skupina diferencovaná. Napríklad v skupinách s rôznymi etiologickými faktormi klinického priebehu pneumónie nie je priemerná úroveň prenocovania rovnaká - pozoruje sa medziskupinová diverzita.

D odpočinok. - zvyškový (vnútroskupinový) rozptyl, ktorý charakterizuje rozptyl variantu v rámci skupín. Odráža náhodné variácie, t.j. časť variácie, ktorá sa vyskytuje pod vplyvom nešpecifikovaných faktorov a nezávisí od znaku – faktora, ktorý je základom zoskupenia. Variácia študovaného znaku závisí od sily vplyvu niektorých nezapočítaných náhodných faktorov, a to ako od organizovaných (daných výskumníkom), tak od náhodných (neznámych) faktorov.

Preto je celková variácia (disperzia) zložená z variácie spôsobenej organizovanými (danými) faktormi, nazývanými faktorová variácia a neorganizované faktory, t.j. zvyšková variácia (náhodná, neznáma).

Klasická analýza rozptylu sa vykonáva v nasledujúcich krokoch:

  1. Výstavba disperzného komplexu.
  2. Výpočet priemerných štvorcov odchýlok.
  3. Výpočet rozptylu.
  4. Porovnanie faktorových a reziduálnych rozptylov.
  5. Vyhodnotenie výsledkov pomocou teoretických hodnôt Fisher-Snedekorovho rozdelenia (Príloha N 1).

ALGORITHUS NA VYKONÁVANIE ANOVANE ANALÝZY PODĽA ZJEDNODUŠENÉHO VARIANTU

Algoritmus na vykonávanie analýzy rozptylu pomocou zjednodušenej metódy vám umožňuje získať rovnaké výsledky, ale výpočty sú oveľa jednoduchšie:

ja inscenujem. Výstavba disperzného komplexu

Konštrukcia disperzného komplexu znamená zostavenie tabuľky, v ktorej by boli jasne rozlíšené faktory, efektívny znak a výber pozorovaní (pacientov) v každej skupine.

Jednofaktorový komplex pozostáva z niekoľkých gradácií jedného faktora (A). Gradácie sú vzorky z rôznych všeobecných populácií (A1, A2, AZ).

Dvojfaktorový komplex - pozostáva z niekoľkých gradácií dvoch faktorov vo vzájomnej kombinácii. Etiologické faktory výskytu pneumónie sú rovnaké (A1, A2, AZ) v kombinácii s rôznymi formami klinického priebehu pneumónie (H1 - akútna, H2 - chronická).

Znak výsledku (priemerný počet prenocovaní) Etiologické faktory rozvoja pneumónie
A1 A2 A3
H1 H2 H1 H2 H1 H2
M = 14 dní

II etapa. Výpočet celkového priemeru (M obsh)

Výpočet súčtu možností pre každú gradáciu faktorov: Σ Vj = V 1 + V 2 + V 3

Výpočet celkového súčtu variantu (Σ V total) cez všetky gradácie atribútu faktora: Σ V celkom = Σ Vj 1 + Σ Vj 2 + Σ Vj 3

Výpočet priemernej skupiny (M gr.) Znak faktora: M gr. = Σ Vj / N,
kde N je súčet počtu pozorovaní pre všetky gradácie prvku faktora I (Σn podľa skupín).

III etapa. Výpočet rozptylov:

Pri splnení všetkých podmienok na uplatnenie analýzy rozptylu je matematický vzorec nasledujúci:

D gen. = D fakt + D zvyšok.

D gen. - celkový rozptyl, charakterizovaný rozptylom variantu (pozorovaných hodnôt) od všeobecného priemeru;
D fakt. - faktoriálny (medziskupinový) rozptyl charakterizuje rozptyl skupinových priemerov od všeobecného priemeru;
D odpočinok. - zvyškový (vnútroskupinový) rozptyl charakterizuje rozptyl variantu v rámci skupín.

  1. Výpočet faktoriálového rozptylu (D fakt.): D fakt. = Σh - H
  2. Výpočet h sa vykonáva podľa vzorca: h = (Σ Vj) / N
  3. Výpočet H sa vykonáva podľa vzorca: H = (ΣV)2/N
  4. Výpočet reziduálneho rozptylu: D odpočinok. = (Σ V) 2 - Σ h
  5. Výpočet celkového rozptylu: D gen. = (ΣV)2 - ΣH

IV štádium. Výpočet hlavného ukazovateľa sily vplyvu skúmaného faktora Ukazovateľ sily vplyvu (η 2) atribútu faktora na výsledok je určený podielom faktoriálového rozptylu (D fakt.) na celkovom rozptyle (D všeobecný), η 2 (tento) - ukazuje, aký podiel vplyv skúmaného faktora zaberá medzi všetkými ostatnými faktormi a je určený vzorcom:

V etapa. Stanovenie spoľahlivosti výsledkov štúdie Fisherovou metódou sa vykonáva podľa vzorca:


F - Fisherovo kritérium;
Fst. - tabuľková hodnota (pozri prílohu 1).
σ 2 skutočnosť, σ 2 zvyšok. - faktoriálne a zvyškové odchýlky (od lat. de - z, cez - cesta) - odchýlka od strednej čiary, určená vzorcami:


r je počet gradácií atribútu faktora.

Porovnanie Fisherovho kritéria (F) so štandardným (tabuľkovým) F sa vykonáva podľa stĺpcov tabuľky, pričom sa berú do úvahy stupne voľnosti:

v 1 \u003d n - 1
v 2 \u003d N - 1

Horizontálne určte v 1 vertikálne - v 2 , v ich priesečníku určte tabuľkovú hodnotu F, kde horná tabuľková hodnota p ≥ 0,05 a dolná zodpovedá p > 0,01 a porovnajte s vypočítaným kritériom F. Ak je hodnota vypočítané kritérium F rovnaké alebo väčšie ako tabuľkové, potom sú výsledky spoľahlivé a H 0 nie je zamietnuté.

Úloha:

V podniku N. sa zvýšila miera úrazovosti, v súvislosti s ktorou lekár vykonal štúdiu jednotlivých faktorov, medzi ktorými boli skúmané pracovné skúsenosti pracovníkov v obchodoch. Vzorky boli odobraté v podniku N. zo 4 predajní s podobnými podmienkami a charakterom práce. Úrazovosť sa počíta na 100 zamestnancov za posledný rok.

Pri štúdiu faktora pracovných skúseností sa získali tieto údaje:

Na základe údajov štúdie bola vyslovená nulová hypotéza (H 0) o vplyve pracovných skúseností na úroveň úrazovosti zamestnancov podniku A.

Cvičenie
Potvrďte alebo vyvráťte nulovú hypotézu pomocou jednosmernej analýzy rozptylu:

  1. určiť silu vplyvu;
  2. vyhodnotiť spoľahlivosť vplyvu faktora.

Etapy aplikácie analýzy rozptylu
určiť vplyv faktora (pracovnej skúsenosti) na výsledok (úrazovosť)

Záver. V súbore vzoriek sa zistilo, že vplyv pracovných skúseností na mieru úrazovosti je v celkovom počte ostatných faktorov 80 %. Pre všetky dielne závodu možno s pravdepodobnosťou 99,7 % (13,3 > 8,7) konštatovať, že pracovné skúsenosti ovplyvňujú mieru úrazovosti.

Nulová hypotéza (Н 0) sa teda nezamieta a vplyv pracovných skúseností na úroveň úrazovosti v dielňach závodu A sa považuje za preukázaný.

Hodnota F (Fisherov test) štandardná pri p ≥ 0,05 (horná hodnota) pri p ≥ 0,01 (dolná hodnota)

1 2 3 4 5 6 7 8 9 10 11
6 6,0
13,4
5,1
10,9
4,8
9,8
4,5
9,2
4,4
8,8
4,3
8,5
4,2
8,3
4,1
8,1
4,1
8,0
4,1
7,9
4,0
7,8
7 5,6
12,3
4,7
9,6
4,4
8,5
4,1
7,9
4,0
7,5
3,9
7,2
3,8
7,0
3,7
6,8
3,7
6,7
3,6
6,6
3,6
6,5
8 5,3
11,3
4,6
8,7
4,1
7,6
3,8
7,0
3,7
6,6
3,6
6,4
3,5
6,2
3,4
6,0
3,4
5,9
3,3
5,8
3,1
5,7
9 5,1
10,6
4,3
8,0
3,6
7,0
3,6
6,4
3,5
6,1
3,4
5,8
3,3
5,6
3,2
5,5
3,2
5,4
3,1
5,3
3,1
5,2
10 5,0
10,0
4,1
7,9
3,7
6,6
3,5
6,0
3,3
5,6
3,2
5,4
3,1
5,2
3,1
5,1
3,0
5,0
2,9
4,5
2,9
4,8
11 4,8
9,7
4,0
7,2
3,6
6,2
3,6
5,7
3,2
5,3
3,1
5,1
3,0
4,9
3,0
4,7
2,9
4,6
2,9
4,5
2,8
4,5
12 4,8
9,3
3,9
6,9
3,5
6,0
3,3
5,4
3,1
5,1
3,0
4,7
2,9
4,7
2,9
4,5
2,8
4,4
2,8
4,3
2,7
4,2
13 4,7
9,1
3,8
6,7
3,4
5,7
3,2
5,2
3,0
4,9
2,9
4,6
2,8
4,4
2,8
4,3
2,7
4,2
2,7
4,1
2,6
4,0
14 4,6
8,9
3,7
6,5
3,3
5,6
3,1
5,0
3,0
4,7
2,9
4,5
2,8
4,3
2,7
4,1
2,7
4,0
2,6
3,9
2,6
3,9
15 4,5
8,7
3,7
6,4
3,3
5,4
3,1
4,9
2,9
4,6
2,8
4,3
2,7
4,1
2,6
4,0
2,6
3,9
2,5
3,8
2,5
3,7
16 4,5
8,5
3,6
6,2
3,2
5,3
3,0
4,8
2,9
4,4
2,7
4,2
2,7
4,0
2,6
3,9
2,5
3,8
2,5
3,7
2,5
3,6
17 4,5
8,4
3,6
6,1
3,2
5,2
3,0
4,7
2,8
4,3
2,7
4,1
2,6
3,9
2,6
3,8
2,5
3,8
2,5
3,6
2,4
3,5
18 4,4
8,3
3,5
6,0
3,2
5,1
2,9
4,6
2,8
4,2
2,7
4,0
2,6
3,8
2,5
3,7
2,7
3,6
2,4
3,6
3,4
3,5
19 4,4
8,2
3,5
5,9
3,1
5,0
2,9
4,5
2,7
4,2
2,6
3,9
2,5
3,8
2,5
3,6
2,4
3,5
2,4
3,4
2,3
3,4
20 4,3
8,1
3,5
5,8
3,1
4,9
2,9
4,4
2,7
4,1
2,6
3,9
2,5
3,7
2,4
3,6
2,4
3,4
2,3
3,4
2,3
3,3

  1. Vlasov V.V. Epidemiológia. - M.: GEOTAR-MED, 2004. 464 s.
  2. Arkhipova G.L., Lavrova I.G., Troshina I.M. Niektoré moderné metódy štatistickej analýzy v medicíne. - M.: Metrosnab, 1971. - 75 s.
  3. Zaitsev V.M., Liflyandsky V.G., Marinkin V.I. Aplikovaná lekárska štatistika. - Petrohrad: LLC "FOLIANT Publishing House", 2003. - 432 s.
  4. Platonov A.E. Štatistická analýza v medicíne a biológii: úlohy, terminológia, logika, počítačové metódy. - M.: Vydavateľstvo Ruskej akadémie lekárskych vied, 2000. - 52 s.
  5. Plokhinský N.A. Biometria. - Vydavateľstvo Sibírskej pobočky Akadémie vied ZSSR Novosibirsk. - 1961. - 364 s.

Všetci ľudia prirodzene hľadajú poznanie. (Aristoteles. Metafyzika)

Analýza rozptylu

Úvodný prehľad

V tejto časti si zopakujeme základné metódy, predpoklady a terminológiu ANOVA.

Všimnite si, že v anglickej literatúre sa analýza rozptylu zvyčajne nazýva analýza variácie. Preto pre stručnosť nižšie tento výraz niekedy použijeme ANOVA (An analýza o f va rácie) pre konvenčné ANOVA a termín MANOVA pre viacrozmernú analýzu rozptylu. V tejto časti sa budeme postupne zaoberať hlavnými myšlienkami analýzy rozptylu ( ANOVA), analýza kovariancie ( ANCOVA), viacrozmerná analýza rozptylu ( MANOVA) a multivariačná kovariančná analýza ( MANCOVÁ). Po krátkej diskusii o výhodách kontrastnej analýzy a post hoc testov sa pozrime na predpoklady, na ktorých sú založené metódy ANOVA. Na konci tejto časti sú vysvetlené výhody viacrozmerného prístupu pre analýzu opakovaných meraní v porovnaní s tradičným jednorozmerným prístupom.

Kľúčové nápady

Účel analýzy rozptylu. Hlavným účelom analýzy rozptylu je študovať významnosť rozdielu medzi priemermi. kapitola (Kapitola 8) poskytuje krátky úvod do testovania štatistickej významnosti. Ak práve porovnávate priemery dvoch vzoriek, analýza rozptylu poskytne rovnaký výsledok ako normálna analýza. t- kritérium pre nezávislé vzorky (ak sa porovnávajú dve nezávislé skupiny objektov alebo pozorovaní), príp t- kritérium pre závislé vzorky (ak sa porovnávajú dve premenné na rovnakom súbore objektov alebo pozorovaní). Ak nie ste oboznámení s týmito kritériami, odporúčame vám pozrieť si úvodný prehľad kapitoly (kapitola 9).

Odkiaľ pochádza názov Analýza rozptylu? Môže sa zdať zvláštne, že postup porovnávania priemerov sa nazýva analýza rozptylu. V skutočnosti je to spôsobené tým, že pri skúmaní štatistickej významnosti rozdielu medzi priemermi v skutočnosti analyzujeme rozptyly.

Rozdelenie súčtu štvorcov

Pre veľkosť vzorky n sa rozptyl vzorky vypočíta ako súčet štvorcových odchýlok od priemeru vzorky vydelený n-1 (veľkosť vzorky mínus jedna). Pre pevnú veľkosť vzorky n je teda rozptyl funkciou súčtu druhých mocnín (odchýlok), označovaných pre stručnosť, SS(z anglického Sum of Squares - Súčet štvorcov). Analýza rozptylu je založená na rozdelení (alebo rozdelení) rozptylu na časti. Zvážte nasledujúci súbor údajov:

Priemery týchto dvoch skupín sú výrazne odlišné (2 a 6). Súčet štvorcových odchýlok vnútri každej skupiny je 2. Ich sčítaním dostaneme 4. Ak teraz tieto výpočty zopakujeme nepočítajúcčlenstvo v skupine, teda ak počítame SS na základe kombinovaného priemeru dvoch vzoriek dostaneme 28. Inými slovami, rozptyl (súčet štvorcov) založený na variabilite v rámci skupiny vedie k oveľa menším hodnotám, ako keď sa vypočítajú na základe celkovej variability (vo vzťahu k celkovej priemer). Dôvodom je zjavne významný rozdiel medzi priemermi a tento rozdiel medzi prostriedkami vysvetľuje existujúci rozdiel medzi súčtami štvorcov. Skutočne, ak použijeme modul Analýza rozptylu, získajú sa tieto výsledky:

Ako je možné vidieť z tabuľky, celkový súčet štvorcov SS=28 rozdelené na súčet druhých mocnín kvôli vnútroskupinové variabilita ( 2+2=4 ; pozri druhý riadok tabuľky) a súčet štvorcov v dôsledku rozdielu v stredných hodnotách. (28-(2+2)=24; pozri prvý riadok tabuľky).

SS chyby aSS účinok. Vnútroskupinová variabilita ( SS) sa zvyčajne nazýva rozptyl chyby. To znamená, že sa zvyčajne nedá predpovedať alebo vysvetliť, keď sa experiment vykonáva. Na druhej strane, SS účinok(alebo medziskupinovú variabilitu) možno vysvetliť rozdielom medzi priemermi v skúmaných skupinách. Inými slovami, príslušnosť k určitej skupine vysvetľuje medziskupinová variabilita, pretože vieme, že tieto skupiny majú rôzne prostriedky.

Kontrola významnosti. Hlavné myšlienky testovania štatistickej významnosti sú uvedené v kapitole Základné pojmy štatistiky(8. kapitola). Tá istá kapitola vysvetľuje dôvody, prečo mnohé testy používajú pomer vysvetleného a nevysvetleného rozptylu. Príkladom tohto použitia je samotná analýza rozptylu. Testovanie významnosti v ANOVA je založené na porovnaní rozptylu v dôsledku variácií medzi skupinami (tzv stredný štvorcový efekt alebo PANIEffect) a rozptyl v dôsledku šírenia v rámci skupiny (tzv stredná kvadratická chyba alebo PANIomyl). Ak je pravdivá nulová hypotéza (rovnosť priemerov v dvoch populáciách), potom môžeme očakávať relatívne malý rozdiel v priemeroch vzorky v dôsledku náhodnej variability. Preto podľa nulovej hypotézy sa vnútroskupinový rozptyl bude prakticky zhodovať s celkovým rozptylom vypočítaným bez zohľadnenia členstva v skupine. Výsledné odchýlky v rámci skupiny možno porovnať pomocou F- test, ktorý kontroluje, či je pomer rozptylov výrazne väčší ako 1. Vo vyššie uvedenom príklade F- Test ukazuje, že rozdiel medzi priemermi je štatisticky významný.

Základná logika ANOVA. Ak to zhrnieme, môžeme povedať, že účelom analýzy rozptylu je testovať štatistickú významnosť rozdielu medzi priemermi (pre skupiny alebo premenné). Táto kontrola sa vykonáva pomocou analýzy rozptylu, t.j. rozdelením celkového rozptylu (variácie) na časti, z ktorých jedna je spôsobená náhodnou chybou (čiže vnútroskupinová variabilita) a druhá je spojená s rozdielom v priemerných hodnotách. Posledná zložka rozptylu sa potom použije na analýzu štatistickej významnosti rozdielu medzi priemermi. Ak je tento rozdiel významný, nulová hypotéza sa zamietne a prijme sa alternatívna hypotéza, že medzi priemermi existuje rozdiel.

Závislé a nezávislé premenné. Premenné, ktorých hodnoty sú určené meraniami počas experimentu (napríklad skóre dosiahnuté v teste), sa nazývajú závislý premenné. Premenné, s ktorými možno v experimente manipulovať (napríklad tréningové metódy alebo iné kritériá, ktoré umožňujú rozdeliť pozorovania do skupín), sa nazývajú faktory alebo nezávislý premenné. Tieto pojmy sú podrobnejšie popísané v kapitole Základné pojmy štatistiky(8. kapitola).

Viacrozmerná analýza rozptylu

Vo vyššie uvedenom jednoduchom príklade môžete okamžite vypočítať nezávislý výberový t-test pomocou vhodnej možnosti modulu Základné štatistiky a tabuľky. Získané výsledky sa samozrejme zhodujú s výsledkami analýzy rozptylu. Analýza rozptylu však obsahuje flexibilné a výkonné technické nástroje, ktoré možno použiť na oveľa komplexnejšie štúdie.

Veľa faktorov. Svet je vo svojej podstate zložitý a mnohorozmerný. Situácie, kedy je nejaký jav úplne opísaný jednou premennou, sú extrémne zriedkavé. Napríklad, ak sa snažíme naučiť pestovať veľké paradajky, mali by sme zvážiť faktory súvisiace s genetickou štruktúrou rastlín, typom pôdy, svetlom, teplotou atď. Pri vykonávaní typického experimentu sa teda musíte vysporiadať s veľkým množstvom faktorov. Hlavným dôvodom, prečo je použitie ANOVA vhodnejšie ako opätovné porovnávanie dvoch vzoriek na rôznych úrovniach použitia faktorov t- Kritériom je, že analýza rozptylu je viac efektívne a pre malé vzorky aj informatívnejšie.

Faktorový manažment. Predpokladajme, že v príklade dvojvzorkovej analýzy diskutovanej vyššie pridáme ešte jeden faktor, napr. Poschodie- rod. Každú skupinu nech tvoria 3 muži a 3 ženy. Dizajn tohto experimentu môže byť prezentovaný vo forme tabuľky 2 x 2:

Experimentujte. Skupina 1 Experimentujte. Skupina 2
Muži2 6
3 7
1 5
Priemerný2 6
ženy4 8
5 9
3 7
Priemerný4 8

Pred vykonaním výpočtov môžete vidieť, že v tomto príklade má celkový rozptyl aspoň tri zdroje:

(1) náhodná chyba (v rámci skupinového rozptylu),

(2) variabilita spojená s členstvom v experimentálnej skupine a

(3) variabilita vzhľadom na pohlavie pozorovaných objektov.

(Všimnite si, že existuje ďalší možný zdroj variability - interakcia faktorov, o ktorom budeme diskutovať neskôr). Čo sa stane, ak nezahrnieme poschodierod ako faktor v analýze a vypočítať obvyklé t-kritérium? Ak počítame súčty štvorcov, ignorujeme poschodie -rod(t. j. kombinovanie objektov rôzneho pohlavia do jednej skupiny pri výpočte rozptylu v rámci skupiny, pričom sa získa súčet štvorcov pre každú skupinu rovný SS=10 a celkový súčet štvorcov SS= 10+10 = 20), potom dostaneme väčšiu hodnotu vnútroskupinového rozptylu ako pri presnejšej analýze s dodatočným delením do podskupín podľa polo- rod(v tomto prípade sa vnútroskupinový priemer bude rovnať 2 a celkový vnútroskupinový súčet štvorcov sa bude rovnať SS = 2+2+2+2 = 8). Tento rozdiel je spôsobený tým, že stredná hodnota pre muži - samcov menej ako priemer za ženy -Žena a tento rozdiel v prostriedkoch zvyšuje celkovú variabilitu v rámci skupiny, ak sa neberie do úvahy pohlavie. Riadenie odchýlky chyby zvyšuje citlivosť (výkon) testu.

Tento príklad ukazuje ďalšiu výhodu analýzy rozptylu oproti konvenčnej analýze. t-kritérium pre dve vzorky. Analýza rozptylu vám umožňuje študovať každý faktor riadením hodnôt iných faktorov. To je v skutočnosti hlavný dôvod jeho väčšej štatistickej sily (na získanie zmysluplných výsledkov je potrebná menšia veľkosť vzorky). Z tohto dôvodu analýza rozptylu, dokonca aj na malých vzorkách, poskytuje štatisticky významnejšie výsledky ako jednoduchá. t- kritérium.

Interakčné efekty

Existuje ďalšia výhoda použitia ANOVA oproti konvenčnej analýze. t- kritérium: analýza rozptylu vám umožňuje zistiť interakcia medzi faktormi, a preto umožňuje študovať zložitejšie modely. Na ilustráciu si predstavte ďalší príklad.

Hlavné efekty, párové (dvojfaktorové) interakcie. Predpokladajme, že sú dve skupiny žiakov a psychologicky sú žiaci prvej skupiny naladení na plnenie zadaných úloh a sú cieľavedomejší ako žiaci druhej skupiny, ktorú tvoria lenivejší žiaci. Rozdeľme každú skupinu náhodne na polovicu a jednej polovici každej skupiny ponúkneme ťažkú ​​úlohu a druhej ľahkú úlohu. Potom meriame, ako usilovne študenti na týchto úlohách pracujú. Priemery pre túto (fiktívnu) štúdiu sú uvedené v tabuľke:

Aký záver možno vyvodiť z týchto výsledkov? Je možné dospieť k záveru, že: (1) študenti usilovnejšie pracujú na náročnej úlohe; (2) pracujú motivovaní študenti tvrdšie ako leniví? Žiadne z týchto tvrdení neodráža podstatu systematického charakteru priemerov uvedených v tabuľke. Pri analýze výsledkov by bolo správnejšie povedať, že iba motivovaní študenti pracujú tvrdšie na zložitých úlohách, zatiaľ čo len leniví študenti pracujú tvrdšie na ľahkých úlohách. Inými slovami, povaha žiakov a náročnosť úlohy interagujúce navzájom ovplyvňujú množstvo potrebného úsilia. To je príklad párová interakcia medzi povahou žiakov a zložitosťou úlohy. Všimnite si, že výroky 1 a 2 popisujú hlavné účinky.

Interakcie vyšších rádov. Zatiaľ čo párové interakcie sa dajú pomerne ľahko vysvetliť, interakcie vyššieho rádu sa vysvetľujú oveľa ťažšie. Predstavme si, že v príklade uvedenom vyššie je zavedený ešte jeden faktor poschodie -rod a dostali sme nasledujúcu tabuľku priemerov:

Aké závery možno teraz vyvodiť zo získaných výsledkov? Priemerné grafy uľahčujú interpretáciu zložitých efektov. Modul Analýza rozptylu vám umožňuje zostaviť tieto grafy takmer jedným kliknutím.

Obrázok v grafoch nižšie predstavuje skúmanú trojstrannú interakciu.

Pri pohľade na grafy môžeme povedať, že existuje interakcia medzi povahou a obtiažnosťou testu pre ženy: motivované ženy pracujú viac na náročnej úlohe ako na ľahkej. U mužov je rovnaká interakcia obrátená. Je vidieť, že popis interakcie medzi faktormi sa stáva neprehľadnejším.

Všeobecný spôsob popisu interakcií. Vo všeobecnom prípade je interakcia medzi faktormi opísaná ako zmena jedného účinku pod vplyvom iného. Vo vyššie diskutovanom príklade možno dvojfaktorovú interakciu opísať ako zmenu hlavného účinku faktora charakterizujúceho zložitosť úlohy pod vplyvom faktora popisujúceho charakter študenta. Pre interakciu troch faktorov z predchádzajúceho odseku môžeme povedať, že interakcia dvoch faktorov (zložitosť úlohy a charakter žiaka) sa mení pod vplyvom rodrod. Ak sa skúma interakcia štyroch faktorov, môžeme povedať, že interakcia troch faktorov sa mení pod vplyvom štvrtého faktora, t.j. existujú rôzne typy interakcií na rôznych úrovniach štvrtého faktora. Ukázalo sa, že v mnohých oblastiach nie je interakcia piatich či dokonca viacerých faktorov nezvyčajná.

Komplexné plány

Medziskupinové a vnútroskupinové plány (plány premerania)

Pri porovnávaní dvoch rôznych skupín sa zvyčajne používa jedna t- kritérium pre nezávislé vzorky (z modulu Základné štatistiky a tabuľky). Keď sa porovnávajú dve premenné na rovnakej množine objektov (pozorovaní), používa sa t-kritérium pre závislé vzorky. Pre analýzu rozptylu je tiež dôležité, či sú vzorky závislé alebo nie. Ak sa opakujú merania rovnakých premenných (za rôznych podmienok alebo v rôznych časoch) pre rovnaké predmety, potom hovoria o prítomnosti faktor opakovaných meraní(tiež nazývaný vnútroskupinový faktor keďže súčet štvorcov v rámci skupiny sa vypočítava na vyhodnotenie jeho významnosti). Ak sa porovnávajú rôzne skupiny predmetov (napríklad muži a ženy, tri kmene baktérií atď.), potom sa opíše rozdiel medzi skupinami medziskupinový faktor. Metódy na výpočet kritérií významnosti pre dva opísané typy faktorov sú odlišné, ale ich všeobecná logika a interpretácia sú rovnaké.

Vnútroskupinové a vnútroskupinové plány. V mnohých prípadoch si experiment vyžaduje zahrnutie medziskupinového faktora aj faktora opakovaných meraní do návrhu. Napríklad sa merajú matematické zručnosti študentov a študentiek (kde poschodie -rod-medziskupinový faktor) na začiatku a na konci semestra. Dve dimenzie zručností každého študenta tvoria faktor v rámci skupiny (faktor opakovaných meraní). Interpretácia hlavných efektov a interakcií pre medziskupinové a opakované faktory je rovnaká a obidva typy faktorov sa samozrejme môžu navzájom ovplyvňovať (napríklad ženy počas semestra získavajú zručnosti a muži ich strácajú).

Neúplné (vnorené) plány

V mnohých prípadoch možno interakčný efekt zanedbať. K tomu dochádza buď vtedy, keď je známe, že v populácii neexistuje žiadny interakčný efekt, alebo keď sa implementuje plná faktoriál plán je nemožný. Skúma sa napríklad vplyv štyroch aditív do paliva na spotrebu paliva. Vyberú sa štyri autá a štyria vodiči. Plný faktoriál experiment vyžaduje, aby sa každá kombinácia: doplnok, vodič, auto objavila aspoň raz. Vyžaduje si to aspoň 4 x 4 x 4 = 64 testovacích skupín, čo je príliš časovo náročné. Okrem toho medzi vodičom a aditívom do paliva nedochádza takmer k žiadnej interakcii. S ohľadom na to môžete plán použiť latinské štvorce, ktorý obsahuje iba 16 skupín testov (štyri doplnkové látky sú označené písmenami A, B, C a D):

Latinské štvorce sú opísané vo väčšine experimentálnych kníh o dizajne (napr. Hays, 1988; Lindman, 1974; Milliken a Johnson, 1984; Winer, 1962) a nebudeme ich tu podrobne rozoberať. Všimnite si, že latinské štvorce sú nienplný plány, ktoré nezahŕňajú všetky kombinácie úrovní faktorov. Napríklad vodič 1 riadi auto 1 iba s aditívom A, vodič 3 riadi auto 1 iba s aditívom C. Úrovne faktorov aditíva ( A, B, C a D) vnorené do buniek tabuľky automobil X vodič - ako vajcia v hniezde. Toto mnemotechnické pravidlo je užitočné na pochopenie prírody vnorené alebo vnorené plány. modul Analýza rozptylu poskytuje jednoduché spôsoby analýzy plánov tohto typu.

Analýza kovariancie

Hlavná myšlienka

V kapitole Kľúčové nápady stručne sa diskutovalo o myšlienke riadiacich faktorov a o tom, ako zahrnutie aditívnych faktorov môže znížiť súčet štvorcových chýb a zvýšiť štatistickú silu návrhu. Toto všetko je možné rozšíriť na premenné so súvislým súborom hodnôt. Keď sú takéto spojité premenné zahrnuté ako faktory v návrhu, nazývajú sa kovariáty.

Pevné kovariáty

Predpokladajme, že porovnávame matematické zručnosti dvoch skupín žiakov, ktorí sa učili z dvoch rôznych učebníc. Predpokladajme tiež, že máme údaje o inteligenčnom kvociente (IQ) pre každého študenta. Môžeme predpokladať, že IQ súvisí s matematickými zručnosťami a použiť tieto informácie. Pre každú z dvoch skupín študentov možno vypočítať korelačný koeficient medzi IQ a matematickými schopnosťami. Pomocou tohto korelačného koeficientu je možné rozlíšiť medzi podielom rozptylu v skupinách vysvetleným vplyvom IQ a nevysvetleným podielom rozptylu (pozri aj Základné pojmy štatistiky(kapitola 8) a Základné štatistiky a tabuľky(kapitola 9)). Zostávajúci zlomok rozptylu sa použije v analýze ako rozptyl chyby. Ak existuje korelácia medzi IQ a matematickými schopnosťami, potom sa odchýlky chýb môžu výrazne znížiť. SS/(n-1) .

Vplyv kovariátov naF- kritérium. F- kritérium hodnotí štatistickú významnosť rozdielu medzi priemernými hodnotami v skupinách, pričom sa vypočítava pomer medziskupinového rozptylu ( PANIúčinok) na odchýlku chyby ( PANIchyba) . Ak PANIchyba klesá napríklad pri zohľadnení faktora IQ hodnota F zvyšuje.

Veľa premenných. Zdôvodnenie použité vyššie pre jednu kovariátu (IQ) sa ľahko rozširuje na viaceré kovariáty. Napríklad okrem IQ môžete zaradiť aj meranie motivácie, priestorového myslenia atď. Namiesto obvyklého korelačného koeficientu sa používa viacnásobný korelačný koeficient.

Keď hodnotaF - Kritériá sa znižujú. Zavedenie kovariátov do návrhu experimentu niekedy znižuje hodnotu F- kritériá . To zvyčajne naznačuje, že kovariáty korelujú nielen so závislou premennou (ako sú matematické zručnosti), ale aj s faktormi (ako sú rôzne učebnice). Predpokladajme, že IQ sa meria na konci semestra po tom, čo dve skupiny študentov strávili takmer rok štúdiom dvoch rôznych učebníc. Hoci boli študenti rozdelení do skupín náhodne, môže sa ukázať, že rozdiel v učebniciach je taký veľký, že IQ aj matematické zručnosti sa v rôznych skupinách budú značne líšiť. V tomto prípade kovariáty nielen znižujú rozptyl chýb, ale aj rozptyl medzi skupinami. Inými slovami, po kontrole rozdielu v IQ medzi skupinami už rozdiel v matematických zručnostiach nebude významný. Dá sa to povedať aj inak. Po „odstránení“ vplyvu IQ sa chtiac-nechtiac vylučuje vplyv učebnice na rozvoj matematických schopností.

Upravené priemery. Keď kovariát ovplyvňuje medziskupinový faktor, treba počítať upravené priemery, t.j. také prostriedky, ktoré sa získajú po odstránení všetkých odhadov kovariátov.

Interakcia medzi premennými a faktormi. Rovnako ako sa skúmajú interakcie medzi faktormi, možno skúmať interakcie medzi kovariátmi a medzi skupinami faktorov. Predpokladajme, že jedna z učebníc je vhodná najmä pre šikovných študentov. Druhá učebnica je pre šikovných žiakov nudná a tá istá učebnica je ťažká pre menej šikovných žiakov. V dôsledku toho existuje pozitívna korelácia medzi IQ a výsledkami učenia v prvej skupine (inteligentnejší žiaci, lepšie výsledky) a nulová alebo malá negatívna korelácia v druhej skupine (čím je žiak múdrejší, tým je menšia pravdepodobnosť, že získa matematické zručnosti z druhej učebnice). V niektorých štúdiách je táto situácia diskutovaná ako príklad porušenia predpokladov analýzy kovariancie. Keďže však modul Analýza rozptylu využíva najbežnejšie metódy analýzy kovariancie, je možné posúdiť najmä štatistickú významnosť interakcie medzi faktormi a kovariantami.

Variabilné kovariáty

Zatiaľ čo pevné kovariáty sa v učebniciach rozoberajú pomerne často, premenné kovariáty sa spomínajú oveľa menej často. Zvyčajne nás pri vykonávaní experimentov s opakovanými meraniami zaujímajú rozdiely v meraniach rovnakých veličín v rôznych časových bodoch. Konkrétne nás zaujíma význam týchto rozdielov. Ak sa meranie kovariancie vykonáva v rovnakom čase ako merania závislej premennej, možno vypočítať koreláciu medzi kovariátom a závislou premennou.

Napríklad na začiatku a na konci semestra môžete študovať záujem o matematiku a matematické zručnosti. Bolo by zaujímavé skontrolovať, či zmeny záujmu o matematiku korelujú so zmenami v matematických zručnostiach.

modul Analýza rozptylu v ŠTATISTIKA automaticky vyhodnocuje štatistickú významnosť zmien v kovariátoch v týchto plánoch, ak je to možné.

Viacrozmerné návrhy: Viacrozmerná ANOVA a kovariančná analýza

Medziskupinové plány

Všetky príklady zvažované skôr zahŕňali iba jednu závislú premennú. Keď je súčasne viacero závislých premenných, zvyšuje sa len zložitosť výpočtov a obsah a základné princípy sa nemení.

Napríklad sa robí štúdia na dvoch rôznych učebniciach. Zároveň sa študuje úspešnosť študentov v štúdiu fyziky a matematiky. V tomto prípade ide o dve závislé premenné a je potrebné zistiť, ako ich ovplyvňujú dve rôzne učebnice súčasne. Na tento účel môžete použiť viacrozmernú analýzu rozptylu (MANOVA). Namiesto jednorozmerného F kritérium, viacrozmerné F test (Wilksov l-test) založený na porovnaní chybovej kovariančnej matice a medziskupinovej kovariančnej matice.

Ak sú závislé premenné navzájom korelované, potom by sa táto korelácia mala brať do úvahy pri výpočte testu významnosti. Je zrejmé, že ak sa rovnaké meranie zopakuje dvakrát, potom sa v tomto prípade nedá získať nič nové. Ak sa k existujúcej dimenzii pridá dimenzia, ktorá s ňou koreluje, získajú sa nejaké nové informácie, no nová premenná obsahuje nadbytočné informácie, čo sa odráža v kovariancii medzi premennými.

Interpretácia výsledkov. Ak je celkové viacrozmerné kritérium významné, môžeme konštatovať, že zodpovedajúci efekt (napr. typ učebnice) je významný. Vynárajú sa však nasledujúce otázky. Má typ učebnice vplyv na zlepšenie iba matematických zručností, iba fyzických zručností alebo oboch. V skutočnosti, po získaní zmysluplného multivariačného kritéria pre jediný hlavný efekt alebo interakciu, jednorozmerné F kritérium. Inými slovami, závislé premenné, ktoré prispievajú k významnosti viacrozmerného testu, sa skúmajú oddelene.

Plány s opakovanými meraniami

Ak sa matematicko-fyzikálne zručnosti študentov merajú na začiatku a na konci semestra, tak ide o opakované merania. Štúdium kritéria významnosti v takýchto plánoch je logickým vývojom jednorozmerného prípadu. Všimnite si, že viacrozmerné metódy ANOVA sa tiež bežne používajú na skúmanie významu jednorozmerných faktorov opakovaných meraní, ktoré majú viac ako dve úrovne. Príslušné aplikácie budú diskutované neskôr v tejto časti.

Sumácia premenných hodnôt a viacrozmerná analýza rozptylu

Dokonca aj skúsení používatelia jednorozmernej a viacrozmernej ANOVA sú často zmätení, keď získajú rôzne výsledky pri aplikácii viacrozmernej ANOVA na, povedzme, tri premenné, a pri aplikácii jednorozmernej ANOVA na súčet týchto troch premenných ako jednej premennej.

Nápad zhrnutie premenných je, že každá premenná obsahuje nejakú skutočnú premennú, ktorá sa skúma, ako aj náhodnú chybu merania. Preto pri spriemerovaní hodnôt premenných bude chyba merania bližšia k 0 pre všetky merania a spriemerované hodnoty budú spoľahlivejšie. V skutočnosti je v tomto prípade aplikácia ANOVA na súčet premenných rozumná a výkonná technika. Ak sú však závislé premenné svojou povahou viacrozmerné, sčítanie hodnôt premenných je nevhodné.

Napríklad, nech závislé premenné pozostávajú zo štyroch meraní úspech v spoločnosti. Každý ukazovateľ charakterizuje úplne nezávislú stránku ľudskej činnosti (napríklad profesionálny úspech, obchodný úspech, rodinný blahobyt atď.). Sčítanie týchto premenných je ako sčítanie jablka a pomaranča. Súčet týchto premenných by nebol vhodnou jednorozmernou mierou. Preto sa s takýmito údajmi musí zaobchádzať ako s viacrozmernými ukazovateľmi multivariačná analýza rozptylu.

Kontrastná analýza a post hoc testy

Prečo sa porovnávajú jednotlivé súbory prostriedkov?

Zvyčajne sa hypotézy o experimentálnych údajoch formulujú nielen z hľadiska hlavných účinkov alebo interakcií. Príkladom je nasledujúca hypotéza: určitá učebnica zlepšuje matematické zručnosti len u študentov mužského pohlavia, iná učebnica je približne rovnako účinná pre obe pohlavia, no stále menej účinná pre mužov. Dá sa predpovedať, že výkon v učebnici interaguje s pohlavím študenta. Aj táto predpoveď však platí prírody interakcie. U študentov v jednej knihe sa očakáva výrazný rozdiel medzi pohlaviami a v druhej knihe prakticky rodovo nezávislé výsledky u študentov. Tento typ hypotézy sa zvyčajne skúma pomocou kontrastnej analýzy.

Kontrastná analýza

Stručne povedané, analýza kontrastu nám umožňuje vyhodnotiť štatistickú významnosť niektorých lineárnych kombinácií komplexných účinkov. Kontrastná analýza je hlavným a nevyhnutným prvkom každého komplexného plánu ANOVA. modul Analýza rozptylu má množstvo možností analýzy kontrastu, ktoré vám umožňujú vybrať a analyzovať akýkoľvek typ porovnávania priemerov.

a posteriori prirovnania

Niekedy sa v dôsledku spracovania experimentu objaví neočakávaný efekt. Hoci vo väčšine prípadov bude kreatívny výskumník schopný vysvetliť akýkoľvek výsledok, neposkytuje to príležitosť na ďalšiu analýzu a odhady pre prognózu. Tento problém je jedným z tých, pre ktoré post hoc kritériá, teda kritériá, ktoré sa nepoužívajú a priori hypotéz. Na ilustráciu zvážte nasledujúci experiment. Predpokladajme, že 100 kariet obsahuje čísla od 1 do 10. Po vložení všetkých týchto kariet do hlavičky náhodne vyberieme 20-krát 5 kariet a vypočítame priemernú hodnotu pre každú vzorku (priemer čísel napísaných na kartičkách). Môžeme očakávať, že existujú dve vzorky, ktorých priemery sú výrazne odlišné? Toto je veľmi pravdepodobné! Výberom dvoch vzoriek s maximálnym a minimálnym priemerom je možné získať rozdiel v priemeroch, ktorý je veľmi odlišný od rozdielu v priemeroch, napríklad prvých dvoch vzoriek. Tento rozdiel je možné skúmať napríklad pomocou kontrastnej analýzy. Bez toho, aby sme zachádzali do detailov, existuje niekoľko tzv a posteriori kritériá, ktoré sú založené presne na prvom scenári (vyberanie extrémnych priemerov z 20 vzoriek), t. j. tieto kritériá sú založené na výbere najrôznejších prostriedkov na porovnanie všetkých prostriedkov v návrhu. Tieto kritériá sa aplikujú preto, aby nedošlo k umelému efektu čisto náhodne, napríklad aby sa zistil významný rozdiel medzi prostriedkami, keď žiadne neexistujú. modul Analýza rozptylu ponúka širokú škálu takýchto kritérií. Keď sa v experimente zahŕňajúcom viacero skupín vyskytnú neočakávané výsledky, a posteriori postupy na skúmanie štatistickej významnosti získaných výsledkov.

Súčet štvorcov typu I, II, III a IV

Viacrozmerná regresia a analýza rozptylu

Existuje úzky vzťah medzi metódou multivariačnej regresie a analýzou rozptylu (analýza variácií). V oboch metódach sa študuje lineárny model. Stručne povedané, takmer všetky experimentálne návrhy možno preskúmať pomocou multivariačnej regresie. Zvážte nasledujúci jednoduchý plán krížových skupín 2 x 2.

DV A B AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

Stĺpce A a B obsahujú kódy charakterizujúce úrovne faktorov A a B, stĺpec AxB obsahuje súčin dvoch stĺpcov A a B. Tieto údaje môžeme analyzovať pomocou multivariačnej regresie. Variabilné DV definovaná ako závislá premenná, premenné od A predtým AxB ako nezávislé premenné. Štúdia významnosti pre regresné koeficienty sa bude zhodovať s výpočtami pri analýze rozptylu významnosti hlavných účinkov faktorov. A a B a interakčný efekt AxB.

Nevyvážené a vyvážené plány

Pri výpočte korelačnej matice pre všetky premenné, napríklad pre údaje zobrazené vyššie, je možné vidieť, že hlavné účinky faktorov A a B a interakčný efekt AxB nekorelované. Táto vlastnosť efektov sa nazýva aj ortogonalita. Hovoria, že účinky A a B - ortogonálne alebo nezávislý jeden od druhého. Ak sú všetky efekty v pláne navzájom ortogonálne, ako v príklade vyššie, potom sa hovorí, že plán je vyvážené.

Vyvážené plány majú „dobrú vlastnosť“. Výpočty pri analýze takýchto plánov sú veľmi jednoduché. Všetky výpočty sú zredukované na výpočet korelácie medzi efektmi a závislými premennými. Keďže účinky sú ortogonálne, čiastočné korelácie (ako v plnom rozsahu viacrozmerný regresie) sa nepočítajú. V reálnom živote však plány nie sú vždy vyvážené.

Zvážte skutočné údaje s nerovnakým počtom pozorovaní v bunkách.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Ak tieto údaje zakódujeme ako je uvedené vyššie a vypočítame korelačnú maticu pre všetky premenné, potom sa ukáže, že faktory návrhu sú navzájom korelované. Faktory v pláne teraz nie sú ortogonálne a takéto plány sa nazývajú nevyvážený. Všimnite si, že v tomto príklade korelácia medzi faktormi úplne súvisí s rozdielom vo frekvenciách 1 a -1 v stĺpcoch dátovej matice. Inými slovami, experimentálne návrhy s nerovnakými objemami buniek (presnejšie s neprimeranými objemami) budú nevyvážené, čo znamená, že hlavné efekty a interakcie sa budú miešať. V tomto prípade na výpočet štatistickej významnosti účinkov musíte úplne vypočítať viacrozmernú regresiu. Existuje tu niekoľko stratégií.

Súčet štvorcov typu I, II, III a IV

Typ súčtu štvorcovjaaIII. Na štúdium významnosti každého faktora vo viacrozmernom modeli je možné vypočítať čiastočnú koreláciu každého faktora za predpokladu, že všetky ostatné faktory sú už v modeli zohľadnené. Faktory môžete do modelu zadávať aj krok za krokom, pričom opravíte všetky faktory už zadané do modelu a ignorujete všetky ostatné faktory. Vo všeobecnosti je to rozdiel medzi typu III a typuja súčty štvorcov (táto terminológia bola zavedená v SAV, pozri napr. SAS, 1982; podrobnú diskusiu možno nájsť aj v Searle, 1987, s. 461; Woodward, Bonett a Brecht, 1990, s. 216; alebo Milliken a Johnson, 1984, str.

Typ súčtu štvorcovII.Ďalšou stratégiou vytvárania „stredného“ modelu je: kontrolovať všetky hlavné efekty pri štúdiu významnosti jediného hlavného efektu; pri kontrole všetkých hlavných efektov a všetkých párových interakcií, keď sa skúma význam jedinej párovej interakcie; pri riadení všetkých hlavných účinkov všetkých párových interakcií a všetkých interakcií troch faktorov; pri štúdiu samostatnej interakcie troch faktorov atď. Takto vypočítané súčty štvorcov pre efekty sa nazývajú typuII súčty štvorcov. takze typuII súčty štvorcov ovládajú všetky efekty rovnakého rádu a nižšie, ignorujúc všetky efekty vyššieho rádu.

Typ súčtu štvorcovIV. Nakoniec pre niektoré špeciálne plány s chýbajúcimi bunkami (neúplné plány) je možné vypočítať tzv typu IV súčty štvorcov. O tejto metóde sa bude diskutovať neskôr v súvislosti s neúplnými plánmi (plány s chýbajúcimi bunkami).

Interpretácia odhadu súčtu štvorcov typov I, II a III

súčet štvorcov typuIII najjednoduchšie interpretovať. Pripomeňme, že súčty štvorcov typuIII preskúmať účinky po kontrole všetkých ostatných účinkov. Napríklad po zistení štatisticky významného typuIII vplyv na faktor A v module Analýza rozptylu, môžeme povedať, že existuje jediný významný vplyv faktora A, po zavedení všetkých ostatných efektov (faktorov) a podľa toho tento efekt interpretovať. Pravdepodobne v 99 % všetkých aplikácií analýzy rozptylu je tento typ kritéria pre výskumníka zaujímavý. Tento typ súčtu štvorcov sa zvyčajne počíta v module Analýza rozptylu predvolene, bez ohľadu na to, či je táto možnosť vybratá Regresný prístup alebo nie (štandardné prístupy prijaté v module Analýza rozptylu diskutované nižšie).

Významné účinky získané pomocou súčtu štvorcov typu alebo typuII súčty štvorcov nie je také ľahké interpretovať. Najlepšie sa interpretujú v kontexte postupnej multivariačnej regresie. Ak použijete súčet štvorcov typuja hlavný účinok faktora B bol významný (po zahrnutí faktora A do modelu, ale pred pridaním interakcie medzi A a B), možno usúdiť, že existuje významný hlavný účinok faktora B za predpokladu, že neexistuje interakcie medzi faktormi A a B. (Ak pri použití kritéria typuIII, faktor B sa tiež ukázal ako významný, potom môžeme konštatovať, že existuje významný hlavný účinok faktora B, po zavedení všetkých ostatných faktorov a ich interakcií do modelu).

Z hľadiska okrajových prostriedkov hypotézy typuja a typuII zvyčajne nemajú jednoduchý výklad. V týchto prípadoch sa hovorí, že nemožno interpretovať význam účinkov tak, že budeme brať do úvahy len okrajové prostriedky. skôr prezentované p stredné hodnoty súvisia s komplexnou hypotézou, ktorá kombinuje priemer a veľkosť vzorky. Napríklad, typuII hypotézy pre faktor A v jednoduchom príklade návrhu 2 x 2, o ktorom sme diskutovali vyššie, by boli (pozri Woodward, Bonett a Brecht, 1990, s. 219):

nij- počet pozorovaní v bunke

uij- priemerná hodnota v bunke

n. j- hraničný priemer

Bez zachádzania do detailov (podrobnejšie pozri Milliken a Johnson, 1984, kapitola 10), je jasné, že nejde o jednoduché hypotézy a vo väčšine prípadov žiadna z nich nie je pre výskumníka zvlášť zaujímavá. Existujú však prípady, keď hypotézy typuja môže byť zaujímavé.

Predvolený výpočtový prístup v module Analýza rozptylu

Predvolené, ak možnosť nie je začiarknutá Regresný prístup, modul Analýza rozptylu používa bunkový priemerný model. Pre tento model je charakteristické, že súčty štvorcov pre rôzne efekty sa počítajú pre lineárne kombinácie priemerov buniek. V úplnom faktoriálnom experimente to vedie k súčtom štvorcov, ktoré sú rovnaké ako súčty štvorcov, o ktorých sme diskutovali skôr ako typu III. Avšak v opci Plánované porovnania(v okne Analýza výsledkov rozptylu), používateľ môže predpokladať akúkoľvek lineárnu kombináciu vážených alebo nevážených bunkových priemerov. Používateľ tak môže testovať nielen hypotézy typuIII, ale hypotézy akéhokoľvek typu (vrátane typuIV). Tento všeobecný prístup je užitočný najmä pri skúmaní návrhov s chýbajúcimi bunkami (takzvané neúplné návrhy).

Pre úplné faktoriálne návrhy je tento prístup užitočný aj vtedy, keď chceme analyzovať vážené hraničné priemery. Predpokladajme napríklad, že v jednoduchom dizajne 2 x 2 zvažovanom vyššie chceme porovnať vážené (v zmysle úrovní faktorov) B) hraničné priemery pre faktor A. Toto je užitočné, keď distribúciu pozorovaní v bunkách nepripravil experimentátor, ale skonštruoval ju náhodne, a táto náhodnosť sa odráža v distribúcii počtu pozorovaní podľa hladín faktora B v súhrne .

Napríklad existuje faktor - vek vdov. Možná vzorka respondentov je rozdelená do dvoch skupín: mladší ako 40 rokov a starší ako 40 rokov (faktor B). Druhým faktorom (faktor A) v pláne je, či vdovy dostávali sociálnu podporu od nejakej agentúry (zatiaľ čo niektoré vdovy boli vybrané náhodne, iné slúžili ako kontroly). V tomto prípade vekové rozloženie vdov vo vzorke odráža skutočné vekové rozloženie vdov v populácii. Hodnotenie efektívnosti skupiny sociálnej podpory pre vdovy všetky vekové skupiny bude zodpovedať váženému priemeru pre dve vekové skupiny (s váhami zodpovedajúcimi počtu pozorovaní v skupine).

Plánované porovnania

Upozorňujeme, že súčet zadaných kontrastných pomerov sa nemusí nevyhnutne rovnať 0 (nule). Namiesto toho program automaticky vykoná úpravy, aby sa zodpovedajúce hypotézy nemiešali s celkovým priemerom.

Aby sme to ilustrovali, vráťme sa k jednoduchému plánu 2 x 2, o ktorom sme hovorili vyššie. Pripomeňme, že počty buniek tohto nevyváženého dizajnu sú -1, 2, 3 a 1. Povedzme, že chceme porovnať vážené hraničné priemery pre faktor A (vážené frekvenciou úrovní faktora B). Môžete zadať kontrastné pomery:

Všimnite si, že tieto koeficienty sa nesčítavajú do 0. Program nastaví koeficienty tak, aby sa sčítali do 0, pričom sa zachovajú ich relatívne hodnoty, t.j.

1/3 2/3 -3/4 -1/4

Tieto kontrasty budú porovnávať vážené priemery pre faktor A.

Hypotézy o hlavnom priemere. Hypotézu, že nevážený hlavný priemer je 0, možno preskúmať pomocou koeficientov:

Hypotéza, že vážený hlavný priemer je 0, sa testuje pomocou:

Program v žiadnom prípade nekoriguje kontrastné pomery.

Analýza plánov s chýbajúcimi bunkami (neúplné plány)

Faktorové návrhy obsahujúce prázdne bunky (spracovanie kombinácií buniek, v ktorých nie sú žiadne pozorovania) sa nazývajú neúplné. V takýchto návrhoch niektoré faktory zvyčajne nie sú ortogonálne a niektoré interakcie sa nedajú vypočítať. Vo všeobecnosti neexistuje lepšia metóda na analýzu takýchto plánov.

Regresný prístup

V niektorých starších programoch, ktoré sú založené na analýze návrhov ANOVA pomocou viacrozmernej regresie, sú faktory v neúplných návrhoch štandardne nastavené obvyklým spôsobom (ako keby bol plán úplný). Pre tieto fiktívne kódované faktory sa potom vykoná viacrozmerná regresná analýza. Bohužiaľ, táto metóda vedie k výsledkom, ktoré je veľmi ťažké, ak nie nemožné, interpretovať, pretože nie je jasné, ako každý efekt prispieva k lineárnej kombinácii prostriedkov. Zvážte nasledujúci jednoduchý príklad.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 Zmeškané

Ak viacrozmerná regresia formy Závislá premenná = konštanta + faktor A + faktor B, potom hypotéza o význame faktorov A a B z hľadiska lineárnych kombinácií priemerov vyzerá takto:

Faktor A: Bunka A1,B1 = bunka A2,B1

Faktor B: Bunka A1,B1 = bunka A1,B2

Tento prípad je jednoduchý. V zložitejších plánoch sa vlastne nedá určiť, čo presne sa bude skúmať.

Priemer buniek, analýza rozptylu , hypotézy IV. typu

Prístup, ktorý sa odporúča v literatúre a zdá sa byť výhodnejší, je štúdium zmysluplných (z hľadiska výskumných úloh) a priori hypotézy o prostriedkoch pozorovaných v bunkách plánu. Podrobnú diskusiu o tomto prístupe možno nájsť v Dodge (1985), Heiberger (1989), Milliken a Johnson (1984), Searle (1987) alebo Woodward, Bonett a Brecht (1990). Súčty štvorcov spojené s hypotézami o lineárnej kombinácii prostriedkov v neúplných návrhoch, ktoré skúmajú odhady časti účinkov, sa tiež nazývajú súčty štvorcov. IV.

Automatické generovanie typových hypotézIV. Keď majú multivariačné návrhy komplexný chýbajúci bunkový vzor, ​​je žiaduce definovať ortogonálne (nezávislé) hypotézy, ktorých skúmanie je ekvivalentné skúmaniu hlavných účinkov alebo interakcií. Algoritmické (výpočtové) stratégie (založené na pseudoinverznej matici návrhu) boli vyvinuté na generovanie vhodných váh pre takéto porovnania. Bohužiaľ, konečné hypotézy nie sú jednoznačne definované. Samozrejme, závisia od poradia, v ktorom boli účinky definované, a len zriedka sa dajú ľahko interpretovať. Preto sa odporúča starostlivo študovať povahu chýbajúcich buniek a potom formulovať hypotézy typuIV, ktoré najviac zodpovedajú cieľom štúdie. Potom preskúmajte tieto hypotézy pomocou možnosti Plánované porovnania v okne výsledky. Najjednoduchší spôsob, ako špecifikovať porovnania v tomto prípade, je vyžadovať zavedenie vektora kontrastov pre všetky faktory spolu v okne Plánované porovnania. Po vyvolaní dialógového okna Plánované porovnania zobrazia sa všetky skupiny aktuálneho plánu a tie, ktoré sú vynechané, budú označené.

Kontrola vynechaných buniek a špecifických účinkov

Existuje niekoľko typov plánov, v ktorých umiestnenie chýbajúcich buniek nie je náhodné, ale starostlivo naplánované, čo umožňuje jednoduchú analýzu hlavných účinkov bez ovplyvnenia iných účinkov. Napríklad, keď nie je k dispozícii požadovaný počet buniek v pláne, často sa používajú plány. latinské štvorce odhadnúť hlavné účinky viacerých faktorov s veľkým počtom úrovní. Napríklad faktoriálny dizajn 4 x 4 x 4 x 4 vyžaduje 256 buniek. Zároveň môžete použiť grécko-latinské námestie odhadnúť hlavné efekty, keďže v pláne je len 16 buniek (kap. Plánovanie experimentov, zväzok IV, obsahuje podrobný popis takýchto plánov). Neúplné návrhy, v ktorých možno hlavné účinky (a niektoré interakcie) odhadnúť pomocou jednoduchých lineárnych kombinácií prostriedkov, sa nazývajú vyvážené neúplné plány.

Vo vyvážených návrhoch potom štandardná (predvolená) metóda generovania kontrastov (váh) pre hlavné efekty a interakcie vytvorí analýzu tabuľky rozptylov, v ktorej sa súčty štvorcov pre príslušné efekty navzájom nemiešajú. Možnosť Špecifické účinky okno výsledky vygeneruje chýbajúce kontrasty napísaním nuly do chýbajúcich buniek plánu. Ihneď po vyžiadaní opcie Špecifické účinky pre používateľa, ktorý študuje nejakú hypotézu, sa zobrazí tabuľka výsledkov so skutočnými váhami. Všimnite si, že vo vyváženom dizajne sa súčty druhých mocnín príslušných efektov počítajú iba vtedy, ak sú tieto efekty ortogonálne (nezávislé) na všetkých ostatných hlavných efektoch a interakciách. V opačnom prípade použite možnosť Plánované porovnania preskúmať zmysluplné porovnania medzi prostriedkami.

Chýbajúce bunky a kombinované chybové efekty/členovia

Ak možnosť Regresný prístup na spúšťacom paneli modulu Analýza rozptylu nie je vybratá, pri výpočte súčtu druhých mocnín pre efekty sa použije model priemeru buniek (predvolené nastavenie). Ak návrh nie je vyvážený, potom pri kombinácii neortogonálnych efektov (pozri vyššie uvedenú diskusiu o možnosti Chýbajúce bunky a špecifický účinok) možno získať súčet štvorcov pozostávajúci z neortogonálnych (alebo prekrývajúcich sa) komponentov. Výsledky získané týmto spôsobom sa zvyčajne nedajú interpretovať. Preto treba byť veľmi opatrný pri výbere a implementácii zložitých neúplných experimentálnych návrhov.

Existuje veľa kníh s podrobnými diskusiami o rôznych typoch plánov. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken a Johnson, 1984; Searle, 1987; Woodward a Bonett, 1990), ale tento druh informácií je mimo rámca tejto učebnice. Analýza rôznych typov plánov sa však ukáže neskôr v tejto časti.

Predpoklady a účinky porušenia predpokladov

Odchýlka od predpokladu normálnych rozdelení

Predpokladajme, že závislá premenná sa meria na číselnej škále. Predpokladajme tiež, že závislá premenná má v rámci každej skupiny normálne rozdelenie. Analýza rozptylu obsahuje širokú škálu grafov a štatistík na potvrdenie tohto predpokladu.

Účinky porušenia. Vo všeobecnosti F kritérium je veľmi odolné voči odchýlke od normálu (podrobné výsledky pozri Lindman, 1974). Ak je špička väčšia ako 0, potom hodnota štatistiky F môže byť veľmi malá. Nulová hypotéza je prijatá, aj keď nemusí byť pravdivá. Situácia je opačná, keď je špičatosť menšia ako 0. Šikmosť rozloženia má zvyčajne malý vplyv na Fštatistiky. Ak je počet pozorovaní v bunke dostatočne veľký, potom na odchýlke od normálu príliš nezáleží centrálna limitná veta, podľa ktorého je rozdelenie strednej hodnoty blízke normálnemu, bez ohľadu na počiatočné rozdelenie. Podrobná diskusia o udržateľnosti Fštatistiky možno nájsť u Boxa a Andersona (1955), alebo Lindmana (1974).

Homogenita disperzie

Predpoklady. Predpokladá sa, že odchýlky rôznych skupín plánu sú rovnaké. Tento predpoklad sa nazýva predpoklad homogenita disperzie. Pripomeňme, že na začiatku tejto časti, keď sme popisovali výpočet súčtu druhých mocnín, sme vykonali súčet v rámci každej skupiny. Ak sa odchýlky v dvoch skupinách od seba líšia, potom ich sčítanie nie je príliš prirodzené a nedáva odhad celkového rozptylu v rámci skupiny (keďže v tomto prípade vôbec nejde o všeobecný rozptyl). modul Disperzná analýza -ANOVA/MANOVA obsahuje veľký súbor štatistických kritérií na zisťovanie odchýlky od predpokladov homogenity rozptylu.

Účinky porušenia. Lindman (1974, s. 33) to ukazuje F kritérium je pomerne stabilné vzhľadom na porušenie predpokladov homogenity rozptylu ( heterogenita disperzia, pozri tiež Box, 1954a, 1954b; Hsu, 1938).

Špeciálny prípad: korelácia priemerov a rozptylov. Sú chvíle, kedy Fštatistika môže zavádzať. Stáva sa to vtedy, keď sú stredné hodnoty v bunkách návrhu korelované s rozptylom. modul Analýza rozptylu umožňuje vykresliť rozptylové grafy rozptylu alebo štandardnej odchýlky oproti prostriedkom na zistenie takejto korelácie. Dôvod, prečo je takáto korelácia nebezpečná, je nasledujúci. Predstavme si, že v pláne je 8 buniek, z ktorých 7 má takmer rovnaký priemer a v jednej bunke je priemer oveľa väčší ako zvyšok. Potom F test môže zistiť štatisticky významný účinok. Predpokladajme ale, že v bunke s veľkou strednou hodnotou a rozptyl je oveľa väčší ako ostatné, t.j. priemer a rozptyl v bunkách sú závislé (čím väčší priemer, tým väčší rozptyl). V tomto prípade je veľký priemer nespoľahlivý, pretože môže byť spôsobený veľkou odchýlkou ​​v údajoch. Avšak Fštatistiky založené na zjednotený rozptyl v rámci buniek zachytí veľký priemer, hoci kritériá založené na rozptyle v každej bunke nebudú považovať všetky rozdiely v priemeroch za významné.

S touto povahou údajov (veľký priemer a veľký rozptyl) sa často stretávame, keď existujú odľahlé pozorovania. Jedno alebo dve odľahlé pozorovania výrazne posúvajú priemer a výrazne zvyšujú rozptyl.

Homogenita rozptylu a kovariancie

Predpoklady. Vo viacrozmerných návrhoch s viacrozmerne závislými mierami sa tiež uplatňuje homogenita predpokladov rozptylu opísaná vyššie. Keďže však existujú viacrozmerné závislé premenné, je tiež potrebné, aby ich vzájomné korelácie (kovariancie) boli jednotné vo všetkých bunkách plánu. modul Analýza rozptylu ponúka rôzne spôsoby testovania týchto predpokladov.

Účinky porušenia. Viacrozmerný analóg F- kritérium - λ-test podľa Wilksa. O stabilite (robustnosti) Wilksovho λ-testu s ohľadom na porušenie vyššie uvedených predpokladov nie je veľa známe. Od interpretácie výsledkov modulu Analýza rozptylu je zvyčajne založená na význame jednorozmerných efektov (po stanovení významnosti spoločného kritéria), diskusia o robustnosti sa týka hlavne jednorozmernej analýzy rozptylu. Preto by sa význam jednorozmerných efektov mal dôkladne preskúmať.

Špeciálny prípad: analýza kovariancie. Zvlášť závažné narušenie homogenity rozptylu/kovariancie môže nastať, keď sú do návrhu zahrnuté kovariáty. Najmä ak je korelácia medzi kovariátmi a závislými mierami odlišná v rôznych bunkách návrhu, môže nasledovať nesprávna interpretácia výsledkov. Malo by sa pamätať na to, že pri analýze kovariancie sa v podstate v každej bunke vykonáva regresná analýza, aby sa izolovala tá časť rozptylu, ktorá zodpovedá kovariancii. Predpoklad homogenity rozptylu/kovariancie predpokladá, že táto regresná analýza sa vykonáva za nasledujúceho obmedzenia: všetky regresné rovnice (sklony) pre všetky bunky sú rovnaké. Ak to nie je zamýšľané, môžu sa vyskytnúť veľké chyby. modul Analýza rozptylu má niekoľko špeciálnych kritérií na testovanie tohto predpokladu. Môže byť vhodné použiť tieto kritériá, aby ste sa uistili, že regresné rovnice pre rôzne bunky sú približne rovnaké.

Sférickosť a komplexná symetria: dôvody na použitie viacrozmerného prístupu s opakovanými meraniami pri analýze rozptylu

V návrhoch obsahujúcich faktory opakovaného merania s viac ako dvoma úrovňami si aplikácia jednorozmernej analýzy rozptylu vyžaduje ďalšie predpoklady: komplexné predpoklady symetrie a predpoklady sféricity. Tieto predpoklady sú splnené len zriedka (pozri nižšie). Preto si v posledných rokoch v takýchto plánoch získala popularitu viacrozmerná analýza rozptylu (oba prístupy sú kombinované v module Analýza rozptylu).

Predpoklad komplexnej symetrie Predpokladom komplexnej symetrie je, že rozptyly (celkom v rámci skupiny) a kovariancie (podľa skupiny) pre rôzne opakované merania sú jednotné (rovnaké). Toto je dostatočná podmienka na to, aby bol jednorozmerný F test platný pre opakované merania (tj uvádzané F-hodnoty sú v priemere konzistentné s F-distribúciou). V tomto prípade však táto podmienka nie je potrebná.

Predpoklad sférickosti. Predpoklad sféricity je nevyhnutnou a postačujúcou podmienkou na to, aby bolo F-kritérium opodstatnené. Spočíva v tom, že v rámci skupín sú všetky pozorovania nezávislé a rovnomerne rozdelené. Povaha týchto predpokladov, ako aj dopad ich porušenia, zvyčajne nie sú dobre opísané v knihách o analýze rozptylu – tento bude popísaný v nasledujúcich odsekoch. Ukáže tiež, že výsledky jednorozmerného prístupu sa môžu líšiť od výsledkov viacrozmerného prístupu a vysvetlí, čo to znamená.

Potreba nezávislosti hypotéz. Všeobecný spôsob analýzy údajov pri analýze rozptylu je model fit. Ak vzhľadom na model zodpovedajúci údajom existujú nejaké a priori hypotézy, potom sa rozptyl rozdelí na testovanie týchto hypotéz (kritériá pre hlavné účinky, interakcie). Z výpočtového hľadiska tento prístup generuje určitý súbor kontrastov (súbor porovnaní prostriedkov v návrhu). Ak však kontrasty nie sú na sebe nezávislé, delenie rozdielov stráca zmysel. Napríklad, ak dva kontrasty A a B sú identické a zodpovedajúca časť sa vyberie z rozptylu, potom sa rovnaká časť vyberie dvakrát. Napríklad je hlúpe a nezmyselné vyčleniť dve hypotézy: „priemer v bunke 1 je vyšší ako priemer v bunke 2“ a „priemer v bunke 1 je vyšší ako priemer v bunke 2“. Takže hypotézy musia byť nezávislé alebo ortogonálne.

Nezávislé hypotézy pri opakovaných meraniach. Všeobecný algoritmus implementovaný v module Analýza rozptylu, sa pokúsi generovať nezávislé (ortogonálne) kontrasty pre každý efekt. Pre faktor opakovaných meraní tieto kontrasty vedú k mnohým hypotézam o rozdiely medzi úrovňami uvažovaného faktora. Ak však tieto rozdiely korelujú v rámci skupín, výsledné kontrasty už nie sú nezávislé. Napríklad pri školení, kde sa žiaci merajú trikrát za jeden semester, sa môže stať, že zmeny medzi 1. a 2. dimenziou negatívne korelujú so zmenou medzi 2. a 3. dimenziou predmetov. Tí, ktorí si osvojili väčšinu materiálu medzi 1. a 2. dimenziou, ovládajú menšiu časť počas času, ktorý prešiel medzi 2. a 3. dimenziou. V skutočnosti vo väčšine prípadov, keď sa pri opakovaných meraniach používa analýza rozptylu, možno predpokladať, že zmeny hladín sú medzi subjektmi korelované. Keď sa to však stane, nie sú splnené predpoklady komplexnej symetrie a sféricity a nie je možné vypočítať nezávislé kontrasty.

Vplyv porušení a spôsoby ich nápravy. Ak nie sú splnené predpoklady komplexnej symetrie alebo sféricity, analýza rozptylu môže viesť k chybným výsledkom. Predtým, ako boli dostatočne vyvinuté multivariačné postupy, bolo urobených niekoľko predpokladov na kompenzáciu porušení týchto predpokladov. (Pozri napríklad Greenhouse & Geisser, 1959 a Huynh & Feldt, 1970). Tieto metódy sú aj dnes široko používané (preto sú prezentované v module Analýza rozptylu).

Viacrozmerná analýza rozptylu pristupuje k opakovaným meraniam. Vo všeobecnosti sa problémy komplexnej symetrie a sférickosti týkajú skutočnosti, že súbory kontrastov zahrnuté do štúdie účinkov faktorov opakovaných meraní (s viac ako 2 úrovňami) nie sú na sebe nezávislé. Nemusia však byť nezávislé, ak sa používajú. viacrozmerný kritérium na súčasné testovanie štatistickej významnosti dvoch alebo viacerých kontrastov faktorov opakovaných meraní. To je dôvod, prečo sa viacrozmerná analýza metód rozptylu čoraz viac používa na testovanie významnosti jednorozmerných faktorov opakovaných meraní s viac ako 2 úrovňami. Tento prístup je široko používaný, pretože vo všeobecnosti nevyžaduje predpoklad komplexnej symetrie a predpokladu sféricity.

Prípady, v ktorých nemožno použiť prístup multivariačnej analýzy rozptylu. Existujú príklady (plány), kedy nie je možné použiť viacrozmernú analýzu rozptylu. Zvyčajne ide o prípady, keď je v návrhu malý počet subjektov a veľa úrovní vo faktore opakovaných meraní. Potom môže byť príliš málo pozorovaní na vykonanie viacrozmernej analýzy. Napríklad, ak existuje 12 subjektov, p = 4 faktor opakovaných meraní a každý faktor má k = 3 úrovne. Potom sa interakcia 4 faktorov „vynaloží“ (k-1)P = 2 4 = 16 stupne slobody. Existuje však iba 12 subjektov, preto v tomto príklade nemožno vykonať viacrozmerný test. modul Analýza rozptylu nezávisle zistí tieto pozorovania a vypočíta iba jednorozmerné kritériá.

Rozdiely v jednorozmerných a viacrozmerných výsledkoch. Ak štúdia zahŕňa veľký počet opakovaných meraní, môžu nastať prípady, keď prístup jednorozmerných opakovaných meraní ANOVA poskytne výsledky, ktoré sú veľmi odlišné od výsledkov získaných pomocou viacrozmerného prístupu. To znamená, že rozdiely medzi úrovňami príslušných opakovaných meraní sú medzi subjektmi korelované. Niekedy je táto skutočnosť predmetom nezávislého záujmu.

Viacrozmerná analýza rozptylu a štruktúrne modelovanie rovníc

V posledných rokoch sa modelovanie štruktúrnych rovníc stalo populárnym ako alternatíva k multivariačnej disperznej analýze (pozri napríklad Bagozzi a Yi, 1989; Bagozzi, Yi a Singh, 1991; Cole, Maxwell, Arvey a Salas, 1993). Tento prístup umožňuje testovať hypotézy nielen o priemeroch v rôznych skupinách, ale aj o korelačných maticiach závislých premenných. Môžete napríklad uvoľniť predpoklady o homogenite rozptylu a kovariancie a explicitne zahrnúť chyby do modelu pre každú skupinu rozptylu a kovariancie. modul ŠTATISTIKAModelovanie štruktúrnych rovníc (SEPATH) (pozri zväzok III) umožňuje takúto analýzu.

Vyššie diskutované metódy na testovanie štatistických hypotéz o významnosti rozdielov medzi dvoma priemermi majú v praxi obmedzené využitie. Dôvodom je skutočnosť, že s cieľom identifikovať vplyv všetkých možných podmienok a faktorov na výsledný znak sa terénne a laboratórne experimenty spravidla vykonávajú nie s dvoma, ale s väčším počtom vzoriek (1220 alebo viac). ).

Vedci často porovnávajú priemery niekoľkých vzoriek spojených do jedného komplexu. Napríklad pri skúmaní vplyvu rôznych druhov a dávok hnojív na úrodu plodín sa experimenty opakujú v rôznych verziách. V týchto prípadoch sa párové porovnávanie stáva ťažkopádnym a štatistická analýza celého komplexu si vyžaduje použitie špeciálnej metódy. Táto metóda, vyvinutá v matematickej štatistike, sa nazýva analýza rozptylu. Prvýkrát ho použil anglický štatistik R. Fisher pri spracovaní výsledkov agronomických pokusov (1938).

Analýza rozptylu- ide o metódu štatistického hodnotenia spoľahlivosti prejavu závislosti efektívneho znaku od jedného alebo viacerých faktorov. Pomocou metódy analýzy rozptylu sa testujú štatistické hypotézy týkajúce sa priemerov v niekoľkých všeobecných populáciách, ktoré majú normálne rozdelenie.

Analýza rozptylu je jednou z hlavných metód štatistického hodnotenia výsledkov experimentu. Čoraz častejšie sa využíva aj pri analýze ekonomických informácií. Analýza rozptylu umožňuje zistiť, do akej miery sú selektívne ukazovatele vzťahu medzi efektívnymi a faktorovými znakmi dostatočné na rozšírenie údajov získaných zo vzorky do všeobecnej populácie. Výhodou tejto metódy je, že poskytuje pomerne spoľahlivé závery z malých vzoriek.

Skúmaním variácie výsledného atribútu pod vplyvom jedného alebo viacerých faktorov pomocou analýzy rozptylu možno okrem všeobecných odhadov významnosti závislostí získať aj posúdenie rozdielov v priemerných hodnotách, ktoré sa tvoria na rôznych úrovniach faktorov a význam interakcie faktorov. Disperzná analýza sa používa na štúdium závislostí kvantitatívnych a kvalitatívnych charakteristík, ako aj ich kombinácií.

Podstata tejto metódy spočíva v štatistickom štúdiu pravdepodobnosti vplyvu jedného alebo viacerých faktorov, ako aj ich interakcie na efektívnu vlastnosť. V súlade s tým sa pomocou analýzy rozptylu riešia tri hlavné úlohy: 1) všeobecné posúdenie významnosti rozdielov medzi priemermi skupín; 2) posúdenie pravdepodobnosti interakcie faktorov; 3) posúdenie významnosti rozdielov medzi pármi prostriedkov. Najčastejšie musia výskumníci takéto problémy riešiť pri realizácii terénnych a zootechnických experimentov, keď sa skúma vplyv viacerých faktorov na výsledný znak.

Principiálna schéma disperznej analýzy zahŕňa stanovenie hlavných zdrojov variácií výsledného atribútu a určenie objemu variácií (súčty kvadrátov odchýlok) podľa zdrojov jej vzniku; určenie počtu stupňov voľnosti zodpovedajúcich zložkám celkovej variácie; výpočet rozptylov ako pomer zodpovedajúcich objemov variácií k ich počtu stupňov voľnosti; analýza vzťahu medzi disperziami; posúdenie spoľahlivosti rozdielu medzi priemermi a formulácia záverov.

Táto schéma je zachovaná ako v jednoduchých modeloch ANOVA, kedy sú dáta zoskupené podľa jedného atribútu, tak aj v zložitých modeloch, kedy sú dáta zoskupené podľa dvoch alebo viacerých atribútov. S nárastom počtu skupinových charakteristík sa však proces rozkladu všeobecnej variácie podľa zdrojov jej formovania komplikuje.

Podľa schematického diagramu možno analýzu rozptylu znázorniť ako päť po sebe idúcich krokov:

1) definícia a dekompozícia variácie;

2) určenie počtu stupňov voľnosti variácie;

3) výpočet disperzií a ich pomerov;

4) analýza disperzií a ich pomerov;

5) posúdenie spoľahlivosti rozdielu medzi priemermi a formulácia záverov o testovaní nulovej hypotézy.

Časovo najnáročnejšia časť analýzy rozptylu je prvá fáza - definícia a rozklad variácie podľa zdrojov jej vzniku. Poradie expanzie celkového objemu variácií bolo podrobne diskutované v kapitole 5.

Základom riešenia problémov variančnej analýzy je zákon o expanzii (sčítaní) variácie, podľa ktorého sa celková variácia (kolísanie) výsledného atribútu delí na dve: variácie v dôsledku pôsobenia skúmaného faktora (faktorov). ), a variácie spôsobené pôsobením náhodných príčin, tj

Predpokladajme, že skúmaná populácia je rozdelená do niekoľkých skupín podľa faktora, z ktorých každá je charakterizovaná svojou priemernou hodnotou efektívneho atribútu. Súčasne možno odchýlku týchto hodnôt vysvetliť dvoma typmi dôvodov: tými, ktoré systematicky pôsobia na efektívnu vlastnosť a sú prístupné úprave v priebehu experimentu a nie sú prístupné úprave. Je zrejmé, že medziskupinová (faktoriálna alebo systematická) variácia závisí hlavne od pôsobenia študovaného faktora a vnútroskupinová (reziduálna alebo náhodná) - od pôsobenia náhodných faktorov.

Na posúdenie významnosti rozdielov medzi skupinovými priemermi je potrebné určiť medziskupinové a vnútroskupinové variácie. Ak medziskupinová (faktoriálna) variácia výrazne prevyšuje vnútroskupinovú (reziduálnu) variáciu, potom faktor ovplyvnil výslednú vlastnosť a výrazne zmenil hodnoty skupinových priemerov. Vynára sa však otázka, aký je pomer medzi medziskupinovými a vnútroskupinovými variáciami, možno považovať za dostatočný na záver o spoľahlivosti (významnosti) rozdielov medzi skupinovými priemermi.

Na posúdenie významnosti rozdielov medzi priemermi a formulovanie záverov o testovaní nulovej hypotézy (H0: x1 = x2 = ... = xn) sa pri analýze rozptylu používa akýsi štandard - G-kritérium, distribučný zákon ktorú založil R. Fisher. Toto kritérium je pomer dvoch rozptylov: faktoriálneho, generovaného pôsobením skúmaného faktora, a reziduálneho, v dôsledku pôsobenia náhodných príčin:

Disperzný pomer r = t>u : £ * 2 americký štatistik Snedecor navrhol označovať písmenom G na počesť vynálezcu analýzy rozptylu R. Fishera.

Disperzie °2 io2 sú odhady rozptylu bežnej populácie. Ak sú vzorky s odchýlkami °2 °2 vyrobené z rovnakej všeobecnej populácie, kde bola odchýlka v hodnotách náhodná, potom je nezrovnalosť v hodnotách °2 °2 tiež náhodná.

Ak experiment kontroluje vplyv viacerých faktorov (A, B, C atď.) na efektívnu vlastnosť súčasne, potom by rozptyl v dôsledku pôsobenia každého z nich mal byť porovnateľný s °napr.gP, t.j

Ak je hodnota rozptylu faktora výrazne väčšia ako rezíduum, tak faktor výrazne ovplyvnil výsledný atribút a naopak.

V multifaktoriálnych experimentoch okrem variácií spôsobených pôsobením každého faktora existuje takmer vždy variácia v dôsledku interakcie faktorov ($av: ^ls ^ss $liіs). Podstatou interakcie je, že účinok jedného faktora sa výrazne mení na rôznych úrovniach druhého (napríklad účinnosť kvality pôdy pri rôznych dávkach hnojív).

Interakcia faktorov by sa mala posúdiť aj porovnaním príslušných rozptylov 3 ^w.gr:

Pri výpočte skutočnej hodnoty B-kritéria sa v čitateli berie najväčší z rozptylov, teda B > 1. Je zrejmé, že čím väčšie je B-kritérium, tým väčšie sú rozdiely medzi rozptylmi. Ak B = 1, potom otázka hodnotenia významnosti rozdielov v rozptyloch odpadá.

Na určenie limitov náhodných fluktuácií vytvoril pomer rozptylov G. Fisher špeciálne tabuľky B-distribúcie (Príloha 4 a 5). Kritérium B funkčne súvisí s pravdepodobnosťou a závisí od počtu stupňov voľnosti variácie k1 a k2 z dvoch porovnávaných rozptylov. Na vyvodenie záverov o maximálnej hodnote kritéria pre hladiny významnosti 0,05 a 0,01 sa zvyčajne používajú dve tabuľky. Hladina významnosti 0,05 (alebo 5 %) znamená, že len v 5 prípadoch zo 100 môže kritérium B nadobudnúť hodnotu rovnakú alebo vyššiu ako je uvedená v tabuľke. Pokles hladiny významnosti z 0,05 na 0,01 vedie k zvýšeniu hodnoty kritéria B medzi dvoma rozptylmi pôsobením iba náhodných príčin.

Hodnota kritéria tiež priamo závisí od počtu stupňov voľnosti dvoch porovnávaných disperzií. Ak má počet stupňov voľnosti tendenciu k nekonečnu (k-me), potom pomer by pre dve disperzie smeruje k jednote.

Tabuľková hodnota kritéria B ukazuje možnú náhodnú hodnotu pomeru dvoch rozptylov na danej hladine významnosti a zodpovedajúci počet stupňov voľnosti pre každý z porovnávaných rozptylov. V týchto tabuľkách je hodnota B uvedená pre vzorky vyrobené z rovnakej všeobecnej populácie, kde sú dôvody zmeny hodnôt iba náhodné.

Hodnota G sa zistí z tabuliek (príloha 4 a 5) na priesečníku príslušného stĺpca (počet stupňov voľnosti pre väčší rozptyl - k1) a riadku (počet stupňov voľnosti pre menší rozptyl - k2). Ak teda väčší rozptyl (čitateľ G) k1 = 4 a menší rozptyl (menovateľ G) k2 = 9, potom Ga na hladine významnosti a = 0,05 bude 3,63 (približne 4). Takže v dôsledku pôsobenia náhodných príčin, keďže vzorky sú malé, rozptyl jednej vzorky môže na 5% hladine významnosti prevýšiť rozptyl pre druhú vzorku 3,63-krát. S poklesom hladiny významnosti z 0,05 na 0,01 sa tabuľková hodnota kritéria D, ako je uvedené vyššie, zvýši. Takže pri rovnakých stupňoch voľnosti k1 = 4 ak2 = 9 a a = 0,01 bude tabuľková hodnota kritéria G 6,99 (cca 5).

Zvážte postup na určenie počtu stupňov voľnosti pri analýze rozptylu. Počet stupňov voľnosti, ktorý zodpovedá celkovému súčtu štvorcových odchýlok, sa rozloží na zodpovedajúce zložky podobne ako pri rozklade súčtov štvorcových odchýlok (k1) a vnútroskupinových (k2) variácií.

Ak teda vzorka populácie pozostávajúca z N pozorovania delené podľa t skupiny (počet možností experimentu) a P podskupiny (počet opakovaní), potom počet stupňov voľnosti k bude:

a) pre celkový súčet štvorcových odchýlok (dszar)

b) pre medziskupinový súčet štvorcových odchýlok ^m.gP)

c) pre vnútroskupinový súčet štvorcových odchýlok v w.gr)

Podľa variačného pravidla pridávania:

Napríklad, ak sa v experimente vytvorili štyri varianty experimentu (m = 4) v piatich opakovaniach (n = 5) a celkový počet pozorovaní N = = t o p \u003d 4 * 5 \u003d 20, potom sa počet stupňov voľnosti rovná:

Keď poznáme súčty štvorcových odchýlok počtu stupňov voľnosti, je možné určiť neskreslené (upravené) odhady pre tri rozptyly:

Nulová hypotéza H0 podľa kritéria B sa testuje rovnako ako pri Studentovom u-teste. Pre rozhodnutie o kontrole H0 je potrebné vypočítať skutočnú hodnotu kritéria a porovnať ju s tabuľkovou hodnotou Ba pre akceptovanú hladinu významnosti a a počet stupňov voľnosti. k1 a k2 pre dve disperzie.

Ak Bfakg > Ba, potom v súlade s akceptovanou hladinou významnosti môžeme konštatovať, že rozdiely vo výberových rozptyloch nie sú určené iba náhodnými faktormi; sú významné. V tomto prípade je nulová hypotéza zamietnutá a existuje dôvod domnievať sa, že faktor výrazne ovplyvňuje výsledný atribút. Ak< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

Použitie jedného alebo druhého modelu ANOVA závisí od počtu skúmaných faktorov a od metódy odberu vzoriek.

V závislosti od počtu faktorov, ktoré určujú variáciu efektívnej funkcie, môžu byť vzorky tvorené jedným, dvoma alebo viacerými faktormi. Podľa tejto analýzy sa rozptyl delí na jednofaktorový a viacfaktorový. Inak sa nazýva aj jednofaktorový a viacfaktorový disperzný komplex.

Schéma rozkladu všeobecnej variácie závisí od vytvorenia skupín. Môže byť náhodné (pozorovania jednej skupiny nesúvisia s pozorovaniami druhej skupiny) a nenáhodné (pozorovania dvoch vzoriek sú prepojené spoločnými podmienkami experimentu). V súlade s tým sa získajú nezávislé a závislé vzorky. Nezávislé vzorky môžu byť vytvorené s rovnakými aj nepárnymi číslami. Tvorba závislých vzoriek predpokladá ich rovnaký počet.

Ak sú skupiny vytvorené v nenásilnom poradí, potom celkové množstvo variácií výslednej vlastnosti zahŕňa spolu s faktoriálnou (medziskupinovou) a zvyškovou variáciou variáciu opakovaní, tj.

V praxi je vo väčšine prípadov potrebné uvažovať so závislými vzorkami, keď sú podmienky pre skupiny a podskupiny vyrovnané. Takže v terénnom experimente je celá oblasť rozdelená na bloky s najvýhodnejšími podmienkami. Zároveň každý variant experimentu dostane rovnaké príležitosti na zastúpenie vo všetkých blokoch, čím sa dosiahne vyrovnanie podmienok pre všetky testované možnosti, skúsenosti. Táto metóda budovania skúseností sa nazýva metóda náhodných blokov. Pokusy so zvieratami sa vykonávajú podobne.

Pri spracovaní sociálno-ekonomických údajov metódou rozptylovej analýzy je potrebné mať na pamäti, že vzhľadom na bohatý počet faktorov a ich vzájomný vzťah je ťažké, aj pri najstarostlivejšom zosúladení podmienok, určiť stupeň objektívny vplyv každého jednotlivého faktora na efektívny atribút. Preto je úroveň reziduálnej variácie určená nielen náhodnými príčinami, ale aj významnými faktormi, ktoré neboli zohľadnené pri zostavovaní modelu ANOVA. V dôsledku toho sa zvyškový rozptyl ako základ na porovnanie niekedy stáva neadekvátnym pre svoj účel, je jasne nadhodnotený a nemôže slúžiť ako kritérium pre významnosť vplyvu faktorov. V tomto ohľade sa pri vytváraní modelov disperznej analýzy stáva relevantným problém výberu najdôležitejších faktorov a vyrovnávania podmienok na prejavenie pôsobenia každého z nich. Okrem toho. použitie analýzy rozptylu predpokladá normálne alebo blízke normálne rozloženie študovaných štatistických populácií. Ak táto podmienka nie je splnená, potom budú odhady získané pri analýze rozptylu zveličené.