Kritériá vhodnosti v štatistických inovačných technológiách. Pearsonov test dobrej zhody

V tejto časti sa budeme zaoberať jednou z otázok súvisiacich s testovaním pravdepodobnosti hypotéz, konkrétne otázkou konzistencie medzi teoretickými a štatistickými rozdeleniami.

Predpokladajme, že dané štatistické rozdelenie je sploštené nejakou teoretickou krivkou f(x)(obr. 7.6.1). Bez ohľadu na to, ako dobre je zvolená teoretická krivka, medzi ňou a štatistickým rozdelením sú nevyhnutné určité nezrovnalosti. Prirodzene vyvstáva otázka: sú tieto nezrovnalosti spôsobené iba náhodnými okolnosťami spojenými s obmedzeným počtom pozorovaní, alebo sú významné a súvisia s tým, že krivka, ktorú sme zvolili, nevyrovnáva toto štatistické rozdelenie správne. Na zodpovedanie tejto otázky sa používajú takzvané „kritériá súhlasu“.

ZÁKONY DISTRIBÚCIE NÁHODNÝCH PREMENNÝCH



Myšlienka použitia kritérií dobrej zhody je nasledovná.

Na základe tohto štatistického materiálu musíme hypotézu otestovať H, spočíva v tom, že náhodná premenná X dodržiava určitý zákon o distribúcii. Tento zákon môže byť daný v tej či onej forme: napríklad vo forme distribučnej funkcie F(x) alebo vo forme hustoty distribúcie f(x), alebo vo forme súboru pravdepodobností p t , kde pt- pravdepodobnosť, že hodnota X bude spadať dovnútra niečo vypúšťanie.

Keďže z týchto tvorí distribučná funkcia F(x) je najvšeobecnejšia a určuje akúkoľvek inú, sformulujeme hypotézu H, ako spočívajúci v tom, že hodnota X má distribučnú funkciu ^(d:).

Prijať alebo zamietnuť hypotézu H, zvážiť nejaké množstvo ty charakterizujúce mieru nesúladu medzi teoretickým a štatistickým rozdelením. Hodnota U môžu byť vybrané rôznymi spôsobmi; napríklad ako U môžeme vziať súčet druhých mocnín odchýlok teoretických pravdepodobností pt z príslušných frekvencií R* alebo súčet rovnakých štvorcov s niektorými koeficientmi („váhy“) alebo maximálna odchýlka funkcie štatistického rozdelenia F*(x) z teoretickej F(x) atď. Predpokladajme, že množstvo U zvolený tak či onak. Je zrejmé, že existuje náhodná hodnota. Zákon rozdelenia tejto náhodnej premennej závisí od zákona rozdelenia náhodnej premennej X, na ktorých sa experimenty uskutočnili az počtu experimentov P. Ak je hypotéza H je pravda, potom distribučný zákon množstva U určuje distribučný zákon množstva X(funkcia F(x)) a číslo P.

Predpokladajme, že tento distribučný zákon je nám známy. V dôsledku tejto série experimentov sa zistilo, že opatrenie, ktoré sme zvolili



KRITÉRIÁ SÚHLASU


nezrovnalosti U nadobudli určitú hodnotu a. Otázkou je, či to možno vysvetliť náhodnými príčinami, alebo či je tento nesúlad príliš veľký a naznačuje prítomnosť významného rozdielu medzi teoretickým a štatistickým rozdelením, a teda nevhodnosť hypotézy. H? Ak chcete odpovedať na túto otázku, predpokladajme, že hypotéza H je správny a za tohto predpokladu vypočítame pravdepodobnosť, že v dôsledku náhodných príčin spojených s nedostatočným množstvom experimentálneho materiálu bude miera nezrovnalosti U nebude menšia ako hodnota, ktorú sme pozorovali v experimente a tj vypočítame pravdepodobnosť udalosti:

Ak je táto pravdepodobnosť veľmi malá, ide o hypotézu H by sa malo odmietnuť ako málo pravdepodobné; ak je táto pravdepodobnosť významná, malo by sa uznať, že experimentálne údaje nie sú v rozpore s hypotézou N.

Vynára sa otázka, akým spôsobom by sa mala zvoliť miera nezrovnalosti £/? Ukazuje sa, že pre niektoré spôsoby jej výberu platí zákon rozdelenia množstva U má veľmi jednoduché vlastnosti a pre dostatočne veľké P prakticky nezávislé od funkcie F(x). Práve takéto miery nezrovnalostí sa používajú v matematickej štatistike ako kritériá zhody.

Pozrime sa na jedno z najčastejšie používaných kritérií dohody – takzvané „kritérium pri?" Pearson.

Predpokladajme, že existuje ha nezávislých experimentov, v každom z nich náhodná premenná X nadobudli určitú hodnotu. Výsledky experimentov sú zhrnuté v kčíslic a sú prezentované vo forme štatistického radu.

Nulový(základné) nazvať predloženú hypotézu o tvare neznámeho rozdelenia alebo o parametroch známych rozdelení. súťažiť (alternatíva) nazývaná hypotéza, ktorá je v rozpore s nulovou.

Napríklad, ak nulová hypotéza predpokladá, že náhodná premenná X je rozdelená podľa zákona , potom môže konkurenčná hypotéza spočívať v predpoklade, že náhodná premenná X distribuované podľa iného zákona.

Štatistické kritérium(alebo jednoducho kritérium) sa nazýva nejaká náhodná premenná Komu, ktorý slúži na testovanie nulovej hypotézy.

Po výbere určitého kritéria, napríklad kritéria , sa množina všetkých jeho možných hodnôt rozdelí na dve neprekrývajúce sa podmnožiny: jedna z nich obsahuje hodnoty kritéria, podľa ktorých je nulová hypotéza zamietnutá, a druhá - pod ktoré sa prijíma.

Kritická oblasť je súbor testovacích hodnôt, pre ktoré je nulová hypotéza zamietnutá. Oblasť prijatia hypotézy nazývaný súbor hodnôt kritéria, podľa ktorého je hypotéza prijatá. kritických bodov nazývajú sa body oddeľujúce kritickú oblasť od oblasti prijatia nulovej hypotézy.

Pre náš príklad s hodnotou , hodnota vypočítaná zo vzorky zodpovedá oblasti prijatia hypotézy: náhodná premenná je rozdelená podľa zákona . Ak vypočítaná hodnota spadá do kritickej oblasti, to znamená, že hypotéza o rozdelení náhodnej premennej podľa zákona je zamietnutá.

V prípade rozdelenia je kritická oblasť určená nerovnosťou, akceptačná oblasť nulovej hypotézy je určená nerovnosťou.

2.6.3. Kritériá dobroty Pearson.

Jednou z úloh zootechniky a veterinárnej genetiky je šľachtenie nových plemien a druhov s požadovanými vlastnosťami. Napríklad zvýšená imunita, odolnosť voči chorobám, či zmena farby srsti.

V praxi sa pri analýze výsledkov často ukazuje, že skutočné výsledky viac-menej zodpovedajú nejakému teoretickému zákonu rozdelenia. Je potrebné posúdiť mieru zhody medzi skutočnými (empirickými) údajmi a teoretickými (hypotetickými) údajmi. Za týmto účelom predložte nulovú hypotézu: výsledná populácia je rozdelená podľa zákona "A". Overenie hypotézy o navrhovanom zákone o rozdeľovaní sa vykonáva pomocou špeciálne vybranej náhodnej premennej – kritéria dobrej zhody.

Kritérium zhody nazval kritériom testovania hypotézy údajného zákona neznámeho rozdelenia.

Existuje niekoľko kritérií vhodnosti: Pearson, Kolmogorov, Smirnov atď. Pearsonov test dobrej zhody je najčastejšie používaný.

Zvážte aplikáciu Pearsonovho kritéria na príklade testovania hypotézy normálneho zákona o rozdelení všeobecnej populácie. Za týmto účelom porovnáme empirické a teoretické (vypočítané v pokračovaní normálneho rozdelenia) frekvencie.

Zvyčajne existuje určitý rozdiel medzi teoretickými a empirickými frekvenciami. Napríklad:

Empirické frekvencie 7 15 41 93 113 84 25 13 5

Teoretické frekvencie 5 13 36 89 114 91 29 14 6

Zvážte dva prípady:

Rozpor medzi teoretickými a empirickými frekvenciami je náhodný (nevýznamný), t.j. je možné urobiť návrh na rozdelenie empirických početností podľa normálneho zákona;

Rozpor medzi teoretickými a empirickými frekvenciami nie je náhodný (významný), t.j. teoretické frekvencie sú vypočítané na základe nesprávnej hypotézy o normálnom rozdelení všeobecnej populácie.

Pomocou Pearsonovho kritéria dobrej zhody je možné náhodne alebo nie určiť nesúlad medzi teoretickými a empirickými frekvenciami, t.j. s danou pravdepodobnosťou spoľahlivosti určiť, či je všeobecná populácia rozdelená podľa normálneho zákona alebo nie.

Nech sa teda získa empirická distribúcia pre vzorku veľkosti n:

Možnosti……

Empirické frekvencie......

Predpokladajme, že za predpokladu normálneho rozdelenia sú vypočítané teoretické početnosti. Na hladine významnosti je potrebné otestovať nulovú hypotézu: populácia je normálne rozložená.

Ako kritérium na testovanie nulovej hypotézy berieme náhodnú premennú

(*)

Táto hodnota je náhodná, pretože v rôznych experimentoch nadobúda rôzne, predtým neznáme hodnoty. Je zrejmé, že čím menej sa empirické a teoretické frekvencie líšia, tým menšia je hodnota kritéria a následne do určitej miery charakterizuje blízkosť empirického a teoretického rozdelenia.

Je dokázané, že v , distribučný zákon náhodnej premennej (*), bez ohľadu na to, ktorému distribučnému zákonu podlieha všeobecná populácia, smeruje k distribučnému zákonu so stupňami voľnosti. Preto je náhodná premenná (*) označená a samotné kritérium sa nazýva „chí-kvadrát“ test zhody.

Hodnotu kritéria vypočítaného z pozorovacích údajov označme ako . Tabuľkové kritické hodnoty kritéria pre danú úroveň významnosti a počet stupňov voľnosti označujú . V tomto prípade sa počet stupňov voľnosti určí z rovnosti , kde počet skupín (čiastkových intervalov) vzorky alebo tried; - počet parametrov navrhovaného rozdelenia. Normálne rozdelenie má dva parametre – matematické očakávanie a smerodajnú odchýlku. Preto sa počet stupňov voľnosti pre normálne rozdelenie zistí z rovnosti

Ak vypočítaná hodnota a tabuľková hodnota vyhovujú nerovnosti , je prijatá nulová hypotéza o normálnom rozdelení všeobecnej populácie. Ak , nulová hypotéza sa zamieta a akceptuje sa alternatíva hypotézy k nej (všeobecná populácia nie je rozdelená podľa normálneho zákona).

Komentujte. Pri použití Pearsonovho testu dobrej zhody musí byť veľkosť vzorky aspoň 30. Každá skupina musí obsahovať aspoň 5 možností. Ak je v skupinách menej ako 5 frekvencií, kombinujú sa so susednými skupinami.

Vo všeobecnosti je počet stupňov voľnosti pre rozdelenie chí-kvadrát definovaný ako celkový počet hodnôt, z ktorých sa vypočítavajú zodpovedajúce miery, mínus počet tých podmienok, ktoré spájajú tieto hodnoty, t.j. znížiť možnosť variácií medzi nimi. V najjednoduchších prípadoch sa pri výpočte počet stupňov voľnosti bude rovnať počtu tried zníženému o jednu. Napríklad pri dihybridnom štiepení sa získajú 4 triedy, ale získa sa iba prvá trieda nesúvisiaca, nasledujúce sú už spojené s predchádzajúcimi. Preto pre dihybridné štiepenie je počet stupňov voľnosti .

Príklad 1 Určte mieru zhody medzi skutočným rozdelením skupín z hľadiska počtu kráv s tuberkulózou a teoreticky očakávaným, ktorý bol vypočítaný pri uvažovaní normálneho rozdelenia. Počiatočné údaje sú zhrnuté v tabuľke:

Riešenie.

Podľa hladiny významnosti a počtu stupňov voľnosti z tabuľky kritických distribučných bodov (pozri prílohu 4) zistíme hodnotu . Pretože môžeme konštatovať, že rozdiel medzi teoretickými a skutočnými frekvenciami je náhodný. Skutočné rozdelenie skupín podľa počtu kráv s tuberkulózou teda zodpovedá teoreticky očakávanému.

Príklad 2 Teoretické rozdelenie podľa fenotypu jedincov získaných v druhej generácii dihybridným krížením králikov podľa Mendelovho zákona je 9: 3: 3: 1. Je potrebné vypočítať zhodu empirického rozdelenia králikov z kríženia čiernych jedincov s normálnou srsťou. s páperovitými zvieratami - albínmi. Pri krížení v druhej generácii sa získalo 120 potomkov, z toho 45 čiernych s krátkou srsťou, 30 čiernych páperových králikov, 25 bielych s krátkosrstou srsťou, 20 bielych páperových králikov.

Riešenie. Teoreticky predpokladaná segregácia u potomstva by mala zodpovedať pomeru štyroch fenotypov (9:3:3:1). Vypočítajte teoretické frekvencie (počet cieľov) pre každú triedu:

9+3+3+1=16, takže môžeme očakávať, že budú čierne krátkosrsté ; čierne páperové - ; biela krátkosrstá ; biele páperové -.

Empirická (skutočná) fenotypová distribúcia bola nasledovná45; tridsať; 25; dvadsať.

Všetky tieto údaje zhrnieme v nasledujúcej tabuľke:

Pomocou Pearsonovho testu dobrej zhody vypočítame hodnotu:

Počet stupňov voľnosti v dihybridnom krížení. Pre hladinu významnosti nájsť hodnotu . Pretože môžeme konštatovať, že rozdiel medzi teoretickými a skutočnými frekvenciami nie je náhodný. Následne sa výsledná skupina králikov pri dihybridnom krížení odchyľuje z hľadiska distribúcie fenotypov od Mendelovho zákona a odráža vplyv určitých faktorov, ktoré menia typ štiepenia vo fenotype v druhej generácii hybridov.

Pearsonov chí-kvadrát test dobrej zhody možno použiť aj na porovnanie dvoch homogénnych empirických rozdelení medzi sebou, t.j. tie, ktoré majú rovnaké hranice triedy. Nulová hypotéza je hypotéza, že dve neznáme distribučné funkcie sú rovnaké. Chí-kvadrát test v takýchto prípadoch je určený vzorcom

(**)

kde a sú objemy porovnávaných distribúcií; a sú to frekvencie zodpovedajúcich tried.

Zvážte porovnanie dvoch empirických rozdelení pomocou nasledujúceho príkladu.

Príklad 3 Dĺžka kukučích vajec bola meraná v dvoch územných pásmach. V prvej zóne bola vyšetrená vzorka 76 vajec (), v druhej 54 (). Získajú sa nasledujúce výsledky:

Dĺžka (mm)
Frekvencie
Frekvencie - - -

Na hladine významnosti je potrebné otestovať nulovú hypotézu, že obe vzorky vajíčok patria do rovnakej populácie kukučky.

Úvod

Relevantnosť tejto témy je v tom, že pri štúdiu základov bioštatistiky sme predpokladali, že zákon rozloženia bežnej populácie je známy. Ale čo ak je distribučný zákon neznámy, ale existuje dôvod predpokladať, že má určitú formu (nazvime ho A), potom sa overí nulová hypotéza: všeobecná populácia je rozdelená podľa zákona A. Táto hypotéza sa testuje pomocou špeciálne vybranej náhodnej premennej – kritéria zhody.

Testy dobrej zhody sú kritériami na testovanie hypotéz o zhode empirického rozdelenia s teoretickým rozdelením pravdepodobnosti. Tieto kritériá spadajú do dvoch kategórií:

  • III Všeobecné kritériá dobrej zhody sa vzťahujú na najvšeobecnejšiu formuláciu hypotézy, konkrétne na hypotézu, že pozorované výsledky súhlasia s akýmkoľvek a priori predpokladaným rozdelením pravdepodobnosti.
  • III Špeciálne testy dobrej zhody zahŕňajú špeciálne nulové hypotézy, ktoré formulujú súhlas s určitou formou rozdelenia pravdepodobnosti.

Kritériá dobroty

Najbežnejšie testy dobrej zhody sú omega-kvadrát, chí-kvadrát, Kolmogorov a Kolmogorov-Smirnov.

Široko používané sú neparametrické testy zhody Kolmogorov, Smirnov, omega štvorec. Sú však spojené aj s rozšírenými chybami pri aplikácii štatistických metód.

Faktom je, že uvedené kritériá boli vyvinuté na testovanie zhody s plne známym teoretickým rozdelením. Výpočtové vzorce, tabuľky rozdelenia a kritické hodnoty sú široko používané. Hlavnou myšlienkou Kolmogorovho, omega štvorca a podobných kritérií je meranie vzdialenosti medzi empirickou distribučnou funkciou a teoretickou distribučnou funkciou. Tieto kritériá sa líšia vo forme vzdialeností v priestore distribučných funkcií.

Pearsonove testy dobrej zhody p2 pre jednoduchú hypotézu

Teorém K. Pearsona sa týka nezávislých pokusov s konečným počtom výsledkov, t.j. na Bernoulliho procesy (v trochu rozšírenom zmysle). Umožňuje posúdiť, či pozorovania vo veľkom počte pokusov o frekvencii týchto výsledkov sú v súlade s ich odhadovanými pravdepodobnosťami.

V mnohých praktických problémoch nie je presný distribučný zákon známy. Preto sa predkladá hypotéza o zhode existujúceho empirického zákona, postaveného na základe pozorovaní, s nejakým teoretickým. Táto hypotéza si vyžaduje štatistické testovanie, ktorého výsledky budú buď potvrdené, alebo vyvrátené.

Nech X je skúmaná náhodná premenná. Je potrebné otestovať hypotézu H0, že táto náhodná premenná sa riadi distribučným zákonom F(x). Na to je potrebné urobiť vzorku n nezávislých pozorovaní a zostaviť z nej empirický distribučný zákon F "(x). Na porovnanie empirických a hypotetických zákonov sa používa pravidlo nazývané dobrá zhoda. Jedno z tzv. Najpopulárnejšia je K. Pearsonova chí-kvadrát štatistika vhodnosti. V nej sa vypočítava chí-kvadrát štatistika:

kde N je počet intervalov, podľa ktorých bol zostavený empirický distribučný zákon (počet stĺpcov príslušného histogramu), i je číslo intervalu, pt i je pravdepodobnosť, že hodnota náhodnej premennej bude spadať do i-tý interval pre teoretický distribučný zákon, pe i je pravdepodobnosť, že hodnota náhodnej premennej bude spadať do i-tého intervalu pre empirický distribučný zákon. Musí dodržiavať rozdelenie chí-kvadrát.

Ak vypočítaná hodnota štatistiky prekročí kvantil chí-kvadrát distribúcie s k-p-1 stupňami voľnosti pre danú hladinu významnosti, potom sa hypotéza H0 zamieta. V opačnom prípade je akceptovaný na danej hladine významnosti. Tu k je počet pozorovaní, p je počet odhadovaných parametrov distribučného zákona.

Pozrime sa na štatistiky:

Štatistika p2 sa pre jednoduchú hypotézu nazýva Pearsonova chí-kvadrát štatistika.

Je jasné, že p2 je druhá mocnina určitej vzdialenosti medzi dvoma r-rozmernými vektormi: vektorom relatívnej frekvencie (mi / n, ..., mr / n) a vektorom pravdepodobnosti (pi, ..., pr). Táto vzdialenosť sa líši od euklidovskej vzdialenosti len tým, že do nej vstupujú rôzne súradnice s rôznymi váhami.

Poďme diskutovať o správaní sa štatistiky h2 v prípade, keď je hypotéza H pravdivá a v prípade, keď je H nepravdivá. Ak je H pravdivé, potom asymptotické správanie ch2 pre n > ? označuje K. Pearsonovu vetu. Aby ste pochopili, čo sa stane s (2.2), keď H je nepravdivé, všimnite si, že podľa zákona veľkých čísel mi / n > pi pre n > ?, pre i = 1, …, r. Preto pre n > ?:

Táto hodnota sa rovná 0. Ak je teda H nesprávne, potom h2 >? (keď n > ?).

Z toho, čo bolo povedané, vyplýva, že H by sa malo zamietnuť, ak je hodnota h2 získaná v experimente príliš veľká. Tu, ako vždy, slová „príliš veľké“ znamenajú, že pozorovaná hodnota n2 presahuje kritickú hodnotu, ktorú v tomto prípade možno získať z tabuliek rozdelenia chí-kvadrát. Inými slovami, pravdepodobnosť P(p2 npi p2) je malá hodnota, a preto je nepravdepodobné, že by náhodne dostala rovnakú hodnotu ako v experimente alebo ešte väčšiu nezrovnalosť medzi frekvenčným vektorom a vektorom pravdepodobnosti.

Asymptotická povaha vety K. Pearsona, ktorá je základom tohto pravidla, si vyžaduje opatrnosť pri jej praktickom použití. Dá sa na to spoľahnúť len pri veľkom n. Na posúdenie, či je n dostatočne veľké, je potrebné vziať do úvahy pravdepodobnosti pi , …, pr . Nedá sa teda povedať, že napríklad sto pozorovaní bude stačiť, keďže veľké musí byť nielen n, ale ani súčin npi , …, npr (očakávané frekvencie) nesmú byť malé. Preto sa problém aproximácie ch2 (spojité rozdelenie) k štatistike ch2, ktorej rozdelenie je diskrétne, ukázal ako zložitý. Kombinácia teoretických a experimentálnych argumentov viedla k presvedčeniu, že táto aproximácia je použiteľná, ak sú všetky očakávané frekvencie npi>10. ak sa číslo r (počet rôznych výsledkov) zvýši, hranica pre sa zníži (na 5 alebo dokonca na 3, ak je r rádovo niekoľko desiatok). Na splnenie týchto požiadaviek je v praxi niekedy potrebné kombinovať viacero výstupov, t.j. prejdite na Bernoulliho schému s menším r.

Opísaná metóda kontroly zhody sa môže použiť nielen na Bernoulliho testy, ale aj na náhodné vzorky. Ich pozorovania musia byť najprv prevedené do Bernoulliho testov zoskupením. Robia to takto: pozorovací priestor sa rozdelí na konečný počet neprekrývajúcich sa oblastí a potom sa pre každú oblasť vypočíta pozorovaná frekvencia a hypotetická pravdepodobnosť.

V tomto prípade sa k vyššie uvedeným ťažkostiam aproximácie pridáva ešte jedna - voľba rozumného rozdelenia pôvodného priestoru. Zároveň treba dbať na to, aby vo všeobecnosti pravidlo na testovanie hypotézy o počiatočnom rozdelení vzorky bolo dostatočne citlivé na možné alternatívy. Nakoniec poznamenávam, že štatistické kritériá založené na redukcii na Bernoulliho schému spravidla neplatia pre všetky alternatívy. Takže tento spôsob overovania súhlasu má obmedzenú hodnotu.

Kolmogorov-Smirnov test dobrej zhody vo svojej klasickej forme je výkonnejší ako test h2 a možno ho použiť na testovanie hypotézy, že empirické rozdelenie zodpovedá akémukoľvek teoretickému spojitému rozdeleniu F(x) so známymi parametrami. Posledná okolnosť obmedzuje možnosť širokého praktického použitia tohto kritéria pri analýze výsledkov mechanických skúšok, pretože parametre distribučnej funkcie charakteristík mechanických vlastností sa spravidla odhadujú z údajov samotná vzorka.

Kritérium Kolmogorov-Smirnov sa používa pre nezoskupené údaje alebo pre zoskupené údaje v prípade malej šírky intervalu (napríklad rovnajúcej sa dieliku stupnice silomera, počítadla cyklov zaťaženia atď.). Nech je výsledkom testu série n vzoriek variačná séria charakteristík mechanických vlastností

x1? x2? ... ? xi? ... ? xn. (3,93)

Je potrebné otestovať nulovú hypotézu, že rozdelenie vzorky (3.93) patrí do teoretického zákona F(x).

Kolmogorovovo-Smirnovovo kritérium je založené na rozdelení maximálnej odchýlky akumulovaného partikula od hodnoty distribučnej funkcie. Pri jeho použití sa počítajú štatistiky

čo je štatistika Kolmogorovho testu. Ak nerovnosť

Dnvn? čelo (3,97)

pre veľké veľkosti vzoriek (n > 35) alebo

Dn(vn + 0,12 + 0,11/vn) ? čelo (3,98)

pre n? 35, nulová hypotéza nie je zamietnutá.

Ak nerovnosti (3,97) a (3,98) nie sú splnené, potom sa akceptuje alternatívna hypotéza, že vzorka (3,93) patrí do neznámeho rozdelenia.

Kritické hodnoty lb sú: л0,1 = 1,22; 10,05 = 1,36; 10,01 = 1,63.

Ak parametre funkcie F(x) nie sú vopred známe, ale sú odhadnuté zo vzorových údajov, Kolmogorovovo-Smirnovovo kritérium stráca svoju univerzálnosť a možno ho použiť len na kontrolu súladu experimentálnych údajov len s určitým špecifickým rozdelením. funkcie.

Ak sa použije ako nulová hypotéza, či experimentálne údaje patria do normálneho alebo log-normálneho rozdelenia, štatistika sa vypočíta:

kde Ц(zi) je hodnota Laplaceovej funkcie pre

Ц(zi) = (xi - xср)/s Kritérium Kolmogorov-Smirnov pre akúkoľvek veľkosť vzorky n je zapísané ako

Kritické hodnoty lb sú v tomto prípade: л0,1 = 0,82; 10,05 = 0,89; 10,01 = 1,04.

Ak sa overí hypotéza o zhode vzorky s *** exponenciálnym rozdelením, ktorého parameter sa odhaduje z experimentálnych údajov, vypočítajú sa podobné štatistiky:

kritérium empirická pravdepodobnosť

a tvoria Kolmogorovovo-Smirnovovo kritérium.

Kritické hodnoty lb pre tento prípad sú: λ0,1 = 0,99; 10,05 = 1,09; 10,01 = 1,31.

Na testovanie hypotézy o zhode empirického rozdelenia s teoretickým zákonom rozdelenia sa používajú špeciálne štatistické ukazovatele - kritériá dobrej zhody (alebo kritériá zhody). Patria sem kritériá Pearsona, Kolmogorova, Romanovského, Yastremského atď. Väčšina kritérií dobrej zhody je založená na použití odchýlok empirických frekvencií od teoretických. Je zrejmé, že čím menšie sú tieto odchýlky, tým lepšie sa teoretické rozdelenie zhoduje (alebo opisuje) s empirickým.

Kritériá súhlasu- toto sú kritériá na testovanie hypotéz o zhode empirického rozdelenia s teoretickým rozdelením pravdepodobnosti. Takéto kritériá sú rozdelené do dvoch tried: všeobecné a špeciálne. Všeobecné kritériá dobrej zhody sa vzťahujú na najvšeobecnejšiu formuláciu hypotézy, konkrétne na hypotézu, že pozorované výsledky súhlasia s akýmkoľvek a priori predpokladaným rozdelením pravdepodobnosti. Špeciálne testy dobrej zhody zahŕňajú špeciálne nulové hypotézy, ktoré formulujú súhlas s určitou formou rozdelenia pravdepodobnosti.

Kritériá dohody, založené na zavedenom distribučnom zákone, umožňujú určiť, kedy by sa nezrovnalosti medzi teoretickými a empirickými frekvenciami mali považovať za nevýznamné (náhodné) a kedy - významné (nenáhodné). Z toho vyplýva, že kritériá dobrej zhody umožňujú zamietnuť alebo potvrdiť správnosť hypotézy predloženej pri vyrovnávaní radu o povahe rozdelenia v empirickom rade a odpovedať, či je možné akceptovať model vyjadrený nejakým teoretickým distribučným zákonom pre dané empirické rozdelenie.

Pearsonov test dobrej zhody c 2 (chí-kvadrát) je jedným z hlavných kritérií vhodnosti. Navrhol ho anglický matematik Karl Pearson (1857-1936) na posúdenie náhodnosti (významnosti) nezrovnalostí medzi frekvenciami empirických a teoretických rozdelení:

Schéma uplatňovania kritéria c 2 na posúdenie konzistentnosti teoretického a empirického rozdelenia je takáto:

1. Stanoví sa vypočítaná miera nezrovnalosti.

2. Určí sa počet stupňov voľnosti.

3. Počet stupňov voľnosti n sa určí pomocou špeciálnej tabuľky.

4. Ak , potom pre danú hladinu významnosti α a počet stupňov voľnosti n je hypotéza nevýznamných (náhodných) nezrovnalostí zamietnutá. V opačnom prípade možno uznať, že hypotéza nie je v rozpore so získanými experimentálnymi údajmi a s pravdepodobnosťou (1 – α) možno tvrdiť, že nezrovnalosti medzi teoretickými a empirickými frekvenciami sú náhodné.

Úroveň významnosti je pravdepodobnosť chybného zamietnutia predloženej hypotézy, t.j. pravdepodobnosť, že správna hypotéza bude zamietnutá. V štatistických štúdiách sa v závislosti od dôležitosti a zodpovednosti riešených úloh používajú tieto tri úrovne významnosti:

1) a = 0,1, potom R = 0,9;

2) a = 0,05, potom R = 0,95;

3) a = 0,01, potom R = 0,99.

Pri použití kritéria zhody c 2 sa musia dodržať tieto podmienky:

1. Objem skúmanej populácie by mal byť dostatočne veľký ( N≥ 50), pričom frekvencia alebo veľkosť skupiny musí byť aspoň 5. Pri porušení tejto podmienky je potrebné najskôr zlúčiť malé frekvencie (menej ako 5).

2. Empirické rozdelenie by malo pozostávať z údajov získaných ako výsledok náhodného výberu, t.j. musia byť nezávislé.

Nevýhodou Pearsonovho kritéria dobrej zhody je strata niektorých počiatočných informácií spojených s potrebou zoskupovať výsledky pozorovaní do intervalov a kombinovať jednotlivé intervaly s malým počtom pozorovaní. V tejto súvislosti sa odporúča doplniť overenie zhody rozdelení podľa kritéria o 2 ďalšie kritériá. Je to potrebné najmä vtedy, keď je veľkosť vzorky relatívne malá ( n ≈ 100).

V štatistike Kolmogorovov test dobrej zhody(tiež známy ako Kolmogorov-Smirnov test dobrej zhody) sa používa na určenie, či dve empirické distribúcie dodržiavajú rovnaký zákon, alebo na určenie, či výsledná distribúcia vyhovuje navrhovanému modelu. Kolmogorovovo kritérium je založené na určení maximálneho rozdielu medzi akumulovanými frekvenciami alebo frekvenciami empirických alebo teoretických rozdelení. Kolmogorovovo kritérium sa vypočíta podľa týchto vzorcov:

kde D a d- respektíve maximálny rozdiel medzi akumulovanými frekvenciami ( ff¢) a medzi akumulovanými frekvenciami ( pp¢) empirické a teoretické rady rozdelení; N- počet jednotiek v populácii.

Po vypočítaní hodnoty λ špeciálna tabuľka určuje pravdepodobnosť, s ktorou možno tvrdiť, že odchýlky empirických frekvencií od teoretických sú náhodné. Ak znamienko nadobúda hodnoty do 0,3, znamená to, že existuje úplná zhoda frekvencií. Pri veľkom počte pozorovaní je Kolmogorovov test schopný odhaliť akúkoľvek odchýlku od hypotézy. To znamená, že akýkoľvek rozdiel medzi rozložením vzoriek a teoretickým sa s jeho pomocou zistí, ak existuje veľa pozorovaní. Praktický význam tejto vlastnosti nie je významný, pretože vo väčšine prípadov je ťažké počítať so získaním veľkého počtu pozorovaní za konštantných podmienok, teoretická predstava distribučného zákona, ktorému sa musí vzorka podriadiť, je vždy približná a presnosť štatistických kontrol by nemala presiahnuť presnosť zvoleného modelu.

Romanovského kritérium vhodnosti na základe použitia Pearsonovho kritéria, t.j. už nájdené hodnoty c 2 a počet stupňov voľnosti:

kde n je počet stupňov voľnosti variácie.

Romanovského kritérium je vhodné pri absencii tabuliek pre . Ak< 3, то расхождения распределений случайны, если же >3, potom nie sú náhodné a teoretické rozdelenie nemôže slúžiť ako model pre skúmané empirické rozdelenie.

B. S. Yastremsky použil v kritériu dobrej zhody nie počet stupňov voľnosti, ale počet skupín ( k), špeciálna hodnota q v závislosti od počtu skupín a hodnota chí-kvadrát. Yastremského kritérium súhlasu má rovnaký význam ako Romanovského kritérium a je vyjadrené vzorcom

kde c 2 - Pearsonovo kritérium zhody; - počet skupín; q - koeficient, pre počet skupín menší ako 20 rovný 0,6.

Ak L fakt > 3, nezrovnalosti medzi teoretickým a empirickým rozdelením nie sú náhodné, t.j. empirické rozdelenie nespĺňa požiadavky normálneho rozdelenia. Ak L skutočnosť< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.

Spracovaním nezávislých meraní náhodnej veličiny ξ môžeme zostrojiť štatistickú distribučnú funkciu F*(x). Podľa tvaru tejto funkcie možno prijať hypotézu, že skutočná teoretická distribučná funkcia je F(x). Samotné nezávislé merania (x 1 , x 2 ,…,x n) tvoriace vzorku možno považovať za identicky rozdelené náhodné premenné s hypotetickou distribučnou funkciou F(x).

Je zrejmé, že medzi funkciami F * (x) a F (x) budú určité nezrovnalosti. Vzniká otázka, či sú tieto nezrovnalosti dôsledkom obmedzenej veľkosti vzorky alebo súvisia s tým, že naša hypotéza nie je správna, t.j. skutočná distribučná funkcia nie je F(x), ale nejaká iná. Na vyriešenie tohto problému sa používajú kritériá súhlasu, ktorých podstata je nasledovná. Je zvolená určitá hodnota Δ(F, F *), ktorá charakterizuje mieru nesúladu medzi funkciami F * (x) a F(x). Napríklad Δ(F, F *)=Sup|F(x)-F * (x)|, t.j. horná hranica v x modulu rozdielu.

Za predpokladu, že hypotéza je správna, t.j. ak poznáme distribučnú funkciu F(x), môžeme nájsť distribučný zákon náhodnej premennej Δ(F, F *) (otázkou, ako to urobiť, sa nebudeme dotýkať). Nastavme číslo p 0 také malé, že realizáciu udalosti (Δ(F, F *)>Δ 0 ) s touto pravdepodobnosťou budeme považovať za prakticky nemožnú. Zo stavu

nájdite hodnotu Δ 0 . Tu f(x) je hustota distribúcie Δ(F,F *).

Vypočítajme teraz z výsledkov hodnotu Δ(F, F *)= Δ 1

vzorky, t.j. nájdite jednu z možných hodnôt náhodnej premennej Δ(F, F *). Ak Δ 1 ≥Δ 0 , potom to znamená, že nastala takmer nemožná udalosť. Dá sa to vysvetliť tým, že naša hypotéza nie je správna. Takže, ak Δ 1 ≥Δ 0, potom je hypotéza zamietnutá, a keď Δ 1<Δ 0 , гипотеза может оказаться неверной, но вероятность этого мала.

Ako miera diskrepancie Δ(F, F *) možno použiť rôzne hodnoty. V závislosti od toho sa získajú rôzne kritériá dohody. Napríklad Kolmogorov, Mises, Pearsonov test dobrej zhody alebo chí-kvadrát test.

Nech sú výsledky n meraní prezentované ako zoskupené štatistické rady s k číslicami.

VYBITIE (x 0 ,x 1) (v skutočnosti predpokladáme, že chyby merania sú v určitom segmente rozložené rovnomerne). Potom sa pravdepodobnosť zasiahnutia každej zo siedmich číslic bude rovnať . Pomocou zoskupeného radu z §11 vypočítame Δ(F, F *)= Δ 1 =podľa vzorca (1). V tomto prípade .

Keďže zákon o hypotetickom rozdelení obsahuje dva neznáme parametre, α a β - začiatok a koniec segmentu, počet stupňov voľnosti bude 7-1-2=4. Podľa tabuľky rozdelenia chí-kvadrát so zvolenou pravdepodobnosťou p 0 =10 -3 nájdeme Δ 0 =18. Pretože Δ 1 >Δ 0 , potom bude musieť byť hypotéza rovnomerného rozdelenia chyby merania zavrhnutá.