Atbilstības kritēriji statistikas inovāciju tehnoloģijās. Pīrsona piemērotības tests

Šajā sadaļā mēs apskatīsim vienu no jautājumiem, kas saistīti ar hipotēžu iespējamības pārbaudi, proti, teorētisko un statistisko sadalījumu konsekvences jautājumu.

Pieņemsim, ka dotais statistiskais sadalījums ir saplacināts ar kādu teorētisku līkni f(x)(7.6.1. att.). Neatkarīgi no tā, cik labi tiek izvēlēta teorētiskā līkne, dažas neatbilstības starp to un statistisko sadalījumu ir neizbēgamas. Protams, rodas jautājums: vai šīs neatbilstības ir radušās tikai nejaušu apstākļu dēļ, kas saistīti ar ierobežotu novērojumu skaitu, vai arī tās ir nozīmīgas un ir saistītas ar faktu, ka mūsu izvēlētā līkne pareizi neizlīdzina šo statistisko sadalījumu. Lai atbildētu uz šo jautājumu, tiek izmantoti tā sauktie "piekrišanas kritēriji".

NEJAUŠU MAINĪGO SADALES LIKUMI



Piemērotības kritēriju piemērošanas ideja ir šāda.

Pamatojoties uz šo statistikas materiālu, mums ir jāpārbauda hipotēze H, kas sastāv no tā, ka nejaušais mainīgais X ievēro kādu noteiktu sadales likumu. Šo likumu var dot vienā vai otrā veidā: piemēram, sadales funkcijas veidā F(x) vai sadalījuma blīvuma veidā f(x), vai varbūtību kopas veidā p t , kur pt- varbūtība, ka vērtība X iekritīs iekšā l kaut ko izlāde.

Tā kā no šīm formām sadales funkcija F(x) ir visvispārīgākais un nosaka jebkuru citu, mēs formulēsim hipotēzi H, kā sastāv no tā, ka vērtība X ir sadalījuma funkcija ^(d :).

Lai pieņemtu vai noraidītu hipotēzi H, apsveriet kādu daudzumu tu, raksturojot neatbilstības pakāpi starp teorētiskajiem un statistiskajiem sadalījumiem. Vērtība U var izvēlēties dažādos veidos; piemēram, kā U var ņemt teorētisko varbūtību noviržu kvadrātā summu pt no atbilstošajām frekvencēm R* vai to pašu kvadrātu summa ar dažiem koeficientiem (“svariem”), vai statistiskā sadalījuma funkcijas maksimālā novirze F*(x) no teorētiskā F(x) utt. Pieņemsim, ka daudzums U tā vai citādi izvēlēta. Acīmredzot, ir daži nejauša vērtība.Šī gadījuma lieluma sadalījuma likums ir atkarīgs no nejaušā lieluma sadalījuma likuma x, ar kuriem tika veikti eksperimenti, un no eksperimentu skaita P. Ja hipotēze H ir taisnība, tad daudzuma sadales likums U nosaka daudzuma sadales likums X(funkcija F(x)) un numurs P.

Pieņemsim, ka šis sadales likums mums ir zināms. Šīs eksperimentu sērijas rezultātā tika konstatēts, ka pasākums, kuru esam izvēlējušies



PIEKRĪŠANAS KRITĒRIJI


neatbilstības U ieguva zināmu vērtību a. Jautājums ir, vai to var izskaidrot ar nejaušiem cēloņiem, vai arī šī neatbilstība ir pārāk liela un norāda uz būtisku atšķirību starp teorētisko un statistisko sadalījumu un līdz ar to uz hipotēzes nepiemērotību. H? Lai atbildētu uz šo jautājumu, pieņemsim, ka hipotēze H ir pareizs, un saskaņā ar šo pieņēmumu mēs aprēķinām varbūtību, ka nejaušu iemeslu dēļ, kas saistīti ar nepietiekamu eksperimentālā materiāla daudzumu, neatbilstības mērs U būs ne mazāka par vērtību, ko mēs novērojām eksperimentā un, i., mēs aprēķinām notikuma iespējamību:

Ja šī varbūtība ir ļoti maza, tad hipotēze H jānoraida kā ne pārāk ticams; ja šī varbūtība ir nozīmīga, jāatzīst, ka eksperimentālie dati nav pretrunā ar hipotēzi N.

Rodas jautājums, kādā veidā būtu jāizvēlas neatbilstības mērs £/? Izrādās, ka dažiem tā izvēles veidiem ir daudzuma sadalījuma likums U ir ļoti vienkāršas īpašības un pietiekami lielam P praktiski neatkarīgi no funkcijas F(x). Tieši šādus nesakritības mērus matemātiskajā statistikā izmanto kā vienošanās kritērijus.

Apskatīsim vienu no visbiežāk izmantotajiem vienošanās kritērijiem - tā saukto "kritēriju pie?" Pīrsons.

Pieņemsim, ka ir neatkarīgi eksperimenti, kuros katrā ir nejaušais mainīgais X ieguva noteiktu vērtību. Eksperimentu rezultāti ir apkopoti k cipariem un tiek uzrādītas statistikas rindas veidā.

Null(pamata) izsauc izvirzīto hipotēzi par nezināmā sadalījuma formu vai par zināmo sadalījumu parametriem. sacenšas (alternatīva) sauc par hipotēzi, kas ir pretrunā ar nulli.

Piemēram, ja nulles hipotēze ir pieņemt, ka nejaušais mainīgais X tiek sadalīts saskaņā ar likumu , tad konkurējošā hipotēze var sastāvēt no pieņēmuma , ka nejaušais mainīgais X izplatīta saskaņā ar citu likumu.

Statistiskais kritērijs(vai vienkārši kritērijs) sauc par kādu nejaušu mainīgo Uz, kas kalpo nulles hipotēzes pārbaudei.

Pēc noteikta kritērija izvēles, piemēram, kritērijs , visu tā iespējamo vērtību kopa tiek sadalīta divās apakškopās, kas nepārklājas: viena no tām satur kritērija vērtības, saskaņā ar kurām nulles hipotēze tiek noraidīta, bet otrā - saskaņā ar kas ir pieņemts.

Kritiskā zona ir testa vērtību kopa, kurai nulles hipotēze tiek noraidīta. Hipotēzes pieņemšanas joma sauc par kritērija vērtību kopu, saskaņā ar kuru tiek pieņemta hipotēze. kritiskie punkti tiek saukti punkti, kas atdala kritisko apgabalu no nulles hipotēzes pieņemšanas zonas.

Mūsu piemērā ar vērtību no parauga aprēķinātā vērtība atbilst hipotēzes pieņemšanas zonai: nejaušais mainīgais tiek sadalīts saskaņā ar likumu . Ja aprēķinātā vērtība , tad tā ietilpst kritiskajā apgabalā, tas ir, hipotēze par nejauša lieluma sadalījumu saskaņā ar likumu tiek noraidīta.

Sadalījuma gadījumā kritisko reģionu nosaka nevienlīdzība, nulles hipotēzes pieņemšanas apgabalu nosaka nevienlīdzība.

2.6.3. Labestības kritēriji Pīrsons.

Viens no zootehnikas un veterinārās ģenētikas uzdevumiem ir jaunu šķirņu un sugu audzēšana ar nepieciešamajām īpašībām. Piemēram, paaugstināta imunitāte, izturība pret slimībām vai kažokādas krāsas maiņa.

Praksē, analizējot rezultātus, bieži vien izrādās, ka faktiskie rezultāti vairāk vai mazāk atbilst kādam teorētiskam sadalījuma likumam. Ir nepieciešams novērtēt faktisko (empīrisko) un teorētisko (hipotētisko) datu atbilstības pakāpi. Lai to izdarītu, izvirziet nulles hipotēzi: iegūtā populācija tiek sadalīta saskaņā ar likumu "A". Hipotēzes par ierosināto sadalījuma likumu pārbaude tiek veikta, izmantojot īpaši izvēlētu gadījuma lielumu - atbilstības kritēriju.

Atbilstības kritērijs sauca par nezināmā sadalījuma iespējamā likuma hipotēzes pārbaudes kritēriju.

Ir vairāki piemērotības kritēriji: Pīrsons, Kolmogorovs, Smirnovs utt. Visbiežāk izmantotais ir Pīrsona piemērotības tests.

Apsveriet Pīrsona kritērija piemērošanu vispārējās populācijas normālā sadalījuma likuma hipotēzes pārbaudes piemērā. Šim nolūkam salīdzināsim empīriskās un teorētiskās (kas aprēķinātas normālā sadalījuma turpinājumā) frekvences.

Parasti pastāv zināma atšķirība starp teorētiskajām un empīriskajām frekvencēm. Piemēram:

Empīriskās frekvences 7 15 41 93 113 84 25 13 5

Teorētiskās frekvences 5 13 36 89 114 91 29 14 6

Apsveriet divus gadījumus:

Teorētiskās un empīriskās frekvences neatbilstība ir nejauša (nenozīmīga), t.i. iespējams izteikt priekšlikumu par empīrisko frekvenču sadalījumu pēc parastā likuma;

Teorētiskās un empīriskās frekvences neatbilstība nav nejauša (būtiska), t.i. teorētiskās frekvences tiek aprēķinātas, pamatojoties uz nepareizu hipotēzi par vispārējās populācijas normālo sadalījumu.

Ar Pīrsona piemērotības kritērija palīdzību ir iespējams nejauši vai nejauši noteikt neatbilstību starp teorētiskajām un empīriskajām frekvencēm, t.i. ar noteiktu ticamības varbūtību, lai noteiktu, vai vispārējā populācija ir sadalīta saskaņā ar parasto likumu vai nē.

Tātad, iegūstiet empīrisko sadalījumu n izmēra paraugam:

Iespējas……

Empīriskās frekvences……

Pieņemsim, ka, pieņemot normālu sadalījumu, tiek aprēķinātas teorētiskās frekvences. Nozīmīguma līmenī ir jāpārbauda nulles hipotēze: populācija ir normāli sadalīta.

Kā kritēriju nulles hipotēzes pārbaudei mēs ņemam gadījuma lielumu

(*)

Šī vērtība ir nejauša, jo dažādos eksperimentos tā iegūst dažādas, iepriekš nezināmas vērtības. Skaidrs, ka, jo mazāk atšķiras empīriskās un teorētiskās frekvences, jo mazāka ir kritērija vērtība un līdz ar to tas zināmā mērā raksturo empīriskā un teorētiskā sadalījuma tuvumu.

Ir pierādīts, ka pie , gadījuma lieluma (*) sadalījuma likums neatkarīgi no tā, kuram sadalījuma likumam ir pakļauta vispārējā populācija, tiecas uz sadalījuma likumu ar brīvības pakāpēm. Tāpēc nejaušais mainīgais (*) tiek apzīmēts ar , un pats kritērijs tiek saukts par “hī kvadrāta” atbilstības testu.

No novērojumu datiem aprēķinātā kritērija vērtību apzīmēsim kā . Tabulā norādītās kritērija kritiskās vērtības noteiktam nozīmīguma līmenim un brīvības pakāpju skaitam apzīmē . Šajā gadījumā brīvības pakāpju skaitu nosaka no vienādības , kur izlases vai klašu grupu (daļējo intervālu) skaits; - piedāvātā sadalījuma parametru skaits. Normālajam sadalījumam ir divi parametri - matemātiskā prognoze un standarta novirze. Tāpēc brīvības pakāpju skaits normālam sadalījumam tiek atrasts no vienādības

Ja aprēķinātā vērtība un tabulas vērtība apmierina nevienlīdzību , tiek pieņemta nulles hipotēze par vispārējās populācijas normālo sadalījumu. Ja , nulles hipotēze tiek noraidīta un tiek pieņemta tai alternatīvā hipotēze (vispārējā populācija nav sadalīta saskaņā ar parasto likumu).

komentēt. Izmantojot Pīrsona piemērotības testu, izlases lielumam ir jābūt vismaz 30. Katrā grupā ir jābūt vismaz 5 opcijām. Ja grupās ir mazāk par 5 frekvencēm, tās tiek apvienotas ar blakus grupām.

Parasti brīvības pakāpju skaits hī kvadrāta sadalījumam tiek definēts kā kopējais vērtību skaits, no kurām tiek aprēķināti attiecīgie mērījumi, atskaitot to nosacījumu skaitu, kas saista šīs vērtības, t.i. samazināt to atšķirību iespējamību. Vienkāršākajos gadījumos, aprēķinot, brīvības pakāpju skaits būs vienāds ar klašu skaitu, kas samazināts par vienu. Tā, piemēram, ar dihibrīda sadalīšanu tiek iegūtas 4 klases, bet tikai pirmā klase tiek iegūta nesaistīta, nākamās jau ir saistītas ar iepriekšējām. Tāpēc dihibrīda sadalīšanai brīvības pakāpju skaits ir .

1. piemērs Noteikt atbilstības pakāpi starp faktisko grupu sadalījumu tuberkulozes govju skaita ziņā un teorētiski paredzamo, kas tika aprēķināts, ņemot vērā normālo sadalījumu. Sākotnējie dati ir apkopoti tabulā:

Risinājums.

Atbilstoši nozīmīguma pakāpei un brīvības pakāpju skaitam no kritisko sadalījuma punktu tabulas (skat. 4. pielikumu) atrodam vērtību . Tāpēc ka , mēs varam secināt, ka atšķirība starp teorētiskajām un faktiskajām frekvencēm ir nejauša. Tādējādi faktiskais grupu sadalījums pēc tuberkulozes govju skaita atbilst teorētiski sagaidāmajam.

2. piemērs Teorētiskais sadalījums pēc īpatņu fenotipiem, kas iegūti otrajā paaudzē ar trušu dihibrīdo krustošanu pēc Mendeļa likuma ir 9: 3: 3: 1. Nepieciešams aprēķināt trušu empīriskā sadalījuma atbilstību, krustojot melnus īpatņus ar normālu apmatojumu. ar pūkainiem dzīvniekiem - albīniem. Krustojot otrajā paaudzē, iegūti 120 pēcnācēji, tai skaitā 45 melni ar īsspalvu, 30 melni pūkaini, 25 balti ar īsspalvu, 20 balti pūkaini truši.

Risinājums. Teorētiski paredzamajai segregācijai pēcnācējos jāatbilst četru fenotipu attiecībai (9:3:3:1). Aprēķiniet katras klases teorētisko biežumu (mērķu skaitu):

9+3+3+1=16, tātad varam sagaidīt, ka melni īsspalvaini būs ; melna pūka - ; balts īsspalvainais ; balts pūkains -.

Empīriskais (faktiskais) fenotipiskais sadalījums bija šāds: 45; trīsdesmit; 25; divdesmit.

Apkoposim visus šos datus šajā tabulā:

Izmantojot Pīrsona piemērotības testu, mēs aprēķinām vērtību:

Brīvības pakāpju skaits dihibrīda krustojumā. Par nozīmīguma līmeni atrast vērtību . Tāpēc ka , mēs varam secināt, ka atšķirība starp teorētiskajām un faktiskajām frekvencēm nav nejauša. Līdz ar to iegūtā trušu grupa fenotipu sadalījuma ziņā atšķiras no Mendeļa likuma dihibrīda krustošanās laikā un atspoguļo noteiktu faktoru ietekmi, kas maina fenotipa šķelšanās veidu otrajā hibrīdu paaudzē.

Pīrsona hī kvadrāta piemērotības testu var izmantot arī, lai salīdzinātu divus viendabīgus empīriskus sadalījumus savā starpā, t.i. tiem, kuriem ir vienādas klases robežas. Nulles hipotēze ir hipotēze, ka divas nezināmas sadalījuma funkcijas ir vienādas. Hī kvadrāta testu šādos gadījumos nosaka pēc formulas

(**)

kur un ir salīdzināto sadalījumu apjomi; un ir atbilstošo klašu frekvences.

Apsveriet divu empīrisku sadalījumu salīdzinājumu, izmantojot šādu piemēru.

3. piemērs Dzeguzes olu garums tika mērīts divās teritoriālajās zonās. Pirmajā zonā tika pārbaudīts 76 olu paraugs (), bet otrajā - 54 (). Tiek iegūti šādi rezultāti:

Garums (mm)
Frekvences
Frekvences - - -

Nozīmīguma līmenī ir jāpārbauda nulles hipotēze, ka abi olu paraugi pieder vienai un tai pašai dzegužu populācijai.

Ievads

Šīs tēmas aktualitāte ir tāda, ka, pētot biostatistikas pamatus, mēs pieņēmām, ka ir zināms vispārējās populācijas sadalījuma likums. Bet ko darīt, ja sadalījuma likums nav zināms, bet ir pamats pieņemt, ka tam ir noteikta forma (sauksim to par A), tad tiek pārbaudīta nulles hipotēze: vispārējā populācija tiek sadalīta pēc likuma A. Šī hipotēze tiek pārbaudīta izmantojot speciāli izvēlētu gadījuma lielumu – saskaņošanas kritēriju.

Piemērotības testi ir kritēriji hipotēžu pārbaudei par empīriskā sadalījuma atbilstību teorētiskajam varbūtības sadalījumam. Šie kritēriji iedalās divās kategorijās:

  • III Vispārīgie atbilstības kritēriji attiecas uz hipotēzes vispārīgāko formulējumu, proti, hipotēzi, ka novērotie rezultāti sakrīt ar jebkuru a priori pieņemto varbūtības sadalījumu.
  • III Speciālie piemērotības testi ietver īpašas nulles hipotēzes, kas formulē sakritību ar noteiktu varbūtības sadalījuma formu.

Labestības kritēriji

Visizplatītākie piemērotības testi ir omega kvadrāts, hī kvadrāts, Kolmogorovs un Kolmogorovs-Smirnovs.

Plaši tiek izmantoti neparametriskie saskaņošanas testi Kolmogorovs, Smirnovs, omega kvadrāts. Taču tās ir saistītas arī ar plaši izplatītām kļūdām statistikas metožu pielietošanā.

Fakts ir tāds, ka uzskaitītie kritēriji tika izstrādāti, lai pārbaudītu līgumu ar pilnībā zināmu teorētisko sadalījumu. Plaši tiek izmantotas aprēķinu formulas, sadalījumu tabulas un kritiskās vērtības. Kolmogorova, omega kvadrāta un līdzīgu kritēriju galvenā ideja ir izmērīt attālumu starp empīrisko sadalījuma funkciju un teorētisko sadalījuma funkciju. Šie kritēriji atšķiras ar attālumu formu sadalījuma funkciju telpā.

Pīrsona p2 piemērotības testi vienkāršai hipotēzei

K. Pīrsona teorēma attiecas uz neatkarīgiem izmēģinājumiem ar ierobežotu iznākumu skaitu, t.i. uz Bernulli izmēģinājumiem (nedaudz paplašinātā nozīmē). Tas ļauj spriest, vai novērojumi daudzos izmēģinājumos par šo iznākumu biežumu atbilst to aplēstajām varbūtībām.

Daudzās praktiskās problēmās precīzs sadales likums nav zināms. Tāpēc tiek izvirzīta hipotēze par esošā empīriskā likuma, kas veidota uz novērojumu pamata, atbilstību kādam teorētiskam. Šai hipotēzei ir nepieciešams statistiskais tests, kura rezultāti tiks vai nu apstiprināti, vai atspēkoti.

Pieņemsim, ka X ir pētāmais gadījuma lielums. Jāpārbauda hipotēze H0, ka šis nejaušais lielums atbilst sadalījuma likumam F(x). Lai to izdarītu, ir nepieciešams izveidot n neatkarīgu novērojumu paraugu un no tā izveidot empīrisko sadalījuma likumu F "(x). Lai salīdzinātu empīriskos un hipotētiskos likumus, tiek izmantots noteikums, ko sauc par atbilstības kritēriju. Viens no visvairāk populārs ir K. Pīrsona hī kvadrāta atbilstības tests. Tajā tiek aprēķināta hī kvadrāta statistika:

kur N ir intervālu skaits, saskaņā ar kuriem tika izveidots empīriskais sadalījuma likums (atbilstošās histogrammas kolonnu skaits), i ir intervāla numurs, pt i ir varbūtība, ka nejaušā lieluma vērtība iekritīs i-tais intervāls teorētiskajam sadalījuma likumam, pe i ir varbūtība, ka nejaušā lieluma vērtība iekritīs empīriskā sadalījuma likuma i-tajā intervālā. Tam ir jāievēro hī kvadrāta sadalījums.

Ja statistikas aprēķinātā vērtība pārsniedz hī kvadrāta sadalījuma kvantili ar k-p-1 brīvības pakāpēm noteiktam nozīmīguma līmenim, tad H0 hipotēze tiek noraidīta. Pretējā gadījumā tas tiek ņemts noteiktā nozīmes līmenī. Šeit k ir novērojumu skaits, p ir sadalījuma likuma aprēķināto parametru skaits.

Apskatīsim statistiku:

Vienkāršai hipotēzei p2 statistiku sauc par Pīrsona hī kvadrāta statistiku.

Ir skaidrs, ka p2 ir kāda attāluma kvadrāts starp diviem r-dimensijas vektoriem: relatīvo frekvences vektoru (mi /n, …, mr /n) un varbūtības vektoru (pi , …, pr). Šis attālums atšķiras no Eiklīda attāluma tikai ar to, ka tajā ievada dažādas koordinātas ar dažādu svaru.

Apspriedīsim h2 statistikas uzvedību gadījumā, ja hipotēze H ir patiesa un gadījumā, ja H ir nepatiesa. Ja H ir patiess, tad ch2 asimptotiskā uzvedība n > ? norāda K. Pīrsona teorēmu. Lai saprastu, kas notiek ar (2.2), ja H ir nepatiess, ņemiet vērā, ka saskaņā ar lielu skaitļu likumu mi /n > pi, ja n > ?, ja i = 1, …, r. Tāpēc n > ?:

Šī vērtība ir vienāda ar 0. Tāpēc, ja H ir nepareizs, tad h2 >? (kad n >?).

No teiktā izriet, ka H ir jānoraida, ja eksperimentā iegūtā h2 vērtība ir pārāk liela. Šeit, kā vienmēr, vārdi "pārāk liels" nozīmē, ka novērotā n2 vērtība pārsniedz kritisko vērtību, ko šajā gadījumā var ņemt no hī kvadrāta sadalījuma tabulām. Citiem vārdiem sakot, varbūtība P(p2 npi p2) ir maza vērtība, un tāpēc maz ticams, ka tā nejauši iegūs tādu pašu kā eksperimentā vai vēl lielāku neatbilstību starp frekvences vektoru un varbūtības vektoru.

Šī noteikuma pamatā esošās K. Pīrsona teorēmas asimptotiskais raksturs prasa piesardzību tās praktiskajā lietošanā. Uz to var paļauties tikai uz lieliem n. Lai spriestu, vai n ir pietiekami liels, jāņem vērā varbūtības pi , …, pr . Tāpēc nevar teikt, ka, piemēram, pietiks ar simts novērojumiem, jo ​​ne tikai n jābūt lielam, bet arī reizinājumiem npi , …, npr (paredzamās frekvences) nedrīkst būt mazi. Tāpēc ch2 (nepārtrauktā sadalījuma) tuvināšana statistikai ch2, kuras sadalījums ir diskrēts, izrādījās sarežģīta. Teorētisku un eksperimentālu argumentu kombinācija radīja pārliecību, ka šī tuvināšana ir piemērojama, ja visas paredzamās frekvences ir npi> 10. ja skaitlis r (dažādu iznākumu skaits) palielinās, limits for tiek pazemināts (līdz 5 vai pat līdz 3, ja r ir vairāki desmiti). Lai izpildītu šīs prasības, praksē dažkārt ir nepieciešams apvienot vairākus rezultātus, t.i. dodieties uz Bernulli shēmu ar mazāku r.

Aprakstīto sakritības pārbaudes metodi var piemērot ne tikai Bernulli testiem, bet arī izlases veida paraugiem. Viņu novērojumi vispirms jāpārvērš Bernulli testos, grupējot. Viņi to dara šādi: novērošanas telpa tiek sadalīta ierobežotā skaitā nepārklājošu reģionu, un tad katram reģionam tiek aprēķināta novērotā biežums un hipotētiskā varbūtība.

Šajā gadījumā iepriekš uzskaitītajām tuvināšanas grūtībām tiek pievienota vēl viena - sākotnējās telpas saprātīga nodalījuma izvēle. Tajā pašā laikā ir jāraugās, lai kopumā hipotēzes pārbaudes noteikums par izlases sākotnējo sadalījumu būtu pietiekami jutīgs pret iespējamām alternatīvām. Visbeidzot, es atzīmēju, ka statistikas kritēriji, kuru pamatā ir samazinājums uz Bernulli shēmu, parasti nav derīgi attiecībā uz visām alternatīvām. Tāpēc šai piekrišanas pārbaudes metodei ir ierobežota vērtība.

Kolmogorova-Smirnova piemērotības tests tā klasiskajā formā ir spēcīgāks par h2 testu, un to var izmantot, lai pārbaudītu hipotēzi, ka empīriskais sadalījums atbilst jebkuram teorētiskam nepārtrauktam sadalījumam F(x) ar zināmiem parametriem. Pēdējais apstāklis ​​ierobežo iespēju plaši praktiski pielietot šo kritēriju mehānisko pārbaužu rezultātu analīzē, jo mehānisko īpašību raksturlielumu sadalījuma funkcijas parametri parasti tiek novērtēti no pats paraugs.

Kolmogorova-Smirnova kritēriju izmanto negrupētiem datiem vai grupētiem datiem maza intervāla platuma gadījumā (piemēram, vienāds ar spēka mērītāja, slodzes ciklu skaitītāja skalas iedalījumu utt.). Lai n paraugu sērijas testa rezultāts ir mehānisko īpašību raksturlielumu variāciju sērija

x1? x2? ... ? xi? ... ? xn. (3,93)

Nepieciešams pārbaudīt nulles hipotēzi, ka izlases sadalījums (3.93) pieder teorētiskajam likumam F(x).

Kolmogorova-Smirnova kritērija pamatā ir uzkrātās partitūras maksimālās novirzes sadalījums no sadalījuma funkcijas vērtības. Izmantojot to, tiek aprēķināta statistika

kas ir Kolmogorova testa statistika. Ja nevienlīdzība

Dnvn? piere (3,97)

lieliem paraugu izmēriem (n > 35) vai

Dn(vn + 0,12 + 0,11/vn) ? piere (3,98)

par n? 35, nulles hipotēze netiek noraidīta.

Ja nevienādības (3.97) un (3.98) nav izpildītas, tad tiek pieņemta alternatīvā hipotēze, ka izlase (3.93) pieder nezināmam sadalījumam.

Lb kritiskās vērtības ir: л0,1 = 1,22; l0,05 = 1,36; l0,01 = 1,63.

Ja funkcijas F(x) parametri nav zināmi iepriekš, bet tiek novērtēti pēc izlases datiem, Kolmogorova-Smirnova kritērijs zaudē savu universālumu un ar to var tikai pārbaudīt eksperimentālo datu atbilstību tikai kādam konkrētam sadalījumam. funkcijas.

Ja to izmanto kā nulles hipotēzi, neatkarīgi no tā, vai eksperimentālie dati pieder normālam vai log-normālam sadalījumam, statistiku aprēķina:

kur Ц(zi) ir Laplasa funkcijas vērtība

Ц(zi) = (xi - xср)/s Kolmogorova-Smirnova kritēriju jebkuram izlases lielumam n raksta kā

Lb kritiskās vērtības šajā gadījumā ir: л0,1 = 0,82; l0,05 = 0,89; l0,01 = 1,04.

Ja tiek pārbaudīta hipotēze par izlases atbilstību *** eksponenciālajam sadalījumam, kura parametrs tiek novērtēts no eksperimentāliem datiem, tiek aprēķināta līdzīga statistika:

kritērijs empīriskā varbūtība

un veido Kolmogorova-Smirnova kritēriju.

Lb kritiskās vērtības šajā gadījumā ir: λ0,1 = 0,99; l0,05 = 1,09; l0,01 = 1,31.

Lai pārbaudītu hipotēzi par empīriskā sadalījuma atbilstību teorētiskajam sadalījuma likumam, tiek izmantoti īpaši statistikas rādītāji - piemērotības kritēriji (jeb atbilstības kritēriji). Tie ietver Pīrsona, Kolmogorova, Romanovska, Jastremska uc kritērijus. Lielākā daļa atbilstības kritēriju ir balstīti uz empīrisko frekvenču noviržu izmantošanu no teorētiskajām. Acīmredzot, jo mazākas šīs novirzes, jo labāk teorētiskais sadalījums sakrīt (vai apraksta) empīrisko.

Piekrišanas kritēriji- tie ir kritēriji hipotēžu pārbaudei par empīriskā sadalījuma atbilstību teorētiskajam varbūtības sadalījumam. Šādi kritēriji ir sadalīti divās klasēs: vispārīgie un īpašie. Vispārējie atbilstības kritēriji attiecas uz hipotēzes vispārīgāko formulējumu, proti, uz hipotēzi, ka novērotie rezultāti sakrīt ar jebkuru a priori pieņemto varbūtības sadalījumu. Īpaši piemērotības testi ietver īpašas nulles hipotēzes, kas formulē sakritību ar noteiktu varbūtības sadalījuma formu.

Vienošanās kritēriji, balstoties uz noteikto sadales likumu, ļauj noteikt, kad neatbilstības starp teorētiskajām un empīriskajām frekvencēm atzīstamas par nenozīmīgām (nejaušas), bet kad par būtiskām (negadījuma rakstura). No tā izriet, ka atbilstības kritēriji ļauj noraidīt vai apstiprināt hipotēzes pareizību, kas izvirzīta, nivelējot rindas par sadalījuma raksturu empīriskajā sērijā, un atbildēt, vai ir iespējams pieņemt modelis, kas izteikts ar kādu teorētisku sadalījuma likumu noteiktam empīriskam sadalījumam.

Pīrsona piemērotības tests c 2 (hī kvadrāts) ir viens no galvenajiem piemērotības kritērijiem. Angļu matemātiķa Karla Pīrsona (1857-1936) ierosinājums novērtēt empīrisko un teorētisko sadalījumu biežuma neatbilstību nejaušību (nozīmību):

Shēma c 2 kritērija piemērošanai, lai novērtētu teorētisko un empīrisko sadalījumu konsekvenci, ir šāda:

1. Tiek noteikts aprēķinātais neatbilstības mērs.

2. Noteikts brīvības pakāpju skaits.

3. Brīvības pakāpju skaitu n nosaka, izmantojot īpašu tabulu.

4. Ja , tad noteiktam nozīmīguma līmenim α un brīvības pakāpju skaitam n, hipotēze par neatbilstību nenozīmīgumu (nejaušību) tiek noraidīta. Pretējā gadījumā hipotēzi var atzīt par nepretrunīgu ar iegūtajiem eksperimentālajiem datiem, un ar varbūtību (1 – α) var apgalvot, ka neatbilstības starp teorētiskajām un empīriskajām frekvencēm ir nejaušas.

Nozīmes līmenis ir izvirzītās hipotēzes kļūdainas noraidīšanas varbūtība, t.i. varbūtība, ka pareizā hipotēze tiks noraidīta. Statistikas pētījumos atkarībā no risināmo uzdevumu svarīguma un atbildības tiek izmantoti šādi trīs nozīmīguma līmeņi:

1) a = 0,1, tad R = 0,9;

2) a = 0,05, tad R = 0,95;

3) a = 0,01, tad R = 0,99.

Izmantojot atbilstības kritēriju c 2 , ir jāievēro šādi nosacījumi:

1. Pētītās populācijas apjomam jābūt pietiekami lielam ( N≥ 50), savukārt grupas biežumam vai lielumam jābūt vismaz 5. Ja šis nosacījums tiek pārkāpts, vispirms ir jāapvieno mazas frekvences (mazākas par 5).

2. Empīriskais sadalījums jāsastāv no datiem, kas iegūti nejaušās atlases rezultātā, t.i. tiem jābūt neatkarīgiem.

Pīrsona piemērotības kritērija trūkums ir daļa no sākotnējās informācijas, kas saistīta ar nepieciešamību grupēt novērojumu rezultātus intervālos un apvienot atsevišķus intervālus ar nelielu novērojumu skaitu. Šajā sakarā ir ieteicams papildināt sadalījumu atbilstības pārbaudi atbilstoši kritērijam ar 2 citiem kritērijiem. Tas ir īpaši nepieciešams, ja izlases lielums ir salīdzinoši mazs ( n ≈ 100).

Statistikā Kolmogorova piemērotības tests(pazīstams arī kā Kolmogorova-Smirnova atbilstības tests) tiek izmantots, lai noteiktu, vai divi empīriski sadalījumi atbilst vienam un tam pašam likumam, vai arī lai noteiktu, vai iegūtais sadalījums atbilst ierosinātajam modelim. Kolmogorova kritērijs balstās uz maksimālās starpības noteikšanu starp uzkrātajām frekvencēm vai empīrisko vai teorētisko sadalījumu frekvencēm. Kolmogorova kritēriju aprēķina pēc šādām formulām:

kur D un d- attiecīgi maksimālā starpība starp uzkrātajām frekvencēm ( ff¢) un starp uzkrātajām frekvencēm ( lpplpp¢) empīriskās un teorētiskās sadalījumu rindas; N- vienību skaits populācijā.

Aprēķinot λ vērtību, īpaša tabula nosaka varbūtību, ar kādu var apgalvot, ka empīrisko frekvenču novirzes no teorētiskajām ir nejaušas. Ja zīmei ir vērtības līdz 0,3, tas nozīmē, ka pastāv pilnīga frekvenču sakritība. Ar lielu skaitu novērojumu Kolmogorova tests spēj noteikt jebkādas novirzes no hipotēzes. Tas nozīmē, ka ar tās palīdzību tiks atklāta jebkura atšķirība starp izlases sadalījumu un teorētisko, ja novērojumu būs daudz. Šīs īpašības praktiskā nozīme nav nozīmīga, jo vairumā gadījumu ir grūti paļauties uz liela skaita novērojumu iegūšanu nemainīgos apstākļos, teorētiskā ideja par sadalījuma likumu, kuram paraugam ir jāievēro, vienmēr ir aptuvens, un statistisko pārbaužu precizitāte nedrīkst pārsniegt izvēlētā modeļa precizitāti.

Romanovska piemērotības kritērijs pamatojoties uz Pīrsona kritērija izmantošanu, t.i. jau atrastās vērtības c 2 un brīvības pakāpju skaits:

kur n ir variācijas brīvības pakāpju skaits.

Romanovska kritērijs ir ērts, ja nav tabulu priekš . Ja< 3, то расхождения распределений случайны, если же >3, tad tie nav nejauši un teorētiskais sadalījums nevar kalpot par modeli pētāmajam empīriskajam sadalījumam.

B. S. Jastremskis vienošanās kritērijā izmantoja nevis brīvības pakāpju skaitu, bet gan grupu skaitu ( k), īpaša vērtība q atkarībā no grupu skaita un hī kvadrāta vērtība. Jastremska piekrišanas kritērijs ir tāda pati nozīme kā Romanovska kritērijam, un to izsaka ar formulu

kur c 2 - Pīrsona vienošanās kritērijs; - grupu skaits; q - koeficients, grupu skaitam, kas mazāks par 20, vienāds ar 0,6.

Ja L fakts > 3, neatbilstības starp teorētisko un empīrisko sadalījumu nav nejaušas, t.i. empīriskais sadalījums neatbilst normālā sadalījuma prasībām. Ja L fakts< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.

Apstrādājot gadījuma lieluma ξ neatkarīgus mērījumus, varam izveidot statistiskā sadalījuma funkciju F*(x). Pēc šīs funkcijas formas var pieņemt hipotēzi, ka patiesā teorētiskā sadalījuma funkcija ir F(x). Pašus neatkarīgos mērījumus (x 1 , x 2 ,…,x n), kas veido izlasi, var uzskatīt par identiski sadalītiem gadījuma lielumiem ar hipotētisku sadalījuma funkciju F(x).

Acīmredzot būs dažas neatbilstības starp funkcijām F * (x) un F (x). Rodas jautājums, vai šīs neatbilstības ir ierobežotā izlases lieluma sekas vai ir saistītas ar to, ka mūsu hipotēze nav pareiza, t.i. faktiskā sadalījuma funkcija nav F(x), bet kāda cita. Lai atrisinātu šo problēmu, tiek izmantoti piekrišanas kritēriji, kuru būtība ir šāda. Tiek izvēlēta noteikta vērtība Δ(F, F *), kas raksturo funkciju F * (x) un F(x) nesakritības pakāpi. Piemēram, Δ(F, F *)=Sup|F(x)-F * (x)|, t.i. starpības moduļa augšējā robeža x.

Pieņemot, ka hipotēze ir pareiza, t.i. zinot sadalījuma funkciju F(x), var atrast gadījuma lieluma Δ(F, F *) sadalījuma likumu (jautājumu, kā to izdarīt, neskarsim). Skaitli p 0 uzstādām tik mazu, ka notikums (Δ(F, F *)>Δ 0 ) ar šādu varbūtību tiks uzskatīts par praktiski neiespējamu. No stāvokļa

atrodiet vērtību Δ 0 . Šeit f(x) ir sadalījuma blīvums Δ(F,F *).

Tagad no rezultātiem aprēķināsim vērtību Δ(F, F *)= Δ 1

paraugi, t.i. atrodiet vienu no iespējamām nejaušā lieluma Δ(F, F *) vērtībām. Ja Δ 1 ≥Δ 0, tad tas nozīmē, ka ir noticis gandrīz neiespējams notikums. To var izskaidrot ar to, ka mūsu hipotēze nav pareiza. Tātad, ja Δ 1 ≥Δ 0, tad hipotēze tiek noraidīta un, ja Δ 1<Δ 0 , гипотеза может оказаться неверной, но вероятность этого мала.

Kā neatbilstības Δ(F, F *) mēru var ņemt dažādas vērtības. Atkarībā no tā tiek iegūti dažādi vienošanās kritēriji. Piemēram, Kolmogorova, Mises, Pīrsona piemērotības tests vai hī kvadrāta tests.

Ņemiet vērā, ka n mērījumu rezultāti tiek parādīti kā grupētas statistikas rindas ar k cipariem.

IZLĀDE (x 0 ,x 1) (patiesībā mēs pieņemam, ka mērījumu kļūdas ir vienmērīgi sadalītas pa noteiktu segmentu). Tad varbūtība trāpīt katram no septiņiem cipariem būs vienāda ar . Izmantojot grupētās sērijas no §11, mēs aprēķinām Δ(F, F *)= Δ 1 =pēc formulas (1). Šajā gadījumā .

Tā kā hipotētiskajā sadalījuma likumā ir iekļauti divi nezināmi parametri α un β - segmenta sākums un beigas, tad brīvības pakāpju skaits būs 7-1-2=4. Pēc hī kvadrāta sadalījuma tabulas ar izvēlēto varbūtību p 0 =10 -3 atrodam Δ 0 =18. Jo Δ 1 >Δ 0 , tad hipotēze par vienmērīgu mērījumu kļūdas sadalījumu būs jāatmet.