Todennäköisyysjakauman normaali laki. Numeeristen arvojen tilastollinen analyysi (ei-parametriset tilastot)

    Kuinka hallita yrityksesi taloutta oikein, jos et ole talousanalyysin asiantuntija - Taloudellinen analyysi

    Taloushallinto - oppiaineiden väliset taloudelliset suhteet, taloushallinto eri tasoilla, salkunhoito, taloudellisten resurssien hallinnan menetelmät - tämä ei ole täydellinen luettelo aiheesta " Varainhoito"

    Puhutaan siitä mikä on valmennus? Jotkut uskovat, että tämä on porvarillinen brändi, toisten mielestä se on läpimurto nykyaikaisessa liiketoiminnassa. Valmennus on joukko menestyvän liiketoiminnan sääntöjä sekä kykyä hallita näitä sääntöjä oikein.

4.1. Onko havaintojen jakautuminen usein normaalia?

Ekonometrisissa ja talousmatemaattisissa malleissa, joita käytetään erityisesti markkinointi- ja johtamisprosessien, yritys- ja aluejohtamisen, teknisten prosessien tarkkuuden ja vakauden tutkimuksessa ja optimoinnissa, luotettavuusongelmissa, turvallisuuteen, mukaan lukien ympäristöturvallisuus, teknisten prosessien toimivuus. laitteet ja esineet , organisaatiokaavioiden kehittämisessä sovelletaan usein todennäköisyysteorian ja matemaattisten tilastojen käsitteitä ja tuloksia. Tässä tapauksessa käytetään usein tiettyjä parametrisia todennäköisyysjakaumien perheitä. Suosituin on normaalijakauma. Käytetään myös log-normaalijakaumaa, eksponentiaalista jakaumaa, gamma-jakaumaa, Weibull-Gnedenko-jakaumaa jne.

On selvää, että mallien vastaavuus todellisuutta on aina tarpeen tarkistaa. On kaksi kysymystä. Eroavatko todelliset jakaumat mallissa käytetyistä? Missä määrin tämä ero vaikuttaa johtopäätöksiin?

Alla on esimerkkinä normaalijakaumasta ja siihen perustuvien jyrkästi erilaisten havaintojen (outliers) hylkäämismenetelmien avulla, että todelliset jakaumat poikkeavat lähes aina klassisten parametriperheiden sisältämistä ja olemassa olevat poikkeamat annetuista perheistä. tehdä tässä tapauksessa vääriä johtopäätöksiä hylkäämisestä näiden perheiden käyttöön perustuen.

Onko mitään syytä olettaa a priori mittaustulosten normaaleja?

Joskus väitetään, että jos mittausvirhe (tai muu satunnaismuuttuja) määräytyy monien pienten tekijöiden kumulatiivisen vaikutuksen tuloksena, tämä arvo on todennäköisyysteorian keskirajalauseen (CLT) vuoksi. hyvin approksimoitu (jakauman mukaan) normaalilla satunnaismuuttujalla. Tämä väite pitää paikkansa, jos pienet tekijät toimivat additiivisesti ja toisistaan ​​riippumatta. Jos ne toimivat moninkertaisesti, niin saman CLT:n vuoksi on tarpeen tehdä likiarvo log-normaalijakauman mukaan. Sovelletuissa ongelmissa ei yleensä ole mahdollista perustella pienten tekijöiden toiminnan additiivisuutta eikä moninkertaisuutta. Jos riippuvuus on luonteeltaan yleinen, sitä ei ole pelkistetty additiiviseen tai multiplikatiiviseen muotoon, eikä ole perusteita hyväksyä malleja, jotka antavat eksponentiaalisia, Weibull-Gnedenko-, gamma- tai muita jakaumia, niin jakauman jakautumisesta ei tiedetä käytännössä mitään. lopullinen satunnaismuuttuja, paitsi sisäiset matemaattiset ominaisuudet, kuten säännöllisyys .

Tiettyä dataa käsiteltäessä joskus uskotaan, että mittausvirheillä on normaalijakauma. Normaaliuden olettamuksella rakennetaan klassisia regressio-, dispersio-, tekijäanalyysi-, metrologisia malleja, joita edelleen löytyy sekä kotimaisesta sääntely- ja teknisestä dokumentaatiosta että kansainvälisistä standardeista. Taloudellisten rakenteiden, teknisten laitteiden ja esineiden toiminnan turvallisuuden varmistavien järjestelmien suunnittelussa käytetyt tiettyjen ominaisuuksien maksimi saavutettavissa olevien tasojen laskentamallit perustuvat samaan olettamukseen. Tälle oletukselle ei kuitenkaan ole olemassa teoreettista perustaa. On tarpeen tutkia kokeellisesti virheiden jakautumista.

Mitä kokeelliset tulokset osoittavat? Monografiassa esitetyn yhteenvedon perusteella voidaan todeta, että useimmissa tapauksissa mittausvirheiden jakauma poikkeaa normaalista. Siten konesähkötekniikan instituutissa (Varna, Bulgaria) tutkittiin analogisten sähköisten mittauslaitteiden vaakojen kalibrointivirheiden jakautumista. Tutkittiin Tšekkoslovakiassa, Neuvostoliitossa ja Bulgariassa valmistettuja laitteita. Virheen jakautumislaki osoittautui samaksi. Sillä on tiheys

Analysoimme tietoja 219 todellisen virhejakauman parametreista, joita eri kirjoittajat ovat tutkineet mitattaessa sekä sähköisiä että ei-sähköisiä suureita monilla erilaisilla (sähkö)laitteilla. Tämän tutkimuksen tuloksena kävi ilmi, että 111 jakaumaa, ts. noin 50 % kuuluu tiheysjakaumien luokkaan

missä on asteparametri; b - siirtoparametri; - mittakaavaparametri; - argumentin gammafunktio;

(cm.); 63 jakelua, ts. 30 %:lla on litteät tiheydet, joissa on pitkät, loivat rinteet, eikä niitä voida kuvata normaaliksi tai esimerkiksi eksponentiaaliseksi. Loput 45 jakaumaa osoittautuivat bimodaaliseksi.

Kuuluisan metrologin kirjassa prof. PV Novitsky esittelee erilaisten mittausvirheiden jakautumislakeja koskevan tutkimuksen tulokset. Hän tutki sähkömekaanisten instrumenttien virheiden jakautumista ytimille, elektronisia lämpötiloja ja voimia mittaavia laitteita, digitaalisia laitteita, joissa on manuaalinen tasapainotus. Jokaisen näytteen koeaineistonäytteiden määrä oli 100–400 lukemaa. Kävi ilmi, että 46 jakaumasta 47:stä poikkesi merkittävästi normaalista. Virhejakauman muotoa 25 kopiossa Shch-1411 digitaalisista volttimittareista tutkittiin alueen 10 pisteessä. Tulokset ovat samanlaisia. Lisätietoja on monografiassa.

Tarton valtionyliopiston sovelletun matematiikan laboratorio analysoi 2500 näytettä todellisten tilastotietojen arkistosta. 92 prosentissa normaalihypoteesi jouduttiin hylkäämään.

Yllä olevat koetietojen kuvaukset osoittavat, että mittausvirheillä on useimmiten normaalista poikkeavia jakaumia. Tämä tarkoittaa erityisesti sitä, että useimmat Studentin t-testin, klassisen regressioanalyysin ja muiden normaaliteoriaan perustuvien tilastollisten menetelmien sovellukset eivät ole tiukasti ottaen perusteltuja, koska taustalla on vastaavan satunnaisjakaumien normaaliaksiooma. muuttujat ovat virheellisiä.

On selvää, että nykyisen tilastotietojen analysointikäytännön perustelemiseksi tai järkeväksi muuttamiseksi on tarpeen tutkia "laittomien" sovellusten tietojen analysointimenettelyjen ominaisuuksia. Hylkäämismenettelyjen tutkimus on osoittanut, että ne ovat erittäin epävakaita normaalista poikkeamille, joten niitä ei ole suositeltavaa käyttää todellisen tiedon käsittelyyn (katso alla); siksi ei voida väittää, että mielivaltaisesti valittu menettely olisi vakaa normaalista poikkeamista vastaan.

Joskus ehdotetaan, että ennen esimerkiksi Studentin testin soveltamista kahden näytteen homogeenisuuden tarkastamiseen. Vaikka tälle on monia kriteerejä, normaaliuden testaus on monimutkaisempi ja aikaa vievä tilastollinen menettely kuin homogeenisuuden testaus (sekä Student-tyyppisillä tilastoilla että ei-parametrisilla testeillä). Normaalin riittävän luotettavaksi toteamiseksi tarvitaan melko suuri määrä havaintoja. Joten sen takaamiseksi, että havaintojen tulosten jakaumafunktio poikkeaa jostain normaalista enintään 0,01 (millä tahansa argumentin arvolla), tarvitaan noin 2500 havaintoa. Useimmissa taloudellisissa, teknisissä, biolääketieteellisissä ja muissa sovellettavissa tutkimuksissa havaintoja on huomattavasti vähemmän. Tämä koskee erityisesti taloudellisten rakenteiden ja teknisten kohteiden toimintavarmuuden varmistamiseen liittyvien ongelmien selvittämiseen käytettyä dataa.

Joskus he yrittävät käyttää DCT:tä lähentääkseen virheen jakautumista normaaliin, mukaan lukien erityiset summaimet mittauslaitteen teknologisessa kaaviossa. Arvioidaan tämän toimenpiteen hyödyllisyyttä. Olkoot Z1 , Z2 ,…, Zk riippumattomia identtisesti jakautuneita satunnaismuuttujia jakaumafunktiolla H = H(x) siten, että harkitaan

Summainin tarjoama normaaliläheisyyden osoitin on

Oikea epäyhtälö viimeisessä suhteessa seuraa kirjassa saaduista Berry-Esseen-epäyhtälön vakion estimaateista ja vasen monografian esimerkistä. Normaalille laille = 1,6, yhtenäiselle laille = 1,3, kahden pisteen laille = 1 (tämä on :n alaraja). Siksi, jotta varmistetaan, että etäisyys (Kolmogorov-metriikassa) normaalijakaumaan on enintään 0,01 "epäonnistuneet" jakaumat, tarvitaan vähintään k0 termiä, jossa

Yleisesti käytetyissä summaimissa termit ovat paljon pienempiä. Kaventamalla mahdollisten jakaumien luokkaa H saadaan, kuten monografiassa esitetään, nopeampi konvergenssi, mutta tässä teoria ei vielä sulaudu käytäntöön. Lisäksi ei ole selvää, varmistaako jakauman normaalin läheisyys (tietyssä metriikassa) myös tämän jakauman satunnaismuuttujista konstruoidun tilaston jakauman läheisyyden normaaleja havaintoja vastaavan tilaston jakaumaan. Ilmeisesti jokaista yksittäistä tilastoa varten tarvitaan erityisiä teoreettisia tutkimuksia, tähän johtopäätökseen monografian kirjoittaja tulee. Outlier-hylkäysongelmissa vastaus on: "Ei tarjoa" (katso alla).

Huomaa, että minkä tahansa todellisen mittauksen tulos tallennetaan äärellisellä määrällä desimaalipaikkoja, yleensä pieniä (2-5), joten on suositeltavaa mallintaa mikä tahansa todellinen data vain diskreeteillä satunnaismuuttujilla, jotka ottavat äärellisen määrän arvoja. Normaalijakauma on vain todellisen jakauman approksimaatio. Joten esimerkiksi tietyn tutkimuksen tiedot, jotka on annettu työssä, saavat arvot välillä 1,0 - 2,2, ts. kaikkiaan 13 mahdollista arvoa. Dirichlet-periaatteesta seuraa, että jossain vaiheessa työtietojen mukaan muodostettu jakaumafunktio eroaa lähimmästä normaalijakaumafunktiosta vähintään 1/26, ts. 0.04 mennessä. Lisäksi on selvää, että satunnaismuuttujan normaalijakaumalla todennäköisyys putoaa diskreettiin desimaalilukujen joukkoon tietyllä määrällä desimaalipaikkoja on 0.

Edellä esitetystä seuraa, että mittaustuloksilla ja yleensä tilastotiedoilla on ominaisuuksia, jotka johtavat siihen, että ne tulisi mallintaa satunnaismuuttujilla, joiden jakaumat poikkeavat enemmän tai vähemmän normaaleista. Useimmissa tapauksissa jakaumat poikkeavat merkittävästi normaalijakaumista, toisissa normaalijakaumia voidaan ilmeisesti pitää jonkinlaisena approksimaationa, mutta täydellistä sattumaa ei koskaan ole. Tämä merkitsee sekä tarvetta tutkia klassisten tilastollisten menetelmien ominaisuuksia ei-klassisissa todennäköisyysmalleissa (samalla tavalla kuin jäljempänä Studentin kriteerille) että tarvetta kehittää stabiileja (ottaen huomioon normaalista poikkeamat) ja ei-parametriset, mukaan lukien jakeluvapaat menettelyt, niiden laaja käyttöönotto tilastotietojen käsittelyssä.

Muiden parametristen perheiden osalta tässä jätetyt huomiot johtavat samanlaisiin johtopäätöksiin. Tulos voidaan muotoilla seuraavasti. Todelliset datajakaumat eivät juuri koskaan kuulu mihinkään tiettyyn parametriperheeseen. Todelliset jakaumat ovat aina erilaisia ​​kuin parametriperheisiin sisältyvät. Erot voivat olla suuria tai pieniä, mutta ne ovat aina olemassa. Yritetään ymmärtää, kuinka tärkeitä nämä erot ovat ekonometriselle analyysille.

Kaikki oikeudet pidätetään. Tämän sivuston materiaalia saa käyttää vain linkin kanssa tälle sivustolle.

Orlov A.I. Onko havaintojen jakautuminen usein normaalia? - Aikakauslehti "Tehdaslaboratorio". 1991 T.57. No.7 P.64-66.

Onko havaintojen jakautuminen usein normaalia?

A.I.Orlov

Mittaustuloksissa ja yleensä tilastotiedoissa on ominaisuuksia, jotka johtavat siihen, että ne tulisi mallintaa satunnaismuuttujilla, joiden jakaumat poikkeavat normaalista enemmän tai vähemmän. Useimmissa tapauksissa jakaumat poikkeavat merkittävästi normaalista. Toisissa normaalijakaumia voidaan ilmeisesti pitää jonkinlaisena approksimaationa. Mutta täydellistä ottelua ei ole koskaan olemassa. Tämä tarkoittaa sekä tarvetta tutkia klassisten tilastollisten menetelmien ominaisuuksia ei-klassisissa todennäköisyysmalleissa että tarvetta kehittää stabiileja (ottaen huomioon normaalista poikkeamien olemassaolo) ja ei-parametrisia, mukaan lukien jakautumisvapaita proseduureja, niiden laajat. tilastollisen tietojenkäsittelyn käytäntöön.

Ekonometrisissa ja talousmatemaattisissa malleissa, joita käytetään erityisesti markkinointi- ja johtamisprosessien, yritys- ja aluejohtamisen, teknisten prosessien tarkkuuden ja vakauden tutkimuksessa ja optimoinnissa, luotettavuusongelmissa, turvallisuuteen, mukaan lukien ympäristöturvallisuus, teknisten prosessien toimivuus. laitteet ja esineet , organisaatiokaavioiden kehittämisessä sovelletaan usein todennäköisyysteorian ja matemaattisten tilastojen käsitteitä ja tuloksia. Tässä tapauksessa käytetään usein tiettyjä parametrisia todennäköisyysjakaumien perheitä. Suosituin on normaalijakauma. Käytetään myös log-normaalijakaumaa, eksponentiaalista jakaumaa, gamma-jakaumaa, Weibull-Gnedenko-jakaumaa jne.

On selvää, että mallien vastaavuus todellisuutta on aina tarpeen tarkistaa. On kaksi kysymystä. Eroavatko todelliset jakaumat mallissa käytetyistä? Missä määrin tämä ero vaikuttaa johtopäätöksiin?

Alla on esimerkkinä normaalijakaumasta ja siihen perustuvien jyrkästi erilaisten havaintojen (outliers) hylkäämismenetelmien avulla, että todelliset jakaumat poikkeavat lähes aina klassisten parametriperheiden sisältämistä ja olemassa olevat poikkeamat annetuista perheistä. tehdä tässä tapauksessa vääriä johtopäätöksiä hylkäämisestä näiden perheiden käyttöön perustuen.

Onko mitään syytä olettaa a priori mittaustulosten normaaleja?

Joskus väitetään, että jos mittausvirhe (tai muu satunnaismuuttuja) määräytyy monien pienten tekijöiden kumulatiivisen vaikutuksen tuloksena, tämä arvo on todennäköisyysteorian keskirajalauseen (CLT) vuoksi. hyvin approksimoitu (jakauman mukaan) normaalilla satunnaismuuttujalla. Tämä väite pitää paikkansa, jos pienet tekijät toimivat additiivisesti ja toisistaan ​​riippumatta. Jos ne toimivat moninkertaisesti, niin saman CLT:n vuoksi on tarpeen tehdä likiarvo log-normaalijakauman mukaan. Sovelletuissa ongelmissa ei yleensä ole mahdollista perustella pienten tekijöiden toiminnan additiivisuutta eikä moninkertaisuutta. Jos riippuvuus on luonteeltaan yleinen, sitä ei ole pelkistetty additiiviseen tai multiplikatiiviseen muotoon, eikä ole perusteita hyväksyä malleja, jotka antavat eksponentiaalisia, Weibull-Gnedenko-, gamma- tai muita jakaumia, niin jakauman jakautumisesta ei tiedetä käytännössä mitään. lopullinen satunnaismuuttuja, paitsi sisäiset matemaattiset ominaisuudet, kuten säännöllisyys .

Tiettyä dataa käsiteltäessä joskus uskotaan, että mittausvirheillä on normaalijakauma. Normaaliuden olettamuksella rakennetaan klassisia regressio-, dispersio-, tekijäanalyysi-, metrologisia malleja, joita edelleen löytyy sekä kotimaisesta sääntely- ja teknisestä dokumentaatiosta että kansainvälisistä standardeista. Taloudellisten rakenteiden, teknisten laitteiden ja esineiden toiminnan turvallisuuden varmistavien järjestelmien suunnittelussa käytetyt tiettyjen ominaisuuksien maksimi saavutettavissa olevien tasojen laskentamallit perustuvat samaan olettamukseen. Tälle oletukselle ei kuitenkaan ole olemassa teoreettista perustaa. On tarpeen tutkia kokeellisesti virheiden jakautumista.

Mitä kokeelliset tulokset osoittavat? Monografiassa esitetyn yhteenvedon perusteella voidaan todeta, että useimmissa tapauksissa mittausvirheiden jakauma poikkeaa normaalista. Siten konesähkötekniikan instituutissa (Varna, Bulgaria) tutkittiin analogisten sähköisten mittauslaitteiden vaakojen kalibrointivirheiden jakautumista. Tutkittiin Tšekkoslovakiassa, Neuvostoliitossa ja Bulgariassa valmistettuja laitteita. Virheen jakautumislaki osoittautui samaksi. Sillä on tiheys

Analysoimme tietoja 219 todellisen virhejakauman parametreista, joita eri kirjoittajat ovat tutkineet mitattaessa sekä sähköisiä että ei-sähköisiä suureita monilla erilaisilla (sähkö)laitteilla. Tämän tutkimuksen tuloksena kävi ilmi, että 111 jakaumaa, ts. noin 50 % kuuluu tiheysjakaumien luokkaan

missä on asteparametri; b- siirtoparametri; - skaalausparametri - argumentin gammafunktio;

(cm.); 63 jakelua, ts. 30 %:lla on litteät tiheydet, joissa on pitkät, loivat rinteet, eikä niitä voida kuvata normaaliksi tai esimerkiksi eksponentiaaliseksi. Loput 45 jakaumaa osoittautuivat bimodaaliseksi.

Kuuluisan metrologin kirjassa prof. PV Novitsky esittelee erilaisten mittausvirheiden jakautumislakeja koskevan tutkimuksen tulokset. Hän tutki sähkömekaanisten instrumenttien virheiden jakautumista ytimille, elektronisia lämpötiloja ja voimia mittaavia laitteita, digitaalisia laitteita, joissa on manuaalinen tasapainotus. Jokaisen näytteen koeaineistonäytteiden määrä oli 100–400 lukemaa. Kävi ilmi, että 46 jakaumasta 47:stä poikkesi merkittävästi normaalista. Virhejakauman muotoa 25 kopiossa Shch-1411 digitaalisista volttimittareista tutkittiin alueen 10 pisteessä. Tulokset ovat samanlaisia. Lisätietoja on monografiassa.

Tarton valtionyliopiston sovelletun matematiikan laboratorio analysoi 2500 näytettä todellisten tilastotietojen arkistosta. 92 prosentissa normaalihypoteesi jouduttiin hylkäämään.

Yllä olevat koetietojen kuvaukset osoittavat, että mittausvirheillä on useimmiten normaalista poikkeavia jakaumia. Tämä tarkoittaa erityisesti sitä, että useimmat Studentin t-testin, klassisen regressioanalyysin ja muiden normaaliteoriaan perustuvien tilastollisten menetelmien sovellukset eivät ole tiukasti ottaen perusteltuja, koska taustalla on vastaavan satunnaisjakaumien normaaliaksiooma. muuttujat ovat virheellisiä.

On selvää, että olemassa olevan tilastotietojen analysointikäytännön perustelemiseksi tai järkeväksi muuttamiseksi on tarpeen tutkia "laittomien" sovellusten tietojen analysointimenettelyjen ominaisuuksia. Hylkäämismenettelyjen tutkimus on osoittanut, että ne ovat erittäin epävakaita normaalista poikkeamille, joten niitä ei ole suositeltavaa käyttää todellisen tiedon käsittelyyn (katso alla); siksi ei voida väittää, että mielivaltaisesti valittu menettely olisi vakaa normaalista poikkeamista vastaan.

Joskus ehdotetaan, että ennen esimerkiksi Studentin testin soveltamista kahden näytteen homogeenisuuden tarkastamiseen. Vaikka tälle on monia kriteerejä, normaaliuden testaus on monimutkaisempi ja aikaa vievä tilastollinen menettely kuin homogeenisuuden testaus (sekä Student-tyyppisillä tilastoilla että ei-parametrisilla testeillä). Normaalin riittävän luotettavaksi toteamiseksi tarvitaan melko suuri määrä havaintoja. Joten sen takaamiseksi, että havaintojen tulosten jakaumafunktio poikkeaa jostain normaalista enintään 0,01 (millä tahansa argumentin arvolla), tarvitaan noin 2500 havaintoa. Useimmissa taloudellisissa, teknisissä, biolääketieteellisissä ja muissa sovellettavissa tutkimuksissa havaintoja on huomattavasti vähemmän. Tämä koskee erityisesti taloudellisten rakenteiden ja teknisten kohteiden toimintavarmuuden varmistamiseen liittyvien ongelmien selvittämiseen käytettyä dataa.

Joskus he yrittävät käyttää CCT:tä lähentääkseen virheen jakautumista normaaliin, mukaan lukien erityiset summaimet mittauslaitteen teknologisessa kaaviossa. Arvioidaan tämän toimenpiteen hyödyllisyyttä. Anna olla Z 1 , Z 2 ,…, Z k- riippumattomat identtisesti jakautuneet satunnaismuuttujat jakaumafunktiolla H=H(x) sellainen, että harkitsee

Summainin tarjoama normaaliläheisyyden osoitin on

Oikea epäyhtälö viimeisessä suhteessa seuraa kirjassa saaduista Berry-Esseen-epäyhtälön vakion estimaateista ja vasen monografian esimerkistä. Normaalille laille = 1,6, yhtenäiselle laille = 1,3, kahden pisteen laille = 1 (tämä on alaraja). Siksi, jotta etäisyys (Kolmogorov-metriikassa) normaalijakaumaan olisi enintään 0,01 "epäonnistuneiden" jakaumien osalta, ainakin k 0 ehdot, missä

Yleisesti käytetyissä summaimissa termit ovat paljon pienempiä. Mahdollisten jakaumien luokan kaventaminen H, on mahdollista saavuttaa, kuten monografiassa esitetään, nopeampi konvergenssi, mutta tässä teoria ei vielä sulaudu käytäntöön. Lisäksi ei ole selvää, varmistaako jakauman normaalin läheisyys (tietyssä metriikassa) myös tämän jakauman satunnaismuuttujista konstruoidun tilaston jakauman läheisyyden normaaleja havaintoja vastaavan tilaston jakaumaan. Ilmeisesti jokaista yksittäistä tilastoa varten tarvitaan erityisiä teoreettisia tutkimuksia, tähän johtopäätökseen monografian kirjoittaja tulee. Outlier-hylkäysongelmissa vastaus on: "Ei tarjoa" (katso alla).

Huomaa, että minkä tahansa todellisen mittauksen tulos tallennetaan äärellisellä määrällä desimaalipaikkoja, yleensä pieniä (2-5), joten on suositeltavaa mallintaa mikä tahansa todellinen data vain diskreeteillä satunnaismuuttujilla, jotka ottavat äärellisen määrän arvoja. Normaalijakauma on vain todellisen jakauman approksimaatio. Joten esimerkiksi tietyn tutkimuksen tiedot, jotka on annettu työssä, saavat arvot välillä 1,0 - 2,2, ts. kaikkiaan 13 mahdollista arvoa. Dirichlet-periaatteesta seuraa, että jossain vaiheessa työtietojen mukaan muodostettu jakaumafunktio eroaa lähimmästä normaalijakaumafunktiosta vähintään 1/26, ts. 0.04 mennessä. Lisäksi on selvää, että satunnaismuuttujan normaalijakaumalla todennäköisyys joutua diskreettiin desimaalilukujen joukkoon tietyllä määrällä desimaalipaikkoja on 0.

Edellä esitetystä seuraa, että mittaustuloksilla ja yleensä tilastotiedoilla on ominaisuuksia, jotka johtavat siihen, että ne tulisi mallintaa satunnaismuuttujilla, joiden jakaumat poikkeavat enemmän tai vähemmän normaaleista. Useimmissa tapauksissa jakaumat poikkeavat merkittävästi normaalijakaumista, toisissa normaalijakaumia voidaan ilmeisesti pitää jonkinlaisena approksimaationa, mutta täydellistä sattumaa ei koskaan ole. Tämä merkitsee sekä tarvetta tutkia klassisten tilastollisten menetelmien ominaisuuksia ei-klassisissa todennäköisyysmalleissa (samalla tavalla kuin jäljempänä Studentin kriteerille) että tarvetta kehittää stabiileja (ottaen huomioon normaalista poikkeamat) ja ei-parametriset, mukaan lukien jakeluvapaat menettelyt, niiden laaja käyttöönotto tilastotietojen käsittelyssä.

Kirjallisuus

1. Novitsky P.V., Zograf I.A. Mittaustulosten virheiden arviointi. - L.: Energoatomizdat, 1985. - 248 s.

2. Novitsky P.V. Mittalaitteiden tietoteorian perusteet. - L .: energia, 1968. - 248 s.

3. Borovkov A.A. Todennäköisyysteoria. - M.: Nauka, 1976. - 352 s.

4. Petrov V.V. Riippumattomien satunnaismuuttujien summat. - M.: Nauka, 1972. - 416 s.

5. Zolotarev V.M. Moderni teoria riippumattomien satunnaismuuttujien summaamisesta. - M.: Nauka, 1986. - 416 s.

6. Egorova L.A., Kharitonov Yu.S., Sokolovskaya L.V. // Tehtaan laboratorio. - 1976. V.42. Nro 10. S. 1237.

Tarkastellaan kahta riippumatonta satunnaismuuttujaa ja normaalilakien mukaisesti:

, (12.6.1)

. (12.6.2)

Näistä laeista on tehtävä koostumus, eli löydettävä suuren jakautumislaki:

Käytämme yleiskaavaa (12.5.3) jakautumislakien koostumukseen:

. (12.6.3)

Jos avaamme sulut integrandin eksponenttiin ja tuomme samanlaiset termit, saamme:

,

;

;

.

Korvaamalla nämä lausekkeet kaavaan (9.1.3), olemme jo tavanneet:

, (12.6.4)

muunnosten jälkeen saamme:

, (12.6.5)

ja tämä on vain normaali laki, jossa on hajontakeskus

ja keskihajonta

. (12.6.7)

Sama johtopäätös voidaan tehdä paljon helpommin seuraavan laadullisen päättelyn avulla.

Avaamatta sulkuja ja tekemättä muunnoksia integrandissa (12.6.3), tulemme heti siihen tulokseen, että eksponentti on neliötrinomi muodon suhteen

,

jos arvo ei sisälly kertoimeen ollenkaan, se sisältyy kertoimeen ensimmäisessä asteessa ja kertoimeen - neliöön. Tätä silmällä pitäen ja kaavaa (12.6.4) soveltaen päätämme, että on olemassa eksponenttifunktio, jonka eksponentti on neliötrinomi suhteessa :iin ja tämän tyypin jakautumistiheys vastaa normaalilakia. Siten tulemme puhtaasti kvalitatiiviseen johtopäätökseen: suuren jakautumislain on oltava normaali.

Tämän lain parametrien löytämiseksi - ja - käytämme matemaattisten odotusten yhteenlaskulausetta ja varianssien yhteenlaskulausetta. Matemaattisten odotusten summauslauseen mukaan

Varianssilisäyslauseen mukaan

josta seuraa kaava (12.6.7).

Siirtymällä keskihajonnoista niihin verrannollisiin todennäköisiin poikkeamiin saadaan:

Siten olemme päässeet seuraavaan sääntöön: kun normaaleja lakeja muodostetaan, saadaan taas normaalilaki ja lasketaan matemaattiset odotukset ja varianssit (eli neliöidyt todennäköiset poikkeamat).

Normaalilakien koostumussääntö voidaan yleistää sattumanvaraiseen määrään riippumattomia satunnaismuuttujia.

Jos on riippumattomia satunnaismuuttujia:

normaalien lakien alaisena sirontakeskuksilla

ja keskihajonnat

,

sitten arvo

noudattaa myös normaalia lakia parametrien kanssa

Kaavan (12.6.12) sijasta voit käyttää vastaavaa kaavaa:

Jos satunnaismuuttujajärjestelmä jakautuu normaalin lain mukaan, mutta suureet ovat riippuvaisia, on yleisen kaavan (12.5.1) perusteella helppo todistaa, kuten ennenkin, että suuren jakautumislaki

siellä on myös normaali laki. Sirontakeskukset lisätään edelleen algebrallisesti, mutta keskihajonnan sääntö muuttuu monimutkaisemmaksi:

, (12.6.14)

missä on arvojen korrelaatiokerroin ja .

Kun lisätään useita riippuvaisia ​​satunnaismuuttujia, jotka kokonaisuutena noudattavat normaalilakia, myös summan jakautumislaki osoittautuu normaaliksi parametrien kanssa

, (12.6.16)

tai todennäköisiä poikkeamia

, (12.6.17)

missä on arvojen korrelaatiokerroin, ja summaus ulottuu kaikkiin eri arvojen parittaisiin yhdistelmiin.

Olemme nähneet normaalin lain erittäin tärkeän ominaisuuden: kun normaalilait yhdistetään, saadaan taas normaali laki. Tämä on niin kutsuttu "vakausominaisuus". Jakaumalain sanotaan olevan stabiili, jos muodostamalla kaksi tämäntyyppistä lakia saadaan jälleen samantyyppinen laki. Olemme osoittaneet edellä, että normaali laki on vakaa. Hyvin harvoilla jakelulailla on stabiiliuden ominaisuus. Edellisessä (esimerkki 2) varmistimme, että esimerkiksi tasaisen tiheyden laki on epävakaa: kun muodosteltiin kaksi tasaisen tiheyden lakia osissa 0-1, saatiin Simpsonin laki.

Normaalilain pysyvyys on yksi sen laajan käytännön soveltamisen olennaisista edellytyksistä. Stabiilisuuden ominaisuus on kuitenkin normaalin lisäksi myös eräillä muilla jakautumislailla. Normaalin lain ominaisuus on, että kun muodostuu riittävän suuri määrä käytännössä mielivaltaisia ​​jakautumalakeja, kokonaislaki osoittautuu mielivaltaisen lähelle normaalia riippumatta siitä, mitkä termien jakautumislait olivat. Tätä voidaan havainnollistaa esimerkiksi muodostamalla kolme tasaisen tiheyden lakia osioihin 0 - 1. Tuloksena oleva jakautumislaki on esitetty kuvassa 1. 12.6.1. Kuten piirroksesta voidaan nähdä, funktion kuvaaja on hyvin samanlainen kuin normaalin lain kuvaaja.

4.1. Onko havaintojen jakautuminen usein normaalia?

Ekonometrisissa ja talousmatemaattisissa malleissa, joita käytetään erityisesti markkinointi- ja johtamisprosessien, yritys- ja aluejohtamisen, teknisten prosessien tarkkuuden ja vakauden tutkimuksessa ja optimoinnissa, luotettavuusongelmissa, turvallisuuteen, mukaan lukien ympäristöturvallisuus, teknisten prosessien toimivuus. laitteet ja esineet , organisaatiokaavioiden kehittämisessä sovelletaan usein todennäköisyysteorian ja matemaattisten tilastojen käsitteitä ja tuloksia. Tässä tapauksessa käytetään usein tiettyjä parametrisia todennäköisyysjakaumien perheitä. Suosituin on normaalijakauma. Käytetään myös log-normaalijakaumaa, eksponentiaalista jakaumaa, gamma-jakaumaa, Weibull-Gnedenko-jakaumaa jne.

On selvää, että mallien vastaavuus todellisuutta on aina tarpeen tarkistaa. On kaksi kysymystä. Eroavatko todelliset jakaumat mallissa käytetyistä? Missä määrin tämä ero vaikuttaa johtopäätöksiin?

Alla on esimerkkinä normaalijakaumasta ja siihen perustuvien jyrkästi erilaisten havaintojen (outliers) hylkäämismenetelmien avulla, että todelliset jakaumat poikkeavat lähes aina klassisten parametriperheiden sisältämistä ja olemassa olevat poikkeamat annetuista perheistä. tehdä tässä tapauksessa vääriä johtopäätöksiä hylkäämisestä näiden perheiden käyttöön perustuen.

Onko mitään syytä olettaa a priori mittaustulosten normaaleja?

Joskus väitetään, että jos mittausvirhe (tai muu satunnaismuuttuja) määräytyy monien pienten tekijöiden kumulatiivisen vaikutuksen tuloksena, tämä arvo on todennäköisyysteorian keskirajalauseen (CLT) vuoksi. hyvin approksimoitu (jakauman mukaan) normaalilla satunnaismuuttujalla. Tämä väite pitää paikkansa, jos pienet tekijät toimivat additiivisesti ja toisistaan ​​riippumatta. Jos ne toimivat moninkertaisesti, niin saman CLT:n vuoksi on tarpeen tehdä likiarvo log-normaalijakauman mukaan. Sovelletuissa ongelmissa ei yleensä ole mahdollista perustella pienten tekijöiden toiminnan additiivisuutta eikä moninkertaisuutta. Jos riippuvuus on luonteeltaan yleinen, sitä ei ole pelkistetty additiiviseen tai multiplikatiiviseen muotoon, eikä ole perusteita hyväksyä malleja, jotka antavat eksponentiaalisia, Weibull-Gnedenko-, gamma- tai muita jakaumia, niin jakauman jakautumisesta ei tiedetä käytännössä mitään. lopullinen satunnaismuuttuja, paitsi sisäiset matemaattiset ominaisuudet, kuten säännöllisyys .

Tiettyä dataa käsiteltäessä joskus uskotaan, että mittausvirheillä on normaalijakauma. Normaaliuden olettamuksella rakennetaan klassisia regressio-, dispersio-, tekijäanalyysi-, metrologisia malleja, joita edelleen löytyy sekä kotimaisesta sääntely- ja teknisestä dokumentaatiosta että kansainvälisistä standardeista. Taloudellisten rakenteiden, teknisten laitteiden ja esineiden toiminnan turvallisuuden varmistavien järjestelmien suunnittelussa käytetyt tiettyjen ominaisuuksien maksimi saavutettavissa olevien tasojen laskentamallit perustuvat samaan olettamukseen. Tälle oletukselle ei kuitenkaan ole olemassa teoreettista perustaa. On tarpeen tutkia kokeellisesti virheiden jakautumista.

Mitä kokeelliset tulokset osoittavat? Monografiassa esitetyn yhteenvedon perusteella voidaan todeta, että useimmissa tapauksissa mittausvirheiden jakauma poikkeaa normaalista. Siten konesähkötekniikan instituutissa (Varna, Bulgaria) tutkittiin analogisten sähköisten mittauslaitteiden vaakojen kalibrointivirheiden jakautumista. Tutkittiin Tšekkoslovakiassa, Neuvostoliitossa ja Bulgariassa valmistettuja laitteita. Virheen jakautumislaki osoittautui samaksi. Sillä on tiheys

Analysoimme tietoja 219 todellisen virhejakauman parametreista, joita eri kirjoittajat ovat tutkineet mitattaessa sekä sähköisiä että ei-sähköisiä suureita monilla erilaisilla (sähkö)laitteilla. Tämän tutkimuksen tuloksena kävi ilmi, että 111 jakaumaa, ts. noin 50 % kuuluu tiheysjakaumien luokkaan

missä on asteparametri; b- siirtoparametri; - mittakaavaparametri; - argumentin gammafunktio;

(cm.); 63 jakelua, ts. 30 %:lla on litteät tiheydet, joissa on pitkät, loivat rinteet, eikä niitä voida kuvata normaaliksi tai esimerkiksi eksponentiaaliseksi. Loput 45 jakaumaa osoittautuivat bimodaaliseksi.

Kuuluisan metrologin kirjassa prof. PV Novitsky esittelee erilaisten mittausvirheiden jakautumislakeja koskevan tutkimuksen tulokset. Hän tutki sähkömekaanisten instrumenttien virheiden jakautumista ytimille, elektronisia lämpötiloja ja voimia mittaavia laitteita, digitaalisia laitteita, joissa on manuaalinen tasapainotus. Jokaisen näytteen koeaineistonäytteiden määrä oli 100–400 lukemaa. Kävi ilmi, että 46 jakaumasta 47:stä poikkesi merkittävästi normaalista. Virhejakauman muotoa 25 kopiossa Shch-1411 digitaalisista volttimittareista tutkittiin alueen 10 pisteessä. Tulokset ovat samanlaisia. Lisätietoja on monografiassa.

Tarton valtionyliopiston sovelletun matematiikan laboratorio analysoi 2500 näytettä todellisten tilastotietojen arkistosta. 92 prosentissa normaalihypoteesi jouduttiin hylkäämään.

Yllä olevat koetietojen kuvaukset osoittavat, että mittausvirheillä on useimmiten normaalista poikkeavia jakaumia. Tämä tarkoittaa erityisesti sitä, että useimmat Studentin t-testin, klassisen regressioanalyysin ja muiden normaaliteoriaan perustuvien tilastollisten menetelmien sovellukset eivät ole tiukasti ottaen perusteltuja, koska taustalla on vastaavan satunnaisjakaumien normaaliaksiooma. muuttujat ovat virheellisiä.

On selvää, että nykyisen tilastotietojen analysointikäytännön perustelemiseksi tai järkeväksi muuttamiseksi on tarpeen tutkia "laittomien" sovellusten tietojen analysointimenettelyjen ominaisuuksia. Hylkäämismenettelyjen tutkimus on osoittanut, että ne ovat erittäin epävakaita normaalista poikkeamille, joten niitä ei ole suositeltavaa käyttää todellisen tiedon käsittelyyn (katso alla); siksi ei voida väittää, että mielivaltaisesti valittu menettely olisi vakaa normaalista poikkeamista vastaan.

Joskus ehdotetaan, että ennen esimerkiksi Studentin testin soveltamista kahden näytteen homogeenisuuden tarkastamiseen. Vaikka tälle on monia kriteerejä, normaaliuden testaus on monimutkaisempi ja aikaa vievä tilastollinen menettely kuin homogeenisuuden testaus (sekä Student-tyyppisillä tilastoilla että ei-parametrisilla testeillä). Normaalin riittävän luotettavaksi toteamiseksi tarvitaan melko suuri määrä havaintoja. Joten sen takaamiseksi, että havaintojen tulosten jakaumafunktio poikkeaa jostain normaalista enintään 0,01 (millä tahansa argumentin arvolla), tarvitaan noin 2500 havaintoa. Useimmissa taloudellisissa, teknisissä, biolääketieteellisissä ja muissa sovellettavissa tutkimuksissa havaintoja on huomattavasti vähemmän. Tämä koskee erityisesti taloudellisten rakenteiden ja teknisten kohteiden toimintavarmuuden varmistamiseen liittyvien ongelmien selvittämiseen käytettyä dataa.

Joskus he yrittävät käyttää CCT:tä lähentääkseen virheen jakautumista normaaliin, mukaan lukien erityiset summaimet mittauslaitteen teknologisessa kaaviossa. Arvioidaan tämän toimenpiteen hyödyllisyyttä. Anna olla Z 1 , Z 2 ,…, Z k- riippumattomat identtisesti jakautuneet satunnaismuuttujat jakaumafunktiolla H = H(x) sellainen, että harkitsee

Summainin tarjoama normaaliläheisyyden osoitin on

Oikeanpuoleinen epäyhtälö viimeisessä suhteessa seuraa kirjassa saaduista Berry-Esseen-epäyhtälön vakion estimaateista ja vasemmanpuoleinen monografian esimerkistä. Normaalille laille = 1,6, yhtenäiselle laille = 1,3, kahden pisteen laille = 1 (tämä on :n alaraja). Siksi, jotta etäisyys (Kolmogorov-metriikassa) normaalijakaumaan olisi enintään 0,01 "epäonnistuneiden" jakaumien osalta, ainakin k 0 ehdot, missä

Yleisesti käytetyissä summaimissa termit ovat paljon pienempiä. Mahdollisten jakaumien luokan kaventaminen H, on mahdollista saavuttaa, kuten monografiassa esitetään, nopeampi konvergenssi, mutta tässä teoria ei vielä sulaudu käytäntöön. Lisäksi ei ole selvää, varmistaako jakauman normaalin läheisyys (tietyssä metriikassa) myös tämän jakauman satunnaismuuttujista konstruoidun tilaston jakauman läheisyyden normaaleja havaintoja vastaavan tilaston jakaumaan. Ilmeisesti jokaista yksittäistä tilastoa varten tarvitaan erityisiä teoreettisia tutkimuksia, tähän johtopäätökseen monografian kirjoittaja tulee. Outlier-hylkäysongelmissa vastaus on: "Ei tarjoa" (katso alla).

Huomaa, että minkä tahansa todellisen mittauksen tulos tallennetaan äärellisellä määrällä desimaalipaikkoja, yleensä pieniä (2-5), joten on suositeltavaa mallintaa mikä tahansa todellinen data vain diskreeteillä satunnaismuuttujilla, jotka ottavat äärellisen määrän arvoja. Normaalijakauma on vain todellisen jakauman approksimaatio. Joten esimerkiksi tietyn tutkimuksen tiedot, jotka on annettu työssä, saavat arvot välillä 1,0 - 2,2, ts. kaikkiaan 13 mahdollista arvoa. Dirichlet-periaatteesta seuraa, että jossain vaiheessa työtietojen mukaan muodostettu jakaumafunktio eroaa lähimmästä normaalijakaumafunktiosta vähintään 1/26, ts. 0.04 mennessä. Lisäksi on selvää, että satunnaismuuttujan normaalijakaumalla todennäköisyys putoaa diskreettiin desimaalilukujen joukkoon tietyllä määrällä desimaalipaikkoja on 0.

Edellä esitetystä seuraa, että mittaustuloksilla ja yleensä tilastotiedoilla on ominaisuuksia, jotka johtavat siihen, että ne tulisi mallintaa satunnaismuuttujilla, joiden jakaumat poikkeavat enemmän tai vähemmän normaaleista. Useimmissa tapauksissa jakaumat poikkeavat merkittävästi normaalijakaumista, toisissa normaalijakaumia voidaan ilmeisesti pitää jonkinlaisena approksimaationa, mutta täydellistä sattumaa ei koskaan ole. Tämä merkitsee sekä tarvetta tutkia klassisten tilastollisten menetelmien ominaisuuksia ei-klassisissa todennäköisyysmalleissa (samalla tavalla kuin jäljempänä Studentin kriteerille) että tarvetta kehittää stabiileja (ottaen huomioon normaalista poikkeamat) ja ei-parametriset, mukaan lukien jakeluvapaat menettelyt, niiden laaja käyttöönotto tilastotietojen käsittelyssä.

Muiden parametristen perheiden osalta tässä jätetyt huomiot johtavat samanlaisiin johtopäätöksiin. Tulos voidaan muotoilla seuraavasti. Todelliset datajakaumat eivät juuri koskaan kuulu mihinkään tiettyyn parametriperheeseen. Todelliset jakaumat ovat aina erilaisia ​​kuin parametriperheisiin sisältyvät. Erot voivat olla suuria tai pieniä, mutta ne ovat aina olemassa. Yritetään ymmärtää, kuinka tärkeitä nämä erot ovat ekonometriselle analyysille.

todennäköisyysteoriassa ja matemaattisessa tilastossa tarkastellaan erilaisia ​​numeeristen satunnaismuuttujien jakaumien parametrisia perheitä. Nimittäin tutkitaan normaalijakaumien perheitä, logaritmisesti normaalijakaumia, eksponentiaalisia, gammajakaumia, Weibull-Gnedenkon jakaumia jne. Kaikki ne riippuvat yhdestä, kahdesta tai kolmesta parametrista. Siksi jakauman täydelliseksi kuvaamiseksi riittää, että tietää tai arvioi yksi, kaksi tai kolme numeroa. Erittäin mukavasti. Siksi matemaattisten tilastojen parametriteoriaa kehitetään laajasti, jossa oletetaan, että havaintojen tulosten jakaumat kuuluvat johonkin parametriperheeseen.

Valitettavasti parametriperheet ovat olemassa vain todennäköisyysteorian ja matemaattisten tilastojen oppikirjojen tekijöiden mielessä. Niitä ei ole olemassa oikeassa elämässä. Siksi ekonometria käyttää pääasiassa ei-parametrisia menetelmiä, joissa havaintojen tulosten jakaumat voivat olla mielivaltaisia.

Ensin tarkastelemme normaalijakauman esimerkkiä käyttäen yksityiskohtaisemmin parametriperheiden käytännön käytön mahdottomuutta kuvata tietyn taloudellisen tiedon jakaumia. Sen jälkeen analysoimme parametrisia menetelmiä poikkeavien havaintojen hylkäämiseksi ja osoitamme useiden parametristen tilastojen menetelmien käytännön käytön mahdottomuuden, niiden johtamien johtopäätösten virheellisyyden. Sitten analysoimme ei-parametrisiä menetelmiä numeeristen satunnaismuuttujien pääominaisuuksien - matemaattinen odotus, mediaani, varianssi, keskihajonta, variaatiokerroin. Luento päättyy menetelmiin kahden riippumattoman tai toisiinsa liittyvän näytteen homogeenisuuden tarkistamiseksi.

Onko havaintojen jakautuminen usein normaalia?

Ekonometrisissa ja talousmatemaattisissa malleissa, joita käytetään erityisesti markkinointi- ja johtamisprosessien, yritys- ja aluejohtamisen, teknisten prosessien tarkkuuden ja vakauden tutkimuksessa ja optimoinnissa, luotettavuusongelmissa, turvallisuuteen, mukaan lukien ympäristöturvallisuus, teknisten prosessien toimivuus. laitteet ja esineet , organisaatiokaavioiden kehittämisessä sovelletaan usein todennäköisyysteorian ja matemaattisten tilastojen käsitteitä ja tuloksia. Tässä tapauksessa käytetään usein tiettyjä parametrisia todennäköisyysjakaumien perheitä. Suosituin normaalijakauma. Käytetään myös logaritmisesti normaalijakauma, eksponentiaalinen jakauma, gammajakauma, Weibull-Gnedenko-jakauma jne.

On selvää, että mallien vastaavuus todellisuutta on aina tarpeen tarkistaa. On kaksi kysymystä. Eroavatko todelliset jakaumat mallissa käytetyistä? Missä määrin tämä ero vaikuttaa johtopäätöksiin?

Alla on esimerkkinä normaalijakaumasta ja siihen perustuvien jyrkästi erilaisten havaintojen (outliers) hylkäämismenetelmien avulla, että todelliset jakaumat poikkeavat lähes aina klassisten parametriperheiden sisältämistä ja olemassa olevat poikkeamat annetuista perheistä. tehdä tässä tapauksessa vääriä johtopäätöksiä hylkäämisestä näiden perheiden käyttöön perustuen.

Onko mitään syytä olettaa a priori mittaustulosten normaaleja?

Joskus väitetään, että siinä tapauksessa, että mittausvirhe (tai muu satunnainen arvo) määräytyy monien pienten tekijöiden yhteisvaikutuksen tuloksena, niin todennäköisyysteorian keskirajalauseen (CLT) perusteella tämä arvo on hyvin approksimoitu (jakauman perusteella) normaalilla satunnaismuuttujalla. Tämä väite pitää paikkansa, jos pienet tekijät toimivat additiivisesti ja toisistaan ​​riippumatta. Jos ne toimivat moninkertaisesti, niin saman CLT:n vuoksi on tarpeen tehdä likiarvo log-normaalijakauman mukaan. Sovelletuissa ongelmissa ei yleensä ole mahdollista perustella pienten tekijöiden toiminnan additiivisuutta eikä moninkertaisuutta. Jos riippuvuus on luonteeltaan yleinen, sitä ei ole pelkistetty additiiviseen tai multiplikatiiviseen muotoon, eikä ole perusteita hyväksyä malleja, jotka antavat eksponentiaalisia, Weibull-Gnedenko-, gamma- tai muita jakaumia, niin jakauman jakautumisesta ei tiedetä käytännössä mitään. lopullinen satunnaismuuttuja, paitsi sisäiset matemaattiset ominaisuudet, kuten säännöllisyys .

Tiettyjä tietoja käsiteltäessä joskus uskotaan, että mittausvirheitä on normaalijakauma. Normaaliuden olettaen klassiset regression, dispersion mallit, tekijäanalyysit, metrologiset mallit, joita edelleen löytyy sekä kotimaisista normatiivisista ja teknisistä asiakirjoista että kansainvälisistä standardeista. Taloudellisten rakenteiden, teknisten laitteiden ja esineiden toiminnan turvallisuuden varmistavien järjestelmien suunnittelussa käytetyt tiettyjen ominaisuuksien maksimi saavutettavissa olevien tasojen laskentamallit perustuvat samaan olettamukseen. Tälle oletukselle ei kuitenkaan ole olemassa teoreettista perustaa. On tarpeen tutkia kokeellisesti virheiden jakautumista.

Mitä kokeelliset tulokset osoittavat? Monografiassa esitetyn yhteenvedon perusteella voidaan todeta, että useimmissa tapauksissa mittausvirheiden jakauma poikkeaa normaalista. Siten konesähkötekniikan instituutissa (Varna, Bulgaria) tutkittiin analogisten sähköisten mittauslaitteiden vaakojen kalibrointivirheiden jakautumista. Tutkittiin Tšekkoslovakiassa, Neuvostoliitossa ja Bulgariassa valmistettuja laitteita. Virheen jakautumislaki osoittautui samaksi. Sillä on tiheys

Analysoimme tietoja 219 todellisen virhejakauman parametreista, joita eri kirjoittajat ovat tutkineet mitattaessa sekä sähköisiä että ei-sähköisiä suureita monilla erilaisilla (sähkö)laitteilla. Tämän tutkimuksen tuloksena kävi ilmi, että 111 jakaumaa, ts. noin 50 % kuuluu tiheysjakaumien luokkaan

missä on asteparametri; - siirtoparametri; - mittakaavaparametri; - argumentin gammafunktio;

Tarton valtionyliopiston sovelletun matematiikan laboratorio analysoi 2500 näytettä todellisten tilastotietojen arkistosta. 92 prosentissa normaalihypoteesi jouduttiin hylkäämään.

Yllä olevat koetietojen kuvaukset osoittavat, että mittausvirheillä on useimmiten normaalista poikkeavia jakaumia. Tämä tarkoittaa erityisesti sitä, että useimmat Studentin t-testin sovellukset ovat klassisia taantumisanalyysi ja muut normaaliteoriaan perustuvat tilastolliset menetelmät, tarkalleen ottaen, eivät ole perusteltuja, koska niiden taustalla olevien vastaavien satunnaismuuttujien jakaumien normaaliaksiooma on virheellinen.

On selvää, että olemassa olevan tilastotietojen analysointikäytännön perustelemiseksi tai järkeväksi muuttamiseksi on tarpeen tutkia "laittomien" sovellusten tietojen analysointimenettelyjen ominaisuuksia. Hylkäämismenettelyjen tutkimus on osoittanut, että ne ovat erittäin epävakaita normaalista poikkeamille, joten niitä ei ole suositeltavaa käyttää todellisen tiedon käsittelyyn (katso alla); siksi ei voida väittää, että mielivaltaisesti valittu menettely olisi vakaa normaalista poikkeamista vastaan.

Joskus ehdotetaan, että ennen esimerkiksi Studentin testin soveltamista kahden näytteen homogeenisuuden tarkastamiseen. Vaikka tälle on monia kriteerejä, normaaliuden testaus on monimutkaisempi ja aikaa vievä tilastollinen menettely kuin homogeenisuuden testaus (sekä Student-tyyppisillä tilastoilla että ei-parametrisilla testeillä). Normaalin riittävän luotettavaksi toteamiseksi tarvitaan melko suuri määrä havaintoja. Joten sen takaamiseksi, että havaintojen tulosten jakaumafunktio poikkeaa jostain normaalista enintään 0,01 (millä tahansa argumentin arvolla), tarvitaan noin 2500 havaintoa. Useimmissa taloudellisissa, teknisissä, biolääketieteellisissä ja muissa sovellettavissa tutkimuksissa havaintoja on huomattavasti vähemmän. Tämä koskee erityisesti taloudellisten rakenteiden ja teknisten kohteiden toimintavarmuuden varmistamiseen liittyvien ongelmien selvittämiseen käytettyä dataa.

Joskus he yrittävät käyttää DCT:tä lähentääkseen virheen jakautumista normaaliin, mukaan lukien erityiset summaimet mittauslaitteen teknologisessa kaaviossa. Arvioidaan tämän toimenpiteen hyödyllisyyttä. Olkoon riippumattomia identtisesti jakautuneita satunnaismuuttujia jakaumafunktiolla sellainen, että harkitsee

Summainin tarjoama normaaliläheisyyden osoitin on

Oikea epäyhtälö viimeisessä suhteessa seuraa kirjassa saaduista Berry-Esseen-epäyhtälön vakion estimaateista ja vasen monografian esimerkistä. varten normaali laki, yhtenäinen , kaksipiste (tämä on alaraja ). Siksi sen varmistamiseksi, että etäisyys (Kolmogorov-metriikassa) normaalijakaumaan on enintään 0,01 "epäonnistuneiden" jakaumien tapauksessa, tarvitaan ainakin termit, joissa todennäköisyys putoaa diskreettiin desimaalilukujen joukkoon tietyllä määrällä desimaalit on yhtä suuri kuin 0.

Edellä esitetystä seuraa, että mittaustuloksilla ja yleensä tilastotiedoilla on ominaisuuksia, jotka johtavat siihen, että ne tulisi mallintaa satunnaismuuttujilla, joiden jakaumat poikkeavat enemmän tai vähemmän normaaleista. Useimmissa tapauksissa jakaumat poikkeavat merkittävästi normaalijakaumista, toisissa normaalijakaumia voidaan ilmeisesti pitää jonkinlaisena approksimaationa, mutta täydellistä sattumaa ei koskaan ole. Tämä tarkoittaa sekä tarvetta tutkia klassisten tilastollisten menetelmien ominaisuuksia ei-klassisissa todennäköisyysmallit(samalla tavalla kuin alla on tehty Studentin t-testille) ja tarve kehittää stabiileja (ottaen huomioon normaalista poikkeamien olemassaolo) ja ei-parametrisiä, mukaan lukien jakautumisvapaita proseduureja, niiden laaja käyttöönotto tilastollisen käytäntöön. tietojenkäsittely.

Muiden parametristen perheiden osalta tässä jätetyt huomiot johtavat samanlaisiin johtopäätöksiin. Tulos voidaan muotoilla seuraavasti. Todelliset datajakaumat eivät juuri koskaan kuulu mihinkään tiettyyn parametriperheeseen. Todelliset jakaumat ovat aina erilaisia ​​kuin parametriperheisiin sisältyvät. Erot voivat olla suuria tai pieniä, mutta ne ovat aina olemassa. Yritetään ymmärtää, kuinka tärkeitä nämä erot ovat ekonometriselle analyysille.