Centrálna limitná veta v MS EXCEL. Encyklopédia marketingu

Keďže veľa náhodných premenných v aplikáciách vzniká pod vplyvom niekoľkých slabo závislých náhodných faktorov, ich rozdelenie sa považuje za normálne. V tomto prípade treba dodržať podmienku, že žiadny z faktorov nie je dominantný. Centrálne limitné vety v týchto prípadoch oprávňujú použitie normálneho rozdelenia.

Encyklopedický YouTube

  • 1 / 5

    Nech existuje nekonečná postupnosť nezávislých identicky rozdelených náhodných premenných s konečným matematickým očakávaním a rozptylom. Označte posledné µ (\displaystyle \mu ) a σ 2 (\displaystyle \sigma ^(2)), resp. Nechajte tiež

    . S n − μ n σ n → N (0 , 1) (\displaystyle (\frac (S_(n)-\mu n)(\sigma (\sqrt (n))))\to N(0,1) ) distribúciou na ,

    kde N (0, 1) (\displaystyle N(0,1))- normálne rozdelenie s nulovým matematickým očakávaním a štandardnou odchýlkou ​​rovnajúcou sa jednej. Označuje výberový priemer prvého n (\displaystyle n) množstvá, tzn X ¯ n = 1 n ∑ i = 1 n X i (\displaystyle (\bar (X))_(n)=(\frac (1)(n))\sum \limits _(i=1)^( n)X_(i)), môžeme prepísať výsledok centrálnej limitnej vety do nasledujúceho tvaru:

    n X ¯ n − μ σ → N (0 , 1) (\displaystyle (\sqrt (n))(\frac ((\bar (X))_(n)-\mu )(\sigma ))\to N(0,1)) distribúciou na n → ∞ (\displaystyle n\to \infty ).

    Mieru konvergencie možno odhadnúť pomocou  Berry- Esseenovej nerovnosti.

    Poznámky

    • Neformálne povedané, klasická centrálna limitná veta hovorí, že súčet n (\displaystyle n) nezávislé identicky rozdelené náhodné premenné má rozdelenie blízke N (n μ , n σ 2) (\displaystyle N(n\mu ,n\sigma ^(2))). ekvivalentne, X¯n (\displaystyle (\bar(X))_(n)) má distribúciu blízko N (μ , σ 2 / n) (\displaystyle N(\mu ,\sigma ^(2)/n)).
    • Pretože distribučná funkcia štandardného normálneho rozdelenia je spojitá, konvergencia k tomuto rozdeleniu je ekvivalentná bodovej konvergencii distribučných funkcií k distribučnej funkcii štandardného normálneho rozdelenia. Umiestňovanie Z n = S n − μ n σ n (\displaystyle Z_(n)=(\frac (S_(n)-\mu n)(\sigma (\sqrt (n))))), dostaneme F Z n (x) → Φ (x) , ∀ x ∈ R (\displaystyle F_(Z_(n))(x)\to \Phi (x),\;\forall x\in \mathbb (R) ), kde Φ (x) (\displaystyle \Phi (x)) je distribučná funkcia štandardného normálneho rozdelenia.
    • Klasická formulácia centrálnej limitnej vety je dokázaná metódou charakteristických funkcií (Levyho veta o spojitosti).
    • Všeobecne povedané, konvergencia hustôt nevyplýva z konvergencie distribučných funkcií. Napriek tomu v tomto klasickom prípade je to tak.

    Miestny C.P.T.

    Za predpokladov klasickej formulácie predpokladajme navyše, že rozdelenie náhodných premenných ( X i ) i = 1 ∞ (\displaystyle \(X_(i)\)_(i=1)^(\infty )) absolútne súvislý, to znamená, že má hustotu. Potom je distribúcia tiež absolútne kontinuálna a navyše

    f Z n (x) → 1 2 π e − x 2 2 (\displaystyle f_(Z_(n))(x)\to (\frac (1)(\sqrt (2\pi )))\,e^ (-(\frac (x^(2))(2)))) pri n → ∞ (\displaystyle n\to \infty ),

    kde f Z n (x) (\displaystyle f_(Z_(n))(x))- hustota náhodnej veličiny Z n (\displaystyle Z_(n)) a na pravej strane je hustota štandardného normálneho rozdelenia.

    Zovšeobecnenia

    Výsledok klasickej centrálnej limitnej vety platí pre situácie oveľa všeobecnejšie ako úplná nezávislosť a rovnomerné rozdelenie.

    C. P. T. Lindeberg

    Nech nezávislé náhodné premenné X 1 , … , X n , … (\displaystyle X_(1),\ldots ,X_(n),\ldots ) sú definované na rovnakom pravdepodobnostnom priestore a majú konečné matematické očakávania a rozptyly: E [ X i ] = μ i, D [ X i ] = σ i 2 (\displaystyle \mathbb (E) =\mu _(i),\;\mathrm (D) =\sigma _(i)^( 2)).

    Nechať byť S n = ∑ i = 1 n X i (\displaystyle S_(n)=\sum \limits _(i=1)^(n)X_(i)).

    Potom E [ S n ] = m n = ∑ i = 1 n μ i , D [ S n ] = s n 2 = ∑ i = 1 n σ i 2 (\displaystyle \mathbb (E) =m_(n)=\sum \ limity _(i=1)^(n)\mu _(i),\;\mathrm (D) =s_(n)^(2)=\súčet \limity _(i=1)^(n)\ sigma _(i)^(2)).

    A nechajte to bežať Lindebergov stav:

    ∀ ε > 0 , lim n → ∞ ∑ i = 1 n E [ (X i − μ i) 2 s n 2 1 ( | X i − μ i | > ε s n ) ] = 0 , (\displaystyle \forall \varepsilon >0,\;\lim \limits _(n\to \infty )\suma \limits _(i=1)^(n)\mathbb (E) \left[(\frac ((X_(i)-\ mu _(i))^(2))(s_(n)^(2)))\,\mathbf (1) _(\(|X_(i)-\mu _(i)|>\varepsilon s_ (n)\))\vpravo]=0,)

    kde 1 ( | X i − μ i | > ε s n ) (\displaystyle \mathbf (1) _(\(|X_(i)-\mu _(i)|>\varepsilon s_(n)\)))) funkcia - indikátor.

    distribúciou na n → ∞ (\displaystyle n\to \infty ).

    Ts. P. T. Lyapunova

    Nech sa naplnia základné predpoklady Ts. P. T. Lindeberga. Nech náhodné premenné ( X i ) (\displaystyle \(X_(i)\)) mať konečný tretí moment. Potom postupnosť

    r n 3 = ∑ i = 1 n E [ | X i − μ i | 3 ] (\displaystyle r_(n)^(3)=\sum _(i=1)^(n)\mathbb (E) \left[|X_(i)-\mu _(i)|^(3 )\správny]).

    Ak limit

    lim n → ∞ r n s n = 0 (\displaystyle \lim \limits _(n\to \infty )(\frac (r_(n))(s_(n)))=0) (Ljapunov stav), S n − m n s n → N (0 , 1) (\displaystyle (\frac (S_(n)-m_(n))(s_(n)))\to N(0,1)) distribúciou na n → ∞ (\displaystyle n\to \infty ).

    C.P.T. pre martingaly

    Nechajte proces (X n) n ∈ N (\displaystyle (X_(n))_(n\in \mathbb (N) )) je martingal s ohraničenými prírastkami. Predpokladajme najmä to

    E [ X n + 1 − X n ∣ X 1 , … , X n ] = 0 , n ∈ N , X 0 ≡ 0 , (\displaystyle \mathbb (E) \left=0,\;n\in \mathbb (N) ,\;X_(0)\ekviv 0,)

    a prírastky sú rovnomerne ohraničené, tzn

    ∃ C > 0 ∀ n ∈ N | X n + 1 − X n | ≤ C (\displaystyle \existuje C>0\,\forall n\in \mathbb (N) \;|X_(n+1)-X_(n)|\leq C) τ n = min ( k | ∑ i = 1 k σ i 2 ≥ n ) (\displaystyle \tau _(n)=\min \left\(k\left\vert \;\sum _(i=1)^ (k)\sigma _(i)^(2)\geq n\right.\right\)). X τ n n → N (0 , 1) (\displaystyle (\frac (X_(\tau _(n)))(\sqrt (n)))\to N(0,1)) distribúciou na n → ∞ (\displaystyle n\to \infty ).

    Python pre výučbu vedeckej informatiky: Modelovanie systémov radenia

    • Preklad
    • tutoriál

    anotácia

    V tomto príspevku predstavujeme metodológiu pre začiatky vo vedeckej informatike založenú na modelovaní vo vzdelávaní. Ako základ pre skúmané objekty ponúkame viacfázové systémy radenia. Na implementáciu modelov používame Python a paralelné výpočty, ktoré poskytujú výsledky kódovej a stochastickej simulácie.

    1. Úvod a pozadie

    V našej štúdii chápeme význam pojmu „vedecká informatika“ ako využitie počítačov na analýzu a riešenie vedeckých a technických problémov. Odlišujeme ich od jednoduchých numerických výpočtov. Využitie vedeckej informatiky vo vyučovaní je vždy výzvou pre žiaka aj učiteľa. Takýto proces učenia sa zaoberá mnohými technickými a interdisciplinárnymi problémami a tiež si vyžaduje synchronizáciu matematických vedomostí s informatikou. Na prekonanie týchto výziev navrhujeme súbor princípov a metodológie vyučovania, ktorý stavia na konštruktiviznom prístupe k učeniu a poskytuje učiteľovi vhodný štrukturálny základ. To všetko umožňuje študentom vykonávať sériu výpočtových experimentov s počítačovými modelmi. Tento prístup je spojený so znalosťami matematiky a programovania, ktoré sa zase vyučujú v rámci hlavného učiva a úzko s ním súvisia. Sekciu výpočtovej štatistiky budeme považovať za úvodnú časť vedeckej informatiky a za možnú oblasť aplikácie tejto štúdie. Pozadie tejto metodiky je uvedené nižšie.

    1.1. Vedecká informatika

    Carniadax a Kirby II definovali „počítačovú informatiku ako „srdce“ simulačného výskumu. Autori ponúkajú „holistický prístup k numerickým algoritmom, moderným programovacím metódam a paralelným výpočtom... Takéto koncepty a podobné nástroje sa často pravidelne študujú v rôznych súvisiacich kurzoch a učebniciach a vzťah medzi nimi je okamžite zrejmý. Potreba integrovať koncepty a nástroje sa zvyčajne prejaví až po ukončení kurzu, napríklad pri prvej postgraduálnej práci alebo pri písaní dizertačnej práce, čím je študent nútený syntetizovať porozumenie troch nezávislých oblastí do jednej, aby získal požadované riešenie. Aj keď je tento proces nepochybne veľmi cenný, je časovo náročný a v mnohých prípadoch nemusí viesť k efektívnej kombinácii konceptov a nástrojov. Z pedagogického hľadiska môže holistický, integrovaný prístup stimulovať študenta k niekoľkým disciplínam naraz, aby sa zlepšilo porozumenie témam vedeckej informatiky. Obrázok 1 predstavuje definíciu vedeckej informatiky ako priesečníka numerickej matematiky, informatiky a modelovania.


    Ryža. jeden. Vedecká informatika.

    1.2. Konštruktivizmus v učení

    Kane a Kane vo svojom základnom výskume navrhli základné princípy konštruktivizmu v učení. Jedným z najdôležitejších je pre nás toto: "Mozog spracováva časti a celok súčasne."

    Dobre organizovaný proces učenia teda demonštruje základné detaily a nápady. Pri použití prístupu založeného na simulácii sa po vytvorení simulačného modelu stanú ciele štúdie zrejmé. To nám umožňuje sledovať výsledky a vyvodzovať vhodné závery.

    1.3. Učenie založené na simulácii: Prečo modely?

    Gibbons predstavuje v roku 2001 tréningový program založený na simulácii. Zdôraznenie nasledujúcich základných princípov:
    • Študent získava skúsenosti interakciou s modelmi;
    • Študent rieši vedecké a inžinierske problémy experimentovaním s modelom;
    • Zváženie a formulovanie problémov;
    • Definícia špecifických vzdelávacích cieľov;
    • Predloženie všetkých potrebných informácií v kontexte rozhodnutia.
    Millard a kol., navrhujú model facilitovaného učenia pomocou „interaktívnej simulácie“. Autori prezentujú moderné počítačové technológie založené na „sľubnej metodológii“ založenej na „dynamike systému“. "Praktická skúsenosť zahŕňa vytváranie interaktívnych... modelov a ich používanie na testovanie hypotéz a experimentov."

    Lehrer a Schauble sa zameriavajú na experimentovanie s rôznymi reprezentáciami modelu: „Študentské vzdelávanie je lepšie, keď má študent možnosť vytvárať a revidovať viaceré verzie modelov a potom porovnávať primeranosť opisov týchto rôznych modelov.“

    1.4. Vedecká informatika v srdci vzdelávania: experimenty s modelmi

    Xue navrhuje „reformy výučby vo vzdelávaní „vedeckej informatiky“ prostredníctvom modelovania a simulácie. Odporúča „... používať modelovanie a simulácie na riešenie aktuálnych problémov programovania, modelovania a analýzy údajov...“. V matematickom vzdelávaní sa využíva učenie založené na modelovaní. Mnoho modelov je vytvorených pomocou softvéru Geogebra. Modely zohrávajú významnú úlohu vo vedeckom vzdelávaní.

    1.5. Stochastické modelovanie systémov radenia

    Odporúčame použitie radiacich systémov kvôli jednoduchosti ich počiatočných definícií a kvôli širokým možnostiam modelovania a simulácií. Teória radenia je dobre známa a modelovanie systémov radenia (QS) je široko používané vo vede a vzdelávaní. Viacfázové systémy zaraďovania sú dobrou platformou pre študentské experimenty, rovnako ako použitie paralelných výpočtov. Existuje tiež množstvo zaujímavých teoretických výsledkov pre štúdium a výskum.

    1.6. Python vo vzdelávaní založenom na vedeckej informatike

    Python je jedným z najpopulárnejších programovacích jazykov pre vedcov a pedagógov. Python je široko používaný v priemyselnej vedeckej výpočtovej technike. Langtangen podáva správu o dlhodobých skúsenostiach s používaním jazyka Python ako primárneho jazyka na výučbu prírodovedných počítačov na univerzite v Oslo. Python je propagovaný ako prvý jazyk na učenie sa programovania, ako aj na pokročilé štúdium výpočtových metód.

    2. Základy

    Pred začatím modelovania si definujme kľúčové prístupy, ktoré budeme v procese používať. V tejto kapitole sa dotkneme generovania náhodných čísel a rozdelenia pravdepodobnosti, stochastického modelovania. Zvážte elementárnu teóriu pravdepodobnosti. Hlavnou úlohou týchto experimentov bude experimentálny dôkaz Centrálnej limitnej vety. Modely a experimenty s týmito modelmi objasňujú princíp generátorov pseudo- a kvázináhodných čísel, ako aj pochopenie exponenciálneho rozdelenia. To môže poskytnúť základ pre podrobnejšie experimenty s modelmi QS.

    2.1. Náhodné premenné a distribúcie

    Všetky prvky teórie pravdepodobnosti sa tradične považujú za ťažko pochopiteľné a sú vždy v oblasti záujmu medzinárodných vzdelávacích inštitúcií. Tieto otázky zároveň zohrávajú dôležitú úlohu vo vedeckom výskume. Modelovací prístup uľahčuje pochopenie tohto materiálu. Model, na ktorý sa pozrieme v tomto článku, je jednoduchý model hodu jednou alebo viacerými kockami, počnúc jednou a končiac niekoľkými.

    Úloha týchto úvodných experimentov je pomerne zložitá. Pozrieme sa nielen na rozdelenia pravdepodobnosti, ale dotkneme sa aj modelovania a paralelných výpočtov. Vo vedeckom výskume urobíme jeden krok vpred: experimentálne dokážeme Centrálnu limitnú vetu.

    Začneme generovaním náhodných čísel (bez ovplyvnenia rozdelenia). Potom vysvetlíme rovnomerne rozdelené náhodné premenné. Diskusie o skutočnej náhodnosti a kvázi náhodnosti uvádzajú autori. Pre pokročilých bude predstavená séria experimentov s pseudonáhodným generátorom Pythonu. V počiatočnej fáze, kvôli prehľadnosti štúdie, zvýšime počet testov pozorovaním výsledku simulácie. V ďalšom kroku prejdeme na zložitejšie experimenty a paralelné výpočty. Na modelovanie použijeme modul náhodných premenných Python a na paralelné výpočty knižnicu mpi4py. Python Random Module je založený na generátore pseudonáhodných čísel pre rôzne distribúcie. Napríklad: random.randint(a,b) vráti náhodné celé číslo N, kde a ≤ N ≤ b a random.expovariate(lambd) vráti exponenciálne rozdelené náhodné premenné s parametrom 'lambd'. Viac podrobností nájdete v dokumentácii Pythonu. Programovanie modelu hádzania kockou je znázornené na obrázku 2.

    Import pylab import random number_of_trials =100 ## Tu simulujeme opakované hádzanie jedinej šesťhrannej kocky list_of_values ​​​​= pre i v rozsahu (počet_pokusov): list_of_values.append(random.randint(1,6)) print "Skúšky =" , počet_skúšok, "krát." print "Mean =", pylab.mean(list_of_values) print "Štandardná odchýlka =", pylab.std(list_of_values) pylab.hist(list_of_values, bins=) pylab.xlabel("Value") pylab.ylabel of times("Počet ") pylab.show()
    Ryža. 2. Programovanie modelu hodu jednou kockou v Pythone

    Výsledky simulácie hodu jednou kockou sú znázornené na obrázku 3.


    Ryža. 3. Výsledky simulácie jednej kocky


    Ryža. 4. Porovnanie funkcií hustoty pravdepodobnosti

    Proces učenia pokračuje úpravou kódu na simuláciu hodu dvoma kockami tak, aby sa začal uvažovať prípad s viacerými kockami. Kód je podobný kódu s jednou kockou, s výnimkou dvoch riadkov kódu nižšie:

    List_of_values.append(random.randint(1, 6) + random.randint(1, 6)) ... pylab.hist(list_of_values, pylab.arange(1.5, 13.5, 1.0)) ...
    Výsledok výpočtov v prípade dvoch kociek je znázornený na obrázku 5.


    Ryža. 5. Prípad dvoch kociek

    Teraz môžeme zvážiť normálne rozdelenie. Úlohou v tejto fáze je ukázať, ako predchádzajúci prípad s niekoľkými kockami koreluje s normálnym rozdelením. Ďalší problém nám predstaví priemer a smerodajnú odchýlku. Kód zostáva rovnaký ako v prípade jednej kocky, s výnimkou nižšie uvedených pokynov:

    List_of_values.append(random.normalvariate(7, 2.4)) ...
    Výsledky simulácie pre normálne rozdelenie sú znázornené na obrázku 6.


    Ryža. 6. Výsledok simulácie pre normálne rozdelenie

    Posledným krokom je demonštrovať exponenciálne rozdelenie. Exponenciálne rozdelenie sa používa na modelovanie rozloženia (trvania) intervalov medzi momentmi príchodu požiadaviek v systémoch rôznych typov. Výsledky ich modelovania sú uvedené na obrázkoch 7 a 8.

    Import pylab import random number_of_trials = 1000 number_of_customer_per_hour = 10 ## Tu simulujeme medzipríchodový čas zákazníkov list_of_values ​​​​= pre i v rozsahu (počet pokusov): list_of_values.append(random.expovariate(number_of_customer_lab.b. priemer (zoznam_hodnot) std=pylab.std(zoznam_hodnot) print "Pokusy =", počet_pokusov, "krát" tlač "Priemer =", stredná hodnota "Štandardná odchýlka =", std pylab.hist(zoznam_hodnot,20) pylab.xlabel( "Hodnota") pylab.ylabel("Počet krát") pylab.show()
    Ryža. 7. Pythonský model pre exponenciálnu distribúciu


    Ryža. osem. Výsledok simulácie pre exponenciálne rozdelenie

    2.2. Stochastická simulácia

    Stochastické modelovanie je dôležitým prvkom vedeckej informatiky. Zameriame sa na metódu Monte Carlo. Po zostavení modelu môžeme generovať náhodné premenné a experimentovať s rôznymi systémovými parametrami. V rámci tohto článku je kľúčovým bodom experimentov Monte Carlo mnohokrát opakovať testy, aby sa výsledky zhromaždili a integrovali. Najjednoduchšia aplikácia bola popísaná v predchádzajúcej časti. Zvýšením počtu testov zvýšime presnosť výsledkov simulácie.

    Tu musí študent vykonať určitý počet experimentov s použitím tohto jednoduchého modelu zvýšením počtu pokusov. Zvýšením počtu kociek a počtu pokusov študent zažije pomerne dlhé výpočtové časy. To je skvelý dôvod na použitie paralelných výpočtov. Pythonský model pre niekoľko kociek je znázornený na obrázku 9. A výsledky simulácie sú znázornené na obrázku 10. Ďalším krokom je zváženie všeobecnejších problémov súvisiacich s rôznymi systémami radenia. Stručný úvod do klasifikácie QS je uvedený v ďalšej časti tohto článku. Začnime systémom M/M/1 a zložitejšími systémami radenia. Základným pojmom stochastických procesov sa budeme podrobne venovať v tejto časti článku. Ako možný príklad môžeme navrhnúť problém štúdia výstupného prúdu. Dokážme, že výstup M/M/1 systému je Poissonov tok. Takto zozbierané dáta budú prezentované vo forme konštruovaného výstupného empirického histogramu.

    Import pylab import náhodný počet_skúšok = 150 000 počet_kociek = 200 ## Tu simulujeme opakované hádzanie ## množstva jednoduchých šesťstranných kociek zoznam_hodnotí= pre i v rozsahu(počet_pokusov): súčet=0 pre j v rozsahu(počet_kociek ): sum+=random.randint(1,6) list_of_values.append(sum) mean=pylab.mean(list_of_values) std=pylab.std(list_of_values) print "Skúšky =", počet_skúšok, "krát" print "Priemerná =" , stredná tlač "Štandardná odchýlka =", std pylab.hist(zoznam_hodnot,20) pylab.xlabel("Hodnota") pylab.ylabel("Počet krát") pylab.show()
    Ryža. deväť. Simulačný model Pythonu pre rozšírenú normálnu distribúciu


    Ryža. desať. Výsledok simulácie pre rozšírené normálne rozdelenie

    3. Viacfázové systémy radenia a stochastické modelovanie

    Nižšie je uvedený úvodný popis QS, berúc do úvahy nuansy modelovania a stochastiky.

    3.1. Systémy radenia

    Jednoduchý systém radenia pozostáva z jedného servera, ktorý spracováva prichádzajúce požiadavky. Všeobecná schéma jednoduchého systému radenia je znázornená na obrázku 11. Vo všeobecnosti QS pozostáva z jedného alebo viacerých serverov, ktoré spracúvajú prichádzajúce požiadavky. Je tiež možné mať jeden alebo viac servisných krokov s jedným alebo viacerými servisnými zariadeniami v každej fáze. Prichádzajúci klienti, ktorí našli všetky servery zaneprázdnené, sa zapoja do jedného alebo viacerých frontov pred obslužnými zariadeniami. Existuje mnoho aplikácií, ktoré možno použiť na modelovanie QS, ako sú výrobné systémy, komunikačné systémy, systémy údržby a iné. Všeobecný QS možno charakterizovať tromi hlavnými komponentmi: tok požiadaviek, proces služby a metóda radenia. Aplikácie môžu pochádzať z niekoľkých obmedzených alebo neobmedzených zdrojov.


    Ryža. jedenásť. Jednoduché CMO.

    Proces vydávania lístkov popisuje, ako lístky prichádzajú do systému. Poďme definovať
    ako časový interval medzi príchodom škôd medzi a -tou škodou, očakávaný (priemerný) čas medzi príjmami škôd ako aj frekvenciu prijímania škôd ako

    Tiež definujeme ako počet obslužných zariadení. Obslužný mechanizmus je definovaný týmto číslom. Každý server má svoj vlastný front, ako aj pravdepodobnostnú distribúciu času služby požiadavky.

    Definujme ako čas obsluhy -tej požiadavky, ako priemerný čas obsluhy požiadavky a ako rýchlosť obsluhy požiadavky.

    Pravidlo, ktoré server používa na výber ďalšej požiadavky z frontu, sa nazýva disciplína frontu QS. Najbežnejšie disciplíny radenia sú: Priorita – zákazníci sú obsluhovaní v poradí podľa ich dôležitosti. FIFO - kto prv príde, ten prv melie; LIFO - zásobník, posledný príde, ten prv melie. Rozšírená klasifikácia systémov podľa Kendalla používa 6 symbolov: A/B/s/q/c/p, kde A je rozdelenie intervalov medzi prichádzajúce požiadavky, B je rozdelenie servisných intervalov, s je počet serverov, q sú disciplíny služieb (vynechané pre FIFO), c – kapacita systému (vynechané pre nekonečné fronty), p – počet možných požiadaviek (vynechané pre otvorené systémy) . Napríklad M/M/1 popisuje vstupný Poissonov tok, jeden exponenciálny server, jeden nekonečný FIFO front a nekonečný počet zákazníkov.

    QS sa používajú na modelovanie a štúdium rôznych oblastí vedy a techniky. Môžeme napríklad modelovať a študovať výrobné alebo dopravné systémy pomocou teórie radenia. Okrem toho sa požiadavky na služby považujú za aplikácie a postupy údržby za mechanizmus služieb. Ďalším príkladom sú: počítače (terminálne požiadavky a odpovede servera), počítačové viacdiskové pamäťové systémy (požiadavky na zápis/čítanie dát, spoločný diskový radič), zväzková rádiová komunikácia (telefónne signály, opakovače), počítačové siete (požiadavky , kanály). V biológii možno teóriu radenia použiť na modelovanie enzýmových systémov (proteíny, všeobecné enzýmy). V biochémii je možné model čakacej siete použiť na štúdium regulačného reťazca operónu LAK.

    3.2. Prečo viacfázový?

    Zvážte viacfázový QS, ktorý pozostáva z niekoľkých servisných zariadení, ktoré sú zapojené do série a majú neobmedzený počet požiadaviek. Čas medzi požiadavkami a čas spracovania sú nezávislé a exponenciálne rozdelené. Front je nekonečný s disciplínou služby FIFO. Viacfázový QS prirodzene odráža topológiu viacjadrových počítačových systémov. Ako uvidíme neskôr, každý model sa dá jednoducho napísať v programovacom jazyku, naučiť sa a upravovať. Model tiež umožňuje porovnávacie štúdium rôznych prístupov k multiprocesingu. Viacfázový model QS je znázornený na obrázku 12.


    Ryža. 12. Viacfázové QS.

    3.3. Teoretický základ

    V prípade štatistického modelovania sa vždy stretávame s problémom overovania počítačového kódu. Vždy existuje otvorená otázka chýb v našom programe alebo algoritme. Model nie je plne analytický a pri každom spustení programu máme rôzne vstupné/výstupné údaje. Na kontrolu správnosti kódu alebo algoritmu sú teda potrebné rôzne prístupy (od prístupu, ktorý používame v prípade plne deterministických vstupných údajov). Na vyriešenie tohto problému musíme použiť teoretické výsledky niektorých štúdií, ktoré možno nájsť vo vedeckej literatúre. Tieto výsledky nám poskytujú základ pre overenie a analýzu výstupných údajov, ako aj pre riešenie problému správnosti výsledkov simulácie.

    Prešetríme čas zdržania reklamácie vo viacfázovom QS. Označte ako čas zotrvania požiadavky v systéme, ako čas obsluhy n-tá aplikácia j-tá fáza. Zvážte, ako pre k-tá fáza.

    Existuje konštanta taká, že

    Veta. Ak sú splnené podmienky (1) a (2).

    3.4. Štatistické modelovanie

    Po zostavení modelu by sme mohli spustiť sériu experimentov s týmto modelom. To vám umožní študovať niektoré charakteristiky systému. Môžeme emitovať náhodné premenné s očakávaným priemerom a vypočítať (pomocou rekurzívnej rovnice nižšie) požadované hodnoty na štúdium. Tieto hodnoty budú tiež náhodné (máme stochasticitu vstupných údajov nášho modelu - náhodný čas medzi príchodom požiadaviek a náhodným servisným časom). V dôsledku toho môžeme vypočítať niektoré parametre týchto náhodných premenných (premenných): strednú hodnotu a rozdelenie pravdepodobnosti. Túto metódu nazývame štatistické modelovanie kvôli náhodnosti prítomnej v modeli. Ak sú potrebné presnejšie výsledky, musíme zopakovať experimenty s naším modelom a potom integrovať výsledky, potom vypočítať integrálne charakteristiky: strednú hodnotu alebo štandardnú odchýlku. Hovorí sa tomu metóda Monte Carlo a v článku bola popísaná o niečo vyššie.

    3.5. Rekurentná rovnica

    Na vývoj algoritmu na modelovanie vyššie opísaného QS je potrebné analyzovať niektoré matematické konštrukcie. Hlavnou úlohou je preštudovať a vypočítať čas zdržania požiadavky s číslom n vo viacfázovom QS pozostávajúcom z fáz. Môžeme dať nasledujúcu rekurzívnu rovnicu , označujúcu: - čas príchodu -tého rádu; ako čas obsluhy -tého nároku -tej fázy; . Nasledujúca rekurzívna rovnica platí pre čakaciu dobu --tého rádu -tej fázy:

    Predpoklad. Rekurzívna rovnica na výpočet doby zotrvania aplikácie vo viacfázovom QS.

    Dôkaz. Platí, že ak je čas , potom čakacia doba v -tej fáze -tého rádu je 0. V tomto prípade , čakacia doba v -tej fáze -tého rádu a . Ak vezmeme do úvahy vyššie uvedené dva prípady, konečne máme zamýšľaný výsledok.

    Teraz môžeme začať implementovať potrebné algoritmy na základe všetkých získaných teoretických výsledkov.

    4. Python pre multiprocessing

    Python ako programovací jazyk je medzi vedcami a pedagógmi veľmi obľúbený a môže byť veľmi atraktívny pre riešenie vedecky orientovaných problémov. Python poskytuje výkonnú platformu pre modelovanie a simuláciu, vrátane grafických nástrojov, širokej škály matematických, štatistických a multiprocesných balíkov. Pre skrátenie času vykonávania je potrebné kombinovať Python a C kód. To všetko nám dáva výkonnú modelovaciu platformu na získavanie štatistických údajov a spracovanie výsledkov. Kľúčovými pojmami v Pythone, ktoré sú dôležité aj pri modelovaní, sú dekorátory, korutíny, výnosové výrazy, multiprocessing a fronty. Tieto body Beasley vo svojej knihe veľmi dobre zváži. Napriek tomu existuje niekoľko spôsobov, ako organizovať medziprocesovú komunikáciu, a začneme s využitím frontov, pretože to je vo svetle štúdia QS veľmi prirodzené.

    Nižšie je uvedený jednoduchý príklad výhod použitia multiprocessingu na zvýšenie efektívnosti a účinnosti kódu. Študent môže zlepšiť výsledky simulácie využitím paralelných výpočtov na superpočítačoch alebo klastrových systémoch. Na jednej strane nám multiprocesing umožní zosúladiť viacfázový model s prostriedkami viacjadrového procesora a na druhej strane môžeme pomocou multiprocesingu vykonať sériu paralelných testov Monte Carlo. Na tieto dva prístupy sa pozrieme v ďalšej časti. Pre motivovaných študentov nasleduje krátky úvod do multiprocesingu s Pythonom.

    Začneme použitím modulu mpi4py. To je dôležité pre predstavenie hlavnej myšlienky fungovania MPI. Jednoducho skopíruje poskytnutý program do jedného z užívateľom definovaných jadier procesora a integruje výsledky po použití metódy collect(). Príklad kódu Python (obr. 13) a výsledky simulácie (obr. 14) sú uvedené nižšie.

    #!/usr/bin/python import pylab import náhodný import numpy ako np z mpi4py import MPI kocky=200 pokusov= 150000 hodnotenie = MPI.COMM_WORLD.Get_rank() veľkosť = MPI.COMM WORLD.Get_size() názov = názov_procesu MPI.Get () random.seed(rank) ## Každý proces - jedno hádzanie určitého počtu hodnôt šesťhrannej kocky= np.nuly(pokusy) pre i v rozsahu (pokusy): súčet=0 pre j v rozsahu (kocky): sum+=random.randint(l,6) values[i]=sum data=np.array(MPI.COMM_WORLD.gather(values, root=0)) if rank == 0: data=data.flatten() mean= pylab.mean(data) std=pylab.std(data) print "Počet pokusov =", veľkosť*skúšky, "krát." print "Priemerná =", stredná tlač "Štandardná odchýlka =", std pylab.hist(údaje,20) pylab.xlabel("Hodnota") pylab.ylabel("Počet časov") pylab.savefig("multi_dice_mpi.png" )
    Ryža. trinásť. Python model pre rozšírenú normálnu distribúciu pomocou MPI.


    Ryža. štrnásť. Normálna distribúcia pomocou MPI.

    5. Výchovný prístup založený na simulácii

    Viacfázové QS nám poskytujú jadro pre vývoj vhodného prístupu založeného na simulácii. Tento prístup zahŕňa základné pojmy opísané v predchádzajúcich častiach, ako aj komplexnejšie teoretické výsledky a metódy. Hlavné myšlienky sú stochastickej povahy: náhodné premenné, náhodné číselné rozdelenia, generátory náhodných čísel, centrálna limitná veta; Konštrukcie programovania v Pythone:
    dekoratérov, korutíny a výrazy yeildu. Komplexnejšie výsledky zahŕňajú nasledujúce teoretické koncepty: čas strávený nárokom v systéme, rekurzívna rovnica na výpočet času stráveného nárokom v QS, metódy stochastického modelovania a multiprocesorové technológie. Obrázok 15 zobrazuje hlavný diagram popisujúci vzdelávací rámec.


    Ryža. pätnásť. Vzdelávací prístup založený na simulácii

    Všetky tieto teoretické a programové štruktúry umožňujú študentovi experimentovať s rôznymi modelmi viacfázových QS. Účel týchto experimentov je dvojaký. Po prvé, vedie študentov k pochopeniu nasledujúcej postupnosti, ktorá je dôležitá pre akýkoľvek vedecký výskum: teoretické fakty potrebné na štúdium, matematické modely, programové štruktúry, počítačové modely, stochastické modely a pozorovanie výsledkov simulácií. Študent tak získa úplný obraz o všeobecnom vedeckom výskume (obrázok 16).


    Ryža. šestnásť. Oblasť výskumu

    Tento prístup umožní hlbšie pochopenie stochastického modelovania a základných softvérových konštrukcií, ako je multiprocesing a paralelné programovanie. Tieto ustanovenia sú mimoriadne dôležité v oblasti vedeckej výpočtovej techniky.

    5.1. Modelové experimenty

    V tejto časti uvažujeme o troch počítačových modeloch viacfázového QS. Všetky tieto modely sa líšia vo svojich filozofických a kľúčových črtách. Napriek tomu, že účelom experimentov je vytvorenie štatistického modelu a štúdium hlavných parametrov viacfázových systémov, idey týchto modelov sú úplne odlišné. Porovnanie týchto základných myšlienok pomôže študentovi pochopiť základné pojmy, ktoré sú základom paralelných výpočtov, viacprocesorového štatistického a simulačného modelovania.

    Prvý nami prezentovaný model je založený na zázname v reálnom čase a nazývame ho simulačný model. Používa multiprocesorový modul Python. Presnosť tohto modelu závisí od presnosti a rozlíšenia metódy time(). Môže byť dosť nízka v prípade rôznych operačných systémov na všeobecné použitie a dosť vysoká v prípade systémov v reálnom čase. Študent môže tento model upraviť pomocou predtým navrhnutej rekurzívnej rovnice (na výpočet času stráveného entitou v systéme) a porovnať výsledky v oboch prípadoch.

    Nasledujúci model počíta čas zotrvania objednávky v systéme a je založený na stochastickej simulácii. Model nevyužíva priamo multiprocesing. Multiprocesing je emulovaný pomocou výnosu vo výrazoch Pythonu.

    Najnovší model je tu prezentovaný pomocou modulu Python MPI mpi4py. Tu používame skutočný MPI (multiprocesorový) prístup na štatistické modelovanie a vďaka tomu môžeme zvýšiť počet testov v metóde Monte Carlo.

    Vo všeobecnosti je úlohou študenta vytvoriť sériu experimentov s poskytnutými modelmi a získať experimentálny dôkaz o zákone iterovaného logaritmu pre čas zotrvania aplikácie vo viacfázovom QS.

    5.2. Simulačný model využívajúci multiprocesorovú službu

    Nižšie je uvedený simulačný model. Hlavnou otázkou na štúdium je rozdiel medzi simulačným modelom a štatistickým modelom. Ďalšou dôležitou otázkou je správnosť a presnosť simulačného modelu. Dôležitá je aj otázka správnosti a presnosti prezentovaného modelu. Študent môže skúmať a porovnávať výsledky simulácie v závislosti od rôznych parametrov, ako je interval a frekvencia spracovania, počet požiadaviek a počet obslužných uzlov. Všeobecná schéma modelu je znázornená na obrázku 17.


    Ryža. 17. simulačný model

    Programový kód Kód sa skladá z dvoch hlavných častí. Prvý je určený priamo na výpočty a ďalší na vykresľovanie výsledkov. Kalkulačný modul obsahuje tri hlavné funkcie: producent() - na prijímanie požiadaviek a ich umiestňovanie na prvé miesto; server() - na obsluhu požiadaviek; Consumer() - na získanie výsledkov. Tento programovací model je založený na reálnej simulácii a na výpočty nepoužíva matematické výrazy. Jeho presnosť závisí od presnosti dočasného modulu Pythonu a vo všeobecnosti závisí od operačného systému. Výpočet práce obslužných zariadení je rozdelený medzi rôzne procesy v rámci multiprocesorového systému. Počítačový kód na implementáciu vyššie uvedeného modelu je znázornený na obrázku 18.

    Importovať čas importu s viacnásobným spracovaním importovať náhodný import numpy ako np def server(input_q,next_q,i): while True: item = input_q.get() if i==0:item.st=time.time() ## začiatok nahrávania ## (prvá fáza) timc.sleep(random.expovariate(glambda|i])) ##zastavte čas nahrávania (posledná fáza), ak i==M-1:item.st=time.time()-item.st next_q.put(item) input_q.task_done() print("Server%d stop" % i) ##nikdy sa nevytlačí prečo? def producent(sekvencia,výstup_q): pre položku v poradí: time.sleep(random.expovariate(glambda)) output_q.put(ilem) def Consumer(input_q): "Dokončenie procedúr" ## spustenie nahrávania čas spracovania ptime=čas. time() in_seq= while True: item = input_q.get() in_scq+= input_q.task_done() if item.cid == N-1: break print_results(in_seq) print("END") print("Čas spracovania sek. %d" %(time.time()-ptime)) ## zastavenie nahrávania čas spracovania printf("Použitý procesor %d" %(multiprocessing.cpu_count())) def print_resulls(in_seq): "Výsledky výstupu" f=open ("out.txt","w") f.write("%d\n" % N) pre l v rozsahu (M): f.write("%d%s" % (glambda[t]," ,")) f.write("%d\n" % glambda[M]) pre t v rozsahu (N-1): f.write("%f%s" % (in_seq[t].st," ,")) f.write("%f\n" % (in_seq.st)) f.close() class Klient(objekt): "Klient triedy" def __init__(self,cid,st): self.cid= cid ## ID zákazníka self.st=st ## čas pobytu zákazníka ###GLOBALS N=100 ## celkový počet zákazníkov, ktorí prišli M=5 ## počet serverov ### glambda - príchod + frekvencia servisu ### = zákazníci/za jednotku času glambda=np.array(+) ###START if __name__ == "__main__": all_clients= q= pre i v rozsahu (M): serv = multiprocessing.Process(target=server,args=(q[i],q,i)) serv.daemon=True serv.start() cons = multiprocessing.Process(target=consumer,args=(q[M] ,)) cons.start() ### začať "produkovať" zákazníkov producent (all_clients,q) pre i v q: i.join()
    Ryža. osemnásť. Python kód pre simulačný model využívajúci multiprocesorovú službu.

    Otázky na štúdium:

    • Ako sa poskytujú a zdieľajú globálne premenné medzi procesmi?
    • Ako ukončiť procesy spojené s rôznymi servisnými zariadeniami?
    • Ako sa prenáša tok informácií medzi rôznymi procesmi?
    • A čo správnosť modelu?
    • Čo sa týka účinnosti modelu. Ako dlho bude trvať, kým si rôzne procesy vymenia informácie?
    Teraz môžeme vytlačiť výsledky pomocou modulu matplotlib a po poskytnutí grafu môžeme výsledky vizuálne analyzovať. Vidíme (obrázok 19), že model potrebuje ďalšie zlepšenie. Môžeme teda prejsť na výkonnejší model.


    Ryža. devätnásť. Výsledky simulácie simulačného modelu multiprocesorovej služby.

    5.3. Jednotkový procesný štatistický model

    Hlavným rysom štatistického modelu je nasledovné: teraz používame rekurzívnu rovnicu na presný výpočet času stráveného objednávkou v systéme; všetky údaje spracovávame v jedinom procese pomocou špecifickej funkcie korutín Pythonu; pre lepšiu spoľahlivosť výpočtov vykonávame určitý počet simulácií Monte Carlo. Tento model nám poskytuje „presné“ výpočty času, ktorý objednávka strávi v systéme. Hlavná schéma modelu je znázornená na obrázku 20. Študent môže preskúmať rozdiely medzi simulačným modelom a štatistickým modelom.


    Ryža. 20. Jednotkový procesný štatistický model

    Programový kód na implementáciu vyššie uvedeného modelu je znázornený na obrázku 21. Výsledky simulácie sú znázornené na obrázku 22.

    #!/usr/bin/python import náhodný čas importu import numpy ako np z numpy import linspace def coroutine(func): del start(*args,**kwargs): g = func(*args,**kwargs) g. next() return g return start def print_header(): "Výsledky výstupu - hlavička" f=open("out.txt","w") f.write("%d\n" % N) ##počet bodov v šablóne tlače f.write("%d\n" % TMPN) pre t v rozsahu (M): f.write("%d%s" % (glambda[t],",")) f.write( "%d\n" % glambda[M]) f.close() def print_results(in_seq): "Výsledky výstupu" f=open("out.txt","a") k=() pre i v rozsahu( N-2): if in_seq[i].cid==template[k]: f.write("%f%s" % (in_seq[i].st,",")) k+=1 f.write( "%f\n" % (in_seq.st)) f.close() coroutine def server(i): ST=0 ##čas pobytu pre predchádzajúceho klienta item=Žiadne, kým platí: item = (výnosová položka) ## získať položku, ak položka == Žiadne: ##new Monte Carlo iterácia ST=0 pokračovať wait_time=max(0.0,ST-item.st-item.tau) item.st+=random.expovariate(glambda)+waiting_time ST=item. st def producent(): výsledky= i=0, zatiaľ čo True : ak i == N: prerušenie c=Klient(i,0.,0.) ak i!=0: c.tau=random.expovariate(glambda) i+= 1 pre s v p: c=s.odoslať( c) results+=[c] for s in p: c=s.send(None) ##final signal return results class Klient(objekt): def __init__(self,cid,st,tau): self.cid=cid self .st=st self.tau=tau def params(self): return (self.cid,self.st,self.tau) stt=time.time() N=1000000 ## Klienti M=5 ## Servery ## Frekvencia vstupu/služby glambda= + MKS=20 ## Výsledky simulácie Monte Carlo ## Počet bodov v tlačovej šablóne TMPN=N/10000 ## šablóna pre tlač= mapa(int,linspace(0,N-1,TMPN) ) print_header() p= pre i v rozsahu (M):p += pre i v rozsahu! MKS): print_results(producer()) print("Krok=%d" % i) sys.stdout.write("Čas spracovania:%d\n" % int(time.time()-stt))
    Ryža. 21. Python kód pre štatistický model jednotkového procesu


    Ryža. 22. Výsledky simulácie pre jednotkový proces štatistického modelu

    5.4. Štatistický model na MPI

    Ďalším krokom vo vývoji nášho modelu je použitie modulu Python MPI - mpi4py. To nám umožňuje spustiť viac simulácií Monte Carlo a použiť klaster na spustenie a testovanie modelu. Ďalším krokom by malo byť ďalšie vylepšovanie modelu na základe použitia programovacieho jazyka C, „skutočnej“ technológie MPI alebo SWIG (https://ru.wikipedia.org/wiki/SWIG) pre Python. Tento model je takmer identický s predchádzajúcim modelom, len s tým rozdielom, že mpi4py sa používa na multiprocessing a integráciu výsledkov (obrázok 23).


    Ryža. 23.Štatistický model MPI

    Okrem predchádzajúceho modelu je potrebné importovať niekoľko doplnkových modulov. Funkciu print_results() je tiež potrebné prepísať, pretože v tejto fáze máme viac testov. Musíme tiež prepísať hlavnú časť programu. Na obrázku 24 sme poskytli iba tú časť kódu, ktorá sa líši od kódu predchádzajúceho modelu. Výsledky simulácie sú znázornené na obrázku 25.

    Import sys z mpi4py import MPI .................... def print_results(in_seq): "Výstupné výsledky" f=open("out.txt","a") for m in range(int(size)): for j in range(MKS): for i in range(TMPN-l): f.write("%f%s" % (in_seq[m].st,", ")) f.write("%f\n" % (in_seq[m][(TMPN-l)+j*TMPN].st)) f.close() ........... ......... stt=time.time() #čas začiatku procesu poradie = MPI.COMM_WORLD.Get_rank() size = MPI.COMM_WORLD.Get_size() name = MPI.Get_processor_name() N= 10 **3 ## Klienti M=5 ## Servery ## Frekvencia vstupu/služieb glambda=+ ## Počet Monte-Carlo simulácií pre tento konkrétny proces MKS=20 TMPN=200 ## Počet bodov v šablóne tlače = mapa (int,linspace(0,N-1,TMPN)) ## bodov za tlač p= výsledky= ## výsledky tohto procesu total_results= ## celkové výsledky pre i v rozsahu(M):p += pre i v rozsahu( MKS):results+=producer() total_results=MPI.COMM_WORLD.gather(results,0) random.seed(rank) if rank == 0: print_header() print_results(total_results) sys.stdout.write("Procesy ng čas: %d\n" % int(time.time()-stt))
    Ryža. 24. Python kód pre štatistický model založený na MPI


    Ryža. 25. Výsledky simulácie štatistického modelu MPI

    6. Závery

    V tomto článku bolo zvážených niekoľko modelov pre učenie založené na simulácii. Tieto modely umožňujú študentovi vykonávať sériu experimentov a zvyšovať porozumenie disciplíny vedeckej informatiky. Existuje niekoľko úrovní zložitosti prezentovaných modelov a experimentov s takýmito modelmi. Prvá úroveň je základná. Privádza nás k pochopeniu náhodných premenných a tiež nám dáva primárne pochopenie oblasti vedeckého výskumu. Ďalšia úroveň je pokročilejšia a poskytuje hlbšie pochopenie paralelného programovania a stochastickej simulácie. Sú prezentované relevantné teoretické poznatky a v prípade potreby môžu byť použité ako doplnkový materiál. Toto všetko poskytuje základný súbor nástrojov pre úvod do vedeckej informatiky. Na záver by sme chceli uviesť odporúčania na ďalšie štúdium a zlepšenie modelov.

    6.1. Linearita modelu a štatistické parametre QS

    Viacfázový model QS uvedený v tomto článku nie je lineárny. Toto je zrejmé z rekurzívnej rovnice, pretože obsahuje nelineárnu matematickú funkciu max. Ak chceme získať správne výsledky simulácie, najmä v prípade výpočtu štatistických parametrov QS, musíme na výpočet použiť čiastočne lineárny model. Toto je obzvlášť dôležité pre nezaťažené dopravné systémy, pretože inak môžeme získať dosť veľký chybný rozdiel vo výpočtoch.

    6.2. Rozšírenia modulu Python a paralelné programovanie C

    Pre skúsených študentov môže byť zaujímavé pokračovať v zlepšovaní efektívnosti kódu. Dá sa to dosiahnuť rozšírením modulov Pythonu o implementované funkcie C pomocou technológie SWING. V klastrových systémoch je možné zlepšiť výpočty kódu a urýchliť výpočty pomocou Cythonu, programovacieho jazyka C, „skutočných“ technológií MPI a HTC (high performance computing).

    6.3. Efektívnosť softvérových riešení a ďalší vývoj

    V tejto časti môže študent preskúmať efektivitu rôznych softvérových riešení. Táto téma je dôležitá pre všetky programovacie modely, ktoré sú založené na paralelnom výpočte. Študent môže študovať efektivitu rôznych programovacích modelov a pokúsiť sa krok za krokom vylepšiť algoritmy. Kľúčovým bodom je tu študovať pomer počtu informačných tokov a výpočtov pre rôzne softvérové ​​procesy. Pomer je teda dôležitý pri budovaní najefektívnejšieho vývoja programu s paralelným výpočtom. Ďalšou zaujímavou témou je štúdium možnosti prevodu algoritmickej štruktúry na klastrovanú štruktúru HTC.

    Ako ďalšiu výskumnú úlohu autori považujú modelovanie QS, ktoré by sa malo modelovať a analyzovať. Relatívne zložitý charakter QS a zodpovedajúci typ aplikácií si vyžadujú použitie rozsiahlejších programovacích techník. To poskytuje dobrú základnú platformu na implementáciu bežných programovacích konceptov, ako je dedičnosť, zapuzdrenie a polymorfizmus. Na druhej strane je potrebné prebrať aj základné teoretické koncepty informatiky. Okrem toho si štatistické a simulačné modelovanie QS vyžaduje pokročilejšie znalosti teórie pravdepodobnosti, použitie väčšieho množstva výpočtových zdrojov a poskytnutie skutočného vedeckého výpočtového prostredia, ako aj dobrú motiváciu pre pokročilého študenta.

    Literatúra

    Úplný zoznam referencií

    A. Arazi, E. Ben-Jacob a U. Yechiali, Premostenie genetických sietí a teória radenia, Physica A: Statistical Mechanics and its Applications 332 (2004), 585-616.
    D.M. Beazley, Python Essential Reference, Addison-Wesley Professional, 2009.
    J. Bernard, Use Python for science computing, Linux Journal 175 (2008), 7.
    OSN Bhat, Úvod do modelovania a analýzy teórie radenia v aplikáciách, Birkhäuser, Boston, MA, 2008.
    K.J. Bogacev, Základy paralelného programovania, Binom, Moskva, 2003.
    R.N. Caine a G. Caine, Making Connections: Teaching and the Human Brain, Association for Supervision and Curriculum Development, Alexandria, 1991.
    J. Clement a M.A. Rea, Model Based Learning and Instruction in Science, Springer, Holandsko, 2008.
    N.A. Cookson, W.H. Mather, T. Danino, O. Mondragón- Palomino, R.J. Williams, L.S. Tsimring a J. Hasty, Queuing up for enzymatic processing: correlated signaling through coupled degradation, Molecular Systems Biology 7 (2011), 1. A.S. Gibbons, Model-centered training, Journal of Structural Learning and Intelligent Systems 4 (2001), 511-540. M.T. Heath, Scientific Computing a Introductory Survey, McGraw-Hill, New York, 1997.
    A. Hellander, Stochastická simulácia a metódy Monte Carlo, 2009.
    G.I. Ivčenko, V.A. Kastanov a I.N. Kovalenko, Teória systému radenia, Visshaja Shkola, Moskva, 1982.
    Z.L. Joel, N.W. Wei, J. Louis a T.S. Chuan, diskrétna udalosť
    simulácia systémov radenia, in: Sixth Youth Science Conference, Singapore Ministry of Education, Singapore, 2000, pp. 1–5.
    E. Jones, Úvod do vedeckých výpočtov v jazyku Python, v: SciPy, California Institute of Technology, Pasadena, CA, 2007, s. 333.
    M. Joubert a P. Andrews, Výskum a vývoj vo vzdelávaní pravdepodobnosti na medzinárodnej úrovni, v: British Congress for Mathematics Education, 2010, s. 41.
    G.E. Karniadakis a R.M. Kyrby, Parallel Scientific Computing v C++ a MPI. Bezproblémový prístup k paralelným algoritmom a ich implementácia, Cambridge Univ. tlač, 2003.
    D.G. Kendall, Stochastické procesy vyskytujúce sa v teórii radov a ich analýza metódou vnoreného Markovovho reťazca, The Annals of Mathematical Statistics 1 (1953), 338–354.
    PANI. Khine a I.M. Saleh, Modely a modelovanie, kognitívne nástroje pre vedecké bádanie, in: Modely a modelovanie vo vzdelávaní v prírode, Springer, 2011, s. 290.
    T. Kiesling a T. Krieger, Efficient parallel queuing system simulation, in: The 38th Conference on Winter Simulation, Winter Simulation Conference, 2006, s. 1020–1027.
    J. Kiusalaas, Numerical Methods in Engineering with Python, Cambridge Univ. Tlač, 2010.
    A. Kumar, Python pre vzdelávanie. Učenie matematiky a prírodných vied pomocou jazyka Python a ich písanie v LATEX, Inter University Accelerator Centre, New Delhi, 2010.
    H.P. Langtangen, Python Scripting for Computational Science, Springer-Verlag, Berlín, 2009.
    H.P. Langtangen, Primer on Scientific Programming with Python, Springer-Verlag, Berlín, 2011.
    H.P. Langtangen, Skúsenosti s používaním Pythonu ako primárneho jazyka na výučbu vedeckých výpočtových techník na Univerzite v Oslo, Univerzite v Osle, 2012.
    R. Lehrer a L. Schauble, Kultivovanie modelového uvažovania vo vedeckom vzdelávaní, v: The Cambridge Handbook of the Learning Sciences, Cambridge Univ. Tlač, 2005, s. 371–388.
    G. Levy, Úvod do kvázi náhodných čísel, in: Numerical Algorithms, Group, 2012.
    J.S. Liu, Monte Carlo Strategies in Scientific Computing, Harvard Univ., 2001.
    V.E. Malishkin a V.D. Korneev, Paralelné programovanie multipočítačov, Technická univerzita v Novosibirsku, Novosibirsk, 2006.
    N. Matloff, Programming on Parallel Machines: GPU, Multi-core, Clusters and More, University of California, 2012.
    M.Milrad, J.M. Spector a P.I. Davidsen, Model facilitated learning, in: Instructional Design, Development and Evaluation, Syracuse Univ. tlač, 2003.
    S. Minkevicius, O zákone iterovaného logaritmu vo viacfázových systémoch radenia, Informatica II (1997), 367–376.
    S. Minkevicius a V. Dolgopolovas, Analýza zákona iterovaného logaritmu pre čas nečinnosti zákazníka vo viacfázových frontoch, Int. J. Pure Appl. Matematika 66 (2011), 183–190.
    Učenie zamerané na model, Cesty k matematickému porozumeniu pomocou GeoGebry, in: Modeling and Simulations for Learning and Instruction, Sense Publishers, Holandsko, 2011.
    C.R. Myers a J.P. Sethna, Python pre vzdelávanie: Výpočtové metódy pre nelineárne systémy, Computing in Science & Engineering 9 (2007), 75–79.
    H. Niederreiter, Generovanie náhodných čísel a metódy Quasi-Monte Carlo, SIAM, 1992.
    F.B. Nilsen, Systémy radenia: Modelovanie, analýza a simulácia, Katedra informatiky, Univerzita v Osle, Oslo, 1998.
    R.P. Sen, Operations Research: Algorithms and Applications, PHI Learning, 2010. Pridať štítky

    Plán:

    1. Pojem centrálnej limitnej vety (Ljapunovova veta)

    2. Zákon veľkých čísel, pravdepodobnosti a frekvencie (Čebyševova a Bernoulliho veta)

    1. Pojem centrálnej limitnej vety.

    Normálne rozdelenie pravdepodobností má v teórii pravdepodobnosti veľký význam. Normálny zákon sa riadi pravdepodobnosťou pri streľbe na cieľ, pri meraniach atď. Najmä sa ukazuje, že distribučný zákon pre súčet dostatočne veľkého počtu nezávislých náhodných veličín s ľubovoľnými zákonmi rozdelenia je blízky normálnemu rozdeleniu. Táto skutočnosť sa nazýva centrálna limitná veta alebo Ljapunovova veta.

    Je známe, že normálne rozdelené náhodné premenné sú v praxi široko používané. čo to vysvetľuje? Táto otázka bola zodpovedaná

    Centrálna limitná veta. Ak je náhodná premenná X súčtom veľmi veľkého počtu vzájomne nezávislých náhodných premenných, pričom vplyv každej z nich na celý súčet je zanedbateľný, potom má X rozdelenie blízke normálnemu rozdeleniu.

    Príklad. Nech sa zmeria nejaká fyzikálna veličina. Akékoľvek meranie poskytuje len približnú hodnotu meranej veličiny, pretože výsledok merania ovplyvňuje mnoho nezávislých náhodných faktorov (teplota, kolísanie prístroja, vlhkosť atď.). Každý z týchto faktorov generuje zanedbateľnú „čiastočnú chybu“. Keďže je však počet týchto faktorov veľmi veľký, ich kumulatívny účinok generuje už badateľnú „celkovú chybu“.

    Ak vezmeme do úvahy celkovú chybu ako súčet veľmi veľkého počtu vzájomne nezávislých čiastkových chýb, môžeme konštatovať, že celková chyba má rozdelenie blízke normálnemu rozdeleniu. Skúsenosti potvrdzujú platnosť tohto záveru.

    Zvážte podmienky, za ktorých je splnená "centrálna limitná veta".

    x1,X2, ..., Xn je postupnosť nezávislých náhodných premenných,

    M(X1),M(X2), ...,M(Xn) sú konečné matematické očakávania týchto veličín, respektíve rovné M(Xk)= ak

    D (X1),D(X2), ...,D(Xn) - ich konečné odchýlky, respektíve rovné D(X k)= bk2

    Zavedieme zápis: S= X1+X2 + ...+Xn;

    A k= X1+X2 + ...+Xn=; B2=D (X1)+D(X2)+ ...+D(Xn) =

    Zapíšeme distribučnú funkciu normalizovaného súčtu:

    Hovoria do poradia x1,X2, ..., Xn centrálna limitná veta je použiteľná, ak, pre nejaký X distribučná funkcia normalizovaného súčtu ako n ® ¥ smeruje k normálnej distribučnej funkcii:

    Right "style="border-collapse:collapse;border:none;margin-left:6.75pt;margin-right: 6.75pt">

    Zvážte diskrétnu náhodnú premennú X, dané distribučnou tabuľkou:

    Dajme si za úlohu odhadnúť pravdepodobnosť, že odchýlka náhodnej premennej od jej matematického očakávania nepresiahne v absolútnej hodnote kladné číslo ε

    Ak ε dostatočne malý, odhadneme teda pravdepodobnosť, že X bude nadobúdať hodnoty dostatočne blízke jeho matematickým očakávaniam. preukázala nerovnosť, ktorá nám umožňuje poskytnúť odhad, ktorý nás zaujíma.

    Lemma Čebyševová. Daná náhodná premenná X má iba nezáporné hodnoty s očakávaním M(X). Pre akékoľvek číslo α>0 platí výraz:

    Čebyševova nerovnosť. Pravdepodobnosť, že odchýlka náhodnej premennej X od jej matematického očakávania v absolútnej hodnote je menšia ako kladné číslo ε , nie menej ako 1 – D(X) / ε 2:

    P(|X-M(X)|< ε ) ³ 1 - D (X) / ε 2.

    Komentujte.Čebyševova nerovnosť má obmedzenú praktickú hodnotu, pretože často poskytuje hrubý a niekedy triviálny (nezaujímavý) odhad.

    Teoretický význam Čebyševovej nerovnosti je veľmi veľký. Nižšie použijeme túto nerovnosť na odvodenie Čebyševovej vety.

    2.2. Čebyševova veta

    Ak X1, X2, ..., Xn.. sú párovo nezávislé náhodné premenné a ich rozptyly sú rovnomerne obmedzené (nepresahujú konštantné číslo C), potom bez ohľadu na to, aké malé je kladné číslo ε , pravdepodobnosť nerovnosti

    ÷ (X1+X2 + ...+Xn)/n - (M(X1)+M(X2)+ ...+M(Xn))/n |< ε

    bude ľubovoľne blízko k jednote, ak je počet náhodných premenných dostatočne veľký.

    P (÷ (X1+X2 + ...+Xn)/n - (M(X1)+M(X2)+ ...+M(Xn))/n |< ε )=1.

    Čebyševova veta hovorí:

    1. Uvažujeme dostatočne veľký počet nezávislých náhodných premenných s obmedzenými rozptylmi,

    Pri formulovaní Čebyševovej vety sme predpokladali, že náhodné premenné majú rôzne matematické očakávania. V praxi sa často stáva, že náhodné premenné majú rovnaké matematické očakávanie. Je zrejmé, že ak opäť predpokladáme, že disperzie týchto veličín sú obmedzené, potom na ne bude platiť Čebyševova veta.

    Označme matematické očakávanie každej z náhodných premenných cez a;

    V posudzovanom prípade sa aritmetický priemer matematických očakávaní, ako je ľahké vidieť, tiež rovná a.

    Pre konkrétny prípad je možné sformulovať Čebyševovu vetu.

    „Ak Х1, Х2, ..., Хn.. sú párovo nezávislé náhodné premenné s rovnakým matematickým očakávaním a, a ak sú disperzie týchto premenných rovnomerne obmedzené, potom bez ohľadu na to, aký malý je počet ε > Ach, pravdepodobnosť nerovnosti

    ÷ (X1+X2 + ...+Xn) / n - a | < ε

    bude ľubovoľne blízko k jednote, ak je počet náhodných premenných dostatočne veľký." .

    Inými slovami, za podmienok vety

    P (÷ (X1+X2 + ...+Xn) / n - a |< ε ) = 1.

    2.3. Podstata Čebyševovej vety

    Hoci jednotlivé nezávislé náhodné premenné môžu nadobúdať hodnoty, ktoré sú ďaleko od ich matematických očakávaní, aritmetický priemer dostatočne veľkého počtu náhodných premenných s vysokou pravdepodobnosťou nadobúda hodnoty blízke určitému konštantnému číslu, konkrétne číslu

    (M(Xj) + M (X2)+... + M (Xn))/n alebo na číslo a v konkrétny prípad.

    Inými slovami, jednotlivé náhodné premenné môžu mať značný rozptyl a ich aritmetický priemer je rozptýlený malý.

    Nedá sa teda s istotou predpovedať, akú možnú hodnotu nadobudne každá z náhodných premenných, ale dá sa predpovedať, akú hodnotu bude mať ich aritmetický priemer.

    Takže aritmetický priemer dostatočne veľkého počtu nezávislých náhodných premenných (ktorých rozptyly sú rovnomerne obmedzené) stráca charakter náhodnej premennej.

    Vysvetľuje to skutočnosť, že odchýlky každej z veličín od ich matematických očakávaní môžu byť kladné aj záporné a v aritmetickom priemere sa navzájom rušia.

    Čebyševova veta platí nielen pre diskrétne, ale aj pre spojité náhodné veličiny; je to príklad potvrdzujúci platnosť učenia o spojení náhody a nevyhnutnosti.

    2.4. Význam Čebyševovej vety pre prax

    Uveďme príklady aplikácie Čebyševovej vety na riešenie praktických problémov.

    Zvyčajne sa na meranie určitej fyzikálnej veličiny vykoná niekoľko meraní a ich aritmetický priemer sa berie ako požadovaná veľkosť. Za akých podmienok možno tento spôsob merania považovať za správny? Odpoveď na túto otázku dáva Čebyševova veta (jej špeciálny prípad).

    Výsledky každého merania skutočne považujte za náhodné premenné

    X1, X2, ..., Xn

    Na tieto množstvá možno použiť Čebyševovu vetu, ak:

    1) Sú párovo nezávislé.

    2) majú rovnaké matematické očakávania,

    3) ich disperzie sú rovnomerne obmedzené.

    Prvá požiadavka je splnená, ak výsledok každého merania nezávisí od výsledkov ostatných.

    Druhá požiadavka je splnená, ak sa merania vykonajú bez systematických chýb (jedno znamienko). V tomto prípade sú matematické očakávania všetkých náhodných premenných rovnaké a rovnajú sa skutočnej veľkosti a.

    Tretia požiadavka je splnená, ak zariadenie poskytuje určitú presnosť merania. Aj keď sú výsledky jednotlivých meraní rozdielne, ich rozptyl je obmedzený.

    Ak sú splnené všetky špecifikované požiadavky, máme právo na výsledky merania aplikovať Čebyševovu vetu: pre dostatočne veľkú P pravdepodobnosť nerovnosti

    | (X1 + Xa+...+Xn)/n - a |< ε svojvoľne blízko k jednote.

    Inými slovami, pri dostatočne veľkom počte meraní je takmer isté, že ich aritmetický priemer sa ľubovoľne málo líši od skutočnej hodnoty meranej veličiny.

    Čebyševova veta udáva podmienky, za ktorých možno opísanú metódu merania aplikovať. Je však chybou myslieť si, že zvýšením počtu meraní možno dosiahnuť ľubovoľne vysokú presnosť. Faktom je, že samotné zariadenie poskytuje údaje iba s presnosťou ± α, takže každý z výsledkov merania, a teda aj ich aritmetický priemer, sa získajú iba s presnosťou nepresahujúcou presnosť zariadenia.

    Metóda výberu vzoriek široko používaná v štatistike je založená na Chebyshevovej vete, ktorej podstatou je, že na posúdenie celej populácie (všeobecnej populácie) skúmaných objektov sa používa relatívne malá náhodná vzorka.

    Napríklad kvalita balíka bavlny sa posudzuje podľa malého zväzku pozostávajúceho z vlákien náhodne vybraných z rôznych častí balíka. Hoci je počet vlákien vo zväzku oveľa menší ako v balíku, samotný zväzok obsahuje pomerne veľké množstvo vlákien, ktoré sa počítajú na stovky.

    Ako ďalší príklad možno uviesť stanovenie kvality zrna z malej vzorky. A v tomto prípade je počet náhodne vybraných zŕn malý v porovnaní s celou hmotnosťou zrna, ale sám o sebe je dosť veľký.

    Už z uvedených príkladov možno usúdiť, že pre prax má Čebyševova veta neoceniteľný význam.

    2.5. VetaBernoulli

    Vyrobené P nezávislé testy (nie udalosti, ale testy). V každom z nich pravdepodobnosť výskytu udalosti A rovná sa R.

    Vyvstáva otázka, aká bude relatívna frekvencia výskytu udalosti? Na túto otázku odpovedá Bernoulliho teorém, ktorý sa nazýval „zákon veľkých čísel“ a položil základy teórie pravdepodobnosti ako vedy.

    Bernoulliho veta. Ak v každom z P pravdepodobnosť nezávislého testu R výskyt udalosti ALE je konštantná, potom pravdepodobnosť, že odchýlka relatívnej frekvencie od pravdepodob R bude v absolútnej hodnote ľubovoľne malá, ak je počet pokusov dostatočne veľký.

    Inými slovami, ak ε >0 je ľubovoľne malé číslo, potom za podmienok vety máme rovnosť

    P(|m / n - p|< ε)= 1

    Komentujte. Na základe Bernoulliho vety by bolo nesprávne dospieť k záveru, že so zvyšujúcim sa počtom pokusov sa relatívna frekvencia neustále približuje k pravdepodobnosti R; inými slovami, Bernoulliho veta neimplikuje rovnosť (t/n) = p,

    AT Veta sa zaoberá iba pravdepodobnosťou, že pri dostatočne veľkom počte pokusov sa relatívna frekvencia bude ľubovoľne málo líšiť od konštantnej pravdepodobnosti výskytu udalosti v každom pokuse.

    Úloha 7-1.

    1. Odhadnite pravdepodobnosť, že po 3600 hodoch kockou bude počet výskytov 6 aspoň 900.

    rozhodnutie. Nech x je počet výskytov 6 bodov v 3600 hodoch mincou. Pravdepodobnosť získania 6 bodov jedným hodom je p=1/6, potom M(x)=3600 1/6=600. Použijeme Čebyševovu nerovnosť (lemu) pre dané α = 900

    = P(X³ 900) 600 £ / 900 = 2 / 3

    Odpoveď 2 / 3.

    2. Uskutočnilo sa 1000 nezávislých testov, p=0,8. Nájdite pravdepodobnosť, že počet výskytov udalosti A v týchto testoch sa odchyľuje od svojho matematického očakávania modulo menej ako 50.

    rozhodnutie. x je počet výskytov udalosti A v n - 1000 pokusoch.

    M (X) \u003d 1 000 0,8 \u003d 800. D(x) = 100 0,8 0,2 = 160

    Použijeme Čebyševovu nerovnosť pre dané ε = 50

    P(|x-M(x)|< ε) ³ 1 - D (x) / ε 2

    R(|x-800|< 50) ³ / 50 2 = 1-160 / 2500 = 0,936.

    Odpoveď. 0,936

    3. Pomocou Čebyševovej nerovnosti odhadnite pravdepodobnosť, že |X - M(X)|< 0,1, если D (X) = 0,001. Ответ Р³0,9.

    4. Dané: P(|X- M(X)\< e) 0,9; D (X)= 0,004. Pomocou Čebyševovej nerovnosti nájdite ε . Odpoveď. 0,2.

    Kontrolné otázky a úlohy

    1. Účel centrálnej limitnej vety

    2. Podmienky použiteľnosti Ljapunovovej vety.

    3. Rozdiel medzi lemou a Čebyševovou vetou.

    4. Podmienky použiteľnosti Čebyševovej vety.

    5. Podmienky použiteľnosti Bernoulliho vety (zákon veľkých čísel)

    Požiadavky na vedomosti a zručnosti

    Študent musí poznať všeobecnú sémantickú formuláciu centrálnej limitnej vety. Vedieť formulovať parciálne vety pre nezávislé identicky rozdelené náhodné premenné. Pochopte Čebyševovu nerovnosť a zákon veľkých čísel v Čebyševovej forme. Majte predstavu o frekvencii udalosti, o vzťahu medzi pojmami „pravdepodobnosť“ a „frekvencia“. Pochopte zákon veľkých čísel vo forme Bernoulliho.

    (1857-1918), vynikajúci ruský matematik

    Limitné vety teórie pravdepodobnosti

    Čebyševova nerovnosť

    Uvažujme niekoľko tvrdení a teorémov z veľkej skupiny takzvaných limitných viet teórie pravdepodobnosti, ktoré vytvárajú spojenie medzi teoretickými a experimentálnymi charakteristikami náhodných premenných s veľkým počtom testov na nich. Tvoria základ matematickej štatistiky. Limitné vety sa bežne delia do dvoch skupín. Prvá skupina viet, tzv zákon veľkých čísel, stanovuje stabilitu stredných hodnôt, t.j. pri veľkom počte pokusov ich priemerný výsledok prestáva byť náhodný a dá sa predpovedať s dostatočnou presnosťou. Druhá skupina viet, tzv centrálny limit, stanovuje podmienky, za ktorých sa zákon rozdelenia súčtu veľkého počtu náhodných veličín neobmedzene približuje normálnemu.

    Najprv zvážte Čebyševovu nerovnosť, ktorú možno použiť na: a) hrubý odhad pravdepodobnosti udalostí spojených s náhodnými premennými, ktorých rozdelenie nie je známe; b) dôkazy množstva viet zákona o veľkých číslach.

    Veta 7.1. Ak náhodná premenná X má matematické očakávania a rozptyl DX, potom Čebyševova nerovnosť

    . (7.1)

    Všimnite si, že Čebyševova nerovnosť môže byť napísaná v inej forme:

    pre frekvencie alebo udalosti v n nezávislých pokusov, v každom z nich sa môže s pravdepodobnosťou vyskytnúť , ktorého rozptyl je , Čebyševova nerovnosť má tvar

    Nerovnosť (7.5) možno prepísať ako

    . (7.6)

    Príklad 7.1. Pomocou Čebyševovej nerovnosti odhadnite pravdepodobnosť odchýlky náhodnej premennej X od jeho matematického očakávania budú menšie ako tri smerodajné odchýlky, t.j. menšie .

    rozhodnutie:

    Za predpokladu, že vzorec (7.2), dostaneme

    Toto hodnotenie sa nazýva pravidlo troch sigma.

    Čebyševova veta

    Hlavné tvrdenie zákona veľkých čísel je obsiahnuté v Chebyshevovej vete. V ňom a ďalších teorémoch zákona veľkých čísel sa používa pojem „konvergencia náhodných premenných v pravdepodobnosti“.

    náhodné premenné konvergovať v pravdepodobnosti na hodnotu A (náhodná alebo nenáhodná), ak pre nejakú má pravdepodobnosť udalosti pri tendenciu k jednote, t.j.

    (alebo ). Konvergencia pravdepodobnosti je symbolicky napísaná takto:

    Treba poznamenať, že konvergencia v pravdepodobnosti vyžaduje, aby nerovnosť platila pre veľkú väčšinu členov sekvencie (v matematickej analýze - pre všetkých n > N, kde N- určitý počet) a takmer všetci členovia postupnosti musia spadať do ε- susedstve ALE.

    Veta 7.3 (Zákon veľkých čísel v tvare P.L. Chebysheva). Ak náhodné premenné sú nezávislé a je ich množstvo C> 0, ktorý , potom pre ľubovoľný

    , (7.7)

    tie. aritmetický priemer týchto náhodných premenných konverguje v pravdepodobnosti k aritmetickému priemeru ich matematických očakávaní:

    .

    Dôkaz. Odvtedy

    .

    Potom aplikovaním Čebyševovej nerovnosti (7.2) na náhodnú premennú máme

    tie. aritmetický priemer náhodných premenných konverguje v pravdepodobnosti k matematickému očakávaniu a:

    Dôkaz. Ako

    a rozptyly náhodných premenných , t.j. sú ohraničené, potom použitím Čebyševovej vety (7.7) dostaneme tvrdenie (7.9).

    Dôsledok Čebyševovej vety ospravedlňuje princíp „aritmetického priemeru“ náhodných premenných Х i neustále používané v praxi. Áno, nech sa to stane n nezávislé merania nejakej veličiny, ktorej skutočná hodnota a(nie je známe). Výsledkom každého merania je náhodná veličina Х i. Podľa následku ako približná hodnota veličiny a môžete použiť aritmetický priemer výsledkov merania:

    .

    Rovnosť je čím presnejšia, tým viac n.

    Čebyševova veta je tiež založená na široko používanom v štatistike metóda odberu vzoriek, ktorej podstatou je, že kvalitu veľkého množstva homogénneho materiálu možno posudzovať podľa jeho malej vzorky.

    Čebyševova veta potvrdzuje súvislosť medzi náhodnosťou a nevyhnutnosťou: priemerná hodnota náhodnej premennej sa prakticky nelíši od nenáhodnej premennej.

    Bernoulliho veta

    Bernoulliho veta je historicky prvou a najjednoduchšou formou zákona veľkých čísel. Teoreticky dokladá vlastnosť stability relatívnej frekvencie.

    Veta 7.4 (Zákon veľkých čísel v tvare J. Bernoulliho). Ak je pravdepodobnosť výskytu udalosti ALE v jednom teste je R, počet výskytov tejto udalosti o n nezávislých pokusov sa rovná , potom pre akékoľvek číslo máme rovnosť

    , (7.10)

    t.j. relatívna frekvencia udalosti ALE konverguje v pravdepodobnosti k pravdepodobnosti R diania ALE: .

    Dôkaz. Náhodné premenné zavádzame nasledovne: ak in i-th súd došlo k udalosti ALE, a ak sa nezobrazí, potom . Potom číslo ALE(počet úspechov) môže byť reprezentovaný ako

    Matematické očakávanie a rozptyl náhodných premenných sú: , . Zákon rozdelenia náhodných veličín X i má tvar

    Х i
    R R

    pre akékoľvek i. Teda náhodné premenné X i nezávislé, ich odchýlky sú obmedzené na rovnaký počet, keďže

    .

    Preto možno na tieto náhodné premenné aplikovať Čebyševovu vetu

    .

    ,

    teda .

    Bernoulliho veta teoreticky zdôvodňuje možnosť približného výpočtu pravdepodobnosti udalosti pomocou jej relatívnej frekvencie. Takže napríklad relatívnu frekvenciu tejto udalosti možno brať ako pravdepodobnosť mať dievča, ktorá sa podľa štatistických údajov približne rovná 0,485.

    Čebyševova nerovnosť (7.2) pre náhodné veličiny

    má formu

    kde pi- pravdepodobnosť udalosti ALE v ja- m test.

    Príklad 7.2. Pravdepodobnosť tlačovej chyby na jednej strane rukopisu je 0,2. Odhadnite pravdepodobnosť, že v rukopise obsahujúcom 400 strán sa frekvencia výskytu tlačovej chyby líši od zodpovedajúceho modulu pravdepodobnosti menej ako 0,05.

    rozhodnutie:

    Používame vzorec (7.11). V tomto prípade , , , . Máme t.j. .

    Centrálna limitná veta

    Centrálna limitná veta je druhá skupina limitných viet, ktoré vytvárajú súvislosť medzi distribučným zákonom súčtu náhodnej veličiny a jej limitnou formou – zákonom normálneho rozdelenia.

    Sformulujme centrálnu limitnú vetu pre prípad, keď majú členy súčtu rovnaké rozdelenie. Táto veta sa v praxi používa najčastejšie. V matematickej štatistike majú náhodné premenné rovnaké distribúcie, pretože sú získané z rovnakej všeobecnej populácie.

    Veta 7.5. Nech sú náhodné premenné nezávislé, rovnomerne rozdelené, majú konečné matematické očakávanie a rozptyl , . Potom distribučná funkcia centrovaného a normalizovaného súčtu týchto náhodných premenných smeruje k distribučnej funkcii štandardnej normálnej náhodnej premennej.

    Najjednoduchšia verzia centrálnej limitnej vety (CLT) teórie pravdepodobnosti je nasledovná.

    (pre identicky distribuované výrazy). Nechať byť X 1 , X 2 ,…, X n, … sú nezávislé identicky rozdelené náhodné premenné s matematickými očakávaniami M(X i) = m a disperzie D(X i) = , i= 1, 2,…, n,... Potom pre akékoľvek reálne číslo X existuje limit

    kde F(x) je štandardná funkcia normálneho rozdelenia.

    Táto veta sa niekedy nazýva Lindeberg-Levyho veta.

    V mnohých aplikovaných problémoch nie je splnená podmienka identického rozdelenia. V takýchto prípadoch zvyčajne zostáva platná centrálna limitná veta, ale na postupnosť náhodných premenných treba uložiť určité podmienky. Podstatou týchto podmienok je, že žiadny člen nesmie byť dominantný, príspevok každého člena k aritmetickému priemeru musí byť zanedbateľný v porovnaní s konečným súčtom. Najčastejšie sa používa Lyapunovova veta.

    Centrálna limitná veta(pre rôzne distribuované výrazy) – Ljapunovova veta. Nechať byť X 1 , X 2 ,…, X n, … sú nezávislé náhodné premenné s matematickými očakávaniami M(X i) = m i a disperzie D(X i) = , i= 1, 2,…, n,... Nech pre nejaké δ>0 majú všetky uvažované náhodné premenné centrálne momenty rádu 2+δ a „Ljapunov zlomok“ klesá neobmedzene:

    Potom pre akékoľvek reálne číslo X existuje limit

    kde F(x) je štandardná funkcia normálneho rozdelenia.

    V prípade identicky rozdelených náhodných členov

    a Ljapunovova veta sa mení na Lindebergovu-Levyho vetu.

    História získavania centrálnych limitných viet pre náhodné veličiny sa tiahla dve storočia – od prvých prác De Moivreho v 30. rokoch 18. storočia až po nevyhnutné a postačujúce podmienky získané Lindebergom a Fellerom v 30. rokoch 20. storočia.

    Lindebergova-Fellerova veta. Nechať byť X 1 , X 2 ,…, X n, …, sú nezávislé náhodné premenné s matematickými očakávaniami M(X i) = m i a disperzie D(X i) = , i= 1, 2,…, n,… Limitný vzťah (1), t.j. centrálna limitná veta, je splnená práve vtedy, ak pre ľubovoľné τ>0

    kde Fk(X) označuje distribučnú funkciu náhodnej premennej X k.

    Dôkazy uvedených variantov centrálnej limitnej vety pre náhodné veličiny možno nájsť v klasickom kurze teórie pravdepodobnosti.

    Pre aplikovanú štatistiku a najmä pre nenumerickú štatistiku má veľký význam multivariačná centrálna limitná veta. Nejde o súčet náhodných premenných, ale o súčet náhodných vektorov.

    Nevyhnutná a postačujúca podmienka pre multidimenzionálnu konvergenciu. Nechať byť F n označuje spoločnú distribučnú funkciu k-rozmerný náhodný vektor, n= 1,2,… a Fλn . Nevyhnutná a postačujúca podmienka konvergencie F n pre niektoré k-rozmerová distribučná funkcia F je to? Fλn má limit pre ľubovoľný vektor λ.

    Uvedená veta je cenná, pretože konvergencia vektorov sa redukuje na konvergenciu lineárnych kombinácií ich súradníc, t.j. ku konvergencii obvyklých náhodných premenných uvažovaných skôr. Neumožňuje však priamo určiť rozdelenie limitov. Dá sa to urobiť pomocou nasledujúcej vety.

    Veta o viacrozmernej konvergencii. Nechať byť F n a Fλn sú rovnaké ako v predchádzajúcej vete. Nechať byť F- funkcia spoločného rozdeľovania k-rozmerný náhodný vektor. Ak je funkcia distribúcie Fλn s rastúcou veľkosťou vzorky konverguje k distribučnej funkcii F λ pre ľubovoľný vektor λ, kde F λ je distribučná funkcia lineárnej kombinácie , potom F n konverguje k F.

    Tu je konvergencia F n do F znamená, že pre každého k-rozmerný vektor taký, že distribučná funkcia F súvislé v , číselná postupnosť F n konverguje s rastom n na číslo F. Inými slovami, konvergencia distribučných funkcií je chápaná presne rovnakým spôsobom ako v diskusii o limitných vetách pre náhodné premenné vyššie. Uveďme viacrozmernú analógiu týchto teorémov.

    Viacrozmerná centrálna limitná veta. Zvážte nezávislé identicky rozdelené k-rozmerné náhodné vektory

    kde prvočíslo označuje operáciu vektorovej transpozície. Predpokladajme náhodné vektory U n majú momenty prvého a druhého rádu, t.j.

    M(U n) = μ, D(U n) = Σ,

    kde μ je vektor matematických očakávaní súradníc náhodného vektora, Σ je jeho kovariančná matica. Zavádzame postupnosť náhodných vektorov aritmetického priemeru:

    Potom je náhodný vektor asymptotický k-rozmerné normálne rozdelenie, t.j. je asymptoticky distribuovaný rovnakým spôsobom ako k-rozmerná normála s nulovým priemerom, kovarianciou Σ a hustotou

    Tu |Σ| je determinant matice Σ. Inými slovami, distribúcia náhodného vektora konverguje k k-rozmerné normálne rozdelenie s nulovým priemerom a kovariančnou maticou Σ.

    Pripomeňme, že viacrozmerné normálne rozdelenie s očakávaním μ a kovariančnou maticou Σ je rozdelenie s hustotou

    Multivariačná centrálna limitná veta ukazuje, že distribúcie súčtov nezávislých identicky rozdelených náhodných vektorov s veľkým počtom členov sú dobre aproximované normálnymi distribúciami, ktoré majú rovnaké prvé dva momenty (vektor očakávania súradníc náhodného vektora a jeho korelácia matice) ako pôvodné vektory. Rovnakú distribúciu možno opustiť, bude si to však vyžadovať určitú komplikáciu symboliky. Celkovo z vety o viacrozmernej konvergencii vyplýva, že viacrozmerný prípad sa zásadne nelíši od jednorozmerného.

    Príklad. Nechať byť X 1 , … X n,… sú nezávislé identicky rozdelené náhodné premenné. Zvážte k-rozmerovo nezávislé identicky rozdelené náhodné vektory

    Ich matematické očakávanie je vektorom teoretických počiatočných momentov a kovariančná matica je zložená zo zodpovedajúcich centrálnych momentov. Potom je vektor vzorových centrálnych momentov. Multivariačná centrálna limitná veta tvrdí, že má asymptoticky normálne rozdelenie. Ako vyplýva z vet o dedičnosti konvergencie a linearizácie (pozri nižšie), z rozdelenia možno odvodiť rozdelenia rôznych funkcií počiatočných momentov vzorky. A keďže ústredné momenty sú vyjadrené počiatočnými momentmi, platí podobné tvrdenie aj pre nich.

    Predchádzajúce