Selektívne pozorovanie: pojem, typy, výberové chyby, vyhodnotenie výsledkov. Príklady riešenia problémov

Počas selektívneho pozorovania by to malo byť zabezpečené nehoda výber jednotky. Každá jednotka musí mať rovnakú príležitosť byť vybraná ako ostatné. Na tom je založený náhodný výber.

TO správna náhodná vzorka sa vzťahuje na výber jednotiek z celej všeobecnej populácie (bez predbežného rozdelenia do akýchkoľvek skupín) žrebovaním (hlavne) alebo inou podobnou metódou, napríklad pomocou tabuľky náhodných čísel. Náhodný výber Tento výber nie je náhodný. Princíp náhodnosti naznačuje, že zaradenie alebo vylúčenie objektu zo vzorky nemôže ovplyvniť žiadny iný faktor ako náhoda. Príklad vlastne náhodné výber môže slúžiť ako obeh výhier: z celkového počtu vydaných tiketov sa náhodne vyberie určitá časť čísel, ktoré tvoria výhry. Okrem toho majú všetky čísla rovnakú príležitosť dostať sa do vzorky. V tomto prípade sa počet jednotiek vybraných v súbore vzoriek zvyčajne určuje na základe akceptovaného podielu vzorky.

Ukážkový podiel je pomer počtu jednotiek výberovej populácie k počtu jednotiek všeobecnej populácie:

Takže s 5% vzorkou zo série dielov v 1000 jednotkách. veľkosť vzorky P je 50 jednotiek a pri 10% vzorke - 100 jednotiek. atď. Pri správnej vedeckej organizácii odberu vzoriek možno chyby reprezentatívnosti znížiť na minimálne hodnoty, v dôsledku čoho sa selektívne pozorovanie stáva dostatočne presným.

Správny náhodný výber „vo svojej čistej forme“ sa v praxi selektívneho pozorovania používa len zriedka, ale je východiskom medzi všetkými ostatnými typmi výberu, obsahuje a implementuje základné princípy selektívneho pozorovania.

Uvažujme o niektorých otázkach teórie metódy výberu vzoriek a chybového vzorca pre jednoduchú náhodnú vzorku.

Pri aplikácii metódy výberu vzoriek v štatistike sa zvyčajne používajú dva hlavné typy zovšeobecňujúcich ukazovateľov: priemerná hodnota kvantitatívneho znaku A relatívnu hodnotu alternatívneho znaku(podiel alebo podiel jednotiek v štatistickej populácii, ktoré sa líšia od všetkých ostatných jednotiek tejto populácie len prítomnosťou skúmaného znaku).

Ukážkový podiel (w), alebo frekvencia, je určená pomerom počtu jednotiek, ktoré majú skúmanú charakteristiku T, k celkovému počtu odberných jednotiek P:

Napríklad, ak zo 100 vzorových podrobností ( n= 100), 95 dielov sa ukázalo ako štandardných (T= 95), potom frakcia vzorky

w=95/100=0,95 .

Na charakterizáciu spoľahlivosti vzorových ukazovateľov existujú stredná A hraničná výberová chyba.

Chyba pri odbere vzoriek ? alebo inými slovami, chyba reprezentatívnosti je rozdiel medzi zodpovedajúcou vzorkou a všeobecnými charakteristikami:

*

*

Výberová chyba je charakteristická len pre selektívne pozorovania. Čím väčšia je hodnota tejto chyby, tým viac sa výberové ukazovatele líšia od zodpovedajúcich všeobecných ukazovateľov.

Priemer vzorky a podiel vzorky sú inherentne náhodné premenné, ktoré môžu nadobudnúť rôzne hodnoty v závislosti od toho, ktoré jednotky populácie boli zahrnuté do vzorky. Preto sú výberové chyby tiež náhodné premenné a môžu nadobudnúť rôzne hodnoty. Stanovte si preto priemer možných chýb – priemernú chybu vzorky.

Od čoho to závisí priemerná vzorkovacia chyba? Pri dodržaní zásady náhodného výberu sa primárne určuje priemerná výberová chyba veľkosť vzorky:čím väčšia je populácia, ceteris paribus, tým menšia je priemerná výberová chyba. Pokrytím výberového zisťovania s narastajúcim počtom jednotiek bežnej populácie čoraz presnejšie charakterizujeme celú populáciu.

Stredná vzorkovacia chyba závisí aj od stupeň variácieštudovaná vlastnosť. Stupeň variácie, ako viete, je charakterizovaný rozptylom? 2 alebo w(1-w)-- pre alternatívnu funkciu. Čím menšia je variácia funkcie, a teda aj rozptyl, tým menšia je priemerná vzorkovacia chyba a naopak. Pri nulovom rozptyle (atribút sa nemení) je priemerná výberová chyba nulová, t. j. každá jednotka všeobecnej populácie bude presne charakterizovať celú populáciu podľa tohto atribútu.

Závislosť priemernej výberovej chyby od jej objemu a stupňa variácie atribútu sa odráža vo vzorcoch, ktoré možno použiť na výpočet priemernej výberovej chyby v podmienkach pozorovania vzorky, keď všeobecné charakteristiky ( x, p) sú neznáme, a preto nie je možné zistiť skutočnú výberovú chybu priamo zo vzorcov (formulár 1), (formulár 2).

W S náhodným výberom priemerné chyby teoreticky vypočítané podľa nasledujúcich vzorcov:

* pre priemerný kvantitatívny znak

* na podiel (alternatívna charakteristika)

Keďže prakticky rozptyl atribútu v bežnej populácii? 2 nie je presne známa, v praxi používajú hodnotu rozptylu S 2 vypočítanú pre výberovú populáciu na základe zákona veľkých čísel, podľa ktorej výberová populácia s dostatočne veľkou veľkosťou vzorky presne reprodukuje charakteristiky výberového súboru. všeobecná populácia.

teda kalkulačné vzorce stredná vzorkovacie chyby náhodné prevzorkovanie bude nasledovné:

* pre priemerný kvantitatívny znak

* na podiel (alternatívna charakteristika)

Rozptyl výberovej populácie sa však nerovná rozptylu všeobecnej populácie, a preto budú priemerné výberové chyby vypočítané pomocou vzorcov (formulár 5) a (formulár 6) približné. Ale v teórii pravdepodobnosti je dokázané, že všeobecný rozptyl je vyjadrený cez voliteľný vzťah nasledujúcim vzťahom:

Pretože P/(n-1) pre dostatočne veľké P -- hodnoty blízkej jednotke, možno predpokladať, že pri praktických výpočtoch priemerných výberových chýb možno použiť vzorce (formulár 5) a (formulár 6). A iba v prípadoch malej vzorky (keď veľkosť vzorky nepresahuje 30) je potrebné vziať do úvahy koeficient P/(n-1) a vypočítajte malá vzorka stredná chyba podľa vzorca:

W X S náhodným neopakovateľným výberom vo vyššie uvedených vzorcoch na výpočet priemerných výberových chýb je potrebné vynásobiť koreňový výraz 1-(n / N), pretože počet jednotiek vo všeobecnej populácii sa v procese neopakujúceho sa vzorkovania znižuje. Preto na neopakovateľný výber kalkulačné vzorce stredná vzorkovacia chyba bude mať nasledujúcu formu:

* pre priemerný kvantitatívny znak

* na podiel (alternatívna charakteristika)

. (formulár 10)

Pretože P vždy menej N, potom ďalší faktor 1-( n/N) bude vždy menej ako jedna. Z toho vyplýva, že priemerná chyba pri neopakovanom výbere bude vždy menšia ako pri opakovanom výbere. Zároveň pri relatívne malom percente vzorky sa tento faktor blíži k jednej (napr. pri 5 % vzorke je to 0,95, pri 2 % vzorke je to 0,98 atď.). Preto sa niekedy v praxi používajú vzorce (formuláre 5) a (formuláre 6) na určenie priemernej výberovej chyby bez špecifikovaného multiplikátora, hoci vzorka je organizovaná ako neopakovaná. K tomu dochádza, keď je počet jednotiek všeobecnej populácie N neznámy alebo neobmedzený, alebo keď P veľmi málo v porovnaní s N a v podstate zavedenie dodatočného faktora, ktorého hodnota sa blíži k jednej, prakticky neovplyvní hodnotu priemernej výberovej chyby.

Mechanický odber vzoriek spočíva v tom, že výber jednotiek vo výberovom súbore zo všeobecného, ​​rozdeleného neutrálnym kritériom na rovnaké intervaly (skupiny), sa uskutočňuje tak, že z každej takejto skupiny vo výberovom súbore sa vyberie len jedna jednotka. Aby sa predišlo systematickej chybe, mala by sa vybrať jednotka, ktorá je v strede každej skupiny.

Pri organizovaní mechanického výberu sú jednotky populácie vopred usporiadané (zvyčajne v zozname) v určitom poradí (napríklad abecedne, podľa miesta, vo vzostupnom alebo zostupnom poradí hodnôt akéhokoľvek ukazovateľa, ktorý nie je spojený. so skúmanou nehnuteľnosťou atď.) atď.), po ktorej sa mechanicky v určitom intervale vyberie daný počet jednotiek. V tomto prípade sa veľkosť intervalu vo všeobecnej populácii rovná recipročnej hodnote podielu vzorky. Takže pri 2% vzorke sa vyberie a skontroluje každá 50. jednotka (1: 0,02), pri 5% vzorke každá 20. jednotka (1: 0,05), napríklad zostupný detail zo stroja.

Pri dostatočne veľkej populácii je mechanický výber z hľadiska presnosti výsledkov blízky riadnemu náhodnému. Preto sa na určenie priemernej chyby mechanickej vzorky používajú vzorce pre samonáhodné neopakujúce sa vzorkovanie (formulár 9), (formulár 10).

Na výber jednotiek z heterogénnej populácie, tzv typická vzorka , ktorý sa používa v prípadoch, keď všetky jednotky bežnej populácie možno rozdeliť do niekoľkých kvalitatívne homogénnych, podobných skupín podľa charakteristík, ktoré ovplyvňujú skúmané ukazovatele.

Pri zisťovaní podnikov môžu byť takými skupinami napríklad priemysel a podsektor, formy vlastníctva. Potom sa z každej typickej skupiny uskutoční individuálny výber jednotiek do vzorky náhodnou alebo mechanickou vzorkou.

Typická vzorka sa zvyčajne používa pri štúdiu komplexných štatistických populácií. Napríklad vo výberovom zisťovaní rodinných rozpočtov pracovníkov a zamestnancov v určitých odvetviach hospodárstva bola produktivita práce pracovníkov v podniku reprezentovaná samostatnými kvalifikačnými skupinami.

Typická vzorka poskytuje presnejšie výsledky v porovnaní s inými metódami výberu jednotiek v súbore vzoriek. Typizácia všeobecnej populácie zabezpečuje reprezentatívnosť takejto vzorky, zastúpenie každej typologickej skupiny v nej, čo umožňuje vylúčiť vplyv medziskupinového rozptylu na priemernú výberovú chybu.

Pri určovaní priemerná chyba typickej vzorky ako indikátor variácie je priemer vnútroskupinových rozptylov.

Stredná vzorkovacia chyba sa nachádzajú podľa vzorcov:

* pre priemerný kvantitatívny znak

(opätovný výber); (formulár 11)

(nevratný výber); (formulár 12)

* na podiel (alternatívna charakteristika)

(opätovný výber); (formulár 13)

(neopakovateľný výber), (formulár 14)

kde je priemer vnútroskupinových rozptylov pre populáciu vzorky;

Priemer vnútroskupinových rozptylov podielu (alternatívneho znaku) v populácii vzorky.

sériové odbery vzoriek zahŕňa náhodný výber zo všeobecnej populácie nie jednotlivých jednotiek, ale ich rovnakých skupín (hniezda, série) s cieľom podrobiť pozorovaniu v takýchto skupinách všetky jednotky bez výnimky.

Použitie sériového odberu vzoriek je spôsobené tým, že veľa tovarov na ich prepravu, skladovanie a predaj je balených do obalov, škatúľ atď. Preto je pri kontrole kvality baleného tovaru racionálnejšie kontrolovať viacero balíkov (sérií), ako vyberať potrebné množstvo tovaru zo všetkých balíkov.

Keďže v rámci skupín (sérií) sa skúmajú všetky jednotky bez výnimky, priemerná výberová chyba (pri výbere rovnakých sérií) závisí len od medziskupinového (medzisériového) rozptylu.

W Priemerná výberová chyba pre stredné skóre pri sériovom výbere sa nachádzajú podľa vzorcov:

(opätovný výber); (formulár 15)

(neopakovateľný výber), (formulár 16)

Kde r- počet vybraných sérií; R- celkový počet epizód.

Medziskupinový rozptyl sériovej vzorky sa vypočíta takto:

kde je priemer i- séria; - všeobecný priemer za celú populáciu vzorky.

W Priemerná vzorkovacia chyba pre zdieľanie (alternatívna funkcia) v sériovom výbere:

(opätovný výber); (formulár 17)

(neopakovateľný výber). (formulár 18)

medziskupina(medziséria) rozptyl podielu sériového vzorky určený podľa vzorca:

, (formulár 19)

kde je podiel funkcie v i séria; - celkový podiel znaku v celej vzorke.

V praxi štatistických zisťovaní sa okrem doteraz uvažovaných výberových metód využíva ich kombinácia (kombinovaný výber).

Pojem a výpočet výberovej chyby.

Úlohou selektívneho pozorovania je poskytnúť správne predstavy o súhrnných ukazovateľoch celej populácie na základe niektorej z nich sledovanej časti. Nazýva sa možná odchýlka podielu vzorky a priemeru vzorky od podielu a priemeru vo všeobecnej populácii vzorkovacia chyba alebo chyba reprezentatívnosti. Čím väčšia je hodnota tejto chyby, tým viac sa ukazovatele výberového pozorovania líšia od ukazovateľov bežnej populácie.

Rozdiel:

Chyby pri odbere vzoriek;

Chyby registrácie.

Chyby registrácie nastať, keď sa v procese pozorovania nesprávne zistí skutočnosť. Sú charakteristické pre kontinuálne aj selektívne pozorovanie, ale menej sú pri selektívnom pozorovaní.

Povaha chyby je:

Tendenčný – zámerný, t.j. boli vybrané buď najlepšie alebo najhoršie jednotky populácie. V tomto prípade strácajú pozorovania zmysel;

Náhodné - hlavným organizačným princípom selektívneho pozorovania je zabrániť zámernému výberu, t.j. zabezpečiť prísne dodržiavanie zásady náhodného výberu.

Všeobecné pravidlo náhodného výberu je: jednotlivé jednotky všeobecnej populácie musia mať presne tie isté podmienky a príležitosti, aby spadli do počtu jednotiek zahrnutých do vzorky. To charakterizuje nezávislosť výsledku vzorky od vôle pozorovateľa. Vôľa pozorovateľa generuje tendenčné chyby. Výberová chyba pri náhodnom výbere je náhodná. Charakterizuje veľkosť odchýlok všeobecných charakteristík od vzorových.

Vzhľadom na to, že charakteristiky v skúmanej populácii sa líšia, zloženie jednotiek vo vzorke sa nemusí zhodovať so zložením jednotiek celej populácie. Znamená to, že R a nezhodujú sa s W A . Možný nesúlad medzi týmito charakteristikami je určený výberovou chybou, ktorá je určená vzorcom:

kde je všeobecný rozptyl.

kde je rozptyl vzorky.

To ukazuje, kde sa všeobecný rozptyl líši od rozptylu vzorky v čase.

Existuje opakovaný a neopakovaný výber. Podstatou opätovného výberu je, že každá jednotka vo vzorke sa po pozorovaní vráti k bežnej populácii a môže byť znovu preskúmaná. Pri prevzorkovaní sa vypočíta priemerná vzorkovacia chyba:

Pre ukazovateľ podielu alternatívneho atribútu je výberový rozptyl určený vzorcom:

V praxi sa opätovný výber používa len zriedka. S neopakovateľným výberom veľkosť bežnej populácie N sa počas vzorkovania zníži, vzorec pre priemernú výberovú chybu pre kvantitatívny atribút je:



Jedna z možných hodnôt, v ktorej môže byť podiel študovaného znaku, sa rovná:

kde je výberová chyba alternatívneho znaku.

Príklad.

Pri výberovom prieskume 10 % výrobkov šarže hotových výrobkov metódou bez opätovného výberu boli získané nasledujúce údaje o obsahu vlhkosti vo vzorkách.

Určte priemernú vlhkosť %, rozptyl, smerodajnú odchýlku s pravdepodobnosťou 0,954, možné hranice, v ktorých sa očakáva priemer. % vlhkosti všetkých hotových výrobkov, s pravdepodobnosťou 0,987, možné limity špecifickej hmotnosti štandardných výrobkov za predpokladu, že výrobky s vlhkosťou do 13 a nad 19 % patria do neštandardnej šarže.

Len s určitou pravdepodobnosťou možno tvrdiť, že všeobecný podiel výberového podielu a všeobecný priemer výberového priemeru sa v r. t raz.

V štatistike sa tieto odchýlky nazývajú hraničné výberové chyby a sú označené.

Pravdepodobnosť rozsudkov sa môže zvýšiť alebo znížiť t raz. S pravdepodobnosťou 0,683, s 0,954, s 0,987 sa potom určia ukazovatele všeobecnej populácie podľa ukazovateľov vzorky:

Priemerná vzorkovacia chyba je vždy prítomný vo vzorových štúdiách a objavuje sa v dôsledku skutočnosti, že nie sú zisťované všetky jednotky štatistickej populácie, ale iba jej časť.

Stredná vzorkovacia chyba sa stáva marginálna chyba Δ po vynásobení faktorom spoľahlivosti t , ktorá je prednastavená na základe požadovanej presnosti pozorovania. Hraničná chyba umožňuje s určitou mierou pravdepodobnosti posúdiť „skutočnú“ veľkosť parametra v bežnej populácii

Pre typický a sériový výber pri výpočte vzorkovacej chyby namiesto celkového rozptylu 2 ) použite priemer rozptylov v rámci skupiny a rozptylu medzi skupinami
, Kde
- súkromný rozptyl skupiny i, zväzok i skupina

Vzorce pre hraničnú chybu náhodnej vzorky pri určovaní priemeru

Na opätovný výber

Vzorce pre hraničnú chybu náhodnej vzorky pri určovaní podielu

Na opätovný výber

Pre jednorazový výber

Vzorce pre veľkosť náhodnej vzorky pri určovaní priemernej hodnoty

Vzorce pre počet náhodných vzoriek pri určovaní podielu študovaného znaku

Hraničný rozdiel medzi všeobecným a výberovým priemerom zodpovedá hraničnej chybe

Hodnoty pravdepodobnosti resp t sú v distribučných tabuľkách:

  • Študent (v prípade malej vzorky)

Vzorce náhodného vzorkovania sú vhodné aj pre mechanické vzorkovanie.

Ak je potrebné zaokrúhľovanie, pri náhodnom odbere - zaokrúhľovanie nahor, pri mechanickom odbere - zaokrúhľovanie nadol.

Malá vzorka

Ak veľkosť vzorky nie je väčšia ako 30 jednotiek, potom sa priemerná chyba malej vzorky pri určovaní priemernej hodnoty vypočíta podľa vzorca:

Na výpočet chyby malej vzorky sa používa spresnený vzorec rozptylu

Typy vzorkovacích úloh

    definícia vzorkovacej chyby,

    určenie veľkosti vzorky n ,

    určenie pravdepodobnosti, že sa výberový priemer (alebo podiel) odchyľuje od všeobecného najviac o danú hodnotu t=Δ/μ,

    posúdenie náhodnosti nezrovnalostí v ukazovateľoch výberových pozorovaní,

    prenos charakteristík vzorky na všeobecnú populáciu.

Testovanie priemerných a proporčných hypotéz

Odhad náhodnosti nezrovnalostí v ukazovateľoch výberových pozorovaní


Metódy prenosu údajov vzorky bežnej populácii

    metóda váženia;

    metóda opätovného váženia;

    spôsob plnenia náhodným výberom v náhradných triedach.

marginálna chyba- maximálny možný nesúlad medzi priemerom alebo maximálnou chybou pre danú pravdepodobnosť jeho výskytu.

1. Hraničná výberová chyba pre priemer pri opakovanom výbere v sa vypočíta podľa vzorca:

kde t - normalizovaná odchýlka - "faktor spoľahlivosti", ktorý závisí od pravdepodobnosti, ktorá zaručuje hraničnú výberovú chybu;

mu x je stredná vzorkovacia chyba.

2. Hraničná vzorkovacia chyba pre pomer keď je opätovný výber určený vzorcom:

3. Hraničná výberová chyba pre priemer s neopakujúcim sa výberom:

Limit relatívnej chyby vzorkovanie je definované ako percentuálny pomer medznej výberovej chyby k zodpovedajúcej charakteristike výberového súboru. Definuje sa takto:

Malá vzorka

Bola vyvinutá teória malých vzoriek Anglický štatistik Študent na začiatku 20. storočia. V roku 1908 objavil špeciálne rozdelenie, ktoré umožňuje, dokonca aj s malými vzorkami, korelovať t a pravdepodobnosť spoľahlivosti F(t). Pre n väčšie ako 100 dávajú rovnaké výsledky ako tabuľky Laplaceovho pravdepodobnostného integrálu, pre 30< n < 100 различия получаются незначительные. Поэтому на практике к малым выборкам относятся выборки объемом менее 30 единиц.

Ako je známe, v štatistike existujú dva spôsoby pozorovania hromadných javov v závislosti od úplnosti pokrytia objektu: spojité a nespojité. Obmenou diskontinuálneho pozorovania je selektívne pozorovanie.

Pod selektívne pozorovanie sa chápe ako nekontinuálne pozorovanie, pri ktorom sa náhodne vybrané jednotky skúmanej populácie podrobia štatistickému skúmaniu (pozorovaniu).

Selektívne pozorovanie si kladie za úlohu charakterizovať celú populáciu jednotiek pre skúmanú časť pri dodržaní všetkých pravidiel a zásad štatistického pozorovania a vedecky organizovanej práce na výbere jednotiek.

Súbor jednotiek vybraných pre zisťovanie v štatistike sa zvyčajne nazýva vzorová populácia , a volá sa množina jednotiek, z ktorých sa robí výber všeobecná populácia . Hlavné charakteristiky všeobecnej a výberovej populácie sú uvedené v tabuľke 1.

Stôl 1 - Hlavné charakteristiky všeobecnej a výberovej populácie
IndexOznačenie alebo vzorec
Populácia Vzorová populácia
Počet jednotiek N n
Počet jednotiek, ktoré majú funkciu M m
Podiel jednotiek s touto vlastnosťou p = M/N ω = m/n
Podiel jednotiek, ktoré túto funkciu nemajú q = 1 - p 1 - š
Priemerná hodnota znamenie
Disperzia znamenie
Rozptýlenie alternatívneho prvku (rozptýlenie akcie) pq ω (1 – ω)

Pri vykonávaní selektívneho pozorovania sa vyskytujú systematické a náhodné chyby. Systematické chyby vznikajú v dôsledku porušenia pravidiel výberu jednotiek vo vzorke. Zmenou pravidiel výberu je možné takéto chyby eliminovať.

Náhodné chyby vznikajú v dôsledku nespojitého charakteru prieskumu. Inak sa nazývajú chyby reprezentatívnosti (reprezentatívnosti). Náhodné chyby sa delia na priemerné a hraničné výberové chyby, ktoré sa zisťujú tak pri výpočte znaku, ako aj pri výpočte podielu.

Priemerná a limitná chyba sú spojené nasledujúcim vzťahom :A = tμ, kde Δ je hraničná výberová chyba, μ je priemerná výberová chyba, t je faktor spoľahlivosti určený v závislosti od úrovne pravdepodobnosti. Tabuľka 2 ukazuje niektoré hodnoty t prevzaté z teórie pravdepodobnosti.

Hodnota priemernej chyby výberu sa vypočítava rozdielne v závislosti od metódy výberu a postupu vzorkovania. Hlavné vzorce na výpočet výberových chýb sú uvedené v tabuľke 3.

Tabuľka 3 - Základné vzorce na výpočet chýb pri vzorkovaní pri opakovanom a neopakovanom výbere
IndexOznačenie a vzorec
Populácia Vzorová populácia
Stredná chyba funkcie pre náhodné prevzorkovanie
Priemerná chyba zdieľania pre náhodné prevzorkovanie
Limit chyby funkcie v prípade náhodného opätovného výberu
Chyba okrajového podielu pri náhodnom opätovnom výbere
Priemerná chyba funkcie pre náhodný neopakujúci sa výber
Stredná chyba podielu pri náhodnom neopakujúcom sa odbere vzoriek
Limit chyby objektu s náhodným neopakujúcim sa výberom
Chyba okrajového podielu pre náhodný neopakujúci sa výber

Výpočet priemerných a hraničných výberových chýb umožňuje určiť možné hranice, v ktorých budú charakteristiky bežnej populácie .

Napríklad pre vzorový priemer sú takéto limity stanovené na základe nasledujúcich vzťahov:

Hranice podielu znaku v bežnej populácii p.

Príklady riešenia úloh na tému "Vzorkovanie pozorovania v štatistike"

Úloha 1 . Existujú informácie o produkcii produktov (práce, služby) získané na základe 10% výberového pozorovania podnikov v regióne:

Určite: 1) pre podniky zahrnuté do vzorky: a) priemernú veľkosť produkcie na podnik; b) rozptyl objemu výroby; c) podiel podnikov s objemom výroby viac ako 400 tisíc rubľov; 2) za región ako celok s pravdepodobnosťou 0,954 hranice, v rámci ktorých možno očakávať: a) priemerný objem výroby na podnik; b) podiel podnikov s objemom výroby viac ako 400 tisíc rubľov; 3) celkový objem produkcie v regióne.

Riešenie

Na vyriešenie problému rozširujeme navrhovanú tabuľku.

1) Priemerná veľkosť produkcie na podnik v prípade podnikov zaradených do vzorky

110800/400 = 277 tisíc rubľov

Rozptyl objemu produkcie vypočítame zjednodušeným spôsobom σ 2 = 35640000/400 - 277 2 = 89100 - 76229 = 12371.

Počet podnikov, ktorých objem výroby presahuje 400 tisíc rubľov. sa rovná 36+12 = 48 a ich podiel sa rovná ω = 48:400 = 0,12 = 12 %.

2) Z teórie pravdepodobnosti je známe, že s pravdepodobnosťou P=0,954 je faktor spoľahlivosti t=2. Okrajová výberová chyba

2√12371:400 = 11,12 tisíc rubľov

Stanovme si hranice všeobecného priemeru: 277-11,12 ≤Xav ≤ 277+11,12; 265,88 ≤ Xav ≤ 288,12

Hraničná výberová chyba podielu podnikov

2√0,12*0,88/400 = 0,03

Definujme hranice všeobecného podielu: 0,12-0,03≤ p ≤0,12+0,03; 0,09≤ p≤0,15

3) Nakoľko uvažovaná skupina podnikov tvorí 10 % z celkového počtu podnikov v kraji, v kraji je celkovo 4 000 podnikov. Potom celkový objem produkcie v regióne leží v rozmedzí 265,88×4000≤Q≤288,12×4000; 1063520 ≤ Q ≤ 1152480

Úloha 2 . Podľa výsledkov kontrolnej kontroly daňových úradov 400 podnikateľských štruktúr 140 z nich neuvádza v daňových priznaniach všetky príjmy podliehajúce zdaneniu. Určte v bežnej populácii (za celý kraj) podiel podnikateľských štruktúr, ktoré ukrývali časť svojich daňových príjmov s pravdepodobnosťou 0,954.

Riešenie

Podľa podmienky úlohy je počet jednotiek vo výberovej populácii n=400, počet jednotiek s uvažovaným znakom je m=140, pravdepodobnosť je P=0,954.

Z teórie pravdepodobnosti je známe, že pri pravdepodobnosti P=0,954 je faktor spoľahlivosti t=2.

Podiel jednotiek, ktoré majú uvedený atribút, je určený vzorcom: p=w+∆p, kde w = m/n=140/400=0,35=35 %,
a limitná chyba znaku ∆p sa získa zo vzorca: ∆p= t √w(1-w)/n = 2√0,35×0,65/400 ≈ 0,5 = 5 %

Potom p = 35±5 %.

Odpoveď : Podiel podnikateľských štruktúr, ktoré schovali časť svojich daňových príjmov s pravdepodobnosťou 0,954, je 35±5 %.