შერჩევითი დაკვირვება: კონცეფცია, ტიპები, შერჩევის შეცდომები, შედეგების შეფასება. პრობლემის გადაჭრის მაგალითები

შერჩევითი დაკვირვების დროს უზრუნველყოფილი უნდა იყოს უბედური შემთხვევაერთეულის შერჩევა. თითოეულ ერთეულს უნდა ჰქონდეს თანაბარი შესაძლებლობა, რომ შეირჩეს სხვებთან ერთად. ეს არის ის, რასაც ეფუძნება შემთხვევითი შერჩევა.

TO სათანადო შემთხვევითი ნიმუში ეხება ერთეულების შერჩევას მთელი საერთო პოპულაციისგან (მისი წინასწარი დაყოფის გარეშე რომელიმე ჯგუფად) წილისყრით (ძირითადად) ან სხვა მსგავსი მეთოდით, მაგალითად, შემთხვევითი რიცხვების ცხრილის გამოყენებით. შემთხვევითი შერჩევაეს არჩევანი არ არის შემთხვევითი. შემთხვევითობის პრინციპი ვარაუდობს, რომ ნიმუშიდან ობიექტის ჩართვაზე ან გამორიცხვაზე არ შეიძლება გავლენა იქონიოს სხვა ფაქტორმა, გარდა შემთხვევითობისა. Მაგალითი რეალურად შემთხვევითიშერჩევა შეიძლება გახდეს მოგების ტირაჟი: გაცემული ბილეთების მთლიანი რაოდენობადან შემთხვევითად შეირჩევა ნომრების გარკვეული ნაწილი, რომლებშიც გათვალისწინებულია მოგება. უფრო მეტიც, ყველა ნომერს ეძლევა ნიმუშში მოხვედრის თანაბარი შესაძლებლობა. ამ შემთხვევაში, ნიმუშის კომპლექტში შერჩეული ერთეულების რაოდენობა ჩვეულებრივ განისაზღვრება ნიმუშის მიღებული პროპორციის საფუძველზე.

ნიმუშის გაზიარება არის შერჩევის პოპულაციის ერთეულების რაოდენობის თანაფარდობა საერთო პოპულაციის ერთეულების რაოდენობასთან:

ასე რომ, 5% ნიმუშით ნაწილების პარტიიდან 1000 ერთეულში. ნიმუშის ზომა არის 50 ერთეული, ხოლო 10%-იანი ნიმუშით - 100 ერთეული. და ა.შ. შერჩევის სწორი სამეცნიერო ორგანიზებით, წარმომადგენლობითი შეცდომები შეიძლება შემცირდეს მინიმალურ მნიშვნელობებამდე, შედეგად, შერჩევითი დაკვირვება საკმარისად ზუსტი ხდება.

სწორი შემთხვევითი შერჩევა „სუფთა სახით“ იშვიათად გამოიყენება შერჩევითი დაკვირვების პრაქტიკაში, მაგრამ ის ამოსავალი წერტილია შერჩევის სხვა ტიპებს შორის, შეიცავს და ახორციელებს შერჩევითი დაკვირვების ძირითად პრინციპებს.

მოდით განვიხილოთ შერჩევის მეთოდის თეორიის რამდენიმე კითხვა და მარტივი შემთხვევითი ნიმუშის შეცდომის ფორმულა.

სტატისტიკაში შერჩევის მეთოდის გამოყენებისას ჩვეულებრივ გამოიყენება განზოგადების ინდიკატორების ორი ძირითადი ტიპი: რაოდენობრივი ნიშნის საშუალო მნიშვნელობადა ალტერნატიული მახასიათებლის ფარდობითი მნიშვნელობა(ერთეულების პროპორცია ან პროპორცია სტატისტიკურ პოპულაციაში, რომელიც განსხვავდება ამ პოპულაციის ყველა სხვა ერთეულისგან მხოლოდ შესასწავლი მახასიათებლის არსებობით).

ნიმუშის გაზიარება (ვ),ან სიხშირე, განისაზღვრება იმ ერთეულების რაოდენობის შეფარდებით, რომლებსაც აქვთ შესასწავლი მახასიათებელი T,შერჩევის ერთეულების საერთო რაოდენობამდე P:

მაგალითად, თუ 100 ნიმუშის დეტალიდან ( =100), 95 ნაწილი აღმოჩნდა სტანდარტული (ტ=95), შემდეგ ნიმუშის ფრაქცია

=95/100=0,95 .

ნიმუშის ინდიკატორების სანდოობის დასახასიათებლად არსებობს შუადა შერჩევის ზღვრული შეცდომა.

შერჩევის შეცდომა ? ან, სხვა სიტყვებით რომ ვთქვათ, წარმომადგენლობითი შეცდომა არის განსხვავება შესაბამის ნიმუშსა და ზოგად მახასიათებლებს შორის:

*

*

შერჩევის შეცდომა დამახასიათებელია მხოლოდ შერჩევითი დაკვირვებისთვის. რაც უფრო დიდია ამ შეცდომის მნიშვნელობა, მით უფრო განსხვავდება ნიმუშის ინდიკატორები შესაბამისი ზოგადი ინდიკატორებისგან.

ნიმუშის საშუალო და ნიმუშის წილი თანდაყოლილი არიან შემთხვევითი ცვლადები,რომელსაც შეუძლია მიიღოს სხვადასხვა მნიშვნელობები იმისდა მიხედვით, თუ რომელი პოპულაციის ერთეული იყო შერჩეული. ამიტომ, შერჩევის შეცდომები ასევე შემთხვევითი ცვლადებია და შეიძლება სხვადასხვა მნიშვნელობების მიღება. მაშასადამე, განსაზღვრეთ შესაძლო შეცდომების საშუალო - საშუალო ნიმუშის შეცდომა.

რაზეა დამოკიდებული ნიშნავს შერჩევის შეცდომას?შემთხვევითი შერჩევის პრინციპის გათვალისწინებით, შერჩევის საშუალო ცდომილება ძირითადად განისაზღვრება ნიმუშის ზომა:რაც უფრო დიდია პოპულაცია, ceteris paribus, მით უფრო მცირეა შერჩევის საშუალო შეცდომა. ფართო პოპულაციის ერთეულების მზარდი რაოდენობის შერჩევის გამოკითხვისას ჩვენ უფრო და უფრო ზუსტად ვახასიათებთ მთელ მოსახლეობას.

შერჩევის საშუალო შეცდომა ასევე დამოკიდებულია ვარიაციის ხარისხიშესწავლილი თვისება. ვარიაციის ხარისხი, მოგეხსენებათ, ხასიათდება დისპერსიით? 2 ან w(1-w)-- ალტერნატიული ფუნქციისთვის. რაც უფრო მცირეა მახასიათებლის ვარიაცია და, შესაბამისად, ვარიაცია, მით უფრო მცირეა შერჩევის საშუალო შეცდომა და პირიქით. ნულოვანი დისპერსიით (ატრიბუტი არ იცვლება), შერჩევის საშუალო შეცდომა არის ნული, ანუ ზოგადი პოპულაციის ნებისმიერი ერთეული ზუსტად დაახასიათებს მთელ პოპულაციას ამ ატრიბუტის მიხედვით.

შერჩევის საშუალო შეცდომის დამოკიდებულება მის მოცულობაზე და ატრიბუტის ცვალებადობის ხარისხზე აისახება ფორმულებში, რომლებიც შეიძლება გამოყენებულ იქნას შერჩევის საშუალო შეცდომის გამოსათვლელად ნიმუშის დაკვირვების პირობებში, როდესაც ზოგადი მახასიათებლები ( x, p)უცნობია და შესაბამისად, შერჩევის რეალური შეცდომის პოვნა უშუალოდ ფორმულებიდან (ფორმ. 1), (ფორმ. 2) შეუძლებელია.

შემთხვევითი შერჩევით საშუალო შეცდომებითეორიულად გამოითვლება შემდეგი ფორმულებით:

* საშუალო რაოდენობრივი ნიშნისთვის

* გაზიარებისთვის (ალტერნატიული მახასიათებელი)

რამდენადაც პრაქტიკულად ატრიბუტის დისპერსია ზოგად პოპულაციაში? 2 ზუსტად არ არის ცნობილი, პრაქტიკაში ისინი იყენებენ დისპერსიის S 2 მნიშვნელობას, რომელიც გამოითვლება ნიმუშის პოპულაციისთვის დიდი რიცხვების კანონის საფუძველზე, რომლის მიხედვითაც, საკმარისად დიდი ნიმუშის მქონე ნიმუშის პოპულაცია ზუსტად ასახავს მახასიათებლებს. საერთო მოსახლეობა.

ამრიგად, გაანგარიშების ფორმულები შუა შერჩევის შეცდომები შემთხვევითი შერჩევის წესი იქნება შემდეგი:

* საშუალო რაოდენობრივი ნიშნისთვის

* გაზიარებისთვის (ალტერნატიული მახასიათებელი)

თუმცა, შერჩევის პოპულაციის ვარიაცია არ არის საერთო პოპულაციის ვარიანსის ტოლი და, შესაბამისად, ფორმულებით (ფორმ. 5) და (ფორმ. 6) გამოთვლილი საშუალო შერჩევის შეცდომები იქნება მიახლოებითი. მაგრამ ალბათობის თეორიაში დამტკიცდა, რომ ზოგადი დისპერსია გამოიხატება არჩევითი გზით შემდეგი მიმართებით:

იმიტომ რომ P/(-1) საკმარისად დიდი P --ერთიანობასთან მიახლოებული მნიშვნელობა, შეიძლება ვივარაუდოთ, რომ და, შესაბამისად, საშუალო შერჩევის შეცდომების პრაქტიკულ გამოთვლებში შეიძლება გამოყენებულ იქნას ფორმულები (ფორმ. 5) და (ფორმ. 6). და მხოლოდ მცირე ნიმუშის შემთხვევაში (როდესაც ნიმუშის ზომა არ აღემატება 30-ს) აუცილებელია გავითვალისწინოთ კოეფიციენტი /(-1) და გამოთვალეთ მცირე ნიმუში საშუალო შეცდომაფორმულის მიხედვით:

W X შემთხვევითი არაგანმეორებადი შერჩევით ზემოაღნიშნულ ფორმულებში საშუალო შერჩევის შეცდომების გამოსათვლელად, აუცილებელია ძირეული გამოხატვის გამრავლება 1-(n/N-ით), ვინაიდან ერთეულების რაოდენობა ზოგად პოპულაციაში მცირდება განმეორებითი შერჩევის პროცესში. ამიტომ, არაგანმეორებადი შერჩევისთვის გაანგარიშების ფორმულები ნიშნავს შერჩევის შეცდომას მიიღებს შემდეგ ფორმას:

* საშუალო რაოდენობრივი ნიშნისთვის

* გაზიარებისთვის (ალტერნატიული მახასიათებელი)

. (ფორმა. 10)

იმიტომ რომ ყოველთვის ნაკლები , შემდეგ დამატებითი ფაქტორი 1-( N/N) ყოველთვის იქნება ერთზე ნაკლები. აქედან გამომდინარეობს, რომ საშუალო ცდომილება არაგანმეორებადი შერჩევისას ყოველთვის ნაკლები იქნება, ვიდრე განმეორებითი შერჩევისას. ამავდროულად, შერჩევის შედარებით მცირე პროცენტით, ეს ფაქტორი ერთს უახლოვდება (მაგალითად, 5%-იანი ნიმუშით არის 0.95; 2%-იანი ნიმუშით არის 0.98 და ა.შ.). ამიტომ, ზოგჯერ პრაქტიკაში, ფორმულები (ფორმები 5) და (ფორმები 6) გამოიყენება შერჩევის საშუალო შეცდომის დასადგენად მითითებული მულტიპლიკატორის გარეშე, თუმცა ნიმუში ორგანიზებულია როგორც განუმეორებელი. ეს ხდება მაშინ, როდესაც N საერთო პოპულაციის ერთეულების რაოდენობა უცნობია ან შეუზღუდავია, ან როდის ძალიან ცოტა შედარებით და არსებითად, დამატებითი ფაქტორის შემოღება, მნიშვნელობით ერთთან ახლოს, პრაქტიკულად არ იმოქმედებს საშუალო შერჩევის შეცდომის მნიშვნელობაზე.

მექანიკური სინჯის აღება მდგომარეობს იმაში, რომ ნიმუშში ერთეულების შერჩევა ზოგადიდან, ნეიტრალური კრიტერიუმით დაყოფილი თანაბარ ინტერვალებად (ჯგუფებად), ხორციელდება ისე, რომ ნიმუშის თითოეული ასეთი ჯგუფიდან შეირჩევა მხოლოდ ერთი ერთეული. სისტემატური შეცდომის თავიდან აცილების მიზნით, უნდა შეირჩეს ერთეული, რომელიც თითოეული ჯგუფის შუაშია.

მექანიკური შერჩევის ორგანიზებისას, მოსახლეობის ერთეულები წინასწარ არის მოწყობილი (ჩვეულებრივ სიაში) გარკვეული თანმიმდევრობით (მაგალითად, ანბანურად, მდებარეობის მიხედვით, ნებისმიერი ინდიკატორის მნიშვნელობების აღმავალი ან კლებადი თანმიმდევრობით, რომელიც არ არის დაკავშირებული. შესასწავლ ქონებასთან და ა.შ.) და ა.შ.), რის შემდეგაც მექანიკურად, გარკვეული ინტერვალით ირჩევა ერთეულების მოცემული რაოდენობა. ამ შემთხვევაში, საერთო პოპულაციაში ინტერვალის ზომა უდრის შერჩევის წილის საპასუხო ნაწილს. ასე რომ, 2% ნიმუშით, ყოველი 50-ე ერთეული (1: 0.02) შეირჩევა და მოწმდება, 5%-იანი ნიმუშით, ყოველი მე-20 ერთეული (1: 0.05), მაგალითად, დაღმავალი დეტალი მანქანიდან.

საკმარისად დიდი პოპულაციის პირობებში, მექანიკური შერჩევა შედეგების სიზუსტის თვალსაზრისით ახლოს არის სათანადო შემთხვევითობასთან. ამიტომ მექანიკური ნიმუშის საშუალო ცდომილების დასადგენად გამოიყენება თვითშემთხვევითი არაგანმეორებადი შერჩევის ფორმულები (ფორმ. 9), (ფორმ. 10).

ჰეტეროგენული პოპულაციისგან ერთეულების შესარჩევად ე.წ ტიპიური ნიმუში , რომელიც გამოიყენება იმ შემთხვევებში, როდესაც საერთო მოსახლეობის ყველა ერთეული შეიძლება დაიყოს რამდენიმე თვისობრივად ერთგვაროვან, მსგავს ჯგუფად იმ მახასიათებლების მიხედვით, რომლებიც გავლენას ახდენენ შესასწავლ ინდიკატორებზე.

საწარმოების გამოკვლევისას ასეთი ჯგუფები შეიძლება იყოს, მაგალითად, მრეწველობა და ქვესექტორი, საკუთრების ფორმები. შემდეგ, თითოეული ტიპიური ჯგუფიდან, ნიმუშის ერთეულების ინდივიდუალური შერჩევა ხდება შემთხვევითი ან მექანიკური ნიმუშით.

ტიპიური ნიმუში ჩვეულებრივ გამოიყენება რთული სტატისტიკური პოპულაციების შესწავლისას. მაგალითად, ეკონომიკის ცალკეულ სექტორებში დასაქმებულთა და დასაქმებულთა საოჯახო ბიუჯეტის შერჩევისას, საწარმოში მუშაკთა შრომის პროდუქტიულობა, წარმოდგენილი ცალკეული უნარების ჯგუფებით.

ტიპიური ნიმუში იძლევა უფრო ზუსტ შედეგებს ნიმუშების კომპლექტში ერთეულების შერჩევის სხვა მეთოდებთან შედარებით. ზოგადი პოპულაციის ტიპიზაცია უზრუნველყოფს ასეთი ნიმუშის წარმომადგენლობას, მასში თითოეული ტიპოლოგიური ჯგუფის წარმოდგენას, რაც შესაძლებელს ხდის გამოირიცხოს ჯგუფთაშორისი დისპერსიის გავლენა საშუალო შერჩევის შეცდომაზე.

განსაზღვრისას ტიპიური ნიმუშის საშუალო შეცდომაროგორც ვარიაციის მაჩვენებელია ჯგუფშიდა ვარიაციების საშუალო.

შერჩევის საშუალო შეცდომა გვხვდება ფორმულებით:

* საშუალო რაოდენობრივი ნიშნისთვის

(ხელახალი შერჩევა); (ფორმა. 11)

(შეუქცევადი შერჩევა); (ფორმა. 12)

* გაზიარებისთვის (ალტერნატიული მახასიათებელი)

(ხელახალი შერჩევა); (ფორმა.13)

(არაგანმეორებადი შერჩევა), (ფორმ. 14)

სად არის ჯგუფური დისპერსიების საშუალო შერჩევის პოპულაციისთვის;

შერჩევის პოპულაციაში წილის (ალტერნატიული თვისების) შიდაჯგუფური ვარიაციების საშუალო მაჩვენებელი.

სერიული ნიმუშის აღება გულისხმობს საერთო პოპულაციისგან შემთხვევით შერჩევას არა ცალკეული ერთეულების, არამედ მათი თანაბარი ჯგუფების (ბუდეები, სერია), რათა ყველა ერთეული გამონაკლისის გარეშე დაექვემდებაროს დაკვირვებას ასეთ ჯგუფებში.

სერიული სინჯების გამოყენება განპირობებულია იმით, რომ ბევრი საქონელი მათი ტრანსპორტირებისთვის, შესანახად და გასაყიდად შეფუთულია პაკეტებში, ყუთებში და ა.შ. ამიტომ დაფასოებული საქონლის ხარისხის კონტროლისას უფრო რაციონალურია რამდენიმე პაკეტის (სერიის) შემოწმება, ვიდრე ყველა შეფუთვიდან საქონლის საჭირო რაოდენობის შერჩევა.

ვინაიდან ჯგუფებში (სერიებში) ყველა ერთეული გამონაკლისის გარეშე განიხილება, შერჩევის საშუალო შეცდომა (თანაბარი სერიების არჩევისას) დამოკიდებულია მხოლოდ ჯგუფთაშორის (სერიების) დისპერსიაზე.

შერჩევის საშუალო შეცდომა საშუალო ქულისთვის სერიული შერჩევისას ისინი გვხვდება ფორმულებით:

(ხელახალი შერჩევა); (ფორმა.15)

(არაგანმეორებადი შერჩევა), (ფორმ. 16)

სად r-შერჩეული სერიების რაოდენობა; R-ეპიზოდების საერთო რაოდენობა.

სერიული ნიმუშის ჯგუფთაშორისი ვარიაცია გამოითვლება შემდეგნაირად:

სად არის საშუალო მე- ე სერია; - ზოგადი საშუალო მთლიანი შერჩევის პოპულაციისთვის.

შერჩევის საშუალო შეცდომა გაზიარებისთვის (ალტერნატიული ფუნქცია) სერიების შერჩევაში:

(ხელახალი შერჩევა); (ფორმა. 17)

(არაგანმეორებადი შერჩევა). (ფორმა. 18)

ჯგუფთაშორისი(სერიებს შორის) სერიული ნიმუშის წილის განსხვავებაგანისაზღვრება ფორმულით:

, (ფორმა. 19)

სად არის ფუნქციის წილი მეე სერია; - თვისების მთლიანი წილი მთელ ნიმუშში.

სტატისტიკური კვლევების პრაქტიკაში, ადრე განხილული შერჩევის მეთოდების გარდა, გამოიყენება მათი კომბინაცია (კომბინირებული შერჩევა).

შერჩევის შეცდომის კონცეფცია და გაანგარიშება.

შერჩევითი დაკვირვების ამოცანაა დაკვირვების ქვეშ მყოფი მათი ზოგიერთი ნაწილის საფუძველზე სწორი წარმოდგენების მიცემა მთელი მოსახლეობის შემაჯამებელ ინდიკატორებზე. საერთო პოპულაციაში შერჩევის წილისა და შერჩევის საშუალო წილისა და საშუალოს შესაძლო გადახრას ეწოდება შერჩევის შეცდომა ან წარმომადგენლობითი შეცდომა. რაც უფრო დიდია ამ შეცდომის მნიშვნელობა, მით უფრო განსხვავდება ნიმუშის დაკვირვების ინდიკატორები ზოგადი მოსახლეობისგან.

განსხვავება:

შერჩევის შეცდომები;

რეგისტრაციის შეცდომები.

რეგისტრაციის შეცდომებიხდება მაშინ, როდესაც ფაქტი არასწორად არის დადგენილი დაკვირვების პროცესში. ისინი დამახასიათებელია როგორც უწყვეტი დაკვირვებისთვის, ასევე შერჩევითი დაკვირვებისთვის, მაგრამ ისინი ნაკლებად არიან შერჩევითი დაკვირვებისთვის.

შეცდომის ბუნება შემდეგია:

ტენდენციური - მიზანმიმართული, ე.ი. შეირჩა მოსახლეობის საუკეთესო ან ყველაზე ცუდი ერთეულები. ამ შემთხვევაში დაკვირვებები აზრს კარგავს;

შემთხვევითი - შერჩევითი დაკვირვების მთავარი ორგანიზაციული პრინციპი არის მიზანმიმართული შერჩევის თავიდან აცილება, ე.ი. უზრუნველყოს შემთხვევითი შერჩევის პრინციპის მკაცრი დაცვა.

შემთხვევითი შერჩევის ზოგადი წესიარის: საერთო პოპულაციის ცალკეულ ერთეულებს უნდა ჰქონდეთ ზუსტად იგივე პირობები და შესაძლებლობები, რათა მოხვდნენ ნიმუშში შემავალი ერთეულების რაოდენობაში. ეს ახასიათებს ნიმუშის შედეგის დამოუკიდებლობას დამკვირვებლის ნებისგან. დამკვირვებლის ნება ტენდენციურ შეცდომებს წარმოშობს. შერჩევის შეცდომა შემთხვევითი შერჩევისას არის შემთხვევითი. იგი ახასიათებს ზოგადი მახასიათებლების გადახრების ზომას ნიმუშისგან.

გამომდინარე იქიდან, რომ შესწავლილ პოპულაციაში მახასიათებლები განსხვავდება, ნიმუშის ერთეულების შემადგენლობა შეიძლება არ ემთხვეოდეს მთელი პოპულაციის ერთეულების შემადგენლობას. Ეს ნიშნავს, რომ და არ ემთხვევა და . ამ მახასიათებლებს შორის შესაძლო შეუსაბამობა განისაზღვრება შერჩევის შეცდომით, რომელიც განისაზღვრება ფორმულით:

სად არის ზოგადი განსხვავება.

სად არის ნიმუშის განსხვავება.

ეს გვიჩვენებს, თუ სად განსხვავდება ზოგადი დისპერსია ნიმუშის დისპერსიისგან დროებით.

არის განმეორებითი და განუმეორებელი შერჩევა. ხელახალი შერჩევის არსი იმაში მდგომარეობს, რომ ნიმუშის თითოეული ერთეული, დაკვირვების შემდეგ, უბრუნდება ზოგად პოპულაციას და შესაძლებელია ხელახლა შესწავლა. ხელახალი შერჩევისას, შერჩევის საშუალო შეცდომა გამოითვლება:

ალტერნატიული ატრიბუტის წილის ინდიკატორისთვის, ნიმუშის განსხვავება განისაზღვრება ფორმულით:

პრაქტიკაში ხელახალი შერჩევა იშვიათად გამოიყენება. არაგანმეორებადი შერჩევით, საერთო პოპულაციის ზომა მცირდება შერჩევის დროს, შერჩევის საშუალო შეცდომის ფორმულა რაოდენობრივი ატრიბუტისთვის არის:



ერთ-ერთი შესაძლო მნიშვნელობა, რომელშიც შეიძლება იყოს შესწავლილი მახასიათებლის წილი, უდრის:

სად არის ალტერნატიული მახასიათებლის შერჩევის შეცდომა.

მაგალითი.

ხელახალი შერჩევის გარეშე მეთოდის მიხედვით მზა პროდუქციის პროდუქციის 10%-ის შერჩევისას მიღებული იქნა შემდეგი მონაცემები ნიმუშებში ტენიანობის შესახებ.

განსაზღვრეთ საშუალო ტენიანობა %, ვარიაცია, სტანდარტული გადახრა, 0,954 ალბათობით, შესაძლო ზღვრები, რომლებშიც მოსალოდნელია საშუალო. ყველა მზა პროდუქტის % ტენიანობა, ალბათობით 0,987, სტანდარტული პროდუქციის სპეციფიკური სიმძიმის შესაძლო ლიმიტები, იმ პირობით, რომ პროდუქტები 13-მდე და 19%-მდე ტენიანობის შემცველობით მიეკუთვნება არასტანდარტულ პარტიას.

მხოლოდ გარკვეული ალბათობით შეიძლება იმის მტკიცება, რომ შერჩევის წილის საერთო წილი და ნიმუშის საშუალო საშუალო საშუალო გადახრის ერთხელ.

სტატისტიკაში ამ გადახრებს ე.წ შერჩევის ზღვრული შეცდომები და აღინიშნება.

განსჯის ალბათობა შეიძლება გაიზარდოს ან შემცირდეს ერთხელ. 0,683 ალბათობით, 0,954-ით, 0,987-ით, მაშინ განისაზღვრება საერთო პოპულაციის მაჩვენებლები ნიმუშის მაჩვენებლების მიხედვით:

შერჩევის საშუალო შეცდომა ყოველთვის არის შერჩეულ კვლევებში და ჩნდება იმის გამო, რომ სტატისტიკური პოპულაციის არა ყველა ერთეული, არამედ მისი მხოლოდ ნაწილია გამოკვლეული.

შერჩევის საშუალო შეცდომა ხდება ზღვრული შეცდომა Δ როდესაც მრავლდება ნდობის ფაქტორზე , რომელიც წინასწარ არის დაყენებული დაკვირვების საჭირო სიზუსტის საფუძველზე. ზღვრული შეცდომა საშუალებას გაძლევთ განსაზღვროთ პარამეტრის "ნამდვილი" ზომა ზოგადად პოპულაციაში გარკვეული ალბათობით.

ტიპიური და სერიული შერჩევისთვის, შერჩევის შეცდომის გაანგარიშებისას მთლიანი დისპერსიის ნაცვლად 2 ) გამოიყენეთ ჯგუფური დისპერსიების საშუალო და ჯგუფს შორის დისპერსიის
, სად
- i ჯგუფის პირადი ვარიაცია, ტომი I ჯგუფი

შემთხვევითი ნიმუშის ზღვრული ცდომილების ფორმულები საშუალოს განსაზღვრისას

ხელახალი შერჩევისთვის

შემთხვევითი ნიმუშის ზღვრული შეცდომის ფორმულები პროპორციის განსაზღვრისას

ხელახალი შერჩევისთვის

არაგანმეორებადი შერჩევისთვის

შემთხვევითი ნიმუშის ზომის ფორმულები საშუალო მნიშვნელობის განსაზღვრისას

შესწავლილი ნიშან-თვისების წილის განსაზღვრისას შემთხვევითი ნიმუშების რაოდენობის ფორმულები

ზღვრული სხვაობა ზოგად და შერჩევის საშუალოს შორის შეესაბამება ზღვრულ შეცდომას

ალბათობის მნიშვნელობები და შესაბამისად არის განაწილების ცხრილებში:

  • სტუდენტი (მცირე ნიმუშის შემთხვევაში)

შემთხვევითი შერჩევის ფორმულები ასევე შესაფერისია მექანიკური შერჩევისთვის.

დამრგვალების აუცილებლობის შემთხვევაში, შემთხვევითი აღებით - დამრგვალება ზევით, მექანიკური შერჩევით - დამრგვალება.

მცირე ნიმუში

თუ ნიმუშის ზომა არ არის 30 ერთეულზე მეტი, მაშინ მცირე ნიმუშის საშუალო შეცდომა საშუალო მნიშვნელობის განსაზღვრისას გამოითვლება ფორმულით:

მცირე ნიმუშის შეცდომის გამოსათვლელად გამოიყენება დახვეწილი დისპერსიის ფორმულა

შერჩევის ამოცანების სახეები

    შერჩევის შეცდომის განმარტება,

    ნიმუშის ზომის განსაზღვრა ,

    ალბათობის განსაზღვრა, რომ ნიმუშის საშუალო (ან წილი) გადახრილია ზოგადიდან არაუმეტეს მოცემული ოდენობით t=Δ/μ,

    შერჩევის დაკვირვების ინდიკატორებში შეუსაბამობების შემთხვევითობის შეფასება,

    ნიმუშის მახასიათებლების გადაცემა ზოგად პოპულაციაზე.

საშუალო და პროპორციული ჰიპოთეზის ტესტირება

სანიმუშო დაკვირვების ინდიკატორებში შეუსაბამობების შემთხვევითობის შეფასება


ზოგადი პოპულაციისთვის ნიმუშის მონაცემების გადაცემის მეთოდები

    აწონვის მეთოდი;

    გადაწონის მეთოდი;

    შემცვლელ კლასებში შემთხვევითი შერჩევით შევსების მეთოდი.

ზღვრული შეცდომა- მაქსიმალური შესაძლო შეუსაბამობა საშუალებებს შორის ან მაქსიმალური შეცდომა მისი წარმოშობის მოცემული ალბათობით.

1. ზღვრული შერჩევის შეცდომა საშუალოზე განმეორებითი შერჩევისას გამოითვლება ფორმულით:

სადაც t - ნორმალიზებული გადახრა - "ნდობის ფაქტორი", რომელიც დამოკიდებულია შერჩევის ზღვრული შეცდომის გარანტიის ალბათობაზე;

mu x არის შერჩევის საშუალო შეცდომა.

2. შერჩევის ზღვრული შეცდომა პროპორციისთვისროდესაც ხელახალი შერჩევა განისაზღვრება ფორმულით:

3. ზღვრული შერჩევის ცდომილება საშუალოსთვის არაგანმეორებადი შერჩევით:

შეზღუდეთ ფარდობითი შეცდომაშერჩევის შერჩევა განისაზღვრება, როგორც შერჩევის ზღვრული შეცდომის პროცენტული თანაფარდობა შერჩევის პოპულაციის შესაბამის მახასიათებელთან. იგი ასე განისაზღვრება:

მცირე ნიმუში

შემუშავდა მცირე ნიმუშების თეორია ინგლისელი სტატისტიკოსი სტუდენტიმე-20 საუკუნის დასაწყისში. 1908 წელს მან აღმოაჩინა სპეციალური განაწილება, რომელიც შესაძლებელს ხდის, თუნდაც მცირე ნიმუშებით, t ​​და ნდობის ალბათობის F(t) კორელაცია. 100-ზე მეტი n-ისთვის ისინი აძლევენ იგივე შედეგებს, რასაც ლაპლასის ალბათობის ინტეგრალის ცხრილები, 30-ისთვის.< n < 100 различия получаются незначительные. Поэтому на практике к малым выборкам относятся выборки объемом менее 30 единиц.

როგორც ცნობილია, სტატისტიკაში მასობრივი ფენომენებზე დაკვირვების ორი გზა არსებობს, რაც დამოკიდებულია ობიექტის დაფარვის სისრულეზე: უწყვეტი და არაუწყვეტი. უწყვეტი დაკვირვების ვარიაცია არის შერჩევითი დაკვირვება.

ქვეშ შერჩევითი დაკვირვება გაგებულია, როგორც არა უწყვეტი დაკვირვება, რომელშიც შემთხვევით შერჩეული შესწავლილი პოპულაციის ერთეულები ექვემდებარება სტატისტიკურ გამოკვლევას (დაკვირვებას).

შერჩევითი დაკვირვება აყენებს ამოცანას, დაახასიათოს ერთეულების მთელი პოპულაცია გამოკვლეული ნაწილისთვის, ექვემდებარება სტატისტიკური დაკვირვების ყველა წესსა და პრინციპს და მეცნიერულად ორგანიზებულ მუშაობას ერთეულების შერჩევაზე.

სტატისტიკაში გამოკითხვისთვის შერჩეული ერთეულების ნაკრები ჩვეულებრივ ე.წ ნიმუშის პოპულაცია , და ერთეულთა სიმრავლე, საიდანაც ხდება შერჩევა, ეწოდება საერთო მოსახლეობა . ზოგადი და სანიმუშო პოპულაციის ძირითადი მახასიათებლები წარმოდგენილია ცხრილში 1.

ცხრილი 1 - ზოგადი და სანიმუშო პოპულაციის ძირითადი მახასიათებლები
ინდექსიაღნიშვნა ან ფორმულა
მოსახლეობა ნიმუშის პოპულაცია
ერთეულების რაოდენობა
ერთეულების რაოდენობა, რომლებსაც აქვთ ფუნქცია
ამ მახასიათებლის მქონე ერთეულების პროპორცია p = M/N ω = m/n
ერთეულების პროპორცია, რომლებსაც არ გააჩნიათ ეს ატრიბუტი q = 1 - გვ 1 - ვ
Საშუალო ღირებულება ნიშანი
დისპერსია ნიშანი
ალტერნატიული ფუნქციის დისპერსია (წილის დისპერსია) pq ω (1 - ω)

შერჩევითი დაკვირვების ჩატარებისას ხდება სისტემატური და შემთხვევითი შეცდომები. სისტემატური შეცდომები წარმოიქმნება ნიმუშში ერთეულების შერჩევის წესების დარღვევის გამო. შერჩევის წესების შეცვლით, ასეთი შეცდომები შეიძლება აღმოიფხვრას.

შემთხვევითი შეცდომები წარმოიქმნება გამოკითხვის წყვეტილი ხასიათის გამო. წინააღმდეგ შემთხვევაში, მათ წარმომადგენლობითობის (წარმომადგენლობის) შეცდომებს უწოდებენ. შემთხვევითი შეცდომები იყოფა შერჩევის საშუალო და ზღვრულ შეცდომებად, რომლებიც განისაზღვრება როგორც მახასიათებლის გაანგარიშებისას, ასევე წილის გამოთვლისას.

საშუალო და ზღვრული შეცდომები დაკავშირებულია შემდეგი მიმართებით :Δ = tμ, სადაც Δ არის შერჩევის ზღვრული შეცდომა, μ არის შერჩევის საშუალო შეცდომა, t არის ნდობის ფაქტორი, რომელიც განისაზღვრება ალბათობის დონის მიხედვით. ცხრილი 2 გვიჩვენებს t-ის რამდენიმე მნიშვნელობას, რომელიც აღებულია ალბათობის თეორიიდან.

შერჩევის საშუალო შეცდომის მნიშვნელობა გამოითვლება განსხვავებულად, შერჩევის მეთოდისა და შერჩევის პროცედურის მიხედვით. შერჩევის შეცდომების გამოთვლის ძირითადი ფორმულები მოცემულია ცხრილში 3.

ცხრილი 3 - განმეორებითი და განმეორებითი შერჩევისას შერჩევის შეცდომების გამოთვლის ძირითადი ფორმულები
ინდექსიაღნიშვნა და ფორმულა
მოსახლეობა ნიმუშის პოპულაცია
მახასიათებლის საშუალო შეცდომა შემთხვევითი შერჩევისთვის
გაზიარების საშუალო შეცდომა შემთხვევითი შერჩევისთვის
ფუნქციის შეცდომის შეზღუდვა შემთხვევითი ხელახალი შერჩევის შემთხვევაში
ზღვრული გაზიარების შეცდომა შემთხვევითი ხელახალი შერჩევისას
ფუნქციის საშუალო შეცდომა შემთხვევითი არაგანმეორებადი შერჩევისთვის
საშუალო გაზიარების შეცდომა შემთხვევითი არაგანმეორებადი შერჩევისას
ფუნქციის შეცდომის შეზღუდვა შემთხვევითი არაგანმეორებადი შერჩევით
ზღვრული გაზიარების შეცდომა შემთხვევითი არაგანმეორებადი შერჩევისთვის

შერჩევის საშუალო და ზღვრული შეცდომების გაანგარიშება საშუალებას გაძლევთ განსაზღვროთ შესაძლო საზღვრები, რომლებშიც იქნება ზოგადი პოპულაციის მახასიათებლები .

მაგალითად, საშუალო ნიმუშისთვის, ასეთი ლიმიტები დადგენილია შემდეგი ურთიერთობების საფუძველზე:

ნიშან-თვისების წილის ლიმიტები ზოგად პოპულაციაში გვ.

ამოცანების გადაჭრის მაგალითები თემაზე "შერჩევის დაკვირვება სტატისტიკაში"

დავალება 1 . არსებობს ინფორმაცია რეგიონის საწარმოებზე 10%-იანი შერჩევითი დაკვირვების საფუძველზე მიღებული პროდუქციის (სამუშაო, მომსახურება) გამოშვების შესახებ:

განსაზღვრეთ: 1) ნიმუშში შემავალი საწარმოებისთვის: ა) პროდუქციის საშუალო ზომა ერთ საწარმოზე; ბ) წარმოების მოცულობის დისპერსიას; გ) საწარმოების წილი, რომელთა წარმოების მოცულობა აღემატება 400 ათას რუბლს; 2) მთლიანი რეგიონისთვის, 0,954 ალბათობით, ლიმიტები, რომლის ფარგლებშიც შეიძლება ველოდოთ: ა) წარმოების საშუალო მოცულობას ერთ საწარმოზე; ბ) საწარმოების წილი, რომელთა წარმოების მოცულობა აღემატება 400 ათას რუბლს; 3) რეგიონში გამოშვების მთლიანი მოცულობა.

გამოსავალი

პრობლემის გადასაჭრელად, ჩვენ ვაფართოებთ შემოთავაზებულ ცხრილს.

1) ნიმუშში შემავალი საწარმოებისთვის, პროდუქციის საშუალო ზომა ერთ საწარმოზე

110800/400 = 277 ათასი რუბლი

წარმოების მოცულობის დისპერსიას ვიანგარიშებთ გამარტივებული გზით σ 2 = 35640000/400 - 277 2 = 89100 - 76229 = 12371.

საწარმოების რაოდენობა, რომელთა წარმოების მოცულობა აღემატება 400 ათას რუბლს. უდრის 36+12 = 48-ს და მათი წილი უდრის ω = 48:400 = 0,12 = 12%.

2) ალბათობის თეორიიდან ცნობილია, რომ ალბათობით P=0.954 ნდობის ფაქტორი t=2. შერჩევის ზღვრული შეცდომა

2√12371:400 = 11,12 ათასი რუბლი

დავადგინოთ საერთო საშუალოს საზღვრები: 277-11,12 ≤Xav ≤ 277+11,12; 265.88 ≤Xav ≤ 288.12

საწარმოთა წილის ზღვრული შერჩევის შეცდომა

2√0,12*0,88/400 = 0,03

განვსაზღვროთ საერთო წილის საზღვრები: 0,12-0,03≤ p ≤0,12+0,03; 0.09≤ p≤0.15

3) ვინაიდან საწარმოთა განხილული ჯგუფი შეადგენს რეგიონის საწარმოთა საერთო რაოდენობის 10%-ს, მთლიანობაში რეგიონში 4000 საწარმოა. მაშინ გამომავალი მთლიანი მოცულობა რეგიონში 265,88×4000≤Q≤288,12×4000 ფარგლებშია; 1063520 ≤ Q ≤ 1152480

დავალება 2 . 400 ბიზნეს სტრუქტურის საგადასახადო ორგანოების მიერ ჩატარებული საკონტროლო აუდიტის შედეგების მიხედვით, მათგან 140 საგადასახადო დეკლარაციაში სრულად არ არის მითითებული დაბეგვრას დაქვემდებარებული შემოსავალი. განსაზღვრეთ ზოგადად მოსახლეობაში (მთელი რეგიონისთვის) ბიზნეს სტრუქტურების წილი, რომლებიც მალავდნენ საგადასახადო შემოსავლების ნაწილს 0,954 ალბათობით.

გამოსავალი

პრობლემის პირობის მიხედვით შერჩევის პოპულაციაში ერთეულების რაოდენობაა n=400, განხილული მახასიათებლის მქონე ერთეულების რაოდენობაა m=140, ალბათობა P=0,954.

ალბათობის თეორიიდან ცნობილია, რომ ალბათობით P=0.954 ნდობის ფაქტორი t=2.

ერთეულების წილი, რომლებსაც აქვთ მითითებული ატრიბუტი, განისაზღვრება ფორმულით: p=w+∆p, სადაც w = m/n=140/400=0.35=35%,
ხოლო ∆p მახასიათებლის ზღვრული შეცდომა მიღებულია ფორმულიდან: ∆p= t √w(1-w)/n = 2√0.35×0.65/400 ≈ 0.5 = 5%

შემდეგ p = 35±5%.

უპასუხე : ბიზნეს სტრუქტურების წილი, რომლებმაც დამალეს საგადასახადო შემოსავლის ნაწილი 0,954 ალბათობით, არის 35±5%.