მოსახლეობის შერჩევითი მაჩვენებლები. პრაქტიკული გაანგარიშების მაგალითები

ხშირად ხდება, რომ საჭიროა კონკრეტული სოციალური ფენომენის ანალიზი და მის შესახებ ინფორმაციის მოპოვება. ასეთი ამოცანები ხშირად ჩნდება სტატისტიკასა და სტატისტიკურ კვლევაში. სრულად განსაზღვრული სოციალური ფენომენის გადამოწმება ხშირად შეუძლებელია. მაგალითად, როგორ გავარკვიოთ მოსახლეობის ან გარკვეული ქალაქის ყველა მაცხოვრებლის აზრი რომელიმე საკითხზე? აბსოლუტურად ყველას კითხვა თითქმის შეუძლებელია და ძალიან შრომატევადი. ასეთ შემთხვევებში ჩვენ გვჭირდება ნიმუში. ეს არის ზუსტად ის კონცეფცია, რომელსაც ეფუძნება თითქმის ყველა კვლევა და ანალიზი.

რა არის ნიმუში

კონკრეტული სოციალური ფენომენის გაანალიზებისას აუცილებელია მის შესახებ ინფორმაციის მოპოვება. თუ რაიმე კვლევას ავიღებთ, დავინახავთ, რომ კვლევის ობიექტის მთლიანობის ყველა ერთეული არ ექვემდებარება კვლევას და ანალიზს. ამ მთლიანობის მხოლოდ გარკვეული ნაწილია გათვალისწინებული. ეს პროცესი არის ნიმუშის აღება: როდესაც კომპლექტიდან მხოლოდ გარკვეული ერთეულები განიხილება.

რა თქმა უნდა, ბევრი რამ არის დამოკიდებული ნიმუშის ტიპზე. მაგრამ ასევე არსებობს ძირითადი წესები. მთავარი ამბობს, რომ მოსახლეობისგან შერჩევა აბსოლუტურად შემთხვევითი უნდა იყოს. გამოსაყენებელი პოპულაციის ერთეულები არ უნდა შეირჩეს რაიმე კრიტერიუმის გამო. უხეშად რომ ვთქვათ, თუ საჭიროა გარკვეული ქალაქის მოსახლეობისგან მოსახლეობის შეგროვება და მხოლოდ მამაკაცების შერჩევა, მაშინ იქნება შეცდომა კვლევაში, რადგან შერჩევა შემთხვევითი არ არის, არამედ სქესის მიხედვით შეირჩა. ამ წესს ეფუძნება შერჩევის თითქმის ყველა მეთოდი.

შერჩევის წესები

იმისათვის, რომ შერჩეულმა კომპლექტმა ასახოს მთელი ფენომენის ძირითადი თვისებები, ის უნდა აშენდეს კონკრეტული კანონების მიხედვით, სადაც მთავარი ყურადღება უნდა მიექცეს შემდეგ კატეგორიებს:

ნიმუში (ნიმუშის პოპულაცია);
საერთო მოსახლეობა;
წარმომადგენლობა;
წარმომადგენლობითობის შეცდომა;
მოსახლეობის ერთეული;
შერჩევის მეთოდები.

შერჩევითი დაკვირვებისა და შერჩევის მახასიათებლები შემდეგია:

ყველა მიღებული შედეგი ეფუძნება მათემატიკურ კანონებსა და წესებს, ანუ კვლევის სწორი ჩატარებით და სწორი გამოთვლებით შედეგები არ იქნება დამახინჯებული სუბიექტურ საფუძველზე.
ეს შესაძლებელს ხდის შედეგის ბევრად უფრო სწრაფად და ნაკლები დროისა და რესურსით მიღებას, მოვლენების არა მთელი რიგის, არამედ მათი მხოლოდ ნაწილის შესწავლით.
მისი გამოყენება შესაძლებელია სხვადასხვა ობიექტების შესასწავლად: კონკრეტული საკითხებიდან, მაგალითად, ასაკი, ჩვენთვის საინტერესო ჯგუფის სქესი, საზოგადოებრივი აზრის შესწავლა თუ მოსახლეობის მატერიალური მხარდაჭერის დონე.

შერჩევითი დაკვირვება

შერჩევითი - ეს არის ისეთი სტატისტიკური დაკვირვება, რომლის დროსაც კვლევას ექვემდებარება არა შესწავლილი მთელი პოპულაცია, არამედ მისი მხოლოდ გარკვეული ნაწილი, შერჩეული გარკვეული გზით და ამ ნაწილის კვლევის შედეგები ვრცელდება მთელ პოპულაციაზე. ამ ნაწილს სინჯის ჩარჩო ეწოდება. ეს არის ერთადერთი გზა სასწავლო ობიექტის დიდი მასივის შესასწავლად.

მაგრამ შერჩევითი დაკვირვება შეიძლება გამოყენებულ იქნას მხოლოდ იმ შემთხვევებში, როდესაც საჭიროა მხოლოდ მცირე ჯგუფის ერთეულების შესწავლა. მაგალითად, მსოფლიოში მამაკაცებისა და ქალების თანაფარდობის შესწავლისას გამოყენებული იქნება შერჩევითი დაკვირვება. გასაგები მიზეზების გამო, შეუძლებელია ჩვენი პლანეტის თითოეული მკვიდრის გათვალისწინება.

მაგრამ ერთი და იგივე შესწავლით, მაგრამ არა დედამიწის ყველა მკვიდრის, არამედ გარკვეული 2 "A" კლასის კონკრეტულ სკოლაში, გარკვეულ ქალაქში, გარკვეულ ქვეყანაში, შერჩევითი დაკვირვება შეიძლება გამორიცხული იყოს. ყოველივე ამის შემდეგ, სავსებით შესაძლებელია სასწავლო ობიექტის მთელი მასივის ანალიზი. აუცილებელია ამ კლასის ბიჭების და გოგონების დათვლა - ეს იქნება თანაფარდობა.

ნიმუში და პოპულაცია

სინამდვილეში ეს არც ისე რთულია, როგორც ჟღერს. კვლევის ნებისმიერ ობიექტში არის ორი სისტემა: ზოგადი და სანიმუშო პოპულაცია. Რა არის ეს? ყველა ერთეული ეკუთვნის გენერალს. ხოლო ნიმუშს - მთლიანი პოპულაციის ის ერთეულები, რომლებიც აღებული იქნა ნიმუშისთვის. თუ ყველაფერი სწორად გაკეთდა, მაშინ არჩეული ნაწილი იქნება მთელი (ზოგადი) პოპულაციის შემცირებული განლაგება.

თუ ვსაუბრობთ ზოგად პოპულაციაზე, მაშინ შეგვიძლია გამოვყოთ მისი მხოლოდ ორი ჯიში: განსაზღვრული და განუსაზღვრელი ზოგადი პოპულაცია. ეს დამოკიდებულია იმაზე, ცნობილია თუ არა მოცემული სისტემის ერთეულების საერთო რაოდენობა. თუ ეს არის გარკვეული პოპულაცია, მაშინ სინჯის აღება გაადვილდება იმის გამო, რომ ცნობილია, თუ რამდენი პროცენტი იქნება აღებული ერთეულების მთლიანი რაოდენობით.

ეს მომენტი ძალიან აუცილებელია კვლევაში. მაგალითად, თუ საჭიროა კონკრეტულ ქარხანაში დაბალი ხარისხის საკონდიტრო ნაწარმის პროცენტული შესწავლა. დავუშვათ, რომ მოსახლეობა უკვე განსაზღვრულია. დანამდვილებით ცნობილია, რომ ეს საწარმო წელიწადში 1000 საკონდიტრო ნაწარმს აწარმოებს. თუ ამ ათასიდან 100 შემთხვევითი საკონდიტრო ნაწარმის ნიმუშს გავაკეთებთ და გამოვგზავნით შესამოწმებლად, მაშინ შეცდომა მინიმალური იქნება. უხეშად რომ ვთქვათ, ყველა პროდუქტის 10% ექვემდებარებოდა კვლევას და შედეგებიდან გამომდინარე, წარმომადგენლობითი შეცდომის გათვალისწინებით, შეიძლება ვისაუბროთ ყველა პროდუქტის უხარისხობაზე.

და თუ თქვენ გააკეთებთ 100 საკონდიტრო ნაწარმის ნიმუშს განუსაზღვრელი ზოგადი პოპულაციისგან, სადაც რეალურად იყო, ვთქვათ, 1 მილიონი ერთეული, მაშინ ნიმუშის შედეგი და თავად კვლევის შედეგი იქნება კრიტიკულად დაუჯერებელი და არაზუსტი. Იგრძენი განსხვავება? ამიტომ, ზოგადი მოსახლეობის სიზუსტე უმეტეს შემთხვევაში უაღრესად მნიშვნელოვანია და დიდად მოქმედებს კვლევის შედეგზე.

მოსახლეობის წარმომადგენლობა

ასე რომ, ახლა ერთ-ერთი ყველაზე მნიშვნელოვანი კითხვა - როგორი უნდა იყოს ნიმუში? ეს არის კვლევის ყველაზე მნიშვნელოვანი წერტილი. ამ ეტაპზე აუცილებელია ნიმუშის გამოთვლა და მასში მთლიანი რიცხვიდან ერთეულების შერჩევა. პოპულაცია სწორად იქნა შერჩეული, თუ შერჩეულში რჩება ზოგადი პოპულაციის გარკვეული მახასიათებლები და მახასიათებლები. ამას ჰქვია წარმომადგენლობა.

სხვა სიტყვებით რომ ვთქვათ, თუ შერჩევის შემდეგ, ნაწილი ინარჩუნებს იგივე ტენდენციებსა და მახასიათებლებს, როგორც მთელი გამოკვლეული რაოდენობა, მაშინ ასეთ პოპულაციას ეწოდება წარმომადგენლობითი. მაგრამ ყველა კონკრეტული ნიმუში არ შეიძლება შეირჩეს წარმომადგენლობითი პოპულაციისგან. არის ისეთი კვლევის ობიექტებიც, რომელთა ნიმუში უბრალოდ რეპრეზენტატიული ვერ იქნება. აქედან მოდის წარმომადგენლობითი შეცდომის ცნება. მაგრამ ამაზე ცოტა მეტი ვისაუბროთ.

როგორ გავაკეთოთ არჩევანი

ასე რომ, წარმომადგენლობითობის მაქსიმალურად გაზრდის მიზნით, არსებობს შერჩევის სამი ძირითადი წესი:

ნიმუშის რაოდენობის ყველაზე უნიკალურ მაჩვენებლად ითვლება 20%. 20%-იანი სტატისტიკური ნიმუში თითქმის ყოველთვის იძლევა რეალობასთან მაქსიმალურად მიახლოებულ შედეგს. ამავდროულად, არ არის საჭირო მოსახლეობის შეგროვებულ უფრო დიდ ნაწილზე გადარიცხვა. შერჩევის 20% არის მაჩვენებელი, რომელიც შემუშავებულია მრავალი კვლევის შედეგად. მოდით შევხედოთ კიდევ რამდენიმე თეორიას. რაც უფრო დიდია ნიმუში, მით უფრო მცირეა წარმომადგენლობითობის შეცდომა და უფრო ზუსტია კვლევის შედეგი. რაც უფრო ახლოს იქნება ნიმუშის პოპულაცია ზოგად პოპულაციასთან ერთეულების რაოდენობის მიხედვით, მით უფრო ზუსტი და სწორი იქნება შედეგები. ყოველივე ამის შემდეგ, თუ თქვენ შეამოწმებთ მთელ სისტემას, მაშინ შედეგი იქნება 100%. მაგრამ აქ არჩევანი არ არის. ეს არის ის კვლევები, რომლებშიც მთელი მასივი განიხილება, ყველა ერთეული, ასე რომ ეს ჩვენ არ გვაინტერესებს.
ზოგადი მოსახლეობის 20%-ის დამუშავების მიზანშეუწონლობის შემთხვევაში დასაშვებია მოსახლეობის ერთეულების შესწავლა არანაკლებ 1001 ოდენობით. ეს ასევე არის კვლევის ობიექტის მასივის შესწავლის ერთ-ერთი მაჩვენებელი. , რომელიც დროთა განმავლობაში განვითარდა. რა თქმა უნდა, ის არ მოგცემთ ზუსტ შედეგებს კვლევის დიდი მასივებით, მაგრამ რაც შეიძლება ახლოს მიიყვანს მას ნიმუშის შესაძლო სიზუსტესთან.
სტატისტიკაში ბევრი ფორმულა და ცხრილია. კვლევის ობიექტიდან და შერჩევის კრიტერიუმიდან გამომდინარე, მიზანშეწონილია ამა თუ იმ ფორმულის არჩევა. მაგრამ ეს ელემენტი გამოიყენება რთულ და მრავალსაფეხურიან კვლევებში.

წარმომადგენლობის შეცდომა (შეცდომა).

შერჩეული ნიმუშის ხარისხის მთავარი მახასიათებელია „წარმომადგენლობის შეცდომის“ კონცეფცია. Რა არის ეს? ეს არის გარკვეული შეუსაბამობები შერჩევითი და უწყვეტი დაკვირვების მაჩვენებლებს შორის. შეცდომის ინდიკატორების მიხედვით, წარმომადგენლობა იყოფა საიმედო, ჩვეულებრივ და მიახლოებით. სხვა სიტყვებით რომ ვთქვათ, მისაღებია გადახრები 3%-მდე, 3-დან 10%-მდე და 10-დან 20%-მდე. თუმცა სტატისტიკაში სასურველია, რომ შეცდომა 5-6%-ს არ აღემატებოდეს. წინააღმდეგ შემთხვევაში, ნიმუშის არასაკმარის წარმომადგენლობაზე საუბრის საფუძველი არსებობს. წარმომადგენლობითი შეცდომის გამოსათვლელად და როგორ აისახება ის ნიმუშზე ან პოპულაციაზე, მხედველობაში მიიღება მრავალი ფაქტორი:

ალბათობა, რომლითაც უნდა მივიღოთ ზუსტი შედეგი.
შერჩევის ერთეულების რაოდენობა. როგორც უკვე აღვნიშნეთ, რაც უფრო მცირეა ერთეულების რაოდენობა ნიმუშში, მით უფრო დიდი იქნება წარმომადგენლობითი შეცდომა და პირიქით.
საკვლევი პოპულაციის ჰომოგენურობა. რაც უფრო ჰეტეროგენული იქნება მოსახლეობა, მით უფრო დიდი იქნება წარმომადგენლობითი შეცდომა. პოპულაციის უნარი იყოს წარმომადგენლობითი დამოკიდებულია მისი ყველა შემადგენელი ერთეულის ერთგვაროვნებაზე.
ერთეულების შერჩევის მეთოდი შერჩევის პოპულაციაში.

კონკრეტულ კვლევებში საშუალო პროცენტულ ცდომილებას, როგორც წესი, თავად მკვლევარი ადგენს, დაკვირვების პროგრამის საფუძველზე და წინა კვლევების მონაცემების მიხედვით. როგორც წესი, მისაღებია შერჩევის მაქსიმალური შეცდომა (წარმომადგენლობის შეცდომა) 3-5%-ის ფარგლებში.

მეტი ყოველთვის არ არის უკეთესი

ასევე უნდა გვახსოვდეს, რომ შერჩევითი დაკვირვების ორგანიზებისას მთავარია მისი მოცულობის მისაღებ მინიმუმამდე მიყვანა. ამავდროულად, არ უნდა ვცდილობთ ზედმეტად შემცირდეს შერჩევის შეცდომის ლიმიტები, რადგან ამან შეიძლება გამოიწვიოს ნიმუშის მონაცემების რაოდენობის გაუმართლებელი ზრდა და, შესაბამისად, შერჩევის ღირებულების ზრდა.

ამავე დროს, წარმომადგენლობითი შეცდომის ზომა არ უნდა გაიზარდოს ზედმეტად. ყოველივე ამის შემდეგ, ამ შემთხვევაში, მიუხედავად იმისა, რომ იქნება ნიმუშის ზომის შემცირება, ეს გამოიწვევს მიღებული შედეგების სანდოობის გაუარესებას.

რა კითხვებს სვამს ჩვეულებრივ მკვლევარი?

ნებისმიერი კვლევა, თუ ჩატარდა, არის გარკვეული მიზნისთვის და გარკვეული შედეგების მისაღებად. სანიმუშო გამოკითხვის ჩატარებისას, როგორც წესი, საწყისი კითხვებია:

სინჯის ერთეულის საჭირო რაოდენობის განსაზღვრა, ანუ რამდენი ერთეული იქნება გამოკვლეული. გარდა ამისა, ზუსტი კვლევისთვის მოსახლეობა რეპრეზენტატიული უნდა იყოს.
წარმომადგენლობითობის შეცდომის გამოთვლა ალბათობის დადგენილი დონით. დაუყოვნებლივ უნდა აღინიშნოს, რომ შერჩევითი კვლევები არ ხდება 100% ალბათობის დონით. თუ ავტორიტეტი, რომელმაც ჩაატარა კონკრეტული სეგმენტის კვლევა, ამტკიცებს, რომ მათი შედეგები ზუსტია 100%-იანი ალბათობით, მაშინ ეს ტყუილია. მრავალწლიანმა პრაქტიკამ უკვე დაადგინა სწორად ჩატარებული ნიმუშის კვლევის ალბათობის პროცენტი. ეს მაჩვენებელი 95,4%-ია.

ნიმუშში კვლევის ერთეულების შერჩევის მეთოდები

ყველა ნიმუში არ არის წარმომადგენლობითი. ზოგჯერ ერთი და იგივე ნიშანი განსხვავებულად არის გამოხატული მთლიანობაში და მის ნაწილში. წარმომადგენლობითობის მოთხოვნების მისაღწევად, მიზანშეწონილია გამოიყენოთ შერჩევის სხვადასხვა ტექნიკა. უფრო მეტიც, ამა თუ იმ მეთოდის გამოყენება დამოკიდებულია კონკრეტულ გარემოებებზე. შერჩევის ზოგიერთი მეთოდი მოიცავს:

შემთხვევითი შერჩევა;
მექანიკური შერჩევა;
ტიპიური შერჩევა;
სერიული (ჩასმული) შერჩევა.

შემთხვევითი შერჩევა არის აქტივობების სისტემა, რომელიც მიზნად ისახავს პოპულაციის ერთეულების შემთხვევით შერჩევას, როდესაც ნიმუშში შეყვანის ალბათობა ტოლია საერთო პოპულაციის ყველა ერთეულისთვის. ამ ტექნიკის გამოყენება მიზანშეწონილია მხოლოდ ჰომოგენურობისა და მისი თანდაყოლილი მახასიათებლების მცირე რაოდენობის შემთხვევაში. წინააღმდეგ შემთხვევაში, ზოგიერთი დამახასიათებელი თვისება ემუქრება ნიმუშში არ ასახვას. შემთხვევითი შერჩევის თავისებურებები საფუძვლად უდევს შერჩევის ყველა სხვა მეთოდს.

ერთეულების მექანიკური შერჩევა ხორციელდება გარკვეული ინტერვალით. თუ საჭიროა კონკრეტული დანაშაულების ნიმუშის ფორმირება, შესაძლებელია ყოველი მე-5, მე-10 ან მე-15 ბარათის ამოღება დაფიქსირებული დანაშაულის ყველა სტატისტიკური ჩანაწერიდან მათი საერთო რაოდენობისა და ხელმისაწვდომი ნიმუშის ზომის მიხედვით. ამ მეთოდის მინუსი ის არის, რომ შერჩევამდე აუცილებელია მოსახლეობის ერთეულების სრული აღრიცხვა, შემდეგ საჭიროა რეიტინგის ჩატარება და მხოლოდ ამის შემდეგ არის შესაძლებელი ნიმუშის აღება გარკვეული ინტერვალით. ამ მეთოდს დიდი დრო სჭირდება, ამიტომ ხშირად არ გამოიყენება.

ტიპიური (რეგიონული) შერჩევა არის ნიმუშის ტიპი, რომელშიც ზოგადი პოპულაცია იყოფა ერთგვაროვან ჯგუფებად გარკვეული ატრიბუტის მიხედვით. ზოგჯერ მკვლევარები „ჯგუფების“ ნაცვლად სხვა ტერმინებს იყენებენ: „უბნები“ და „ზონები“. შემდეგ, თითოეული ჯგუფიდან შემთხვევითი წესით შეირჩევა ერთეულების გარკვეული რაოდენობა მთლიან პოპულაციაში ჯგუფის წილის პროპორციულად. ტიპიური შერჩევა ხშირად რამდენიმე ეტაპად ხორციელდება.

სერიული შერჩევა არის მეთოდი, რომლის დროსაც ერთეულების შერჩევა ხდება ჯგუფებად (სერიებით) და შერჩეული ჯგუფის (სერიების) ყველა ერთეული ექვემდებარება შემოწმებას. ამ მეთოდის უპირატესობა ის არის, რომ ზოგჯერ უფრო რთულია ცალკეული ერთეულების შერჩევა, ვიდრე სერიები, მაგალითად, სასჯელის მოხდის პირის შესწავლისას. შერჩეულ ზონებში, ზონებში გამოიყენება ყველა ერთეულის შესწავლა გამონაკლისის გარეშე, მაგალითად, კონკრეტულ დაწესებულებაში სასჯელს იხდის ყველა პირის შესწავლა.

თემა: ნიმუშის აღება სტატისტიკაში

1. შერჩევითი დაკვირვების ცნება, მისი ამოცანები

სტატისტიკური დაკვირვება შეიძლება იყოს ორგანიზებული უწყვეტი და არაუწყვეტი. უწყვეტი დაკვირვებამოიცავს შესწავლილი მოსახლეობის ყველა ერთეულის გამოკითხვას და დაკავშირებულია დიდ შრომით და მატერიალურ ხარჯებთან. შეიძლება განხორციელდეს მოსახლეობის არა ყველა ერთეულის, არამედ მხოლოდ გარკვეული ნაწილის შესწავლა, რომლითაც უნდა ვიმსჯელოთ მთლიანი მოსახლეობის თვისებებზე. უწყვეტიდაკვირვება. სტატისტიკურ პრაქტიკაში ყველაზე გავრცელებულია შერჩევითი დაკვირვება.

შერჩევითი დაკვირვება - ეს არის უწყვეტი დაკვირვების ტიპი, რომლის დროსაც გამოსაკვლევი ერთეულების შერჩევა ხდება შემთხვევითი თანმიმდევრობით, შერჩეული ნაწილის შესწავლა და შედეგები ნაწილდება მთელ თავდაპირველ პოპულაციაზე. დაკვირვება ორგანიზებულია ისე, რომ შერჩეული ერთეულების ეს ნაწილი შემცირებული მასშტაბით წარმოადგენს(წარმოადგენს) მთელ მოსახლეობას.

მოსახლეობას, საიდანაც ხდება შერჩევა ე.წ გენერალური, გენერალი.

არჩეული ერთეულების სიმრავლე ე.წ ნიმუშის ნაკრები,და მისი ყველა ზოგადი მაჩვენებელი - შერჩევითი.

არსებობს მრავალი მიზეზი, რის გამოც, ხშირ შემთხვევაში, შერჩევითი დაკვირვება უპირატესობას ანიჭებს უწყვეტ დაკვირვებას. მათგან ყველაზე მნიშვნელოვანი შემდეგია:

დროისა და ფულის დაზოგვა სამუშაოს მოცულობის შემცირების შედეგად;

შესასწავლი ობიექტების დაზიანების ან განადგურების მინიმუმამდე შემცირება (ნართის სიმტკიცის დადგენა შესვენებისას, ელექტრო ნათურების ტესტირება წვის ხანგრძლივობისთვის, დაკონსერვებული საკვების კარგი ხარისხის შემოწმება);

დაკვირვების თითოეული ერთეულის დეტალური შესწავლის აუცილებლობა, როდესაც შეუძლებელია ყველა ერთეულის დაფარვა (ოჯახების ბიუჯეტის შესწავლისას);

მიაღწიეთ კვლევის შედეგების უფრო მეტ სიზუსტეს რეგისტრაციის შეცდომების შემცირებით.

შერჩევითი დაკვირვების უპირატესობა მუდმივ დაკვირვებასთან შედარებით შეიძლება განხორციელდეს, თუ ის ორგანიზებული და განხორციელდება მეცნიერული პრინციპების მკაცრი დაცვით. შერჩევის მეთოდის თეორია.ეს პრინციპებია: უზრუნველყოფა შანსი(ნიმუშში მოხვედრის თანაბარი შანსი) ერთეულების შერჩევა და მათი საკმარისი რაოდენობა.ამ პრინციპებთან შესაბამისობა შესაძლებელს ხდის მიღებული ნიმუშის წარმომადგენლობითობის ობიექტური გარანტიის მიღებას. შინაარსი წარმომადგენლობაშერჩეული პოპულაცია არ უნდა იქნას გაგებული, როგორც მისი წარმოდგენა შესწავლილი პოპულაციის ყველა მახასიათებლის მიხედვით, არამედ მხოლოდ იმ მახასიათებლებთან მიმართებაში, რომლებიც შესწავლილია ან მნიშვნელოვან გავლენას ახდენენ შემაჯამებელი განზოგადების მახასიათებლების ფორმირებაზე.

ეკონომიკაში შერჩევის დაკვირვების მთავარი ამოცანაა შერჩევის პოპულაციის (საშუალო და წილი) მახასიათებლებზე დაფუძნებული სანდო განსჯის მიღება საშუალო და საერთო პოპულაციაში წილის მაჩვენებლების შესახებ. ამავდროულად, გასათვალისწინებელია, რომ ნებისმიერ სტატისტიკურ კვლევაში (მყარი და შერჩევითი) წარმოიქმნება ორი ტიპის შეცდომები: რეგისტრაცია და წარმომადგენლობითი.

რეგისტრაციის შეცდომები შეიძლება ჰქონდეს შემთხვევითი(უნებლიე) და სისტემატური(ტენდენციური) პერსონაჟი. შემთხვევითი შეცდომებიჩვეულებრივ აწონასწორებენ ერთმანეთს, ვინაიდან მათ არ აქვთ უპირატესი მიმართულება შესასწავლი ინდიკატორის გაზვიადების ან შეუფასებლობის მიმართულებით. სისტემური შეცდომებიერთი მიმართულებით მიმართული შერჩევის წესების მიზანმიმართული დარღვევის გამო (მიკერძოებული მიზნები). მათი თავიდან აცილება შესაძლებელია სათანადო ორგანიზებითა და მონიტორინგით.

წარმომადგენლობითობის შეცდომები თანდაყოლილია მხოლოდ შერჩევითი დაკვირვებისთვის და წარმოიქმნება იმის გამო, რომ ნიმუში სრულად არ ასახავს ზოგადს. ისინი წარმოადგენენ შეუსაბამობას ნიმუშიდან მიღებული ინდიკატორების მნიშვნელობებსა და იმავე მნიშვნელობების ინდიკატორების მნიშვნელობებს შორის, რომლებიც მიღებულ იქნებოდა უწყვეტი დაკვირვებით, რომელიც განხორციელდა იგივე სიზუსტით, ე.ი. შერჩეული მნიშვნელობები და შესაბამისი ზოგადი მაჩვენებლები.

თითოეული კონკრეტული ნიმუშის დაკვირვებისთვის, წარმომადგენლობითობის შეცდომის მნიშვნელობა შეიძლება განისაზღვროს შესაბამისი ფორმულებით, რომლებიც დამოკიდებულია ტიპი, მეთოდიდა გზანიმუშის ფორმირება.

ტიპის მიხედვით არსებობს ინდივიდუალური, ჯგუფური და კომბინირებული შერჩევა. ზე ინდივიდუალური შერჩევანიმუშში შეირჩევა საერთო პოპულაციის ცალკეული ერთეულები; ზე ჯგუფის შერჩევა- თვისობრივად ერთგვაროვანი ჯგუფები ან შესწავლილი ერთეულების სერია; კომბინირებული შერჩევამოიცავს პირველი და მეორე ტიპის კომბინაციას.

შერჩევის მეთოდით განასხვავებენ გაიმეორადა განმეორებითი შერჩევა.

ზე ნიმუშების გადაღებაშერჩევის პროცესში მოსახლეობის ერთეულების საერთო რაოდენობა უცვლელი რჩება. ნიმუშში მოხვედრილი ესა თუ ის ერთეული, რეგისტრაციის შემდეგ, კვლავ უბრუნდება ზოგად პოპულაციას და ინარჩუნებს თანაბარ შესაძლებლობას ყველა სხვა ერთეულთან, როდესაც ერთეულები ხელახლა შეირჩევა, რომ მოხვდნენ ნიმუშში („შერჩევა შერჩევის მიხედვით დაბრუნებული ბურთის სქემა“). სოციო-ეკონომიკურ ცხოვრებაში ხელახალი შერჩევა იშვიათია. როგორც წესი, შერჩევის ორგანიზება ხდება განმეორებითი შერჩევის სქემის მიხედვით.

ზე შერჩევის გარეშეპოპულაციის ერთეული, რომელიც მოხვდა ნიმუშში, არ უბრუნდება ზოგად პოპულაციას და მომავალში არ მონაწილეობს შერჩეულში; ანუ, შემდგომი ნიმუში აღებულია ზოგადი პოპულაციისგან ადრე შერჩეული ერთეულების გარეშე („შერჩევა დაუბრუნებელი ბურთის სქემის მიხედვით“). ამრიგად, განმეორებითი შერჩევის შემთხვევაში, კვლევის პროცესში მცირდება ერთეულების რაოდენობა ზოგად პოპულაციაში.

შერჩევის მეთოდი განსაზღვრავს კონკრეტულ მექანიზმს ან პროცედურას პოპულაციისგან ერთეულების შერჩევისთვის.

მოსახლეობის ერთეულების დაფარვის ხარისხის მიხედვით გამოყოფენ დიდიდა პატარა (ნ <30) выборки.

ნიმუშების შესწავლის პრაქტიკაში ყველაზე ფართოდ გამოიყენება შერჩევის შემდეგი ტიპები: სათანადო შემთხვევითი, მექანიკური, ტიპიური, სერიული, კომბინირებული.

ზოგადი და ნიმუშის პოპულაციების პარამეტრების ძირითადი მახასიათებლები მითითებულია სიმბოლოებით:

საერთო მოსახლეობის N-მოცულობა (მასში შემავალი ერთეულების რაოდენობა);

P -შერჩევის ზომა (გამოკითხული ერთეულების რაოდენობა);

- ზოგადი საშუალო (ატრიბუტის საშუალო მნიშვნელობა ზოგად პოპულაციაში);

- ნიმუში საშუალო;

პ- ზოგადი წილი (ერთეულების წილი, რომლებსაც აქვთ ატრიბუტის მოცემული მნიშვნელობა საერთო მოსახლეობის ერთეულების საერთო რაოდენობაში);

ვ - ნიმუშის წილი;

- ზოგადი ვარიაცია (მახასიათებლის ვარიაცია ზოგად პოპულაციაში);

ს 2 - იგივე ატრიბუტის ნიმუშის ვარიაცია;

- სტანდარტული გადახრა ზოგად პოპულაციაში;

ს- სტანდარტული გადახრა ნიმუშში.

2. შერჩევის შეცდომები

შერჩევითი დაკვირვებისას უზრუნველყოფილი უნდა იყოს შანსიერთეულის შერჩევა. თითოეულ ერთეულს უნდა ჰქონდეს თანაბარი შესაძლებლობა, რომ შეირჩეს სხვებთან ერთად. ეს არის ის, რასაც ეფუძნება შემთხვევითი შერჩევა.

რომ სათანადო შემთხვევითი ნიმუში იგულისხმება ერთეულების შერჩევა მთელი საერთო პოპულაციისგან (მისი წინასწარი დაყოფის გარეშე რომელიმე ჯგუფად) ლატარიის (ძირითადად) ან სხვა მსგავსი მეთოდით, მაგალითად, შემთხვევითი რიცხვების ცხრილის გამოყენებით. შემთხვევითი შერჩევა -ეს არჩევანი არ არის შემთხვევითი. შემთხვევითობის პრინციპი ვარაუდობს, რომ ნიმუშიდან ობიექტის ჩართვა ან გამორიცხვა შემთხვევითობის გარდა სხვა ფაქტორების გავლენის ქვეშ არ შეიძლება. Მაგალითი რეალურად შემთხვევითიმოგების გათამაშება შეიძლება იყოს შერჩევის ფუნქცია: გაცემული ბილეთების მთლიანი რაოდენობადან შემთხვევითი წესით შეირჩევა ნომრების გარკვეული ნაწილი, რომლებშიც გათვალისწინებულია მოგება. უფრო მეტიც, ყველა ნომერს ეძლევა ნიმუშში მოხვედრის თანაბარი შესაძლებლობა. ამ შემთხვევაში, ნიმუშის კომპლექტში შერჩეული ერთეულების რაოდენობა ჩვეულებრივ განისაზღვრება ნიმუშის მიღებული პროპორციის საფუძველზე.

გააზიარეთ, ნიმუშები არის ნიმუშის ერთეულების რაოდენობის თანაფარდობა საერთო პოპულაციაში ერთეულების რაოდენობასთან:

ასე რომ, 5% ნიმუშით ნაწილების პარტიიდან 1000 ერთეულში. ნიმუშის ზომა პარის 50 ერთეული, ხოლო 10%-იანი ნიმუშით -100 ერთეული. და ა.შ. შერჩევის სათანადო მეცნიერული ორგანიზებით, წარმომადგენლობითი შეცდომები შეიძლება შემცირდეს მინიმალურ მნიშვნელობებამდე, რის შედეგადაც შერჩევითი დაკვირვება საკმაოდ ზუსტი ხდება.

თვითშემთხვევითი შერჩევა „სუფთა სახით“ იშვიათად გამოიყენება შერჩევითი დაკვირვების პრაქტიკაში, მაგრამ ის არის თავდაპირველი შერჩევის სხვა ტიპებს შორის, შეიცავს და ახორციელებს შერჩევითი დაკვირვების ძირითად პრინციპებს.

მოდით განვიხილოთ შერჩევის მეთოდის თეორიის რამდენიმე კითხვა და მარტივი შემთხვევითი ნიმუშის შეცდომის ფორმულა.

სტატისტიკაში შერჩევის მეთოდის გამოყენებისას ჩვეულებრივ გამოიყენება განზოგადების ინდიკატორების ორი ძირითადი ტიპი: რაოდენობრივი ნიშნის საშუალო მნიშვნელობადა ალტერნატიული მახასიათებლის ფარდობითი მნიშვნელობა(სტატისტიკურ პოპულაციაში ერთეულების პროპორცია ან პროპორცია, რომელიც განსხვავდება ამ პოპულაციის ყველა სხვა ერთეულისგან მხოლოდ შესასწავლი მახასიათებლის არსებობით).

ნიმუშის გაზიარება ( ვ ), ან სიხშირე, განისაზღვრება იმ ერთეულების რაოდენობის შეფარდებით, რომლებსაც აქვთ შესასწავლი მახასიათებელი ტ,შერჩევის ერთეულების საერთო რაოდენობამდე P:

მოვლენის ალბათობის ინტერვალის შეფასება. შემთხვევითი შერჩევის მეთოდის შემთხვევაში ნიმუშების რაოდენობის გამოთვლის ფორმულები.

ჩვენთვის საინტერესო მოვლენების ალბათობის დასადგენად ვიყენებთ შერჩევის მეთოდს: ვახორციელებთ ნდამოუკიდებელი ექსპერიმენტები, რომელთაგან თითოეულში A მოვლენა შეიძლება მოხდეს (ან არ მოხდეს) (ალბათობა რ A მოვლენის დადგომა თითოეულ ექსპერიმენტში მუდმივია). შემდეგ მოვლენების გაჩენის ფარდობითი სიხშირე p* მაგრამსერიაში ნტესტები აღებულია, როგორც პუნქტური შეფასება ალბათობისთვის გვმოვლენის დადგომა მაგრამცალკე ტესტში. ამ შემთხვევაში, მნიშვნელობა p* ეწოდება ნიმუშის წილი მოვლენის შემთხვევები მაგრამდა რ - ზოგადი წილი .

ცენტრალური ლიმიტის თეორემის (მოივრე-ლაპლასის თეორემა) დასკვნის საფუძველზე, დიდი ნიმუშის მქონე მოვლენის ფარდობითი სიხშირე შეიძლება ჩაითვალოს ნორმალურად განაწილებულად M(p*)=p და პარამეტრებით.

ამიტომ, n>30-ისთვის, ზოგადი წილადის ნდობის ინტერვალი შეიძლება აშენდეს ფორმულების გამოყენებით:

სადაც u cr გვხვდება ლაპლასის ფუნქციის ცხრილების მიხედვით, მოცემული ნდობის ალბათობის γ გათვალისწინებით: 2Ф(u cr)=γ.

ნიმუშის მცირე ზომით n≤30, ზღვრული შეცდომა ε განისაზღვრება სტუდენტური განაწილების ცხრილიდან:
სადაც t cr =t(k; α) და თავისუფლების გრადუსების რაოდენობა k=n-1 ალბათობა α=1-γ (ორმხრივი ფართობი).

ფორმულები ძალაშია, თუ შერჩევა განხორციელდა შემთხვევით, განმეორებით (ზოგადი პოპულაცია უსასრულოა), წინააღმდეგ შემთხვევაში აუცილებელია შესწორება განმეორებადი შერჩევისთვის (ცხრილი).

შერჩევის საშუალო შეცდომა ზოგადი პროპორციისთვის

მოსახლეობა	დაუსრულებელი	საბოლოო მოცულობა ნ
შერჩევის ტიპი	გაიმეორა	განუმეორებელი
შერჩევის საშუალო შეცდომა

ნიმუშის ზომის გამოთვლის ფორმულები სათანადო შემთხვევითი შერჩევის მეთოდით

შერჩევის მეთოდი	ნიმუშის ზომის ფორმულები
	შუასთვის	გასაზიარებლად
გაიმეორა
განუმეორებელი

პრობლემები საერთო წილის შესახებ

კითხვაზე "ფარავს თუ არა p 0-ის მოცემული მნიშვნელობა ნდობის ინტერვალს?" - შეიძლება პასუხის გაცემა H 0:p=p 0 სტატისტიკური ჰიპოთეზის ტესტირებით. ვარაუდობენ, რომ ექსპერიმენტები ტარდება ბერნულის ტესტის სქემის მიხედვით (დამოუკიდებელი, ალბათობა გვმოვლენის დადგომა მაგრამმუდმივი). მოცულობის ნიმუშით ნგანსაზღვრეთ A მოვლენის ადგილის ფარდობითი სიხშირე p *: სად მ- მოვლენის შემთხვევების რაოდენობა მაგრამსერიაში ნტესტები. H 0 ჰიპოთეზის შესამოწმებლად გამოიყენება სტატისტიკა, რომელსაც საკმარისად დიდი ნიმუშის ზომით აქვს სტანდარტული ნორმალური განაწილება (ცხრილი 1).
ცხრილი 1 - ჰიპოთეზები ზოგადი წილის შესახებ

ჰიპოთეზა	H0:p=p0	H 0:p 1 \u003d p 2
ვარაუდები	ბერნულის ტესტის სქემა	ბერნულის ტესტის სქემა
შეფასების ნიმუში
სტატისტიკა კ
სტატისტიკის განაწილება კ		სტანდარტული ნორმალური N(0,1)

მაგალითი #1. შემთხვევითი ხელახალი შერჩევის გამოყენებით, კომპანიის ხელმძღვანელობამ შემთხვევითი გამოკითხვა ჩაატარა 900 თანამშრომელზე. გამოკითხულთა შორის 270 ქალი იყო. დახაზეთ ნდობის ინტერვალი, რომელიც, 0,95 ალბათობით, მოიცავს ქალების ნამდვილ პროპორციას ფირმის მთელ გუნდში.
გადაწყვეტილება. პირობების მიხედვით, ქალების შერჩევის პროპორცია არის (ქალთა ფარდობითი სიხშირე ყველა რესპონდენტში). ვინაიდან შერჩევა მეორდება და ნიმუშის ზომა დიდია (n=900), შერჩევის ზღვრული შეცდომა განისაზღვრება ფორმულით

u cr-ის მნიშვნელობა გვხვდება ლაპლასის ფუნქციის ცხრილიდან 2Ф(u cr)=γ მიმართებიდან, ე.ი. ლაპლასის ფუნქცია (დანართი 1) იღებს მნიშვნელობას 0,475 u cr =1,96-ზე. ამიტომ, ზღვრული შეცდომა და სასურველი ნდობის ინტერვალი
(p – ε, p + ε) = (0.3 – 0.18; 0.3 + 0.18) = (0.12; 0.48)
ასე რომ, 0,95 ალბათობით, გარანტირებულია, რომ ქალების პროპორცია ფირმის მთელ გუნდში არის 0,12-დან 0,48-მდე.

მაგალითი #2. ავტოსადგომის მფლობელი დღეს „იღბლიან“ მიიჩნევს, თუ პარკინგი 80%-ზე მეტია სავსე. წლის განმავლობაში 40 ავტოსადგომის შემოწმება ჩატარდა, საიდანაც 24 „წარმატებული“ იყო. 0,98 ალბათობით, იპოვეთ ნდობის ინტერვალი წლის განმავლობაში "იღბლიანი" დღეების ჭეშმარიტი პროცენტის შესაფასებლად.
გადაწყვეტილება. "კარგი" დღეების სანიმუშო ფრაქცია არის
ლაპლასის ფუნქციის ცხრილის მიხედვით ვპოულობთ u cr-ის მნიშვნელობას მოცემულისთვის
თავდაჯერებულობის დონე
Ф(2.23) = 0.49, u cr = 2.33.
იმის გათვალისწინებით, რომ შერჩევა არ განმეორდება (ანუ ორი შემოწმება არ განხორციელებულა იმავე დღეს), ჩვენ ვპოულობთ ზღვრულ შეცდომას:
სადაც n=40, N = 365 (დღე). აქედან
და ნდობის ინტერვალი ზოგადი წილადისთვის: (p – ε, p + ε) = (0.6 – 0.17; 0.6 + 0.17) = (0.43; 0.77)
0,98 ალბათობით, მოსალოდნელია, რომ წლის განმავლობაში "კარგი" დღეების პროპორცია 0.43-დან 0.77-მდეა.

მაგალითი #3. პარტიაში 2500 ნივთის შემოწმების შემდეგ, მათ აღმოაჩინეს, რომ 400 ელემენტი იყო უმაღლესი კლასის, მაგრამ n–m არა. რამდენი პროდუქტის შემოწმება გჭირდებათ პრემიუმ კლასის წილის დასადგენად 0.01 სიზუსტით 95% დარწმუნებით?
ჩვენ ვეძებთ გამოსავალს ხელახალი შერჩევის ნიმუშის ზომის განსაზღვრის ფორმულის მიხედვით.

Ф(t) = γ/2 = 0,95/2 = 0,475 და ლაპლასის ცხრილის მიხედვით ეს მნიშვნელობა შეესაბამება t=1,96
ნიმუშის ფრაქცია w = 0,16; შერჩევის შეცდომა ε = 0.01

მაგალითი #4. პროდუქციის პარტია მიიღება, თუ ალბათობა იმისა, რომ პროდუქტი დააკმაყოფილებს სტანდარტს არის მინიმუმ 0,97. შემოწმებული ლოტის შემთხვევით შერჩეულ 200 პროდუქტს შორის აღმოჩნდა 193 პროდუქტი, რომელიც აკმაყოფილებს სტანდარტს. შესაძლებელია თუ არა სერიის მიღება მნიშვნელოვნების დონეზე α=0.02?
გადაწყვეტილება. ჩვენ ვაყალიბებთ ძირითად და ალტერნატიულ ჰიპოთეზებს.
H 0: p \u003d p 0 \u003d 0.97 - უცნობი ზოგადი წილი გვუდრის მითითებულ მნიშვნელობას p 0 =0.97. პირობასთან დაკავშირებით - ალბათობა იმისა, რომ საცდელი ლოტიდან ნაწილი იქნება სტანდარტის შესაბამისი არის 0,97; იმათ. პროდუქციის პარტია შეიძლება მიღებულ იქნეს.
H1:p<0,97 - вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0.97; т.е. партию изделий нельзя принять. При такой альтернативной гипотезе критическая область будет левосторонней.
დაკვირვებული სტატისტიკური მნიშვნელობა კ(ცხრილი) გამოთვალეთ მოცემული მნიშვნელობებისთვის p 0 =0.97, n=200, m=193

კრიტიკული მნიშვნელობა ნაპოვნია ლაპლასის ფუნქციის ცხრილიდან ტოლობიდან

პირობის მიხედვით α=0.02, აქედან F(Kcr)=0.48 და Kcr=2.05. კრიტიკული რეგიონი მემარცხენეა, ე.ი. არის ინტერვალი (-∞;-K kp)= (-∞;-2.05). დაკვირვებული მნიშვნელობა Kobs = -0,415 არ მიეკუთვნება კრიტიკულ რეგიონს, შესაბამისად, მნიშვნელოვნების ამ დონეზე, არ არსებობს საფუძველი, რომ უარვყოთ მთავარი ჰიპოთეზა. პროდუქციის პარტია შეიძლება მიღებულ იქნეს.

მაგალითი ნომერი 5. ორი ქარხანა აწარმოებს იგივე ტიპის ნაწილებს. მათი ხარისხის შესაფასებლად აღებული იქნა ნიმუშები ამ ქარხნების პროდუქციიდან და მიღებული იქნა შემდეგი შედეგები. პირველი ქარხნის შერჩეულ 200 პროდუქტს შორის 20 იყო დეფექტური, ხოლო მეორე ქარხნის 300 პროდუქციიდან 15.
0,025 მნიშვნელოვნების დონეზე, გაარკვიეთ, არის თუ არა მნიშვნელოვანი განსხვავება ამ ქარხნების მიერ წარმოებული ნაწილების ხარისხში.

პირობის მიხედვით α=0.025, აქედან F(Kcr)=0.4875 და Kcr=2.24. ორმხრივი ალტერნატივით, დასაშვები მნიშვნელობების ფართობს აქვს ფორმა (-2.24; 2.24). დაკვირვებული მნიშვნელობა Kobs =2.15 ხვდება ამ ინტერვალში, ე.ი. მნიშვნელობის ამ დონეზე, არ არსებობს მიზეზი, რომ უარვყოთ მთავარი ჰიპოთეზა. ქარხნები აწარმოებენ იმავე ხარისხის პროდუქტებს.

შერჩევითი კვლევა.

შერჩევის მეთოდის კონცეფცია.

შერჩევითი დაკვირვება- ეს არის ისეთი არა უწყვეტი დაკვირვება, რომლის დროსაც შესასწავლი პოპულაციის ერთეულების შერჩევა ხდება შემთხვევით, შერჩეული ნაწილი ექვემდებარება კვლევას, რის შემდეგაც შედეგები ნაწილდება მთელ პოპულაციაზე.

შერჩევის მეთოდი გამოიყენება როცა

1 როდესაც დაკვირვება თავისთავად ასოცირდება დაკვირვებული ერთეულების დაზიანებასთან ან განადგურებასთან (ნართი სანელებლისთვის, ელექტრო ნათურა წვის პროდუქტისთვის)

2 დიდი მთლიანი მოცულობა

3 მაღალი ხარჯები (ფინანსური და შრომითი).

ჩვეულებრივ, მთლიანი მოსახლეობის 5-10% ექვემდებარება შერჩევის გამოკითხვას, ნაკლებად ხშირად 15-25%.

შერჩევის მიზანია საერთო საშუალო და საერთო პროპორციის (P) მახასიათებლების დადგენა. შერჩევის პოპულაციის მახასიათებლები - შერჩევის საშუალო და ნიმუშის ფრაქცია (w) განსხვავდება ზოგადი მახასიათებლებისგან შერჩევის შეცდომის რაოდენობით ( ). ამიტომ აუცილებელია შერჩევის ცდომილების ან წარმომადგენლობითი ცდომილების გამოთვლა, რომელიც განისაზღვრება ალბათობის თეორიაში შემუშავებული ფორმულებით თითოეული ტიპის ნიმუშისა და შერჩევის მეთოდისთვის.

ერთეულების არჩევის შემდეგი გზები არსებობს:

1 დასაბრუნებელი ბურთის შერჩევა, რომელსაც ჩვეულებრივ უწოდებენ ნიმუშების გადაღება.

განმეორებითი შერჩევით, თითოეული ცალკეული ერთეულის ნიმუშში მოხვედრის ალბათობა მუდმივი რჩება, რადგან ერთეულის შერჩევის შემდეგ ის კვლავ უბრუნდება პოპულაციას და შეიძლება ხელახლა შეირჩეს.

2 შერჩევა დაუბრუნებელი ბურთის სქემის მიხედვით, ე.წ შემთხვევითი შერჩევა.ამ შემთხვევაში, თითოეული არჩეული ერთეული უკან არ ბრუნდება და ნიმუშში ცალკეული ერთეულების მოხვედრის ალბათობა მუდმივად იცვლება (დარჩენილი ერთეულებისთვის ის გაიზრდება) (ლოტი), შემთხვევითი რიცხვების ცხრილები, მაგალითად, 75-დან. 780.

ნიმუშის ტიპები.

1 რეალურად - შემთხვევითი.

ეს არის ის, რომელშიც ერთეულების შერჩევა ხდება უშუალოდ მთლიანი პოპულაციის ერთეულების მთელი მასიდან.

ამ შემთხვევაში, შერჩეული ერთეულების რაოდენობა ჩვეულებრივ განისაზღვრება ნიმუშის მიღებული პროპორციის საფუძველზე.

ნიმუშისთვის არის შეფარდება ერთეულების რაოდენობის შერჩევის პოპულაციაში და ერთეულების რაოდენობას საერთო პოპულაციაში N.

ასე რომ, 2000 ერთეული საქონლის პარტიიდან 5%-იანი ნიმუშით, ნიმუშის ზომა n არის 100 ერთეული. (
), ხოლო 20%-იანი ნიმუშით იქნება 400 ერთეული.

(
)

მნიშვნელოვანი პირობაა სათანადო შემთხვევითი ნიმუშისთვის რომ მოსახლეობის თითოეულ ერთეულს ეძლევა ნიმუშში ჩართვის თანაბარი შესაძლებლობა.

შემთხვევითი შერჩევით, შერჩევის ზღვრული შეცდომა საშუალოსთვის უდრის

- შერჩევის ვარიაცია

n - ნიმუშის ზომა

t არის ნდობის ფაქტორი, რომელიც განისაზღვრება ლაპლასის ინტეგრალური ფუნქციის მნიშვნელობების ცხრილიდან მოცემული ალბათობის P.

განმეორებითი შერჩევისას, შერჩევის ზღვრული შეცდომა განისაზღვრება საშუალოს ფორმულით

სადაც N არის წილის საერთო პოპულაციის ზომა

ნახშირის ნაცრის შემცველობის დასადგენად, შემთხვევით გამოიკვლია ნახშირის 100 ნიმუში. კვლევის შედეგად დადგინდა, რომ ნახშირის ნაცრის შემცველობა ნიმუშში საშუალოდ არის 16%. = 5%. 10 ნიმუშში ნახშირის ნაცრის შემცველობა იყო > 20% 0,954 ალბათობით, რათა განისაზღვროს ლიმიტები, რომლებშიც იქნება ნახშირის ნაცრის საშუალო შემცველობა საბადოში და ნახშირის წილი ნაცრის შემცველობით > 20% იქნება.

ნაცრის საშუალო შემცველობა

შერჩევის ზღვრული შეცდომის დადგენა

2*0.5=1%

p=0.954 t=2-ზე

ნახშირის წილი ნაცრის შემცველობით >20%

ნიმუშის წილი განისაზღვრება

სადაც m არის ერთეულების პროპორცია, რომლებსაც აქვთ მახასიათებელი

შერჩევის შეცდომა გაზიარებისთვის

0,954 ალბათობით, შეიძლება ითქვას, რომ ნახშირის პროპორცია ნაცრის შემცველობით 20%-ზე მეტი საბადოში იქნება ფარგლებში.

P= 10%+(-)6% ან

მექანიკური სინჯის აღება.

ეს არის ერთგვარი რეალურად - შემთხვევითი. ამ შემთხვევაში მთელი პოპულაცია იყოფა n თანაბარ ნაწილად და შემდეგ თითოეული ნაწილიდან ირჩევა ერთი ერთეული.

მოსახლეობის ყველა ერთეული უნდა იყოს მოწყობილი გარკვეული თანმიმდევრობით. ამავდროულად, შესასწავლ ინდიკატორთან მიმართებაში, საერთო პოპულაციის ერთეულების დალაგება შესაძლებელია მნიშვნელოვანი, მეორადი ან ნეიტრალური მახასიათებლის მიხედვით. ამ შემთხვევაში, თითოეული ჯგუფიდან უნდა შეირჩეს ერთეული, რომელიც ყოველი ჯგუფის შუაშია. ეს თავიდან აიცილებს შერჩევის მიკერძოებას.

მიმართვა: მაღაზიებში მყიდველების, კლინიკებში ვიზიტორების შემოწმებისას, ყოველ 5,4,3 და ა.შ.

მექანიკური ნიმუშის მაგალითი

ბანკში მოკლევადიანი სესხით სარგებლობის საშუალო ვადის დასადგენად გაკეთდება 5%-იანი მექანიკური ნიმუში, რომელიც მოიცავს 100 ანგარიშს. გამოკითხვის შედეგად დადგინდა, რომ მოკლევადიანი სესხით სარგებლობის საშუალო ვადა 30 დღეა.
9 დღე 5 ანგარიშზე სესხის ვადა > 60 დღე.

შერჩევის შეცდომა

იმათ. 0,954 ალბათობით შეიძლება ითქვას, რომ სესხით სარგებლობის ვადა მერყეობს

1 30 დღის განმავლობაში +(-) 2 დღეში, ე.ი.

სესხის 2 აქცია 60 დღეზე მეტი ვადით.

ნიმუშის წილი იქნება

განსაზღვრეთ გაზიარების შეცდომა

0,954 ალბათობით, შეიძლება ითქვას, რომ საბანკო სესხების წილი 60 დღეზე მეტი ვადით იქნება ფარგლებში.

ტიპიური ნიმუში.

საერთო მოსახლეობა იყოფა ერთგვაროვან ტიპურ ჯგუფებად. შემდეგ, თითოეული ტიპიური ჯგუფიდან, ნიმუშის ერთეულების ინდივიდუალური შერჩევა ხდება შემთხვევითი ან მექანიკური ნიმუშით.

მაგალითად: pr.tr. კვალიფიკაციის მიხედვით ცალკეული ჯგუფებისაგან შემდგარი მუშები.

მნიშვნელოვანი თვისება- იძლევა უფრო ზუსტ შედეგებს სხვებთან შედარებით, ტკ. ნიმუში მოიცავს ტიპოლოგიურ ერთეულს.

სანიმუშო კომპლექტში დაკვირვების ერთეულების შერჩევა სხვადასხვა მეთოდით ხდება. განვიხილოთ ტიპიური ნიმუში პროპორციული შერჩევით ტიპიურ ჯგუფებში.

ნიმუშის ზომა ტიპიური ჯგუფიდან შერჩევისას ტიპიური ჯგუფების რაოდენობის პროპორციულად განისაზღვრება ფორმულით

სადაც = V ნიმუშები ტიპიური ჯგუფიდან

= ტიპიური ჯგუფის V.

შერჩევის საშუალო და პროპორციების ზღვრული შეცდომა ტიპიური ჯგუფების შიგნით შემთხვევითი და მექანიკური შერჩევის მეთოდისთვის გამოითვლება ფორმულებით

სადაც = ნიმუშის განსხვავება

მაგალითი: ტიპიური ნიმუში

ქორწინებაში შესული მამაკაცების საშუალო ასაკის დასადგენად რაიონში გაკეთდა 5%-იანი ნიმუში ტიპიური ჯგუფების რაოდენობის პროპორციულად ერთეულების შერჩევით.

ჯგუფებში გამოყენებული იქნა მექანიკური შერჩევა

0,954 ალბათობით დაადგინეთ ზღვრები, რომლებშიც იქნება დაქორწინებული მამაკაცების საშუალო ასაკი და მეორედ დაქორწინებული მამაკაცების პროპორცია.

ქორწინების საშუალო ასაკი მამაკაცებისთვის ნიმუშში

შერჩევის ზღვრული შეცდომა

0,954 ალბათობით შეიძლება ითქვას, რომ ქორწინებაში მყოფი მამაკაცების საშუალო ასაკი იქნება ფარგლებში

მეორე ქორწინებაში შესული მამაკაცებისთვის იყოს შიგნით

ნიმუშის წილი განისაზღვრება

ალტერნატიული მახასიათებლის ნიმუშის ვარიაცია არის

0,954 ალბათობით შეიძლება ითქვას, რომ მეორედ დაქორწინებულთა წილი არის ფარგლებში

სერიული ნიმუშის აღება.

სერიული შერჩევით მოსახლეობა იყოფა იმავე ზომის ჯგუფებად - სერიებად. შერჩევის პოპულაცია არის შერჩეული სერია. სერიაში უწყვეტი დაკვირვება ხდება სერიებში მოხვედრილ ერთეულებზე.

განმეორებითი შერჩევით და განისაზღვრება ფორმულით

სადაც
- ინტერსერიების ვარიაცია

სადაც
სერიის საშუალო ნიმუში

სერიული ნიმუშის ნიმუში

R- საერთო პოპულაციის სერიების რაოდენობა

r - შერჩეული სერიების რაოდენობა

მაგალითი: 10 ბრიგადის სახელოსნოში მათი შრომის პროდუქტიულობის შესასწავლად ჩატარდება 20%-იანი სერიული ნიმუში, რომელშიც შედიოდა 2 ბრიგადა. გამოკითხვის შედეგად დადგინდა, რომ

0,997 ალბათობით, რათა დადგინდეს ის ზღვრები, რომლებშიც იქნება მაღაზიის მუშაკების საშუალო გამომუშავება.

სერიული ნიმუშის ნიმუშის საშუალო მაჩვენებელი განისაზღვრება ფორმულით

0,997 ალბათობით შეიძლება ითქვას, რომ მაღაზიის მუშაკების საშუალო გამომუშავება არის ფარგლებში

სახელოსნოს მზა პროდუქციის საწყობში არის ნაწილების 200 ყუთი, თითო კოლოფში 40 ცალი. მზა პროდუქციის ხარისხის შესამოწმებლად ჩატარდება 10%-იანი სერიული სინჯები. სინჯების აღების შედეგად დადგინდა, რომ დეფექტური ნაწილებისთვის არის 15%. სერიული ნიმუშის ვარიაცია არის 0.0049.

0,997 ალბათობით, განსაზღვრეთ ზღვრები, რომლებშიც არის დეფექტური პროდუქტების პროპორცია ყუთების პარტიაში.

დეფექტური ნაწილების პროპორცია იქნება ფარგლებში

ფორმულით განსაზღვრეთ წილის შერჩევის ზღვრული შეცდომა

0,997 ალბათობით შეიძლება ითქვას, რომ დეფექტური ნაწილების პროპორცია

პარტიაში არის შიგნით

ნიმუშზე დაკვირვების შემუშავების პრაქტიკაში საჭიროა ნიმუშის ზომის პოვნა, რაც აუცილებელია ზოგადი მახასიათებლების - საშუალო და პროპორციის - გამოთვლაში გარკვეული სიზუსტის უზრუნველსაყოფად.

შერჩევის ზღვრული შეცდომა, მისი წარმოშობის ალბათობა და მახასიათებლის ცვალებადობა წინასწარ არის ცნობილი.

შემთხვევითობით ხელახალი შერჩევანიმუშის ზომა განისაზღვრება ფორმულით

შემთხვევითი არაგანმეორებადი და მექანიკური შერჩევით, ნიმუშის ზომა

ტიპიური ნიმუშისთვის

სერიული ნიმუშისთვის

მაგალითად, რაიონში 2000 ოჯახი ცხოვრობს.

დაგეგმილია მათი შერჩევითი გამოკითხვის ჩატარება შემთხვევითი არაგანმეორებადი შერჩევის მეთოდით ოჯახის საშუალო ზომის დასადგენად.

განსაზღვრეთ ნიმუშის საჭირო ზომა, იმ პირობით, რომ 0,954 ალბათობით შერჩევის შეცდომა არ აღემატება 1 ადამიანს 3 ადამიანის სტანდარტული გადახრით.

ქალაქში 10 ათასი ადამიანი ცხოვრობს. ოჯახები. მექანიკური შერჩევის გამოყენებით, შემოთავაზებულია განისაზღვროს სამი და მეტი შვილიანი ოჯახების პროპორცია. როგორი უნდა იყოს შერჩევის ზომა 0,02-ზე ნაკლები შეცდომისთვის, ალბათობით P=0,954, თუ ცნობილია, რომ დისპერსია არის 0,02 წინა კვლევებიდან?

Გეგმა:

1. მათემატიკური სტატისტიკის ამოცანები.

2. ნიმუშის ტიპები.

3. შერჩევის მეთოდები.

4. ნიმუშის სტატისტიკური განაწილება.

5. ემპირიული განაწილების ფუნქცია.

6. პოლიგონი და ჰისტოგრამა.

7. ვარიაციების სერიის რიცხვითი მახასიათებლები.

8. განაწილების პარამეტრების სტატისტიკური შეფასებები.

9. განაწილების პარამეტრების ინტერვალური შეფასებები.

1. მათემატიკური სტატისტიკის ამოცანები და მეთოდები

მათემატიკის სტატისტიკა არის მათემატიკის დარგი, რომელიც ეძღვნება სტატისტიკური დაკვირვების მონაცემების შედეგების შეგროვების, ანალიზისა და დამუშავების მეთოდებს სამეცნიერო და პრაქტიკული მიზნებისთვის.

დაე, საჭირო გახდეს ერთგვაროვანი ობიექტების ერთობლიობის შესწავლა რაიმე თვისებრივი ან რაოდენობრივი მახასიათებლის მიმართ, რომელიც ახასიათებს ამ ობიექტებს. მაგალითად, თუ არსებობს ნაწილების პარტია, მაშინ ნაწილის სტანდარტი შეიძლება იყოს ხარისხობრივი ნიშანი, ხოლო ნაწილის კონტროლირებადი ზომა შეიძლება იყოს რაოდენობრივი ნიშანი.

ზოგჯერ ტარდება უწყვეტი შესწავლა, ე.ი. შეამოწმეთ თითოეული ობიექტი სასურველი მახასიათებლის მიხედვით. პრაქტიკაში, ყოვლისმომცველი გამოკითხვა იშვიათად გამოიყენება. მაგალითად, თუ მოსახლეობა შეიცავს ობიექტთა ძალიან დიდ რაოდენობას, მაშინ ფიზიკურად შეუძლებელია უწყვეტი გამოკითხვის ჩატარება. თუ ობიექტის გამოკვლევა დაკავშირებულია მის განადგურებასთან ან მოითხოვს დიდ მატერიალურ ხარჯებს, მაშინ სრული გამოკვლევის ჩატარებას აზრი არ აქვს. ასეთ შემთხვევებში, ობიექტების შეზღუდული რაოდენობა (ნიმუშების ნაკრები) შემთხვევით შერჩეულია მთელი პოპულაციისგან და ექვემდებარება მათ შესწავლას.

მათემატიკური სტატისტიკის მთავარი ამოცანაა შესწავლა მთელი პოპულაციის შერჩევის მონაცემების საფუძველზე, მიზნიდან გამომდინარე, ე.ი. პოპულაციის ალბათური თვისებების შესწავლა: განაწილების კანონი, რიცხვითი მახასიათებლები და სხვ. გაურკვევლობის პირობებში მენეჯერული გადაწყვეტილებების მისაღებად.

2. ნიმუშის ტიპები

მოსახლეობა არის ობიექტების ერთობლიობა, საიდანაც მზადდება ნიმუში.

ნიმუშის პოპულაცია (ნიმუში) არის შემთხვევით შერჩეული ობიექტების კოლექცია.

მოსახლეობის ზომა არის ამ კოლექციაში არსებული ობიექტების რაოდენობა. საერთო მოსახლეობის მოცულობა აღინიშნება N, შერჩევითი - n.

მაგალითი:

თუ 1000 ნაწილიდან 100 ნაწილი შეირჩევა შესამოწმებლად, მაშინ საერთო პოპულაციის მოცულობან = 1000 და ნიმუშის ზომა n = 100.

ნიმუშის აღება შეიძლება განხორციელდეს ორი გზით: ობიექტის შერჩევისა და მასზე დაკვირვების შემდეგ, ის შეიძლება დაბრუნდეს ან არ დაუბრუნდეს ზოგად პოპულაციას. რომ. ნიმუშები იყოფა განმეორებად და არაგანმეორებად.

გაიმეორადაურეკა სინჯის აღება, რომელზედაც შერჩეული ობიექტი (შემდეგის არჩევამდე) უბრუნდება ზოგად პოპულაციას.

არ განმეორდებადაურეკა სინჯის აღება, რომლის დროსაც არჩეული ობიექტი არ უბრუნდება ზოგად პოპულაციას.

პრაქტიკაში ჩვეულებრივ გამოიყენება არაგანმეორებადი შემთხვევითი შერჩევა.

იმისათვის, რომ ნიმუშის მონაცემები საკმარისად დარწმუნებული იყოს ფართო პოპულაციის ინტერესის მახასიათებლის შესაფასებლად, აუცილებელია, რომ ნიმუშის ობიექტები სწორად წარმოადგენენ მას. ნიმუში სწორად უნდა წარმოადგენდეს მოსახლეობის პროპორციებს. ნიმუში უნდა იყოს წარმომადგენელი (წარმომადგენელი).

დიდი რიცხვების კანონის მიხედვით, შეიძლება ითქვას, რომ ნიმუში იქნება წარმომადგენლობითი, თუ იგი შესრულებულია შემთხვევით.

თუ საერთო პოპულაციის ზომა საკმარისად დიდია და ნიმუში ამ პოპულაციის მხოლოდ მცირე ნაწილია, მაშინ წაშლილია განსხვავება განმეორებით და განუმეორებელ ნიმუშებს შორის; შეზღუდულ შემთხვევაში, როდესაც განიხილება უსასრულო ზოგადი პოპულაცია და ნიმუშს აქვს სასრული ზომა, ეს განსხვავება ქრება.

მაგალითი:

ამერიკულ ჟურნალში Literary Review, სტატისტიკური მეთოდების გამოყენებით, შესწავლილი იქნა პროგნოზები 1936 წელს აშშ-ს მომავალი საპრეზიდენტო არჩევნების შედეგებთან დაკავშირებით. ამ პოსტზე განმცხადებლები იყვნენ ფ.დ. რუზველტი და A.M. Landon. სატელეფონო დირექტორიები იქნა მიღებული, როგორც წყარო შესწავლილი ამერიკელების ზოგადი მოსახლეობისთვის. აქედან 4 მილიონი მისამართი შემთხვევით შეირჩა, რომლებსაც ჟურნალის რედაქტორებმა გაუგზავნეს ღია ბარათები და სთხოვდნენ გამოხატონ თავიანთი დამოკიდებულება პრეზიდენტობის კანდიდატების მიმართ. გამოკითხვის შედეგების დამუშავების შემდეგ, ჟურნალმა გამოაქვეყნა სოციოლოგიური პროგნოზი, რომ ლენდონი მომავალ არჩევნებში დიდი სხვაობით გაიმარჯვებს. და... ვცდებოდი: რუზველტმა გაიმარჯვა.
ეს მაგალითი შეიძლება ჩაითვალოს არაწარმომადგენლობითი ნიმუშის მაგალითად. ფაქტია, რომ შეერთებულ შტატებში მეოცე საუკუნის პირველ ნახევარში ტელეფონები ჰქონდა მოსახლეობის მხოლოდ მდიდარ ნაწილს, რომელიც მხარს უჭერდა ლენდონის შეხედულებებს.

3. შერჩევის მეთოდები

პრაქტიკაში გამოიყენება შერჩევის სხვადასხვა მეთოდი, რომლებიც შეიძლება დაიყოს 2 ტიპად:

1. შერჩევა არ საჭიროებს მოსახლეობის ნაწილებად დაყოფას (ა) მარტივი შემთხვევითი განმეორება; ბ) მარტივი შემთხვევითი გამეორება).

2. სელექცია, რომელშიც საერთო მოსახლეობა იყოფა ნაწილებად. (ა) ტიპიური შერჩევა; ბ) მექანიკური შერჩევა; in) სერიალი შერჩევა).

მარტივი შემთხვევითი დაუძახეთ ამას შერჩევა, რომელშიც ობიექტები ამოღებულია სათითაოდ მთელი ზოგადი პოპულაციისგან (შემთხვევით).

Ტიპიურიდაურეკა შერჩევა, რომელშიც ობიექტები შეირჩევა არა მთელი ზოგადი პოპულაციისგან, არამედ მისი თითოეული "ტიპიური" ნაწილისგან. მაგალითად, თუ ნაწილი დამზადებულია რამდენიმე მანქანაზე, მაშინ შერჩევა ხდება არა ყველა დანადგარის მიერ წარმოებული ნაწილების მთელი ნაკრებიდან, არამედ თითოეული აპარატის პროდუქტებიდან ცალკე. ასეთი შერჩევა გამოიყენება მაშინ, როდესაც გამოკვლეული მახასიათებელი შესამჩნევად იცვლება ზოგადი პოპულაციის სხვადასხვა „ტიპიურ“ ნაწილში.

მექანიკურიდაურეკა შერჩევა, რომელშიც ზოგადი პოპულაცია "მექანიკურად" იყოფა იმდენ ჯგუფად, რამდენი ობიექტია შეტანილი ნიმუშში და თითოეული ჯგუფიდან ირჩევა ერთი ობიექტი. მაგალითად, თუ საჭიროა მანქანით დამზადებული ნაწილების 20%-ის შერჩევა, მაშინ ყოველი მე-5 ნაწილი შეირჩევა; თუ საჭიროა ნაწილების 5%-ის შერჩევა - ყოველი მე-20 და ა.შ. ზოგჯერ ასეთი შერჩევა შეიძლება არ უზრუნველყოს წარმომადგენლობითი ნიმუში (თუ შეირჩევა ყოველი მე-20 ბრუნვის როლიკერი და საჭრელი შეიცვლება შერჩევისთანავე, მაშინ შეირჩევა ბლაგვი საჭრელებით შემობრუნებული ყველა ლილვაკი).

სერიალიდაურეკა შერჩევა, რომელშიც ობიექტები შეირჩევა საერთო პოპულაციისგან არა ერთ ჯერზე, არამედ „სერიებად“, რომლებიც ექვემდებარება უწყვეტ კვლევას. მაგალითად, თუ პროდუქტები იწარმოება ავტომატური მანქანების დიდი ჯგუფის მიერ, მაშინ მხოლოდ რამდენიმე მანქანის პროდუქცია ექვემდებარება უწყვეტ შემოწმებას.

პრაქტიკაში ხშირად გამოიყენება კომბინირებული შერჩევა, რომელშიც გაერთიანებულია ზემოთ ჩამოთვლილი მეთოდები.

4. ნიმუშის სტატისტიკური განაწილება

მოდით აიღოთ ნიმუში ზოგადი პოპულაციისგან და მნიშვნელობა x 1-დაკვირვებული ერთხელ, x 2 -n 2-ჯერ, ... x k - n k-ჯერ. n= n 1 +n 2 +...+n k არის ნიმუშის ზომა. დაკვირვებული ღირებულებებიდაურეკა პარამეტრები, და თანმიმდევრობა არის ვარიანტი, რომელიც დაწერილია ზრდის მიხედვით - ვარიაციული სერია. დაკვირვებების რაოდენობადაურეკა სიხშირეები (აბსოლუტური სიხშირეები)და მათი კავშირი ნიმუშის ზომასთან- შედარებითი სიხშირეებიან სტატისტიკური ალბათობები.

თუ ვარიანტების რაოდენობა დიდია ან ნიმუში მზადდება უწყვეტი ზოგადი პოპულაციისგან, მაშინ ვარიაციების სერია შედგენილია არა ცალკეული წერტილის მნიშვნელობებით, არამედ ზოგადი პოპულაციის მნიშვნელობების ინტერვალებით. ასეთ სერიას ეძახიან ინტერვალი.ინტერვალების სიგრძე უნდა იყოს თანაბარი.

ნიმუშის სტატისტიკური განაწილება ეწოდება ოფციონების სიას და მათ შესაბამის სიხშირეებს ან ფარდობით სიხშირეებს.

სტატისტიკური განაწილება ასევე შეიძლება განისაზღვროს, როგორც ინტერვალების თანმიმდევრობა და მათი შესაბამისი სიხშირეები (სიხშირეების ჯამი, რომელიც შედის მნიშვნელობების ამ ინტერვალში)

სიხშირეების წერტილოვანი ცვალებადობის სერია შეიძლება წარმოდგენილი იყოს ცხრილით:

x i	x 1	x2	…	x k
n i	n 1	n 2	…	ნკ

ანალოგიურად, შეიძლება წარმოადგენდეს ფარდობითი სიხშირეების წერტილოვანი ცვალებადობის სერიას.

და:

მაგალითი:

ზოგიერთ X ტექსტში ასოების რაოდენობა 1000-ის ტოლი აღმოჩნდა. პირველი ასო იყო "ი", მეორე - ასო "ი", მესამე - ასო "ა", მეოთხე - "უ". შემდეგ მოვიდა ასოები "o", "e", "y", "e", "s".

ჩამოვწეროთ ის ადგილები, რომლებსაც ისინი იკავებენ ანბანში, შესაბამისად გვაქვს: 33, 10, 1, 32, 16, 6, 21, 31, 29.

ამ რიცხვების ზრდადი მიმდევრობით დალაგების შემდეგ ვიღებთ ვარიაციის სერიას: 1, 6, 10, 16, 21, 29, 31, 32, 33.

ტექსტში ასოების გამოჩენის სიხშირეები: "a" - 75, "e" -87, "i" - 75, "o" - 110, "y" - 25, "s" - 8, "e" - 3, "yu "- 7," I "- 22.

ჩვენ ვქმნით სიხშირეების წერტილოვან ცვალებად სერიას:

მაგალითი:

მითითებულია მოცულობის სინჯის სიხშირის განაწილება n = 20.

შეადგინეთ ფარდობითი სიხშირეების წერტილის ცვალებადობის სერია.

x i	2	6	12
n i	3	10	7

გადაწყვეტილება:

იპოვნეთ შედარებითი სიხშირეები:

x i	2	6	12
w i	0,15	0,5	0,35

ინტერვალის განაწილების აგებისას, არსებობს ინტერვალების რაოდენობის ან თითოეული ინტერვალის ზომის არჩევის წესები. კრიტერიუმი აქ არის ოპტიმალური თანაფარდობა: ინტერვალების რაოდენობის მატებასთან ერთად უმჯობესდება წარმომადგენლობა, მაგრამ იზრდება მონაცემების რაოდენობა და მათი დამუშავების დრო. განსხვავება x max - x min უდიდეს და უმცირეს მნიშვნელობებს შორის ვარიანტს უწოდებენ დიდი მასშტაბითნიმუშები.

ინტერვალების რაოდენობის დასათვლელადკ ჩვეულებრივ გამოიყენება Sturgess-ის ემპირიული ფორმულა (რაც გულისხმობს დამრგვალებას უახლოეს მოსახერხებელ მთელ რიცხვზე): k = 1 + 3.322 log n.

შესაბამისად, თითოეული ინტერვალის მნიშვნელობათ შეიძლება გამოითვალოს ფორმულის გამოყენებით:

5. ემპირიული განაწილების ფუნქცია

განვიხილოთ ზოგადი პოპულაციის ზოგიერთი ნიმუში. ცნობილი იყოს X რაოდენობრივი ატრიბუტის სიხშირეების სტატისტიკური განაწილება. შემოვიღოთ აღნიშვნა: n x.არის დაკვირვებების რაოდენობა, რომლებშიც დაფიქსირდა x-ზე ნაკლები მახასიათებლის მნიშვნელობა;ნ არის დაკვირვებების საერთო რაოდენობა (ნიმუშის ზომა). მოვლენის შედარებითი სიხშირე X<х равна n x /n . თუ x იცვლება, მაშინ ფარდობითი სიხშირეც იცვლება, ე.ი. შედარებითი სიხშირეn x / nარის x-ის ფუნქცია. იმიტომ რომ გვხვდება ემპირიულად, მას ემპირიული ჰქვია.

ემპირიული განაწილების ფუნქცია (ნიმუშის განაწილების ფუნქცია) დარეკეთ ფუნქციას, რომელიც განსაზღვრავს თითოეული x-ისთვის X მოვლენის ფარდობით სიხშირეს<х.

სად არის x-ზე ნაკლები ვარიანტების რაოდენობა,

n - ნიმუშის ზომა.

ნიმუშის ემპირიული განაწილების ფუნქციისგან განსხვავებით, პოპულაციის განაწილების ფუნქცია F(x) ეწოდება თეორიული განაწილების ფუნქცია.

განსხვავება ემპირიულ და თეორიულ განაწილების ფუნქციებს შორის არის ის, რომ თეორიული ფუნქცია F (x) განსაზღვრავს X მოვლენის ალბათობას. F*(x)მიდრეკილია ალბათობით ამ მოვლენის F (x) ალბათობამდე. ანუ დიდი ნ F*(x)და F(x) ერთმანეთისგან ცოტათი განსხვავდება.

რომ. მიზანშეწონილია გამოიყენოს ნიმუშის ემპირიული განაწილების ფუნქცია ზოგადი პოპულაციის თეორიული (ინტეგრალური) განაწილების ფუნქციის მიახლოებითი წარმოდგენისთვის.

F*(x)აქვს ყველა თვისება F(x).

1. ღირებულებები F*(x)მიეკუთვნება ინტერვალს.

2. F*(x) არის შეუმცირებელი ფუნქცია.

3. თუ ყველაზე პატარა ვარიანტია, მაშინ F*(x) = 0, x-ზე < x1; თუ x k არის ყველაზე დიდი ვარიანტი, მაშინ F*(x) = 1, x > x k-ისთვის.

იმათ. F*(x)ემსახურება F(x) შეფასებას.

თუ ნიმუში მოცემულია ვარიაციული სერიით, მაშინ ემპირიულ ფუნქციას აქვს ფორმა:

ემპირიული ფუნქციის გრაფიკს კუმულატიური ეწოდება.

მაგალითი:

დახაზეთ ემპირიული ფუნქცია მოცემული ნიმუშის განაწილებაზე.

გადაწყვეტილება:

ნიმუშის ზომა n = 12 + 18 +30 = 60. ყველაზე პატარა ვარიანტია 2, ე.ი. x-ზე < 2. მოვლენა X<6, (x 1 = 2) наблюдалось 12 раз, т.е. F*(x)=12/60=0.2 2-ზე < x < 6. მოვლენა X<10, (x 1 =2, x 2 = 6) наблюдалось 12 + 18 = 30 раз, т.е.F*(x)=30/60=0,5 при 6 < x < 10. რადგან x=10 ყველაზე დიდი ვარიანტია F*(x) = 1 x>10-ზე. სასურველ ემპირიულ ფუნქციას აქვს ფორმა:

კუმულაცია:

კუმულატი შესაძლებელს ხდის გრაფიკულად წარმოდგენილი ინფორმაციის გაგებას, მაგალითად, კითხვებზე პასუხის გაცემას: „განსაზღვრეთ დაკვირვებების რაოდენობა, რომლებშიც მახასიათებლის მნიშვნელობა იყო 6-ზე ნაკლები ან არანაკლებ 6. F*(6) = 0.2. » მაშინ დაკვირვებების რაოდენობა, რომლებშიც დაკვირვებული მახასიათებლის მნიშვნელობა 6-ზე ნაკლები იყო, არის 0,2*ნ \u003d 0.2 * 60 \u003d 12. დაკვირვებების რაოდენობა, რომლებშიც დაკვირვებული მახასიათებლის მნიშვნელობა იყო არანაკლებ 6, არის (1-0.2) * n \u003d 0.8 * 60 \u003d 48.

თუ მოცემულია ინტერვალის ცვალებადობის სერია, მაშინ ემპირიული განაწილების ფუნქციის შესადგენად, გვხვდება ინტერვალების შუა წერტილები და მათგან მიიღება ემპირიული განაწილების ფუნქცია, როგორც წერტილოვანი ვარიაციის სერიის მსგავსად.

6. პოლიგონი და ჰისტოგრამა

სიცხადისთვის აგებულია სტატისტიკური განაწილების სხვადასხვა გრაფიკები: მრავალწევრი და ჰისტოგრამები

სიხშირის პოლიგონი -ეს არის გატეხილი ხაზი, რომლის სეგმენტები აკავშირებს წერტილებს ( x 1 ;n 1 ), ( x 2 ;n 2 ),…, ( x k ; n k ), სადაც არის ოფციები, არის მათი შესაბამისი სიხშირეები.

ფარდობითი სიხშირეების პოლიგონი -ეს არის გატეხილი ხაზი, რომლის სეგმენტები აკავშირებს წერტილებს ( x 1 ;w 1 ), (x 2 ;w 2 ),…, ( x k ;w k ), სადაც x i არის ვარიანტები, w i არის მათ შესაბამისი ფარდობითი სიხშირეები.

მაგალითი:

დახაზეთ ფარდობითი სიხშირის პოლინომი მოცემული ნიმუშის განაწილებაზე:

გადაწყვეტილება:

უწყვეტი მახასიათებლის შემთხვევაში, მიზანშეწონილია ჰისტოგრამის აგება, რომლისთვისაც ინტერვალი, რომელიც შეიცავს მახასიათებლის ყველა დაკვირვებულ მნიშვნელობას, იყოფა h სიგრძის რამდენიმე ნაწილობრივ ინტერვალად და ყოველი ნაწილობრივი ინტერვალისთვის მოიძებნება n i. - ვარიანტის სიხშირეების ჯამი, რომელიც ხვდება i-ე ინტერვალში. (მაგალითად, ადამიანის სიმაღლის ან წონის გაზომვისას საქმე გვაქვს უწყვეტ ნიშანთან).

სიხშირის ჰისტოგრამა -ეს არის საფეხურიანი ფიგურა, რომელიც შედგება მართკუთხედებისგან, რომელთა ფუძეები არის h სიგრძის ნაწილობრივი ინტერვალები, ხოლო სიმაღლეები უდრის თანაფარდობას (სიხშირის სიმკვრივე).

მოედანი i-ე ნაწილობრივი მართკუთხედი უდრის i-ის ინტერვალის ვარიანტის სიხშირეების ჯამს, ე.ი. სიხშირის ჰისტოგრამის ფართობი უდრის ყველა სიხშირის ჯამს, ე.ი. ნიმუშის ზომა.

მაგალითი:

მოცემულია ელექტრულ ქსელში ძაბვის (ვოლტებში) ცვლილების შედეგები. შეადგინეთ ვარიაციის სერია, შექმენით მრავალკუთხედი და სიხშირის ჰისტოგრამა, თუ ძაბვის მნიშვნელობები შემდეგია: 227, 215, 230, 232, 223, 220, 228, 222, 221, 226, 226, 215, 218, 216, 220, 225, 212, 217, 220.

გადაწყვეტილება:

მოდით შევქმნათ ვარიაციების სერია. გვაქვს n = 20, x min =212, x max =232.

ინტერვალების რაოდენობის გამოსათვლელად გამოვიყენოთ Sturgess-ის ფორმულა.

სიხშირეების ინტერვალის ცვალებად სერიას აქვს ფორმა:

		სიხშირის სიმკვრივე
212-21 6		0,75
21 6-22 0		0,75
220-224		1,75
224-228
228-232		0,75

მოდით ავაშენოთ სიხშირეების ჰისტოგრამა:

მოდით ავაშენოთ სიხშირეების პოლიგონი ჯერ ინტერვალების შუა წერტილების აღმოჩენით:

ფარდობითი სიხშირეების ჰისტოგრამაეწოდება საფეხურიანი ფიგურა, რომელიც შედგება მართკუთხედებისგან, რომელთა ფუძეები არის h სიგრძის ნაწილობრივი ინტერვალები, ხოლო სიმაღლეები უდრის w შეფარდებას. მე/სთ (ფარდობითი სიხშირის სიმკვრივე).

მოედანი i-ე ნაწილობრივი მართკუთხედი ტოლია იმ ვარიანტის ფარდობითი სიხშირისა, რომელიც მოხვდა i-ე ინტერვალში. იმათ. ფარდობითი სიხშირეების ჰისტოგრამის ფართობი უდრის ყველა ფარდობითი სიხშირის ჯამს, ე.ი. ერთეული.

7. ვარიაციების სერიის რიცხვითი მახასიათებლები

განვიხილოთ ზოგადი და სანიმუშო პოპულაციების ძირითადი მახასიათებლები.

ზოგადი საშუალოეწოდება საერთო პოპულაციის მახასიათებლის მნიშვნელობების საშუალო არითმეტიკული.

სხვადასხვა მნიშვნელობებისთვის x 1 , x 2 , x 3 , ..., x n . N მოცულობის საერთო პოპულაციის ნიშანი გვაქვს:

თუ ატრიბუტის მნიშვნელობებს აქვთ შესაბამისი სიხშირეები N 1 +N 2 +…+N k =N, მაშინ

ნიმუში ნიშნავსეწოდება ნიმუშის პოპულაციის მახასიათებლის მნიშვნელობების საშუალო არითმეტიკული.

თუ ატრიბუტის მნიშვნელობებს აქვთ შესაბამისი სიხშირეები n 1 +n 2 +…+n k = n, მაშინ

მაგალითი:

გამოთვალეთ ნიმუშის საშუალო მაჩვენებელი: x 1 = 51,12; x 2 \u003d 51,07; x 3 \u003d 52,95; x 4 \u003d 52,93; x 5 \u003d 51,1; x 6 \u003d 52,98; x 7 \u003d 52,29; x 8 \u003d 51,23; x 9 \u003d 51.07; x10 = 51.04.

გადაწყვეტილება:

ზოგადი ვარიაციაეწოდება საერთო პოპულაციის X მახასიათებლის მნიშვნელობების კვადრატული გადახრების საშუალო არითმეტიკული საშუალო საშუალოდან.

N მოცულობის პოპულაციის ნიშნის სხვადასხვა x 1 , x 2 , x 3 , ..., x N მნიშვნელობებისთვის გვაქვს:

თუ ატრიბუტის მნიშვნელობებს აქვთ შესაბამისი სიხშირეები N 1 +N 2 +…+N k =N, მაშინ

ზოგადი სტანდარტული გადახრა (სტანდარტული)ეწოდება ზოგადი დისპერსიის კვადრატული ფესვი

ნიმუშის განსხვავებაეწოდება მახასიათებლის დაკვირვებული მნიშვნელობების საშუალო მნიშვნელობიდან კვადრატული გადახრების საშუალო არითმეტიკული.

n მოცულობის ნიმუშის პოპულაციის ნიშნის სხვადასხვა მნიშვნელობებისთვის x 1 , x 2 , x 3 , ..., x n გვაქვს:

თუ ატრიბუტის მნიშვნელობებს აქვთ შესაბამისი სიხშირეები n 1 +n 2 +…+n k = n, მაშინ

ნიმუშის სტანდარტული გადახრა (სტანდარტული)ეწოდება ნიმუშის დისპერსიის კვადრატული ფესვი.

მაგალითი:

შერჩევის ნაკრები მოცემულია განაწილების ცხრილით. იპოვეთ ნიმუშის განსხვავება.

გადაწყვეტილება:

თეორემა: დისპერსია უდრის განსხვავებას მახასიათებლის მნიშვნელობების კვადრატების საშუალოსა და მთლიანი საშუალოს კვადრატს შორის.

მაგალითი:

იპოვეთ განსხვავება ამ განაწილებისთვის.

გადაწყვეტილება:

8. განაწილების პარამეტრების სტატისტიკური შეფასებები

მოდით, ზოგადი პოპულაცია შეისწავლოს ზოგიერთი ნიმუშით. ამ შემთხვევაში შესაძლებელია მხოლოდ უცნობი პარამეტრის Q მიახლოებითი მნიშვნელობის მიღება, რომელიც ემსახურება მის შეფასებას. აშკარაა, რომ შეფასებები შეიძლება განსხვავდებოდეს ერთი ნიმუშიდან მეორეზე.

სტატისტიკური შეფასებაQ*თეორიული განაწილების უცნობ პარამეტრს ეწოდება ფუნქცია f, რომელიც დამოკიდებულია ნიმუშის დაკვირვებულ მნიშვნელობებზე. ნიმუშიდან უცნობი პარამეტრების სტატისტიკური შეფასების ამოცანაა ისეთი ფუნქციის აგება სტატისტიკური დაკვირვების არსებული მონაცემებიდან, რომელიც მისცემს ამ პარამეტრების რეალური, მკვლევარისთვის უცნობი მნიშვნელობების ყველაზე ზუსტ სავარაუდო მნიშვნელობებს.

სტატისტიკური შეფასებები იყოფა წერტილად და ინტერვალად, მათი მოწოდების (რიცხვი ან ინტერვალი) მიხედვით.

ქულების შეფასებას სტატისტიკური შეფასება ეწოდება. Q *=f (x 1 , x 2 , ..., x n) პარამეტრის ერთი მნიშვნელობით განსაზღვრული თეორიული განაწილების Q პარამეტრი, სადაცx 1, x 2, ..., xn- გარკვეული ნიმუშის X რაოდენობრივ ატრიბუტზე ემპირიული დაკვირვების შედეგები.

სხვადასხვა ნიმუშებიდან მიღებული ასეთი პარამეტრების შეფასებები ყველაზე ხშირად განსხვავდება ერთმანეთისგან. აბსოლუტური სხვაობა /Q *-Q / ეწოდება შერჩევის შეცდომა (შეფასება).

იმისათვის, რომ სტატისტიკურმა შეფასებებმა მისცეს სანდო შედეგები სავარაუდო პარამეტრების შესახებ, აუცილებელია, რომ ისინი იყოს მიუკერძოებელი, ეფექტური და თანმიმდევრული.

ქულების შეფასება, რომლის მათემატიკური მოლოდინი უდრის (არა ტოლია) სავარაუდო პარამეტრს, ე.წ შეუცვლელი (გადატანილი). M(Q *)=Q.

სხვაობა M( ქ *)-ქ ეძახიან მიკერძოება ან სისტემატური შეცდომა. მიუკერძოებელი შეფასებისთვის, სისტემატური შეცდომა არის 0.

ეფექტური შეფასება Q *, რომელსაც მოცემული ნიმუშის n ზომისთვის აქვს ყველაზე მცირე შესაძლო ვარიაცია: D min(n = const). ეფექტურ შემფასებელს აქვს ყველაზე მცირე გავრცელება სხვა მიუკერძოებელ და თანმიმდევრულ შემფასებლებთან შედარებით.

Მდიდარიასეთ სტატისტიკას უწოდებენ შეფასება Q *, რომელიც ნმიდრეკილია სავარაუდო პარამეტრზექ , ე.ი. ნიმუშის ზომის ზრდითნ შეფასება მიდრეკილია პარამეტრის ნამდვილ მნიშვნელობამდექ.

თანმიმდევრულობის მოთხოვნა შეესაბამება დიდი რიცხვების კანონს: რაც უფრო მეტია პირველადი ინფორმაცია შესასწავლი ობიექტის შესახებ, მით უფრო ზუსტი იქნება შედეგი. თუ ნიმუშის ზომა მცირეა, მაშინ პარამეტრის წერტილის შეფასებამ შეიძლება გამოიწვიოს სერიოზული შეცდომები.

ნებისმიერი ნიმუში (მოცულობაო)შეიძლება ჩაითვალოს შეკვეთილ კომპლექტადx 1, x 2, ..., xnდამოუკიდებელი იდენტურად განაწილებული შემთხვევითი ცვლადები.

სანიმუშო საშუალებები სხვადასხვა მოცულობის ნიმუშებისთვისნ ერთი და იგივე პოპულაციისგან განსხვავებული იქნება. ანუ, შერჩევის საშუალო შეიძლება ჩაითვალოს შემთხვევით ცვლადად, რაც ნიშნავს, რომ შეგვიძლია ვისაუბროთ შერჩევის საშუალო განაწილებაზე და მის რიცხვობრივ მახასიათებლებზე.

შერჩევის საშუალო მაჩვენებელი აკმაყოფილებს სტატისტიკურ შეფასებებზე დაწესებულ ყველა მოთხოვნას, ე.ი. იძლევა მოსახლეობის საშუალო ობიექტურ, ეფექტურ და თანმიმდევრულ შეფასებას.

ამის დამტკიცება შეიძლება. ამრიგად, ნიმუშის დისპერსია არის ზოგადი დისპერსიის მიკერძოებული შეფასება, რაც მას დაუფასებელ მნიშვნელობას აძლევს. ანუ მცირე ნიმუშის ზომით ის სისტემატიურ შეცდომას მისცემს. მიუკერძოებელი, თანმიმდევრული შეფასებისთვის საკმარისია რაოდენობის აღება, რომელსაც კორექტირებულ დისპერსიას უწოდებენ. ე.ი.

პრაქტიკაში, ზოგადი დისპერსიის შესაფასებლად გამოიყენება შესწორებული დისპერსია, როდესაცნ < 30. სხვა შემთხვევებში ( n >30) გადახრა ძლივს შესამჩნევი. ამიტომ, დიდი ღირებულებებისთვისნ მიკერძოების შეცდომის უგულებელყოფა შეიძლება.

ასევე შეიძლება დაამტკიცოს, რომ ფარდობითი სიხშირეn i / n არის მიუკერძოებელი და თანმიმდევრული ალბათობის შეფასება P(X=x i ). ემპირიული განაწილების ფუნქცია F*(x ) არის თეორიული განაწილების ფუნქციის მიუკერძოებელი და თანმიმდევრული შეფასება F(x)=P(X< x ).

მაგალითი:

იპოვეთ საშუალო და დისპერსიის მიუკერძოებელი შეფასებები ნიმუშის ცხრილიდან.

x i
n i

გადაწყვეტილება:

ნიმუშის ზომა n=20.

მათემატიკური მოლოდინის მიუკერძოებელი შეფასება არის შერჩევის საშუალო.

დისპერსიის მიუკერძოებელი შეფასების გამოსათვლელად, ჩვენ ჯერ ვპოულობთ ნიმუშის დისპერსიას:

ახლა ვიპოვოთ მიუკერძოებელი შეფასება:

9. განაწილების პარამეტრების ინტერვალური შეფასებები

ინტერვალი არის სტატისტიკური შეფასება, რომელიც განისაზღვრება ორი რიცხვითი მნიშვნელობით - შესწავლილი ინტერვალის ბოლოები.

ნომერი> 0, სადაც | Q - Q*|< , ახასიათებს ინტერვალის შეფასების სიზუსტეს.

სანდოდაურეკა ინტერვალი , რომელიც მოცემული ალბათობითფარავს უცნობი პარამეტრის მნიშვნელობასქ . ნდობის ინტერვალის შევსება პარამეტრის ყველა შესაძლო მნიშვნელობის ნაკრებისთვისქ დაურეკა კრიტიკული ზონა. თუ კრიტიკული რეგიონი მდებარეობს ნდობის ინტერვალის მხოლოდ ერთ მხარეს, მაშინ ნდობის ინტერვალი ეწოდება ცალმხრივი: მარცხენა მხარეს, თუ კრიტიკული რეგიონი არსებობს მხოლოდ მარცხნივ და მემარჯვენეთუ მარჯვნივ. წინააღმდეგ შემთხვევაში, ნდობის ინტერვალი ეწოდება ორმხრივი.

სანდოობა ან ნდობის დონე, Q შეფასებები (Q-ის გამოყენებით *) დაასახელეთ ალბათობა, რომლითაც სრულდება შემდეგი უტოლობა: | Q - Q*|< .

ყველაზე ხშირად, ნდობის ალბათობა წინასწარ დგინდება (0,95; 0,99; 0,999) და მას ეკისრება მოთხოვნა, რომ იყოს ერთთან ახლოს.

ალბათობადაურეკა შეცდომის ალბათობა, ან მნიშვნელოვნების დონე.

მოდით | Q - Q*|< , მაშინ. ეს ნიშნავს, რომ ალბათობითშეიძლება ითქვას, რომ პარამეტრის ნამდვილი მნიშვნელობაქ ინტერვალს ეკუთვნის. რაც უფრო მცირეა გადახრამით უფრო ზუსტია შეფასება.

ნდობის ინტერვალის საზღვრები (ბოლოები) ეწოდება ნდობის საზღვრები, ან კრიტიკული საზღვრები.

ნდობის ინტერვალის საზღვრების მნიშვნელობები დამოკიდებულია პარამეტრის განაწილების კანონზე Q*.

გადახრის მნიშვნელობანდობის ინტერვალის სიგანის ნახევარი ეწოდება შეფასების სიზუსტე.

ნდობის ინტერვალების აგების მეთოდები პირველად ამერიკელმა სტატისტიკოსმა ი.ნეუმანმა შეიმუშავა. შეფასების სიზუსტე, ნდობის ალბათობა და ნიმუშის ზომა n ურთიერთდაკავშირებული. ამიტომ, ორი რაოდენობის კონკრეტული მნიშვნელობების ცოდნით, ყოველთვის შეგიძლიათ გამოთვალოთ მესამე.

ნდობის ინტერვალის პოვნა ნორმალური განაწილების მათემატიკური მოლოდინის შესაფასებლად, თუ ცნობილია სტანდარტული გადახრა.

მოდით, ნიმუში გაკეთდეს ზოგადი პოპულაციისგან, ნორმალური განაწილების კანონის დაცვით. მოდით ცნობილი იყოს ზოგადი სტანდარტული გადახრა, მაგრამ თეორიული განაწილების მათემატიკური მოლოდინი უცნობიაა ().

შემდეგი ფორმულა მოქმედებს:

იმათ. მითითებული გადახრის მნიშვნელობის მიხედვითშესაძლებელია იმის დადგენა, თუ რა ალბათობით მიეკუთვნება უცნობი ზოგადი საშუალო ინტერვალს. და პირიქით. ფორმულიდან ჩანს, რომ ნიმუშის ზომის გაზრდით და ნდობის ალბათობის ფიქსირებული მნიშვნელობით, მნიშვნელობა- იკლებს, ე.ი. გაიზარდა შეფასების სიზუსტე. სანდოობის ზრდით (ნდობის ალბათობა), ღირებულება-იზრდება, ე.ი. შეფასების სიზუსტე მცირდება.

მაგალითი:

ტესტების შედეგად მიიღეს შემდეგი მნიშვნელობები -25, 34, -20, 10, 21. ცნობილია, რომ ისინი ემორჩილებიან ნორმალურ განაწილების კანონს სტანდარტული გადახრით 2. იპოვეთ შეფასება a *-სთვის. მათემატიკური მოლოდინი ა. დახაზეთ მისთვის 90%-იანი ნდობის ინტერვალი.

გადაწყვეტილება:

მოდი ვიპოვოთ მიუკერძოებელი შეფასება

მერე

a-სთვის დამაჯერებლობის ინტერვალს აქვს ფორმა: 4 - 1.47< ა< 4+ 1,47 или 2,53 < a < 5, 47

ნდობის ინტერვალის პოვნა ნორმალური განაწილების მათემატიკური მოლოდინის შესაფასებლად, თუ სტანდარტული გადახრა უცნობია.

ცნობილია, რომ ზოგადი მოსახლეობა ექვემდებარება ნორმალური განაწილების კანონს, სადაც ა და. ნდობის ინტერვალის დაფარვის სიზუსტე საიმედოობითპარამეტრის ჭეშმარიტი მნიშვნელობა, ამ შემთხვევაში, გამოითვლება ფორმულით:

, სადაც n არის ნიმუშის ზომა, , - სტუდენტის კოეფიციენტი (ის უნდა მოიძებნოს მოცემული მნიშვნელობებიდან n და ცხრილიდან „სტუდენტური განაწილების კრიტიკული წერტილები“).

მაგალითი:

ტესტების შედეგად მიღებული იქნა შემდეგი მნიშვნელობები -35, -32, -26, -35, -30, -17. ცნობილია, რომ ისინი ემორჩილებიან ნორმალური განაწილების კანონს. იპოვეთ ნდობის ინტერვალი პოპულაციის საშუალო a-სთვის ნდობის დონით 0,9.

გადაწყვეტილება:

მოდი ვიპოვოთ მიუკერძოებელი შეფასება.

მოდი ვიპოვოთ.

მერე

ნდობის ინტერვალი მიიღებს ფორმას(-29.2 - 5.62; -29.2 + 5.62) ან (-34.82; -23.58).

ნორმალური განაწილების დისპერსიისა და სტანდარტული გადახრის ნდობის ინტერვალის პოვნა

მოდით ავიღოთ მოცულობის შემთხვევითი ნიმუში მნიშვნელობების ზოგიერთი ზოგადი ნაკრებიდან, რომელიც განაწილებულია ნორმალური კანონის მიხედვითნ < 30, რომლისთვისაც გამოითვლება ნიმუშის დისპერსიები: მიკერძოებულიდა გაასწორა s 2. შემდეგ იპოვონ ინტერვალური შეფასებები მოცემული სანდოობითზოგადი დისპერსიისთვისდზოგადი სტანდარტული გადახრაგამოიყენება შემდეგი ფორმულები.

ან,

ღირებულებები- იპოვეთ კრიტიკული წერტილების მნიშვნელობების ცხრილის გამოყენებითპირსონის განაწილებები.

დისპერსიის ნდობის ინტერვალი ამ უტოლობებიდან არის ნაპოვნი უტოლობის ყველა ნაწილის კვადრატში.

მაგალითი:

შემოწმდა 15 ჭანჭიკის ხარისხი. ვივარაუდოთ, რომ მათი წარმოების შეცდომა ექვემდებარება ნორმალურ განაწილების კანონს და ნიმუშის სტანდარტულ გადახრასუდრის 5 მმ, განსაზღვრეთ საიმედოობითნდობის ინტერვალი უცნობი პარამეტრისთვის

ჩვენ წარმოვადგენთ ინტერვალის საზღვრებს ორმაგი უტოლობის სახით:

დისპერსიის ორმხრივი ნდობის ინტერვალის ბოლოები შეიძლება განისაზღვროს არითმეტიკული ოპერაციების შესრულების გარეშე ნდობის მოცემული დონისა და ნიმუშის ზომისთვის შესაბამისი ცხრილის გამოყენებით (სარწმუნოობის ინტერვალების საზღვრები დისპერსიისთვის, დამოკიდებულია თავისუფლებისა და სანდოობის ხარისხზე ). ამისათვის ცხრილიდან მიღებული ინტერვალის ბოლოები მრავლდება შესწორებულ დისპერსიაზე s 2..

მაგალითი:

მოდით, წინა პრობლემა სხვაგვარად გადავჭრათ.

გადაწყვეტილება:

ვიპოვოთ შესწორებული ვარიაცია:

ცხრილის მიხედვით "სარწმუნოობის ინტერვალის საზღვრები დისპერსიისთვის, რაც დამოკიდებულია თავისუფლებისა და სანდოობის ხარისხების რაოდენობაზე", ჩვენ ვპოულობთ ნდობის ინტერვალის საზღვრებს დისპერსიისთვისკ=14 და: ქვედა ზღვარი 0.513 და ზედა ზღვარი 2.354.

მიღებული საზღვრები გავამრავლოთs 2 და ამოიღეთ ფესვი (რადგან ჩვენ გვჭირდება ნდობის ინტერვალი არა დისპერსიისთვის, არამედ სტანდარტული გადახრისთვის).

როგორც მაგალითებიდან ჩანს, ნდობის ინტერვალის მნიშვნელობა დამოკიდებულია მისი აგების მეთოდზე და იძლევა ახლო, მაგრამ განსხვავებულ შედეგებს.

საკმარისად დიდი ზომის ნიმუშებისთვის (ნ>30) ზოგადი სტანდარტული გადახრის ნდობის ინტერვალის საზღვრები შეიძლება განისაზღვროს ფორმულით: - რომელიღაც რიცხვი, რომელიც ჩამოთვლილია და მოცემულია შესაბამის საცნობარო ცხრილში.

თუ 1- ქ<1, то формула имеет вид:

მაგალითი:

მესამე გზით გადავჭრათ წინა პრობლემა.

გადაწყვეტილება:

ადრე ნაპოვნის= 5,17. ქ(0.95; 15) = 0.46 - ვპოულობთ ცხრილის მიხედვით.

შემდეგ:

პორტალი სტუდენტისთვის. თვითმმართველობის მომზადება

რა არის ნიმუში

შერჩევის წესები

შერჩევითი დაკვირვება

ნიმუში და პოპულაცია

მოსახლეობის წარმომადგენლობა

როგორ გავაკეთოთ არჩევანი

წარმომადგენლობის შეცდომა (შეცდომა).

მეტი ყოველთვის არ არის უკეთესი

რა კითხვებს სვამს ჩვეულებრივ მკვლევარი?

ნიმუშში კვლევის ერთეულების შერჩევის მეთოდები

პრობლემები საერთო წილის შესახებ

ᲓᲐᲙᲐᲕᲨᲘᲠᲔᲑᲣᲚᲘ ᲡᲢᲐᲢᲘᲔᲑᲘ