სტანდარტული ნდობის ინტერვალი. Ნდობის ინტერვალი

სამიზნე– ასწავლოს სტუდენტებს სტატისტიკური პარამეტრების სანდო ინტერვალების გამოთვლის ალგორითმები.

მონაცემების სტატისტიკური დამუშავებისას გამოთვლილმა არითმეტიკულმა საშუალომ, ცვალებადობის კოეფიციენტმა, კორელაციის კოეფიციენტმა, სხვაობის კრიტერიუმებმა და სხვა პუნქტების სტატისტიკამ უნდა მიიღოს რაოდენობრივი ნდობის ლიმიტები, რაც მიუთითებს ინდიკატორის შესაძლო რყევებზე ზევით და ქვემოთ ნდობის ინტერვალის ფარგლებში.

მაგალითი 3.1 . მაიმუნების სისხლის შრატში კალციუმის განაწილება, როგორც ადრე იყო დადგენილი, ხასიათდება შემდეგი შერჩევითი მაჩვენებლებით: = 11,94 მგ%; = 0,127 მგ%; = 100. საჭიროა ნდობის ინტერვალის განსაზღვრა ზოგადი საშუალოსთვის ( ) ნდობის ალბათობით = 0,95.

ზოგადი საშუალო არის გარკვეული ალბათობით ინტერვალში:

, სად – საშუალო არითმეტიკული ნიმუში; - მოსწავლის კრიტერიუმი; არის საშუალო არითმეტიკული შეცდომა.

ცხრილის "სტუდენტური კრიტერიუმის ღირებულებები" მიხედვით ვპოულობთ მნიშვნელობას ნდობის დონით 0,95 და თავისუფლების ხარისხით \u003d 100-1 \u003d 99. უდრის 1,982-ს. საშუალო არითმეტიკული და სტატისტიკური შეცდომის მნიშვნელობებთან ერთად, ჩვენ ვცვლით მას ფორმულაში:

ან 11.69
12,19

ამრიგად, 95%-იანი ალბათობით, შეიძლება ითქვას, რომ ამ ნორმალური განაწილების საერთო საშუალო არის 11,69-დან 12,19 მგ%-მდე.

მაგალითი 3.2 . განსაზღვრეთ 95% ნდობის ინტერვალის საზღვრები ზოგადი დისპერსიისთვის ( ) კალციუმის განაწილება მაიმუნების სისხლში, თუ ცნობილია, რომ
= 1.60, თან = 100.

პრობლემის გადასაჭრელად შეგიძლიათ გამოიყენოთ შემდეგი ფორმულა:

სად არის დისპერსიის სტატისტიკური შეცდომა.

იპოვეთ ნიმუშის დისპერსიის შეცდომა ფორმულის გამოყენებით:
. უდრის 0,11-ს. მნიშვნელობა - კრიტერიუმი 0,95 ნდობის ალბათობით და თავისუფლების ხარისხით = 100–1 = 99 ცნობილია წინა მაგალითიდან.

გამოვიყენოთ ფორმულა და მივიღოთ:

ან 1.38
1,82

უფრო ზუსტი ნდობის ინტერვალი ზოგადი დისპერსიისთვის შეიძლება აშენდეს გამოყენებით (ჩი-კვადრატი) - პირსონის ტესტი. ამ კრიტერიუმის კრიტიკული წერტილები მოცემულია სპეციალურ ცხრილში. კრიტერიუმის გამოყენებისას ორმხრივი მნიშვნელოვნების დონე გამოიყენება ნდობის ინტერვალის ასაგებად. ქვედა ზღვარისთვის, მნიშვნელოვნების დონე გამოითვლება ფორმულით
ზემოსთვის
. მაგალითად, ნდობის დონისთვის = 0,99= 0,010,= 0.990. შესაბამისად კრიტიკული სიდიდეების განაწილების ცხრილის მიხედვით , გამოთვლილი ნდობის დონეებით და თავისუფლების ხარისხით = 100 – 1= 99, იპოვეთ მნიშვნელობები
და
. ვიღებთ
უდრის 135.80 და
უდრის 70.06.

ზოგადი დისპერსიის ნდობის ზღვრების პოვნა გამოყენებით ჩვენ ვიყენებთ ფორმულებს: ქვედა ზღვრისთვის
, ზედა ზღვრისთვის
. ჩაანაცვლეთ ამოცანის მონაცემები ნაპოვნი მნიშვნელობებით ფორმულებად:
= 1,17;
= 2.26. ამრიგად, ნდობის დონით = 0.99 ან 99% ზოგადი ვარიაცია იქნება დიაპაზონში 1.17-დან 2.26 მგ%-მდე ჩათვლით.

მაგალითი 3.3 . ლიფტთან მისულ ლოტიდან 1000 ხორბლის თესლს შორის აღმოჩნდა ერგოტით დაინფიცირებული 120 თესლი. აუცილებელია ხორბლის მოცემულ პარტიაში დაავადებული თესლის მთლიანი პროპორციის სავარაუდო საზღვრების დადგენა.

საერთო წილის ნდობის ლიმიტები მისი ყველა შესაძლო მნიშვნელობისთვის უნდა განისაზღვროს ფორმულით:

,

სად არის დაკვირვებების რაოდენობა; არის ერთ-ერთი ჯგუფის აბსოლუტური რიცხვი; არის ნორმალიზებული გადახრა.

დაინფიცირებული თესლის ნიმუშის ფრაქცია ტოლია
ან 12%. ნდობის დონით = 95% ნორმალიზებული გადახრა ( -სტუდენტური კრიტერიუმი =
) = 1,960.

ჩვენ ვცვლით არსებულ მონაცემებს ფორმულაში:

აქედან გამომდინარე, ნდობის ინტერვალის საზღვრებია = 0,122–0,041 = 0,081, ანუ 8,1%; = 0,122 + 0,041 = 0,163, ანუ 16,3%.

ამრიგად, 95%-იანი ნდობის დონით შეიძლება ითქვას, რომ ინფიცირებული თესლების საერთო წილი 8.1-დან 16.3%-მდეა.

მაგალითი 3.4 . ვარიაციის კოეფიციენტი, რომელიც ახასიათებს მაიმუნების სისხლის შრატში კალციუმის (მგ%) ცვალებადობას, უდრიდა 10,6%-ს. ნიმუშის ზომა = 100. აუცილებელია ზოგადი პარამეტრისთვის 95% ნდობის ინტერვალის საზღვრების დადგენა CV.

ნდობის ლიმიტები ცვალებადობის ზოგადი კოეფიციენტისთვის CV განისაზღვრება შემდეგი ფორმულებით:

და
, სად შუალედური მნიშვნელობა გამოითვლება ფორმულით
.

ამის ცოდნა ნდობის დონით = 95% ნორმალიზებული გადახრა (სტუდენტის t-ტესტი ამისთვის =
) = 1.960, წინასწარ გამოთვალეთ მნიშვნელობა TO:

.

ან 9.3%

ანუ 12.3%

ამრიგად, ვარიაციის ზოგადი კოეფიციენტი 95%-იანი ნდობის ალბათობით არის 9.3-დან 12.3%-მდე დიაპაზონში. განმეორებითი ნიმუშების შემთხვევაში ვარიაციის კოეფიციენტი არ აღემატება 12,3%-ს და არ დაეცემა 9,3%-ს 100-დან 95 შემთხვევაში.

კითხვები თვითკონტროლისთვის:

ამოცანები დამოუკიდებელი გადაწყვეტისთვის.

1. ხოლმოგორის ჯვრების ძროხების ლაქტაციისთვის რძეში ცხიმის საშუალო პროცენტული მაჩვენებელი იყო: 3,4; 3.6; 3.2; 3.1; 2.9; 3.7; 3.2; 3.6; 4.0; 3.4; 4.1; 3.8; 3.4; 4.0; 3.3; 3.7; 3.5; 3.6; 3.4; 3.8. დააყენეთ ნდობის ინტერვალები საერთო საშუალოსთვის 95% ნდობის დონეზე (20 ქულა).

2. ჰიბრიდული ჭვავის 400 მცენარეზე პირველი ყვავილი ჩნდებოდა საშუალოდ თესვიდან 70,5 დღეში. სტანდარტული გადახრა იყო 6.9 დღე. საშუალო და ნდობის ინტერვალების ცდომილების განსაზღვრა პოპულაციის საშუალო და დისპერსიის მნიშვნელოვნების დონეზე = 0,05 და = 0.01 (25 ქულა).

3. ბაღის მარწყვის 502 ეგზემპლარის ფოთლის სიგრძის შესწავლისას მიღებული იქნა შემდეგი მონაცემები: = 7,86 სმ; σ = 1,32 სმ, \u003d ± 0,06 სმ. განსაზღვრეთ ნდობის ინტერვალები პოპულაციის საშუალო არითმეტიკისთვის 0,01 მნიშვნელოვნების დონეებით; 0,02; 0.05. (25 ქულა).

4. 150 ზრდასრული მამაკაცის გამოკვლევისას საშუალო სიმაღლე იყო 167 სმ და σ \u003d 6 სმ. რა არის საერთო საშუალო და ზოგადი ვარიაციის საზღვრები 0,99 და 0,95 ნდობის ალბათობით? (25 ქულა).

5. მაიმუნების სისხლის შრატში კალციუმის განაწილება ხასიათდება შემდეგი შერჩევითი მაჩვენებლებით: = 11,94 მგ%, σ = 1,27, = 100. დახაზეთ 95% ნდობის ინტერვალი ამ განაწილების პოპულაციის საშუალოზე. გამოთვალეთ ვარიაციის კოეფიციენტი (25 ქულა).

6. შესწავლილი იქნა ალბინოსი ვირთხების სისხლის პლაზმაში აზოტის საერთო შემცველობა 37 და 180 დღის ასაკში. შედეგები გამოხატულია გრამებში 100 სმ 3 პლაზმაში. 37 დღის ასაკში 9 ვირთხას ჰქონდა: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0.87. 180 დღის ასაკში 8 ვირთხას ჰქონდა: 1,20; 1.18; 1.33; 1.21; 1.20; 1.07; 1.13; 1.12. დააყენეთ ნდობის ინტერვალები სხვაობისთვის ნდობის დონით 0,95 (50 ქულა).

7. განსაზღვრეთ 95% სანდო ინტერვალის საზღვრები მაიმუნების სისხლის შრატში კალციუმის (მგ%) განაწილების ზოგადი ვარიაციისთვის, თუ ამ განაწილებისთვის ნიმუშის ზომაა n = 100, ნიმუშის ვარიაციის სტატისტიკური შეცდომა. σ 2 = 1.60 (40 ქულა).

8. განსაზღვრეთ 95%-იანი ნდობის ინტერვალის საზღვრები 40 ღეროს ხორბლის სიგრძის განაწილების ზოგადი ვარიაციისთვის (σ 2 = 40,87 მმ 2). (25 ქულა).

9. მოწევა ითვლება ფილტვების ობსტრუქციული დაავადებისადმი მიდრეკილ მთავარ ფაქტორად. პასიური მოწევა ასეთ ფაქტორად არ ითვლება. მეცნიერებმა ეჭვქვეშ დააყენეს პასიური მოწევის უსაფრთხოება და გამოიკვლიეს სასუნთქი გზები არამწეველებში, პასიურ და აქტიურ მწეველებში. სასუნთქი გზების მდგომარეობის დასახასიათებლად ჩვენ ავიღეთ გარე სუნთქვის ფუნქციის ერთ-ერთი მაჩვენებელი - ამოსუნთქვის შუა ნაწილის მაქსიმალური მოცულობითი სიჩქარე. ამ ინდიკატორის შემცირება სასუნთქი გზების გამავლობის დარღვევის ნიშანია. გამოკითხვის მონაცემები ნაჩვენებია ცხრილში.

გამოკვლეულთა რაოდენობა

მაქსიმალური შუა ამოსუნთქვის სიჩქარე, ლ/წმ

Სტანდარტული გადახრა

არამწეველები

მუშაობა არამწეველ ადგილას

მუშაობა კვამლით სავსე ოთახში

მწეველები

მცირე რაოდენობით სიგარეტის მოწევა

სიგარეტის მწეველთა საშუალო რაოდენობა

დიდი რაოდენობით სიგარეტის მოწევა

ცხრილიდან იპოვეთ 95% ნდობის ინტერვალები ზოგადი საშუალოსთვის და ზოგადი დისპერსიისთვის თითოეული ჯგუფისთვის. რა განსხვავებაა ჯგუფებს შორის? შედეგების გრაფიკულად წარმოდგენა (25 ქულა).

10. დაადგინეთ 95% და 99% ნდობის ინტერვალების საზღვრები გოჭების რაოდენობის ზოგადი დისპერსიისთვის 64 მშობიარობაში, თუ ნიმუშის დისპერსიის სტატისტიკური შეცდომაა. σ 2 = 8.25 (30 ქულა).

11. ცნობილია, რომ კურდღლების საშუალო წონა 2,1 კგ-ია. განსაზღვრეთ 95% და 99% ნდობის ინტერვალების საზღვრები ზოგადი საშუალოსა და დისპერსიისთვის, როდესაც = 30, σ = 0,56 კგ (25 ქულა).

12. 100 ყურში გაზომეს ყურის მარცვლის შემცველობა ( X), წვერის სიგრძე ( ) და მარცვლეულის მასა ყურში ( ). იპოვეთ ნდობის ინტერვალები ზოგადი საშუალოსთვის და დისპერსიისთვის 1 = 0,95, 2 = 0,99, 3 = 0,999 თუ = 19, = 6,766 სმ, = 0,554 გ; σ x 2 = 29,153, σ y 2 = 2,111, σ z 2 = 0,064 (25 ქულა).

13. საზამთრო ხორბლის შემთხვევით შერჩეულ 100 ყურში დაითვალეს ღეროების რაოდენობა. ნიმუშის ნაკრები ხასიათდებოდა შემდეგი ინდიკატორებით: = 15 spikelets და σ = 2.28 pc. დაადგინეთ რა სიზუსტით მიიღება საშუალო შედეგი ( ) და დახაზეთ ნდობის ინტერვალი საერთო საშუალოსა და დისპერსიისთვის 95% და 99% მნიშვნელოვნების დონეზე (30 ქულა).

14. ნამარხი მოლუსკის ჭურვებზე ნეკნების რაოდენობა ორთამბონიტები კალიგრამა:

ცნობილია, რომ = 19, σ = 4.25. განსაზღვრეთ ნდობის ინტერვალის საზღვრები ზოგადი საშუალოსთვის და ზოგადი ვარიაციისთვის მნიშვნელოვნების დონეზე = 0.01 (25 ქულა).

15. კომერციულ რძის ფერმაში რძის მოსავლიანობის დასადგენად დღიურად განისაზღვრა 15 ძროხის პროდუქტიულობა. წლის მონაცემებით თითო ძროხა დღეში საშუალოდ იღებდა რძეს შემდეგ რაოდენობას (ლ): 22; 19; 25; ოცი; 27; 17; ოცდაათი; 21; თვრამეტი; 24; 26; 23; 25; ოცი; 24. ნახაზების ნდობის ინტერვალები ზოგადი დისპერსიისა და არითმეტიკული საშუალოსთვის. შეიძლება ველოდოთ, რომ ძროხაზე საშუალო წლიური რძის მოსავალი იქნება 10000 ლიტრი? (50 ქულა).

16. მეურნეობისთვის ხორბლის საშუალო მოსავლიანობის დადგენის მიზნით თიბვა განხორციელდა 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 და 2 ჰა სანიმუშო ნაკვეთებზე. ნაკვეთებიდან მოსავლიანობამ (ც/ჰა) შეადგინა 39,4; 38; 35,8; 40; 35; 42,7; 39.3; 41,6; 33; 42; 29 შესაბამისად. ნახაზების ნდობის ინტერვალები ზოგადი დისპერსიისა და არითმეტიკული საშუალოსთვის. შესაძლებელია თუ არა იმის მოლოდინი, რომ სასოფლო-სამეურნეო საწარმოს საშუალო მოსავალი იქნება 42 ც/ჰა? (50 ქულა).

სტატისტიკაში არსებობს ორი სახის შეფასება: წერტილი და ინტერვალი. ქულების შეფასებაარის ერთი ნიმუშის სტატისტიკა, რომელიც გამოიყენება პოპულაციის პარამეტრის შესაფასებლად. მაგალითად, ნიმუში ნიშნავს არის პოპულაციის საშუალო და შერჩევის დისპერსიის წერტილის შეფასება S2- პოპულაციის დისპერსიის ქულათა შეფასება σ2. ნაჩვენებია, რომ შერჩევის საშუალო არის მოსახლეობის მოლოდინის მიუკერძოებელი შეფასება. შერჩევის საშუალოს ეწოდება მიუკერძოებელი, რადგან ყველა ნიმუშის საშუალო ნიშნავს (იგივე ნიმუშის ზომით ) უდრის საერთო მოსახლეობის მათემატიკურ მოლოდინს.

ნიმუშის დისპერსიის მიზნით S2გახდა პოპულაციის დისპერსიის მიუკერძოებელი შემფასებელი σ2, ნიმუშის დისპერსიის მნიშვნელი ტოლი უნდა იყოს – 1 , მაგრამ არა . სხვა სიტყვებით რომ ვთქვათ, პოპულაციის ვარიაცია არის ყველა შესაძლო ნიმუშის ვარიაციების საშუალო.

პოპულაციის პარამეტრების შეფასებისას უნდა გვახსოვდეს, რომ ნიმუშის სტატისტიკა, როგორიცაა , დამოკიდებულია კონკრეტულ ნიმუშებზე. ამ ფაქტის გათვალისწინება, მოპოვება ინტერვალის შეფასებაზოგადი მოსახლეობის მათემატიკური მოლოდინი აანალიზებს ნიმუშის საშუალებების განაწილებას (დაწვრილებით იხ.). აგებულ ინტერვალს ახასიათებს გარკვეული ნდობის დონე, რაც არის ალბათობა იმისა, რომ ზოგადი პოპულაციის ჭეშმარიტი პარამეტრი სწორად არის შეფასებული. მსგავსი ნდობის ინტერვალები შეიძლება გამოყენებულ იქნას მახასიათებლის პროპორციის შესაფასებლად და საერთო მოსახლეობის ძირითადი განაწილებული მასა.

ჩამოტვირთეთ შენიშვნა ფორმატში ან ფორმატში, მაგალითები ფორმატში

ნდობის ინტერვალის აგება ზოგადი პოპულაციის მათემატიკური მოლოდინისთვის ცნობილი სტანდარტული გადახრით

ზოგადი პოპულაციის მახასიათებლის პროპორციისთვის ნდობის ინტერვალის აგება

ამ განყოფილებაში ნდობის ინტერვალის კონცეფცია ვრცელდება კატეგორიულ მონაცემებზე. ეს საშუალებას გაძლევთ შეაფასოთ მახასიათებლის წილი ზოგად პოპულაციაში ნიმუშის წილით = X/. როგორც აღინიშნა, თუ ღირებულებები და (1 - გვ)აღემატება 5 რიცხვს, ბინომალური განაწილება შეიძლება მიახლოებით ნორმალურზე. მაშასადამე, საერთო პოპულაციაში მახასიათებლის წილის შესაფასებლად შესაძლებელია ინტერვალის აგება, რომლის ნდობის დონე ტოლია (1 - α)x100%.


სადაც გვ- ფუნქციის ნიმუშის წილი, ტოლია X/, ე.ი. წარმატებების რაოდენობა გაყოფილი ნიმუშის ზომაზე, - თვისების წილი ზოგად პოპულაციაში, არის სტანდარტიზებული ნორმალური განაწილების კრიტიკული მნიშვნელობა, - ნიმუშის ზომა.

მაგალითი 3დავუშვათ, რომ ნიმუში ამოღებულია საინფორმაციო სისტემიდან, რომელიც შედგება ბოლო ერთი თვის განმავლობაში შესრულებული 100 ინვოისისაგან. ვთქვათ, რომ ამ ანგარიშფაქტურებიდან 10 არასწორია. Ამგვარად, = 10/100 = 0.1. 95% ნდობის დონე შეესაბამება კრიტიკულ მნიშვნელობას Z = 1.96.

ამრიგად, არსებობს 95%-იანი შანსი, რომ ინვოისების 4.12%-დან 15.88%-მდე შეცდომებს შეიცავდეს.

მოცემული ნიმუშის ზომისთვის, ნდობის ინტერვალი, რომელიც შეიცავს მახასიათებლის პროპორციას ზოგად პოპულაციაში, უფრო ფართოა, ვიდრე უწყვეტი შემთხვევითი ცვლადი. ეს იმიტომ ხდება, რომ უწყვეტი შემთხვევითი ცვლადის გაზომვები შეიცავს უფრო მეტ ინფორმაციას, ვიდრე კატეგორიული მონაცემების გაზომვები. სხვა სიტყვებით რომ ვთქვათ, კატეგორიული მონაცემები, რომლებიც იღებენ მხოლოდ ორ მნიშვნელობას, შეიცავს არასაკმარის ინფორმაციას მათი განაწილების პარამეტრების შესაფასებლად.

INსასრული პოპულაციისგან მიღებული შეფასებების გაანგარიშება

მათემატიკური მოლოდინის შეფასება.კორექტირების ფაქტორი საბოლოო პოპულაციისთვის ( fpc) გამოიყენებოდა სტანდარტული შეცდომის შესამცირებლად კოეფიციენტით. პოპულაციის პარამეტრების შეფასებისთვის სანდო ინტერვალების გაანგარიშებისას, კორექტირების ფაქტორი გამოიყენება იმ სიტუაციებში, როდესაც ნიმუშები შედგენილია ჩანაცვლების გარეშე. ამრიგად, ნდობის ინტერვალი მათემატიკური მოლოდინისთვის, რომელსაც აქვს ნდობის დონე ტოლი (1 - α)x100%, გამოითვლება ფორმულით:

მაგალითი 4სასრულ პოპულაციისთვის კორექტირების ფაქტორის გამოყენების საილუსტრაციოდ, დავუბრუნდეთ ზემოთ მაგალით 3-ში განხილული ინვოისების საშუალო ოდენობის ნდობის ინტერვალის გამოთვლის პრობლემას. დავუშვათ, რომ კომპანია გამოსცემს თვეში 5000 ინვოისს და =110.27 აშშ დოლარი, = $28,95 = 5000, = 100, α = 0.05, t99 = 1.9842. ფორმულის მიხედვით (6) ვიღებთ:

მახასიათებლის წილის შეფასება.უკუგების არჩევისას, ნდობის ინტერვალი იმ მახასიათებლის პროპორციისთვის, რომელსაც აქვს ნდობის დონე ტოლი (1 - α)x100%, გამოითვლება ფორმულით:

ნდობის ინტერვალები და ეთიკური საკითხები

მოსახლეობის შერჩევისა და სტატისტიკური დასკვნების ფორმულირებისას ხშირად ჩნდება ეთიკური პრობლემები. მთავარი ისაა, თუ როგორ ეთანხმება სინჯის სტატისტიკის ნდობის ინტერვალები და წერტილოვანი შეფასებები. საგამომცემლო პუნქტების შეფასებები შესაბამისი ნდობის ინტერვალების (ჩვეულებრივ 95% სანდოობის დონეზე) და ნიმუშის ზომის მითითების გარეშე შეიძლება იყოს შეცდომაში შემყვანი. ამან შეიძლება მომხმარებლისთვის შექმნას შთაბეჭდილება, რომ ქულების შეფასება არის ზუსტად ის, რაც მას სჭირდება მთელი პოპულაციის თვისებების პროგნოზირებისთვის. ამრიგად, აუცილებელია გვესმოდეს, რომ ნებისმიერ კვლევაში წინა პლანზე უნდა იყოს არა წერტილის, არამედ ინტერვალური შეფასებები. გარდა ამისა, განსაკუთრებული ყურადღება უნდა მიექცეს ნიმუშის ზომის სწორ არჩევანს.

ყველაზე ხშირად სტატისტიკური მანიპულაციების ობიექტს წარმოადგენს სხვადასხვა პოლიტიკურ საკითხზე მოსახლეობის სოციოლოგიური გამოკითხვის შედეგები. ამასთან, გამოკითხვის შედეგები დევს გაზეთების პირველ გვერდებზე, ხოლო შერჩევის შეცდომა და სტატისტიკური ანალიზის მეთოდოლოგია სადღაც შუაში იბეჭდება. მიღებული ქულების შეფასებების მართებულობის დასადასტურებლად საჭიროა მიეთითოს ნიმუშის ზომა, რომლის საფუძველზეც იქნა მიღებული ისინი, ნდობის ინტერვალის საზღვრები და მისი მნიშვნელოვნების დონე.

შემდეგი შენიშვნა

გამოყენებულია მასალები წიგნიდან Levin et al., სტატისტიკა მენეჯერებისთვის. - M.: Williams, 2004. - გვ. 448–462 წწ

ცენტრალური ლიმიტის თეორემააცხადებს, რომ საკმარისად დიდი ნიმუშის მოცულობის გათვალისწინებით, საშუალებების ნიმუშის განაწილება შეიძლება მიახლოებული იყოს ნორმალური განაწილებით. ეს ქონება არ არის დამოკიდებული მოსახლეობის განაწილების ტიპზე.

წინა ქვეთავებში განვიხილეთ უცნობი პარამეტრის შეფასების საკითხი მაგრამერთი ნომერი. ასეთ შეფასებას „წერტილი“ ჰქვია. რიგ ამოცანებში საჭიროა არა მხოლოდ პარამეტრის პოვნა მაგრამშესაფერისი რიცხვითი მნიშვნელობა, მაგრამ ასევე შეაფასეთ მისი სიზუსტე და სანდოობა. საჭიროა იცოდეთ რა შეცდომებმა შეიძლება გამოიწვიოს პარამეტრის ჩანაცვლება მაგრამმისი ქულების შეფასება მაგრამდა რა ხარისხის ნდობით შეიძლება ველოდოთ, რომ ეს შეცდომები არ გასცდება ცნობილ საზღვრებს?

ამ ტიპის პრობლემები განსაკუთრებით აქტუალურია მცირე რაოდენობის დაკვირვებისთვის, როდესაც პუნქტიანი შეფასებაა და შიძირითადად შემთხვევითია და a-ს მიახლოებითმა ჩანაცვლებამ შეიძლება გამოიწვიოს სერიოზული შეცდომები.

წარმოდგენა მისცეს შეფასების სიზუსტესა და სანდოობაზე მაგრამ,

მათემატიკური სტატისტიკაში გამოიყენება ე.წ. ნდობის ინტერვალები და ნდობის ალბათობები.

პარამეტრისთვის ნება მაგრამმიღებული გამოცდილებიდან მიუკერძოებელი შეფასებით მაგრამ.ჩვენ გვინდა შევაფასოთ შესაძლო შეცდომა ამ შემთხვევაში. მოდით მივცეთ გარკვეული საკმარისად დიდი ალბათობა p (მაგალითად, p = 0.9, 0.95 ან 0.99) ისე, რომ p ალბათობის მქონე მოვლენა შეიძლება ჩაითვალოს პრაქტიკულად გარკვეულად და ვიპოვოთ s მნიშვნელობა, რომლისთვისაც

შემდეგ შეცდომის პრაქტიკულად შესაძლო მნიშვნელობების დიაპაზონი, რომელიც ხდება შეცვლისას მაგრამზე მაგრამ, იქნება ± s; დიდი აბსოლუტური შეცდომები გამოჩნდება მხოლოდ მცირე ალბათობით a = 1 - p. გადავიწეროთ (14.3.1) ასე:

ტოლობა (14.3.2) ნიშნავს, რომ p ალბათობით პარამეტრის უცნობი მნიშვნელობა მაგრამხვდება ინტერვალში

ამ შემთხვევაში უნდა აღინიშნოს ერთი გარემოება. ადრე ჩვენ არაერთხელ განვიხილავდით შემთხვევითი ცვლადის მოცემულ არა შემთხვევით ინტერვალში მოხვედრის ალბათობას. აქ სიტუაცია განსხვავებულია: მაგრამარა შემთხვევითი, არამედ შემთხვევითი ინტერვალი / რ. შემთხვევითად მისი პოზიცია x-ღერძზე, განისაზღვრება მისი ცენტრით მაგრამ; ზოგადად, 2s ინტერვალის სიგრძეც შემთხვევითია, ვინაიდან s-ის მნიშვნელობა გამოითვლება, როგორც წესი, ექსპერიმენტული მონაცემებიდან. ამიტომ, ამ შემთხვევაში, უკეთესი იქნება p-ის მნიშვნელობა განვმარტოთ და არა როგორც წერტილის „დარტყმის“ ალბათობა. მაგრამინტერვალში / p, მაგრამ როგორც ალბათობა იმისა, რომ შემთხვევითი ინტერვალი / p დაფარავს წერტილს მაგრამ(სურ. 14.3.1).

ბრინჯი. 14.3.1

ალბათობა p ეწოდება თავდაჯერებულობის დონედა ინტერვალი / p - ნდობის ინტერვალი.ინტერვალის საზღვრები თუ. x \u003d a-ს და a 2 = a +და ეძახიან ნდობის საზღვრები.

მოდით კიდევ ერთი ინტერპრეტაცია მივცეთ ნდობის ინტერვალის ცნებას: ის შეიძლება ჩაითვალოს პარამეტრის მნიშვნელობების ინტერვალად. მაგრამ,თავსებადია ექსპერიმენტულ მონაცემებთან და არ ეწინააღმდეგება მათ. მართლაც, თუ ჩვენ ვეთანხმებით მოვლენას a = 1-p ალბათობით, პრაქტიკულად შეუძლებელი, მაშინ a პარამეტრის ის მნიშვნელობები, რომლებისთვისაც აა> s უნდა იყოს აღიარებული, როგორც ეწინააღმდეგება ექსპერიმენტულ მონაცემებს და ის, რისთვისაც |a - მაგრამა ტ ნა 2.

პარამეტრისთვის ნება მაგრამარის მიუკერძოებელი შეფასება მაგრამ.სიდიდის განაწილების კანონი რომ ვიცოდეთ მაგრამ, ნდობის ინტერვალის პოვნის პრობლემა საკმაოდ მარტივი იქნება: საკმარისი იქნება s-ის მნიშვნელობის პოვნა, რომლისთვისაც

სირთულე მდგომარეობს იმაში, რომ შეფასების განაწილების კანონი მაგრამდამოკიდებულია რაოდენობის განაწილების კანონზე Xდა, შესაბამისად, მის უცნობ პარამეტრებზე (კერძოდ, თავად პარამეტრზე მაგრამ).

ამ სირთულის გადასაჭრელად, შეიძლება გამოვიყენოთ შემდეგი მიახლოებითი ხრიკი: შეცვალეთ უცნობი პარამეტრები გამოსახულებაში s-ისთვის მათი წერტილოვანი შეფასებით. შედარებით დიდი რაოდენობით ექსპერიმენტებით (დაახლოებით 20 ... 30) ეს ტექნიკა ჩვეულებრივ იძლევა დამაკმაყოფილებელ შედეგებს სიზუსტის თვალსაზრისით.

მაგალითად, განვიხილოთ მათემატიკური მოლოდინის ნდობის ინტერვალის პრობლემა.

მოდით წარმოებული x,რომლის მახასიათებლებია მათემატიკური მოლოდინი და დისპერსიას - უცნობი. ამ პარამეტრებისთვის მიიღეს შემდეგი შეფასებები:

მათემატიკური მოლოდინისთვის საჭიროა ნდობის ინტერვალის აშენება / р, რომელიც შეესაბამება ნდობის ალბათობას р. რაოდენობები x.

ამ პრობლემის გადაჭრისას ვიყენებთ იმ ფაქტს, რომ რაოდენობა არის ჯამი დამოუკიდებელი იდენტურად განაწილებული შემთხვევითი ცვლადები X სთდა ცენტრალური ლიმიტის თეორემის მიხედვით საკმარისად დიდისთვის მისი განაწილების კანონი ნორმასთან ახლოსაა. პრაქტიკაში, ტერმინების შედარებით მცირე რაოდენობის შემთხვევაშიც კი (10 ... 20 რიგის), ჯამის განაწილების კანონი შეიძლება ჩაითვალოს დაახლოებით ნორმალურად. ჩვენ ვივარაუდებთ, რომ ღირებულება განაწილებულია ჩვეულებრივი კანონის მიხედვით. ამ კანონის მახასიათებლები - მათემატიკური მოლოდინი და დისპერსიული - შესაბამისად თანაბარია და

(იხ. თავი 13 ქვეპუნქტი 13.3). დავუშვათ, რომ ღირებულება ჩვენთვის ცნობილია და ჩვენ ვიპოვით ისეთ მნიშვნელობას Ep, რომლისთვისაც

მე-6 თავის ფორმულის (6.3.5) გამოყენებით, გამოვხატავთ ალბათობას (14.3.5) მარცხენა მხარეს ნორმალური განაწილების ფუნქციის მიხედვით.

სად არის შეფასების სტანდარტული გადახრა თ.

განტოლებიდან

იპოვნეთ Sp მნიშვნელობა:

სადაც arg Ф* (x) არის Ф*-ის შებრუნებული ფუნქცია (X),იმათ. არგუმენტის ისეთი მნიშვნელობა, რომლის ნორმალური განაწილების ფუნქცია უდრის X.

დისპერსია D,რომლის მეშვეობითაც გამოიხატება მნიშვნელობა მაგრამ 1P, ჩვენ ზუსტად არ ვიცით; როგორც მისი სავარაუდო ღირებულება, შეგიძლიათ გამოიყენოთ შეფასება (14.3.4) და დადეთ დაახლოებით:

ამრიგად, ნდობის ინტერვალის აგების პრობლემა დაახლოებით მოგვარებულია, რაც უდრის:

სადაც gp განისაზღვრება ფორმულით (14.3.7).

იმისათვის, რომ თავიდან ავიცილოთ საპირისპირო ინტერპოლაცია ფუნქციის Ф * (l) ცხრილებში s p გაანგარიშებისას, მოსახერხებელია სპეციალური ცხრილის შედგენა (ცხრილი 14.3.1), რომელშიც ჩამოთვლილია რაოდენობის მნიშვნელობები.

დამოკიდებულია რ. მნიშვნელობა (p განსაზღვრავს ნორმალური კანონისთვის სტანდარტული გადახრების რაოდენობას, რომელიც უნდა განთავსდეს დისპერსიული ცენტრის მარჯვნივ და მარცხნივ ისე, რომ მიღებულ არეში ჩავარდნის ალბათობა ტოლი იყოს p.

7 p მნიშვნელობის მიხედვით, ნდობის ინტერვალი გამოიხატება როგორც:

ცხრილი 14.3.1

მაგალითი 1. მნიშვნელობაზე ჩატარდა 20 ექსპერიმენტი x;შედეგები ნაჩვენებია ცხრილში. 14.3.2.

ცხრილი 14.3.2

საჭიროა რაოდენობის მათემატიკური მოლოდინის შეფასების პოვნა Xდა შექმენით ნდობის ინტერვალი, რომელიც შეესაბამება ნდობის დონეს p = 0.8.

გამოსავალი.Ჩვენ გვაქვს:

საწყისის არჩევისას n: = 10, მესამე ფორმულის მიხედვით (14.2.14) ვპოულობთ მიუკერძოებელ შეფასებას :

ცხრილის მიხედვით 14.3.1 ვპოულობთ

ნდობის ლიმიტები:

Ნდობის ინტერვალი:

პარამეტრის მნიშვნელობები T,ამ ინტერვალში მყოფი თავსებადია ცხრილში მოცემულ ექსპერიმენტულ მონაცემებთან. 14.3.2.

ანალოგიურად, ნდობის ინტერვალი შეიძლება აშენდეს დისპერსიისთვის.

მოდით წარმოებული დამოუკიდებელი ექსპერიმენტები შემთხვევით ცვლადზე Xუცნობი პარამეტრებით და A-დან და დისპერსიისთვის მიიღება მიუკერძოებელი შეფასება:

საჭიროა დისპერსიისთვის ნდობის ინტერვალის დაახლოებით აშენება.

ფორმულიდან (14.3.11) ჩანს, რომ მნიშვნელობა წარმოადგენს

თანხა ფორმის შემთხვევითი ცვლადები. ეს ღირებულებები არ არის

დამოუკიდებელი, ვინაიდან რომელიმე მათგანი შეიცავს რაოდენობას T,ყველა სხვაზე დამოკიდებული. თუმცა შეიძლება იმის ჩვენება, რომ როგორც მათი ჯამის განაწილების კანონიც ნორმასთან ახლოსაა. თითქმის ზე = 20...30 უკვე ნორმალურად შეიძლება ჩაითვალოს.

დავუშვათ, რომ ეს ასეა და ვიპოვოთ ამ კანონის მახასიათებლები: მათემატიკური მოლოდინი და განსხვავება. მას შემდეგ, რაც ანგარიში - მაშინ მიუკერძოებელი M[D] = D.

ვარიაციის გაანგარიშება დ დდაკავშირებულია შედარებით რთულ გამოთვლებთან, ამიტომ მის გამოხატვას ვაძლევთ დერივაციის გარეშე:

სადაც c 4 - რაოდენობის მეოთხე ცენტრალური მომენტი x.

ამ გამოთქმის გამოსაყენებლად, თქვენ უნდა შეცვალოთ მასში 4 და მნიშვნელობები. (მინიმუმ სავარაუდო). Იმის მაგივრად შეგიძლიათ გამოიყენოთ შეფასება დ.პრინციპში, მეოთხე ცენტრალური მომენტი ასევე შეიძლება შეიცვალოს მისი შეფასებით, მაგალითად, ფორმის მნიშვნელობით:

მაგრამ ასეთი ჩანაცვლება მისცემს უკიდურესად დაბალ სიზუსტეს, რადგან ზოგადად, ექსპერიმენტების შეზღუდული რაოდენობით, მაღალი რიგის მომენტები განისაზღვრება დიდი შეცდომებით. თუმცა, პრაქტიკაში ხშირად ხდება, რომ რაოდენობის განაწილების კანონის ფორმა Xწინასწარ ცნობილია: მხოლოდ მისი პარამეტრები უცნობია. მაშინ ჩვენ შეგვიძლია ვცადოთ გამოვხატოთ u4 თვალსაზრისით დ.

ავიღოთ ყველაზე გავრცელებული შემთხვევა, როდესაც მნიშვნელობა Xგანაწილებულია ჩვეულებრივი კანონის მიხედვით. შემდეგ მისი მეოთხე ცენტრალური მომენტი გამოიხატება დისპერსიის მიხედვით (იხ. თავი 6 ქვეთავი 6.2);

და ფორმულა (14.3.12) იძლევა ან

(14.3.14) უცნობის ჩანაცვლება მისი შეფასება , ვიღებთ: საიდან

მომენტი u 4 შეიძლება გამოისახოს თვალსაზრისით ასევე ზოგიერთ სხვა შემთხვევაში, როცა რაოდენობის განაწილება Xარ არის ნორმალური, მაგრამ მისი გარეგნობა ცნობილია. მაგალითად, ერთგვაროვანი სიმკვრივის კანონისთვის (იხ. თავი 5) გვაქვს:

სადაც (a, P) არის ის ინტერვალი, რომელზეც კანონი მოცემულია.

შესაბამისად,

ფორმულის მიხედვით (14.3.12) ვიღებთ: საიდანაც ვხვდებით დაახლოებით

იმ შემთხვევებში, როდესაც უცნობია 26-ის მნიშვნელობის განაწილების კანონის ფორმა, a/-ის მნიშვნელობის შეფასებისას კვლავ რეკომენდებულია ფორმულის გამოყენება (14.3.16), თუ არ არსებობს სპეციალური საფუძველი იმის დასაჯერებლად, რომ ეს კანონი ძალიან განსხვავდება ნორმალურისგან (აქვს შესამჩნევი დადებითი ან უარყოფითი ქურთოზი).

თუ a /)-ის მიახლოებითი მნიშვნელობა მიიღება ამა თუ იმ გზით, მაშინ შესაძლებელია დისპერსიისთვის დამაჯერებლობის ინტერვალის აგება ისე, როგორც ჩვენ ავაშენეთ მათემატიკური მოლოდინისთვის:

სადაც მოცემული ალბათობაზე დამოკიდებული მნიშვნელობა p გვხვდება ცხრილში. 14.3.1.

მაგალითი 2. იპოვნეთ დაახლოებით 80% ნდობის ინტერვალი შემთხვევითი ცვლადის ვარიაციისთვის Xმაგალითი 1-ის პირობებში, თუ ცნობილია, რომ მნიშვნელობა Xნორმალურთან მიახლოებული კანონის მიხედვით ნაწილდება.

გამოსავალი.მნიშვნელობა იგივე რჩება, როგორც ცხრილში. 14.3.1:

ფორმულის მიხედვით (14.3.16)

ფორმულის მიხედვით (14.3.18) ვპოულობთ ნდობის ინტერვალს:

სტანდარტული გადახრის მნიშვნელობების შესაბამისი დიაპაზონი: (0.21; 0.29).

14.4. ჩვეულებრივი კანონის მიხედვით განაწილებული შემთხვევითი ცვლადის პარამეტრებისთვის დამაჯერებლობის ინტერვალების აგების ზუსტი მეთოდები

წინა ქვეთავში განვიხილეთ მიახლოებითი მეთოდები საშუალოსა და დისპერსიისთვის ნდობის ინტერვალების ასაგებად. აქ ჩვენ ვაძლევთ იდეას იგივე პრობლემის გადაჭრის ზუსტ მეთოდებზე. ჩვენ ხაზს ვუსვამთ, რომ ნდობის ინტერვალების ზუსტად საპოვნელად აუცილებელია წინასწარ ვიცოდეთ განაწილების კანონის ფორმა რაოდენობაზე. x,ვინაიდან ეს არ არის საჭირო მიახლოებითი მეთოდების გამოყენებისათვის.

ნდობის ინტერვალების აგების ზუსტი მეთოდების იდეა შემდეგია. ნებისმიერი ნდობის ინტერვალი გამოვლენილია მდგომარეობიდან, რომელიც გამოხატავს ზოგიერთი უტოლობის შესრულების ალბათობას, რომელიც მოიცავს ჩვენთვის ინტერესის შეფასებას. მაგრამ.ქულების განაწილების კანონი მაგრამზოგად შემთხვევაში დამოკიდებულია რაოდენობის უცნობ პარამეტრებზე x.თუმცა, ზოგჯერ შესაძლებელია შემთხვევითი ცვლადიდან უტოლობების გადატანა მაგრამდაკვირვებული მნიშვნელობების სხვა ფუნქციებს X p X 2, ..., X გვ.რომლის განაწილების კანონი არ არის დამოკიდებული უცნობ პარამეტრებზე, არამედ დამოკიდებულია მხოლოდ ექსპერიმენტების რაოდენობაზე და რაოდენობის განაწილების კანონის ფორმაზე. x.ამ ტიპის შემთხვევითი ცვლადები დიდ როლს თამაშობენ მათემატიკურ სტატისტიკაში; ისინი ყველაზე დეტალურად იქნა შესწავლილი რაოდენობის ნორმალური განაწილების შემთხვევაში x.

მაგალითად, დადასტურდა, რომ რაოდენობის ნორმალური განაწილებით Xშემთხვევითი მნიშვნელობა

ექვემდებარება ე.წ სტუდენტის განაწილების კანონიდან - თავისუფლების 1 გრადუსი; ამ კანონის სიმკვრივეს აქვს ფორმა

სადაც G(x) არის ცნობილი გამა ფუნქცია:

ასევე დადასტურებულია, რომ შემთხვევითი ცვლადი

აქვს "განაწილება % 2"-ით - თავისუფლების 1 გრადუსი (იხ. თავი 7), რომლის სიმკვრივე გამოიხატება ფორმულით

განაწილების წარმოებულებზე (14.4.2) და (14.4.4) შეჩერების გარეშე, ჩვენ ვაჩვენებთ, თუ როგორ შეიძლება მათი გამოყენება პარამეტრებისთვის სანდო ინტერვალების აგებისას. ტაი დ.

მოდით წარმოებული დამოუკიდებელი ექსპერიმენტები შემთხვევით ცვლადზე x,განაწილებულია ჩვეულებრივი კანონის მიხედვით უცნობი პარამეტრებით TIO.ამ პარამეტრებისთვის, შეფასებები

საჭიროა ნდობის ინტერვალების აგება ორივე პარამეტრისთვის, რომელიც შეესაბამება ნდობის ალბათობას p.

ჯერ ავაშენოთ ნდობის ინტერვალი მათემატიკური მოლოდინისთვის. ბუნებრივია, რომ ეს ინტერვალი სიმეტრიულად მივიღოთ ; s p-ით აღვნიშნოთ ინტერვალის სიგრძის ნახევარი. sp-ის მნიშვნელობა ისე უნდა შეირჩეს, რომ პირობა

შევეცადოთ გადავიტანოთ ტოლობის მარცხენა მხარეს (14.4.5) შემთხვევითი ცვლადიდან. შემთხვევით ცვლადამდე T,ნაწილდება სტუდენტური კანონის მიხედვით. ამისათვის ვამრავლებთ უტოლობის ორივე ნაწილს |m-w?|

დადებითი მნიშვნელობა: ან, აღნიშვნის გამოყენებით (14.4.1),

მოდით ვიპოვოთ რიცხვი / p ისეთი, რომ მნიშვნელობა / p შეიძლება მოიძებნოს მდგომარეობიდან

(14.4.2) ფორმულიდან ჩანს, რომ (1) არის ლუწი ფუნქცია, ამიტომ (14.4.8) იძლევა

ტოლობა (14.4.9) განსაზღვრავს მნიშვნელობას / p, დამოკიდებულია p. თუ თქვენს განკარგულებაში გაქვთ ინტეგრალური მნიშვნელობების ცხრილი

მაშინ მნიშვნელობა / p შეგიძლიათ იხილოთ ცხრილში საპირისპირო ინტერპოლაციით. თუმცა, უფრო მოსახერხებელია წინასწარ შეადგინოთ მნიშვნელობების ცხრილი / p. ასეთი ცხრილი მოცემულია დანართში (ცხრილი 5). ეს ცხრილი აჩვენებს მნიშვნელობებს, რომლებიც დამოკიდებულია ნდობის ალბათობაზე p და თავისუფლების ხარისხების რაოდენობაზე - 1. ცხრილის მიხედვით განსაზღვრული / პ. 5 და ვარაუდით

ჩვენ ვპოულობთ ნდობის ინტერვალის / p სიგანის ნახევარს და თავად ინტერვალს

მაგალითი 1. შემთხვევით ცვლადზე ჩატარდა 5 დამოუკიდებელი ექსპერიმენტი x,ჩვეულებრივ განაწილებულია უცნობი პარამეტრებით და დაახლოებით. ექსპერიმენტების შედეგები მოცემულია ცხრილში. 14.4.1.

ცხრილი 14.4.1

იპოვეთ შეფასება მათემატიკური მოლოდინისთვის და შექმენით მისთვის 90% ნდობის ინტერვალი / p (ანუ ინტერვალი, რომელიც შეესაბამება ნდობის ალბათობას p \u003d 0.9).

გამოსავალი.Ჩვენ გვაქვს:

განაცხადის მე-5 ცხრილის მიხედვით P -ჩვენ ვპოულობთ 1 = 4 და p = 0.9 სადაც

ნდობის ინტერვალი იქნება

მაგალითი 2. 14.3 ქვეპუნქტის 1 მაგალითის პირობებისთვის, მნიშვნელობის გათვალისწინებით Xნორმალურად განაწილებული, იპოვეთ ზუსტი ნდობის ინტერვალი.

გამოსავალი.განაცხადის მე-5 ცხრილის მიხედვით ვხვდებით ზე P - 1 = 19ირ =

0.8 / p = 1.328; აქედან

14.3 ქვეპუნქტის 1-ლი მაგალითის ამოხსნასთან შედარებით (e p = 0.072), ჩვენ ვხედავთ, რომ შეუსაბამობა ძალიან მცირეა. თუ სიზუსტეს შევინარჩუნებთ მეორე ათწილადამდე, მაშინ ზუსტი და მიახლოებითი მეთოდებით ნაპოვნი სანდო ინტერვალები იგივეა:

მოდით გადავიდეთ დისპერსიისთვის ნდობის ინტერვალის აგებაზე. განვიხილოთ მიუკერძოებელი დისპერსიის შეფასება

და გამოხატეთ შემთხვევითი ცვლადი ღირებულების მეშვეობით (14.4.3), რომელსაც აქვს განაწილება x 2 (14.4.4):

სიდიდის განაწილების კანონის ცოდნა V,შესაძლებელია ვიპოვოთ ის ინტერვალი / (1 ), რომელშიც ის ვარდება მოცემული ალბათობით p.

განაწილების კანონი k n _ x (v) I 7-ის მნიშვნელობას აქვს ნახ. 14.4.1.

ბრინჯი. 14.4.1

ჩნდება კითხვა: როგორ ავირჩიოთ ინტერვალი / p? თუ რაოდენობის განაწილების კანონი იყო სიმეტრიული (როგორც ჩვეულებრივი კანონი ან სტუდენტის განაწილება), ბუნებრივი იქნებოდა ინტერვალის /p სიმეტრიული აღება მათემატიკური მოლოდინის მიმართ. ამ შემთხვევაში კანონი k n _ x (v)ასიმეტრიული. მოდით შევთანხმდეთ ავირჩიოთ ინტერვალი /p ისე, რომ სიდიდის გამომავალი ალბათობა იყოს ინტერვალის გარეთ მარჯვნივ და მარცხნივ (დაჩრდილული ადგილები ნახ. 14.4.1-ზე) იყო იგივე და თანაბარი

ამ თვისებით ინტერვალის / p ასაგებად ვიყენებთ Table-ს. 4 აპლიკაცია: შეიცავს ნომრებს y)ისეთივე როგორც

რაოდენობისთვის V,რომელსაც აქვს x 2 -განაწილება r თავისუფლების ხარისხით. ჩვენს შემთხვევაში r = n- 1. გაასწორე r = n- 1 და იპოვეთ ცხრილის შესაბამის სტრიქონში. 4 ორი მნიშვნელობა x 2 -ერთი შეესაბამება ალბათობას მეორე - ალბათობები. მოდით აღვნიშნოთ ეს

ღირებულებები 2-ზედა xl?ინტერვალი აქვს y 2,თავის მარცხნივ და y~მარჯვენა დასასრული.

ახლა ჩვენ ვიპოვით საჭირო ნდობის ინტერვალს /| საზღვრებთან დისპერსიისთვის, და D2,რომელიც ფარავს პუნქტს p ალბათობით:

ავაშენოთ ისეთი ინტერვალი / (, = (?> b A), რომელიც ფარავს წერტილს თუ და მხოლოდ იმ შემთხვევაში, თუ ღირებულება ხვდება ინტერვალში / რ. ვაჩვენოთ, რომ ინტერვალი

აკმაყოფილებს ამ პირობას. მართლაც, უთანასწორობები უტოლობების ტოლფასია

და ეს უტოლობა შენარჩუნებულია ალბათობით p. ამრიგად, დისპერსიის ნდობის ინტერვალი ნაპოვნია და გამოიხატება ფორმულით (14.4.13).

მაგალითი 3. იპოვეთ დისპერსიის დამაჯერებლობის ინტერვალი 14.3 ქვეპუნქტის მე-2 მაგალითის პირობებში, თუ ცნობილია, რომ მნიშვნელობა Xგანაწილებულია ნორმალურად.

გამოსავალი.Ჩვენ გვაქვს . განაცხადის მე-4 ცხრილის მიხედვით

ჩვენ ვპოულობთ r = n - 1 = 19

ფორმულის მიხედვით (14.4.13) ვპოულობთ დისპერსიის ნდობის ინტერვალს

სტანდარტული გადახრის შესაბამისი ინტერვალი: (0.21; 0.32). ეს ინტერვალი მხოლოდ ოდნავ აღემატება მიახლოებითი მეთოდით 14.3 ქვეპუნქტის მე-2 მაგალითში მიღებულ ინტერვალს (0,21; 0,29).

  • სურათი 14.3.1 განიხილავს ნდობის ინტერვალს, რომელიც სიმეტრიულია a-ს მიმართ. ზოგადად, როგორც მოგვიანებით ვნახავთ, ეს არ არის საჭირო.

ნდობის ინტერვალების შეფასება

სასწავლო მიზნები

სტატისტიკა ითვალისწინებს შემდეგს ორი ძირითადი ამოცანა:

    ჩვენ გვაქვს გარკვეული შეფასება, რომელიც დაფუძნებულია ნიმუშის მონაცემებზე და გვსურს გავაკეთოთ გარკვეული ალბათური განცხადება იმის შესახებ, თუ სად არის შეფასებული პარამეტრის ნამდვილი მნიშვნელობა.

    ჩვენ გვაქვს კონკრეტული ჰიპოთეზა, რომელიც უნდა შემოწმდეს ნიმუშის მონაცემების საფუძველზე.

ამ თემაში განვიხილავთ პირველ პრობლემას. ჩვენ ასევე წარმოგიდგენთ ნდობის ინტერვალის განმარტებას.

ნდობის ინტერვალი არის ინტერვალი, რომელიც აგებულია პარამეტრის სავარაუდო მნიშვნელობის გარშემო და გვიჩვენებს, სად არის სავარაუდო პარამეტრის ჭეშმარიტი მნიშვნელობა აპრიორი მოცემულ ალბათობასთან.

ამ თემაზე მასალის შესწავლის შემდეგ თქვენ:

    ისწავლეთ რა არის შეფასების ნდობის ინტერვალი;

    ისწავლოს სტატისტიკური ამოცანების კლასიფიკაცია;

    დაეუფლოს ნდობის ინტერვალების აგების ტექნიკას, როგორც სტატისტიკური ფორმულების, ასევე პროგრამული ინსტრუმენტების გამოყენებით;

    ისწავლეთ ნიმუშის საჭირო ზომის განსაზღვრა სტატისტიკური შეფასებების სიზუსტის გარკვეული პარამეტრების მისაღწევად.

ნიმუშის მახასიათებლების განაწილება

T- განაწილება

როგორც ზემოთ განვიხილეთ, შემთხვევითი ცვლადის განაწილება ახლოსაა სტანდარტიზებულ ნორმალურ განაწილებასთან 0 და 1 პარამეტრებით. ვინაიდან ჩვენ არ ვიცით σ-ის მნიშვნელობა, ჩვენ მას ვცვლით გარკვეული შეფასებით s. რაოდენობას უკვე აქვს განსხვავებული განაწილება, კერძოდ, ან სტუდენტური განაწილება, რომელიც განისაზღვრება პარამეტრით n -1 (თავისუფლების გრადუსების რაოდენობა). ეს განაწილება ახლოს არის ნორმალურ განაწილებასთან (რაც უფრო დიდია n, მით უფრო ახლოსაა განაწილება).

ნახ. 95
წარმოდგენილია სტუდენტის განაწილება თავისუფლების 30 გრადუსით. როგორც ხედავთ, ის ძალიან ახლოს არის ნორმალურ განაწილებასთან.

ნორმალურ განაწილებასთან მუშაობის ფუნქციების მსგავსად NORMDIST და NORMINV, არსებობს t-დისტრიბუციასთან მუშაობის ფუნქციები - STUDIST (TDIST) და STUDRASPBR (TINV). ამ ფუნქციების გამოყენების მაგალითი შეგიძლიათ იხილოთ STUDRIST.XLS ფაილში (თარგი და გამოსავალი) და ნახ. 96
.

სხვა მახასიათებლების განაწილება

როგორც უკვე ვიცით, მოლოდინის შეფასების სიზუსტის დასადგენად, ჩვენ გვჭირდება t-განაწილება. სხვა პარამეტრების შესაფასებლად, როგორიცაა განსხვავება, საჭიროა სხვა განაწილება. ორი მათგანია F- განაწილება და x 2 -განაწილება.

ნდობის ინტერვალი საშუალოსთვის

Ნდობის ინტერვალიარის ინტერვალი, რომელიც აგებულია პარამეტრის სავარაუდო მნიშვნელობის გარშემო და გვიჩვენებს, სად არის სავარაუდო პარამეტრის ჭეშმარიტი მნიშვნელობა აპრიორი მოცემული ალბათობით.

ხდება ნდობის ინტერვალის აგება საშუალო მნიშვნელობისთვის შემდეგი გზით:

მაგალითი

სწრაფი კვების რესტორანი ასორტიმენტის გაფართოებას ახალი ტიპის სენდვიჩით გეგმავს. მასზე მოთხოვნის შესაფასებლად, მენეჯერი გეგმავს შემთხვევით შეარჩიოს 40 ვიზიტორი მათგან, ვინც უკვე სცადა და სთხოვოს შეაფასონ თავიანთი დამოკიდებულება ახალი პროდუქტის მიმართ 1-დან 10-მდე. მენეჯერს სურს შეაფასოს ქულების მოსალოდნელი რაოდენობა, რომელსაც ახალი პროდუქტი მიიღებს და ამ შეფასებისთვის აყალიბებს 95%-იან ნდობის ინტერვალს. Როგორ გავაკეთო ეს? (იხ. ფაილი SANDWICH1.XLS (თარგი და გამოსავალი).

გამოსავალი

ამ პრობლემის გადასაჭრელად, შეგიძლიათ გამოიყენოთ. შედეგები წარმოდგენილია ნახ. 97
.

ნდობის ინტერვალი მთლიანი ღირებულებისთვის

ზოგჯერ, ნიმუშის მონაცემების მიხედვით, საჭიროა არა მათემატიკური მოლოდინის, არამედ მნიშვნელობების ჯამის შეფასება. მაგალითად, აუდიტორთან არსებულ სიტუაციაში, შეიძლება საინტერესო იყოს არა ინვოისის საშუალო ღირებულების, არამედ ყველა ინვოისის ჯამის შეფასება.

მოდით N იყოს ელემენტების საერთო რაოდენობა, n იყოს ნიმუშის ზომა, T 3 იყოს მნიშვნელობების ჯამი ნიმუშში, T" იყოს შეფასება მთლიანი პოპულაციის ჯამისთვის, შემდეგ და ნდობის ინტერვალი გამოითვლება ფორმულით, სადაც s არის ნიმუშის სტანდარტული გადახრის შეფასება, არის ნიმუშის საშუალო შეფასება.

მაგალითი

ვთქვათ, საგადასახადო ოფისს სურს შეაფასოს გადასახადის მთლიანი დაბრუნების ოდენობა 10000 გადასახადის გადამხდელზე. გადასახადის გადამხდელი ან იღებს თანხის დაბრუნებას ან იხდის დამატებით გადასახადებს. იპოვეთ 95% ნდობის ინტერვალი თანხის დაბრუნებისთვის, 500 ადამიანის ნიმუშის ზომის გათვალისწინებით (იხ. ფაილი REFUND AMOUNT.XLS (თარგი და გამოსავალი).

გამოსავალი

StatPro-ში ამ შემთხვევისთვის სპეციალური პროცედურა არ არსებობს, თუმცა, ხედავთ, რომ საზღვრების მიღება შესაძლებელია საშუალოს საზღვრებიდან ზემოთ ფორმულების გამოყენებით (ნახ. 98).
).

ნდობის ინტერვალი პროპორციისთვის

მოდით p იყოს მომხმარებელთა წილის მოლოდინი და pv იყოს ამ წილის შეფასება, მიღებული n ზომის ნიმუშიდან. შეიძლება აჩვენოს, რომ საკმარისად დიდი შეფასების განაწილება ახლოს იქნება ნორმასთან საშუალო p და სტანდარტული გადახრით . შეფასების სტანდარტული შეცდომა ამ შემთხვევაში გამოიხატება როგორც და ნდობის ინტერვალი, როგორც .

მაგალითი

სწრაფი კვების რესტორანი ასორტიმენტის გაფართოებას ახალი ტიპის სენდვიჩით გეგმავს. მასზე მოთხოვნის შესაფასებლად, მენეჯერმა შემთხვევით შეარჩია 40 ვიზიტორი მათგან, ვინც უკვე სცადა და სთხოვა შეაფასონ თავიანთი დამოკიდებულება ახალი პროდუქტის მიმართ 1-დან 10-მდე. მენეჯერს სურს შეაფასოს მოსალოდნელი პროპორცია. მომხმარებელთა, რომლებიც ახალ პროდუქტს 6 ქულაზე მაინც აფასებენ (ის მოელის, რომ ეს მომხმარებლები იქნებიან ახალი პროდუქტის მომხმარებლები).

გამოსავალი

თავდაპირველად, ჩვენ ვქმნით ახალ სვეტს 1-ის საფუძველზე, თუ კლიენტის ქულა იყო 6 ქულაზე მეტი და 0-ზე სხვა შემთხვევაში (იხილეთ SANDWICH2.XLS ფაილი (თარგი და გამოსავალი).

მეთოდი 1

1-ის ოდენობის დათვლას ვაფასებთ წილს და შემდეგ ვიყენებთ ფორმულებს.

z cr-ის მნიშვნელობა აღებულია სპეციალური ნორმალური განაწილების ცხრილებიდან (მაგალითად, 1.96 95% ნდობის ინტერვალისთვის).

ამ მიდგომისა და კონკრეტული მონაცემების გამოყენებით 95% ინტერვალის ასაგებად მივიღებთ შემდეგ შედეგებს (ნახ. 99
). z cr პარამეტრის კრიტიკული მნიშვნელობა არის 1,96. შეფასების სტანდარტული შეცდომაა 0.077. ნდობის ინტერვალის ქვედა ზღვარი არის 0,475. ნდობის ინტერვალის ზედა ზღვარი არის 0,775. ამრიგად, მენეჯერს შეუძლია 95% დარწმუნებით დაუშვას, რომ მომხმარებელთა პროცენტი, რომლებიც ახალ პროდუქტს აფასებენ 6 ქულით ან მეტი, იქნება 47,5-დან 77,5-მდე.

მეთოდი 2

ამ პრობლემის მოგვარება შესაძლებელია სტანდარტული StatPro ინსტრუმენტების გამოყენებით. ამისათვის საკმარისია აღინიშნოს, რომ წილი ამ შემთხვევაში ემთხვევა Type სვეტის საშუალო მნიშვნელობას. შემდეგი განაცხადი StatPro/სტატისტიკური დასკვნა/ერთი ნიმუშის ანალიზიტიპი სვეტისთვის საშუალო მნიშვნელობის (მოლოდინის შეფასება) ნდობის ინტერვალის შესაქმნელად. ამ შემთხვევაში მიღებული შედეგები ძალიან ახლოს იქნება 1-ლი მეთოდის შედეგთან (სურ. 99).

ნდობის ინტერვალი სტანდარტული გადახრისთვის

s გამოიყენება როგორც სტანდარტული გადახრის შეფასება (ფორმულა მოცემულია 1-ელ ნაწილში). s შეფასების სიმკვრივის ფუნქცია არის chi-კვადრატი ფუნქცია, რომელსაც, t-განაწილების მსგავსად, აქვს n-1 გრადუსი თავისუფლება. არსებობს სპეციალური ფუნქციები ამ დისტრიბუციასთან მუშაობისთვის CHI2DIST (CHIDIST) და CHI2OBR (CHIINV).

ნდობის ინტერვალი ამ შემთხვევაში აღარ იქნება სიმეტრიული. საზღვრების პირობითი სქემა ნაჩვენებია ნახ. ასი .

მაგალითი

მანქანამ უნდა აწარმოოს 10 სმ დიამეტრის ნაწილები, თუმცა სხვადასხვა გარემოებების გამო ხდება შეცდომები. ხარისხის კონტროლერს ორი რამ აწუხებს: პირველი, საშუალო მნიშვნელობა უნდა იყოს 10 სმ; მეორეც, ამ შემთხვევაშიც, თუ გადახრები დიდია, მაშინ ბევრი დეტალი უარყოფილი იქნება. ყოველდღე აკეთებს 50 ნაწილისგან შემდგარ ნიმუშს (იხ. ფაილი QUALITY CONTROL.XLS (თარგი და გამოსავალი). რა დასკვნების მოტანა შეუძლია ასეთ ნიმუშს?

გამოსავალი

ჩვენ ვაშენებთ 95% ნდობის ინტერვალებს საშუალო და სტანდარტული გადახრისთვის გამოყენებით StatPro / სტატისტიკური დასკვნა / ერთი ნიმუშის ანალიზი(ნახ. 101
).

გარდა ამისა, დიამეტრის ნორმალური განაწილების დაშვების გამოყენებით, ჩვენ ვიანგარიშებთ დეფექტური პროდუქტების პროპორციას, მაქსიმალური გადახრის დაყენებით 0,065. საძიებო ცხრილის შესაძლებლობების გამოყენებით (ორი პარამეტრის შემთხვევა), ჩვენ ვაშენებთ უარყოფის პროცენტის დამოკიდებულებას საშუალო მნიშვნელობაზე და სტანდარტულ გადახრაზე (ნახ. 102).
).

ნდობის ინტერვალი ორი საშუალების სხვაობისთვის

ეს არის სტატისტიკური მეთოდების ერთ-ერთი ყველაზე მნიშვნელოვანი გამოყენება. სიტუაციის მაგალითები.

    ტანსაცმლის მაღაზიის მენეჯერს სურს იცოდეს, რამდენს მეტ-ნაკლებად ხარჯავს საშუალო მყიდველი ქალი მაღაზიაში, ვიდრე მამაკაცი.

    ორი ავიაკომპანია დაფრინავს მსგავსი მარშრუტებით. მომხმარებელთა ორგანიზაციას სურს შეადაროს განსხვავება ორივე ავიაკომპანიისთვის ფრენის საშუალო მოსალოდნელ დროებს შორის.

    კომპანია აგზავნის კუპონებს გარკვეული ტიპის საქონელზე ერთ ქალაქში და არ აგზავნის მეორეში. მენეჯერებს სურთ შეადარონ ამ ნივთების საშუალო შესყიდვები მომდევნო ორი თვის განმავლობაში.

    მანქანების დილერი ხშირად ხვდება დაქორწინებულ წყვილებს პრეზენტაციებზე. პრეზენტაციაზე მათი პირადი რეაქციების გასაგებად, წყვილებს ხშირად აკითხავენ ცალ-ცალკე. მენეჯერს სურს შეაფასოს ქალებისა და მამაკაცების რეიტინგების განსხვავება.

დამოუკიდებელი ნიმუშების საქმე

საშუალო განსხვავებას ექნება t-განაწილება n 1 + n 2 - თავისუფლების 2 გრადუსით. ნდობის ინტერვალი μ 1 - μ 2 გამოიხატება თანაფარდობით:

ამ პრობლემის გადაჭრა შესაძლებელია არა მხოლოდ ზემოაღნიშნული ფორმულებით, არამედ სტანდარტული StatPro ინსტრუმენტებით. ამისათვის საკმარისია მიმართოთ

ნდობის ინტერვალი პროპორციებს შორის სხვაობისთვის

მოდით იყოს აქციების მათემატიკური მოლოდინი. მოდით იყოს მათი ნიმუშის შეფასებები, რომლებიც აგებულია n 1 და n 2 ზომის ნიმუშებზე, შესაბამისად. შემდეგ არის სხვაობის შეფასება. ამრიგად, ამ განსხვავების ნდობის ინტერვალი გამოიხატება როგორც:

აქ z cr არის სპეციალური ცხრილების ნორმალური განაწილებიდან მიღებული მნიშვნელობა (მაგალითად, 1.96 95% ნდობის ინტერვალისთვის).

შეფასების სტანდარტული შეცდომა გამოიხატება ამ შემთხვევაში მიმართებით:

.

მაგალითი

მაღაზიამ, დიდი გაყიდვისთვის მომზადებისას, ჩაატარა შემდეგი მარკეტინგული კვლევა. 300 საუკეთესო მყიდველი შეირჩა და შემთხვევით დაიყო ორ ჯგუფად თითო 150 წევრისგან. ყველა შერჩეულ მყიდველს გაეგზავნა მოსაწვევები გაყიდვაში მონაწილეობის მისაღებად, მაგრამ მხოლოდ პირველი ჯგუფის წევრებს დაურთეს 5%-იანი ფასდაკლების უფლების მინიჭებული კუპონი. გაყიდვის დროს დაფიქსირდა 300-ვე შერჩეული მყიდველის შესყიდვები. როგორ შეუძლია მენეჯერს შედეგების ინტერპრეტაცია და განსჯის გაკეთება კუპონირების ეფექტურობის შესახებ? (იხილეთ COUPONS.XLS ფაილი (თარგი და გამოსავალი)).

გამოსავალი

ჩვენი კონკრეტული შემთხვევისთვის, 150 კლიენტიდან, რომლებმაც მიიღეს ფასდაკლების კუპონი, 55-მა შეიძინა გაყიდვაში, ხოლო 150-დან, ვინც კუპონი არ მიიღო, მხოლოდ 35-მა შეიძინა (სურ. 103).
). შემდეგ ნიმუშის პროპორციების მნიშვნელობებია 0.3667 და 0.2333, შესაბამისად. ხოლო ნიმუშის სხვაობა მათ შორის უდრის შესაბამისად 0,1333-ს. 95%-იანი ნდობის ინტერვალის დაშვებით, ნორმალური განაწილების ცხრილიდან ვპოულობთ z cr = 1.96. ნიმუშის სხვაობის სტანდარტული ცდომილების გაანგარიშება არის 0,0524. საბოლოოდ, მივიღებთ, რომ 95% ნდობის ინტერვალის ქვედა ზღვარი არის 0.0307, ​​ხოლო ზედა ზღვარი არის 0.2359, შესაბამისად. მიღებული შედეგების ინტერპრეტაცია შესაძლებელია ისე, რომ ყოველი 100 მომხმარებელზე, რომელმაც მიიღო ფასდაკლების კუპონი, შეიძლება ველოდოთ 3-დან 23-მდე ახალ მომხმარებელს. თუმცა, გასათვალისწინებელია, რომ ეს დასკვნა თავისთავად არ ნიშნავს კუპონების გამოყენების ეფექტურობას (რადგან ფასდაკლებით ვკარგავთ მოგებას!). მოდით ვაჩვენოთ ეს კონკრეტულ მონაცემებზე. დავუშვათ, რომ საშუალო შესყიდვის თანხაა 400 რუბლი, აქედან 50 რუბლი. არის მაღაზიის მოგება. მაშინ მოსალოდნელი მოგება 100 მომხმარებელზე, რომლებმაც არ მიიღეს კუპონი, უდრის:

50 0,2333 100 \u003d 1166,50 რუბლი.

მსგავსი გამოთვლები 100 მყიდველისთვის, რომლებმაც მიიღეს კუპონი, იძლევა:

30 0,3667 100 \u003d 1100,10 რუბლი.

საშუალო მოგების 30-მდე შემცირება აიხსნება იმით, რომ ფასდაკლების გამოყენებით, მყიდველები, რომლებმაც მიიღეს კუპონი, საშუალოდ შეიძენენ 380 რუბლს.

ამრიგად, საბოლოო დასკვნა მიუთითებს ამ კონკრეტულ სიტუაციაში ასეთი კუპონების გამოყენების არაეფექტურობაზე.

კომენტარი. ამ პრობლემის მოგვარება შესაძლებელია სტანდარტული StatPro ინსტრუმენტების გამოყენებით. ამისათვის საკმარისია ეს პრობლემა დავამციროთ მეთოდით ორი საშუალოს სხვაობის შეფასების პრობლემამდე და შემდეგ გამოვიყენოთ StatPro/სტატისტიკური დასკვნა/ორი ნიმუშის ანალიზიორ საშუალო მნიშვნელობას შორის სხვაობის ნდობის ინტერვალის შესაქმნელად.

ნდობის ინტერვალის კონტროლი

ნდობის ინტერვალის სიგრძე დამოკიდებულია შემდეგი პირობები:

    პირდაპირ მონაცემები (სტანდარტული გადახრა);

    მნიშვნელოვნების დონე;

    ნიმუშის ზომა.

ნიმუშის ზომა საშუალოს შესაფასებლად

ჯერ განვიხილოთ პრობლემა ზოგად შემთხვევაში. მოდით აღვნიშნოთ ჩვენთვის მოცემული ნდობის ინტერვალის სიგრძის ნახევრის მნიშვნელობა B (ნახ. 104).
). ჩვენ ვიცით, რომ ნდობის ინტერვალი X შემთხვევითი ცვლადის საშუალო მნიშვნელობისთვის გამოიხატება როგორც , სად . ვარაუდით:

და n-ის გამოხატვით მივიღებთ.

სამწუხაროდ, ჩვენ არ ვიცით შემთხვევითი X ცვლადის დისპერსიის ზუსტი მნიშვნელობა. გარდა ამისა, ჩვენ არ ვიცით t cr-ის მნიშვნელობა, რადგან ის დამოკიდებულია n-ზე თავისუფლების გრადუსების რაოდენობის მიხედვით. ამ სიტუაციაში ჩვენ შეგვიძლია გავაკეთოთ შემდეგი. s-ის ნაცვლად, ჩვენ ვიყენებთ დისპერსიის გარკვეულ შეფასებას შესასწავლი შემთხვევითი ცვლადის ზოგიერთი ხელმისაწვდომი რეალიზაციისთვის. t cr მნიშვნელობის ნაცვლად, ვიყენებთ z cr მნიშვნელობას ნორმალური განაწილებისთვის. ეს საკმაოდ მისაღებია, რადგან სიმკვრივის ფუნქციები ნორმალური და t-განაწილებისთვის ძალიან ახლოსაა (გარდა მცირე n-ის შემთხვევისა). ამრიგად, სასურველი ფორმულა იღებს ფორმას:

.

ვინაიდან ფორმულა იძლევა, ზოგადად, არა მთელი რიცხვის შედეგებს, შედეგის ჭარბი დამრგვალება მიიღება, როგორც სასურველი ნიმუშის ზომა.

მაგალითი

სწრაფი კვების რესტორანი ასორტიმენტის გაფართოებას ახალი ტიპის სენდვიჩით გეგმავს. მასზე მოთხოვნის შესაფასებლად, მენეჯერი გეგმავს შემთხვევით შეარჩიოს ვიზიტორთა რაოდენობა მათ შორის, ვინც უკვე სცადა და სთხოვოს შეაფასონ თავიანთი დამოკიდებულება ახალი პროდუქტის მიმართ 1-დან 10-მდე. მენეჯერს სურს. შეაფასოს ქულების მოსალოდნელი რაოდენობა, რომელსაც მიიღებს ახალი პროდუქტი.პროდუქტი და დახაზოთ ამ შეფასების 95%-იანი ნდობის ინტერვალი. თუმცა, მას სურს, რომ ნდობის ინტერვალის ნახევარი არ აღემატებოდეს 0.3-ს. რამდენი ვიზიტორი სჭირდება მას გამოკითხვისთვის?

შემდეგნაირად:

Აქ რ ოწარის p წილადის შეფასება და B არის ნდობის ინტერვალის სიგრძის მოცემული ნახევარი. n-ის გაბერილი მნიშვნელობა შეიძლება მივიღოთ მნიშვნელობის გამოყენებით რ ოწ= 0.5. ამ შემთხვევაში, ნდობის ინტერვალის სიგრძე არ აღემატება მოცემულ მნიშვნელობას B-ს ნებისმიერი ჭეშმარიტი მნიშვნელობისთვის.

მაგალითი

ნება მიეცით მენეჯერს წინა მაგალითიდან დაგეგმოს შეაფასოს მომხმარებელთა პროპორცია, რომლებიც ამჯობინებენ ახალი ტიპის პროდუქტს. მას სურს ააგოს 90%-იანი ნდობის ინტერვალი, რომლის ნახევარი სიგრძე 0,05-ზე ნაკლები ან ტოლია. რამდენი კლიენტი უნდა იყოს შერჩეული შემთხვევით?

გამოსავალი

ჩვენს შემთხვევაში, z cr = 1.645 მნიშვნელობა. ამიტომ, საჭირო რაოდენობა გამოითვლება როგორც .

თუ მენეჯერს ქონდა საფუძველი დაეჯერებინა, რომ p-ის სასურველი მნიშვნელობა არის, მაგალითად, დაახლოებით 0.3, მაშინ ამ მნიშვნელობის ზემოხსენებულ ფორმულაში ჩანაცვლებით, ჩვენ მივიღებთ შემთხვევითი ნიმუშის უფრო მცირე მნიშვნელობას, კერძოდ 228-ს.

განსაზღვრის ფორმულა შემთხვევითი ნიმუშის ზომები ორ საშუალებას შორის სხვაობის შემთხვევაშიდაწერილი როგორც:

.

მაგალითი

ზოგიერთ კომპიუტერულ კომპანიას აქვს მომხმარებელთა მომსახურების ცენტრი. ბოლო დროს იმატა მომხმარებელთა პრეტენზიებმა მომსახურების უხარისხობაზე. სერვის ცენტრში ძირითადად დასაქმებულია ორი ტიპის თანამშრომელი: მცირე გამოცდილების მქონე, მაგრამ გავლილი სპეციალური სასწავლო კურსები და დიდი პრაქტიკული გამოცდილების მქონე, მაგრამ არ გავლილი სპეციალური კურსები. კომპანიას სურს გააანალიზოს მომხმარებელთა საჩივრები ბოლო ექვსი თვის განმავლობაში და შეადაროს მათი საშუალო რაოდენობა თანამშრომლების ორი ჯგუფიდან. ვარაუდობენ, რომ ორივე ჯგუფის ნიმუშებში რიცხვები ერთნაირი იქნება. რამდენი თანამშრომელი უნდა იყოს შეყვანილი ნიმუშში, რომ მივიღოთ 95% ინტერვალი ნახევარი სიგრძით არაუმეტეს 2-ისა?

გამოსავალი

აქ σ ots არის ორივე შემთხვევითი ცვლადის სტანდარტული გადახრის შეფასება იმ ვარაუდით, რომ ისინი ახლოსაა. ამრიგად, ჩვენს ამოცანაში, ჩვენ როგორმე უნდა მივიღოთ ეს შეფასება. ეს შეიძლება გაკეთდეს, მაგალითად, შემდეგნაირად. მომხმარებელთა საჩივრების მონაცემების დათვალიერებისას, ბოლო ექვსი თვის განმავლობაში, მენეჯერმა შეიძლება შეამჩნია, რომ თითო თანამშრომელს ჩვეულებრივ აქვს 6-დან 36-მდე საჩივარი. იმის ცოდნა, რომ ნორმალური განაწილებისთვის, პრაქტიკულად ყველა მნიშვნელობა არის არაუმეტეს სამი სტანდარტული გადახრა საშუალოდან, მას შეუძლია გონივრულად დაიჯეროს, რომ:

, საიდანაც σ ots = 5.

ამ მნიშვნელობის ფორმულაში ჩანაცვლებით, მივიღებთ .

განსაზღვრის ფორმულა შემთხვევითი ნიმუშის ზომა წილებს შორის სხვაობის შეფასების შემთხვევაშიროგორც ჩანს:

მაგალითი

ზოგიერთ კომპანიას აქვს ორი ქარხანა მსგავსი პროდუქტების წარმოებისთვის. კომპანიის მენეჯერს სურს შეადაროს ორივე ქარხნის ხარვეზის მაჩვენებლები. არსებული ინფორმაციით, ორივე ქარხანაში უარყოფის მაჩვენებელი 3-დან 5%-მდეა. სავარაუდოა, რომ ააშენოს 99% ნდობის ინტერვალი ნახევარი სიგრძით არაუმეტეს 0,005 (ან 0,5%). რამდენი პროდუქტი უნდა შეირჩეს თითოეული ქარხნიდან?

გამოსავალი

აქ p 1ot და p 2ot არის 1 და 2 ქარხნების უარყოფის ორი უცნობი ფრაქციის შეფასება. თუ დავსვამთ p 1ots \u003d p 2ots \u003d 0.5, მაშინ მივიღებთ გადაჭარბებულ მნიშვნელობას n-სთვის. მაგრამ რადგან ჩვენს შემთხვევაში გვაქვს გარკვეული აპრიორი ინფორმაცია ამ აქციების შესახებ, ჩვენ ვიღებთ ამ აქციების ზედა შეფასებას, კერძოდ 0.05. ვიღებთ

პოპულაციის ზოგიერთი პარამეტრის შეფასებისას ნიმუშების მონაცემებიდან, სასარგებლოა არა მხოლოდ პარამეტრის წერტილის შეფასება, არამედ სანდო ინტერვალიც, რომელიც აჩვენებს, სად შეიძლება იყოს შეფასებული პარამეტრის ზუსტი მნიშვნელობა.

ამ თავში ასევე გავეცანით რაოდენობრივ მიმართებებს, რომლებიც გვაძლევს საშუალებას ავაშენოთ ასეთი ინტერვალები სხვადასხვა პარამეტრებზე; ისწავლეს ნდობის ინტერვალის სიგრძის კონტროლის გზები.

ჩვენ ასევე აღვნიშნავთ, რომ ნიმუშის ზომის შეფასების პრობლემა (ექსპერიმენტის დაგეგმვის პრობლემა) შეიძლება გადაწყდეს სტანდარტული StatPro ინსტრუმენტების გამოყენებით, კერძოდ StatPro / სტატისტიკური დასკვნა / ნიმუშის ზომის შერჩევა.

გონება არა მხოლოდ ცოდნაშია, არამედ ცოდნის პრაქტიკაში გამოყენების უნარშიც. (არისტოტელე)

ნდობის ინტერვალები

ზოგადი მიმოხილვა

პოპულაციისგან ნიმუშის აღებით, ჩვენ მივიღებთ ჩვენთვის საინტერესო პარამეტრის პუნქტურ შეფასებას და გამოვთვლით სტანდარტულ შეცდომას, რათა მივუთითოთ შეფასების სიზუსტე.

თუმცა, უმეტეს შემთხვევაში, სტანდარტული შეცდომა, როგორც ასეთი, მიუღებელია. ბევრად უფრო სასარგებლოა სიზუსტის ამ საზომის გაერთიანება პოპულაციის პარამეტრის ინტერვალის შეფასებასთან.

ეს შეიძლება გაკეთდეს ნიმუშის სტატისტიკის (პარამეტრი) თეორიული ალბათობის განაწილების ცოდნის გამოყენებით, რათა გამოვთვალოთ ნდობის ინტერვალი (CI - ნდობის ინტერვალი, CI - ნდობის ინტერვალი) პარამეტრზე.

ზოგადად, ნდობის ინტერვალი ავრცელებს შეფასებებს ორივე მიმართულებით სტანდარტული შეცდომის (მოცემული პარამეტრის) რამდენიმე ჯერადით; ორი მნიშვნელობა (ნდობის ლიმიტები), რომლებიც განსაზღვრავენ ინტერვალს, ჩვეულებრივ გამოყოფილია მძიმით და ჩასმულია ფრჩხილებში.

ნდობის ინტერვალი საშუალოსთვის

ნორმალური განაწილების გამოყენებით

ნიმუშის საშუალოს ნორმალური განაწილება აქვს, თუ ნიმუშის ზომა დიდია, ამიტომ ნორმალური განაწილების ცოდნა შეიძლება გამოყენებულ იქნას შერჩევის საშუალოდ განხილვისას.

კერძოდ, ნიმუშის საშუალო განაწილების 95% არის პოპულაციის საშუალო 1,96 სტანდარტული გადახრების (SD) ფარგლებში.

როდესაც ჩვენ გვაქვს მხოლოდ ერთი ნიმუში, ჩვენ ამას ვუწოდებთ საშუალო სტანდარტულ შეცდომას (SEM) და გამოვთვალოთ 95% ნდობის ინტერვალი საშუალოსთვის შემდეგნაირად:

თუ ეს ექსპერიმენტი რამდენჯერმე განმეორდება, მაშინ ინტერვალი შეიცავს დროის 95%-ის ნამდვილ პოპულაციას.

ეს, როგორც წესი, არის ნდობის ინტერვალი, როგორიცაა მნიშვნელობების დიაპაზონი, რომლის ფარგლებშიც რეალური პოპულაციის საშუალო (ზოგადი საშუალო) არის 95% ნდობის დონე.

მიუხედავად იმისა, რომ ნდობის ინტერვალის ამგვარად ინტერპრეტაცია არ არის საკმაოდ მკაცრი (პოპულაციის საშუალო არის ფიქსირებული მნიშვნელობა და შესაბამისად არ შეიძლება ჰქონდეს მასთან დაკავშირებული ალბათობა), კონცეპტუალურად უფრო ადვილი გასაგებია.

გამოყენება t-განაწილება

თქვენ შეგიძლიათ გამოიყენოთ ნორმალური განაწილება, თუ იცით პოპულაციაში დისპერსიის მნიშვნელობა. ასევე, როდესაც შერჩევის ზომა მცირეა, შერჩევის საშუალო მიჰყვება ნორმალურ განაწილებას, თუ პოპულაციის საფუძვლიანი მონაცემები ნორმალურად არის განაწილებული.

თუ პოპულაციის საფუძველში არსებული მონაცემები არ არის ნორმალურად განაწილებული და/ან ზოგადი ვარიაცია (პოპულაციის ვარიაცია) უცნობია, შერჩევის საშუალო ემორჩილება სტუდენტური t-განაწილება.

გამოთვალეთ 95% ნდობის ინტერვალი მოსახლეობის საშუალოზე შემდეგნაირად:

სად - პროცენტული წერტილი (პროცენტილი) t-სტუდენტური განაწილება (n-1) თავისუფლების ხარისხით, რაც იძლევა ორკუდიან ალბათობას 0,05.

ზოგადად, ის უზრუნველყოფს უფრო ფართო ინტერვალს, ვიდრე ნორმალური განაწილების გამოყენებისას, რადგან ითვალისწინებს დამატებით გაურკვევლობას, რომელიც შემოტანილია პოპულაციის სტანდარტული გადახრის შეფასებით და/ან შერჩევის მცირე ზომის გამო.

როდესაც ნიმუშის ზომა დიდია (100 ან მეტი რიგის), განსხვავება ორ განაწილებას შორის ( t-სტუდენტიდა ნორმალური) უმნიშვნელოა. თუმცა, ყოველთვის გამოიყენეთ t-განაწილება ნდობის ინტერვალების გაანგარიშებისას, მაშინაც კი, თუ ნიმუშის ზომა დიდია.

ჩვეულებრივ მოცემულია 95% CI. სხვა ნდობის ინტერვალები შეიძლება გამოითვალოს, როგორიცაა 99% CI საშუალოსთვის.

სტანდარტული შეცდომისა და ცხრილის მნიშვნელობის პროდუქტის ნაცვლად t-განაწილება, რომელიც შეესაბამება ორკუდიან ალბათობას 0,05, გაამრავლეთ იგი (სტანდარტული შეცდომა) მნიშვნელობით, რომელიც შეესაბამება ორკუდიან ალბათობას 0,01. ეს უფრო ფართო ნდობის ინტერვალია, ვიდრე 95%-იანი შემთხვევა, რადგან ის ასახავს გაზრდილ ნდობას, რომ ინტერვალი ნამდვილად მოიცავს პოპულაციის საშუალო მნიშვნელობას.

ნდობის ინტერვალი პროპორციისთვის

პროპორციების შერჩევის განაწილებას აქვს ბინომიური განაწილება. თუმცა, თუ ნიმუშის ზომა გონივრულად დიდი, მაშინ პროპორციული ნიმუშის განაწილება დაახლოებით ნორმალურია საშუალოზე.

შეაფასეთ შერჩევის შეფარდებით p=r/n(სად - ინდივიდების რაოდენობა ნიმუშში ჩვენთვის საინტერესო მახასიათებლებით) და სტანდარტული შეცდომა შეფასებულია:

95%-იანი ნდობის ინტერვალი პროპორციისთვის შეფასებულია:

თუ ნიმუშის ზომა მცირეა (ჩვეულებრივ, როდესაც npან n(1-p)ნაკლები 5 ), მაშინ ბინომალური განაწილება უნდა იქნას გამოყენებული ზუსტი ნდობის ინტერვალების გამოსათვლელად.

გაითვალისწინეთ, რომ თუ გვგამოხატული პროცენტულად, მაშინ (1-p)შეცვალა (100p).

ნდობის ინტერვალების ინტერპრეტაცია

ნდობის ინტერვალის ინტერპრეტაციისას ჩვენ გვაინტერესებს შემდეგი კითხვები:

რამდენად ფართოა ნდობის ინტერვალი?

ფართო ნდობის ინტერვალი მიუთითებს, რომ შეფასება არაზუსტია; ვიწრო მიუთითებს კარგ შეფასებაზე.

ნდობის ინტერვალის სიგანე დამოკიდებულია სტანდარტული შეცდომის ზომაზე, რაც თავის მხრივ დამოკიდებულია ნიმუშის ზომაზე და მონაცემთა ცვალებადობის რიცხვითი ცვლადის განხილვისას, მიეცით უფრო ფართო ნდობის ინტერვალები, ვიდრე რამდენიმე მონაცემთა დიდი ნაკრების კვლევები. ცვლადები.

მოიცავს თუ არა CI რაიმე განსაკუთრებული ინტერესის მნიშვნელობას?

შეგიძლიათ შეამოწმოთ არის თუ არა პოპულაციის პარამეტრის სავარაუდო მნიშვნელობა სანდო ინტერვალში. თუ კი, მაშინ შედეგები შეესაბამება ამ სავარაუდო მნიშვნელობას. თუ არა, მაშინ ნაკლებად სავარაუდოა (95% ნდობის ინტერვალისთვის, შანსი არის თითქმის 5%), რომ პარამეტრს ჰქონდეს ეს მნიშვნელობა.