სტანდარტული ნდობის ინტერვალი. რაოდენობრივი ანალიზის მეთოდები: ნდობის ინტერვალების შეფასება

და სხვები.ყველა მათგანი არის მათი თეორიული ანალოგიების შეფასება, რომლის მიღებაც შეიძლებოდა, თუ იქნებოდა არა ნიმუში, არამედ საერთო პოპულაცია. მაგრამ სამწუხაროდ, საერთო მოსახლეობა ძალიან ძვირია და ხშირად მიუწვდომელია.

ინტერვალის შეფასების ცნება

ნებისმიერი ნიმუშის შეფასებას აქვს გარკვეული გაფანტვა, რადგან არის შემთხვევითი ცვლადი, რომელიც დამოკიდებულია კონკრეტულ ნიმუშში არსებულ მნიშვნელობებზე. ამიტომ, უფრო სანდო სტატისტიკური დასკვნებისთვის, უნდა იცოდეთ არა მხოლოდ ქულების შეფასება, არამედ ინტერვალიც, რომელიც დიდი ალბათობით γ (გამა) ფარავს სავარაუდო მაჩვენებელს θ (თეტა).

ფორმალურად, ეს არის ორი ასეთი მნიშვნელობა (სტატისტიკა) T1 (X)და T2 (X), რა T1< T 2 , რისთვისაც ალბათობის მოცემულ დონეზე γ პირობა დაკმაყოფილებულია:

მოკლედ, სავარაუდოა γ ან მეტი ჭეშმარიტი მნიშვნელობა არის წერტილებს შორის T1 (X)და T2 (X), რომლებსაც ქვედა და ზედა საზღვრებს უწოდებენ ნდობის ინტერვალი.

ნდობის ინტერვალების აგების ერთ-ერთი პირობაა მისი მაქსიმალური სივიწროვე, ე.ი. რაც შეიძლება მოკლე უნდა იყოს. სურვილი საკმაოდ ბუნებრივია, რადგან. მკვლევარი ცდილობს უფრო ზუსტად მოახდინოს სასურველი პარამეტრის მიგნების ლოკალიზება.

აქედან გამომდინარეობს, რომ ნდობის ინტერვალი უნდა მოიცავდეს განაწილების მაქსიმალურ ალბათობას. და თავად ანგარიში იყოს ცენტრში.

ანუ, გადახრის ალბათობა (ჭეშმარიტი ინდიკატორის შეფასებადან) ზემოთ უდრის გადახრის ალბათობას ქვემოთ. აქვე უნდა აღინიშნოს, რომ დახრილი განაწილებისთვის, მარჯვნივ ინტერვალი არ არის მარცხნივ ინტერვალის ტოლი.

ზემოთ მოყვანილი ფიგურა ნათლად აჩვენებს, რომ რაც უფრო დიდია ნდობის დონე, მით უფრო ფართოა ინტერვალი - პირდაპირი ურთიერთობა.

ეს იყო მცირე შესავალი უცნობი პარამეტრების ინტერვალის შეფასების თეორიაში. მოდით გადავიდეთ მათემატიკური მოლოდინის ნდობის ლიმიტების პოვნაზე.

ნდობის ინტერვალი მათემატიკური მოლოდინისთვის

თუ ორიგინალური მონაცემები განაწილებულია ზე, მაშინ საშუალო იქნება ნორმალური მნიშვნელობა. ეს გამომდინარეობს წესიდან, რომ ნორმალური მნიშვნელობების ხაზოვან კომბინაციას ასევე აქვს ნორმალური განაწილება. ამიტომ, ალბათობების გამოსათვლელად, ჩვენ შეგვიძლია გამოვიყენოთ ნორმალური განაწილების კანონის მათემატიკური აპარატი.

თუმცა, ეს მოითხოვს ორი პარამეტრის ცოდნას - მოსალოდნელი მნიშვნელობისა და დისპერსიის შესახებ, რომლებიც, როგორც წესი, უცნობია. თქვენ, რა თქმა უნდა, შეგიძლიათ გამოიყენოთ შეფასებები პარამეტრების ნაცვლად (საშუალო არითმეტიკული და ), მაგრამ შემდეგ საშუალო განაწილება არ იქნება საკმაოდ ნორმალური, ის ოდნავ გაბრტყელდება. ირლანდიის მოქალაქე უილიამ გოსეტმა ოსტატურად აღნიშნა ეს ფაქტი, როდესაც თავისი აღმოჩენა გამოაქვეყნა 1908 წლის მარტის გამოცემაში Biometrica. საიდუმლო მიზნებისათვის, გოსეტმა ხელი მოაწერა სტუდენტს. ასე გაჩნდა Student's t-დისტრიბუცია.

თუმცა, კ.გაუსის მიერ გამოყენებული ასტრონომიული დაკვირვებების შეცდომების ანალიზისას მონაცემთა ნორმალური განაწილება ძალზე იშვიათია ხმელეთის ცხოვრებაში და ამის დადგენა საკმაოდ რთულია (მაღალი სიზუსტისთვის საჭიროა დაახლოებით 2 ათასი დაკვირვება). ამიტომ, უმჯობესია უარი თქვან ნორმალურობის დაშვებაზე და გამოიყენოთ მეთოდები, რომლებიც არ არის დამოკიდებული ორიგინალური მონაცემების განაწილებაზე.

ჩნდება კითხვა: რა არის არითმეტიკული საშუალოს განაწილება, თუ იგი გამოითვლება უცნობი განაწილების მონაცემებით? პასუხს იძლევა ალბათობის თეორიაში ცნობილი ცენტრალური ლიმიტის თეორემა(CPT). მათემატიკაში მისი რამდენიმე ვერსია არსებობს (ფორმულირებები წლების განმავლობაში დაიხვეწა), მაგრამ ყველა მათგანი, უხეშად რომ ვთქვათ, მიდის იმ განცხადებამდე, რომ დიდი რაოდენობით დამოუკიდებელი შემთხვევითი ცვლადების ჯამი ემორჩილება ნორმალურ განაწილების კანონს.

საშუალო არითმეტიკული გამოთვლისას გამოიყენება შემთხვევითი ცვლადების ჯამი. აქედან ირკვევა, რომ საშუალო არითმეტიკას აქვს ნორმალური განაწილება, რომელშიც მოსალოდნელი მნიშვნელობა არის საწყისი მონაცემების მოსალოდნელი მნიშვნელობა, ხოლო განსხვავება არის .

ჭკვიანმა ადამიანებმა იციან როგორ დაამტკიცონ CLT, მაგრამ ჩვენ ამას გადავამოწმებთ Excel-ში ჩატარებული ექსპერიმენტის დახმარებით. მოდით მოვახდინოთ 50 ერთნაირად განაწილებული შემთხვევითი ცვლადის ნიმუშის სიმულაცია (ექსელის ფუნქციის RANDOMBETWEEN-ის გამოყენებით). შემდეგ გავაკეთებთ 1000 ასეთ ნიმუშს და გამოვთვლით საშუალო არითმეტიკას თითოეულისთვის. მოდით შევხედოთ მათ განაწილებას.

ჩანს, რომ საშუალო განაწილება ნორმალურ კანონთან ახლოსაა. თუ ნიმუშების მოცულობა და მათი რაოდენობა კიდევ უფრო დიდი იქნება, მაშინ მსგავსება კიდევ უკეთესი იქნება.

ახლა, როცა ჩვენ თვითონ დავინახეთ CLT-ის ვალიდობა, ჩვენ შეგვიძლია გამოვთვალოთ არითმეტიკული საშუალოს ნდობის ინტერვალები, რომლებიც ფარავს ჭეშმარიტ საშუალოს ან მათემატიკურ მოლოდინს მოცემული ალბათობით.

ზედა და ქვედა საზღვრების დასადგენად საჭიროა ნორმალური განაწილების პარამეტრების ცოდნა. როგორც წესი, ისინი არ გამოიყენება, ამიტომ შეფასებები გამოიყენება: საშუალო არითმეტიკულიდა ნიმუშის განსხვავება. ისევ და ისევ, ეს მეთოდი იძლევა კარგ მიახლოებას მხოლოდ დიდი ნიმუშებისთვის. როდესაც ნიმუშები მცირეა, ხშირად რეკომენდებულია სტუდენტური განაწილების გამოყენება. არ დაიჯერო! სტუდენტის განაწილება საშუალოზე ხდება მხოლოდ მაშინ, როდესაც თავდაპირველ მონაცემს აქვს ნორმალური განაწილება, ანუ თითქმის არასდროს. ამიტომ უმჯობესია დაუყონებლივ დააწესოთ მინიმალური ბარი საჭირო მონაცემების ოდენობაზე და გამოიყენოთ ასიმპტომურად სწორი მეთოდები. მათი თქმით, 30 დაკვირვება საკმარისია. აიღეთ 50 – ვერ შეცდებით.

T 1.2არის ნდობის ინტერვალის ქვედა და ზედა საზღვრები

- საშუალო არითმეტიკული ნიმუში

s0- ნიმუშის სტანდარტული გადახრა (მიკერძოებული)

- ნიმუშის ზომა

γ - ნდობის დონე (ჩვეულებრივ ტოლია 0,9, 0,95 ან 0,99)

c γ =Φ -1 ((1+γ)/2)არის სტანდარტული ნორმალური განაწილების ფუნქციის ორმხრივი. მარტივი სიტყვებით, ეს არის სტანდარტული შეცდომების რაოდენობა არითმეტიკული საშუალოდან ქვედა ან ზედა ზღვარზე (მითითებული სამი ალბათობა შეესაბამება 1.64, 1.96 და 2.58 მნიშვნელობებს).

ფორმულის არსი იმაში მდგომარეობს, რომ საშუალო არითმეტიკული აღებულია და შემდეგ მისგან გამოყოფილია გარკვეული რაოდენობა ( γ-თან ერთად) სტანდარტული შეცდომები ( s 0 /√n). ყველაფერი ცნობილია, აიღე და დაითვალე.

კომპიუტერების მასობრივ გამოყენებამდე, ნორმალური განაწილების ფუნქციის მნიშვნელობებისა და მისი შებრუნებული მნიშვნელობების მისაღებად, ისინი იყენებდნენ. ისინი ჯერ კიდევ გამოიყენება, მაგრამ უფრო ეფექტურია მზა Excel-ის ფორმულებზე გადასვლა. ყველა ელემენტი ზემოთ მოცემული ფორმულიდან ( , და ) მარტივად შეიძლება გამოითვალოს Excel-ში. მაგრამ ასევე არსებობს მზა ფორმულა ნდობის ინტერვალის გამოსათვლელად - ნდობის ნორმა. მისი სინტაქსი შემდეგია.

ნდობის ნორმა (ალფა, standard_dev, ზომა)

ალფა– მნიშვნელოვნების დონე ანუ ნდობის დონე, რომელიც ზემოთ აღნიშვნით უდრის 1-γ, ე.ი. ალბათობა იმისა, რომ მათემატიკურიმოლოდინი იქნება ნდობის ინტერვალის მიღმა. 0,95 ნდობის დონით, ალფა არის 0,05 და ა.შ.

standard_offარის ნიმუშის მონაცემების სტანდარტული გადახრა. თქვენ არ გჭირდებათ სტანდარტული შეცდომის გამოთვლა, Excel გაყოფს n-ის ფესვზე.

ზომა– ნიმუშის ზომა (n).

CONFIDENCE.NORM ფუნქციის შედეგი არის ნდობის ინტერვალის გამოთვლის ფორმულის მეორე წევრი, ე.ი. ნახევარი ინტერვალი. შესაბამისად, ქვედა და ზედა წერტილები არის საშუალო ± მიღებული მნიშვნელობა.

ამრიგად, შესაძლებელია შეიქმნას უნივერსალური ალგორითმი არითმეტიკული საშუალოსთვის ნდობის ინტერვალების გამოსათვლელად, რომელიც არ არის დამოკიდებული საწყისი მონაცემების განაწილებაზე. უნივერსალურობის ფასი მისი ასიმპტომური ბუნებაა, ე.ი. შედარებით დიდი ნიმუშების გამოყენების აუცილებლობა. თუმცა, თანამედროვე ტექნოლოგიების ეპოქაში, მონაცემების სწორი მოცულობის შეგროვება, როგორც წესი, არ არის რთული.

სტატისტიკური ჰიპოთეზების ტესტირება ნდობის ინტერვალის გამოყენებით

(მოდული 111)

სტატისტიკაში გადაჭრილი ერთ-ერთი მთავარი პრობლემაა. მოკლედ, მისი არსი ასეთია. კეთდება დაშვება, მაგალითად, რომ ზოგადი მოსახლეობის მოლოდინი უდრის გარკვეულ მნიშვნელობას. შემდეგ აგებულია სანიმუშო საშუალებების განაწილება, რომლის დაკვირვებაც შესაძლებელია მოცემული მოლოდინით. შემდეგი, ჩვენ ვუყურებთ სად მდებარეობს ამ პირობით განაწილებაში რეალური საშუალო. თუ ის სცილდება დასაშვებ საზღვრებს, მაშინ ასეთი საშუალოს გამოჩენა ძალზე ნაკლებად სავარაუდოა და ექსპერიმენტის ერთჯერადი გამეორებით თითქმის შეუძლებელია, რაც ეწინააღმდეგება წამოყენებულ ჰიპოთეზას, რომელიც წარმატებით უარყოფილია. თუ საშუალო მაჩვენებელი არ სცილდება კრიტიკულ დონეს, მაშინ ჰიპოთეზა არ არის უარყოფილი (მაგრამ არც მტკიცდება!).

ასე რომ, ნდობის ინტერვალების დახმარებით, ჩვენს შემთხვევაში მოლოდინისთვის, თქვენ ასევე შეგიძლიათ შეამოწმოთ რამდენიმე ჰიპოთეზა. ამის გაკეთება ძალიან ადვილია. დავუშვათ, რომ ზოგიერთი ნიმუშისთვის საშუალო არითმეტიკული არის 100. შემოწმებულია ჰიპოთეზა, რომ მოსალოდნელი მნიშვნელობა არის, ვთქვათ, 90. ანუ, თუ კითხვას პრიმიტიულად დავსვათ, ეს ასე ჟღერს: შეიძლება თუ არა ჭეშმარიტი მნიშვნელობით? საშუალო უდრის 90-ს, დაკვირვებული საშუალო იყო 100?

ამ კითხვაზე პასუხის გასაცემად საჭიროა დამატებითი ინფორმაცია სტანდარტული გადახრისა და ნიმუშის ზომის შესახებ. ვთქვათ, სტანდარტული გადახრა არის 30, ხოლო დაკვირვების რაოდენობა 64 (ძირის ადვილად ამოსაღებად). მაშინ საშუალო სტანდარტული შეცდომა არის 30/8 ან 3.75. 95%-იანი ნდობის ინტერვალის გამოსათვლელად, თქვენ უნდა გამოყოთ ორი სტანდარტული შეცდომა საშუალოს ორივე მხარეს (უფრო ზუსტად, 1.96). ნდობის ინტერვალი იქნება დაახლოებით 100 ± 7.5, ანუ 92.5-დან 107.5-მდე.

შემდგომი მსჯელობა შემდეგია. თუ შემოწმებული მნიშვნელობა ხვდება ნდობის ინტერვალში, მაშინ ის არ ეწინააღმდეგება ჰიპოთეზას, ვინაიდან ჯდება შემთხვევითი რყევების საზღვრებში (95%-იანი ალბათობით). თუ ტესტირებადი წერტილი ნდობის ინტერვალის მიღმაა, მაშინ ასეთი მოვლენის ალბათობა ძალიან მცირეა, ნებისმიერ შემთხვევაში მისაღები დონის ქვემოთ. შესაბამისად, ჰიპოთეზა უარყოფილია, როგორც დაკვირვებულ მონაცემებს ეწინააღმდეგება. ჩვენს შემთხვევაში, მოლოდინის ჰიპოთეზა ნდობის ინტერვალის მიღმაა (90-ის შემოწმებული მნიშვნელობა არ შედის 100±7.5 ინტერვალში), ამიტომ იგი უარყოფილი უნდა იყოს. ზემოთ მოცემულ პრიმიტიულ კითხვაზე პასუხის გაცემისას უნდა ითქვას: არა, ეს არ შეიძლება, არავითარ შემთხვევაში, ეს ხდება ძალიან იშვიათად. ხშირად ეს მიუთითებს ჰიპოთეზის მცდარი უარყოფის კონკრეტულ ალბათობაზე (p-დონე) და არა მოცემულ დონეზე, რომლის მიხედვითაც აშენდა ნდობის ინტერვალი, არამედ უფრო სხვა დროს.

როგორც ხედავთ, არ არის რთული საშუალო (ან მათემატიკური მოლოდინის) ნდობის ინტერვალის აშენება. მთავარია, არსი დაიჭირო და მერე წავა საქმე. პრაქტიკაში, უმეტესობა იყენებს 95% ნდობის ინტერვალს, რაც დაახლოებით ორი სტანდარტული შეცდომის სიგანეა საშუალოს ორივე მხარეს.

ჯერჯერობით სულ ესაა. Ყველაფერი საუკეთესო!

ინსტრუქცია

გთხოვთ გაითვალისწინოთ, რომ ინტერვალი(l1 ან l2), რომლის ცენტრალური რეგიონი იქნება შეფასება l* და ასევე, რომელშიც პარამეტრის ჭეშმარიტი მნიშვნელობა სავარაუდოდ შეიცავდეს, იქნება მხოლოდ ნდობა ინტერვალი ohm ან ნდობის დონის ალფა შესაბამისი მნიშვნელობა. ამ შემთხვევაში, თავად l* მიუთითებს წერტილოვან შეფასებებზე. მაგალითად, X (x1, x2,..., xn) შემთხვევითი მნიშვნელობის ნებისმიერი ნიმუშის შედეგების მიხედვით, აუცილებელია გამოვთვალოთ უცნობი ინდიკატორის პარამეტრი l, რომელზედაც დამოკიდებული იქნება განაწილება. ამ შემთხვევაში, მოცემული პარამეტრის l* შეფასების მიღება ნიშნავს, რომ თითოეული ნიმუშისთვის საჭირო იქნება პარამეტრის გარკვეული მნიშვნელობის დაყენება, ანუ Q ინდიკატორის დაკვირვების შედეგების ფუნქციის შექმნა. რომლის მნიშვნელობა მიიღება l* პარამეტრის სავარაუდო მნიშვნელობის ტოლფასი ფორმულის სახით: l*=Q*(x1, x2,..., xn).

გაითვალისწინეთ, რომ დაკვირვების შედეგებზე ნებისმიერ ფუნქციას სტატისტიკა ეწოდება. უფრო მეტიც, თუ იგი სრულად აღწერს განსახილველ პარამეტრს (ფენომენს), მაშინ მას საკმარისი სტატისტიკა ეწოდება. და რადგან დაკვირვების შედეგები შემთხვევითია, მაშინ l * ასევე იქნება შემთხვევითი ცვლადი. სტატისტიკის გამოთვლის ამოცანა უნდა განხორციელდეს მისი ხარისხის კრიტერიუმების გათვალისწინებით. აქ გასათვალისწინებელია, რომ შეფასების განაწილების კანონი საკმაოდ განსაზღვრულია, ალბათობის სიმკვრივის W(x, l) განაწილება.

შეგიძლიათ გამოთვალოთ ნდობა ინტერვალისაკმარისად მარტივია, თუ იცით კანონი შეფასების განაწილების შესახებ. მაგალითად, ნდობა ინტერვალიშეფასებები მათემატიკური მოლოდინის მიმართ (შემთხვევითი მნიშვნელობის საშუალო მნიშვნელობა) mx* =(1/n)*(x1+x2+ …+xn) . ეს შეფასება იქნება მიუკერძოებელი, ანუ ინდიკატორის მათემატიკური მოლოდინი ან საშუალო მნიშვნელობა უდრის პარამეტრის ნამდვილ მნიშვნელობას (M(mx*) = mx).

თქვენ შეგიძლიათ დაადგინოთ, რომ შეფასების განსხვავება მათემატიკური მოლოდინით არის: bx*^2=Dx/n. ლიმიტის ცენტრალური თეორემის საფუძველზე შეგვიძლია გამოვიტანოთ შესაბამისი დასკვნა, რომ ამ შეფასების განაწილების კანონი არის გაუსიანი (ნორმალური). ამიტომ, გამოთვლებისთვის შეგიძლიათ გამოიყენოთ ინდიკატორი Ф (z) - ალბათობების ინტეგრალი. ამ შემთხვევაში, აირჩიეთ ნდობის სიგრძე ინტერვალიდა 2ld, ასე რომ თქვენ მიიღებთ: alpha \u003d P (mx-ld (ალბათობის ინტეგრალის თვისების გამოყენებით ფორმულის მიხედვით: Ф (-z) \u003d 1- Ф (z)).

ჩამოაყალიბეთ ნდობა ინტერვალიმათემატიკური მოლოდინის შეფასებები: - იპოვეთ ფორმულის მნიშვნელობა (ალფა + 1) / 2; - შეარჩიეთ მნიშვნელობა ტოლი ld / sqrt (Dx / n) ალბათობის ინტეგრალური ცხრილიდან; - მიიღეთ ჭეშმარიტი დისპერსიის შეფასება: Dx * = (1 / n) * ( (x1 - mx*)^2+(x2 - mx*)^2+…+(xn - mx*)^2); ინტერვალიფორმულის მიხედვით: (mx*-ld, mx*+ld).

სტატისტიკაში არსებობს ორი სახის შეფასება: წერტილი და ინტერვალი. ქულების შეფასებაარის ერთი ნიმუშის სტატისტიკა, რომელიც გამოიყენება პოპულაციის პარამეტრის შესაფასებლად. მაგალითად, ნიმუში ნიშნავს არის პოპულაციის საშუალო და შერჩევის დისპერსიის წერტილის შეფასება S2- პოპულაციის დისპერსიის ქულათა შეფასება σ2. ნაჩვენებია, რომ შერჩევის საშუალო არის მოსახლეობის მოლოდინის მიუკერძოებელი შეფასება. შერჩევის საშუალოს ეწოდება მიუკერძოებელი, რადგან ყველა ნიმუშის საშუალო ნიშნავს (იგივე ნიმუშის ზომით ) უდრის საერთო მოსახლეობის მათემატიკურ მოლოდინს.

ნიმუშის დისპერსიის მიზნით S2გახდა პოპულაციის დისპერსიის მიუკერძოებელი შემფასებელი σ2, ნიმუშის დისპერსიის მნიშვნელი ტოლი უნდა იყოს – 1 , მაგრამ არა . სხვა სიტყვებით რომ ვთქვათ, პოპულაციის ვარიაცია არის ყველა შესაძლო ნიმუშის ვარიაციების საშუალო.

პოპულაციის პარამეტრების შეფასებისას უნდა გვახსოვდეს, რომ ნიმუშის სტატისტიკა, როგორიცაა , დამოკიდებულია კონკრეტულ ნიმუშებზე. ამ ფაქტის გათვალისწინება, მოპოვება ინტერვალის შეფასებაზოგადი მოსახლეობის მათემატიკური მოლოდინი აანალიზებს ნიმუშის საშუალებების განაწილებას (დაწვრილებით იხ.). აგებულ ინტერვალს ახასიათებს გარკვეული ნდობის დონე, რაც არის ალბათობა იმისა, რომ ზოგადი პოპულაციის ჭეშმარიტი პარამეტრი სწორად არის შეფასებული. მსგავსი ნდობის ინტერვალები შეიძლება გამოყენებულ იქნას მახასიათებლის პროპორციის შესაფასებლად და საერთო მოსახლეობის ძირითადი განაწილებული მასა.

ჩამოტვირთეთ შენიშვნა ფორმატში ან ფორმატში, მაგალითები ფორმატში

ნდობის ინტერვალის აგება ზოგადი პოპულაციის მათემატიკური მოლოდინისთვის ცნობილი სტანდარტული გადახრით

ზოგადი პოპულაციის მახასიათებლის პროპორციისთვის ნდობის ინტერვალის აგება

ამ განყოფილებაში ნდობის ინტერვალის კონცეფცია ვრცელდება კატეგორიულ მონაცემებზე. ეს საშუალებას გაძლევთ შეაფასოთ მახასიათებლის წილი ზოგად პოპულაციაში ნიმუშის წილით = X/. როგორც აღინიშნა, თუ ღირებულებები და (1 - გვ)აღემატება 5 რიცხვს, ბინომალური განაწილება შეიძლება მიახლოებით ნორმალურზე. მაშასადამე, საერთო პოპულაციაში მახასიათებლის წილის შესაფასებლად შესაძლებელია ინტერვალის აგება, რომლის ნდობის დონე ტოლია (1 - α)x100%.


სადაც გვ- ფუნქციის ნიმუშის წილი, ტოლია X/, ე.ი. წარმატებების რაოდენობა გაყოფილი ნიმუშის ზომაზე, - თვისების წილი ზოგად პოპულაციაში, არის სტანდარტიზებული ნორმალური განაწილების კრიტიკული მნიშვნელობა, - ნიმუშის ზომა.

მაგალითი 3დავუშვათ, რომ ნიმუში ამოღებულია საინფორმაციო სისტემიდან, რომელიც შედგება ბოლო ერთი თვის განმავლობაში შესრულებული 100 ინვოისისგან. ვთქვათ, რომ ამ ანგარიშფაქტურებიდან 10 არასწორია. Ამგვარად, = 10/100 = 0.1. 95% ნდობის დონე შეესაბამება კრიტიკულ მნიშვნელობას Z = 1.96.

ამრიგად, არსებობს 95%-იანი შანსი, რომ ინვოისების 4.12%-დან 15.88%-მდე შეცდომებს შეიცავდეს.

მოცემული ნიმუშის ზომისთვის, ნდობის ინტერვალი, რომელიც შეიცავს მახასიათებლის პროპორციას ზოგად პოპულაციაში, უფრო ფართოა, ვიდრე უწყვეტი შემთხვევითი ცვლადი. ეს იმიტომ ხდება, რომ უწყვეტი შემთხვევითი ცვლადის გაზომვები შეიცავს უფრო მეტ ინფორმაციას, ვიდრე კატეგორიული მონაცემების გაზომვები. სხვა სიტყვებით რომ ვთქვათ, კატეგორიული მონაცემები, რომლებიც იღებენ მხოლოდ ორ მნიშვნელობას, შეიცავს არასაკმარის ინფორმაციას მათი განაწილების პარამეტრების შესაფასებლად.

ATსასრული პოპულაციისგან მიღებული შეფასებების გაანგარიშება

მათემატიკური მოლოდინის შეფასება.კორექტირების ფაქტორი საბოლოო პოპულაციისთვის ( fpc) გამოიყენებოდა სტანდარტული შეცდომის შესამცირებლად კოეფიციენტით. პოპულაციის პარამეტრების შეფასების სანდო ინტერვალების გაანგარიშებისას, კორექტირების ფაქტორი გამოიყენება იმ სიტუაციებში, როდესაც ნიმუშები შედგენილია ჩანაცვლების გარეშე. ამრიგად, ნდობის ინტერვალი მათემატიკური მოლოდინისთვის, რომელსაც აქვს ნდობის დონე ტოლი (1 - α)x100%, გამოითვლება ფორმულით:

მაგალითი 4სასრულ პოპულაციისთვის კორექტირების ფაქტორის გამოყენების საილუსტრაციოდ, დავუბრუნდეთ ზემოთ მაგალით 3-ში განხილული ინვოისების საშუალო ოდენობის ნდობის ინტერვალის გამოთვლის პრობლემას. დავუშვათ, რომ კომპანია გამოსცემს თვეში 5000 ინვოისს და =110.27 აშშ დოლარი, = $28,95 = 5000, = 100, α = 0.05, t99 = 1.9842. ფორმულის მიხედვით (6) ვიღებთ:

მახასიათებლის წილის შეფასება.უკუგების არჩევისას, ნდობის ინტერვალი იმ მახასიათებლის პროპორციისთვის, რომელსაც აქვს ნდობის დონე ტოლი (1 - α)x100%, გამოითვლება ფორმულით:

ნდობის ინტერვალები და ეთიკური საკითხები

მოსახლეობის შერჩევისა და სტატისტიკური დასკვნების ფორმულირებისას ხშირად ჩნდება ეთიკური პრობლემები. მთავარი ისაა, თუ როგორ ეთანხმება სინჯის სტატისტიკის ნდობის ინტერვალები და წერტილოვანი შეფასებები. საგამომცემლო პუნქტების შეფასებები შესაბამისი ნდობის ინტერვალების (ჩვეულებრივ 95% სანდოობის დონეზე) და ნიმუშის ზომის მითითების გარეშე შეიძლება იყოს შეცდომაში შემყვანი. ამან შეიძლება მომხმარებლისთვის შექმნას შთაბეჭდილება, რომ ქულების შეფასება არის ზუსტად ის, რაც მას სჭირდება მთელი პოპულაციის თვისებების პროგნოზირებისთვის. ამრიგად, აუცილებელია გვესმოდეს, რომ ნებისმიერ კვლევაში წინა პლანზე უნდა იყოს არა წერტილის, არამედ ინტერვალური შეფასებები. გარდა ამისა, განსაკუთრებული ყურადღება უნდა მიექცეს ნიმუშის ზომის სწორ არჩევანს.

ყველაზე ხშირად სტატისტიკური მანიპულაციების ობიექტს წარმოადგენს სხვადასხვა პოლიტიკურ საკითხზე მოსახლეობის სოციოლოგიური გამოკითხვის შედეგები. ამასთან, გამოკითხვის შედეგები დევს გაზეთების პირველ გვერდებზე, ხოლო შერჩევის შეცდომა და სტატისტიკური ანალიზის მეთოდოლოგია სადღაც შუაში იბეჭდება. მიღებული ქულების შეფასებების მართებულობის დასადასტურებლად საჭიროა მიეთითოს ნიმუშის ზომა, რომლის საფუძველზეც იქნა მიღებული ისინი, ნდობის ინტერვალის საზღვრები და მისი მნიშვნელოვნების დონე.

შემდეგი შენიშვნა

გამოყენებულია მასალები წიგნიდან Levin et al., სტატისტიკა მენეჯერებისთვის. - M.: Williams, 2004. - გვ. 448–462 წწ

ცენტრალური ლიმიტის თეორემააცხადებს, რომ საკმარისად დიდი ნიმუშის მოცულობის გათვალისწინებით, საშუალებების ნიმუშის განაწილება შეიძლება მიახლოებული იყოს ნორმალური განაწილებით. ეს ქონება არ არის დამოკიდებული მოსახლეობის განაწილების ტიპზე.

Ნდობის ინტერვალი(CI; ინგლისურად, ნდობის ინტერვალი - CI) მიღებული კვლევაში ნიმუშზე იძლევა კვლევის შედეგების სიზუსტის (ან გაურკვევლობის) საზომს, რათა გამოიტანოს დასკვნები ყველა ასეთი პაციენტის (ზოგადი პოპულაცია) პოპულაციის შესახებ. ). 95% CI-ის სწორი განმარტება შეიძლება ჩამოყალიბდეს შემდეგნაირად: ასეთი ინტერვალების 95% შეიცავს პოპულაციაში ნამდვილ მნიშვნელობას. ეს ინტერპრეტაცია გარკვეულწილად ნაკლებად ზუსტია: CI არის მნიშვნელობების დიაპაზონი, რომლის ფარგლებშიც შეგიძლიათ 95% დარწმუნებული იყოთ, რომ ის შეიცავს ნამდვილ მნიშვნელობას. CI გამოყენებისას აქცენტი კეთდება რაოდენობრივი ეფექტის განსაზღვრაზე, P მნიშვნელობის საპირისპიროდ, რომელიც მიიღება სტატისტიკური მნიშვნელოვნების ტესტირების შედეგად. P მნიშვნელობა არ აფასებს არცერთ თანხას, არამედ ემსახურება როგორც მტკიცებულების სიძლიერის საზომს "არაეფექტის" ნულოვანი ჰიპოთეზის წინააღმდეგ. P-ის მნიშვნელობა თავისთავად არაფერს გვეუბნება სხვაობის სიდიდეზე, ან თუნდაც მის მიმართულებაზე. ამიტომ, P-ის დამოუკიდებელი მნიშვნელობები აბსოლუტურად არაინფორმაციულია სტატიებში ან აბსტრაქტებში. ამის საპირისპიროდ, CI მიუთითებს როგორც უშუალო ინტერესის ეფექტის რაოდენობაზე, როგორიცაა მკურნალობის სარგებლიანობა, ასევე მტკიცებულების სიძლიერეს. ამიტომ, DI პირდაპირ კავშირშია DM-ის პრაქტიკასთან.

სტატისტიკური ანალიზის შეფასების მიდგომა, ილუსტრირებული CI-ით, მიზნად ისახავს გაზომოს ინტერესის ეფექტის სიდიდე (დიაგნოსტიკური ტესტის მგრძნობელობა, პროგნოზირებული შემთხვევა, ფარდობითი რისკის შემცირება მკურნალობასთან ერთად და ა.შ.), ასევე გაურკვევლობის გაზომვას ეფექტი. ყველაზე ხშირად, CI არის მნიშვნელობების დიაპაზონი შეფასების ორივე მხარეს, რომელზედაც ჭეშმარიტი მნიშვნელობა სავარაუდოდ დევს და თქვენ შეგიძლიათ იყოთ 95% დარწმუნებული ამაში. 95%-იანი ალბათობის გამოყენების კონვენცია თვითნებურია, ისევე როგორც P-ის მნიშვნელობა<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI ემყარება იდეას, რომ ერთი და იგივე კვლევა, რომელიც ჩატარდა პაციენტების სხვადასხვა კომპლექტზე, არ გამოიღებს იდენტურ შედეგებს, მაგრამ მათი შედეგები განაწილდება ჭეშმარიტი, მაგრამ უცნობი მნიშვნელობის გარშემო. სხვა სიტყვებით რომ ვთქვათ, CI აღწერს ამას, როგორც "ნიმუშზე დამოკიდებული ცვალებადობა". CI არ ასახავს დამატებით გაურკვევლობას სხვა მიზეზების გამო; კერძოდ, ის არ მოიცავს პაციენტების შერჩევითი დაკარგვის გავლენას თვალყურისდევნებაზე, ცუდი შესაბამისობის ან შედეგის არაზუსტი გაზომვის, დაბრმავების ნაკლებობას და ა.შ. ამრიგად, CI ყოველთვის არ აფასებს გაურკვევლობის მთლიან რაოდენობას.

ნდობის ინტერვალის გაანგარიშება

ცხრილი A1.1. სტანდარტული შეცდომები და სანდო ინტერვალები ზოგიერთი კლინიკური გაზომვისთვის

როგორც წესი, CI გამოითვლება რაოდენობრივი საზომის დაკვირვების შეფასებიდან, როგორიცაა განსხვავება (d) ორ პროპორციას შორის და სტანდარტული შეცდომა (SE) ამ სხვაობის შეფასებაში. ამგვარად მიღებული მიახლოებითი 95% CI არის d ± 1.96 SE. ფორმულა იცვლება შედეგის ღონისძიების ხასიათისა და CI-ის დაფარვის მიხედვით. მაგალითად, უჯრედული ყივანახველას ვაქცინის რანდომიზებულ, პლაცებოზე კონტროლირებად კვლევაში ყივანახველა განუვითარდა 72 ახალშობილს 1670 (4.3%), რომლებმაც მიიღეს ვაქცინა და 240 1665-დან (14.4%) საკონტროლო ჯგუფში. პროცენტული სხვაობა, რომელიც ცნობილია როგორც აბსოლუტური რისკის შემცირება, არის 10.1%. ამ სხვაობის SE არის 0,99%. შესაბამისად, 95% CI არის 10.1% + 1.96 x 0.99%, ე.ი. 8.2-დან 12.0-მდე.

განსხვავებული ფილოსოფიური მიდგომების მიუხედავად, CI და სტატისტიკური მნიშვნელობის ტესტები მჭიდრო კავშირშია მათემატიკურად.

ამრიგად, P-ის მნიშვნელობა არის "მნიშვნელოვანი", ე.ი. რ<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

შეფასების გაურკვევლობა (უზუსტობა), გამოხატული CI-ში, დიდწილად დაკავშირებულია ნიმუშის ზომის კვადრატულ ფესვთან. მცირე ნიმუშები იძლევა ნაკლებ ინფორმაციას, ვიდრე დიდი ნიმუშები, ხოლო CI-ები შესაბამისად უფრო ფართოა პატარა ნიმუშებში. მაგალითად, სტატიაში, რომელიც ადარებს სამი ტესტის შესრულებას, რომელიც გამოიყენება Helicobacter pylori ინფექციის დიაგნოსტირებისთვის, იტყობინება შარდოვანას სუნთქვის ტესტის მგრძნობელობა 95.8% (95% CI 75-100). მიუხედავად იმისა, რომ მაჩვენებელი 95.8% შთამბეჭდავად გამოიყურება, 24 ზრდასრული H. pylori პაციენტის შერჩევის მცირე ზომა ნიშნავს, რომ არსებობს მნიშვნელოვანი გაურკვევლობა ამ შეფასებაში, როგორც ნაჩვენებია ფართო CI-ით. მართლაც, 75%-იანი ქვედა ზღვარი გაცილებით დაბალია, ვიდრე 95.8%-იანი შეფასება. თუ იგივე მგრძნობელობა დაფიქსირდა 240 ადამიანის ნიმუშში, მაშინ 95% CI იქნება 92.5-98.0, რაც უფრო მეტ გარანტიას იძლევა, რომ ტესტი ძალიან მგრძნობიარეა.

რანდომიზებულ კონტროლირებად კვლევებში (RCTs), არამნიშვნელოვანი შედეგები (ანუ ის P > 0.05) განსაკუთრებით მგრძნობიარეა არასწორი ინტერპრეტაციისთვის. CI განსაკუთრებით სასარგებლოა აქ, რადგან ის მიუთითებს, რამდენად თავსებადია შედეგები კლინიკურად სასარგებლო ნამდვილ ეფექტთან. მაგალითად, RCT-ში, რომელიც ადარებს ნაკერს და მსხვილ ნაწლავში ძირითად ანასტომოზს, ჭრილობის ინფექცია განვითარდა პაციენტების 10,9% და 13,5% შესაბამისად (P = 0,30). ამ სხვაობის 95% CI არის 2.6% (-2-დან +8-მდე). ამ კვლევაშიც კი, რომელიც მოიცავდა 652 პაციენტს, სავარაუდოა, რომ არსებობს მცირე განსხვავება ინფექციების სიხშირეში ორი პროცედურის შედეგად. რაც უფრო მცირეა კვლევა, მით მეტია გაურკვევლობა. სუნგმა და სხვ. ჩაატარა RCT, რომელიც ადარებდა ოქტრეოტიდის ინფუზიას გადაუდებელ სკლეროთერაპიას მწვავე ვარიკოზული სისხლდენის დროს 100 პაციენტში. ოქტრეოტიდის ჯგუფში სისხლდენის შეჩერების მაჩვენებელი იყო 84%; სკლეროთერაპიის ჯგუფში - 90%, რაც იძლევა P = 0,56. გაითვალისწინეთ, რომ მუდმივი სისხლდენის სიხშირე მსგავსია ჭრილობის ინფექციის მაჩვენებლებისა, რაც აღნიშნულ კვლევაში იყო. თუმცა, ამ შემთხვევაში, ინტერვენციებში სხვაობის 95% CI არის 6% (-7-დან +19-მდე). ეს დიაპაზონი საკმაოდ ფართოა 5%-იან განსხვავებასთან შედარებით, რომელიც კლინიკური ინტერესი იქნება. ცხადია, რომ კვლევა არ გამორიცხავს ეფექტურობაში მნიშვნელოვან განსხვავებას. ამიტომ ავტორთა დასკვნა „ოქტრეოტიდის ინფუზია და სკლეროთერაპია თანაბრად ეფექტურია ვარიკოზული სისხლდენის სამკურნალოდ“ ნამდვილად არ არის მართებული. ასეთ შემთხვევებში, როდესაც 95% CI აბსოლუტური რისკის შემცირებისთვის (ARR) მოიცავს ნულს, როგორც აქ, CI NNT-ისთვის (რაოდენობა საჭიროა სამკურნალოდ) საკმაოდ რთულია ინტერპრეტაცია. NLP და მისი CI მიიღება ACP-ის რეციპროკალებიდან (მათი გამრავლება 100-ზე, თუ ეს მნიშვნელობები მოცემულია პროცენტებში). აქ მივიღებთ NPP = 100: 6 = 16.6 95% CI -14.3-დან 5.3-მდე. როგორც ჩანს ცხრილის „დ“ სქოლიოდან. A1.1, ეს CI მოიცავს NTPP-ის მნიშვნელობებს 5.3-დან უსასრულობამდე და NTLP 14.3-დან უსასრულობამდე.

CI-ები შეიძლება აშენდეს ყველაზე ხშირად გამოყენებული სტატისტიკური შეფასებებისთვის ან შედარებისთვის. RCT-ებისთვის ის მოიცავს განსხვავებას საშუალო პროპორციებს, ფარდობით რისკებს, შანსების კოეფიციენტებსა და NRR-ებს შორის. ანალოგიურად, CI-ების მიღება შესაძლებელია ყველა ძირითადი შეფასებისთვის, რომლებიც გაკეთებულია დიაგნოსტიკური ტესტის სიზუსტის კვლევებში - მგრძნობელობა, სპეციფიკა, დადებითი პროგნოზირებადი მნიშვნელობა (ყველა მათგანი მარტივი პროპორციებია) და ალბათობის კოეფიციენტები - შეფასებები, რომლებიც მიღებულია მეტაანალიზში და შედარება-კონტროლში. კვლევები. პერსონალური კომპიუტერის პროგრამა, რომელიც მოიცავს DI-ს ამ გამოყენებას, ხელმისაწვდომია Statistics with Confidence-ის მეორე გამოცემასთან ერთად. პროპორციებისთვის CI-ების გამოსათვლელი მაკრო თავისუფლად არის ხელმისაწვდომი Excel-ისთვის და სტატისტიკური პროგრამებისთვის SPSS და Minitab მისამართზე http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

მკურნალობის ეფექტის მრავალჯერადი შეფასება

მიუხედავად იმისა, რომ CI-ების მშენებლობა სასურველია კვლევის პირველადი შედეგებისთვის, ისინი არ არის საჭირო ყველა შედეგისთვის. CI ეხება კლინიკურად მნიშვნელოვან შედარებებს. მაგალითად, ორი ჯგუფის შედარებისას, სწორი CI არის ის, რომელიც აგებულია ჯგუფებს შორის სხვაობისთვის, როგორც ნაჩვენებია ზემოთ მოცემულ მაგალითებში, და არა CI, რომელიც შეიძლება აშენდეს თითოეულ ჯგუფში შეფასებისთვის. არა მხოლოდ უსარგებლოა თითოეულ ჯგუფში ქულების ცალკე CI-ების მიცემა, ეს პრეზენტაცია შეიძლება იყოს შეცდომაში შემყვანი. ანალოგიურად, სწორი მიდგომა სხვადასხვა ქვეჯგუფში მკურნალობის ეფექტურობის შედარებისას არის ორი (ან მეტი) ქვეჯგუფის პირდაპირ შედარება. არასწორია ვივარაუდოთ, რომ მკურნალობა ეფექტურია მხოლოდ ერთ ქვეჯგუფში, თუ მისი CI გამორიცხავს მნიშვნელობას, რომელიც არ შეესაბამება ეფექტს, ხოლო სხვები არა. CI-ები ასევე სასარგებლოა მრავალი ქვეჯგუფის შედეგების შედარებისას. ნახ. A1.1 აჩვენებს ეკლამფსიის შედარებით რისკს პრეეკლამფსიით დაავადებულ ქალებში ქალთა ქვეჯგუფებში მაგნიუმის სულფატის პლაცებო კონტროლირებადი RCT-დან.

ბრინჯი. A1.2. ტყის გრაფიკი აჩვენებს მსხვილფეხა რქოსანი როტავირუსის ვაქცინის 11 რანდომიზებული კლინიკური კვლევის შედეგებს დიარეის პროფილაქტიკისთვის პლაცებოსთან შედარებით. დიარეის ფარდობითი რისკის შესაფასებლად გამოყენებული იყო 95% ნდობის ინტერვალი. შავი კვადრატის ზომა ინფორმაციის მოცულობის პროპორციულია. გარდა ამისა, ნაჩვენებია მკურნალობის ეფექტურობის შემაჯამებელი შეფასება და 95% ნდობის ინტერვალი (მითითებულია ალმასით). მეტა-ანალიზმა გამოიყენა შემთხვევითი ეფექტების მოდელი, რომელიც აღემატება ზოგიერთ წინასწარ დადგენილ მოდელს; მაგალითად, ეს შეიძლება იყოს ზომა, რომელიც გამოიყენება ნიმუშის ზომის გამოსათვლელად. უფრო მკაცრი კრიტერიუმის მიხედვით, CI-ების მთელმა დიაპაზონმა უნდა აჩვენოს სარგებელი, რომელიც აღემატება წინასწარ განსაზღვრულ მინიმუმს.

ჩვენ უკვე განვიხილეთ სტატისტიკური მნიშვნელობის არარსებობის მცდარობა, როგორც მითითება იმისა, რომ ორი მკურნალობა თანაბრად ეფექტურია. თანაბრად მნიშვნელოვანია, რომ არ გავაიგივოთ სტატისტიკური მნიშვნელობა კლინიკურ მნიშვნელობასთან. კლინიკური მნიშვნელობა შეიძლება ვივარაუდოთ, როდესაც შედეგი არის სტატისტიკურად მნიშვნელოვანი და მკურნალობის პასუხის სიდიდე

კვლევებმა შეიძლება აჩვენოს, არის თუ არა შედეგები სტატისტიკურად მნიშვნელოვანი და რომელია კლინიკურად მნიშვნელოვანი და რომელი არა. ნახ. A1.2 აჩვენებს ოთხი ცდის შედეგებს, რომლებისთვისაც მთელი CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

ამ სტატიიდან თქვენ შეიტყობთ:

    Რა ნდობის ინტერვალი?

    რა აზრი აქვს 3 სიგმას წესები?

    როგორ შეიძლება ამ ცოდნის პრაქტიკაში გამოყენება?

დღესდღეობით, ინფორმაციის სიმრავლის გამო, რომელიც დაკავშირებულია პროდუქციის დიდ ასორტიმენტთან, გაყიდვების მიმართულებებთან, თანამშრომლებთან, საქმიანობასთან და ა.შ. მთავარის არჩევა რთულია, რომლის მართვა, უპირველეს ყოვლისა, ღირს ყურადღების მიქცევა და ძალისხმევა. განმარტება ნდობის ინტერვალიდა მისი რეალური ღირებულებების საზღვრებს გასვლის ანალიზი - ტექნიკა, რომელიც დაგეხმარებათ სიტუაციების ამოცნობაში, ტენდენციებზე გავლენის მოხდენა.შეძლებთ პოზიტიური ფაქტორების განვითარებას და უარყოფითის გავლენის შემცირებას. ეს ტექნოლოგია გამოიყენება ბევრ ცნობილ მსოფლიო კომპანიაში.

არსებობს ე.წ გაფრთხილებები", რომელიც აცნობეთ მენეჯერებსმიუთითებს, რომ შემდეგი მნიშვნელობა გარკვეული მიმართულებით გასცდა ნდობის ინტერვალი. Რას ნიშნავს ეს? ეს არის სიგნალი იმისა, რომ მოხდა რაიმე არასტანდარტული მოვლენა, რამაც შესაძლოა შეცვალოს არსებული ტენდენცია ამ მიმართულებით. ეს არის სიგნალირომ დასალაგებლადსიტუაციაში და იმის გაგება, თუ რა მოახდინა მასზე გავლენა.

მაგალითად, განიხილეთ რამდენიმე სიტუაცია. ჩვენ გამოვთვალეთ გაყიდვების პროგნოზი 2011 წლის 100 საქონლის საპროგნოზო საზღვრებით თვეების მიხედვით და რეალური გაყიდვები მარტში:

  1. „მზესუმზირის ზეთისთვის“ მათ პროგნოზის ზედა ზღვარი გაარღვიეს და ნდობის ინტერვალში არ ჩავარდნენ.
  2. „მშრალი საფუარისთვის“ გასცდა პროგნოზის ქვედა ზღვარს.
  3. "შვრიის ფაფაზე" ზედა ზღვარი გაარღვია.

დანარჩენ საქონელზე ფაქტობრივი გაყიდვები იყო განსაზღვრულ საპროგნოზო საზღვრებში. იმათ. მათი გაყიდვები მოლოდინს შეესაბამება. ასე რომ, ჩვენ გამოვავლინეთ 3 პროდუქტი, რომელიც გასცდა საზღვრებს და დავიწყეთ იმის გარკვევა, თუ რა გავლენა მოახდინა საზღვრებს მიღმა გასვლაზე:

  1. მზესუმზირის ზეთით შევედით ახალ სავაჭრო ქსელში, რამაც მოგვცა გაყიდვების დამატებითი მოცულობა, რამაც განაპირობა ზედა ლიმიტის გასვლა. ამ პროდუქტისთვის, ღირს პროგნოზის გადაანგარიშება წლის ბოლომდე, ამ ჯაჭვში გაყიდვების პროგნოზის გათვალისწინებით.
  2. მშრალი საფუარისთვის მანქანა საბაჟოზე გაიჭედა და 5 დღეში დეფიციტი იყო, რამაც გაყიდვების შემცირებაზე და ქვედა საზღვრებს გასცდა. შეიძლება ღირდეს იმის გარკვევა, თუ რამ გამოიწვია მიზეზი და შეეცადეთ არ განმეორდეს ეს სიტუაცია.
  3. Oatmeal-ისთვის დაიწყო გაყიდვების აქცია, რამაც გამოიწვია გაყიდვების მნიშვნელოვანი ზრდა და გამოიწვია პროგნოზის გადაჭარბება.

ჩვენ გამოვყავით 3 ფაქტორი, რომელმაც გავლენა მოახდინა პროგნოზის გადაჭარბებაზე. ისინი შეიძლება კიდევ ბევრი იყოს ცხოვრებაში. პროგნოზირებისა და დაგეგმვის სიზუსტის გასაუმჯობესებლად, ფაქტორები, რომლებიც განაპირობებს იმას, რომ რეალური გაყიდვები შეიძლება სცდება პროგნოზს, ღირს ცალკე გამოვყოთ და ავაშენოთ პროგნოზები და გეგმები მათთვის. და შემდეგ გაითვალისწინეთ მათი გავლენა გაყიდვების მთავარ პროგნოზზე. თქვენ ასევე შეგიძლიათ რეგულარულად შეაფასოთ ამ ფაქტორების გავლენა და შეცვალოთ სიტუაცია უკეთესობისკენ უარყოფითი ფაქტორების გავლენის შემცირებით და პოზიტიური ფაქტორების გავლენის გაზრდით.

ნდობის ინტერვალით ჩვენ შეგვიძლია:

  1. მონიშნეთ მიმართულებები, რომლებზეც ყურადღების მიქცევა ღირს, რადგან ამ ადგილებში მოხდა მოვლენები, რამაც შეიძლება გავლენა მოახდინოს ტენდენციის ცვლილება.
  2. ფაქტორების განსაზღვრარაც რეალურად ქმნის განსხვავებას.
  3. Მიიღოს შეწონილი გადაწყვეტილება(მაგალითად, შესყიდვების შესახებ, დაგეგმვისას და ა.შ.).

ახლა მოდით შევხედოთ რა არის ნდობის ინტერვალი და როგორ გამოვთვალოთ იგი Excel-ში მაგალითის გამოყენებით.

რა არის ნდობის ინტერვალი?

ნდობის ინტერვალი არის საპროგნოზო საზღვრები (ზედა და ქვედა), რომლის ფარგლებშიც მოცემული ალბათობით (სიგმა)მიიღეთ რეალური ღირებულებები.

იმათ. ჩვენ ვიანგარიშებთ პროგნოზს - ეს არის ჩვენი მთავარი ნიშნული, მაგრამ გვესმის, რომ რეალური მნიშვნელობები ნაკლებად სავარაუდოა, რომ 100% უდრის ჩვენს პროგნოზს. და ჩნდება კითხვა რა ზომითშეიძლება მიიღოს რეალური მნიშვნელობები, თუ მიმდინარე ტენდენცია გაგრძელდება? და ეს კითხვა დაგვეხმარება პასუხის გაცემაში ნდობის ინტერვალის გაანგარიშება, ე.ი. - პროგნოზის ზედა და ქვედა საზღვრები.

რა არის მოცემული ალბათობის სიგმა?

გაანგარიშებისასნდობის ინტერვალი შეგვიძლია დააყენეთ ალბათობა ჰიტებიფაქტობრივი ღირებულებები მოცემული პროგნოზის საზღვრებში. Როგორ გავაკეთო ეს? ამისათვის ჩვენ ვაყენებთ სიგმის მნიშვნელობას და თუ სიგმა უდრის:

    3 სიგმა- მაშინ, ნდობის ინტერვალის შემდეგ ფაქტობრივ მნიშვნელობაზე დაჭერის ალბათობა იქნება 99.7%, ანუ 300-დან 1-მდე, ან არის 0.3% ალბათობა საზღვრებს მიღმა.

    2 სიგმა- მაშინ, საზღვრებში მომდევნო მნიშვნელობაზე მოხვედრის ალბათობა არის ≈ 95.5%, ე.ი. შანსები დაახლოებით 20-დან 1-მდეა, ან საზღვრებს გარეთ გასვლის 4.5%-იანი შანსია.

    1 სიგმა- მაშინ, ალბათობა არის ≈ 68,3%, ე.ი. შანსები არის დაახლოებით 2-დან 1-მდე, ან არის 31.7% შანსი იმისა, რომ შემდეგი მნიშვნელობა ნდობის ინტერვალის მიღმა მოხვდება.

ჩამოვაყალიბეთ 3 სიგმას წესი,რომელიც ამბობს რომ დარტყმის ალბათობაკიდევ ერთი შემთხვევითი მნიშვნელობა ნდობის ინტერვალშიმოცემული ღირებულებით სამი სიგმა არის 99.7%.

დიდმა რუსმა მათემატიკოსმა ჩებიშევმა დაამტკიცა თეორემა, რომ არსებობს 10% შანსი, რომ გასცდეს პროგნოზის საზღვრებს სამი სიგმის მოცემული მნიშვნელობით. იმათ. 3 სიგმას ნდობის ინტერვალში მოხვედრის ალბათობა იქნება მინიმუმ 90%, ხოლო პროგნოზისა და მისი საზღვრების „თვალით“ გამოთვლის მცდელობა სავსეა ბევრად უფრო მნიშვნელოვანი შეცდომებით.

როგორ გამოვთვალოთ დამოუკიდებლად ნდობის ინტერვალი Excel-ში?

მოდით განვიხილოთ Excel-ში ნდობის ინტერვალის გაანგარიშება (ანუ პროგნოზის ზედა და ქვედა საზღვრები) მაგალითის გამოყენებით. გვაქვს დროის სერია - გაყიდვები თვეების მიხედვით 5 წლის განმავლობაში. Იხილეთ თანდართული ფაილი.

პროგნოზის საზღვრების გამოსათვლელად, ჩვენ ვიანგარიშებთ:

  1. Გაყიდვების პროგნოზი().
  2. სიგმა - სტანდარტული გადახრასაპროგნოზო მოდელები რეალური მნიშვნელობებიდან.
  3. სამი სიგმა.
  4. Ნდობის ინტერვალი.

1. გაყიდვების პროგნოზი.

=(RC[-14] (მონაცემები დროის სერიებში)-RC[-1] (მოდელის ღირებულება))^2 (კვადრატში)


3. შეაჯამეთ ყოველი თვის გადახრის მნიშვნელობები მე-8 ეტაპიდან Sum((Xi-Ximod)^2), ე.ი. შევაჯამოთ იანვარი, თებერვალი... ყოველი წლისთვის.

ამისათვის გამოიყენეთ ფორმულა =SUMIF()

SUMIF (მაივი ციკლის შიგნით პერიოდების რიცხვით (თვეებისთვის 1-დან 12-მდე); მითითება ციკლში პერიოდის რაოდენობაზე; მითითება მასივზე საწყის მონაცემებსა და მნიშვნელობებს შორის სხვაობის კვადრატებით პერიოდები)


4. გამოთვალეთ სტანდარტული გადახრა ციკლის თითოეული პერიოდისთვის 1-დან 12-მდე (სტადია 10 თანდართულ ფაილში).

ამისათვის, მე-9 ეტაპზე გამოთვლილი მნიშვნელობიდან გამოვყავით ფესვი და ვყოფთ ამ ციკლის პერიოდების რაოდენობაზე მინუს 1 = ROOT((ჯამ(Xi-Ximod)^2/(n-1))

მოდით გამოვიყენოთ ფორმულები Excel =ROOT(R8 (მინიშნება (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (მინიშნება მასივზე ციკლის ნომრებით); O8 (მინიშნება კონკრეტული ციკლის ნომერზე, რომელსაც განვიხილავთ მასივში))-1))

Excel ფორმულის გამოყენებით = COUNTIFჩვენ ვითვლით რიცხვს n


პროგნოზის მოდელიდან რეალური მონაცემების სტანდარტული გადახრის გამოთვლით, ჩვენ მივიღეთ სიგმას მნიშვნელობა ყოველი თვისთვის - ეტაპი 10. თანდართულ ფაილში.

3. გამოთვალეთ 3 სიგმა.

მე-11 ეტაპზე ჩვენ დავაყენეთ სიგმის რაოდენობა - ჩვენს მაგალითში "3" (სტადია 11 თანდართულ ფაილში):

ასევე პრაქტიკული სიგმას მნიშვნელობები:

1.64 სიგმა - ლიმიტის გადალახვის 10% შანსი (1 შანსი 10-ში);

1,96 სიგმა - საზღვრებს გარეთ გასვლის 5% შანსი (1 შანსი 20-ში);

2.6 სიგმა - 1% შანსი საზღვრებს გარეთ გასვლის (1 100 შანსი).

5) ჩვენ ვიანგარიშებთ სამ სიგმას, ამისათვის ჩვენ ვამრავლებთ "სიგმას" მნიშვნელობებს ყოველი თვისთვის "3-ზე".

3. განსაზღვრეთ ნდობის ინტერვალი.

  1. პროგნოზის ზედა ზღვარი- გაყიდვების პროგნოზი ზრდისა და სეზონურობის გათვალისწინებით + (პლუს) 3 სიგმა;
  2. ქვედა პროგნოზის ზღვარი- გაყიდვების პროგნოზი ზრდისა და სეზონურობის გათვალისწინებით - (მინუს) 3 სიგმა;

ხანგრძლივი პერიოდის განმავლობაში ნდობის ინტერვალის გამოთვლის მოხერხებულობისთვის (იხ. თანდართული ფაილი), ვიყენებთ Excel-ის ფორმულას =Y8+VLOOKUP(W8;$U$8:$V$19;2;0), სად

Y8- გაყიდვების პროგნოზი;

W8- თვის რიცხვი, რომლისთვისაც ავიღებთ 3 სიგმის მნიშვნელობას;

იმათ. პროგნოზის ზედა ზღვარი= "გაყიდვების პროგნოზი" + "3 სიგმა" (მაგალითად, VLOOKUP (თვის ნომერი; ცხრილი 3 სიგმას მნიშვნელობებით; სვეტი, საიდანაც ამოვიღებთ სიგმას მნიშვნელობას, რომელიც უდრის შესაბამის მწკრივში თვის რიცხვს; 0)).

ქვედა პროგნოზის ზღვარი= "გაყიდვების პროგნოზი" მინუს "3 სიგმა".

ასე რომ, ჩვენ გამოვთვალეთ ნდობის ინტერვალი Excel-ში.

ახლა ჩვენ გვაქვს პროგნოზი და დიაპაზონი საზღვრებით, რომლის ფარგლებშიც რეალური მნიშვნელობები დაეცემა მოცემული ალბათობის სიგმას.

ამ სტატიაში ჩვენ გადავხედეთ რა არის სიგმა და სამი სიგმის წესი, როგორ განვსაზღვროთ ნდობის ინტერვალი და რისთვის შეგიძლიათ გამოიყენოთ ეს ტექნიკა პრაქტიკაში.

ზუსტი პროგნოზები და წარმატება თქვენთვის!

Როგორ Forecast4AC PRO დაგეხმარებათნდობის ინტერვალის გაანგარიშებისას?:

    Forecast4AC PRO ავტომატურად გამოთვლის პროგნოზის ზედა ან ქვედა ლიმიტებს ერთდროულად 1000-ზე მეტი დროის სერიებისთვის;

    პროგნოზის საზღვრების ანალიზის უნარი პროგნოზთან, ტრენდთან და რეალურ გაყიდვებთან შედარებით სქემაზე ერთი კლავიშის დაჭერით;

Forcast4AC PRO პროგრამაში შესაძლებელია სიგმას მნიშვნელობის დაყენება 1-დან 3-მდე.

Შემოგვიერთდი!

ჩამოტვირთეთ უფასო პროგნოზირების და ბიზნეს დაზვერვის აპლიკაციები:


  • Novo Forecast Lite- ავტომატური პროგნოზის გაანგარიშება in excel.
  • 4 ანალიტიკა- ABC-XYZ ანალიზიდა ემისიების ანალიზი Excel.
  • Qlik Senseსამუშაო მაგიდა და Qlik ViewPersonal Edition - BI სისტემები მონაცემთა ანალიზისა და ვიზუალიზაციისთვის.

შეამოწმეთ ფასიანი გადაწყვეტილებების მახასიათებლები:

  • Novo Forecast PRO- პროგნოზირება Excel-ში მონაცემთა დიდი მასივებისთვის.