გამოთვალეთ ნდობის ინტერვალი. Microsoft Excel-ში ნდობის ინტერვალის გამოთვლა

"კატრენ-სტილი" აგრძელებს კონსტანტინე კრავჩიკის ციკლის გამოქვეყნებას სამედიცინო სტატისტიკაზე. ორ წინა სტატიაში ავტორი შეეხო ისეთი ცნებების ახსნას, როგორიცაა და.

კონსტანტინე კრავჩიკი

მათემატიკოს-ანალიტიკოსი. სპეციალისტი მედიცინასა და ჰუმანიტარულ მეცნიერებებში სტატისტიკური კვლევების დარგში

ქალაქი მოსკოვი

ძალიან ხშირად კლინიკურ კვლევებზე სტატიებში შეგიძლიათ იპოვოთ იდუმალი ფრაზა: "ნდობის ინტერვალი" (95% CI ან 95% CI - ნდობის ინტერვალი). მაგალითად, სტატიაში შეიძლება ითქვას: „სტუდენტის t-ტესტი გამოიყენებოდა განსხვავებების მნიშვნელოვნების შესაფასებლად, 95%-იანი ნდობის ინტერვალით გამოთვლილი“.

რა არის "95% სანდო ინტერვალის" მნიშვნელობა და რატომ გამოვთვალოთ იგი?

რა არის ნდობის ინტერვალი? - ეს არის დიაპაზონი, რომელშიც მოდის ნამდვილი საშუალო მნიშვნელობები პოპულაციაში. და რა, არის "არაჭეშმარიტი" საშუალო მაჩვენებლები? გარკვეული გაგებით, დიახ, აკეთებენ. ჩვენ განვმარტეთ, რომ შეუძლებელია მთელი პოპულაციის ინტერესის პარამეტრის გაზომვა, ამიტომ მკვლევარები კმაყოფილნი არიან შეზღუდული ნიმუშით. ამ ნიმუშში (მაგალითად, სხეულის წონის მიხედვით) არის ერთი საშუალო მნიშვნელობა (გარკვეული წონა), რომლითაც ჩვენ ვიმსჯელებთ საშუალო მნიშვნელობაზე მთელ ზოგად პოპულაციაში. თუმცა, ნაკლებად სავარაუდოა, რომ ნიმუშის საშუალო წონა (განსაკუთრებით მცირე) ემთხვევა საერთო პოპულაციის საშუალო წონას. აქედან გამომდინარე, უფრო სწორია გამოვთვალოთ და გამოიყენოთ ზოგადი პოპულაციის საშუალო მნიშვნელობების დიაპაზონი.

მაგალითად, დავუშვათ, რომ ჰემოგლობინის 95% ნდობის ინტერვალი (95% CI) არის 110-დან 122 გ/ლ-მდე. ეს ნიშნავს, რომ 95 % ალბათობით, ჰემოგლობინის ნამდვილი საშუალო მნიშვნელობა ზოგად პოპულაციაში იქნება 110-დან 122 გ/ლ-მდე. სხვა სიტყვებით რომ ვთქვათ, ჩვენ არ ვიცით საშუალო ჰემოგლობინის საერთო პოპულაციაში, მაგრამ შეგვიძლია მივუთითოთ ამ მახასიათებლის მნიშვნელობების დიაპაზონი 95% ალბათობით.

ნდობის ინტერვალები განსაკუთრებით ეხება ჯგუფებს შორის საშუალო განსხვავებას, ან რასაც ეფექტის ზომას უწოდებენ.

დავუშვათ, ჩვენ შევადარეთ რკინის ორი პრეპარატის ეფექტურობა: ერთი, რომელიც დიდი ხანია ბაზარზეა და ერთი, რომელიც ახლახან დარეგისტრირდა. თერაპიის კურსის შემდეგ შეფასდა ჰემოგლობინის კონცენტრაცია პაციენტთა შესწავლილ ჯგუფებში და სტატისტიკურმა პროგრამამ გამოთვალა ჩვენთვის, რომ განსხვავება ორ ჯგუფს საშუალო მნიშვნელობებს შორის 95% ალბათობით არის დიაპაზონში. 1,72-დან 14,36 გ/ლ-მდე (ცხრილი 1).

ჩანართი 1. დამოუკიდებელი ნიმუშების კრიტერიუმი
(ჯგუფები შედარებულია ჰემოგლობინის დონის მიხედვით)

ეს უნდა იქნას განმარტებული შემდეგნაირად: ზოგადი პოპულაციის პაციენტების ნაწილში, რომლებიც იღებენ ახალ პრეპარატს, ჰემოგლობინი საშუალოდ უფრო მაღალი იქნება 1,72-14,36 გ/ლ-ით, ვიდრე მათში, ვინც იღებდა უკვე ცნობილ პრეპარატს.

სხვა სიტყვებით რომ ვთქვათ, ზოგად პოპულაციაში, 95% ალბათობის მქონე ჯგუფებში ჰემოგლობინის საშუალო მნიშვნელობების განსხვავება ამ საზღვრებშია. მკვლევარის გადასაწყვეტია, ეს ბევრია თუ ცოტა. ამ ყველაფრის აზრი ის არის, რომ ჩვენ ვმუშაობთ არა ერთი საშუალო მნიშვნელობით, არამედ მნიშვნელობების დიაპაზონით, შესაბამისად, უფრო საიმედოდ ვაფასებთ განსხვავებას პარამეტრებში ჯგუფებს შორის.

სტატისტიკურ პაკეტებში, მკვლევარის შეხედულებისამებრ, შეიძლება დამოუკიდებლად შეიზღუდოს ან გააფართოვოს ნდობის ინტერვალის საზღვრები. ნდობის ინტერვალის ალბათობების შემცირებით, ჩვენ ვიწროვებთ საშუალებების დიაპაზონს. მაგალითად, 90% CI-ზე, საშუალების დიაპაზონი (ან საშუალო განსხვავებები) უფრო ვიწრო იქნება, ვიდრე 95% CI-ზე.

პირიქით, ალბათობის გაზრდა 99%-მდე აფართოებს მნიშვნელობების დიაპაზონს. ჯგუფების შედარებისას, CI-ის ქვედა ზღვარმა შეიძლება გადალახოს ნულოვანი ნიშანი. მაგალითად, თუ ჩვენ გავაფართოვეთ ნდობის ინტერვალის საზღვრები 99 %-მდე, მაშინ ინტერვალის საზღვრები მერყეობდა –1-დან 16 გ/ლ-მდე. ეს ნიშნავს, რომ ზოგად პოპულაციაში არის ჯგუფები, რომელთა შორის სხვაობა საშუალოდ არის 0 (M=0).

ნდობის ინტერვალები შეიძლება გამოყენებულ იქნას სტატისტიკური ჰიპოთეზების შესამოწმებლად. თუ ნდობის ინტერვალი კვეთს ნულს, მაშინ ნულოვანი ჰიპოთეზა, რომელიც ვარაუდობს, რომ ჯგუფები არ განსხვავდებიან შესწავლილ პარამეტრში, მართალია. ზემოთ აღწერილია მაგალითი, როდესაც ჩვენ გავაფართოვეთ საზღვრები 99% -მდე. სადღაც ზოგადად მოსახლეობაში აღმოვაჩინეთ ჯგუფები, რომლებიც არანაირად არ განსხვავდებოდნენ.

ჰემოგლობინის სხვაობის 95% ნდობის ინტერვალი, (გ/ლ)


ფიგურა გვიჩვენებს ორ ჯგუფს შორის საშუალო ჰემოგლობინის სხვაობის 95% ნდობის ინტერვალის ხაზის სახით. ხაზი გადის ნულოვან ნიშნულს, შესაბამისად, არის განსხვავება ნულის ტოლი საშუალებებს შორის, რაც ადასტურებს ნულოვანი ჰიპოთეზას, რომ ჯგუფები არ განსხვავდებიან. ჯგუფებს შორის განსხვავება მერყეობს -2-დან 5 გ/ლ-მდე, რაც ნიშნავს, რომ ჰემოგლობინი შეიძლება შემცირდეს 2 გ/ლ-ით ან გაიზარდოს 5 გ/ლ-ით.

ნდობის ინტერვალი ძალიან მნიშვნელოვანი მაჩვენებელია. მისი წყალობით, თქვენ ხედავთ, ჯგუფებში განსხვავებები მართლაც იყო საშუალების სხვაობით გამოწვეული თუ დიდი ნიმუშის გამო, რადგან დიდი ნიმუშით განსხვავებების პოვნის შანსი უფრო დიდია, ვიდრე მცირეზე.

პრაქტიკაში, ეს შეიძლება ასე გამოიყურებოდეს. ჩვენ ავიღეთ 1000 ადამიანის ნიმუში, გავზომეთ ჰემოგლობინის დონე და აღმოვაჩინეთ, რომ საშუალებებში სხვაობის ნდობის ინტერვალი არის 1,2-დან 1,5 გ/ლ-მდე. სტატისტიკური მნიშვნელოვნების დონე ამ შემთხვევაში გვ

ჩვენ ვხედავთ, რომ ჰემოგლობინის კონცენტრაცია გაიზარდა, მაგრამ თითქმის შეუმჩნევლად, მაშასადამე, სტატისტიკური მნიშვნელობა სწორედ ნიმუშის ზომის გამო გამოჩნდა.

ნდობის ინტერვალები შეიძლება გამოითვალოს არა მხოლოდ საშუალო, არამედ პროპორციებისთვის (და რისკის კოეფიციენტებისთვის). მაგალითად, ჩვენ გვაინტერესებს იმ პაციენტების პროპორციების ნდობის ინტერვალი, რომლებმაც მიაღწიეს რემისიას განვითარებული პრეპარატის მიღებისას. დავუშვათ, რომ 95% CI პროპორციებისთვის, ანუ ასეთი პაციენტების პროპორციისთვის, არის 0.60-0.80 დიაპაზონში. ამრიგად, შეგვიძლია ვთქვათ, რომ ჩვენს წამალს თერაპიული ეფექტი აქვს შემთხვევების 60-დან 80%-მდე.

გონება არა მხოლოდ ცოდნაშია, არამედ ცოდნის პრაქტიკაში გამოყენების უნარშიც. (არისტოტელე)

ნდობის ინტერვალები

ზოგადი მიმოხილვა

პოპულაციისგან ნიმუშის აღებით, ჩვენ მივიღებთ ჩვენთვის საინტერესო პარამეტრის პუნქტურ შეფასებას და გამოვთვლით სტანდარტულ შეცდომას, რათა მივუთითოთ შეფასების სიზუსტე.

თუმცა, უმეტეს შემთხვევაში, სტანდარტული შეცდომა, როგორც ასეთი, მიუღებელია. ბევრად უფრო სასარგებლოა სიზუსტის ამ საზომის გაერთიანება პოპულაციის პარამეტრის ინტერვალის შეფასებასთან.

ეს შეიძლება გაკეთდეს ნიმუშის სტატისტიკის (პარამეტრი) თეორიული ალბათობის განაწილების ცოდნის გამოყენებით, რათა გამოვთვალოთ ნდობის ინტერვალი (CI - ნდობის ინტერვალი, CI - ნდობის ინტერვალი) პარამეტრზე.

ზოგადად, ნდობის ინტერვალი ავრცელებს შეფასებებს ორივე მიმართულებით სტანდარტული შეცდომის (მოცემული პარამეტრის) რამდენიმე ჯერადით; ორი მნიშვნელობა (ნდობის ლიმიტები), რომლებიც განსაზღვრავენ ინტერვალს, ჩვეულებრივ გამოყოფილია მძიმით და ჩასმულია ფრჩხილებში.

ნდობის ინტერვალი საშუალოსთვის

ნორმალური განაწილების გამოყენებით

ნიმუშის საშუალოს ნორმალური განაწილება აქვს, თუ ნიმუშის ზომა დიდია, ამიტომ ნორმალური განაწილების ცოდნა შეიძლება გამოყენებულ იქნას შერჩევის საშუალოდ განხილვისას.

კერძოდ, ნიმუშის საშუალო განაწილების 95% არის პოპულაციის საშუალო 1,96 სტანდარტული გადახრების (SD) ფარგლებში.

როდესაც ჩვენ გვაქვს მხოლოდ ერთი ნიმუში, ჩვენ ამას ვუწოდებთ საშუალო სტანდარტულ შეცდომას (SEM) და გამოვთვალოთ 95% ნდობის ინტერვალი საშუალოსთვის შემდეგნაირად:

თუ ეს ექსპერიმენტი რამდენჯერმე განმეორდება, ინტერვალი შეიცავს დროის 95%-ის ნამდვილ პოპულაციას.

ეს, როგორც წესი, არის ნდობის ინტერვალი, როგორიცაა მნიშვნელობების დიაპაზონი, რომლის ფარგლებშიც რეალური პოპულაციის საშუალო (ზოგადი საშუალო) არის 95% ნდობის დონე.

მიუხედავად იმისა, რომ ნდობის ინტერვალის ამგვარად ინტერპრეტაცია არ არის საკმაოდ მკაცრი (პოპულაციის საშუალო არის ფიქსირებული მნიშვნელობა და შესაბამისად არ შეიძლება ჰქონდეს მასთან დაკავშირებული ალბათობა), კონცეპტუალურად უფრო ადვილი გასაგებია.

გამოყენება t-განაწილება

თქვენ შეგიძლიათ გამოიყენოთ ნორმალური განაწილება, თუ იცით პოპულაციაში დისპერსიის მნიშვნელობა. ასევე, როდესაც შერჩევის ზომა მცირეა, შერჩევის საშუალო მაჩვენებელი მიჰყვება ნორმალურ განაწილებას, თუ პოპულაციის საფუძვლიანი მონაცემები ნორმალურად არის განაწილებული.

თუ პოპულაციის საფუძველში არსებული მონაცემები არ არის ნორმალურად განაწილებული და/ან ზოგადი ვარიაცია (პოპულაციის ვარიაცია) უცნობია, შერჩევის საშუალო ემორჩილება სტუდენტური t-განაწილება.

გამოთვალეთ 95% ნდობის ინტერვალი მოსახლეობის საშუალოზე შემდეგნაირად:

სად - პროცენტული წერტილი (პროცენტილი) t-სტუდენტური განაწილება (n-1) თავისუფლების ხარისხით, რაც იძლევა ორკუდიან ალბათობას 0,05.

ზოგადად, ის უზრუნველყოფს უფრო ფართო ინტერვალს, ვიდრე ნორმალური განაწილების გამოყენებისას, რადგან ითვალისწინებს დამატებით გაურკვევლობას, რომელიც შემოტანილია პოპულაციის სტანდარტული გადახრის შეფასებით და/ან შერჩევის მცირე ზომის გამო.

როდესაც ნიმუშის ზომა დიდია (100 ან მეტი რიგის), განსხვავება ორ განაწილებას შორის ( t-სტუდენტიდა ნორმალური) უმნიშვნელოა. თუმცა, ყოველთვის გამოიყენეთ t-განაწილება ნდობის ინტერვალების გაანგარიშებისას, მაშინაც კი, თუ ნიმუშის ზომა დიდია.

ჩვეულებრივ მოცემულია 95% CI. სხვა ნდობის ინტერვალები შეიძლება გამოითვალოს, როგორიცაა 99% CI საშუალოსთვის.

სტანდარტული შეცდომისა და ცხრილის მნიშვნელობის პროდუქტის ნაცვლად t-განაწილება, რომელიც შეესაბამება ორკუდიან ალბათობას 0,05, გაამრავლეთ იგი (სტანდარტული შეცდომა) მნიშვნელობით, რომელიც შეესაბამება ორკუდიან ალბათობას 0,01. ეს უფრო ფართო ნდობის ინტერვალია, ვიდრე 95%-ის შემთხვევაში, რადგან ის ასახავს გაზრდილ ნდობას, რომ ინტერვალი ნამდვილად მოიცავს მოსახლეობის საშუალო მნიშვნელობას.

ნდობის ინტერვალი პროპორციისთვის

პროპორციების შერჩევის განაწილებას აქვს ბინომიური განაწილება. თუმცა, თუ ნიმუშის ზომა გონივრულად დიდი, მაშინ პროპორციული ნიმუშის განაწილება დაახლოებით ნორმალურია საშუალოზე.

შეაფასეთ შერჩევის შეფარდებით p=r/n(სად - ინდივიდების რაოდენობა ნიმუშში ჩვენთვის საინტერესო მახასიათებლებით) და სტანდარტული შეცდომა შეფასებულია:

95%-იანი ნდობის ინტერვალი პროპორციისთვის შეფასებულია:

თუ ნიმუშის ზომა მცირეა (ჩვეულებრივ, როდესაც npან n(1-p)უფრო პატარა 5 ), მაშინ ბინომალური განაწილება უნდა იქნას გამოყენებული ზუსტი ნდობის ინტერვალების გამოსათვლელად.

გაითვალისწინეთ, რომ თუ გვგამოხატული პროცენტულად, მაშინ (1-p)შეცვალა (100p).

ნდობის ინტერვალების ინტერპრეტაცია

ნდობის ინტერვალის ინტერპრეტაციისას ჩვენ გვაინტერესებს შემდეგი კითხვები:

რამდენად ფართოა ნდობის ინტერვალი?

ფართო ნდობის ინტერვალი მიუთითებს, რომ შეფასება არაზუსტია; ვიწრო მიუთითებს კარგ შეფასებაზე.

ნდობის ინტერვალის სიგანე დამოკიდებულია სტანდარტული შეცდომის ზომაზე, რაც თავის მხრივ დამოკიდებულია ნიმუშის ზომაზე და მონაცემთა ცვალებადობის რიცხვითი ცვლადის განხილვისას, მიეცით უფრო ფართო ნდობის ინტერვალები, ვიდრე მცირე მონაცემთა დიდი ნაკრების კვლევები. ცვლადები.

მოიცავს თუ არა CI რაიმე განსაკუთრებული ინტერესის მნიშვნელობას?

შეგიძლიათ შეამოწმოთ არის თუ არა პოპულაციის პარამეტრის სავარაუდო მნიშვნელობა სანდო ინტერვალში. თუ კი, მაშინ შედეგები შეესაბამება ამ სავარაუდო მნიშვნელობას. თუ არა, მაშინ ნაკლებად სავარაუდოა (95% ნდობის ინტერვალისთვის, შანსი არის თითქმის 5%), რომ პარამეტრს ჰქონდეს ეს მნიშვნელობა.

დავუშვათ, გვაქვს დიდი რაოდენობით ნივთები ზოგიერთი მახასიათებლის ნორმალური განაწილებით (მაგალითად, იგივე ტიპის ბოსტნეულის სრული საწყობი, რომლის ზომა და წონა იცვლება). გსურთ იცოდეთ საქონლის მთელი პარტიის საშუალო მახასიათებლები, მაგრამ არც დრო გაქვთ და არც მიდრეკილება გაზომოთ და აწონოთ თითოეული ბოსტნეული. თქვენ გესმით, რომ ეს არ არის საჭირო. მაგრამ რამდენი ცალი დაგჭირდებათ შემთხვევითი შემოწმებისთვის?

სანამ ამ სიტუაციისთვის სასარგებლო ფორმულებს მოვიყვანთ, გავიხსენებთ აღნიშვნას.

პირველ რიგში, ჩვენ რომ გავზომოთ ბოსტნეულის მთელი საწყობი (ელემენტების ამ კომპლექტს ეწოდება საერთო პოპულაცია), მაშინ ჩვენთვის ხელმისაწვდომი მთელი სიზუსტით გვეცოდინება მთელი ჯგუფის წონის საშუალო მნიშვნელობა. მოდით ვუწოდოთ ამას საშუალო X იხ .გ en . - საერთო საშუალო. ჩვენ უკვე ვიცით, რა არის სრულად განსაზღვრული, თუ ცნობილია მისი საშუალო მნიშვნელობა და გადახრა . მართალია, ჯერჯერობით არც X საშუალო ვართ და არცჩვენ არ ვიცით საერთო მოსახლეობა. ჩვენ შეგვიძლია მხოლოდ აიღოთ ნიმუში, გავზომოთ ჩვენთვის საჭირო მნიშვნელობები და გამოვთვალოთ ამ ნიმუშისთვის როგორც საშუალო მნიშვნელობა X sr. ნიმუშში, ასევე სტანდარტული გადახრა S sb.

ცნობილია, რომ თუ ჩვენი საბაჟო შემოწმება შეიცავს ელემენტების დიდ რაოდენობას (ჩვეულებრივ n 30-ზე მეტია), და ისინი მიიღება მართლაც შემთხვევითი, შემდეგ ს საერთო მოსახლეობა თითქმის არ განსხვავდება ს..

გარდა ამისა, ნორმალური განაწილების შემთხვევაში, შეგვიძლია გამოვიყენოთ შემდეგი ფორმულები:

95% ალბათობით


99% ალბათობით



ზოგადად, ალბათობით Р (t)


კავშირი t სიდიდესა და P (t) ალბათობის მნიშვნელობას შორის, რომლითაც გვინდა ვიცოდეთ ნდობის ინტერვალი, შეიძლება ავიღოთ შემდეგი ცხრილიდან:


ამრიგად, ჩვენ დავადგინეთ, თუ რა დიაპაზონშია საშუალო მნიშვნელობა ზოგადი პოპულაციისთვის (მიცემული ალბათობით).

თუ არ გვექნება საკმარისად დიდი ნიმუში, ვერ ვიტყვით, რომ პოპულაციას აქვს s = S sel. გარდა ამისა, ამ შემთხვევაში პრობლემურია ნიმუშის სიახლოვე ნორმალურ განაწილებასთან. ამ შემთხვევაში, ასევე გამოიყენეთ S sb ამის ნაცვლად s ფორმულაში:




მაგრამ t-ის მნიშვნელობა ფიქსირებული ალბათობისთვის P(t) დამოკიდებული იქნება n ნიმუშში ელემენტების რაოდენობაზე. რაც უფრო დიდია n, მით უფრო ახლოს იქნება მიღებული ნდობის ინტერვალი (1) ფორმულით მოცემულ მნიშვნელობასთან. t მნიშვნელობები ამ შემთხვევაში აღებულია სხვა ცხრილიდან (სტუდენტის t-ტესტი), რომელსაც ქვემოთ გთავაზობთ:

სტუდენტის t-ტესტი მნიშვნელობები ალბათობისთვის 0.95 და 0.99


მაგალითი 3კომპანიის თანამშრომლებიდან შემთხვევითობის პრინციპით 30 ადამიანი შეირჩა. ნიმუშის მიხედვით, აღმოჩნდა, რომ საშუალო ხელფასი (თვეში) არის 30 ათასი რუბლი, საშუალო კვადრატული გადახრით 5 ათასი რუბლი. 0,99 ალბათობით განსაზღვრეთ საშუალო ხელფასი ფირმაში.

გადაწყვეტილება:პირობით, გვაქვს n = 30, X შდრ. =30000, S=5000, P=0.99. ნდობის ინტერვალის საპოვნელად ვიყენებთ სტუდენტის კრიტერიუმის შესაბამის ფორმულას. ცხრილის მიხედვით n \u003d 30 და P \u003d 0.99 ვპოულობთ t \u003d 2.756, შესაბამისად,


იმათ. სასურველი ნდობაინტერვალი 27484< Х ср.ген < 32516.

ასე რომ, 0,99 ალბათობით, შეიძლება ითქვას, რომ ინტერვალი (27484; 32516) შეიცავს საშუალო ხელფასს კომპანიაში.

ვიმედოვნებთ, რომ გამოიყენებთ ამ მეთოდს ყოველ ჯერზე ელცხრილის გარეშე. გამოთვლები შეიძლება განხორციელდეს ავტომატურად Excel-ში. Excel ფაილში ყოფნისას დააჭირეთ fx ღილაკს ზედა მენიუში. შემდეგ, ფუნქციებს შორის აირჩიეთ ტიპი "statistical", ხოლო შემოთავაზებული სიიდან ველში - STEUDRASP. შემდეგ, მოთხოვნაზე, კურსორის განთავსებით "ალბათობის" ველში, ჩაწერეთ ორმხრივი ალბათობის მნიშვნელობა (ანუ ჩვენს შემთხვევაში, 0,95 ალბათობის ნაცვლად, თქვენ უნდა აკრიფოთ ალბათობა 0,05). როგორც ჩანს, ელცხრილი ისეა შექმნილი, რომ შედეგი პასუხობს კითხვას, რამდენად სავარაუდოა, რომ ჩვენ შეიძლება ვცდებოდეთ. ანალოგიურად, ველში "თავისუფლების ხარისხი" შეიყვანეთ მნიშვნელობა (n-1) თქვენი ნიმუშისთვის.

სტატისტიკური ამოცანების გადაჭრის ერთ-ერთი მეთოდია ნდობის ინტერვალის გამოთვლა. იგი გამოიყენება, როგორც სასურველი ალტერნატივა წერტილის შეფასებისთვის, როდესაც ნიმუშის ზომა მცირეა. უნდა აღინიშნოს, რომ ნდობის ინტერვალის გამოთვლის პროცესი საკმაოდ რთულია. მაგრამ Excel პროგრამის ინსტრუმენტები საშუალებას გაძლევთ გარკვეულწილად გაამარტივოთ იგი. მოდით გავარკვიოთ, როგორ კეთდება ეს პრაქტიკაში.

ეს მეთოდი გამოიყენება სხვადასხვა სტატისტიკური სიდიდის ინტერვალური შეფასებისას. ამ გაანგარიშების მთავარი ამოცანაა ქულების შეფასების გაურკვევლობის თავიდან აცილება.

Excel-ში ამ მეთოდის გამოყენებით გამოთვლა ორი ძირითადი ვარიანტია: როდის არის ცნობილი და როდის უცნობია. პირველ შემთხვევაში, ფუნქცია გამოიყენება გამოთვლებისთვის ნდობის ნორმადა მეორეში ნდობა.სტუდენტი.

მეთოდი 1: ნდობის ნორმის ფუნქცია

ოპერატორი ნდობის ნორმა, რომელიც ეხება ფუნქციების სტატისტიკურ ჯგუფს, პირველად გამოჩნდა Excel 2010 წელს. ამ პროგრამის ადრინდელი ვერსიები იყენებენ მის კოლეგას. ᲜᲓᲝᲑᲐ. ამ ოპერატორის ამოცანაა გამოთვალოს ნდობის ინტერვალი ნორმალური განაწილებით მოსახლეობის საშუალოზე.

მისი სინტაქსი ასეთია:

ნდობის ნორმა (ალფა, standard_dev, ზომა)

"ალფა"არის არგუმენტი, რომელიც მიუთითებს მნიშვნელოვნების დონეს, რომელიც გამოიყენება ნდობის დონის გამოსათვლელად. ნდობის დონე უდრის შემდეგ გამონათქვამს:

(1-"ალფა")*100

"Სტანდარტული გადახრა"არის არგუმენტი, რომლის არსი სახელიდანაც კარგად ჩანს. ეს არის შემოთავაზებული ნიმუშის სტანდარტული გადახრა.

"Ზომა"არის არგუმენტი, რომელიც განსაზღვრავს ნიმუშის ზომას.

ამ ოპერატორის ყველა არგუმენტი საჭიროა.

ფუნქცია ᲜᲓᲝᲑᲐაქვს ზუსტად იგივე არგუმენტები და შესაძლებლობები, რაც წინას. მისი სინტაქსია:

TRUST (ალფა, standard_dev, ზომა)

როგორც ხედავთ, განსხვავებები მხოლოდ ოპერატორის სახელშია. ეს ფუნქცია შენარჩუნებულია Excel 2010-ში და ახალ ვერსიებში სპეციალურ კატეგორიაში თავსებადობის მიზეზების გამო. "თავსებადობა". Excel 2007 და უფრო ადრეულ ვერსიებში, ის წარმოდგენილია სტატისტიკური ოპერატორების ძირითად ჯგუფში.

ნდობის ინტერვალის საზღვარი განისაზღვრება შემდეგი ფორმის ფორმულით:

X+(-) ნდობის ნორმა

სად Xარის ნიმუშის საშუალო, რომელიც მდებარეობს შერჩეული დიაპაზონის შუაში.

ახლა მოდით შევხედოთ როგორ გამოვთვალოთ ნდობის ინტერვალი კონკრეტული მაგალითის გამოყენებით. ჩატარდა 12 ტესტი, რის შედეგადაც სხვადასხვა შედეგები, რომლებიც ჩამოთვლილია ცხრილში. ეს არის ჩვენი მთლიანობა. სტანდარტული გადახრა არის 8. ჩვენ უნდა გამოვთვალოთ ნდობის ინტერვალი 97% ნდობის დონეზე.

  1. აირჩიეთ უჯრედი, სადაც ნაჩვენები იქნება მონაცემთა დამუშავების შედეგი. ღილაკზე დაჭერით "ფუნქციის ჩასმა".
  2. ჩნდება ფუნქციის ოსტატი. გადადით კატეგორიაში "სტატისტიკური"და მონიშნეთ სახელი "ნდობა.ნორმა". ამის შემდეგ დააჭირეთ ღილაკს კარგი.
  3. არგუმენტების ფანჯარა იხსნება. მისი ველები ბუნებრივია შეესაბამება არგუმენტების სახელებს.
    დააყენეთ კურსორი პირველ ველზე - "ალფა". აქ უნდა დავაკონკრეტოთ მნიშვნელობის დონე. როგორც გვახსოვს, ჩვენი ნდობის დონე 97%-ია. ამავე დროს, ჩვენ ვთქვით, რომ იგი გამოითვლება ამ გზით:

    (1-ნდობის დონე)/100

    ანუ მნიშვნელობის ჩანაცვლებით მივიღებთ:

    მარტივი გამოთვლებით ვხვდებით, რომ არგუმენტი "ალფა"უდრის 0,03 . შეიყვანეთ ეს მნიშვნელობა ველში.

    მოგეხსენებათ, სტანდარტული გადახრა უდრის 8 . ამიტომ მინდორში "Სტანდარტული გადახრა"უბრალოდ ჩაწერეთ ეს რიცხვი.

    მინდორში "Ზომა"თქვენ უნდა შეიყვანოთ შესრულებული ტესტების ელემენტების რაოდენობა. როგორც გვახსოვს, ისინი 12 . მაგრამ იმისათვის, რომ ფორმულა ავტომატიზირდეს და არ დაარედაქტიროთ ის ყოველ ჯერზე ახალი ტესტის შესრულებისას, მოდით დავაყენოთ ეს მნიშვნელობა არა ჩვეულებრივ რიცხვზე, არამედ ოპერატორის გამოყენებით. ᲩᲔᲙᲘ. ასე რომ, ჩვენ დავაყენეთ კურსორი ველში "Ზომა"და შემდეგ დააწკაპუნეთ სამკუთხედზე, რომელიც მდებარეობს ფორმულის ზოლის მარცხნივ.

    ჩნდება ბოლო დროს გამოყენებული ფუნქციების სია. თუ ოპერატორი ᲩᲔᲙᲘთქვენ მიერ ახლახანს გამოყენებული, ის ამ სიაში უნდა იყოს. ამ შემთხვევაში, თქვენ უბრალოდ უნდა დააჭიროთ მის სახელს. წინააღმდეგ შემთხვევაში, თუ ვერ იპოვნეთ, გადადით პუნქტზე "მეტი ფუნქციები...".

  4. ჩვენთვის უკვე ნაცნობი ჩანს ფუნქციის ოსტატი. ჯგუფში დაბრუნება "სტატისტიკური". ჩვენ იქ ვირჩევთ სახელს "ᲩᲔᲙᲘ". დააჭირეთ ღილაკს კარგი.
  5. ჩნდება არგუმენტის ფანჯარა ზემოაღნიშნული ოპერატორისთვის. ეს ფუნქცია შექმნილია უჯრედების რაოდენობის გამოსათვლელად მითითებულ დიაპაზონში, რომლებიც შეიცავს ციფრულ მნიშვნელობებს. მისი სინტაქსი შემდეგია:

    COUNT (მნიშვნელობა1, მნიშვნელობა2,…)

    არგუმენტების ჯგუფი "ღირებულებები"არის მითითება დიაპაზონზე, რომელშიც გსურთ გამოთვალოთ ციფრული მონაცემებით შევსებული უჯრედების რაოდენობა. საერთო ჯამში 255-მდე ასეთი არგუმენტი შეიძლება იყოს, მაგრამ ჩვენს შემთხვევაში მხოლოდ ერთი გვჭირდება.

    დააყენეთ კურსორი ველში "მნიშვნელობა 1"და, მაუსის მარცხენა ღილაკზე დაჭერით, აირჩიეთ დიაპაზონი ფურცელზე, რომელიც შეიცავს ჩვენს პოპულაციას. შემდეგ ველში გამოჩნდება მისი მისამართი. დააჭირეთ ღილაკს კარგი.

  6. ამის შემდეგ, აპლიკაცია შეასრულებს გამოთვლას და აჩვენებს შედეგს იმ უჯრედში, სადაც ის თავად არის. ჩვენს კონკრეტულ შემთხვევაში, ფორმულა ასე აღმოჩნდა:

    ნდობის ნორმა (0.03,8, COUNT(B2:B13))

    გამოთვლების საერთო შედეგი იყო 5,011609 .

  7. მაგრამ ეს ყველაფერი არ არის. როგორც გვახსოვს, ნდობის ინტერვალის საზღვარი გამოითვლება გაანგარიშების შედეგის საშუალო ნიმუშის მნიშვნელობის დამატებით და გამოკლებით. ნდობის ნორმა. ამ გზით გამოითვლება, შესაბამისად, ნდობის ინტერვალის მარჯვენა და მარცხენა საზღვრები. თავად ნიმუშის საშუალო გამოთვლა შესაძლებელია ოპერატორის გამოყენებით საშუალო.

    ეს ოპერატორი შექმნილია არჩეული რიცხვების დიაპაზონის საშუალო არითმეტიკული მნიშვნელობის გამოსათვლელად. მას აქვს შემდეგი საკმაოდ მარტივი სინტაქსი:

    საშუალო (ნომერი1, ნომერი2,…)

    არგუმენტი "ნომერი"შეიძლება იყოს ერთი რიცხვითი მნიშვნელობა ან მითითება უჯრედებზე ან თუნდაც მთელ დიაპაზონებზე, რომლებიც შეიცავს მათ.

    ასე რომ, აირჩიეთ უჯრედი, რომელშიც ნაჩვენები იქნება საშუალო მნიშვნელობის გაანგარიშება და დააჭირეთ ღილაკს "ფუნქციის ჩასმა".

  8. იხსნება ფუნქციის ოსტატი. დაბრუნება კატეგორიაში "სტატისტიკური"და აირჩიეთ სახელი სიიდან "საშუალო". როგორც ყოველთვის, დააჭირეთ ღილაკს კარგი.
  9. არგუმენტების ფანჯარა იხსნება. დააყენეთ კურსორი ველში "Ნომერი 1"და მაუსის მარცხენა ღილაკზე დაჭერით აირჩიეთ მნიშვნელობების მთელი დიაპაზონი. მას შემდეგ, რაც ველში გამოჩნდება კოორდინატები, დააჭირეთ ღილაკს კარგი.
  10. Ამის შემდეგ საშუალოგამოთვლის შედეგს აწვდის ფურცლის ელემენტს.
  11. ჩვენ ვიანგარიშებთ ნდობის ინტერვალის სწორ ზღვარს. ამისათვის აირჩიეთ ცალკე უჯრედი, დადეთ ნიშანი «=» და დაამატეთ ფურცლის ელემენტების შინაარსი, რომელშიც განთავსებულია ფუნქციების გამოთვლის შედეგები საშუალოდა ნდობის ნორმა. გაანგარიშების შესასრულებლად დააჭირეთ ღილაკს შედი. ჩვენს შემთხვევაში მივიღეთ შემდეგი ფორმულა:

    გაანგარიშების შედეგი: 6,953276

  12. ანალოგიურად, ჩვენ ვიანგარიშებთ ნდობის ინტერვალის მარცხენა საზღვარს, მხოლოდ ამჯერად გაანგარიშების შედეგიდან. საშუალოგამოვაკლოთ ოპერატორის გაანგარიშების შედეგი ნდობის ნორმა. გამოდის ჩვენი მაგალითის შემდეგი ტიპის ფორმულა:

    გაანგარიშების შედეგი: -3,06994

  13. ჩვენ შევეცადეთ დეტალურად აგვეწერა ყველა ნაბიჯი ნდობის ინტერვალის გამოსათვლელად, ამიტომ დეტალურად აღვწერეთ თითოეული ფორმულა. მაგრამ თქვენ შეგიძლიათ დააკავშიროთ ყველა მოქმედება ერთ ფორმულაში. ნდობის ინტერვალის მარჯვენა ზღვრის გაანგარიშება შეიძლება დაიწეროს შემდეგნაირად:

    AVERAGE(B2:B13)+ConfIDENCE(0.03,8,COUNT(B2:B13))

  14. მარცხენა საზღვრის მსგავსი გაანგარიშება ასე გამოიყურება:

    AVERAGE(B2:B13)-CONFIDENCE.NORM(0.03,8,COUNT(B2:B13))

მეთოდი 2: TRUST.STUDENT ფუნქცია

გარდა ამისა, Excel-ში არის კიდევ ერთი ფუნქცია, რომელიც დაკავშირებულია ნდობის ინტერვალის გამოთვლასთან - ნდობა.სტუდენტი. ის გამოჩნდა მხოლოდ Excel 2010 წლიდან. ეს ოპერატორი ასრულებს პოპულაციის ნდობის ინტერვალის გამოთვლას Student-ის განაწილების გამოყენებით. ძალიან მოსახერხებელია მისი გამოყენება იმ შემთხვევაში, როდესაც განსხვავება და, შესაბამისად, სტანდარტული გადახრა უცნობია. ოპერატორის სინტაქსია:

TRUST.STUDENT (ალფა, სტანდარტული_დევ, ზომა)

როგორც ხედავთ, ამ შემთხვევაში ოპერატორების სახელები უცვლელი დარჩა.

ვნახოთ, როგორ გამოვთვალოთ ნდობის ინტერვალის საზღვრები უცნობი სტანდარტული გადახრით იმავე პოპულაციის მაგალითის გამოყენებით, რომელიც განვიხილეთ წინა მეთოდში. ნდობის დონეს, ისევე როგორც წინა ჯერზე, ავიღებთ 97%.

  1. აირჩიეთ უჯრედი, რომელშიც გაანგარიშება მოხდება. დააჭირეთ ღილაკს "ფუნქციის ჩასმა".
  2. გახსნილში ფუნქციის ოსტატიკატეგორიაში გადასვლა "სტატისტიკური". აირჩიეთ სახელი "ნდობა.სტუდენტი". დააჭირეთ ღილაკს კარგი.
  3. მითითებული ოპერატორის არგუმენტის ფანჯარა იხსნება.

    მინდორში "ალფა", იმის გათვალისწინებით, რომ ნდობის დონე არის 97%, ჩვენ ვწერთ რიცხვს 0,03 . მეორედ ამ პარამეტრის გამოთვლის პრინციპებზე არ ვისაუბრებთ.

    ამის შემდეგ დააყენეთ კურსორი ველში "Სტანდარტული გადახრა". ამჯერად ეს მაჩვენებელი ჩვენთვის უცნობია და დათვლას საჭიროებს. ეს კეთდება სპეციალური ფუნქციის გამოყენებით - STDEV.B. ამ ოპერატორის ფანჯრის გამოსაძახებლად დააწკაპუნეთ სამკუთხედზე ფორმულის ზოლის მარცხნივ. თუ სიაში ვერ ვიპოვით სასურველ სახელს, გადადით პუნქტზე "მეტი ფუნქციები...".

  4. გარბის ფუნქციის ოსტატი. კატეგორიაში გადასვლა "სტატისტიკური"და მონიშნეთ სახელი "STDEV.B". შემდეგ დააჭირეთ ღილაკს კარგი.
  5. არგუმენტების ფანჯარა იხსნება. ოპერატორის დავალება STDEV.Bარის სტანდარტული გადახრის განმარტება შერჩევისას. მისი სინტაქსი ასე გამოიყურება:

    STDEV.V (ნომერი1, ნომერი2,…)

    ადვილი მისახვედრია, რომ არგუმენტი "ნომერი"არის შერჩევის ელემენტის მისამართი. თუ არჩევანი მოთავსებულია ერთ მასივში, მაშინ მხოლოდ ერთი არგუმენტის გამოყენებით, შეგიძლიათ ამ დიაპაზონის ბმული მისცეს.

    დააყენეთ კურსორი ველში "Ნომერი 1"და, როგორც ყოველთვის, მაუსის მარცხენა ღილაკზე დაჭერით, აირჩიეთ ნაკრები. მას შემდეგ, რაც კოორდინატები იქნება ველში, ნუ იჩქარებთ ღილაკზე დაჭერას კარგირადგან შედეგი არასწორი იქნება. ჯერ უნდა დავუბრუნდეთ ოპერატორის არგუმენტების ფანჯარას ნდობა.სტუდენტისაბოლოო არგუმენტის გასაკეთებლად. ამისათვის დააწკაპუნეთ შესაბამის სახელზე ფორმულის ზოლში.

  6. უკვე ნაცნობი ფუნქციის არგუმენტის ფანჯარა კვლავ იხსნება. დააყენეთ კურსორი ველში "Ზომა". ისევ დააწკაპუნეთ ჩვენთვის უკვე ნაცნობ სამკუთხედზე, რომ გადავიდეთ ოპერატორების არჩევანზე. როგორც გესმით, სახელი გვჭირდება "ᲩᲔᲙᲘ". ვინაიდან ჩვენ გამოვიყენეთ ეს ფუნქცია წინა მეთოდის გამოთვლებში, ის ამ სიაშია, ასე რომ უბრალოდ დააწკაპუნეთ მასზე. თუ ვერ იპოვნეთ, მაშინ მიჰყევით პირველ მეთოდში აღწერილი ალგორითმს.
  7. არგუმენტების ფანჯარაში შესვლა ᲩᲔᲙᲘ, ჩადეთ კურსორი ველში "Ნომერი 1"და მაუსის დაჭერით აირჩიეთ კოლექცია. შემდეგ დააჭირეთ ღილაკს კარგი.
  8. ამის შემდეგ, პროგრამა ითვლის და აჩვენებს ნდობის ინტერვალის მნიშვნელობას.
  9. საზღვრების დასადგენად, ჩვენ კვლავ უნდა გამოვთვალოთ ნიმუშის საშუალო. მაგრამ, იმის გათვალისწინებით, რომ გაანგარიშების ალგორითმი ფორმულის გამოყენებით საშუალოისევე, როგორც წინა მეთოდში, და შედეგიც კი არ შეცვლილა, ამაზე დეტალურად მეორედ არ ვისაუბრებთ.
  10. გაანგარიშების შედეგების დამატება საშუალოდა ნდობა.სტუდენტი, ვიღებთ ნდობის ინტერვალის სწორ საზღვარს.
  11. ოპერატორის გაანგარიშების შედეგების გამოკლება საშუალოგაანგარიშების შედეგი ნდობა.სტუდენტიჩვენ გვაქვს ნდობის ინტერვალის მარცხენა ზღვარი.
  12. თუ გაანგარიშება ჩაწერილია ერთ ფორმულაში, მაშინ მარჯვენა საზღვრის გაანგარიშება ჩვენს შემთხვევაში ასე გამოიყურება:

    საშუალო (B2:B13)+სტუდენტის ნდობა(0.03,STDV(B2:B13),COUNT(B2:B13))

  13. შესაბამისად, მარცხენა საზღვრის გამოთვლის ფორმულა ასე გამოიყურება:

    საშუალო (B2:B13)-სტუდენტის ნდობა(0.03,STDV(B2:B13),COUNT(B2:B13))

როგორც ხედავთ, Excel პროგრამის ინსტრუმენტები შესაძლებელს ხდის მნიშვნელოვნად გაადვილოს ნდობის ინტერვალისა და მისი საზღვრების გამოთვლა. ამ მიზნებისათვის, ცალკეული ოპერატორები გამოიყენება ნიმუშებისთვის, რომელთა დისპერსიაც ცნობილია და უცნობია.

და სხვები.ყველა მათგანი არის მათი თეორიული ანალოგიების შეფასება, რომლის მიღებაც შეიძლებოდა, თუ იქნებოდა არა ნიმუში, არამედ საერთო პოპულაცია. მაგრამ სამწუხაროდ, საერთო მოსახლეობა ძალიან ძვირია და ხშირად მიუწვდომელია.

ინტერვალის შეფასების ცნება

ნებისმიერი ნიმუშის შეფასებას აქვს გარკვეული გაფანტვა, რადგან არის შემთხვევითი ცვლადი, რომელიც დამოკიდებულია კონკრეტულ ნიმუშში არსებულ მნიშვნელობებზე. ამიტომ, უფრო სანდო სტატისტიკური დასკვნებისთვის, უნდა იცოდეთ არა მხოლოდ ქულების შეფასება, არამედ ინტერვალიც, რომელიც დიდი ალბათობით γ (გამა) ფარავს სავარაუდო მაჩვენებელს θ (თეტა).

ფორმალურად, ეს არის ორი ასეთი მნიშვნელობა (სტატისტიკა) T1 (X)და T2 (X), რა T1< T 2 , რისთვისაც ალბათობის მოცემულ დონეზე γ პირობა დაკმაყოფილებულია:

მოკლედ, სავარაუდოა γ ან მეტი ჭეშმარიტი მნიშვნელობა არის წერტილებს შორის T1 (X)და T2 (X), რომლებსაც ქვედა და ზედა საზღვრებს უწოდებენ ნდობის ინტერვალი.

ნდობის ინტერვალების აგების ერთ-ერთი პირობაა მისი მაქსიმალური სივიწროვე, ე.ი. რაც შეიძლება მოკლე უნდა იყოს. სურვილი საკმაოდ ბუნებრივია, რადგან. მკვლევარი ცდილობს უფრო ზუსტად მოახდინოს სასურველი პარამეტრის მიგნების ლოკალიზება.

აქედან გამომდინარეობს, რომ ნდობის ინტერვალი უნდა მოიცავდეს განაწილების მაქსიმალურ ალბათობას. და თავად ანგარიში იყოს ცენტრში.

ანუ, გადახრის ალბათობა (ჭეშმარიტი ინდიკატორის შეფასებადან) ზემოთ უდრის გადახრის ალბათობას ქვემოთ. აქვე უნდა აღინიშნოს, რომ დახრილი განაწილებისთვის, მარჯვნივ ინტერვალი არ არის მარცხნივ ინტერვალის ტოლი.

ზემოთ მოყვანილი ფიგურა ნათლად აჩვენებს, რომ რაც უფრო დიდია ნდობის დონე, მით უფრო ფართოა ინტერვალი - პირდაპირი ურთიერთობა.

ეს იყო მცირე შესავალი უცნობი პარამეტრების ინტერვალის შეფასების თეორიაში. მოდით გადავიდეთ მათემატიკური მოლოდინის ნდობის ლიმიტების პოვნაზე.

ნდობის ინტერვალი მათემატიკური მოლოდინისთვის

თუ ორიგინალური მონაცემები განაწილებულია ზე, მაშინ საშუალო იქნება ნორმალური მნიშვნელობა. ეს გამომდინარეობს წესიდან, რომ ნორმალური მნიშვნელობების ხაზოვან კომბინაციას ასევე აქვს ნორმალური განაწილება. ამიტომ, ალბათობების გამოსათვლელად, ჩვენ შეგვიძლია გამოვიყენოთ ნორმალური განაწილების კანონის მათემატიკური აპარატი.

თუმცა, ეს მოითხოვს ორი პარამეტრის ცოდნას - მოსალოდნელი მნიშვნელობისა და დისპერსიის შესახებ, რომლებიც, როგორც წესი, უცნობია. თქვენ, რა თქმა უნდა, შეგიძლიათ გამოიყენოთ შეფასებები პარამეტრების ნაცვლად (საშუალო არითმეტიკული და ), მაგრამ შემდეგ საშუალო განაწილება არ იქნება საკმაოდ ნორმალური, ის ოდნავ გაბრტყელდება. ირლანდიის მოქალაქე უილიამ გოსეტმა ოსტატურად აღნიშნა ეს ფაქტი, როდესაც თავისი აღმოჩენა გამოაქვეყნა 1908 წლის მარტის გამოცემაში Biometrica. საიდუმლო მიზნებისათვის, გოსეტმა ხელი მოაწერა სტუდენტს. ასე გაჩნდა Student's t-დისტრიბუცია.

თუმცა, კ.გაუსის მიერ გამოყენებული ასტრონომიული დაკვირვებების შეცდომების ანალიზისას მონაცემთა ნორმალური განაწილება ძალზე იშვიათია ხმელეთის ცხოვრებაში და ამის დადგენა საკმაოდ რთულია (მაღალი სიზუსტისთვის საჭიროა დაახლოებით 2 ათასი დაკვირვება). ამიტომ, უმჯობესია უარი თქვან ნორმალურობის დაშვებაზე და გამოიყენოთ მეთოდები, რომლებიც არ არის დამოკიდებული ორიგინალური მონაცემების განაწილებაზე.

ჩნდება კითხვა: რა არის არითმეტიკული საშუალოს განაწილება, თუ იგი გამოითვლება უცნობი განაწილების მონაცემებით? პასუხს იძლევა ალბათობის თეორიაში ცნობილი ცენტრალური ლიმიტის თეორემა(CPT). მათემატიკაში მისი რამდენიმე ვერსია არსებობს (ფორმულირებები წლების განმავლობაში დაიხვეწა), მაგრამ ყველა მათგანი, უხეშად რომ ვთქვათ, მიდის იმ განცხადებამდე, რომ დიდი რაოდენობით დამოუკიდებელი შემთხვევითი ცვლადების ჯამი ემორჩილება ნორმალურ განაწილების კანონს.

საშუალო არითმეტიკული გამოთვლისას გამოიყენება შემთხვევითი ცვლადების ჯამი. აქედან ირკვევა, რომ საშუალო არითმეტიკას აქვს ნორმალური განაწილება, რომელშიც მოსალოდნელი მნიშვნელობა არის ორიგინალური მონაცემების მოსალოდნელი მნიშვნელობა, ხოლო განსხვავება არის .

ჭკვიანმა ადამიანებმა იციან როგორ დაამტკიცონ CLT, მაგრამ ჩვენ ამას გადავამოწმებთ Excel-ში ჩატარებული ექსპერიმენტის დახმარებით. მოდით მოვახდინოთ 50 ერთნაირად განაწილებული შემთხვევითი ცვლადის ნიმუშის სიმულაცია (ექსელის ფუნქციის RANDOMBETWEEN-ის გამოყენებით). შემდეგ გავაკეთებთ 1000 ასეთ ნიმუშს და გამოვთვლით საშუალო არითმეტიკას თითოეულისთვის. მოდით შევხედოთ მათ განაწილებას.

ჩანს, რომ საშუალო განაწილება ნორმალურ კანონთან ახლოსაა. თუ ნიმუშების მოცულობა და მათი რაოდენობა კიდევ უფრო დიდი იქნება, მაშინ მსგავსება კიდევ უკეთესი იქნება.

ახლა, როცა ჩვენ თვითონ დავინახეთ CLT-ის ვალიდობა, ჩვენ შეგვიძლია გამოვთვალოთ არითმეტიკული საშუალოს ნდობის ინტერვალები, რომლებიც ფარავს ჭეშმარიტ საშუალოს ან მათემატიკურ მოლოდინს მოცემული ალბათობით.

ზედა და ქვედა საზღვრების დასადგენად საჭიროა ნორმალური განაწილების პარამეტრების ცოდნა. როგორც წესი, ისინი არ გამოიყენება, ამიტომ შეფასებები გამოიყენება: საშუალო არითმეტიკულიდა ნიმუშის განსხვავება. ისევ და ისევ, ეს მეთოდი იძლევა კარგ მიახლოებას მხოლოდ დიდი ნიმუშებისთვის. როდესაც ნიმუშები მცირეა, ხშირად რეკომენდებულია სტუდენტური განაწილების გამოყენება. არ დაიჯერო! სტუდენტის განაწილება საშუალოზე ხდება მხოლოდ მაშინ, როდესაც თავდაპირველ მონაცემს აქვს ნორმალური განაწილება, ანუ თითქმის არასდროს. ამიტომ უმჯობესია დაუყონებლივ დააწესოთ მინიმალური ბარი საჭირო მონაცემების ოდენობაზე და გამოიყენოთ ასიმპტომურად სწორი მეთოდები. მათი თქმით, 30 დაკვირვება საკმარისია. აიღეთ 50 – ვერ შეცდებით.

T 1.2არის ნდობის ინტერვალის ქვედა და ზედა საზღვრები

- საშუალო არითმეტიკული ნიმუში

s0- ნიმუშის სტანდარტული გადახრა (მიკერძოებული)

- ნიმუშის ზომა

γ - ნდობის დონე (ჩვეულებრივ ტოლია 0,9, 0,95 ან 0,99)

c γ =Φ -1 ((1+γ)/2)არის სტანდარტული ნორმალური განაწილების ფუნქციის ორმხრივი. მარტივი სიტყვებით, ეს არის სტანდარტული შეცდომების რაოდენობა არითმეტიკული საშუალოდან ქვედა ან ზედა ზღვარზე (მითითებული სამი ალბათობა შეესაბამება 1.64, 1.96 და 2.58 მნიშვნელობებს).

ფორმულის არსი იმაში მდგომარეობს, რომ საშუალო არითმეტიკული აღებულია და შემდეგ მისგან გამოყოფილია გარკვეული რაოდენობა ( γ-თან ერთად) სტანდარტული შეცდომები ( s 0 /√n). ყველაფერი ცნობილია, აიღე და დაითვალე.

კომპიუტერების მასობრივ გამოყენებამდე, ნორმალური განაწილების ფუნქციის მნიშვნელობებისა და მისი შებრუნებული მნიშვნელობების მისაღებად, ისინი იყენებდნენ. ისინი ჯერ კიდევ გამოიყენება, მაგრამ უფრო ეფექტურია მზა Excel-ის ფორმულებზე გადასვლა. ყველა ელემენტი ზემოთ მოცემული ფორმულიდან ( , და ) მარტივად შეიძლება გამოითვალოს Excel-ში. მაგრამ ასევე არსებობს მზა ფორმულა ნდობის ინტერვალის გამოსათვლელად - ნდობის ნორმა. მისი სინტაქსი შემდეგია.

ნდობის ნორმა (ალფა, standard_dev, ზომა)

ალფა– მნიშვნელოვნების დონე ანუ ნდობის დონე, რომელიც ზემოთ აღნიშვნით უდრის 1-γ, ე.ი. ალბათობა იმისა, რომ მათემატიკურიმოლოდინი იქნება ნდობის ინტერვალის მიღმა. 0,95 ნდობის დონით, ალფა არის 0,05 და ა.შ.

standard_offარის ნიმუშის მონაცემების სტანდარტული გადახრა. თქვენ არ გჭირდებათ სტანდარტული შეცდომის გამოთვლა, Excel გაყოფს n-ის ფესვზე.

ზომა– ნიმუშის ზომა (n).

CONFIDENCE.NORM ფუნქციის შედეგი არის ნდობის ინტერვალის გამოთვლის ფორმულის მეორე წევრი, ე.ი. ნახევარი ინტერვალი. შესაბამისად, ქვედა და ზედა წერტილები არის საშუალო ± მიღებული მნიშვნელობა.

ამრიგად, შესაძლებელია შეიქმნას უნივერსალური ალგორითმი არითმეტიკული საშუალოსთვის ნდობის ინტერვალების გამოსათვლელად, რომელიც არ არის დამოკიდებული საწყისი მონაცემების განაწილებაზე. უნივერსალურობის ფასი მისი ასიმპტომური ბუნებაა, ე.ი. შედარებით დიდი ნიმუშების გამოყენების აუცილებლობა. თუმცა, თანამედროვე ტექნოლოგიების ეპოქაში, მონაცემების სწორი მოცულობის შეგროვება, როგორც წესი, არ არის რთული.

სტატისტიკური ჰიპოთეზების ტესტირება ნდობის ინტერვალის გამოყენებით

(მოდული 111)

სტატისტიკაში გადაჭრილი ერთ-ერთი მთავარი პრობლემაა. მოკლედ, მისი არსი ასეთია. კეთდება დაშვება, მაგალითად, რომ ზოგადი მოსახლეობის მოლოდინი უდრის გარკვეულ მნიშვნელობას. შემდეგ აგებულია სანიმუშო საშუალებების განაწილება, რომლის დაკვირვებაც შესაძლებელია მოცემული მოლოდინით. შემდეგი, ჩვენ ვუყურებთ სად მდებარეობს ამ პირობით განაწილებაში რეალური საშუალო. თუ ის სცილდება დასაშვებ საზღვრებს, მაშინ ასეთი საშუალოს გამოჩენა ძალზე ნაკლებად სავარაუდოა და ექსპერიმენტის ერთჯერადი გამეორებით თითქმის შეუძლებელია, რაც ეწინააღმდეგება წამოყენებულ ჰიპოთეზას, რომელიც წარმატებით უარყოფილია. თუ საშუალო მაჩვენებელი არ სცილდება კრიტიკულ დონეს, მაშინ ჰიპოთეზა არ არის უარყოფილი (მაგრამ არც მტკიცდება!).

ასე რომ, ნდობის ინტერვალების დახმარებით, ჩვენს შემთხვევაში მოლოდინისთვის, თქვენ ასევე შეგიძლიათ შეამოწმოთ რამდენიმე ჰიპოთეზა. ამის გაკეთება ძალიან ადვილია. დავუშვათ, რომ ზოგიერთი ნიმუშისთვის საშუალო არითმეტიკული არის 100. შემოწმებულია ჰიპოთეზა, რომ მოსალოდნელი მნიშვნელობა არის, ვთქვათ, 90. ანუ, თუ კითხვას პრიმიტიულად დავსვათ, ეს ასე ჟღერს: შეიძლება თუ არა ჭეშმარიტი მნიშვნელობით? საშუალო უდრის 90-ს, დაკვირვებული საშუალო იყო 100?

ამ კითხვაზე პასუხის გასაცემად საჭიროა დამატებითი ინფორმაცია სტანდარტული გადახრისა და ნიმუშის ზომის შესახებ. ვთქვათ, სტანდარტული გადახრა არის 30, ხოლო დაკვირვების რაოდენობა 64 (ძირის ადვილად ამოსაღებად). მაშინ საშუალო სტანდარტული შეცდომა არის 30/8 ან 3.75. 95%-იანი ნდობის ინტერვალის გამოსათვლელად, თქვენ უნდა გამოყოთ ორი სტანდარტული შეცდომა საშუალოს ორივე მხარეს (უფრო ზუსტად, 1.96). ნდობის ინტერვალი იქნება დაახლოებით 100 ± 7.5, ანუ 92.5-დან 107.5-მდე.

შემდგომი მსჯელობა შემდეგია. თუ შემოწმებული მნიშვნელობა ხვდება ნდობის ინტერვალში, მაშინ ის არ ეწინააღმდეგება ჰიპოთეზას, ვინაიდან ჯდება შემთხვევითი რყევების საზღვრებში (95%-იანი ალბათობით). თუ ტესტირებადი წერტილი ნდობის ინტერვალის მიღმაა, მაშინ ასეთი მოვლენის ალბათობა ძალიან მცირეა, ნებისმიერ შემთხვევაში მისაღები დონის ქვემოთ. შესაბამისად, ჰიპოთეზა უარყოფილია, როგორც დაკვირვებულ მონაცემებს ეწინააღმდეგება. ჩვენს შემთხვევაში, მოლოდინის ჰიპოთეზა ნდობის ინტერვალის მიღმაა (90-ის შემოწმებული მნიშვნელობა არ შედის 100±7.5 ინტერვალში), ამიტომ იგი უარყოფილი უნდა იყოს. ზემოთ მოცემულ პრიმიტიულ კითხვაზე პასუხის გაცემისას უნდა ითქვას: არა, ეს არ შეიძლება, არავითარ შემთხვევაში, ეს ხდება ძალიან იშვიათად. ხშირად ეს მიუთითებს ჰიპოთეზის მცდარი უარყოფის კონკრეტულ ალბათობაზე (p-დონე) და არა მოცემულ დონეზე, რომლის მიხედვითაც აშენდა ნდობის ინტერვალი, არამედ უფრო სხვა დროს.

როგორც ხედავთ, არ არის რთული საშუალო (ან მათემატიკური მოლოდინის) ნდობის ინტერვალის აშენება. მთავარია, არსი დაიჭირო და მერე წავა საქმე. პრაქტიკაში, უმეტესობა იყენებს 95% ნდობის ინტერვალს, რაც დაახლოებით ორი სტანდარტული შეცდომის სიგანეა საშუალოს ორივე მხარეს.

ჯერჯერობით სულ ესაა. Ყველაფერი საუკეთესო!