ალბათობის განაწილების ნორმალური კანონი. რიცხვითი მნიშვნელობების სტატისტიკური ანალიზი (არაპარამეტრული სტატისტიკა)

    როგორ სწორად მართოთ თქვენი ბიზნესის ფინანსები, თუ არ ხართ ფინანსური ანალიზის დარგის ექსპერტი - ფინანსური ანალიზი

    ფინანსური მენეჯმენტი - სუბიექტებს შორის ფინანსური ურთიერთობები, ფინანსური მენეჯმენტი სხვადასხვა დონეზე, პორტფელის მენეჯმენტი, ფინანსური რესურსების მოძრაობის მართვის მეთოდები - ეს არ არის საგნის სრული სია. ფინანსური მენეჯმენტი"

    მოდით ვისაუბროთ იმაზე, რაც არის ქოუჩინგი? ზოგს მიაჩნია, რომ ეს ბურჟუაზიული ბრენდია, ზოგს კი თანამედროვე ბიზნესის გარღვევა. ქოუჩინგი არის წესების ერთობლიობა წარმატებული ბიზნესისთვის, ასევე ამ წესების სწორად მართვის უნარს.

4.1. დაკვირვებების განაწილება ხშირად ნორმალურია?

გამოიყენება ეკონომეტრიულ და ეკონომიკურ-მათემატიკურ მოდელებში, კერძოდ, მარკეტინგული და მენეჯმენტის პროცესების შესწავლასა და ოპტიმიზაციაში, საწარმო და რეგიონული მენეჯმენტი, ტექნოლოგიური პროცესების სიზუსტე და სტაბილურობა, საიმედოობის, უსაფრთხოების, მათ შორის ეკოლოგიური უსაფრთხოების, ტექნიკური ფუნქციონირების პრობლემები. მოწყობილობები და ობიექტები, ორგანიზაციული სქემების შემუშავება ხშირად იყენებენ ალბათობის თეორიის ცნებებსა და შედეგებს და მათემატიკური სტატისტიკას. ამ შემთხვევაში, ხშირად გამოიყენება ალბათობის განაწილების გარკვეული პარამეტრული ოჯახები. ყველაზე პოპულარულია ნორმალური განაწილება. ასევე გამოიყენება ლოგ-ნორმალური განაწილება, ექსპონენციალური განაწილება, გამა განაწილება, ვეიბულ-გნედენკოს განაწილება და ა.შ.

ცხადია, ყოველთვის აუცილებელია მოდელების რეალობასთან შესაბამისობის შემოწმება. არის ორი კითხვა. განსხვავდება თუ არა რეალური განაწილებები მოდელში გამოყენებული განაწილებისგან? რამდენად მოქმედებს ეს განსხვავება დასკვნებზე?

ქვემოთ, ნორმალური განაწილების მაგალითისა და მასზე დაფუძნებული მკვეთრად განსხვავებული დაკვირვებების (აუცილებელთა) უარყოფის მეთოდების გამოყენებით, ნაჩვენებია, რომ რეალური განაწილებები თითქმის ყოველთვის განსხვავდება კლასიკურ პარამეტრულ ოჯახებში შემავალთაგან და არსებული გადახრები მოცემული ოჯახებიდან. არასწორი დასკვნების გაკეთება განსახილველ შემთხვევაში ამ ოჯახების სარგებლობის საფუძველზე უარის თქმის შესახებ.

არსებობს რაიმე მიზეზი, რომ აპრიორი ვივარაუდოთ გაზომვის შედეგების ნორმალურობა?

ზოგჯერ ამტკიცებენ, რომ იმ შემთხვევაში, როდესაც გაზომვის შეცდომა (ან სხვა შემთხვევითი ცვლადი) განისაზღვრება მრავალი მცირე ფაქტორის კუმულაციური მოქმედების შედეგად, მაშინ, ალბათობის თეორიის ცენტრალური ლიმიტის თეორემის (CLT) გამო, ეს მნიშვნელობა არის კარგად მიახლოებული (განაწილების მიხედვით) ნორმალური შემთხვევითი ცვლადით. ეს განცხადება მართალია, თუ მცირე ფაქტორები მოქმედებენ დანამატად და ერთმანეთისგან დამოუკიდებლად. თუ ისინი მოქმედებენ მრავლობითად, მაშინ, ერთი და იგივე CLT-ის გამო, საჭიროა დაახლოება ლოგ-ნორმალური განაწილებით. გამოყენებითი პრობლემების დროს, როგორც წესი, შეუძლებელია მცირე ფაქტორების მოქმედების ადიტიურობის და არა მრავალმხრივობის დასაბუთება. თუ დამოკიდებულება ზოგადი ხასიათისაა, არ არის დაყვანილი დანამატის ან გამრავლების ფორმაზე და არ არსებობს საფუძველი, მივიღოთ მოდელები, რომლებიც იძლევა ექსპონენციალურ, ვეიბულ-გნედენკოს, გამას ან სხვა განაწილებებს, მაშინ პრაქტიკულად არაფერია ცნობილი განაწილების შესახებ. საბოლოო შემთხვევითი ცვლადი, გარდა შიდა მათემატიკური თვისებებისა, როგორიცაა კანონზომიერება.

კონკრეტული მონაცემების დამუშავებისას, ზოგჯერ ითვლება, რომ გაზომვის შეცდომებს აქვთ ნორმალური განაწილება. ნორმალურობის დაშვებით აგებულია რეგრესიის, დისპერსიის, ფაქტორული ანალიზის, მეტროლოგიური მოდელების კლასიკური მოდელები, რომლებიც კვლავაც გვხვდება როგორც შიდა მარეგულირებელ და ტექნიკურ დოკუმენტაციაში, ასევე საერთაშორისო სტანდარტებში. ეკონომიკური სტრუქტურების, ტექნიკური მოწყობილობებისა და ობიექტების ფუნქციონირების უსაფრთხოების უზრუნველსაყოფად სისტემების დიზაინში გამოყენებული გარკვეული მახასიათებლების მაქსიმალური მიღწევადი დონის გამოთვლის მოდელები იმავე დაშვებაზეა დაფუძნებული. თუმცა, ასეთი ვარაუდის თეორიული საფუძველი არ არსებობს. აუცილებელია შეცდომების განაწილების ექსპერიმენტული შესწავლა.

რას აჩვენებს ექსპერიმენტის შედეგები? მონოგრაფიაში მოცემული რეზიუმე საშუალებას გვაძლევს განვაცხადოთ, რომ უმეტეს შემთხვევაში გაზომვის შეცდომების განაწილება განსხვავდება ნორმალურიდან. ამრიგად, მანქანა-ელექტროტექნიკურ ინსტიტუტში (ვარნა, ბულგარეთი) შეისწავლეს კალიბრაციის შეცდომების განაწილება ანალოგური ელექტრო საზომი ხელსაწყოების სასწორებზე. შეისწავლეს ჩეხოსლოვაკიაში, სსრკ-სა და ბულგარეთში წარმოებული მოწყობილობები. შეცდომების განაწილების კანონი იგივე აღმოჩნდა. მას აქვს სიმკვრივე

ჩვენ გავაანალიზეთ სხვადასხვა ავტორის მიერ შესწავლილი შეცდომების 219 რეალური განაწილების პარამეტრების მონაცემები, როდესაც გავზომეთ როგორც ელექტრული, ისე არაელექტრული სიდიდეები მრავალფეროვანი (ელექტრული) მოწყობილობებით. ამ კვლევის შედეგად აღმოჩნდა, რომ 111 განაწილება, ე.ი. დაახლოებით 50% მიეკუთვნება სიმკვრივის განაწილების კლასს

სად არის ხარისხი პარამეტრი; ბ - shift პარამეტრი; - მასშტაბის პარამეტრი; - არგუმენტის გამა ფუნქცია;

(სმ. ); 63 განაწილება, ე.ი. 30%-ს აქვს ბრტყელი სიმკვრივე გრძელი, ნაზი ფერდობებით და არ შეიძლება აღიწეროს როგორც ნორმალური ან, მაგალითად, ექსპონენციალური. დარჩენილი 45 განაწილება ბიმოდალური აღმოჩნდა.

ცნობილი მეტროლოგის წიგნში პროფ. PV Novitsky წარმოგიდგენთ სხვადასხვა სახის გაზომვის შეცდომების განაწილების კანონების შესწავლის შედეგებს. მან შეისწავლა ელექტრომექანიკური ხელსაწყოების შეცდომების განაწილება ბირთვებზე, ტემპერატურისა და ძალების საზომი ელექტრონული ინსტრუმენტები, ციფრული ინსტრუმენტები ხელით ბალანსირებით. ექსპერიმენტული მონაცემების ნიმუშების მოცულობა თითოეული ნიმუშისთვის იყო 100-400 კითხვა. აღმოჩნდა, რომ 47 განაწილებიდან 46 მნიშვნელოვნად განსხვავდებოდა ნორმალურისგან. შესწავლილი იქნა შეცდომების განაწილების ფორმა Shch-1411 ციფრული ვოლტმეტრის 25 ეგზემპლარში დიაპაზონის 10 წერტილში. შედეგები მსგავსია. დამატებითი ინფორმაცია მოცემულია მონოგრაფიაში.

ტარტუს სახელმწიფო უნივერსიტეტის გამოყენებითი მათემატიკის ლაბორატორიამ გააანალიზა 2500 ნიმუში რეალური სტატისტიკური მონაცემების არქივიდან. 92%-ში ნორმალურობის ჰიპოთეზა უნდა უარყო.

ექსპერიმენტული მონაცემების ზემოაღნიშნული აღწერილობები აჩვენებს, რომ გაზომვის შეცდომებს უმეტეს შემთხვევაში აქვთ განაწილება, რომელიც განსხვავდება ნორმალურიდან. ეს, კერძოდ, ნიშნავს, რომ სტუდენტის t-ტესტის, კლასიკური რეგრესიული ანალიზისა და ნორმალურ თეორიაზე დაფუძნებული სხვა სტატისტიკური მეთოდების უმეტესობა, მკაცრად რომ ვთქვათ, არ არის გამართლებული, რადგან შესაბამისი შემთხვევითი განაწილების ნორმალურობის ძირითადი აქსიომაა. ცვლადები არასწორია.

ცხადია, სტატისტიკური მონაცემების ანალიზის არსებული პრაქტიკის დასაბუთების ან გონივრული შეცვლის მიზნით, საჭიროა მონაცემთა ანალიზის პროცედურების თვისებების შესწავლა „არალეგალურ“ აპლიკაციებში. უარყოფის პროცედურების შესწავლამ აჩვენა, რომ ისინი უკიდურესად არასტაბილურია ნორმალურობიდან გადახრის მიმართ და ამიტომ არ არის მიზანშეწონილი მათი გამოყენება რეალური მონაცემების დასამუშავებლად (იხ. ქვემოთ); შესაბამისად, არ შეიძლება იმის მტკიცება, რომ თვითნებურად მიღებული პროცედურა სტაბილურია ნორმალურობიდან გადახრის მიმართ.

ზოგჯერ შემოთავაზებულია ნორმალურობის შემოწმება გამოყენებამდე, მაგალითად, სტუდენტის ტესტი ორი ნიმუშის ერთგვაროვნებისთვის. მიუხედავად იმისა, რომ ამის მრავალი კრიტერიუმი არსებობს, ნორმალურობის ტესტირება უფრო რთული და შრომატევადი სტატისტიკური პროცედურაა, ვიდრე ჰომოგენურობის ტესტირება (როგორც სტუდენტის ტიპის სტატისტიკით, ასევე არაპარამეტრული ტესტებით). ნორმალურობის საკმარისად საიმედოდ დადგენისთვის საჭიროა დაკვირვებების საკმაოდ დიდი რაოდენობა. ასე რომ, იმის უზრუნველსაყოფად, რომ დაკვირვების შედეგების განაწილების ფუნქცია განსხვავდება ნორმალურიდან არაუმეტეს 0,01-ით (არგუმენტის ნებისმიერი მნიშვნელობისთვის), საჭიროა დაახლოებით 2500 დაკვირვება. უმეტეს ეკონომიკურ, ტექნიკურ, ბიოსამედიცინო და სხვა გამოყენებითი კვლევების დროს დაკვირვებების რაოდენობა საგრძნობლად ნაკლებია. ეს განსაკუთრებით ეხება იმ მონაცემებს, რომლებიც გამოიყენება ეკონომიკური სტრუქტურებისა და ტექნიკური ობიექტების ფუნქციონირების უსაფრთხოების უზრუნველყოფასთან დაკავშირებული პრობლემების შესწავლისას.

ზოგჯერ ისინი ცდილობენ გამოიყენონ DCT შეცდომის განაწილების ნორმალურთან მიახლოებით, მათ შორის სპეციალური შემკრები საზომი მოწყობილობის ტექნოლოგიურ სქემაში. მოდით შევაფასოთ ამ ღონისძიების სარგებლიანობა. დაე Z1 , Z2 ,…, Zk იყოს დამოუკიდებელი იდენტურად განაწილებული შემთხვევითი ცვლადები განაწილების ფუნქციით H = H(x) ისეთი, რომ განვიხილოთ

დამამატებლის მიერ მოწოდებული ნორმალურობასთან სიახლოვის მაჩვენებელია

ბოლო მიმართებაში მარჯვენა უტოლობა გამომდინარეობს წიგნში მიღებული ბერი-ესენის უტოლობის მუდმივის შეფასებით, ხოლო მარცხენა მონოგრაფიაში მოცემული მაგალითიდან. ნორმალური კანონისთვის = 1.6, ერთიანი კანონისთვის = 1.3, ორპუნქტიანი კანონისთვის = 1 (ეს არის ქვედა ზღვარი). ამრიგად, მანძილის უზრუნველსაყოფად (კოლმოგოროვის მეტრიკაში) ნორმალურ განაწილებამდე არაუმეტეს 0,01 "წარუმატებელი" განაწილებისთვის, საჭიროა მინიმუმ k0 ტერმინები, სადაც

ჩვეულებრივ გამოყენებულ შემკრებებში, ტერმინები გაცილებით მცირეა. H შესაძლო განაწილების კლასის შევიწროებით, შეიძლება მივიღოთ, როგორც მონოგრაფიაშია ნაჩვენები, უფრო სწრაფი კონვერგენცია, მაგრამ აქ თეორია ჯერ კიდევ არ ერწყმის პრაქტიკას. გარდა ამისა, გაუგებარია განაწილების სიახლოვე ნორმასთან (გარკვეულ მეტრებში) ასევე უზრუნველყოფს შემთხვევითი ცვლადებიდან აგებული სტატისტიკის განაწილების სიახლოვეს ამ განაწილებასთან ნორმალურ დაკვირვებებთან შესაბამისი სტატისტიკის განაწილებასთან. როგორც ჩანს, თითოეული კონკრეტული სტატისტიკისთვის საჭიროა სპეციალური თეორიული კვლევები, ამ დასკვნამდე მიდის მონოგრაფიის ავტორი. გარე უარყოფის პრობლემებში პასუხია: „არ უზრუნველყოფს“ (იხ. ქვემოთ).

გაითვალისწინეთ, რომ ნებისმიერი რეალური გაზომვის შედეგი ჩაიწერება ათწილადების სასრული რაოდენობის გამოყენებით, ჩვეულებრივ მცირე (2-5), ამიტომ მიზანშეწონილია ნებისმიერი რეალური მონაცემების მოდელირება მხოლოდ დისკრეტული შემთხვევითი ცვლადების გამოყენებით, რომლებიც იღებენ სასრულ რაოდენობას. ნორმალური განაწილება არის მხოლოდ რეალური განაწილების მიახლოება. ასე რომ, მაგალითად, ნაშრომში მოცემული კონკრეტული კვლევის მონაცემები, იღებს მნიშვნელობებს 1.0-დან 2.2-მდე, ე.ი. სულ არის 13 შესაძლო მნიშვნელობა. დირიხლეს პრინციპიდან გამომდინარეობს, რომ რაღაც მომენტში სამუშაო მონაცემების მიხედვით აგებული განაწილების ფუნქცია განსხვავდება უახლოესი ნორმალური განაწილების ფუნქციისგან სულ მცირე 1/26-ით, ე.ი. 0.04-ით. გარდა ამისა, აშკარაა, რომ შემთხვევითი ცვლადის ნორმალური განაწილებისთვის, ათობითი რიცხვების დისკრეტულ სიმრავლეში მოხვედრის ალბათობა ათწილადების მოცემული რაოდენობით არის 0.

ზემოაღნიშნულიდან გამომდინარეობს, რომ გაზომვების შედეგებს და, ზოგადად, სტატისტიკურ მონაცემებს აქვთ ისეთი თვისებები, რაც იწვევს იმ ფაქტს, რომ ისინი უნდა იყოს მოდელირებული შემთხვევითი ცვლადებით განაწილებით, რომლებიც მეტ-ნაკლებად განსხვავდება ნორმალურიდან. უმეტეს შემთხვევაში, განაწილებები მნიშვნელოვნად განსხვავდება ნორმალური განაწილებისგან; სხვებში, ნორმალური განაწილება აშკარად შეიძლება ჩაითვალოს ერთგვარ მიახლოებად, მაგრამ არასოდეს არის სრული დამთხვევა. ეს გულისხმობს როგორც კლასიკური სტატისტიკური პროცედურების თვისებების შესწავლის აუცილებლობას არაკლასიკურ ალბათურ მოდელებში (ისევე, როგორც ქვემოთ მოცემულია სტუდენტის კრიტერიუმისთვის), ასევე სტაბილურობის (ნორმალურიდან გადახრების არსებობის გათვალისწინებით) და განვითარების აუცილებლობას. არაპარამეტრული, მათ შორის განაწილების გარეშე პროცედურების, მათი ფართო დანერგვა სტატისტიკური მონაცემების დამუშავების პრაქტიკაში.

სხვა პარამეტრული ოჯახებისთვის აქ გამოტოვებული მოსაზრებები მსგავს დასკვნამდე მივყავართ. შედეგი შეიძლება ჩამოყალიბდეს შემდეგნაირად. რეალური მონაცემების განაწილება თითქმის არასოდეს მიეკუთვნება რომელიმე კონკრეტულ პარამეტრულ ოჯახს. რეალური განაწილებები ყოველთვის განსხვავდება პარამეტრულ ოჯახებში შემავალი განაწილებისგან. განსხვავებები შეიძლება იყოს დიდი ან მცირე, მაგრამ ისინი ყოველთვის არსებობს. შევეცადოთ გავიგოთ, რამდენად მნიშვნელოვანია ეს განსხვავებები ეკონომეტრიული ანალიზისთვის.

Ყველა უფლება დაცულია. ამ საიტზე განთავსებული მასალების გამოყენება შესაძლებელია მხოლოდ ამ საიტის ბმულით.

ორლოვი ა.ი. დაკვირვებების განაწილება ხშირად ნორმალურია? – ჟურნალი „ქარხნის ლაბორატორია“. 1991 წ.57. No7 გვ.64-66.

დაკვირვებების განაწილება ხშირად ნორმალურია?

ა.ი.ორლოვი

გაზომვების შედეგებს და, ზოგადად, სტატისტიკურ მონაცემებს გააჩნიათ თვისებები, რაც იწვევს იმ ფაქტს, რომ ისინი უნდა იყოს მოდელირებული შემთხვევითი ცვლადებით განაწილებით, რომლებიც მეტ-ნაკლებად განსხვავდება ნორმალურისგან. უმეტეს შემთხვევაში, განაწილება მნიშვნელოვნად განსხვავდება ნორმალურისგან. სხვებში ნორმალური განაწილება აშკარად შეიძლება ჩაითვალოს ერთგვარ მიახლოებად. მაგრამ არასოდეს არსებობს სრულყოფილი მატჩი. ეს გულისხმობს როგორც კლასიკური სტატისტიკური პროცედურების თვისებების შესწავლის აუცილებლობას არაკლასიკურ ალბათურ მოდელებში, ასევე სტაბილურობის (ნორმალურიდან გადახრების არსებობის გათვალისწინებით) და არაპარამეტრული, მათ შორის განაწილების გარეშე პროცედურების შემუშავების აუცილებლობას. სტატისტიკური მონაცემების დამუშავების პრაქტიკაში შესავალი.

გამოიყენება ეკონომეტრიულ და ეკონომიკურ-მათემატიკურ მოდელებში, კერძოდ, მარკეტინგული და მენეჯმენტის პროცესების შესწავლასა და ოპტიმიზაციაში, საწარმო და რეგიონული მენეჯმენტი, ტექნოლოგიური პროცესების სიზუსტე და სტაბილურობა, საიმედოობის, უსაფრთხოების, მათ შორის ეკოლოგიური უსაფრთხოების, ტექნიკური ფუნქციონირების პრობლემები. მოწყობილობები და ობიექტები, ორგანიზაციული სქემების შემუშავება ხშირად იყენებენ ალბათობის თეორიის ცნებებსა და შედეგებს და მათემატიკური სტატისტიკას. ამ შემთხვევაში, ხშირად გამოიყენება ალბათობის განაწილების გარკვეული პარამეტრული ოჯახები. ყველაზე პოპულარულია ნორმალური განაწილება. ასევე გამოიყენება ლოგ-ნორმალური განაწილება, ექსპონენციალური განაწილება, გამა განაწილება, ვეიბულ-გნედენკოს განაწილება და ა.შ.

ცხადია, ყოველთვის აუცილებელია მოდელების რეალობასთან შესაბამისობის შემოწმება. არის ორი კითხვა. განსხვავდება თუ არა რეალური განაწილებები მოდელში გამოყენებული განაწილებისგან? რამდენად მოქმედებს ეს განსხვავება დასკვნებზე?

ქვემოთ, ნორმალური განაწილების მაგალითისა და მასზე დაფუძნებული მკვეთრად განსხვავებული დაკვირვებების (აუცილებელთა) უარყოფის მეთოდების გამოყენებით, ნაჩვენებია, რომ რეალური განაწილებები თითქმის ყოველთვის განსხვავდება კლასიკურ პარამეტრულ ოჯახებში შემავალთაგან და არსებული გადახრები მოცემული ოჯახებიდან. არასწორი დასკვნების გაკეთება განსახილველ შემთხვევაში ამ ოჯახების სარგებლობის საფუძველზე უარის თქმის შესახებ.

არსებობს რაიმე მიზეზი, რომ აპრიორი ვივარაუდოთ გაზომვის შედეგების ნორმალურობა?

ზოგჯერ ამტკიცებენ, რომ იმ შემთხვევაში, როდესაც გაზომვის შეცდომა (ან სხვა შემთხვევითი ცვლადი) განისაზღვრება მრავალი მცირე ფაქტორის კუმულაციური მოქმედების შედეგად, მაშინ, ალბათობის თეორიის ცენტრალური ლიმიტის თეორემის (CLT) გამო, ეს მნიშვნელობა არის კარგად მიახლოებული (განაწილების მიხედვით) ნორმალური შემთხვევითი ცვლადით. ეს განცხადება მართალია, თუ მცირე ფაქტორები მოქმედებენ დანამატად და ერთმანეთისგან დამოუკიდებლად. თუ ისინი მოქმედებენ მრავლობითად, მაშინ, ერთი და იგივე CLT-ის გამო, საჭიროა დაახლოება ლოგ-ნორმალური განაწილებით. გამოყენებითი პრობლემების დროს, როგორც წესი, შეუძლებელია მცირე ფაქტორების მოქმედების ადიტიურობის და არა მრავალმხრივობის დასაბუთება. თუ დამოკიდებულება ზოგადი ხასიათისაა, არ არის დაყვანილი დანამატის ან გამრავლების ფორმაზე და არ არსებობს საფუძველი, მივიღოთ მოდელები, რომლებიც იძლევა ექსპონენციალურ, ვეიბულ-გნედენკოს, გამას ან სხვა განაწილებებს, მაშინ პრაქტიკულად არაფერია ცნობილი განაწილების შესახებ. საბოლოო შემთხვევითი ცვლადი, გარდა შიდა მათემატიკური თვისებებისა, როგორიცაა კანონზომიერება.

კონკრეტული მონაცემების დამუშავებისას, ზოგჯერ ითვლება, რომ გაზომვის შეცდომებს აქვთ ნორმალური განაწილება. ნორმალურობის დაშვებით აგებულია რეგრესიის, დისპერსიის, ფაქტორული ანალიზის, მეტროლოგიური მოდელების კლასიკური მოდელები, რომლებიც კვლავაც გვხვდება როგორც შიდა მარეგულირებელ და ტექნიკურ დოკუმენტაციაში, ასევე საერთაშორისო სტანდარტებში. ეკონომიკური სტრუქტურების, ტექნიკური მოწყობილობებისა და ობიექტების ფუნქციონირების უსაფრთხოების უზრუნველსაყოფად სისტემების დიზაინში გამოყენებული გარკვეული მახასიათებლების მაქსიმალური მიღწევადი დონის გამოსათვლელი მოდელები ეფუძნება იმავე ვარაუდს. თუმცა, ასეთი ვარაუდის თეორიული საფუძველი არ არსებობს. აუცილებელია შეცდომების განაწილების ექსპერიმენტული შესწავლა.

რას აჩვენებს ექსპერიმენტის შედეგები? მონოგრაფიაში მოცემული რეზიუმე საშუალებას გვაძლევს განვაცხადოთ, რომ უმეტეს შემთხვევაში გაზომვის შეცდომების განაწილება განსხვავდება ნორმალურიდან. ამრიგად, მანქანა-ელექტროტექნიკურ ინსტიტუტში (ვარნა, ბულგარეთი) შეისწავლეს კალიბრაციის შეცდომების განაწილება ანალოგური ელექტრო საზომი ხელსაწყოების სასწორებზე. შეისწავლეს ჩეხოსლოვაკიაში, სსრკ-სა და ბულგარეთში წარმოებული მოწყობილობები. შეცდომების განაწილების კანონი იგივე აღმოჩნდა. მას აქვს სიმკვრივე

ჩვენ გავაანალიზეთ სხვადასხვა ავტორის მიერ შესწავლილი შეცდომების 219 რეალური განაწილების პარამეტრების მონაცემები, როდესაც გავზომეთ როგორც ელექტრული, ისე არაელექტრული სიდიდეები მრავალფეროვანი (ელექტრული) მოწყობილობებით. ამ კვლევის შედეგად აღმოჩნდა, რომ 111 განაწილება, ე.ი. დაახლოებით 50% მიეკუთვნება სიმკვრივის განაწილების კლასს

სად არის ხარისხი პარამეტრი; - shift პარამეტრი; - მასშტაბის პარამეტრი - არგუმენტის გამა ფუნქცია;

(სმ. ); 63 განაწილება, ე.ი. 30%-ს აქვს ბრტყელი სიმკვრივე გრძელი, ნაზი ფერდობებით და არ შეიძლება აღიწეროს როგორც ნორმალური ან, მაგალითად, ექსპონენციალური. დარჩენილი 45 განაწილება ბიმოდალური აღმოჩნდა.

ცნობილი მეტროლოგის წიგნში პროფ. PV Novitsky წარმოგიდგენთ სხვადასხვა სახის გაზომვის შეცდომების განაწილების კანონების შესწავლის შედეგებს. მან შეისწავლა ელექტრომექანიკური ხელსაწყოების შეცდომების განაწილება ბირთვებზე, ტემპერატურისა და ძალების საზომი ელექტრონული ინსტრუმენტები, ციფრული ინსტრუმენტები ხელით ბალანსირებით. ექსპერიმენტული მონაცემების ნიმუშების მოცულობა თითოეული ნიმუშისთვის იყო 100-400 კითხვა. აღმოჩნდა, რომ 47 განაწილებიდან 46 მნიშვნელოვნად განსხვავდებოდა ნორმალურისგან. შესწავლილი იქნა შეცდომების განაწილების ფორმა Shch-1411 ციფრული ვოლტმეტრის 25 ეგზემპლარში დიაპაზონის 10 წერტილში. შედეგები მსგავსია. დამატებითი ინფორმაცია მოცემულია მონოგრაფიაში.

ტარტუს სახელმწიფო უნივერსიტეტის გამოყენებითი მათემატიკის ლაბორატორიამ გააანალიზა 2500 ნიმუში რეალური სტატისტიკური მონაცემების არქივიდან. 92%-ში ნორმალურობის ჰიპოთეზა უნდა უარყო.

ექსპერიმენტული მონაცემების ზემოაღნიშნული აღწერილობები აჩვენებს, რომ გაზომვის შეცდომებს უმეტეს შემთხვევაში აქვთ განაწილება, რომელიც განსხვავდება ნორმალურიდან. ეს, კერძოდ, ნიშნავს, რომ სტუდენტის t-ტესტის, კლასიკური რეგრესიული ანალიზისა და ნორმალურ თეორიაზე დაფუძნებული სხვა სტატისტიკური მეთოდების უმეტესობა, მკაცრად რომ ვთქვათ, არ არის გამართლებული, რადგან შესაბამისი შემთხვევითი განაწილების ნორმალურობის ძირითადი აქსიომაა. ცვლადები არასწორია.

ცხადია, სტატისტიკური მონაცემების ანალიზის არსებული პრაქტიკის დასაბუთების ან გონივრულად შეცვლის მიზნით, აუცილებელია მონაცემთა ანალიზის პროცედურების თვისებების შესწავლა „არალეგალურ“ აპლიკაციებში. უარყოფის პროცედურების შესწავლამ აჩვენა, რომ ისინი უკიდურესად არასტაბილურია ნორმალურობიდან გადახრის მიმართ და ამიტომ არ არის მიზანშეწონილი მათი გამოყენება რეალური მონაცემების დასამუშავებლად (იხ. ქვემოთ); შესაბამისად, არ შეიძლება იმის მტკიცება, რომ თვითნებურად მიღებული პროცედურა სტაბილურია ნორმალურობიდან გადახრის მიმართ.

ზოგჯერ ვარაუდობენ, რომ ორი ნიმუშის ჰომოგენურობისთვის, მაგალითად, სტუდენტური ტესტის გამოყენებამდე, შეამოწმოთ ნორმალურობა. მიუხედავად იმისა, რომ ამისათვის ბევრი კრიტერიუმი არსებობს, ნორმალურობის ტესტირება უფრო რთული და შრომატევადი სტატისტიკური პროცედურაა, ვიდრე ჰომოგენურობის ტესტირება (როგორც სტუდენტის ტიპის სტატისტიკით, ასევე არაპარამეტრული ტესტებით). ნორმალურობის საკმარისად საიმედოდ დადგენისთვის საჭიროა დაკვირვებების საკმაოდ დიდი რაოდენობა. ასე რომ, იმის უზრუნველსაყოფად, რომ დაკვირვების შედეგების განაწილების ფუნქცია განსხვავდება ზოგიერთი ნორმალურიდან არაუმეტეს 0,01-ით (არგუმენტის ნებისმიერი მნიშვნელობისთვის), საჭიროა დაახლოებით 2500 დაკვირვება. უმეტეს ეკონომიკურ, ტექნიკურ, ბიოსამედიცინო და სხვა გამოყენებით კვლევებში დაკვირვებების რაოდენობა საგრძნობლად ნაკლებია. ეს განსაკუთრებით ეხება იმ მონაცემებს, რომლებიც გამოიყენება ეკონომიკური სტრუქტურებისა და ტექნიკური ობიექტების ფუნქციონირების უსაფრთხოების უზრუნველყოფასთან დაკავშირებული პრობლემების შესწავლისას.

ზოგჯერ ისინი ცდილობენ გამოიყენონ CCT შეცდომის განაწილების ნორმალურთან მიახლოებით, მათ შორის სპეციალური შემკრები საზომი მოწყობილობის ტექნოლოგიურ სქემაში. მოდით შევაფასოთ ამ ღონისძიების სარგებლიანობა. დაე 1 , 2 ,…, - დამოუკიდებელი იდენტურად განაწილებული შემთხვევითი ცვლადები განაწილების ფუნქციით H=(x) ისეთი რომ განიხილოს

დამამატებლის მიერ მოწოდებული ნორმალურობასთან სიახლოვის მაჩვენებელია

ბოლო მიმართებაში მარჯვენა უტოლობა გამომდინარეობს წიგნში მიღებული ბერი-ესენის უტოლობის მუდმივის შეფასებებიდან, ხოლო მარცხენა მონოგრაფიაში მოცემული მაგალითიდან. ნორმალური კანონისთვის = 1.6, ერთიანი კანონისთვის = 1.3, ორპუნქტიანი კანონისთვის = 1 (ეს არის ქვედა ზღვარი). ამიტომ, უზრუნველვყოთ მანძილი (კოლმოგოროვის მეტრიკაში) ნორმალურ განაწილებამდე არაუმეტეს 0,01 "წარუმატებელი" განაწილებისთვის, მინიმუმ 0 პირობები, სადაც

ჩვეულებრივ გამოყენებულ შემკრებებში, ტერმინები გაცილებით მცირეა. შესაძლო განაწილების კლასის შევიწროება , შესაძლებელია, როგორც მონოგრაფიაშია ნაჩვენები, უფრო სწრაფი კონვერგენცია, მაგრამ აქ თეორია ჯერ კიდევ არ ერწყმის პრაქტიკას. გარდა ამისა, გაუგებარია განაწილების სიახლოვე ნორმასთან (გარკვეულ მეტრებში) ასევე უზრუნველყოფს შემთხვევითი ცვლადებიდან აგებული სტატისტიკის განაწილების სიახლოვეს ამ განაწილებასთან ნორმალურ დაკვირვებებთან შესაბამისი სტატისტიკის განაწილებასთან. როგორც ჩანს, თითოეული კონკრეტული სტატისტიკისთვის საჭიროა სპეციალური თეორიული კვლევები, ამ დასკვნამდე მიდის მონოგრაფიის ავტორი. გარე უარყოფის პრობლემებში პასუხია: „არ უზრუნველყოფს“ (იხ. ქვემოთ).

გაითვალისწინეთ, რომ ნებისმიერი რეალური გაზომვის შედეგი ჩაიწერება ათწილადების სასრული რაოდენობის გამოყენებით, ჩვეულებრივ მცირე (2-5), ამიტომ მიზანშეწონილია ნებისმიერი რეალური მონაცემების მოდელირება მხოლოდ დისკრეტული შემთხვევითი ცვლადების გამოყენებით, რომლებიც იღებენ სასრულ რაოდენობას. ნორმალური განაწილება არის მხოლოდ რეალური განაწილების მიახლოება. ასე რომ, მაგალითად, ნაშრომში მოცემული კონკრეტული კვლევის მონაცემები, იღებს მნიშვნელობებს 1.0-დან 2.2-მდე, ე.ი. სულ არის 13 შესაძლო მნიშვნელობა. დირიხლეს პრინციპიდან გამომდინარეობს, რომ რაღაც მომენტში სამუშაო მონაცემების მიხედვით აგებული განაწილების ფუნქცია განსხვავდება უახლოესი ნორმალური განაწილების ფუნქციისგან სულ მცირე 1/26-ით, ე.ი. 0.04-ით. გარდა ამისა, აშკარაა, რომ შემთხვევითი ცვლადის ნორმალური განაწილებისთვის, ათობითი რიცხვების დისკრეტულ სიმრავლეში მოხვედრის ალბათობა ათწილადების მოცემული რაოდენობით არის 0.

ზემოაღნიშნულიდან გამომდინარეობს, რომ გაზომვების შედეგებს და, ზოგადად, სტატისტიკურ მონაცემებს აქვთ ისეთი თვისებები, რაც იწვევს იმ ფაქტს, რომ ისინი უნდა იყოს მოდელირებული შემთხვევითი ცვლადებით განაწილებით, რომლებიც მეტ-ნაკლებად განსხვავდება ნორმალურიდან. უმეტეს შემთხვევაში, განაწილებები მნიშვნელოვნად განსხვავდება ნორმალური განაწილებისგან; სხვებში, ნორმალური განაწილება აშკარად შეიძლება ჩაითვალოს ერთგვარ მიახლოებად, მაგრამ არასოდეს არის სრული დამთხვევა. ეს გულისხმობს როგორც კლასიკური სტატისტიკური პროცედურების თვისებების შესწავლის აუცილებლობას არაკლასიკურ ალბათურ მოდელებში (ისევე, როგორც ქვემოთ მოცემულია სტუდენტის კრიტერიუმისთვის), ასევე სტაბილურობის (ნორმალურიდან გადახრების არსებობის გათვალისწინებით) და განვითარების აუცილებლობას. არაპარამეტრული, მათ შორის განაწილების გარეშე პროცედურების, მათი ფართო დანერგვა სტატისტიკური მონაცემების დამუშავების პრაქტიკაში.

ლიტერატურა

1. Novitsky P.V., Zograf I.A. შეცდომების შეფასება გაზომვის შედეგებში. - L.: Energoatomizdat, 1985. - 248გვ.

2. ნოვიცკი პ.ვ. საზომი ხელსაწყოების ინფორმაციული თეორიის საფუძვლები. - ლ .: ენერგია, 1968. - 248 გვ.

3. ბოროვკოვი ა.ა. ალბათობის თეორია. - მ.: ნაუკა, 1976. - 352გვ.

4. პეტროვი ვ.ვ. დამოუკიდებელი შემთხვევითი ცვლადების ჯამები. - მ.: ნაუკა, 1972. - 416გვ.

5. ზოლოტარევი ვ.მ. დამოუკიდებელი შემთხვევითი ცვლადების შეჯამების თანამედროვე თეორია. - მ.: ნაუკა, 1986. - 416გვ.

6. ეგოროვა ლ.ა., ხარიტონოვი იუ.ს., სოკოლოვსკაია ლ.ვ. // ქარხნის ლაბორატორია. - 1976. V.42. No10. S. 1237 წ.

განვიხილოთ ორი დამოუკიდებელი შემთხვევითი ცვლადი და ნორმალური კანონების დაცვით:

, (12.6.1)

. (12.6.2)

საჭიროა ამ კანონების შედგენის შექმნა, ანუ რაოდენობის განაწილების კანონის პოვნა:

ჩვენ ვიყენებთ ზოგად ფორმულას (12.5.3) განაწილების კანონების შემადგენლობისთვის:

. (12.6.3)

თუ გავხსნით ფრჩხილებს ინტეგრანტის მაჩვენებელში და მოვიყვანთ მსგავს ტერმინებს, მივიღებთ:

,

;

;

.

ამ გამონათქვამების ჩანაცვლება ფორმულაში (9.1.3) ჩვენ უკვე შევხვდით:

, (12.6.4)

გარდაქმნების შემდეგ ვიღებთ:

, (12.6.5)

და ეს სხვა არაფერია, თუ არა ჩვეულებრივი კანონი დისპერსიული ცენტრით

და სტანდარტული გადახრა

. (12.6.7)

იგივე დასკვნის გაკეთება ბევრად უფრო მარტივად შეიძლება შემდეგი თვისებრივი მსჯელობით.

ფრჩხილების გახსნის გარეშე და ინტეგრანდში (12.6.3) გარდაქმნების გარეშე, მაშინვე მივდივართ დასკვნამდე, რომ მაჩვენებელი არის კვადრატული ტრინომია ფორმის მიმართ.

,

სადაც მნიშვნელობა საერთოდ არ შედის კოეფიციენტში, ის შედის კოეფიციენტში პირველ ხარისხში, ხოლო კოეფიციენტში - კვადრატში. ამის გათვალისწინებით და (12.6.4) ფორმულის გამოყენებით მივდივართ დასკვნამდე, რომ არსებობს ექსპონენციალური ფუნქცია, რომლის მაჩვენებელი არის კვადრატული ტრინომი .-ის მიმართ და ამ ტიპის განაწილების სიმკვრივე შეესაბამება ნორმალურ კანონს. ამრიგად, მივდივართ წმინდა ხარისხობრივ დასკვნამდე: რაოდენობის განაწილების კანონი უნდა იყოს ნორმალური.

ამ კანონის - და - პარამეტრების საპოვნელად ვიყენებთ მათემატიკური მოლოდინების შეკრების თეორემას და დისპერსიების შეკრების თეორემას. მათემატიკური მოლოდინების შეკრების თეორემის მიხედვით

დისპერსიის მიმატების თეორემის მიხედვით

აქედან მოდის ფორმულა (12.6.7).

სტანდარტული გადახრებიდან მათ პროპორციულ სავარაუდო გადახრებზე გადასვლისას მივიღებთ:

ამრიგად, ჩვენ მივედით შემდეგ წესამდე: როდესაც ნორმალური კანონები შედგენილია, კვლავ მიიღება ნორმალური კანონი და ჯამდება მათემატიკური მოლოდინები და დისპერსიები (ან სავარაუდო გადახრების კვადრატი).

ნორმალური კანონების შემადგენლობის წესი შეიძლება განზოგადდეს დამოუკიდებელი შემთხვევითი ცვლადების თვითნებური რაოდენობის შემთხვევაში.

თუ არსებობს დამოუკიდებელი შემთხვევითი ცვლადები:

ექვემდებარება ნორმალურ კანონებს გაფანტული ცენტრებით

და სტანდარტული გადახრები

,

შემდეგ ღირებულება

ასევე ემორჩილება ნორმალურ კანონს პარამეტრებით

ფორმულის ნაცვლად (12.6.12) შეგიძლიათ გამოიყენოთ ექვივალენტური ფორმულა:

თუ შემთხვევითი ცვლადების სისტემა განაწილებულია ნორმალური კანონის მიხედვით, მაგრამ რაოდენობები დამოკიდებულია, მაშინ ადვილია იმის დამტკიცება, როგორც ადრე, ზოგადი ფორმულის საფუძველზე (12.5.1), რომ რაოდენობის განაწილების კანონია.

ასევე არსებობს ნორმალური კანონი. გაფანტვის ცენტრები კვლავ ალგებრულად არის დამატებული, მაგრამ სტანდარტული გადახრებისთვის წესი უფრო რთული ხდება:

, (12.6.14)

სად არის მნიშვნელობების კორელაციის კოეფიციენტი და.

რამდენიმე დამოკიდებული შემთხვევითი ცვლადის დამატებისას, რომლებიც მთლიანობაში ემორჩილებიან ნორმალურ კანონს, ჯამის განაწილების კანონიც ნორმალური აღმოჩნდება პარამეტრებით.

, (12.6.16)

ან სავარაუდო გადახრები

, (12.6.17)

სადაც არის მნიშვნელობების კორელაციის კოეფიციენტი და ჯამი ვრცელდება მნიშვნელობების ყველა სხვადასხვა წყვილულ კომბინაციაზე.

ჩვენ დავინახეთ ნორმალური კანონის ძალიან მნიშვნელოვანი თვისება: როდესაც ნორმალური კანონები გაერთიანებულია, ადამიანი კვლავ იღებს ნორმალურ კანონს. ეს არის ეგრეთ წოდებული „სტაბილურობის თვისება“. განაწილების კანონი ითვლება სტაბილურად, თუ ამ ტიპის ორი კანონის შედგენით კვლავ მიიღება იგივე ტიპის კანონი. ჩვენ ზემოთ ვაჩვენეთ, რომ ნორმალური კანონი სტაბილურია. ძალიან ცოტა განაწილების კანონს აქვს სტაბილურობის თვისება. წინაში (მაგალითი 2), ჩვენ დავრწმუნდით, რომ, მაგალითად, ერთგვაროვანი სიმკვრივის კანონი არასტაბილურია: 0-დან 1-მდე მონაკვეთებში ერთიანი სიმკვრივის ორი კანონის შედგენისას მივიღეთ სიმპსონის კანონი.

ნორმალური კანონის სტაბილურობა მისი პრაქტიკაში ფართო გამოყენების ერთ-ერთი აუცილებელი პირობაა. თუმცა, სტაბილურობის თვისებას, გარდა ნორმალურისა, გააჩნია სხვა განაწილების კანონებიც. ნორმალური კანონის თავისებურება ის არის, რომ როდესაც შედგენილია საკმარისად დიდი რაოდენობის პრაქტიკულად თვითნებური განაწილების კანონები, მთლიანი კანონი აღმოჩნდება თვითნებურად ახლოს ნორმალურთან, მიუხედავად იმისა, თუ როგორი იყო ტერმინების განაწილების კანონები. ამის ილუსტრაცია შეიძლება, მაგალითად, ერთიანი სიმკვრივის სამი კანონის შედგენით მონაკვეთებში 0-დან 1-მდე. მიღებული განაწილების კანონი ნაჩვენებია ნახ. 12.6.1. როგორც ნახატიდან ჩანს, ფუნქციის გრაფიკი ძალიან ჰგავს ჩვეულებრივი კანონის გრაფიკს.

4.1. დაკვირვებების განაწილება ხშირად ნორმალურია?

გამოიყენება ეკონომეტრიულ და ეკონომიკურ-მათემატიკურ მოდელებში, კერძოდ, მარკეტინგული და მენეჯმენტის პროცესების შესწავლასა და ოპტიმიზაციაში, საწარმო და რეგიონული მენეჯმენტი, ტექნოლოგიური პროცესების სიზუსტე და სტაბილურობა, საიმედოობის, უსაფრთხოების, მათ შორის ეკოლოგიური უსაფრთხოების, ტექნიკური ფუნქციონირების პრობლემები. მოწყობილობები და ობიექტები, ორგანიზაციული სქემების შემუშავება ხშირად იყენებენ ალბათობის თეორიის ცნებებსა და შედეგებს და მათემატიკური სტატისტიკას. ამ შემთხვევაში, ხშირად გამოიყენება ალბათობის განაწილების გარკვეული პარამეტრული ოჯახები. ყველაზე პოპულარულია ნორმალური განაწილება. ასევე გამოიყენება ლოგ-ნორმალური განაწილება, ექსპონენციალური განაწილება, გამა განაწილება, ვეიბულ-გნედენკოს განაწილება და ა.შ.

ცხადია, ყოველთვის აუცილებელია მოდელების რეალობასთან შესაბამისობის შემოწმება. არის ორი კითხვა. განსხვავდება თუ არა რეალური განაწილებები მოდელში გამოყენებული განაწილებისგან? რამდენად მოქმედებს ეს განსხვავება დასკვნებზე?

ქვემოთ, ნორმალური განაწილების მაგალითისა და მასზე დაფუძნებული მკვეთრად განსხვავებული დაკვირვებების (აუცილებელთა) უარყოფის მეთოდების გამოყენებით, ნაჩვენებია, რომ რეალური განაწილებები თითქმის ყოველთვის განსხვავდება კლასიკურ პარამეტრულ ოჯახებში შემავალთაგან და არსებული გადახრები მოცემული ოჯახებიდან. არასწორი დასკვნების გაკეთება განსახილველ შემთხვევაში ამ ოჯახების სარგებლობის საფუძველზე უარის თქმის შესახებ.

არსებობს რაიმე მიზეზი, რომ აპრიორი ვივარაუდოთ გაზომვის შედეგების ნორმალურობა?

ზოგჯერ ამტკიცებენ, რომ იმ შემთხვევაში, როდესაც გაზომვის შეცდომა (ან სხვა შემთხვევითი ცვლადი) განისაზღვრება მრავალი მცირე ფაქტორის კუმულაციური მოქმედების შედეგად, მაშინ, ალბათობის თეორიის ცენტრალური ლიმიტის თეორემის (CLT) გამო, ეს მნიშვნელობა არის კარგად მიახლოებული (განაწილების მიხედვით) ნორმალური შემთხვევითი ცვლადით. ეს განცხადება მართალია, თუ მცირე ფაქტორები მოქმედებენ დანამატად და ერთმანეთისგან დამოუკიდებლად. თუ ისინი მოქმედებენ მრავლობითად, მაშინ, ერთი და იგივე CLT-ის გამო, საჭიროა დაახლოება ლოგ-ნორმალური განაწილებით. გამოყენებითი პრობლემების დროს, როგორც წესი, შეუძლებელია მცირე ფაქტორების მოქმედების ადიტიურობის და არა მრავალმხრივობის დასაბუთება. თუ დამოკიდებულება ზოგადი ხასიათისაა, არ არის დაყვანილი დანამატის ან გამრავლების ფორმაზე და არ არსებობს საფუძველი, მივიღოთ მოდელები, რომლებიც იძლევა ექსპონენციალურ, ვეიბულ-გნედენკოს, გამას ან სხვა განაწილებებს, მაშინ პრაქტიკულად არაფერია ცნობილი განაწილების შესახებ. საბოლოო შემთხვევითი ცვლადი, გარდა შიდა მათემატიკური თვისებებისა, როგორიცაა კანონზომიერება.

კონკრეტული მონაცემების დამუშავებისას, ზოგჯერ ითვლება, რომ გაზომვის შეცდომებს აქვთ ნორმალური განაწილება. ნორმალურობის დაშვებით აგებულია რეგრესიის, დისპერსიის, ფაქტორული ანალიზის, მეტროლოგიური მოდელების კლასიკური მოდელები, რომლებიც კვლავაც გვხვდება როგორც შიდა მარეგულირებელ და ტექნიკურ დოკუმენტაციაში, ასევე საერთაშორისო სტანდარტებში. ეკონომიკური სტრუქტურების, ტექნიკური მოწყობილობებისა და ობიექტების ფუნქციონირების უსაფრთხოების უზრუნველსაყოფად სისტემების დიზაინში გამოყენებული გარკვეული მახასიათებლების მაქსიმალური მიღწევადი დონის გამოსათვლელი მოდელები ეფუძნება იმავე ვარაუდს. თუმცა, ასეთი ვარაუდის თეორიული საფუძველი არ არსებობს. აუცილებელია შეცდომების განაწილების ექსპერიმენტული შესწავლა.

რას აჩვენებს ექსპერიმენტის შედეგები? მონოგრაფიაში მოცემული რეზიუმე საშუალებას გვაძლევს განვაცხადოთ, რომ უმეტეს შემთხვევაში გაზომვის შეცდომების განაწილება განსხვავდება ნორმალურიდან. ამრიგად, მანქანა-ელექტროტექნიკურ ინსტიტუტში (ვარნა, ბულგარეთი) შეისწავლეს კალიბრაციის შეცდომების განაწილება ანალოგური ელექტრო საზომი ხელსაწყოების სასწორებზე. შეისწავლეს ჩეხოსლოვაკიაში, სსრკ-სა და ბულგარეთში წარმოებული მოწყობილობები. შეცდომების განაწილების კანონი იგივე აღმოჩნდა. მას აქვს სიმკვრივე

ჩვენ გავაანალიზეთ სხვადასხვა ავტორის მიერ შესწავლილი შეცდომების 219 რეალური განაწილების პარამეტრების მონაცემები, როდესაც გავზომეთ როგორც ელექტრული, ისე არაელექტრული სიდიდეები მრავალფეროვანი (ელექტრული) მოწყობილობებით. ამ კვლევის შედეგად აღმოჩნდა, რომ 111 განაწილება, ე.ი. დაახლოებით 50% მიეკუთვნება სიმკვრივის განაწილების კლასს

სად არის ხარისხი პარამეტრი; - shift პარამეტრი; - მასშტაბის პარამეტრი; - არგუმენტის გამა ფუნქცია;

(სმ. ); 63 განაწილება, ე.ი. 30%-ს აქვს ბრტყელი სიმკვრივე გრძელი, ნაზი ფერდობებით და არ შეიძლება აღიწეროს როგორც ნორმალური ან, მაგალითად, ექსპონენციალური. დარჩენილი 45 განაწილება ბიმოდალური აღმოჩნდა.

ცნობილი მეტროლოგის წიგნში პროფ. PV Novitsky წარმოგიდგენთ სხვადასხვა სახის გაზომვის შეცდომების განაწილების კანონების შესწავლის შედეგებს. მან შეისწავლა ელექტრომექანიკური ხელსაწყოების შეცდომების განაწილება ბირთვებზე, ტემპერატურისა და ძალების საზომი ელექტრონული ინსტრუმენტები, ციფრული ინსტრუმენტები ხელით ბალანსირებით. ექსპერიმენტული მონაცემების ნიმუშების მოცულობა თითოეული ნიმუშისთვის იყო 100-400 კითხვა. აღმოჩნდა, რომ 47 განაწილებიდან 46 მნიშვნელოვნად განსხვავდებოდა ნორმალურისგან. შესწავლილი იქნა შეცდომების განაწილების ფორმა Shch-1411 ციფრული ვოლტმეტრის 25 ეგზემპლარში დიაპაზონის 10 წერტილში. შედეგები მსგავსია. დამატებითი ინფორმაცია მოცემულია მონოგრაფიაში.

ტარტუს სახელმწიფო უნივერსიტეტის გამოყენებითი მათემატიკის ლაბორატორიამ გააანალიზა 2500 ნიმუში რეალური სტატისტიკური მონაცემების არქივიდან. 92%-ში ნორმალურობის ჰიპოთეზა უნდა უარყო.

ექსპერიმენტული მონაცემების ზემოაღნიშნული აღწერილობები აჩვენებს, რომ გაზომვის შეცდომებს უმეტეს შემთხვევაში აქვთ განაწილება, რომელიც განსხვავდება ნორმალურიდან. ეს, კერძოდ, ნიშნავს, რომ სტუდენტის t-ტესტის, კლასიკური რეგრესიული ანალიზისა და ნორმალურ თეორიაზე დაფუძნებული სხვა სტატისტიკური მეთოდების უმეტესობა, მკაცრად რომ ვთქვათ, არ არის გამართლებული, რადგან შესაბამისი შემთხვევითი განაწილების ნორმალურობის ძირითადი აქსიომაა. ცვლადები არასწორია.

ცხადია, სტატისტიკური მონაცემების ანალიზის არსებული პრაქტიკის დასაბუთების ან გონივრულად შეცვლის მიზნით, აუცილებელია მონაცემთა ანალიზის პროცედურების თვისებების შესწავლა „არალეგალურ“ აპლიკაციებში. უარყოფის პროცედურების შესწავლამ აჩვენა, რომ ისინი უკიდურესად არასტაბილურია ნორმალურობიდან გადახრის მიმართ და ამიტომ არ არის მიზანშეწონილი მათი გამოყენება რეალური მონაცემების დასამუშავებლად (იხ. ქვემოთ); შესაბამისად, არ შეიძლება იმის მტკიცება, რომ თვითნებურად მიღებული პროცედურა სტაბილურია ნორმალურობიდან გადახრის მიმართ.

ზოგჯერ ვარაუდობენ, რომ ორი ნიმუშის ჰომოგენურობისთვის, მაგალითად, სტუდენტური ტესტის გამოყენებამდე, შეამოწმოთ ნორმალურობა. მიუხედავად იმისა, რომ ამისათვის ბევრი კრიტერიუმი არსებობს, ნორმალურობის ტესტირება უფრო რთული და შრომატევადი სტატისტიკური პროცედურაა, ვიდრე ჰომოგენურობის ტესტირება (როგორც სტუდენტის ტიპის სტატისტიკით, ასევე არაპარამეტრული ტესტებით). ნორმალურობის საკმარისად საიმედოდ დადგენისთვის საჭიროა დაკვირვებების საკმაოდ დიდი რაოდენობა. ასე რომ, იმის უზრუნველსაყოფად, რომ დაკვირვების შედეგების განაწილების ფუნქცია განსხვავდება ნორმალურიდან არაუმეტეს 0,01-ით (არგუმენტის ნებისმიერი მნიშვნელობისთვის), საჭიროა დაახლოებით 2500 დაკვირვება. უმეტეს ეკონომიკურ, ტექნიკურ, ბიოსამედიცინო და სხვა გამოყენებითი კვლევების დროს დაკვირვებების რაოდენობა საგრძნობლად ნაკლებია. ეს განსაკუთრებით ეხება იმ მონაცემებს, რომლებიც გამოიყენება ეკონომიკური სტრუქტურებისა და ტექნიკური ობიექტების ფუნქციონირების უსაფრთხოების უზრუნველყოფასთან დაკავშირებული პრობლემების შესწავლისას.

ზოგჯერ ისინი ცდილობენ გამოიყენონ CCT შეცდომის განაწილების ნორმალურთან მიახლოებით, მათ შორის სპეციალური შემკრები საზომი მოწყობილობის ტექნოლოგიურ სქემაში. მოდით შევაფასოთ ამ ღონისძიების სარგებლიანობა. დაე Z 1, Z 2,…, ზ კ- დამოუკიდებელი იდენტურად განაწილებული შემთხვევითი ცვლადები განაწილების ფუნქციით H = H(x)ისეთი რომ განიხილოს

დამამატებლის მიერ მოწოდებული ნორმალურობასთან სიახლოვის მაჩვენებელია

ბოლო მიმართებაში მარჯვენა უტოლობა გამომდინარეობს წიგნში მიღებული ბერი-ესენის უტოლობის მუდმივის შეფასებით, ხოლო მარცხენა მონოგრაფიაში მოცემული მაგალითიდან. ნორმალური კანონისთვის = 1.6, ერთიანი კანონისთვის = 1.3, ორპუნქტიანი კანონისთვის = 1 (ეს არის ქვედა ზღვარი). ამიტომ, უზრუნველვყოთ მანძილი (კოლმოგოროვის მეტრიკაში) ნორმალურ განაწილებამდე არაუმეტეს 0,01 "წარუმატებელი" განაწილებისთვის, მინიმუმ k 0პირობები, სადაც

ჩვეულებრივ გამოყენებულ შემკრებებში, ტერმინები გაცილებით მცირეა. შესაძლო განაწილების კლასის შევიწროება , შეიძლება მივიღოთ, როგორც მონოგრაფიაშია ნაჩვენები, უფრო სწრაფი კონვერგენცია, მაგრამ აქ თეორია ჯერ კიდევ არ ერწყმის პრაქტიკას. გარდა ამისა, გაუგებარია განაწილების სიახლოვე ნორმასთან (გარკვეულ მეტრებში) ასევე უზრუნველყოფს შემთხვევითი ცვლადებიდან აგებული სტატისტიკის განაწილების სიახლოვეს ამ განაწილებასთან ნორმალურ დაკვირვებებთან შესაბამისი სტატისტიკის განაწილებასთან. როგორც ჩანს, თითოეული კონკრეტული სტატისტიკისთვის საჭიროა სპეციალური თეორიული კვლევები, ამ დასკვნამდე მიდის მონოგრაფიის ავტორი. გარე უარყოფის პრობლემებში პასუხია: „არ უზრუნველყოფს“ (იხ. ქვემოთ).

გაითვალისწინეთ, რომ ნებისმიერი რეალური გაზომვის შედეგი ჩაიწერება ათწილადების სასრული რაოდენობის გამოყენებით, ჩვეულებრივ მცირე (2-5), ამიტომ მიზანშეწონილია ნებისმიერი რეალური მონაცემების მოდელირება მხოლოდ დისკრეტული შემთხვევითი ცვლადების გამოყენებით, რომლებიც იღებენ სასრულ რაოდენობას. ნორმალური განაწილება არის მხოლოდ რეალური განაწილების მიახლოება. ასე რომ, მაგალითად, ნაშრომში მოცემული კონკრეტული კვლევის მონაცემები, იღებს მნიშვნელობებს 1.0-დან 2.2-მდე, ე.ი. სულ არის 13 შესაძლო მნიშვნელობა. დირიხლეს პრინციპიდან გამომდინარეობს, რომ რაღაც მომენტში სამუშაო მონაცემების მიხედვით აგებული განაწილების ფუნქცია განსხვავდება უახლოესი ნორმალური განაწილების ფუნქციისგან სულ მცირე 1/26-ით, ე.ი. 0.04-ით. გარდა ამისა, აშკარაა, რომ შემთხვევითი ცვლადის ნორმალური განაწილებისთვის, ათობითი რიცხვების დისკრეტულ სიმრავლეში მოხვედრის ალბათობა ათწილადების მოცემული რაოდენობით არის 0.

ზემოაღნიშნულიდან გამომდინარეობს, რომ გაზომვების შედეგებს და, ზოგადად, სტატისტიკურ მონაცემებს აქვთ ისეთი თვისებები, რაც იწვევს იმ ფაქტს, რომ ისინი უნდა იყოს მოდელირებული შემთხვევითი ცვლადებით განაწილებით, რომლებიც მეტ-ნაკლებად განსხვავდება ნორმალურიდან. უმეტეს შემთხვევაში, განაწილებები მნიშვნელოვნად განსხვავდება ნორმალური განაწილებისგან; სხვებში, ნორმალური განაწილება აშკარად შეიძლება ჩაითვალოს ერთგვარ მიახლოებად, მაგრამ არასოდეს არის სრული დამთხვევა. ეს გულისხმობს როგორც კლასიკური სტატისტიკური პროცედურების თვისებების შესწავლის აუცილებლობას არაკლასიკურ ალბათურ მოდელებში (ისევე, როგორც ქვემოთ მოცემულია სტუდენტის კრიტერიუმისთვის), ასევე სტაბილურობის (ნორმალურიდან გადახრების არსებობის გათვალისწინებით) და განვითარების აუცილებლობას. არაპარამეტრული, მათ შორის განაწილების გარეშე პროცედურების, მათი ფართო დანერგვა სტატისტიკური მონაცემების დამუშავების პრაქტიკაში.

სხვა პარამეტრული ოჯახებისთვის აქ გამოტოვებული მოსაზრებები მსგავს დასკვნამდე მივყავართ. შედეგი შეიძლება ჩამოყალიბდეს შემდეგნაირად. რეალური მონაცემების განაწილება თითქმის არასოდეს მიეკუთვნება რომელიმე კონკრეტულ პარამეტრულ ოჯახს. რეალური განაწილებები ყოველთვის განსხვავდება პარამეტრულ ოჯახებში შემავალი განაწილებისგან. განსხვავებები შეიძლება იყოს დიდი ან მცირე, მაგრამ ისინი ყოველთვის არსებობს. შევეცადოთ გავიგოთ, რამდენად მნიშვნელოვანია ეს განსხვავებები ეკონომეტრიული ანალიზისთვის.

ალბათობის თეორიასა და მათემატიკურ სტატისტიკაში გათვალისწინებულია რიცხვითი შემთხვევითი ცვლადების განაწილების სხვადასხვა პარამეტრული ოჯახი. კერძოდ, შესწავლილია ნორმალური განაწილების ოჯახები, ლოგარითმულად ნორმალური, ექსპონენციალური, გამა განაწილება, ვეიბულ-გნედენკოს განაწილება და ა.შ.. ყველა მათგანი დამოკიდებულია ერთ, ორ ან სამ პარამეტრზე. ამიტომ, განაწილების სრულად აღსაწერად, საკმარისია ვიცოდეთ ან შეაფასოთ ერთი, ორი ან სამი რიცხვი. ძალიან კომფორტულად. აქედან გამომდინარე, ფართოდ არის განვითარებული მათემატიკური სტატისტიკის პარამეტრული თეორია, რომელშიც ვარაუდობენ, რომ დაკვირვების შედეგების განაწილება ეკუთვნის ამა თუ იმ პარამეტრულ ოჯახს.

სამწუხაროდ, პარამეტრული ოჯახები არსებობს მხოლოდ ალბათობის თეორიისა და მათემატიკური სტატისტიკის სახელმძღვანელოების ავტორთა გონებაში. ისინი რეალურ ცხოვრებაში არ არსებობენ. ამიტომ, ეკონომეტრია ძირითადად იყენებს არაპარამეტრულ მეთოდებს, რომლებშიც დაკვირვების შედეგების განაწილებას შეიძლება ჰქონდეს თვითნებური ფორმა.

პირველ რიგში, ნორმალური განაწილების მაგალითის გამოყენებით, უფრო დეტალურად განვიხილავთ პარამეტრული ოჯახების პრაქტიკული გამოყენების შეუძლებლობას კონკრეტული ეკონომიკური მონაცემების განაწილების აღსაწერად. შემდეგ ჩვენ გავაანალიზებთ გარე დაკვირვებების უარყოფის პარამეტრულ მეთოდებს და ვაჩვენებთ პარამეტრული სტატისტიკის მთელი რიგი მეთოდების პრაქტიკული გამოყენების შეუძლებლობას, მათ მიერ გამოტანილი დასკვნების მცდარობას. შემდეგ გავაანალიზებთ რიცხვითი შემთხვევითი ცვლადების ძირითადი მახასიათებლების ნდობის შეფასების არაპარამეტრულ მეთოდებს - მათემატიკური მოლოდინი, მედიანა, ვარიაცია, სტანდარტული გადახრა, ვარიაციის კოეფიციენტი. ლექცია დასრულდება ორი ნიმუშის ჰომოგენურობის შემოწმების მეთოდებით, დამოუკიდებელი თუ დაკავშირებული.

დაკვირვებების განაწილება ხშირად ნორმალურია?

გამოიყენება ეკონომეტრიულ და ეკონომიკურ-მათემატიკურ მოდელებში, კერძოდ, მარკეტინგული და მენეჯმენტის პროცესების შესწავლასა და ოპტიმიზაციაში, საწარმო და რეგიონული მენეჯმენტი, ტექნოლოგიური პროცესების სიზუსტე და სტაბილურობა, საიმედოობის, უსაფრთხოების, მათ შორის ეკოლოგიური უსაფრთხოების, ტექნიკური ფუნქციონირების პრობლემები. მოწყობილობები და ობიექტები, ორგანიზაციული სქემების შემუშავება ხშირად იყენებენ ალბათობის თეორიის ცნებებსა და შედეგებს და მათემატიკური სტატისტიკას. ამ შემთხვევაში, ხშირად გამოიყენება ალბათობის განაწილების გარკვეული პარამეტრული ოჯახები. Ყველაზე პოპულარული ნორმალური დისტრიბუცია. ასევე გამოიყენება ლოგარითმულად ნორმალური დისტრიბუცია, ექსპონენციალური განაწილება, გამა განაწილება, ვეიბულ-გნედენკოს განაწილება და ა.შ.

ცხადია, ყოველთვის აუცილებელია მოდელების რეალობასთან შესაბამისობის შემოწმება. არის ორი კითხვა. განსხვავდება თუ არა რეალური განაწილებები მოდელში გამოყენებული განაწილებისგან? რამდენად მოქმედებს ეს განსხვავება დასკვნებზე?

ქვემოთ, ნორმალური განაწილების მაგალითისა და მასზე დაფუძნებული მკვეთრად განსხვავებული დაკვირვებების (აუცილებელთა) უარყოფის მეთოდების გამოყენებით, ნაჩვენებია, რომ რეალური განაწილებები თითქმის ყოველთვის განსხვავდება კლასიკურ პარამეტრულ ოჯახებში შემავალთაგან და არსებული გადახრები მოცემული ოჯახებიდან. არასწორი დასკვნების გაკეთება განსახილველ შემთხვევაში ამ ოჯახების სარგებლობის საფუძველზე უარის თქმის შესახებ.

არსებობს რაიმე მიზეზი, რომ აპრიორი ვივარაუდოთ გაზომვის შედეგების ნორმალურობა?

ზოგჯერ ამტკიცებენ, რომ იმ შემთხვევაში, როდესაც გაზომვის შეცდომა (ან სხვა შემთხვევითი მნიშვნელობა) განისაზღვრება მრავალი მცირე ფაქტორის ერთობლივი მოქმედების შედეგად, შემდეგ, ალბათობის თეორიის ცენტრალური ლიმიტის თეორემის (CLT) ძალით, ეს მნიშვნელობა კარგად არის მიახლოებული (განაწილებით) ნორმალური შემთხვევითი ცვლადით. ეს განცხადება მართალია, თუ მცირე ფაქტორები მოქმედებენ დანამატად და ერთმანეთისგან დამოუკიდებლად. თუ ისინი მოქმედებენ მრავლობითად, მაშინ, ერთი და იგივე CLT-ის გამო, საჭიროა დაახლოება ლოგ-ნორმალური განაწილებით. გამოყენებითი პრობლემების დროს, როგორც წესი, შეუძლებელია მცირე ფაქტორების მოქმედების ადიტიურობის და არა მრავალმხრივობის დასაბუთება. თუ დამოკიდებულება ზოგადი ხასიათისაა, არ არის დაყვანილი დანამატის ან გამრავლების ფორმაზე და არ არსებობს საფუძველი, მივიღოთ მოდელები, რომლებიც იძლევა ექსპონენციალურ, ვეიბულ-გნედენკოს, გამას ან სხვა განაწილებებს, მაშინ პრაქტიკულად არაფერია ცნობილი განაწილების შესახებ. საბოლოო შემთხვევითი ცვლადი, გარდა შიდა მათემატიკური თვისებებისა, როგორიცაა კანონზომიერება.

კონკრეტული მონაცემების დამუშავებისას, ზოგჯერ ითვლება, რომ გაზომვის შეცდომები აქვს ნორმალური დისტრიბუცია. ნორმალურობის დაშვებით, რეგრესიის, დისპერსიის კლასიკური მოდელები, ფაქტორების ანალიზები, მეტროლოგიური მოდელები, რომლებიც დღემდე გრძელდება როგორც შიდა ნორმატიულ და ტექნიკურ დოკუმენტაციაში, ასევე საერთაშორისო სტანდარტებში. ეკონომიკური სტრუქტურების, ტექნიკური მოწყობილობებისა და ობიექტების ფუნქციონირების უსაფრთხოების უზრუნველსაყოფად სისტემების დიზაინში გამოყენებული გარკვეული მახასიათებლების მაქსიმალური მიღწევადი დონის გამოსათვლელი მოდელები ეფუძნება იმავე ვარაუდს. თუმცა, ასეთი ვარაუდის თეორიული საფუძველი არ არსებობს. აუცილებელია შეცდომების განაწილების ექსპერიმენტული შესწავლა.

რას აჩვენებს ექსპერიმენტის შედეგები? მონოგრაფიაში მოცემული რეზიუმე საშუალებას გვაძლევს განვაცხადოთ, რომ უმეტეს შემთხვევაში გაზომვის შეცდომების განაწილება განსხვავდება ნორმალურიდან. ამრიგად, მანქანა-ელექტროტექნიკურ ინსტიტუტში (ვარნა, ბულგარეთი) შეისწავლეს კალიბრაციის შეცდომების განაწილება ანალოგური ელექტრო საზომი ხელსაწყოების სასწორებზე. შეისწავლეს ჩეხოსლოვაკიაში, სსრკ-სა და ბულგარეთში წარმოებული მოწყობილობები. შეცდომების განაწილების კანონი იგივე აღმოჩნდა. მას აქვს სიმკვრივე

ჩვენ გავაანალიზეთ სხვადასხვა ავტორის მიერ შესწავლილი შეცდომების 219 რეალური განაწილების პარამეტრების მონაცემები, როდესაც გავზომეთ როგორც ელექტრული, ისე არაელექტრული სიდიდეები მრავალფეროვანი (ელექტრული) მოწყობილობებით. ამ კვლევის შედეგად აღმოჩნდა, რომ 111 განაწილება, ე.ი. დაახლოებით 50% მიეკუთვნება სიმკვრივის განაწილების კლასს

სად არის ხარისხი პარამეტრი; - shift პარამეტრი; - მასშტაბის პარამეტრი; - არგუმენტის გამა ფუნქცია;

ტარტუს სახელმწიფო უნივერსიტეტის გამოყენებითი მათემატიკის ლაბორატორიამ გააანალიზა 2500 ნიმუში რეალური სტატისტიკური მონაცემების არქივიდან. 92%-ში ნორმალურობის ჰიპოთეზა უნდა უარყო.

ექსპერიმენტული მონაცემების ზემოაღნიშნული აღწერილობები აჩვენებს, რომ გაზომვის შეცდომებს უმეტეს შემთხვევაში აქვთ განაწილება, რომელიც განსხვავდება ნორმალურიდან. ეს ნიშნავს, კერძოდ, რომ სტუდენტთა t-ტესტის უმეტესი აპლიკაციები კლასიკურია რეგრესიული ანალიზიდა ნორმალურ თეორიაზე დაფუძნებული სხვა სტატისტიკური მეთოდები, მკაცრად რომ ვთქვათ, არ არის გამართლებული, რადგან მათ საფუძველში მყოფი შესაბამისი შემთხვევითი ცვლადების განაწილების ნორმალურობის აქსიომა არასწორია.

ცხადია, სტატისტიკური მონაცემების ანალიზის არსებული პრაქტიკის დასაბუთების ან გონივრული შეცვლის მიზნით, საჭიროა მონაცემთა ანალიზის პროცედურების თვისებების შესწავლა „არალეგალურ“ აპლიკაციებში. უარყოფის პროცედურების შესწავლამ აჩვენა, რომ ისინი უკიდურესად არასტაბილურია ნორმალურობიდან გადახრის მიმართ და ამიტომ არ არის მიზანშეწონილი მათი გამოყენება რეალური მონაცემების დასამუშავებლად (იხ. ქვემოთ); შესაბამისად, არ შეიძლება იმის მტკიცება, რომ თვითნებურად მიღებული პროცედურა სტაბილურია ნორმალურობიდან გადახრის მიმართ.

ზოგჯერ ვარაუდობენ, რომ ორი ნიმუშის ჰომოგენურობისთვის, მაგალითად, სტუდენტური ტესტის გამოყენებამდე, შეამოწმოთ ნორმალურობა. მიუხედავად იმისა, რომ ამისათვის ბევრი კრიტერიუმი არსებობს, ნორმალურობის ტესტირება უფრო რთული და შრომატევადი სტატისტიკური პროცედურაა, ვიდრე ჰომოგენურობის ტესტირება (როგორც სტუდენტის ტიპის სტატისტიკით, ასევე არაპარამეტრული ტესტებით). ნორმალურობის საკმარისად საიმედოდ დადგენისთვის საჭიროა დაკვირვებების საკმაოდ დიდი რაოდენობა. ასე რომ, იმის უზრუნველსაყოფად, რომ დაკვირვების შედეგების განაწილების ფუნქცია განსხვავდება ნორმალურიდან არაუმეტეს 0,01-ით (არგუმენტის ნებისმიერი მნიშვნელობისთვის), საჭიროა დაახლოებით 2500 დაკვირვება. უმეტეს ეკონომიკურ, ტექნიკურ, ბიოსამედიცინო და სხვა გამოყენებით კვლევებში დაკვირვებების რაოდენობა საგრძნობლად ნაკლებია. ეს განსაკუთრებით ეხება იმ მონაცემებს, რომლებიც გამოიყენება ეკონომიკური სტრუქტურებისა და ტექნიკური ობიექტების ფუნქციონირების უსაფრთხოების უზრუნველყოფასთან დაკავშირებული პრობლემების შესწავლისას.

ზოგჯერ ისინი ცდილობენ გამოიყენონ CCT შეცდომის განაწილების ნორმალურთან მიახლოებით, მათ შორის სპეციალური შემკრები საზომი მოწყობილობის ტექნოლოგიურ სქემაში. მოდით შევაფასოთ ამ ღონისძიების სარგებლიანობა. მოდით იყოს დამოუკიდებელი იდენტურად განაწილებული შემთხვევითი ცვლადები განაწილების ფუნქციით ისეთი რომ განიხილოს

დამამატებლის მიერ მოწოდებული ნორმალურობასთან სიახლოვის მაჩვენებელია

ბოლო მიმართებაში მარჯვენა უტოლობა გამომდინარეობს წიგნში მიღებული ბერი-ესენის უტოლობის მუდმივის შეფასებით, ხოლო მარცხენა მონოგრაფიაში მოცემული მაგალითიდან. ამისთვის ნორმალური კანონი, ერთიანისთვის, ორპუნქტიანისთვის (ეს არის ქვედა ზღვარი ). ამრიგად, მანძილის უზრუნველსაყოფად (კოლმოგოროვის მეტრიკაში) ნორმალურ განაწილებამდე არაუმეტეს 0,01 "წარუმატებელი" განაწილებისთვის, საჭიროა მინიმუმ ტერმინები, სადაც ალბათობაა ათწილადი რიცხვების დისკრეტულ სიმრავლეში მოცემული რიცხვით. ათობითი ადგილები უდრის 0-ს.

ზემოაღნიშნულიდან გამომდინარეობს, რომ გაზომვების შედეგებს და, ზოგადად, სტატისტიკურ მონაცემებს აქვთ ისეთი თვისებები, რაც იწვევს იმ ფაქტს, რომ ისინი უნდა იყოს მოდელირებული შემთხვევითი ცვლადებით განაწილებით, რომლებიც მეტ-ნაკლებად განსხვავდება ნორმალურიდან. უმეტეს შემთხვევაში, განაწილებები მნიშვნელოვნად განსხვავდება ნორმალური განაწილებისგან, სხვებში ნორმალური განაწილება აშკარად შეიძლება ჩაითვალოს ერთგვარ მიახლოებად, მაგრამ არასოდეს არის სრული დამთხვევა. ეს გულისხმობს როგორც კლასიკური სტატისტიკური პროცედურების თვისებების შესწავლის აუცილებლობას არაკლასიკურში სავარაუდო მოდელები(ისევე, რაც ქვემოთ კეთდება Student-ის t-ტესტისთვის) და სტაბილური (ნორმალურიდან გადახრების არსებობის გათვალისწინებით) და არაპარამეტრული, მათ შორის განაწილების გარეშე პროცედურების შემუშავების აუცილებლობა, მათი ფართო დანერგვა სტატისტიკურ პრაქტიკაში. მონაცემთა დამუშავება.

სხვა პარამეტრული ოჯახებისთვის აქ გამოტოვებული მოსაზრებები მსგავს დასკვნამდე მივყავართ. შედეგი შეიძლება ჩამოყალიბდეს შემდეგნაირად. რეალური მონაცემების განაწილება თითქმის არასოდეს მიეკუთვნება რომელიმე კონკრეტულ პარამეტრულ ოჯახს. რეალური განაწილებები ყოველთვის განსხვავდება პარამეტრულ ოჯახებში შემავალი განაწილებისგან. განსხვავებები შეიძლება იყოს დიდი ან მცირე, მაგრამ ისინი ყოველთვის არსებობს. შევეცადოთ გავიგოთ, რამდენად მნიშვნელოვანია ეს განსხვავებები ეკონომეტრიული ანალიზისთვის.