საშუალო კვადრატი. სტანდარტული გადახრის გამოთვლა Microsoft Excel-ში

სტატისტიკური ანალიზის ერთ-ერთი მთავარი ინსტრუმენტია სტანდარტული გადახრის გამოთვლა. ეს მაჩვენებელი საშუალებას გაძლევთ შეაფასოთ სტანდარტული გადახრები ნიმუშისთვის ან ზოგადი პოპულაციისთვის. მოდით ვისწავლოთ როგორ გამოვიყენოთ სტანდარტული გადახრის ფორმულა Excel-ში.

მოდით დაუყოვნებლივ განვსაზღვროთ რა არის სტანდარტული გადახრა და როგორ გამოიყურება მისი ფორმულა. ეს მნიშვნელობა არის არითმეტიკული საშუალო კვადრატების კვადრატული ფესვი სერიის ყველა მნიშვნელობასა და მათ საშუალო არითმეტიკულ მნიშვნელობას შორის სხვაობის. ამ მაჩვენებელს იდენტური სახელი აქვს - სტანდარტული გადახრა. ორივე სახელი სრულიად ექვივალენტურია.

მაგრამ, რა თქმა უნდა, Excel-ში, მომხმარებელს არ სჭირდება ამის გამოთვლა, რადგან პროგრამა ყველაფერს აკეთებს მისთვის. მოდით ვისწავლოთ როგორ გამოვთვალოთ სტანდარტული გადახრა Excel-ში.

გაანგარიშება Excel-ში

თქვენ შეგიძლიათ გამოთვალოთ მითითებული მნიშვნელობა Excel-ში ორი სპეციალური ფუნქციის გამოყენებით STDEV.B(ნიმუშის მიხედვით) და STDEV.G(ზოგადი მოსახლეობის მიხედვით). მათი მოქმედების პრინციპი აბსოლუტურად იგივეა, მაგრამ ისინი შეიძლება ეწოდოს სამი გზით, რომელსაც ქვემოთ განვიხილავთ.

მეთოდი 1: ფუნქციების ოსტატი


მეთოდი 2: ფორმულების ჩანართი


მეთოდი 3: ფორმულის ხელით შეყვანა

ასევე არსებობს გზა, სადაც საერთოდ არ გჭირდებათ არგუმენტის ფანჯრის გამოძახება. ამისათვის შეიყვანეთ ფორმულა ხელით.


როგორც ხედავთ, Excel-ში სტანდარტული გადახრის გამოთვლის მექანიზმი ძალიან მარტივია. მომხმარებელს მხოლოდ უნდა შეიყვანოს ნომრები პოპულაციიდან ან ბმულები უჯრედებზე, რომლებიც შეიცავს მათ. ყველა გაანგარიშება ხორციელდება თავად პროგრამის მიერ. გაცილებით რთულია იმის გაგება, თუ რა არის გამოთვლილი მაჩვენებელი და როგორ შეიძლება გაანგარიშების შედეგების პრაქტიკაში გამოყენება. მაგრამ ამის გაგება უკვე უფრო სტატისტიკის სფეროს ეკუთვნის, ვიდრე პროგრამულ უზრუნველყოფასთან მუშაობის სწავლას.

მარტივი გეომეტრიული საშუალოს გამოსათვლელად გამოიყენება ფორმულა:

გეომეტრიული შეწონილი

გეომეტრიული შეწონილი საშუალოს დასადგენად გამოიყენება ფორმულა:

ბორბლების, მილების, კვადრატების საშუალო გვერდების საშუალო დიამეტრი განისაზღვრება ფესვის საშუალო კვადრატის გამოყენებით.

RMS მნიშვნელობები გამოიყენება ზოგიერთი ინდიკატორის გამოსათვლელად, როგორიცაა ცვალებადობის კოეფიციენტი, რომელიც ახასიათებს გამომუშავების რიტმს. აქ სტანდარტული გადახრა დაგეგმილი გამომუშავებიდან გარკვეული პერიოდის განმავლობაში განისაზღვრება შემდეგი ფორმულით:

ეს მნიშვნელობები ზუსტად ახასიათებს ეკონომიკური მაჩვენებლების ცვლილებას მათ საბაზისო ღირებულებასთან შედარებით, აღებული მისი საშუალო მნიშვნელობით.

კვადრატული მარტივი

მარტივი კვადრატი გამოითვლება ფორმულით:

კვადრატული შეწონილი

შეწონილი ფესვის საშუალო კვადრატი არის:

22. ცვალებადობის აბსოლუტური ზომები მოიცავს:

ვარიაციის დიაპაზონი

საშუალო წრფივი გადახრა

დისპერსია

სტანდარტული გადახრა

ვარიაციის დიაპაზონი (r)

დიაპაზონის ვარიაციაარის განსხვავება ატრიბუტის მაქსიმალურ და მინიმალურ მნიშვნელობებს შორის

ის აჩვენებს ზღვრებს, რომლებშიც იცვლება ატრიბუტის მნიშვნელობა შესწავლილ პოპულაციაში.

წინა სამუშაოზე ხუთი აპლიკანტის მუშაობის გამოცდილებაა: 2,3,4,7 და 9 წელი. გამოსავალი: ვარიაციის დიაპაზონი = 9 - 2 = 7 წელი.

ატრიბუტის მნიშვნელობებში განსხვავებების განზოგადებული მახასიათებლისთვის, საშუალო ცვალებადობის ინდიკატორები გამოითვლება არითმეტიკული საშუალოდან გადახრების შემწეობის საფუძველზე. განსხვავება აღებულია როგორც საშუალოდან გადახრა.

ამავდროულად, იმისათვის, რომ თავიდან ავიცილოთ ნულში გადაქცევა ნიშან-თვისებების ვარიანტების გადახრების ჯამის საშუალოდან (საშუალოების ნულოვანი თვისება), ან უნდა უგულებელყოთ გადახრის ნიშნები, ანუ აიღოთ ეს ჯამის მოდული. ან გადახრის მნიშვნელობების კვადრატში

საშუალო წრფივი და კვადრატული გადახრა

საშუალო წრფივი გადახრაარის ატრიბუტის ინდივიდუალური მნიშვნელობების საშუალოდან აბსოლუტური გადახრების არითმეტიკული საშუალო.

საშუალო წრფივი გადახრა მარტივია:

წინა სამუშაოზე ხუთი აპლიკანტის მუშაობის გამოცდილებაა: 2,3,4,7 და 9 წელი.

ჩვენს მაგალითში: წლები;

პასუხი: 2.4 წელი.

საშუალო წრფივი გადახრა შეწონილივრცელდება დაჯგუფებულ მონაცემებზე:

საშუალო წრფივი გადახრა, მისი პირობითობის გამო, პრაქტიკაში შედარებით იშვიათად გამოიყენება (კერძოდ, სახელშეკრულებო ვალდებულებების შესრულების დასახასიათებლად მიწოდების ერთგვაროვნების თვალსაზრისით; პროდუქტის ხარისხის ანალიზში, წარმოების ტექნოლოგიური მახასიათებლების გათვალისწინებით. ).

Სტანდარტული გადახრა

ვარიაციის ყველაზე სრულყოფილი მახასიათებელია სტანდარტული გადახრა, რომელსაც ეწოდება სტანდარტი (ან სტანდარტული გადახრა). Სტანდარტული გადახრა() უდრის არითმეტიკული საშუალოდან ატრიბუტის ინდივიდუალური მნიშვნელობების გადახრების საშუალო კვადრატის კვადრატულ ფესვს:

სტანდარტული გადახრა მარტივია:

შეწონილი სტანდარტული გადახრა გამოიყენება დაჯგუფებული მონაცემებისთვის:

საშუალო კვადრატსა და საშუალო წრფივ გადახრებს შორის ნორმალური განაწილების პირობებში ხდება შემდეგი მიმართება: ~ 1.25.

სტანდარტული გადახრა, როგორც ცვალებადობის მთავარი აბსოლუტური საზომი, გამოიყენება ნორმალური განაწილების მრუდის ორდინატების მნიშვნელობების დასადგენად, ნიმუშის დაკვირვების ორგანიზებასთან და ნიმუშის მახასიათებლების სიზუსტის დადგენასთან დაკავშირებულ გამოთვლებში, აგრეთვე ერთგვაროვან პოპულაციაში ნიშან-თვისების ვარიაციის საზღვრების შეფასება.

ინსტრუქცია

მოდით იყოს რამდენიმე რიცხვი, რომელიც ახასიათებს - ან ერთგვაროვან სიდიდეებს. მაგალითად, გაზომვების, აწონვის, სტატისტიკური დაკვირვების შედეგები და ა.შ. წარმოდგენილი ყველა რაოდენობა უნდა გაიზომოს ერთი და იგივე გაზომვით. სტანდარტული გადახრის დასადგენად, გააკეთეთ შემდეგი.

დაადგინეთ ყველა რიცხვის საშუალო არითმეტიკული: დაამატეთ ყველა რიცხვი და გაყავით ჯამი რიცხვების საერთო რაოდენობაზე.

დაადგინეთ რიცხვების დისპერსია (გაფანტვა): შეკრიბეთ ადრე აღმოჩენილი გადახრების კვადრატები და მიღებული ჯამი გაყავით რიცხვების რაოდენობაზე.

პალატაში შვიდი პაციენტია 34, 35, 36, 37, 38, 39 და 40 გრადუს ცელსიუს ტემპერატურაზე.

საჭიროა საშუალოდან საშუალო გადახრის დადგენა.
გამოსავალი:
"პალატაში": (34+35+36+37+38+39+40)/7=37 ºС;

ტემპერატურის გადახრები საშუალოდან (ამ შემთხვევაში, ნორმალური მნიშვნელობა): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, გამოდის: -3, -2, -1, 0, 1, 2, 3 (ºС);

ადრე მიღებული რიცხვების ჯამი გაყავით მათ რიცხვზე. გაანგარიშების სიზუსტისთვის უმჯობესია გამოიყენოთ კალკულატორი. გაყოფის შედეგი არის ჯამების საშუალო არითმეტიკული.

დიდი ყურადღება მიაქციეთ გაანგარიშების ყველა ეტაპს, რადგან შეცდომა ერთ-ერთ გაანგარიშებაში მაინც გამოიწვევს არასწორ საბოლოო ინდიკატორს. შეამოწმეთ მიღებული გამოთვლები თითოეულ ეტაპზე. საშუალო არითმეტიკულს აქვს იგივე მეტრი, როგორც რიცხვების ჯამი, ანუ თუ თქვენ განსაზღვრავთ საშუალო დასწრებას, მაშინ ყველა მაჩვენებელი იქნება "ადამიანი".

გაანგარიშების ეს მეთოდი გამოიყენება მხოლოდ მათემატიკურ და სტატისტიკურ გამოთვლებში. მაგალითად, კომპიუტერულ მეცნიერებაში საშუალო არითმეტიკას განსხვავებული გამოთვლის ალგორითმი აქვს. საშუალო არითმეტიკული არის ძალიან პირობითი მაჩვენებელი. ის აჩვენებს მოვლენის ალბათობას, იმ პირობით, რომ მას აქვს მხოლოდ ერთი ფაქტორი ან მაჩვენებელი. ყველაზე სიღრმისეული ანალიზისთვის ბევრი ფაქტორი უნდა იყოს გათვალისწინებული. ამისათვის გამოიყენება უფრო ზოგადი რაოდენობების გამოთვლა.

საშუალო არითმეტიკული არის ცენტრალური ტენდენციის ერთ-ერთი საზომი, რომელიც ფართოდ გამოიყენება მათემატიკასა და სტატისტიკურ გამოთვლებში. რამდენიმე მნიშვნელობის საშუალო არითმეტიკული მნიშვნელობის პოვნა ძალიან მარტივია, მაგრამ თითოეულ დავალებას აქვს თავისი ნიუანსი, რომელთა ცოდნა უბრალოდ აუცილებელია სწორი გამოთვლების შესასრულებლად.

ასეთი ექსპერიმენტების რაოდენობრივი შედეგები.

როგორ მოვძებნოთ არითმეტიკული საშუალო

რიცხვების მასივისთვის საშუალო არითმეტიკულის ძიება უნდა დაიწყოს ამ მნიშვნელობების ალგებრული ჯამის განსაზღვრით. მაგალითად, თუ მასივი შეიცავს ციფრებს 23, 43, 10, 74 და 34, მაშინ მათი ალგებრული ჯამი იქნება 184. წერისას საშუალო არითმეტიკული აღინიშნება ასო მ (mu) ან x (x ზოლით) . შემდეგ, ალგებრული ჯამი უნდა გაიყოს მასივის რიცხვების რაოდენობაზე. ამ მაგალითში ხუთი რიცხვი იყო, ამიტომ საშუალო არითმეტიკული იქნება 184/5 და იქნება 36.8.

უარყოფით რიცხვებთან მუშაობის თავისებურებები

თუ მასივში არის უარყოფითი რიცხვები, მაშინ საშუალო არითმეტიკული იპოვება მსგავსი ალგორითმის გამოყენებით. განსხვავებაა მხოლოდ პროგრამირების გარემოში გაანგარიშებისას, ან დავალების დამატებითი პირობების არსებობისას. ამ შემთხვევებში, სხვადასხვა ნიშნით რიცხვების საშუალო არითმეტიკული პოვნა სამ საფეხურამდე მოდის:

1. საერთო არითმეტიკული საშუალოს პოვნა სტანდარტული მეთოდით;
2. უარყოფითი რიცხვების საშუალო არითმეტიკულის პოვნა.
3. დადებითი რიცხვების საშუალო არითმეტიკულის გამოთვლა.

თითოეული მოქმედების პასუხები იწერება მძიმით გამოყოფილი.

ბუნებრივი და ათობითი წილადები

თუ რიცხვების მასივი წარმოდგენილია ათობითი წილადებით, ამოხსნა ხდება მთელი რიცხვების საშუალო არითმეტიკული გამოთვლის მეთოდის მიხედვით, მაგრამ შედეგი მცირდება ამოცანის მოთხოვნების შესაბამისად პასუხის სიზუსტისთვის.

ბუნებრივ წილადებთან მუშაობისას ისინი უნდა შემცირდეს საერთო მნიშვნელამდე, რომელიც მრავლდება მასივის რიცხვების რაოდენობაზე. პასუხის მრიცხველი იქნება თავდაპირველი წილადი ელემენტების მოცემული მრიცხველების ჯამი.

იგი გამოიყენება იმ შემთხვევებში, როდესაც მახასიათებლის ინდივიდუალური მნიშვნელობების საშუალო მნიშვნელობით ჩანაცვლებისას აუცილებელია თავდაპირველი მნიშვნელობების კვადრატების ჯამის შენარჩუნება უცვლელი.

მისი გამოყენების ძირითადი სფეროა ნიშან-თვისების ინდივიდუალური მნიშვნელობების რყევის ხარისხის გაზომვა არითმეტიკულ საშუალოსთან შედარებით (სტანდარტული გადახრა). გარდა ამისა, ფესვის საშუალო კვადრატი გამოიყენება იმ შემთხვევებში, როდესაც აუცილებელია გამოთვალოთ კვადრატული ან კუბური ერთეულებით გამოხატული მახასიათებლის საშუალო მნიშვნელობა (კვადრატული მონაკვეთების საშუალო ზომის გაანგარიშებისას, მილების საშუალო დიამეტრი, ღეროები და ა.შ.).

ფესვი საშუალო კვადრატიგამოითვლება ორი ფორმით:

- რა მარტივია

რამდენად წონიანი

(4.22)

ყველა სიმძლავრის საშუალოგანსხვავდება ერთმანეთისგან მაჩვენებლის მნიშვნელობებით. სადაც,რაც უფრო მაღალია მაჩვენებელი, მით მეტი საშუალოს რაოდენობრივი მნიშვნელობა :

ძალაუფლების საშუალებების ამ თვისებას საკუთრება ეწოდება მაჟორიტარისაშუალო.

Ამგვარად,საშუალო ინდიკატორის ტიპის არჩევანი მნიშვნელოვან გავლენას ახდენს მის რიცხობრივ მნიშვნელობაზე. საშუალო ტიპის არჩევანი განისაზღვრება თითოეული ინდივიდუალური შემთხვევა საკვლევი პოპულაციის ანალიზით, ფენომენის შინაარსის შესწავლა. ექსპონენციალური საშუალო არჩეულია სწორად, თუ გამოთვლების ყველა ეტაპზე მისი ლოგიკური ფორმულა არ იცვლება , იმათ. სოციალურ-ეკონომიკური შინაარსი საშუალოდ ნიშანი.

განსაკუთრებული სახის საშუალო სტრუქტურული საშუალო. ისინი გამოიყენება მახასიათებლების მნიშვნელობების განაწილების სერიის შიდა სტრუქტურის შესწავლისას. მათ შორისაა რეჟიმი და მედიანა.

რეჟიმი და მედიანა ახასიათებს სტატისტიკური ერთეულის ატრიბუტის მნიშვნელობას, რომელიც იკავებს გარკვეულ პოზიციას ვარიაციულ სერიაში.

მოდა (მო) - მახასიათებლის ყველაზე გავრცელებული მნიშვნელობა პოპულაციაში.რეჟიმი ფართოდ გამოიყენება სტატისტიკურ პრაქტიკაში სამომხმარებლო მოთხოვნის შესწავლა, ფასის რეგისტრაცია და ა.შ.

მედიანა ( მე) - სტატისტიკური ერთეულის მახასიათებლის მნიშვნელობა, რომელიც რანჟირებული სერიის შუაშია და პოპულაციას ყოფს ორ თანაბარ ნაწილად.

დისკრეტული ვარიაციული სერიებისთვის მოდა მეშეირჩევა განმარტებების შესაბამისად: რეჟიმი - როგორც ყველაზე მაღალი სიხშირის მქონე ფუნქციის მნიშვნელობა \ მე ; მედიანის პოზიცია კენტი პოპულაციის ზომისთვის განისაზღვრება მისი რიცხვით
, სად - სტატისტიკური პოპულაციის მოცულობა. სერიის თანაბარი სიგრძისთვის, მედიანა უდრის სერიის შუაში არსებული ორი ვარიანტის საშუალოს.

მედიანა გამოიყენება, როგორც ყველაზე საიმედო მაჩვენებელი ტიპიურიჰეტეროგენული პოპულაციის ღირებულებები, რადგან ის არასენსიტიურებია თვისების უკიდურესი მნიშვნელობები, რომლებიც შეიძლება მნიშვნელოვნად განსხვავდებოდეს მისი ღირებულებების ძირითადი მასივი. გარდა ამისა, მედიანური აღმოჩენები პრაქტიკული გამოყენება სპეციალური მათემატიკური თვისების გამო:
.

განვიხილოთ რეჟიმისა და მედიანის განმარტება შემდეგზე მაგალითი:

არსებობს სამუშაო ადგილების არაერთი განაწილება უნარების დონის მიხედვით. მონაცემები ნაჩვენებია ცხრილში 4.4.

ცხრილი 4.4 - სამუშაო ადგილების განაწილება უნარების დონის მიხედვით

დაგროვილი

რეჟიმი შეირჩევა მაქსიმალური სიხშირის მნიშვნელობის მიხედვით: at მაქს = 14, მო= 4, ე.ი. მე-4 კატეგორია ყველაზე გავრცელებულია. მედიანას საპოვნელად მეგანსაზღვრულია ცენტრალური ერთეულები ( +1)/2. ეს არის 25-ე და 26-ე ერთეული. ჯგუფი, რომელშიც შედის ეს ერთეულები, განისაზღვრება დაგროვილი სიხშირეებით. ეს არის მე-4 ჯგუფი, რომელშიც ფუნქციის მნიშვნელობა არის 4. ამრიგად, მე= 4, ეს ნიშნავს, რომ მუშაკთა ნახევარს აქვს წოდება 4-ზე დაბალი, ხოლო მეორეს აქვს წოდება 4-ზე ზემოთ.

ინტერვალის სერიის მნიშვნელობებში მოდა მეგამოითვლება უფრო რთული გზით.

რეჟიმი განისაზღვრება შემდეგნაირად:

ინტერვალი, რომელშიც განლაგებულია რეჟიმის მნიშვნელობა, განისაზღვრება მაქსიმალური სიხშირის მნიშვნელობით. მოდალური ჰქვია.

მოდალური ინტერვალის ფარგლებში, რეჟიმის მნიშვნელობა გამოითვლება ფორმულით:

სადაც
- მოდალური ინტერვალის ქვედა ზღვარი;

მო - მოდალური ინტერვალის სიგანე;

მო , მო-1 , Mo+1 - შესაბამისად, მოდალური, პრემოდალური (წინა მოდალური) და პოსტმოდალური (შემდეგი მოდალური) ინტერვალების სიხშირეები.

შემდეგი მიდგომა გამოიყენება შუალედური სერიების გამოსათვლელად:

დაგროვილი სიხშირეებიდან გამომდინარე, გვხვდება მედიანური ინტერვალი.

მედიანა არის შუალედი, რომელიც შეიცავს ცენტრალურ ერთეულს.

მედიანური ინტერვალის მნიშვნელობის შიგნით მეგანისაზღვრება ფორმულით:

(4.25)

სადაც
- მედიანური ინტერვალის ქვედა ზღვარი;

მე -მედიანური ინტერვალის სიგანე;

არის სტატისტიკური პოპულაციის მოცულობა;

მე-1- პრემედიანი ინტერვალის დაგროვილი სიხშირე;

მე - მედიანური ინტერვალის სიხშირე.

განვიხილოთ რეჟიმისა და მედიანას გაანგარიშება განაწილების ინტერვალური სერიებისთვის მუშაკთა სტაჟის მიხედვით განაწილების სერიის მაგალითის გამოყენებით (ცხრილი 4.5).

ცხრილი 4.5 - სამუშაო ფართობის განაწილება სტაჟის მიხედვით

ინტერვალი

მე

მე

მე

Გაანგარიშებამო:

მაქსიმალური სიხშირე მაქს = 13, ის შეესაბამება მეოთხე ჯგუფს, შესაბამისად, 12-16 წლის საზღვრებთან ინტერვალი მოდალურია.

რეჟიმი გამოითვლება ფორმულით:

ყველაზე ხშირად არიან მუშები დაახლოებით 13 წლის სამუშაო გამოცდილებით.

რეჟიმი არ მდებარეობს მოდალური ინტერვალის შუაში, ის გადატანილია მის ქვედა საზღვარზე, ეს განპირობებულია ამ განაწილების სერიის სტრუქტურით (პრემოდალური ინტერვალის სიხშირე გაცილებით მაღალია, ვიდრე პოსტმოდალური ინტერვალის სიხშირე).

მედიანური გაანგარიშება:

მედიანური ინტერვალი განისაზღვრება კუმულაციური სიხშირის გრაფიკიდან. იგი შეიცავს 25-ე და 26-ე სტატისტიკურ ერთეულებს, რომლებიც სხვადასხვა ჯგუფშია - მე-3 და მე-4-ში. საპოვნელად მეშეგიძლიათ გამოიყენოთ ნებისმიერი მათგანი. ჩვენ განვახორციელებთ გამოთვლას მე-3 ჯგუფისთვის:

Იგივე მნიშვნელობა მეშეიძლება მიღებულ იქნას მე-4 ჯგუფის გამოთვლისას:

ორმაგი ცენტრით მეყოველთვის მდებარეობს ცენტრალური ერთეულების შემცველი ინტერვალების შეერთებაზე. გამოთვლილი მნიშვნელობა მეგვიჩვენებს, რომ პირველ 25 მუშაკს აქვს 12 წელზე ნაკლები სამუშაო გამოცდილება, ხოლო დანარჩენ 25-ს აქვს 12 წელზე მეტი.

რეჟიმი გრაფიკულად შეიძლება განისაზღვროს განაწილების მრავალკუთხედით დისკრეტულ სერიებში, განაწილების ჰისტოგრამით - ინტერვალური სერიებით, ხოლო მედიანა - კუმულაციით.

ინტერვალის სერიაში რეჟიმის საპოვნელად, მოდალური მართკუთხედის მარჯვენა წვერო უნდა იყოს დაკავშირებული წინა მართკუთხედის ზედა მარჯვენა კუთხესთან, ხოლო მარცხენა წვერო შემდეგი მართკუთხედის ზედა მარცხენა კუთხესთან. ამ ხაზების გადაკვეთის წერტილის აბსციზა იქნება განაწილების რეჟიმი.

მედიანას დასადგენად, კუმულაციის უდიდესი ორდინატის სიმაღლე, რომელიც შეესაბამება მთლიან პოპულაციას, იყოფა ნახევრად. მიღებულ წერტილში აბსცისის ღერძის პარალელურად ხაზდება სწორი ხაზი, სანამ არ გადაიკვეთება კუმულატთან. გადაკვეთის წერტილის აბსციზა არის მედიანა.

გარდა მოდა მევარიანტების სერიაში შეიძლება განისაზღვროს სხვა სტრუქტურული მახასიათებლები - კვანტილები. Quantiles განკუთვნილია განაწილების სერიის სტრუქტურის უფრო ღრმა შესწავლისთვის. კვანტილი- ეს არის მახასიათებლის მნიშვნელობა, რომელიც გარკვეულ ადგილს იკავებს ამ მახასიათებლით შეკვეთილ პოპულაციაში. არსებობს კვანტილების შემდეგი ტიპები:

- კვარტილები- ატრიბუტების მნიშვნელობები, რომლებიც ყოფს შეკვეთილ კომპლექტს 4 თანაბარ ნაწილად;

- დეცილები- ატრიბუტების მნიშვნელობები, რომლებიც ყოფს მოსახლეობას 10 თანაბარ ნაწილად;

- პროცენტები- ატრიბუტების მნიშვნელობები, რომლებიც ყოფს მოსახლეობას 100 თანაბარ ნაწილად.

ამრიგად, განაწილების სერიის ცენტრის პოზიციის დასახასიათებლად შეიძლება გამოყენებულ იქნას 3 ინდიკატორი: ნიშნავსნიშანი,რეჟიმი, მედიანა.

სადისტრიბუციო ცენტრის კონკრეტული ინდიკატორის ტიპისა და ფორმის არჩევისას აუცილებელია შემდეგი რეკომენდაციებიდან გამომდინარე:

მდგრადი სოციალურ-ეკონომიკური პროცესებისთვის ცენტრის მაჩვენებლად გამოიყენება საშუალო არითმეტიკული. ასეთ პროცესებს ახასიათებს სიმეტრიული განაწილება, რომელშიც

= მე= მო;

არასტაბილური პროცესებისთვის სადისტრიბუციო ცენტრის პოზიცია ხასიათდება მოან მე. ასიმეტრიული პროცესებისთვის, სადისტრიბუციო ცენტრის სასურველი მახასიათებელია მედიანა, რადგან ის იკავებს პოზიციას საშუალო არითმეტიკასა და რეჟიმს შორის.

უნდა აღინიშნოს, რომ დისპერსიის ამ გამოთვლას ნაკლი აქვს - მიკერძოებული გამოდის, ე.ი. მისი მათემატიკური მოლოდინი არ უდრის დისპერსიის ნამდვილ მნიშვნელობას. მეტი ამის შესახებ. ამავე დროს, ყველაფერი არც ისე ცუდია. შერჩევის ზომის მატებასთან ერთად ის მაინც უახლოვდება თავის თეორიულ კოლეგას, ე.ი. არის ასიმპტომურად მიუკერძოებელი. ამიტომ, როდესაც საქმე გვაქვს ნიმუშების დიდ ზომებთან, ზემოთ მოცემული ფორმულა შეიძლება გამოყენებულ იქნას.

სასარგებლოა ნიშნების ენის სიტყვების ენაზე თარგმნა. გამოდის, რომ განსხვავება არის გადახრების საშუალო კვადრატი. ანუ, ჯერ გამოითვლება საშუალო მნიშვნელობა, შემდეგ იღებენ განსხვავებას თითოეულ ორიგინალსა და საშუალო მნიშვნელობას შორის, კვადრატში, ემატება და შემდეგ იყოფა ამ პოპულაციის მნიშვნელობების რაოდენობაზე. განსხვავება ინდივიდუალურ მნიშვნელობასა და საშუალოს შორის ასახავს გადახრის ზომას. ის კვადრატულია იმისთვის, რომ ყველა გადახრები იქცეს ექსკლუზიურად პოზიტიურ რიცხვებად და თავიდან აიცილოს დადებითი და უარყოფითი გადახრების ორმხრივი გაუქმება მათი შეჯამებისას. შემდეგ, კვადრატული გადახრების გათვალისწინებით, ჩვენ უბრალოდ გამოვთვალეთ საშუალო არითმეტიკული. საშუალო - კვადრატი - გადახრები. გადახრები კვადრატულია და საშუალოდ ითვლება. პასუხი მხოლოდ სამ სიტყვაშია.

თუმცა, მისი სუფთა სახით, როგორიცაა, მაგალითად, საშუალო არითმეტიკული ან ინდექსი, დისპერსია არ გამოიყენება. ეს უფრო დამხმარე და შუალედური მაჩვენებელია, რომელიც აუცილებელია სხვა ტიპის სტატისტიკური ანალიზისთვის. მას არც კი აქვს ნორმალური საზომი ერთეული. ფორმულით ვიმსჯელებთ, ეს არის ორიგინალური მონაცემთა ერთეულის კვადრატი. ბოთლის გარეშე, როგორც ამბობენ, ვერ გაიგებთ.

(მოდული 111)

დისპერსიის რეალობაში დასაბრუნებლად, ანუ უფრო ამქვეყნიური მიზნებისთვის გამოსაყენებლად, მისგან კვადრატული ფესვი ამოღებულია. გამოდის ე.წ სტანდარტული გადახრა (RMS). არსებობს სახელები "სტანდარტული გადახრა" ან "სიგმა" (ბერძნული ასოს სახელიდან). სტანდარტული გადახრის ფორმულა არის:

ნიმუშისთვის ამ ინდიკატორის მისაღებად გამოიყენეთ ფორმულა:

როგორც დისპერსიის შემთხვევაში, არსებობს ოდნავ განსხვავებული გაანგარიშების ვარიანტი. მაგრამ როგორც ნიმუში იზრდება, განსხვავება ქრება.

სტანდარტული გადახრა, ცხადია, ასევე ახასიათებს მონაცემთა დისპერსიის ზომას, მაგრამ ახლა (განსხვავებით დისპერსიისგან) მისი შედარება შესაძლებელია თავდაპირველ მონაცემებთან, რადგან მათ აქვთ იგივე საზომი ერთეულები (ეს ნათელია გაანგარიშების ფორმულიდან). მაგრამ ეს მაჩვენებელი მისი სუფთა სახით არ არის ძალიან ინფორმატიული, რადგან ის შეიცავს ძალიან ბევრ შუალედურ გამოთვლებს, რომლებიც დამაბნეველია (გადახრა, კვადრატი, ჯამი, საშუალო, ფესვი). მიუხედავად ამისა, უკვე შესაძლებელია უშუალოდ სტანდარტული გადახრით მუშაობა, რადგან ამ ინდიკატორის თვისებები კარგად არის შესწავლილი და ცნობილი. მაგალითად, არის ეს სამი სიგმის წესი, სადაც ნათქვამია, რომ 1000-დან 997 მონაცემი არითმეტიკული საშუალოს ±3 სიგმის ფარგლებშია. სტანდარტული გადახრა, როგორც გაურკვევლობის საზომი, ასევე ჩართულია მრავალ სტატისტიკურ გამოთვლებში. მისი დახმარებით დგინდება სხვადასხვა შეფასებისა და პროგნოზების სიზუსტის ხარისხი. თუ ვარიაცია ძალიან დიდია, მაშინ სტანდარტული გადახრაც დიდი აღმოჩნდება, შესაბამისად, პროგნოზი იქნება არაზუსტი, რაც გამოიხატება, მაგალითად, ძალიან ფართო ნდობის ინტერვალებით.

ცვალებადობის კოეფიციენტი

სტანდარტული გადახრა იძლევა გავრცელების ზომის აბსოლუტურ შეფასებას. ამიტომ, იმის გასაგებად, თუ რამდენად დიდია გავრცელება თავად მნიშვნელობებთან შედარებით (ანუ მათი მასშტაბის მიუხედავად), საჭიროა ფარდობითი მაჩვენებელი. ეს მაჩვენებელი ე.წ ვარიაციის კოეფიციენტიდა გამოითვლება შემდეგი ფორმულით:

ცვალებადობის კოეფიციენტი იზომება პროცენტულად (თუ გამრავლებულია 100%-ზე). ამ მაჩვენებლით შეგიძლიათ შეადაროთ სხვადასხვა ფენომენები, მიუხედავად მათი მასშტაბისა და გაზომვის ერთეულებისა. ეს არის ის, რაც ცვალებადობის კოეფიციენტს ასე პოპულარულს ხდის.

სტატისტიკაში მიღებულია, რომ თუ ცვალებადობის კოეფიციენტის მნიშვნელობა 33%-ზე ნაკლებია, მაშინ მოსახლეობა ითვლება ერთგვაროვანად, თუ 33%-ზე მეტია, მაშინ ჰეტეროგენულია. მიჭირს აქ კომენტარის გაკეთება. არ ვიცი ვინ და რატომ განსაზღვრა ასე, მაგრამ აქსიომად ითვლება.

ვგრძნობ, რომ მშრალმა თეორიამ გამიტაცა და რაღაც ვიზუალური და ფიგურალური უნდა მოვიტანო. მეორეს მხრივ, ვარიაციის ყველა ინდიკატორი აღწერს დაახლოებით ერთსა და იმავეს, მხოლოდ ისინი განსხვავებულად არის გათვლილი. ამიტომ, ძნელია გაბრწყინდეს სხვადასხვა მაგალითებით, მხოლოდ ინდიკატორების მნიშვნელობები შეიძლება განსხვავდებოდეს, მაგრამ არა მათი არსი. მოდით შევადაროთ, თუ როგორ განსხვავდება ვარიაციის სხვადასხვა ინდიკატორის მნიშვნელობები მონაცემთა ერთი და იგივე ნაკრებისთვის. ავიღოთ მაგალითი საშუალო წრფივი გადახრის (-ის) გამოთვლით. აქ არის ორიგინალური მონაცემები:

და შეხსენების სქემა.

ამ მონაცემების საფუძველზე ჩვენ ვიანგარიშებთ ვარიაციის სხვადასხვა მაჩვენებლებს.

საშუალო არის ჩვეულებრივი არითმეტიკული საშუალო.

ვარიაციის დიაპაზონი არის განსხვავება მაქსიმუმსა და მინიმალურს შორის:

საშუალო წრფივი გადახრა გამოითვლება ფორმულით:

Სტანდარტული გადახრა:

ჩვენ ვაჯამებთ გაანგარიშებას ცხრილში.

როგორც ხედავთ, ხაზოვანი საშუალო და სტანდარტული გადახრა იძლევა მსგავს მნიშვნელობებს მონაცემთა ცვალებადობის ხარისხზე. განსხვავება არის სიგმა კვადრატში, ამიტომ ის ყოველთვის იქნება შედარებით დიდი რიცხვი, რომელიც, ფაქტობრივად, არაფერს ამბობს. ვარიაციის დიაპაზონი არის განსხვავება უკიდურესობებს შორის და ბევრი რამის თქმა შეუძლია.

მოდით შევაჯამოთ რამდენიმე შედეგი.

ინდიკატორის ცვალებადობა ასახავს პროცესის ან ფენომენის ცვალებადობას. მისი ხარისხი შეიძლება გაიზომოს რამდენიმე ინდიკატორის გამოყენებით.

1. ვარიაციის დიაპაზონი არის განსხვავება მაქსიმუმსა და მინიმუმს შორის. ასახავს შესაძლო მნიშვნელობების დიაპაზონს.
2. საშუალო წრფივი გადახრა - ასახავს გაანალიზებული პოპულაციის ყველა მნიშვნელობის აბსოლუტური (მოდულური) გადახრების საშუალოს მათი საშუალო მნიშვნელობიდან.
3. დისპერსია - გადახრების საშუალო კვადრატი.
4. სტანდარტული გადახრა - დისპერსიის ფესვი (საშუალო კვადრატული გადახრები).
5. ვარიაციის კოეფიციენტი არის ყველაზე უნივერსალური მაჩვენებელი, რომელიც ასახავს სიდიდეების დისპერსიის ხარისხს, მიუხედავად მათი მასშტაბისა და საზომი ერთეულებისა. ცვალებადობის კოეფიციენტი იზომება პროცენტულად და შეიძლება გამოყენებულ იქნას სხვადასხვა პროცესებისა და ფენომენების ცვალებადობის შესადარებლად.

ამრიგად, სტატისტიკურ ანალიზში არსებობს ინდიკატორების სისტემა, რომელიც ასახავს ფენომენების ერთგვაროვნებას და პროცესების სტაბილურობას. ხშირად, ვარიაციის ინდიკატორებს არ აქვთ დამოუკიდებელი მნიშვნელობა და გამოიყენება შემდგომი მონაცემთა ანალიზისთვის (ნდობის ინტერვალების გამოთვლა