როგორ მოვძებნოთ განსხვავება რიცხვების სერიაში. დისკრეტული შემთხვევითი ცვლადის მათემატიკური მოლოდინი

დაჯგუფებული მონაცემებისთვის ნარჩენი დისპერსია- ჯგუფშიდა დისპერსიების საშუალო:

სადაც σ 2 j არის j -ე ჯგუფის შიდაჯგუფური ვარიაცია.

დაუჯგუფებელი მონაცემებისთვის ნარჩენი დისპერსიაარის მიახლოების სიზუსტის საზომი, ე.ი. რეგრესიის ხაზის დაახლოება საწყის მონაცემებთან:
სადაც y(t) არის პროგნოზი ტენდენციის განტოლების მიხედვით; y t – დინამიკის საწყისი სერია; n არის ქულების რაოდენობა; p არის რეგრესიის განტოლების კოეფიციენტების რაოდენობა (ახსნა ცვლადების რაოდენობა).
ამ მაგალითში მას ე.წ დისპერსიის მიუკერძოებელი შეფასება.

მაგალითი #1. ერთი ასოციაციის სამი საწარმოს მუშაკთა განაწილება სატარიფო კატეგორიების მიხედვით ხასიათდება შემდეგი მონაცემებით:

მუშაკთა ხელფასის კატეგორიასაწარმოში მუშაკთა რაოდენობა
საწარმო 1საწარმო 2საწარმო 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

განსაზღვრეთ:
1. დისპერსია თითოეული საწარმოსთვის (ინტრაჯგუფური დისპერსია);
2. ჯგუფშიდა დისპერსიების საშუალოდ;
3. ჯგუფთაშორისი დისპერსია;
4. მთლიანი დისპერსია.

გადაწყვეტილება.
სანამ პრობლემის გადაჭრას გააგრძელებთ, უნდა გაირკვეს, რომელი თვისებაა ეფექტური და რომელი ფაქტორული. განსახილველ მაგალითში ეფექტური მახასიათებელია „ტარიფის კატეგორია“, ხოლო ფაქტორული მახასიათებელია „საწარმოს ნომერი (დასახელება).
შემდეგ გვაქვს სამი ჯგუფი (საწარმოები), რომლებისთვისაც აუცილებელია გამოვთვალოთ ჯგუფის საშუალო და შიდაჯგუფური ვარიაციები:


კომპანიაჯგუფის საშუალო,ჯგუფური ვარიაცია,
1 4 1,8

შიდაჯგუფური ვარიაციების საშუალო ( ნარჩენი დისპერსია) გამოითვლება ფორმულით:


სადაც შეგიძლიათ გამოთვალოთ:
ან:


მაშინ:
მთლიანი დისპერსია ტოლი იქნება: s 2 \u003d 1.6 + 0 \u003d 1.6.
მთლიანი დისპერსიის გამოთვლა ასევე შესაძლებელია შემდეგი ორი ფორმულიდან ერთ-ერთის გამოყენებით:

პრაქტიკული პრობლემების გადაჭრისას ადამიანს ხშირად უწევს საქმე ნიშანთან, რომელიც მხოლოდ ორ ალტერნატიულ მნიშვნელობას იღებს. ამ შემთხვევაში, ისინი საუბრობენ არა მახასიათებლის კონკრეტული მნიშვნელობის წონაზე, არამედ მის წილზე აგრეგატში. თუ პოპულაციის ერთეულების პროპორცია, რომლებსაც აქვთ შესასწავლი თვისება, აღინიშნება " "და არა ფლობა - მეშვეობით" ”, მაშინ დისპერსიის გამოთვლა შესაძლებელია ფორმულით:
s 2 = p×q

მაგალითი #2. ბრიგადის ექვსი მუშაკის განვითარების მონაცემების მიხედვით, დაადგინეთ ჯგუფთაშორისი ვარიაცია და შეაფასეთ სამუშაო ცვლის გავლენა მათ შრომის პროდუქტიულობაზე, თუ მთლიანი დისპერსია არის 12.2.

სამუშაო ბრიგადის რსამუშაო გამომავალი, ც.
პირველ ცვლაშიმე-2 ცვლაში
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

გადაწყვეტილება. საწყისი მონაცემები

Xf1f2ვ 3f4f5f6სულ
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
სულ 31 33 37 37 40 38

შემდეგ გვაქვს 6 ჯგუფი, რომლებისთვისაც აუცილებელია გამოვთვალოთ ჯგუფის საშუალო და შიდაჯგუფური ვარიაციები.
1. იპოვეთ თითოეული ჯგუფის საშუალო მნიშვნელობები.







2. იპოვეთ თითოეული ჯგუფის საშუალო კვადრატი.







ჩვენ ვაჯამებთ გაანგარიშების შედეგებს ცხრილში:
ჯგუფის ნომერიჯგუფის საშუალოჯგუფშიდა ვარიაცია
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. ჯგუფშიდა ვარიაციაახასიათებს ჯგუფში შესწავლილი (შედეგი) თვისების ცვლილებას (ვარიაციას) ყველა ფაქტორის გავლენის ქვეშ, გარდა დაჯგუფების საფუძვლიანი ფაქტორისა:
ჩვენ ვიანგარიშებთ შიდაჯგუფური დისპერსიების საშუალოს ფორმულის გამოყენებით:


4. ჯგუფთაშორისი ვარიაციაახასიათებს შესწავლილი (შედეგი) ნიშან-თვისების ცვლილებას (ვარიაციას) დაჯგუფების საფუძვლად მყოფი ფაქტორის (ფაქტორული ნიშან-თვისების) გავლენით.
ჯგუფთაშორისი დისპერსია განისაზღვრება როგორც:

სადაც


მერე

სულ სხვაობაახასიათებს შესწავლილი (შედეგი) ნიშან-თვისების ცვლილებას (ვარიაციას) ყველა ფაქტორის (ფაქტორული ნიშან-თვისებების) გამონაკლისის გარეშე. პრობლემის პირობით ის უდრის 12.2-ს.
ემპირიული კორელაციური ურთიერთობაზომავს მიღებული ატრიბუტის მთლიანი რყევიდან რამდენს იწვევს შესწავლილი ფაქტორი. ეს არის ფაქტორული დისპერსიის თანაფარდობა მთლიან დისპერსიასთან:

ჩვენ განვსაზღვრავთ ემპირიულ კორელაციას:

მახასიათებლებს შორის ურთიერთობა შეიძლება იყოს სუსტი ან ძლიერი (ახლო). მათი კრიტერიუმები ფასდება ჩადოკის მასშტაბით:
0.1 0.3 0.5 0.7 0.9 ჩვენს მაგალითში, კავშირი X ფაქტორს შორის სუსტია
განსაზღვრის კოეფიციენტი.

განვსაზღვროთ განსაზღვრის კოეფიციენტი:

ამრიგად, ვარიაციის 0,67% განპირობებულია ნიშან-თვისებებს შორის განსხვავებებით, ხოლო 99,37% სხვა ფაქტორებით.
დასკვნა: ამ შემთხვევაში მუშათა გამომუშავება არ არის დამოკიდებული კონკრეტულ ცვლაში მუშაობაზე, ე.ი. სამუშაო ცვლის გავლენა მათ შრომის პროდუქტიულობაზე არ არის მნიშვნელოვანი და განპირობებულია სხვა ფაქტორებით.

მაგალითი #3. საშუალო ხელფასისა და მისი მნიშვნელობიდან კვადრატული გადახრების საფუძველზე დასაქმებულთა ორი ჯგუფისთვის, იპოვეთ მთლიანი დისპერსია დისპერსიის დამატების წესის გამოყენებით:

გადაწყვეტილება:
ჯგუფური ვარიაციების საშუალო

ჯგუფთაშორისი დისპერსია განისაზღვრება როგორც:


მთლიანი დისპერსია იქნება: 480 + 13824 = 14304

დისპერსია სტატისტიკაშიგვხვდება როგორც ფუნქციის ინდივიდუალური მნიშვნელობები კვადრატში. საწყისი მონაცემებიდან გამომდინარე, იგი განისაზღვრება მარტივი და შეწონილი დისპერსიის ფორმულებით:

1. (დაჯგუფებული მონაცემებისთვის) გამოითვლება ფორმულით:

2. შეწონილი ვარიაცია (ვარიაციის სერიებისთვის):

სადაც n არის სიხშირე (განმეორებადობის ფაქტორი X)

დისპერსიის პოვნის მაგალითი

ეს გვერდი აღწერს დისპერსიის პოვნის სტანდარტულ მაგალითს, ასევე შეგიძლიათ გადახედოთ სხვა ამოცანებს მის საპოვნელად

მაგალითი 1. გვაქვს შემდეგი მონაცემები 20 მიმოწერის სტუდენტური ჯგუფისთვის. აუცილებელია მახასიათებლის განაწილების ინტერვალის სერიის აგება, მახასიათებლის საშუალო მნიშვნელობის გამოთვლა და მისი დისპერსიის შესწავლა.

მოდით ავაშენოთ ინტერვალის დაჯგუფება. მოდით განვსაზღვროთ ინტერვალის დიაპაზონი ფორმულით:

სადაც X max არის დაჯგუფების მახასიათებლის მაქსიმალური მნიშვნელობა;
X min არის დაჯგუფების ფუნქციის მინიმალური მნიშვნელობა;
n არის ინტერვალების რაოდენობა:

ჩვენ ვიღებთ n=5. ნაბიჯი არის: h \u003d (192 - 159) / 5 \u003d 6.6

მოდით გავაკეთოთ ინტერვალური დაჯგუფება

შემდგომი გამოთვლებისთვის ჩვენ ავაშენებთ დამხმარე ცხრილს:

X'i არის შუალედი. (მაგალითად, შუა ინტერვალით 159 - 165.6 = 162.3)

სტუდენტების საშუალო ზრდა განისაზღვრება საშუალო შეწონილი არითმეტიკული ფორმულით:

ჩვენ განვსაზღვრავთ დისპერსიას ფორმულით:

დისპერსიის ფორმულა შეიძლება გარდაიქმნას შემდეგნაირად:

ამ ფორმულიდან გამომდინარეობს, რომ განსხვავება არის განსხვავება ვარიანტების კვადრატების საშუალოსა და კვადრატსა და საშუალოს შორის.

ვარიაცია ვარიაციის სერიაშითანაბარი ინტერვალებით მომენტების მეთოდის მიხედვით შეიძლება გამოვთვალოთ შემდეგი გზით დისპერსიის მეორე თვისების გამოყენებით (ყველა ვარიანტის გაყოფა ინტერვალის მნიშვნელობით). დისპერსიის განმარტებამომენტების მეთოდით გამოთვლილი, შემდეგი ფორმულის მიხედვით ნაკლები დრო სჭირდება:

სადაც i არის ინტერვალის მნიშვნელობა;
A - პირობითი ნული, რომელიც მოსახერხებელია ყველაზე მაღალი სიხშირით ინტერვალის შუა გამოსაყენებლად;
m1 არის პირველი რიგის მომენტის კვადრატი;
m2 - მეორე შეკვეთის მომენტი

(თუ სტატისტიკურ პოპულაციაში ატრიბუტი იცვლება ისე, რომ არსებობს მხოლოდ ორი ურთიერთგამომრიცხავი ვარიანტი, მაშინ ასეთ ცვალებადობას ალტერნატივა ეწოდება) შეიძლება გამოითვალოს ფორმულით:

ამ დისპერსიის ფორმულით q = 1-p ჩანაცვლებით, მივიღებთ:

დისპერსიის სახეები

სულ სხვაობაზომავს თვისების ცვალებადობას მთელ პოპულაციაში, როგორც მთლიანობაში, ყველა იმ ფაქტორების გავლენის ქვეშ, რომლებიც იწვევს ამ ცვალებადობას. ის უდრის x მახასიათებლის ცალკეული მნიშვნელობების გადახრების საშუალო კვადრატს მთლიანი საშუალო მნიშვნელობიდან x და შეიძლება განისაზღვროს, როგორც მარტივი დისპერსიული ან შეწონილი დისპერსია.

ახასიათებს შემთხვევით ვარიაციას, ე.ი. ვარიაციის ნაწილი, რომელიც განპირობებულია გაუთვალისწინებელი ფაქტორების გავლენით და არ არის დამოკიდებული დაჯგუფების საფუძველში არსებულ ნიშან-ფაქტორზე. ასეთი ვარიაცია უდრის X ჯგუფში მახასიათებლის ცალკეული მნიშვნელობების გადახრების საშუალო კვადრატს ჯგუფის საშუალო არითმეტიკულიდან და შეიძლება გამოითვალოს როგორც მარტივი დისპერსია ან როგორც შეწონილი ვარიაცია.

ამრიგად, ჯგუფური დისპერსიის ზომებითვისების ვარიაცია ჯგუფში და განისაზღვრება ფორმულით:

სადაც xi - ჯგუფის საშუალო;
ni არის ჯგუფში ერთეულების რაოდენობა.

მაგალითად, ჯგუფშიდა განსხვავებები, რომლებიც უნდა განისაზღვროს მაღაზიაში მუშაკთა კვალიფიკაციის გავლენის შესასწავლად შრომის პროდუქტიულობის დონეზე, აჩვენებს ცვალებადობას თითოეულ ჯგუფში, რომელიც გამოწვეულია ყველა შესაძლო ფაქტორით (აღჭურვილობის ტექნიკური მდგომარეობა, ხელსაწყოების და მასალების ხელმისაწვდომობა, მუშაკთა ასაკი, შრომის ინტენსივობა და ა.შ.), გარდა კვალიფიკაციის კატეგორიაში განსხვავებებისა (ჯგუფში ყველა მუშაკს აქვს იგივე კვალიფიკაცია).

ჯგუფური დისპერსიების საშუალო ასახავს შემთხვევითობას, ანუ ვარიაციის იმ ნაწილს, რომელიც მოხდა ყველა სხვა ფაქტორების გავლენის ქვეშ, გარდა დაჯგუფების ფაქტორისა. იგი გამოითვლება ფორმულით:

იგი ახასიათებს მიღებული ნიშან-თვისების სისტემატურ ცვალებადობას, რაც განპირობებულია დაჯგუფების საფუძვლად მყოფი თვისება-ფაქტორის გავლენით. იგი უდრის ჯგუფური საშუალებების გადახრების საშუალო კვადრატს საერთო საშუალოდან. ჯგუფთაშორისი განსხვავება გამოითვლება ფორმულით:

ვარიაციების დამატების წესი სტატისტიკაში

Მიხედვით დისპერსიის დამატების წესიმთლიანი დისპერსია უდრის ჯგუფთაშორისი და ჯგუფთაშორისი ვარიაციების საშუალო ჯამის:

ამ წესის მნიშვნელობაარის ის, რომ მთლიანი დისპერსია, რომელიც ხდება ყველა ფაქტორის გავლენის ქვეშ, უდრის სხვა ფაქტორების გავლენის ქვეშ წარმოქმნილი დისპერსიების ჯამს და დაჯგუფების ფაქტორის გამო წარმოქმნილ დისპერსიას.

დისპერსიების დამატების ფორმულის გამოყენებით შესაძლებელია ორი ცნობილი ვარიაციებიდან მესამე უცნობის დადგენა და ასევე დაჯგუფების ატრიბუტის გავლენის სიძლიერის შეფასება.

დისპერსიული თვისებები

1. თუ ატრიბუტის ყველა მნიშვნელობა მცირდება (გაზრდილია) ერთი და იგივე მუდმივი მნიშვნელობით, მაშინ განსხვავება არ შეიცვლება აქედან.
2. თუ ატრიბუტის ყველა მნიშვნელობა მცირდება (გაზრდილია) n-ჯერ ერთნაირი რაოდენობით, მაშინ დისპერსიაც შესაბამისად შემცირდება (გაიზრდება) n^2-ჯერ.

მრავალ ინდიკატორს შორის, რომლებიც გამოიყენება სტატისტიკაში, აუცილებელია გამოვყოთ დისპერსიის გაანგარიშება. უნდა აღინიშნოს, რომ ამ გაანგარიშების ხელით შესრულება საკმაოდ დამღლელი ამოცანაა. საბედნიეროდ, Excel-ში არის ფუნქციები, რომლებიც გაანგარიშების პროცედურის ავტომატიზაციის საშუალებას გაძლევთ. მოდით გავარკვიოთ ამ ინსტრუმენტებთან მუშაობის ალგორითმი.

დისპერსია არის ვარიაციის მაჩვენებელი, რომელიც არის მათემატიკური მოლოდინის გადახრების საშუალო კვადრატი. ამრიგად, იგი გამოხატავს რიცხვების გავრცელებას საშუალოზე. დისპერსიის გაანგარიშება შეიძლება განხორციელდეს როგორც ზოგადი მოსახლეობისთვის, ასევე ნიმუშისთვის.

მეთოდი 1: გაანგარიშება საერთო პოპულაციაზე

Excel-ში ამ ინდიკატორის გამოსათვლელად ზოგადი პოპულაციისთვის, ფუნქცია გამოიყენება DISP.G. ამ გამოთქმის სინტაქსი ასეთია:

DISP.G (Number1; Number2;…)

საერთო ჯამში შეიძლება გამოყენებულ იქნას 1-დან 255-მდე არგუმენტი. არგუმენტები შეიძლება იყოს როგორც რიცხვითი მნიშვნელობები, ასევე მითითებები იმ უჯრედებზე, რომლებშიც ისინი შეიცავს.

ვნახოთ, როგორ გამოვთვალოთ ეს მნიშვნელობა რიცხვითი მონაცემების დიაპაზონისთვის.


მეთოდი 2: ნიმუშის გაანგარიშება

ზოგადი პოპულაციისთვის მნიშვნელობის გაანგარიშებისგან განსხვავებით, ნიმუშის გაანგარიშებისას მნიშვნელი არის არა რიცხვების საერთო რაოდენობა, არამედ ერთით ნაკლები. ეს კეთდება შეცდომის გამოსწორების მიზნით. Excel ითვალისწინებს ამ ნიუანსს სპეციალურ ფუნქციაში, რომელიც განკუთვნილია ამ ტიპის გაანგარიშებისთვის - DISP.V. მისი სინტაქსი წარმოდგენილია შემდეგი ფორმულით:

VAR.B (ნომერი1; ნომერი2;…)

არგუმენტების რაოდენობა, როგორც წინა ფუნქციაში, ასევე შეიძლება იყოს 1-დან 255-მდე.


როგორც ხედავთ, Excel-ის პროგრამას შეუძლია მნიშვნელოვნად შეუწყოს ხელი დისპერსიის გამოთვლას. ეს სტატისტიკა შეიძლება გამოითვალოს აპლიკაციით როგორც პოპულაციისთვის, ასევე ნიმუშისთვის. ამ შემთხვევაში, მომხმარებლის ყველა ქმედება რეალურად მცირდება მხოლოდ დასამუშავებელი რიცხვების დიაპაზონის მითითებით და Excel თავად ასრულებს მთავარ სამუშაოს. რა თქმა უნდა, ეს დაზოგავს მნიშვნელოვან დროს მომხმარებლებს.

მოდით გამოვთვალოთᲥᲐᲚᲑᲐᲢᲝᲜᲘEXCELნიმუშის ვარიაცია და სტანდარტული გადახრა. ჩვენ ასევე ვიანგარიშებთ შემთხვევითი ცვლადის დისპერსიას, თუ მისი განაწილება ცნობილია.

ჯერ განიხილეთ დისპერსია, მაშინ სტანდარტული გადახრა.

ნიმუშის ვარიაცია

ნიმუშის ვარიაცია (ნიმუშის ვარიაცია,ნიმუშიდისპერსიას) ახასიათებს მნიშვნელობების გავრცელებას მასივში .

სამივე ფორმულა მათემატიკურად ექვივალენტურია.

პირველი ფორმულიდან ჩანს, რომ ნიმუშის განსხვავებაარის მასივში თითოეული მნიშვნელობის კვადრატული გადახრების ჯამი საშუალოდანგაყოფილი ნიმუშის ზომაზე მინუს 1.

დისპერსია ნიმუშებიგამოიყენება DISP() ფუნქცია, ინგ. VAR-ის სახელი, ე.ი. ცვალებადობა. MS EXCEL 2010 წლიდან რეკომენდებულია მისი ანალოგი DISP.V() , ინგ. სახელი VARS, ე.ი. ნიმუშის ვარიაცია. გარდა ამისა, MS EXCEL 2010 ვერსიიდან დაწყებული, არსებობს DISP.G () ფუნქცია, ინგ. VARP სახელი, ე.ი. პოპულაციის VARIance რომელიც ითვლის დისპერსიაამისთვის მოსახლეობა. მთელი განსხვავება მოდის მნიშვნელზე: n-1-ის ნაცვლად, როგორიცაა DISP.V() , DISP.G() მნიშვნელში მხოლოდ n აქვს. MS EXCEL 2010-მდე, VARP() ფუნქცია გამოიყენებოდა პოპულაციის დისპერსიის გამოსათვლელად.

ნიმუშის ვარიაცია
=SQUARE(ნიმუში)/(COUNT(ნიმუში)-1)
=(SUMSQ(ნიმუში)-COUNT(ნიმუში)*AVERAGE(ნიმუში)^2)/ (COUNT(ნიმუში)-1)- ჩვეულებრივი ფორმულა
=SUM((ნიმუში -AVERAGE(ნიმუში))^2)/ (COUNT(ნიმუში)-1) –

ნიმუშის ვარიაცია 0-ის ტოლია მხოლოდ იმ შემთხვევაში, თუ ყველა მნიშვნელობა ერთმანეთის ტოლია და, შესაბამისად, ტოლია საშუალო ღირებულება. ჩვეულებრივ, რაც უფრო დიდია მნიშვნელობა დისპერსია, მით უფრო დიდია მნიშვნელობების გავრცელება მასივში.

ნიმუშის ვარიაციაარის ქულების შეფასება დისპერსიაშემთხვევითი ცვლადის განაწილება, საიდანაც ნიმუში. მშენებლობის შესახებ ნდობის ინტერვალებიშეფასებისას დისპერსიაშეგიძლიათ წაიკითხოთ სტატიაში.

შემთხვევითი ცვლადის ვარიაცია

Გამოთვლა დისპერსიაშემთხვევითი ცვლადი, თქვენ უნდა იცოდეთ იგი.

ამისთვის დისპერსიაშემთხვევითი ცვლადი X ხშირად იყენებს აღნიშვნას Var(X). დისპერსიაუდრის E(X) საშუალოდან გადახრის კვადრატს: Var(X)=E[(X-E(X)) 2 ]

დისპერსიაგამოითვლება ფორმულით:

სადაც x i არის მნიშვნელობა, რომელიც შეიძლება მიიღოს შემთხვევითი ცვლადი, და μ არის საშუალო მნიშვნელობა (), р(x) არის ალბათობა იმისა, რომ შემთხვევითი ცვლადი მიიღებს x მნიშვნელობას.

თუ შემთხვევით ცვლადს აქვს , მაშინ დისპერსიაგამოითვლება ფორმულით:

განზომილება დისპერსიაშეესაბამება საწყისი მნიშვნელობების საზომი ერთეულის კვადრატს. მაგალითად, თუ ნიმუშის მნიშვნელობები არის ნაწილის წონის გაზომვები (კგ), მაშინ დისპერსიის განზომილება იქნება კგ 2. ამის ინტერპრეტაცია შეიძლება რთული იყოს, ამიტომ მნიშვნელობების გავრცელების დახასიათება, მნიშვნელობის კვადრატული ფესვის ტოლი დისპერსიასტანდარტული გადახრა.

ზოგიერთი თვისება დისპერსია:

Var(X+a)=Var(X), სადაც X არის შემთხვევითი ცვლადი და a არის მუდმივი.

Var(aХ)=a 2 Var(X)

ვარ(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2=E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

ეს დისპერსიული თვისება გამოიყენება სტატია ხაზოვანი რეგრესიის შესახებ.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), სადაც X და Y არის შემთხვევითი ცვლადები, Cov(X;Y) არის ამ შემთხვევითი ცვლადების კოვარიანტობა.

თუ შემთხვევითი ცვლადები დამოუკიდებელია, მაშინ მათი კოვარიანტობაარის 0 და აქედან გამომდინარე Var(X+Y)=Var(X)+Var(Y). დისპერსიის ეს თვისება გამოიყენება გამოსავალში.

ვაჩვენოთ, რომ დამოუკიდებელი სიდიდეებისთვის Var(X-Y)=Var(X+Y). მართლაც, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var(X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). დისპერსიის ეს თვისება გამოიყენება ნახაზისთვის.

სტანდარტული გადახრის ნიმუში

სტანდარტული გადახრის ნიმუშიარის საზომი იმისა, თუ რამდენად ფართოდ არის მიმოფანტული მნიშვნელობები ნიმუშში მათთან შედარებით.

ა-პრიორიტეტი, სტანდარტული გადახრაუდრის კვადრატულ ფესვს დისპერსია:

Სტანდარტული გადახრაარ ითვალისწინებს მნიშვნელობების სიდიდეს სინჯის აღება, მაგრამ მხოლოდ მათ ირგვლივ ფასეულობების გაფანტვის ხარისხი შუა. ამის საილუსტრაციოდ ავიღოთ მაგალითი.

გამოვთვალოთ სტანდარტული გადახრა 2 ნიმუშისთვის: (1; 5; 9) და (1001; 1005; 1009). ორივე შემთხვევაში s=4. აშკარაა, რომ სტანდარტული გადახრის თანაფარდობა მასივის მნიშვნელობებთან მნიშვნელოვნად განსხვავდება ნიმუშებისთვის. ასეთი შემთხვევებისთვის გამოიყენეთ ცვალებადობის კოეფიციენტი(ვარიაციის კოეფიციენტი, CV) - თანაფარდობა სტანდარტული გადახრასაშუალომდე არითმეტიკა, გამოხატული პროცენტულად.

MS EXCEL 2007-ში და უფრო ადრეულ ვერსიებში გამოსათვლელად სტანდარტული გადახრის ნიმუშიფუნქცია =STDEV() გამოიყენება, ინგ. სახელი STDEV, ე.ი. სტანდარტული გადახრა. MS EXCEL 2010 წლიდან რეკომენდებულია მისი ანალოგი = STDEV.B () , ინგ. დაასახელეთ STDEV.S, ე.ი. სტანდარტული გადახრის ნიმუში.

გარდა ამისა, MS EXCEL 2010 ვერსიიდან დაწყებული, არსებობს ფუნქცია STDEV.G () , ინგ. დაასახელეთ STDEV.P, ე.ი. პოპულაციის სტანდარტული გადახრა, რომელიც ითვლის სტანდარტული გადახრაამისთვის მოსახლეობა. მთელი განსხვავება მოდის მნიშვნელზე: n-1-ის ნაცვლად, როგორიცაა STDEV.V() , STDEV.G() მნიშვნელში მხოლოდ n აქვს.

Სტანდარტული გადახრაასევე შეიძლება გამოითვალოს პირდაპირ ქვემოთ მოცემული ფორმულებიდან (იხ. ფაილის მაგალითი)
=SQRT(SQUADROTIV(ნიმუში)/(COUNT(ნიმუში)-1))
=SQRT((SUMSQ(ნიმუში)-COUNT(ნიმუში)*AVERAGE(ნიმუში)^2)/(COUNT(ნიმუში)-1))

დისპერსიის სხვა ზომები

SQUADRIVE() ფუნქცია ითვლის მმ მნიშვნელობების კვადრატული გადახრები მათგან შუა. ეს ფუნქცია დააბრუნებს იგივე შედეგს, როგორც ფორმულა =VAR.G( ნიმუში)*ᲩᲔᲙᲘ( ნიმუში), სადაც ნიმუში- მითითება დიაპაზონზე, რომელიც შეიცავს ნიმუშის მნიშვნელობების მასივს (). QUADROTIV() ფუნქციაში გამოთვლები ხდება ფორმულის მიხედვით:

SROOT() ფუნქცია ასევე არის მონაცემთა ნაკრების გაფანტვის საზომი. SIROTL() ფუნქცია ითვლის მნიშვნელობების გადახრების აბსოლუტური მნიშვნელობების საშუალოს. შუა. ეს ფუნქცია დააბრუნებს იგივე შედეგს, რასაც ფორმულა =SUMPRODUCT(ABS(Sample-AVERAGE(Sample)))/COUNT(Sample), სად ნიმუში- მითითება დიაპაზონზე, რომელიც შეიცავს ნიმუშის მნიშვნელობების მასივს.

SROOTKL () ფუნქციაში გამოთვლები ხდება ფორმულის მიხედვით:

.

პირიქით, თუ არის არაუარყოფითი ა.ე. ფუნქცია ისეთი, რომ , მაშინ არის აბსოლუტურად უწყვეტი ალბათობის საზომი, რომელიც არის მისი სიმკვრივე.

    ზომის ცვლილება ლებეგის ინტეგრალში:

,

სად არის ბორელის რომელიმე ფუნქცია ინტეგრირებადი ალბათობის საზომთან მიმართებაში.

დისპერსია, დისპერსიის სახეები და თვისებები დისპერსიის ცნება

დისპერსია სტატისტიკაშიგვხვდება, როგორც ნიშან-თვისების ინდივიდუალური მნიშვნელობების სტანდარტული გადახრა არითმეტიკული საშუალოდან კვადრატში. საწყისი მონაცემებიდან გამომდინარე, იგი განისაზღვრება მარტივი და შეწონილი დისპერსიის ფორმულებით:

1. მარტივი ვარიაცია(დაჯგუფებული მონაცემებისთვის) გამოითვლება ფორმულით:

2. შეწონილი ვარიაცია (ვარიაციის სერიებისთვის):

სადაც n - სიხშირე (განმეორებადობის ფაქტორი X)

დისპერსიის პოვნის მაგალითი

ეს გვერდი აღწერს დისპერსიის პოვნის სტანდარტულ მაგალითს, ასევე შეგიძლიათ გადახედოთ სხვა ამოცანებს მის საპოვნელად

მაგალითი 1. ჯგუფის, საშუალო ჯგუფის, ჯგუფს შორის და საერთო დისპერსიის განსაზღვრა

მაგალითი 2. ვარიაციისა და ვარიაციის კოეფიციენტის პოვნა დაჯგუფების ცხრილში

მაგალითი 3. დისკრეტულ სერიაში დისპერსიის პოვნა

მაგალითი 4. გვაქვს შემდეგი მონაცემები 20 მიმოწერის სტუდენტური ჯგუფისთვის. აუცილებელია მახასიათებლის განაწილების ინტერვალის სერიის აგება, მახასიათებლის საშუალო მნიშვნელობის გამოთვლა და მისი დისპერსიის შესწავლა.

მოდით ავაშენოთ ინტერვალის დაჯგუფება. მოდით განვსაზღვროთ ინტერვალის დიაპაზონი ფორმულით:

სადაც X max არის დაჯგუფების მახასიათებლის მაქსიმალური მნიშვნელობა; X min არის დაჯგუფების ფუნქციის მინიმალური მნიშვნელობა; n არის ინტერვალების რაოდენობა:

ჩვენ ვიღებთ n=5. ნაბიჯი არის: h \u003d (192 - 159) / 5 \u003d 6.6

მოდით გავაკეთოთ ინტერვალური დაჯგუფება

შემდგომი გამოთვლებისთვის ჩვენ ავაშენებთ დამხმარე ცხრილს:

X "i - ინტერვალის შუა. (მაგალითად, შუა ინტერვალით 159 - 165.6 \u003d 162.3)

სტუდენტების საშუალო ზრდა განისაზღვრება საშუალო შეწონილი არითმეტიკული ფორმულით:

ჩვენ განვსაზღვრავთ დისპერსიას ფორმულით:

ფორმულა შეიძლება გადაკეთდეს შემდეგნაირად:

ამ ფორმულიდან გამომდინარეობს, რომ განსხვავება არის განსხვავება ვარიანტების კვადრატების საშუალოსა და კვადრატსა და საშუალოს შორის.

ვარიაცია ვარიაციის სერიაშითანაბარი ინტერვალებით მომენტების მეთოდის მიხედვით შეიძლება გამოვთვალოთ შემდეგი გზით დისპერსიის მეორე თვისების გამოყენებით (ყველა ვარიანტის გაყოფა ინტერვალის მნიშვნელობით). დისპერსიის განმარტებამომენტების მეთოდით გამოთვლილი, შემდეგი ფორმულის მიხედვით ნაკლები დრო სჭირდება:

სადაც i არის ინტერვალის მნიშვნელობა; A - პირობითი ნული, რომელიც მოსახერხებელია ყველაზე მაღალი სიხშირით ინტერვალის შუა გამოსაყენებლად; m1 არის პირველი რიგის მომენტის კვადრატი; m2 - მეორე შეკვეთის მომენტი

მახასიათებლის განსხვავება (თუ სტატისტიკურ პოპულაციაში ატრიბუტი იცვლება ისე, რომ არსებობს მხოლოდ ორი ურთიერთგამომრიცხავი ვარიანტი, მაშინ ასეთ ცვალებადობას ალტერნატივა ეწოდება) შეიძლება გამოითვალოს ფორმულით:

ამ დისპერსიის ფორმულით q = 1-p ჩანაცვლებით, მივიღებთ:

დისპერსიის სახეები

სულ სხვაობაზომავს თვისების ცვალებადობას მთელ პოპულაციაში, როგორც მთლიანობაში, ყველა იმ ფაქტორების გავლენის ქვეშ, რომლებიც იწვევს ამ ცვალებადობას. ის უდრის x მახასიათებლის ცალკეული მნიშვნელობების გადახრების საშუალო კვადრატს მთლიანი საშუალო მნიშვნელობიდან x და შეიძლება განისაზღვროს, როგორც მარტივი დისპერსიული ან შეწონილი დისპერსია.

ჯგუფშიდა ვარიაცია ახასიათებს შემთხვევით ვარიაციას, ე.ი. ვარიაციის ნაწილი, რომელიც განპირობებულია გაუთვალისწინებელი ფაქტორების გავლენით და არ არის დამოკიდებული დაჯგუფების საფუძველში მყოფ ნიშან-ფაქტორზე. ასეთი ვარიაცია უდრის X ჯგუფში მახასიათებლის ცალკეული მნიშვნელობების გადახრების საშუალო კვადრატს ჯგუფის საშუალო არითმეტიკულიდან და შეიძლება გამოითვალოს როგორც მარტივი დისპერსია ან როგორც შეწონილი ვარიაცია.

ამრიგად, ჯგუფური დისპერსიის ზომებითვისების ვარიაცია ჯგუფში და განისაზღვრება ფორმულით:

სადაც xi - ჯგუფის საშუალო; ni არის ჯგუფში ერთეულების რაოდენობა.

მაგალითად, ჯგუფშიდა განსხვავებები, რომლებიც უნდა განისაზღვროს მაღაზიაში მუშაკთა კვალიფიკაციის გავლენის შესასწავლად შრომის პროდუქტიულობის დონეზე, აჩვენებს ცვალებადობას თითოეულ ჯგუფში, რომელიც გამოწვეულია ყველა შესაძლო ფაქტორით (აღჭურვილობის ტექნიკური მდგომარეობა, ხელსაწყოების და მასალების ხელმისაწვდომობა, მუშაკთა ასაკი, შრომის ინტენსივობა და ა.შ.), გარდა კვალიფიკაციის კატეგორიაში განსხვავებებისა (ჯგუფში ყველა მუშაკს აქვს იგივე კვალიფიკაცია).

ჯგუფური ვარიაციების საშუალო ასახავს შემთხვევით ვარიაციებს, ანუ ვარიაციის იმ ნაწილს, რომელიც მოხდა ყველა სხვა ფაქტორების გავლენის ქვეშ, გარდა დაჯგუფების ფაქტორისა. იგი გამოითვლება ფორმულით:

ჯგუფთაშორისი ვარიაციაახასიათებს მიღებული ნიშან-თვისების სისტემატურ ცვალებადობას, რაც განპირობებულია დაჯგუფების საფუძვლად მყოფი თვისება-ფაქტორის გავლენით. იგი უდრის ჯგუფური საშუალებების გადახრების საშუალო კვადრატს საერთო საშუალოდან. ჯგუფთაშორისი განსხვავება გამოითვლება ფორმულით: