საშუალო მიახლოების შეცდომის მნიშვნელობების დასაშვები ზღვარი. რეგრესიის მოდელირების შედეგების სტატისტიკური სანდოობის შეფასება ფიშერის F-კრიტერიუმის გამოყენებით

5. F- კრიტერიუმის გამოყენებით დადგინდა, რომ მიღებული წყვილის რეგრესიის განტოლება მთლიანობაში სტატისტიკურად უმნიშვნელოა და არაადეკვატურად აღწერს ყოველთვიურ პენსიას y და საარსებო მინიმუმს x შორის ურთიერთობის შესწავლილ მოვლენას.

6. ჩამოყალიბდა მრავალჯერადი წრფივი რეგრესიის ეკონომეტრიული მოდელი, რომელიც აკავშირებს პირობითი ფირმის y წმინდა შემოსავლის ღირებულებას კაპიტალის ბრუნვასთან x1 და დასაქმებულ კაპიტალთან x2.

7. ელასტიურობის კოეფიციენტების გამოთვლით ნაჩვენებია, რომ კაპიტალის ბრუნვის 1%-ით ცვლილებით, კომპანიის წმინდა შემოსავლის ღირებულება იცვლება 0,0008%-ით, ხოლო გამოყენებული კაპიტალის 1%-ით, კომპანიის ღირებულება. წმინდა შემოსავალი იცვლება 0,56%-ით.

8. t-ტესტის გამოყენებით შეფასდა რეგრესიის კოეფიციენტების სტატისტიკური მნიშვნელოვნება, დადგინდა, რომ ახსნა ცვლადი x 1 სტატისტიკურად უმნიშვნელოა და შეიძლება გამოირიცხოს რეგრესიის განტოლებიდან, ხოლო ახსნა ცვლადი x 2 სტატისტიკურად მნიშვნელოვანია.

9. F-კრიტერიუმის გამოყენებით აღმოჩნდა, რომ მიღებული წყვილის რეგრესიის განტოლება მთლიანობაში არის სტატისტიკურად მნიშვნელოვანი და ადეკვატურად აღწერს შესწავლილ ფენომენს პირობითი ფირმის წმინდა შემოსავლის ღირებულების ურთიერთობას შორის კაპიტალის ბრუნვასთან x 1. და გამოყენებული კაპიტალი x 2.

10. გამოითვალა მრავალჯერადი რეგრესიის წრფივი განტოლებით სტატისტიკური მონაცემების მიახლოების საშუალო ცდომილება, რომელმაც შეადგინა 29,8%. ნაჩვენებია სტატისტიკურ მონაცემთა ბაზაში რომელი დაკვირვების გამო ამ შეცდომის მნიშვნელობა აღემატება დასაშვებ მნიშვნელობას.

14. დაწყვილებული რეგრესიის მოდელის აგება EXCEL-ის გამოყენების გარეშე.

3.5 ცხრილში მოცემული სტატისტიკური მასალის გამოყენებით აუცილებელია:

2. შეაფასეთ კავშირის სიმჭიდროვე კორელაციისა და განსაზღვრის ინდიკატორების გამოყენებით.

3. ელასტიურობის კოეფიციენტის გამოყენებით დაადგინეთ ფაქტორული ატრიბუტისა და შედეგის კავშირის ხარისხი.

4. დაადგინეთ საშუალო მიახლოების შეცდომა.

5. შეაფასეთ სიმულაციის სტატისტიკური სანდოობა Fisher F-ტესტის გამოყენებით.

ცხრილი 3.5. საწყისი მონაცემები.

ფულადი შემოსავლის წილი, რომელიც მიზნად ისახავს დანაზოგების გაზრდას დეპოზიტებში, სესხებზე, სერთიფიკატებში და უცხოური ვალუტის შესაძენად, ერთ სულ მოსახლეზე საშუალო ფულადი შემოსავლის საერთო ოდენობით, %

საშუალო თვიური დარიცხული ხელფასი, ქ.

კალუგა

კოსტრომა

ორლოვსკაია

რიაზანი

სმოლენსკი

დაწყვილებული წრფივი რეგრესიის განტოლების b 0 , b 1 უცნობი პარამეტრების დასადგენად ვიყენებთ ნორმალური განტოლებების სტანდარტულ სისტემას, რომელსაც აქვს ფორმა

(3.7)

ამ სისტემის გადასაჭრელად პირველ რიგში საჭიროა Sx 2 და Sxy-ის მნიშვნელობების დადგენა. ეს მნიშვნელობები განისაზღვრება საწყისი მონაცემების ცხრილიდან, ავსებს მას შესაბამისი სვეტებით (ცხრილი 3.6).

ცხრილი 3.6. რეგრესიის კოეფიციენტების გამოსათვლელად.

შემდეგ სისტემა (3.7) იღებს ფორმას

გამოვხატავთ b 0-ს პირველი განტოლებიდან და მიღებული გამონათქვამის ჩანაცვლებით მეორე განტოლებით, მივიღებთ:

ვადით გამრავლების შესრულება და ფრჩხილების გაფართოება, მივიღებთ:

დაბოლოს, დაწყვილებული წრფივი რეგრესიის განტოლება, რომელიც აკავშირებს მოსახლეობის ფულადი შემოსავლის წილს, რომელიც მიმართულია დანაზოგის გაზრდაზე y საშუალო თვიურ დარიცხულ ხელფასთან x, აქვს ფორმა:

ასე რომ, როგორც დაწყვილებული წრფივი რეგრესიის განტოლება აგებულია, ჩვენ განვსაზღვრავთ წრფივი კორელაციის კოეფიციენტს დამოკიდებულებიდან:

სადაც არის შესაბამისი პარამეტრების სტანდარტული გადახრების მნიშვნელობები.

დამოკიდებულებიდან (3.9) წრფივი კორელაციის კოეფიციენტის გამოსათვლელად ჩვენ შევასრულებთ შუალედურ გამოთვლებს.

ნაპოვნი პარამეტრების მნიშვნელობების (3.9) ჩანაცვლებით, ჩვენ ვიღებთ

.

წრფივი კორელაციის კოეფიციენტის მიღებული მნიშვნელობა მიუთითებს სუსტი შებრუნებული სტატისტიკური კავშირის არსებობაზე მოსახლეობის ფულადი შემოსავლის წილს, რომელიც მიმართულია დანაზოგის გაზრდაზე y და საშუალო თვიურ დარიცხულ ხელფასს x შორის.

განსაზღვრის კოეფიციენტი არის , რაც ნიშნავს, რომ მხოლოდ 9.6% აიხსნება y-ით ახსნა-განმარტებითი ცვლადის რეგრესით. შესაბამისად, 1-ის მნიშვნელობა ტოლია 90,4%-ისა, ახასიათებს ცვლადის დისპერსიის წილს, რომელიც გამოწვეულია ყველა სხვა ახსნა-განმარტებითი ცვლადის გავლენით, რომელიც არ არის გათვალისწინებული ეკონომეტრიულ მოდელში.

ელასტიურობის კოეფიციენტი უდრის

შესაბამისად, საშუალო თვიური დარიცხული ხელფასის ღირებულების 1%-ით ცვლილებასთან ერთად 1%-ით მცირდება მოსახლეობის ფულადი შემოსავლის წილი, რომელიც მიმართულია დანაზოგის გაზრდაზე, ხოლო ხელფასის მატებასთან ერთად მცირდება წილი. მოსახლეობის ფულადი შემოსავალი მიზნად ისახავს დანაზოგის გაზრდას. ეს დასკვნა ეწინააღმდეგება საღ აზრს და მხოლოდ ჩამოყალიბებული მათემატიკური მოდელის არასწორად აიხსნება.

გამოვთვალოთ საშუალო მიახლოების შეცდომა.

ცხრილი 3.7. საშუალო მიახლოების ცდომილების გამოთვლაზე.

მიღებული მნიშვნელობა აღემატება (12…15)%-ს, რაც მიუთითებს გამოთვლილი მონაცემების საშუალო გადახრის მნიშვნელობაზე ფაქტობრივი მონაცემებისგან, რომელზედაც აგებულია ეკონომეტრიული მოდელი.

სტატისტიკური მოდელირების სანდოობა შესრულებულია ფიშერის F-კრიტერიუმის საფუძველზე. ფიშერის კრიტერიუმის Fcalc-ის თეორიული მნიშვნელობა განისაზღვრება ფაქტორული და ნარჩენი დისპერსიების მნიშვნელობების თანაფარდობიდან, რომელიც გამოითვლება თავისუფლების ერთი ხარისხით ფორმულის მიხედვით.

სადაც n არის დაკვირვებების რაოდენობა;

m არის განმარტებითი ცვლადების რაოდენობა (განხილული მაგალითისთვის m m =1).

კრიტიკული მნიშვნელობა Fcrit განისაზღვრება სტატისტიკური ცხრილებიდან და მნიშვნელოვნების დონისთვის a = 0.05 უდრის 10.13-ს. ვინაიდან F კალკ

15. მრავალჯერადი რეგრესიის მოდელის აგება EXCEL-ის გამოყენების გარეშე.

3.8 ცხრილში მოცემული სტატისტიკური მასალის გამოყენებით თქვენ უნდა:

1. ააგეთ წრფივი მრავალჯერადი რეგრესიის განტოლება, ახსენით მისი პარამეტრების ეკონომიკური მნიშვნელობა.

2. პროდუქტიულ ატრიბუტთან ფაქტორების ურთიერთობის სიახლოვის შედარებითი შეფასება საშუალო (ზოგადი) ელასტიურობის კოეფიციენტების გამოყენებით.

3. შეაფასეთ რეგრესიის კოეფიციენტების სტატისტიკური მნიშვნელოვნება t-ტესტის გამოყენებით და განტოლების ნულოვანი ჰიპოთეზის უმნიშვნელო ყოფნის F-ტესტის გამოყენებით.

4. შეაფასეთ განტოლების ხარისხი საშუალო მიახლოების ცდომილების განსაზღვრით.

ცხრილი 3.8. საწყისი მონაცემები.

წმინდა შემოსავალი, მლნ აშშ დოლარი

კაპიტალის ბრუნვა მლნ

გამოყენებული კაპიტალი, მლნ. აშშ დოლარი

მრავალჯერადი წრფივი რეგრესიის განტოლების b 0 , b 1 , b 2 უცნობი პარამეტრების დასადგენად ვიყენებთ ნორმალური განტოლებების სტანდარტულ სისტემას, რომელსაც აქვს ფორმა

(3.11)

ამ სისტემის გადასაჭრელად, პირველ რიგში აუცილებელია Sx 1 2 , Sx 2 2 , Sx 1 y, Sx 2 y, Sx 1 x 2 მნიშვნელობების დადგენა. ეს მნიშვნელობები განისაზღვრება საწყისი მონაცემების ცხრილიდან, ავსებს მას შესაბამისი სვეტებით (ცხრილი 3.9).

ცხრილი 3.9. რეგრესიის კოეფიციენტების გამოსათვლელად.

შემდეგ სისტემა (3.11) იღებს ფორმას

ამ სისტემის ამოსახსნელად ვიყენებთ გაუსის მეთოდს, რომელიც შედგება უცნობების თანმიმდევრული აღმოფხვრაში: სისტემის პირველ განტოლებას ვყოფთ 10-ზე, შემდეგ მიღებულ განტოლებას ვამრავლებთ 370.6-ზე და ვაკლებთ სისტემის მეორე განტოლებას. შემდეგ მიღებული განტოლება გავამრავლოთ 158.20-ზე და გამოვაკლოთ სისტემის მესამე განტოლებას. სისტემის გარდაქმნილი მეორე და მესამე განტოლებისთვის მითითებული ალგორითმის გამეორებით, მივიღებთ:

Þ Þ

Þ .

ტრანსფორმაციის შემდეგ გვაქვს:

შემდეგ, საბოლოოდ, წმინდა შემოსავლის დამოკიდებულებას კაპიტალის ბრუნვაზე და დასაქმებულ კაპიტალზე წრფივი მრავალჯერადი რეგრესიის განტოლების სახით აქვს ფორმა:

მიღებული ეკონომეტრიული განტოლებიდან ჩანს, რომ დასაქმებული კაპიტალის მატებასთან ერთად იზრდება წმინდა შემოსავალი და პირიქით, კაპიტალის ბრუნვის მატებასთან ერთად წმინდა შემოსავალი მცირდება. გარდა ამისა, რაც უფრო დიდია რეგრესიის კოეფიციენტი, მით მეტია ახსნითი ცვლადის გავლენა დამოკიდებულ ცვლადზე. ამ მაგალითში, რეგრესიის კოეფიციენტის მნიშვნელობა მეტია კოეფიციენტის მნიშვნელობაზე, შესაბამისად, გამოყენებული კაპიტალი გაცილებით დიდ გავლენას ახდენს წმინდა შემოსავალზე, ვიდრე კაპიტალის ბრუნვა. ამ დასკვნის რაოდენობრივი დასადგენად, ჩვენ განვსაზღვრავთ ელასტიურობის ნაწილობრივ კოეფიციენტებს.

მიღებული შედეგების ანალიზი ასევე აჩვენებს, რომ გამოყენებული კაპიტალი უფრო დიდ გავლენას ახდენს წმინდა შემოსავალზე. ასე რომ, კერძოდ, დასაქმებული კაპიტალის 1%-ით ზრდით, წმინდა შემოსავალი იზრდება 1,17%-ით. ამასთან, კაპიტალის ბრუნვის 1%-ით ზრდით, წმინდა შემოსავალი 0,5%-ით მცირდება.

ფიშერის კრიტერიუმის თეორიული მნიშვნელობა F calc

კრიტიკული მნიშვნელობის F crit-ის მნიშვნელობა განისაზღვრება სტატისტიკური ცხრილებით და მნიშვნელოვნების დონისთვის a = 0.05 უდრის 4.74-ს. ვინაიდან F calc > F კრიტი, ნულოვანი ჰიპოთეზა უარყოფილია და მიღებული რეგრესიის განტოლება მიჩნეულია სტატისტიკურად მნიშვნელოვანი.

რეგრესიის კოეფიციენტების სტატისტიკური მნიშვნელოვნების შეფასება t-კრიტერიუმის მიხედვით მცირდება ამ კოეფიციენტების რიცხვითი მნიშვნელობის შედარებაზე მათი შემთხვევითი შეცდომების სიდიდესთან და დამოკიდებულების მიხედვით:

t-სტატისტიკის თეორიული მნიშვნელობის გამოთვლის სამუშაო ფორმულა არის:

, (3.13)

სადაც წყვილი კორელაციის კოეფიციენტები და მრავალჯერადი კორელაციის კოეფიციენტი გამოითვლება დამოკიდებულებიდან:

მაშინ t- სტატისტიკის თეორიული (გამოთვლილი) მნიშვნელობები შესაბამისად უდრის:

ვინაიდან t-სტატისტიკის კრიტიკული მნიშვნელობა, განსაზღვრული სტატისტიკური ცხრილების მიხედვით მნიშვნელოვნების დონისთვის a=0.05, tcrit=2.36 ტოლია აბსოლუტური მნიშვნელობით = - 1.798, მაშინ ნულოვანი ჰიპოთეზა არ არის უარყოფილი და ახსნა-განმარტებადი ცვლადი x 1. არის სტატისტიკურად უმნიშვნელო და მისი გამორიცხვა შესაძლებელია რეგრესიის განტოლებიდან. პირიქით, მეორე რეგრესიის კოეფიციენტისთვის > t კრიტი (3.3 >2.36) და ახსნა-განმარტებადი ცვლადი x 2 არის სტატისტიკურად მნიშვნელოვანი.

გამოვთვალოთ საშუალო მიახლოების შეცდომა.

ცხრილი 3.10. საშუალო მიახლოების ცდომილების გამოთვლაზე.

მაშინ საშუალო მიახლოების შეცდომა უდრის

მიღებული მნიშვნელობა არ აღემატება დასაშვებ ზღვარს (12…15)%.

16. გაზომვების თეორიის განვითარების ისტორია

თავდაპირველად, TI განვითარდა, როგორც ფსიქოფიზიკური გაზომვების თეორია. ომისშემდგომ პუბლიკაციებში ამერიკელმა ფსიქოლოგმა ს.ს. სტეფენსმა ყურადღება გაამახვილა გაზომვის სკალებზე. XX საუკუნის მეორე ნახევარში. TI-ის სფერო სწრაფად ფართოვდება. 1950-იან წლებში აშშ-ში გამოცემული „ფსიქოლოგიური მეცნიერებათა ენციკლოპედიის“ ერთ-ერთ ტომს ეწოდა „ფსიქოლოგიური გაზომვები“. ამ პუბლიკაციის შემდგენლებმა გააფართოვეს TI-ის სფერო ფსიქოფიზიკიდან ზოგადად ფსიქოლოგიამდე. ამ კრებულის სტატიაში „გაზომვების თეორიის საფუძვლები“ ​​პრეზენტაცია წარიმართა აბსტრაქტულ-მათემატიკურ დონეზე, გამოყენების რაიმე კონკრეტული სფეროს მითითების გარეშე. მასში აქცენტი გაკეთდა „ემპირიული სისტემების ჰომომორფიზმებზე რიცხვით მიმართებით“ (აქ არ არის საჭირო ამ მათემატიკური ტერმინების შესწავლა), ხოლო პრეზენტაციის მათემატიკური სირთულე გაიზარდა S.S.-ის ნაშრომებთან შედარებით. სტივენსი.

TI-ის შესახებ ერთ-ერთ პირველ შიდა სტატიაში (60-იანი წლების ბოლოს) აღმოჩნდა, რომ ექსპერტების მიერ ექსპერტიზის ობიექტების შეფასებისას მინიჭებული ქულები, როგორც წესი, იზომება რიგითი მასშტაბით. სამუშაოებმა, რომლებიც გაჩნდა 1970-იანი წლების დასაწყისში, განაპირობა TI გამოყენების არეალის მნიშვნელოვანი გაფართოება. იგი გამოიყენებოდა პედაგოგიურ კვალიმეტრაზე (სტუდენტების ცოდნის ხარისხის საზომში), სისტემურ კვლევებში, საექსპერტო შეფასების თეორიის სხვადასხვა ამოცანებში, პროდუქტის ხარისხის მაჩვენებლების აგრეგაციისთვის, სოციოლოგიურ კვლევებში და ა.შ.

კონკრეტული მონაცემების გაზომვის სკალის დადგენის პარალელურად, მონაცემთა ანალიზის ალგორითმების ძიება დასახელდა TI-ის ორ მთავარ პრობლემად, რომელთა შედეგი არ იცვლება სკალის რაიმე დასაშვები ტრანსფორმაციისას (ანუ უცვლელია მიმართებაში. გეოგრაფიაში რიგითი მასშტაბებია ბოფორტის მასშტაბის ქარები ("მშვიდი", "სუსტი ქარი", "ზომიერი ქარი" და ა.შ.), მიწისძვრის სიძლიერის მასშტაბი. ცხადია, არ შეიძლება იმის მტკიცება, რომ 2 მაგნიტუდის მიწისძვრა (ნათურა ატრიალდა ჭერის ქვეშ) ზუსტად 5-ჯერ სუსტია ვიდრე 10 მაგნიტუდის მიწისძვრა (დედამიწის ზედაპირზე ყველაფრის სრული განადგურება).

მედიცინაში რიგითი სასწორები არის ჰიპერტენზიის სტადიის სკალა (მიასნიკოვის მიხედვით), გულის უკმარისობის ხარისხების მასშტაბი (სტრაჟესკო-ვასილენკო-ლანგის მიხედვით), კორონარული უკმარისობის სიმძიმის მასშტაბი (ფოგელსონის მიხედვით) და ა.შ. ყველა ეს სასწორი აგებულია სქემის მიხედვით: დაავადება არ არის გამოვლენილი; დაავადების პირველი ეტაპი; მეორე ეტაპი; მესამე ეტაპი ... ზოგჯერ განასხვავებენ ეტაპებს 1a, 16 და ა.შ.. თითოეულ სტადიას აქვს მხოლოდ მისთვის დამახასიათებელი სამედიცინო მახასიათებელი. შეზღუდული შესაძლებლობის მქონე ჯგუფების აღწერისას, რიცხვები გამოიყენება საპირისპირო თანმიმდევრობით: ყველაზე მძიმე - პირველი ინვალიდობის ჯგუფი, შემდეგ - მეორე, ყველაზე მსუბუქი - მესამე.

სახლების ნომრები ასევე იზომება რიგითი მასშტაბით - ისინი აჩვენებენ რა თანმიმდევრობას აქვს სახლები ქუჩის გასწვრივ. მწერლის მიერ შეგროვებულ ნაწარმოებებში მოცულობის ნომრები ან საწარმოს არქივში საქმის ნომრები, როგორც წესი, დაკავშირებულია ქრონოლოგიურ თანმიმდევრობასთან, რომლითაც ისინი შეიქმნა.

პროდუქციისა და მომსახურების ხარისხის შეფასებისას პოპულარულია რიგითი სასწორები ე.წ. კერძოდ, გამომავალი ერთეული ფასდება, როგორც კარგი ან ცუდი. უფრო საფუძვლიანი ანალიზის დროს გამოიყენება სამი გრადაციის მქონე სკალა: არის მნიშვნელოვანი დეფექტები - არის მხოლოდ მცირე დეფექტები - არ არის დეფექტები. ზოგჯერ გამოიყენება ოთხი გრადაცია: არის კრიტიკული დეფექტები (გამოყენების შეუძლებელს ხდის) - არის მნიშვნელოვანი დეფექტები - არის მხოლოდ მცირე დეფექტები - არ არის დეფექტები. პროდუქტის ხარისხს მსგავსი მნიშვნელობა აქვს - უმაღლესი კლასი, პირველი კლასი, მეორე კლასი, ...

გარემოზე ზემოქმედების შეფასებისას პირველი, ყველაზე განზოგადებული შეფასება, როგორც წესი, რიგითია, მაგალითად: ბუნებრივი გარემო სტაბილურია - ბუნებრივი გარემო დაჩაგრული (დამამცირებელი). ეკოლოგიურ-სამედიცინო მასშტაბი მსგავსია: არ არის გამოხატული ზემოქმედება ადამიანების ჯანმრთელობაზე - აღინიშნება ჯანმრთელობაზე უარყოფითი ზემოქმედება.

რიგითი მასშტაბი ასევე გამოიყენება სხვა სფეროებში. ეკონომეტრიაში, ეს, პირველ რიგში, ექსპერტთა შეფასების სხვადასხვა მეთოდია.

ყველა საზომი სკალა იყოფა ორ ჯგუფად - ხარისხობრივი ნიშნების სკალები და რაოდენობრივი ნიშნების სკალები. რიგითი სკალა და სახელების სკალა არის ხარისხობრივი მახასიათებლების ძირითადი სკალები, შესაბამისად, ბევრ კონკრეტულ სფეროში, ხარისხობრივი ანალიზის შედეგები შეიძლება ჩაითვალოს ამ სკალების საზომებად. რაოდენობრივი ნიშნების სკალები არის ინტერვალების, თანაფარდობების, განსხვავებების, აბსოლუტური სკალები. ინტერვალების მასშტაბი ზომავს პოტენციური ენერგიის მნიშვნელობას ან სწორ ხაზზე წერტილის კოორდინატს. ამ შემთხვევაში სკალაზე არც ბუნებრივი საცნობარო წერტილი და არც ბუნებრივი საზომი ერთეულის მონიშვნა შეუძლებელია. მკვლევარმა თავად უნდა დაადგინოს საცნობარო წერტილი და თავად აირჩიოს საზომი ერთეული. მართებული გარდაქმნები ინტერვალის შკალაში არის წრფივი მზარდი გარდაქმნები, ე.ი. ხაზოვანი ფუნქციები. ცელსიუსის და ფარენჰაიტის ტემპერატურის შკალები დაკავშირებულია ზუსტად ასეთი ურთიერთობით: ° C \u003d 5/9 (° F - 32), სადაც ° C არის ტემპერატურა (გრადუსებში) ცელსიუსის მასშტაბით, და ° F არის ტემპერატურა ფარენჰაიტის მასშტაბით.

რაოდენობრივი სკალებიდან მეცნიერებასა და პრაქტიკაში ყველაზე გავრცელებულია თანაფარდობის სასწორები. მათ აქვთ ბუნებრივი მინიშნება - ნული, ე.ი. არა რაოდენობა, მაგრამ არც ბუნებრივი საზომი ერთეული. ფიზიკური ერთეულების უმეტესობა იზომება თანაფარდობის მასშტაბით: სხეულის მასა, სიგრძე, მუხტი, ისევე როგორც ფასები ეკონომიკაში. ურთიერთობების მასშტაბის დასაშვები გარდაქმნები მსგავსია (მხოლოდ მასშტაბის შეცვლა). სხვა სიტყვებით რომ ვთქვათ, წრფივი დამატებითი კონვერტაციები კვეთის გარეშე, როგორიცაა ფასების კონვერტაცია ერთი ვალუტიდან მეორეზე ფიქსირებული კურსით. დავუშვათ, რომ ჩვენ ვადარებთ ორი საინვესტიციო პროექტის ეკონომიკურ ეფექტურობას ფასების რუბლის გამოყენებით. დაე, პირველი პროექტი მეორეზე უკეთესი იყოს. ახლა გადავიდეთ ჩინეთის ვალუტაზე, იუანზე, ფიქსირებული კურსის გამოყენებით. ცხადია, პირველი პროექტი კვლავ უფრო მომგებიანი უნდა იყოს, ვიდრე მეორე. თუმცა, გაანგარიშების ალგორითმები ავტომატურად არ უზრუნველყოფს ამ პირობის შესრულებას და აუცილებელია შეამოწმოს მისი შესრულება. ასეთი ტესტის შედეგები საშუალო მნიშვნელობებისთვის აღწერილია ქვემოთ.

განსხვავებების მასშტაბში არის გაზომვის ბუნებრივი ერთეული, მაგრამ არ არსებობს ბუნებრივი საცნობარო წერტილი. დრო იზომება განსხვავებების შკალით, თუ წელი (ან დღე - შუადღიდან შუადღემდე) აღებულია, როგორც საზომი ბუნებრივი ერთეული, ხოლო ზოგად შემთხვევაში ინტერვალების სკალაზე. ცოდნის ამჟამინდელ დონეზე, ბუნებრივი საცნობარო წერტილის დაკონკრეტება შეუძლებელია. სხვადასხვა ავტორი სხვადასხვა გზით ითვლის სამყაროს შექმნის თარიღს, ასევე ქრისტეს შობის მომენტს.

მხოლოდ აბსოლუტური სკალისთვის, გაზომვის შედეგები არის რიცხვები სიტყვის ჩვეულებრივი გაგებით, მაგალითად, ოთახში მყოფი ადამიანების რაოდენობა. აბსოლუტური მასშტაბისთვის დაშვებულია მხოლოდ იდენტობის ტრანსფორმაცია.

შესაბამისი ცოდნის სფეროს განვითარების პროცესში შესაძლოა შეიცვალოს მასშტაბის ტიპი. ასე რომ, თავდაპირველად ტემპერატურა იზომებოდა რიგითი მასშტაბით (უფრო ცივი - თბილი). შემდეგ - ინტერვალის სკალაზე (ცელსიუსი, ფარენჰეიტი, რეუმური). და ბოლოს, აბსოლუტური ნულის აღმოჩენის შემდეგ, ტემპერატურა შეიძლება ჩაითვალოს გაზომილი თანაფარდობის მასშტაბით (კელვინის სკალა). უნდა აღინიშნოს, რომ ზოგჯერ სპეციალისტებს შორის არის უთანხმოება იმის თაობაზე, თუ რომელი სასწორები უნდა იქნას გამოყენებული გარკვეული რეალური სიდიდეების გაზომვისთვის. სხვა სიტყვებით რომ ვთქვათ, გაზომვის პროცესი მოიცავს მასშტაბის ტიპის განსაზღვრას (სასწორის კონკრეტული ტიპის არჩევის დასაბუთებასთან ერთად). ჩამოთვლილი სასწორების ექვსი ძირითადი ტიპის გარდა, ზოგჯერ გამოიყენება სხვა სასწორები.

17. უცვლელი ალგორითმები და საშუალო მნიშვნელობები.

მოდით ჩამოვაყალიბოთ TI-ში მონაცემთა ანალიზის ალგორითმების ძირითადი მოთხოვნა: გარკვეული ტიპის სკალაზე გაზომილი მონაცემების საფუძველზე გამოტანილი დასკვნები არ უნდა შეიცვალოს ამ მონაცემების გაზომვის სკალის მისაღები ტრანსფორმაციის შედეგად. სხვა სიტყვებით რომ ვთქვათ, დასკვნები უნდა იყოს უცვლელი დაშვებული მასშტაბის გარდაქმნების მიმართ.

ამრიგად, გაზომვების თეორიის ერთ-ერთი მთავარი მიზანია მკვლევარის სუბიექტურობის წინააღმდეგ ბრძოლა რეალურ ობიექტებზე რიცხვითი მნიშვნელობების მინიჭებისას. ასე რომ, მანძილი შეიძლება გაიზომოს არშინებით, მეტრით, მიკრონებით, მილებით, პარსეკებით და სხვა საზომი ერთეულებით. მასა (წონა) - ფუნტებში, კილოგრამებში, ფუნტებში და ა.შ. საქონლისა და მომსახურების ფასები შეიძლება მითითებული იყოს იუანში, რუბლებში, ტენგეში, გრივნაში, ლატებში, კრონებში, მარკებში, აშშ დოლარში და სხვა ვალუტაში (კონვერტაციის განსაზღვრული კურსის მიხედვით). ხაზგასმით აღვნიშნოთ ძალიან მნიშვნელოვანი, თუმცა საკმაოდ აშკარა გარემოება: საზომი ერთეულების არჩევანი დამოკიდებულია მკვლევარზე, ე.ი. სუბიექტური. სტატისტიკური დასკვნები შეიძლება იყოს რეალობის ადეკვატური მხოლოდ მაშინ, როდესაც ისინი არ არიან დამოკიდებული იმაზე, თუ რომელ საზომ ერთეულს ანიჭებს უპირატესობას მკვლევარი, როდესაც ისინი უცვლელია მისაღები მასშტაბის ტრანსფორმაციის პირობებში. ეკონომეტრიული მონაცემების ანალიზის მრავალი ალგორითმიდან მხოლოდ რამდენიმე აკმაყოფილებს ამ პირობას. ვაჩვენოთ ის საშუალო მნიშვნელობების შედარების მაგალითზე.

მოდით X 1 , X 2 ,.., X n იყოს n ზომის ნიმუში. არითმეტიკული საშუალო ხშირად გამოიყენება. არითმეტიკული საშუალოს გამოყენება იმდენად ჩვეულებრივია, რომ ტერმინში მეორე სიტყვა ხშირად გამოტოვებულია და მოიხსენიება როგორც საშუალო ხელფასი, საშუალო შემოსავალი და სხვა საშუალო მაჩვენებლები კონკრეტული ეკონომიკური მონაცემებისთვის, რაც ნიშნავს "საშუალო" არითმეტიკულ საშუალოს. ასეთი ტრადიცია შეიძლება გამოიწვიოს მცდარი დასკვნები. ეს ვაჩვენოთ პირობითი საწარმოს თანამშრომლების საშუალო ხელფასის (საშუალო შემოსავლის) გაანგარიშების მაგალითით. 100 მუშაკიდან მხოლოდ 5-ს აქვს ხელფასი, რომელიც აღემატება მას, ხოლო დანარჩენი 95-ის ხელფასი საგრძნობლად ნაკლებია საშუალო არითმეტიკულ მაჩვენებელზე. მიზეზი აშკარაა – ერთი ადამიანის – გენერალური დირექტორის ხელფასი აღემატება 95 მუშის – დაბალკვალიფიციური და მაღალკვალიფიციური მუშების, ინჟინრებისა და თანამშრომლების ხელფასს. სიტუაცია წააგავს საავადმყოფოს შესახებ ცნობილ სიუჟეტში აღწერილ ვითარებას, რომელშიც 10 პაციენტს, მათგან 9-ს აქვს 40°C ტემპერატურა, ერთს კი უკვე ამოწურული აქვს, მორგში იმყოფება 0°C ტემპერატურაზე. იმავდროულად, საავადმყოფოში საშუალო ტემპერატურაა 36°C - ეს არ გაუმჯობესდება!

ამრიგად, საშუალო არითმეტიკული შეიძლება გამოყენებულ იქნას მხოლოდ საკმაოდ ერთგვაროვანი პოპულაციებისთვის (ამა თუ იმ მიმართულებით დიდი გამონაკლისების გარეშე). და როგორია საშუალოდ გამოვიყენოთ ხელფასების აღსაწერად? სავსებით ბუნებრივია გამოიყენოს მედიანა - 50-ე და 51-ე თანამშრომელთა საშუალო არითმეტიკული, თუ მათი ანაზღაურება უცვლელია. ჯერ მოდის 40 დაბალი კვალიფიკაციის მქონე მუშაკის ხელფასი, შემდეგ კი - 41-დან 70-ე მუშაკამდე - მაღალკვალიფიციური მუშაკების ანაზღაურება. შესაბამისად, მედიანა სწორედ მათზე მოდის და უდრის 200-ს. 50 მუშაკისთვის ხელფასი არ აღემატება 200-ს, ხოლო 50-ისთვის - სულ მცირე 200-ს, ამიტომ მედიანა აჩვენებს „ცენტრს“, რომლის ირგვლივ არის შესწავლილი მნიშვნელობების ძირითადი ნაწილი. დაჯგუფებულია. კიდევ ერთი საშუალო არის რეჟიმი, ყველაზე ხშირად წარმოქმნილი მნიშვნელობა. განსახილველ შემთხვევაში ეს არის დაბალკვალიფიციური მუშაკების ხელფასი, ე.ი. 100. ამრიგად, ხელფასის აღსაწერად გვაქვს სამი საშუალო მნიშვნელობა - რეჟიმი (100 ერთეული), მედიანა (200 ერთეული) და საშუალო არითმეტიკული (400 ერთეული).

რეალურ ცხოვრებაში დაფიქსირებული შემოსავლისა და ხელფასების განაწილებისთვის, იგივე ნიმუშია: რეჟიმი ნაკლებია მედიანაზე, ხოლო მედიანა ნაკლებია საშუალო არითმეტიკაზე.

რატომ გამოიყენება საშუალო მაჩვენებლები ეკონომიკაში? ჩვეულებრივ, იმისათვის, რომ შევცვალოთ რიცხვების ნაკრები ერთი რიცხვით, შევადაროთ სიმრავლე საშუალოების გამოყენებით. მოდით, მაგალითად, Y 1 , Y 2 ,..., Y n იყოს ექსპერტთა შეფასებების ერთობლიობა „მიცემული“ ექსპერტიზის ერთი ობიექტისთვის (მაგალითად, კომპანიის სტრატეგიული განვითარების ერთ-ერთი ვარიანტი), Z 1, Z 2 ,..., Z n - მეორე (ასეთი განვითარების სხვა ვარიანტი). როგორ შეიძლება ამ აგრეგატების შედარება? ცხადია, უმარტივესი გზა საშუალოდ არის.

როგორ გამოვთვალოთ საშუალო მაჩვენებლები? ცნობილია საშუალოების სხვადასხვა ტიპი: საშუალო არითმეტიკული, მედიანა, რეჟიმი, გეომეტრიული საშუალო, ჰარმონიული საშუალო, საშუალო კვადრატი. შეგახსენებთ, რომ საშუალო მნიშვნელობის ზოგადი კონცეფცია შემოიღო XIX საუკუნის პირველი ნახევრის ფრანგმა მათემატიკოსმა. აკადემიკოსი ო.კოში. ეს არის შემდეგი: საშუალო მნიშვნელობა არის ნებისმიერი ფუნქცია Ф(X 1, X 2,..., X n) ისეთი, რომ არგუმენტების ყველა შესაძლო მნიშვნელობისთვის, ამ ფუნქციის მნიშვნელობა არ იყოს მინიმუმზე ნაკლები. რიცხვები X 1, X 2,... , X n , და არა უმეტეს ამ რიცხვების მაქსიმუმისა. ყველა ზემოთ ჩამოთვლილი ტიპის საშუალო არის კოშის საშუალო.

მისაღები მასშტაბის ტრანსფორმაციით, აშკარად იცვლება საშუალო მნიშვნელობა. მაგრამ დასკვნები იმის შესახებ, თუ რომელი პოპულაციისთვის არის საშუალო უფრო დიდი და ვისთვის ნაკლები, არ უნდა შეიცვალოს (დასკვნათა უცვლელობის მოთხოვნის შესაბამისად, რომელიც მიღებულია როგორც ძირითადი მოთხოვნა TI-ში). ჩამოვაყალიბოთ საშუალო სიდიდეების ფორმის პოვნის შესაბამისი მათემატიკური ამოცანა, რომლის შედარების შედეგი სტაბილურია დასაშვები მასშტაბის გარდაქმნების მიმართ.

მოდით F(X 1 X 2 ,..., X n) იყოს კოშის საშუალო. მოდით, პირველი პოპულაციის საშუალო საშუალოზე ნაკლები იყოს მეორე პოპულაციის საშუალოზე: მაშინ, TI-ს მიხედვით, საშუალების შედარების შედეგის სტაბილურობისთვის აუცილებელია, რომ ნებისმიერი დასაშვები ტრანსფორმაციისთვის g მისაღები გარდაქმნების ჯგუფიდან. შესაბამის სკალაში მართალია, რომ პირველი პოპულაციის გარდაქმნილი მნიშვნელობების საშუალო ასევე ნაკლები იყო მეორე ნაკრებისთვის გარდაქმნილი მნიშვნელობების საშუალოზე. გარდა ამისა, ჩამოყალიბებული პირობა ჭეშმარიტი უნდა იყოს ნებისმიერი ორი კრებულისთვის Y 1 , Y 2 ,...,Y n და Z 1, Z 2 ,..., Z n და, გავიხსენოთ, ნებისმიერი დასაშვები ტრანსფორმაცია. ფორმულირებულ პირობას დამაკმაყოფილებელი საშუალო მნიშვნელობები ეწოდება დასაშვები (შესაბამისი მასშტაბით). TI-ის მიხედვით, მხოლოდ ასეთი საშუალო მაჩვენებლების გამოყენებაა შესაძლებელი ექსპერტის დასკვნისა და განსახილველი მასშტაბით გაზომილი სხვა მონაცემების ანალიზისას.

1970-იან წლებში შემუშავებული მათემატიკური თეორიის დახმარებით შესაძლებელია დასაშვები საშუალებების ფორმის აღწერა ძირითად სასწორებში. ცხადია, რომ სახელების მასშტაბით გაზომილი მონაცემებისთვის საშუალოდ მხოლოდ რეჟიმია შესაფერისი.

18. საშუალო მნიშვნელობები რიგითი მასშტაბით

განვიხილოთ საექსპერტო დასკვნის რიგობით გაზომილი დამუშავება. შემდეგი მტკიცება მართალია.

თეორემა1 . ყველა კოშის საშუალო მაჩვენებლებიდან მხოლოდ ვარიაციული სერიის წევრები (შეკვეთის სტატისტიკა) არის მისაღები საშუალო რიგობით სკალაში.

თეორემა 1 მოქმედებს იმ პირობით, რომ საშუალო Ф(Х 1 Х 2 ,..., Х n) არის უწყვეტი (ცვლადების მთლიანობაზე) და სიმეტრიული ფუნქციაა. ეს უკანასკნელი ნიშნავს, რომ არგუმენტების გადაწყობისას Ф(X 1 X 2 ,..., X n) ფუნქციის მნიშვნელობა არ იცვლება. ეს მდგომარეობა საკმაოდ ბუნებრივია, რადგან ჩვენ ვპოულობთ საშუალო მნიშვნელობას მთლიანობისთვის (სიმრავლისთვის) და არა მიმდევრობისთვის. ნაკრები არ იცვლება იმის მიხედვით, თუ რა თანმიმდევრობით ჩამოვთვლით მის ელემენტებს.

თეორემა 1-ის მიხედვით, რიგითი სკალით გაზომილი მონაცემებისთვის შეიძლება გამოყენებულ იქნას, კერძოდ, მედიანა, როგორც საშუალო (კენტი ნიმუშის ზომისთვის). თანაბარი მოცულობით, ვარიაციის სერიის ორი ცენტრალური წევრიდან ერთი უნდა იყოს გამოყენებული - როგორც მათ ზოგჯერ უწოდებენ, მარცხენა მედიანა ან მარჯვენა მედიანა. რეჟიმის გამოყენება ასევე შესაძლებელია - ის ყოველთვის არის ვარიაციების სერიის წევრი. მაგრამ თქვენ ვერასოდეს გამოთვალეთ საშუალო არითმეტიკული, გეომეტრიული საშუალო და ა.შ.

შემდეგი თეორემა მართალია.

თეორემა 2. მოდით, Y 1 , Y 2 ,...,Y m იყოს დამოუკიდებელი იდენტურად განაწილებული შემთხვევითი ცვლადები F(x) განაწილების ფუნქციით და Z 1, Z 2,..., Z n იყოს დამოუკიდებელი იდენტურად განაწილებული შემთხვევითი ცვლადები ფუნქციით. განაწილება H(x), უფრო მეტიც, ნიმუშები Y 1 , Y 2 ,...,Y m და Z 1 , Z 2 ,..., Z n ერთმანეთისგან დამოუკიდებელია და MY X > MZ X . იმისათვის, რომ მოვლენის ალბათობა 1-ისკენ მიდრეკილი იყოს, როგორც min(m, n) ნებისმიერი მკაცრად მზარდი უწყვეტი ფუნქციისთვის g, რომელიც აკმაყოფილებს |g i |>X პირობას, აუცილებელია და საკმარისია, რომ უტოლობა F(x)< Н(х), причем существовало число х 0 , для которого F(x 0)

Შენიშვნა.ზედა ზღვრის პირობა არის წმინდა ინტრამათემატიკური. ფაქტობრივად, ფუნქცია g არის თვითნებური მართებული ტრანსფორმაცია რიგითი მასშტაბით.

მე-2 თეორემის მიხედვით, საშუალო არითმეტიკული ასევე შეიძლება გამოყენებულ იქნას რიგითი მასშტაბით, თუ შევადარებთ ნიმუშებს ორი განაწილებიდან, რომლებიც აკმაყოფილებენ თეორემაში მოცემულ უტოლობას. მარტივად რომ ვთქვათ, განაწილების ერთ-ერთი ფუნქცია ყოველთვის მეორეზე მაღლა უნდა იყოს. განაწილების ფუნქციები ვერ იკვეთება, მათ მხოლოდ ერთმანეთთან შეხების უფლება აქვთ. ეს პირობა დაკმაყოფილებულია, მაგალითად, თუ განაწილების ფუნქციები განსხვავდება მხოლოდ ცვლაში:

F(x) = H(x + ∆)

ზოგიერთი ∆.

ბოლო პირობა დაკმაყოფილებულია, თუ ერთი და იგივე საზომი ხელსაწყოს გამოყენებით გაიზომება გარკვეული რაოდენობის ორი მნიშვნელობა, რომელშიც შეცდომების განაწილება არ იცვლება განსახილველი რაოდენობის ერთი მნიშვნელობიდან მეორეზე გაზომვისას.

კოლმოგოროვი საშუალოდ

ზემოთ ჩამოთვლილი რამდენიმე საშუალოს განზოგადება არის კოლმოგოროვის საშუალო. X 1, X 2,..., X n რიცხვებისთვის კოლმოგოროვის საშუალო გამოითვლება ფორმულით

G((F(X l) + F(X 2)+...F(X n))/n),

სადაც F არის მკაცრად მონოტონური ფუნქცია (ანუ მკაცრად მზარდი ან მკაცრად კლებადი),

G არის F-ის შებრუნებული ფუნქცია.

კოლმოგოროვის საშუალო მაჩვენებლებს შორის ბევრი ცნობილი პერსონაჟია. ასე რომ, თუ F(x) = x, მაშინ კოლმოგოროვის საშუალო არის არითმეტიკული საშუალო, თუ F(x) = lnx, მაშინ გეომეტრიული საშუალო, თუ F(x) = 1/x, მაშინ ჰარმონიული საშუალო, თუ F( x) \u003d x 2, შემდეგ საშუალო კვადრატი და ა.შ. კოლმოგოროვის საშუალო არის კოშის საშუალო განსაკუთრებული შემთხვევა. მეორეს მხრივ, პოპულარული საშუალოები, როგორიცაა მედიანა და რეჟიმი, არ შეიძლება წარმოდგენილი იყოს კოლმოგოროვის საშუალოდ. მონოგრაფიაში დადასტურებულია შემდეგი მტკიცებულებები.

თეორემა3 . თუ გარკვეული ინტრამათემატიკური კანონზომიერების პირობები მართალია ინტერვალის სკალაში, ყველა კოლმოგოროვის საშუალოდან, დასაშვებია მხოლოდ საშუალო არითმეტიკული. ამრიგად, გეომეტრიული საშუალო ან ძირი ტემპერატურის (ცელსიუსში) ან მანძილების საშუალო კვადრატი უაზროა. საშუალო არითმეტიკული უნდა იყოს გამოყენებული. ასევე შეგიძლიათ გამოიყენოთ მედიანა ან რეჟიმი.

თეორემა 4. თუ შეფარდების სკალაში ჭეშმარიტია ზოგიერთი ინტრამათემატიკური კანონზომიერების პირობა, ყველა კოლმოგოროვის საშუალოდან, დასაშვებია მხოლოდ ძალაუფლების კანონის საშუალო მაჩვენებლები F(x) = x c და გეომეტრიული საშუალო.

კომენტარი. გეომეტრიული საშუალო არის სიმძლავრის საშუალებების ზღვარი c > 0-ისთვის.

არის თუ არა კოლმოგოროვის საშუალო მაჩვენებლები, რომლებიც არ უნდა იქნას გამოყენებული თანაფარდობის სკალაში? რა თქმა უნდა აქვს. მაგალითად F(x) = e x.

საშუალო მნიშვნელობების მსგავსად, შესაძლებელია სხვა სტატისტიკური მახასიათებლების შესწავლა - გავრცელების, შეერთების, მანძილის და ა.შ. მაგალითად, ადვილია იმის ჩვენება, რომ კორელაციის კოეფიციენტი არ იცვლება ინტერვალების თასში რაიმე დასაშვები ტრანსფორმაციის დროს, ისევე როგორც განსხვავებების თანაფარდობა, ვარიაცია არ იცვლება განსხვავებების მასშტაბში, ვარიაციის კოეფიციენტი - კოეფიციენტების მასშტაბი და ა.შ.

ზემოაღნიშნული შედეგები საშუალოდ ფართოდ გამოიყენება არა მხოლოდ ეკონომიკაში, მენეჯმენტში, ექსპერტთა შეფასების თეორიაში ან სოციოლოგიაში, არამედ ინჟინერიაშიც, მაგალითად, აფეთქების ღუმელების APCS-ში სენსორების აგრეგაციის მეთოდების გასაანალიზებლად. TI-ს დიდი გამოყენებითი მნიშვნელობა აქვს სტანდარტიზაციისა და ხარისხის მენეჯმენტის პრობლემებში, კერძოდ კვალიმეტრიაში, სადაც მიღებულია საინტერესო თეორიული შედეგები. ასე, მაგალითად, პროდუქტის ხარისხის ცალკეული მაჩვენებლების შეწონვის კოეფიციენტების ნებისმიერი ცვლილება იწვევს პროდუქციის შეკვეთის ცვლილებას საშუალო შეწონილის მიხედვით (ეს თეორემა დაამტკიცა პროფ. ვ.ვ. პოდინოვსკიმ). მაშასადამე, ზემოაღნიშნული მოკლე ინფორმაცია TI და მისი მეთოდების შესახებ გარკვეული გაგებით აერთიანებს ეკონომიკას, სოციოლოგიას და საინჟინრო მეცნიერებებს და წარმოადგენს ადეკვატურ აპარატს ურთულესი პრობლემების გადასაჭრელად, რომლებიც ადრე არ იყო ეფექტური ანალიზისთვის. გზას უხსნის რეალისტური მოდელების აშენებას და პროგნოზირების პრობლემის გადაჭრას.

22. დაწყვილებული ხაზოვანი რეგრესია

მოდით ახლა მივმართოთ წყვილ-ხაზოვანი რეგრესიის უმარტივესი შემთხვევის უფრო დეტალურ შესწავლას. წრფივი რეგრესია აღწერილია უმარტივესი ფუნქციური დამოკიდებულებით სწორი ხაზის განტოლების სახით და ხასიათდება მოდელის პარამეტრების გამჭვირვალე ინტერპრეტაციით (განტოლების კოეფიციენტები). განტოლების მარჯვენა მხარე საშუალებას გაძლევთ მიიღოთ მიღებული (ახსნილი) ცვლადის თეორიული (გამოთვლილი) მნიშვნელობები რეგრესორის (ახსნა ცვლადი) მოცემული მნიშვნელობებიდან. ამ მნიშვნელობებს ზოგჯერ ასევე უწოდებენ პროგნოზირებადს (იგივე გაგებით), ე.ი. თეორიული ფორმულებიდან მიღებული. თუმცა, დამოკიდებულების ბუნების შესახებ ჰიპოთეზის წამოყენებისას, განტოლების კოეფიციენტები კვლავ უცნობი რჩება. ზოგადად, ამ კოეფიციენტების მიახლოებითი მნიშვნელობების მიღება შესაძლებელია სხვადასხვა მეთოდით.

მაგრამ მათგან ყველაზე მნიშვნელოვანი და გავრცელებული არის უმცირესი კვადრატების მეთოდი (LSM). იგი დაფუძნებულია (როგორც უკვე ავხსენი) მოთხოვნაზე, რომ შემცირდეს მიღებული მახასიათებლის რეალური მნიშვნელობების კვადრატული გადახრების ჯამი გამოთვლილი (თეორიული)გან. თეორიული მნიშვნელობების ნაცვლად (მათი მისაღებად), რეგრესიის განტოლების მარჯვენა მხარეები ჩანაცვლებულია კვადრატული გადახრების ჯამით, შემდეგ კი ამ ფუნქციის ნაწილობრივი წარმოებულები (ფაქტობრივი მნიშვნელობების კვადრატული გადახრების ჯამი). ეფექტური თვისება თეორიულიდან). ეს ნაწილობრივი წარმოებულები აღებულია არა x და y ცვლადების მიმართ, არამედ a და b პარამეტრების მიმართ. ნაწილობრივი წარმოებულები უტოლდება ნულს და მარტივი, მაგრამ რთული გარდაქმნების შემდეგ, მიიღება ნორმალური განტოლებათა სისტემა პარამეტრების დასადგენად. კოეფიციენტი x ცვლადით, ე.ი. b ჰქვია რეგრესიის კოეფიციენტი, ის აჩვენებს შედეგის საშუალო ცვლილებას ფაქტორის ერთი ერთეულით ცვლილებით. პარამეტრს a შეიძლება არ ჰქონდეს ეკონომიკური ინტერპრეტაცია, განსაკუთრებით თუ ამ კოეფიციენტის ნიშანი უარყოფითია.

მოხმარების ფუნქციის შესასწავლად გამოიყენება წყვილი ხაზოვანი რეგრესია. მულტიპლიკატორის გამოსათვლელად გამოიყენება მოხმარების ფუნქციაში რეგრესიის კოეფიციენტი. თითქმის ყოველთვის, რეგრესიის განტოლებას ემატება ურთიერთობის სიმკაცრის მაჩვენებელი. წრფივი რეგრესიის უმარტივესი შემთხვევისთვის, ურთიერთობის სიმკვრივის ეს მაჩვენებელი არის წრფივი კორელაციის კოეფიციენტი. მაგრამ ვინაიდან წრფივი კორელაციის კოეფიციენტი ახასიათებს მახასიათებლების ურთიერთობის სიახლოვეს ხაზოვანი ფორმით, ხაზოვანი კორელაციის კოეფიციენტის აბსოლუტური მნიშვნელობის სიახლოვე ჯერ კიდევ არ არის მახასიათებლებს შორის ურთიერთობის არარსებობის ინდიკატორი.

მოდელის სპეციფიკაციის განსხვავებული არჩევანით და, შესაბამისად, დამოკიდებულების ტიპით, რეალური ურთიერთობა შეიძლება საკმაოდ ახლოს იყოს ერთიანობასთან. მაგრამ წრფივი ფუნქციის შერჩევის ხარისხი განისაზღვრება წრფივი კორელაციის კოეფიციენტის კვადრატის - განსაზღვრის კოეფიციენტის გამოყენებით. იგი ახასიათებს y შედეგიანი ატრიბუტის დისპერსიის პროპორციას, რომელიც აიხსნება რეგრესიით შედეგიანი ატრიბუტის მთლიან დისპერსიაში. მნიშვნელობა, რომელიც ავსებს განსაზღვრის კოეფიციენტს 1-ს, ახასიათებს დისპერსიის პროპორციას, რომელიც გამოწვეულია სხვა ფაქტორების გავლენით, რომლებიც არ არის გათვალისწინებული მოდელში (ნარჩენი ვარიაცია).

წყვილის რეგრესია წარმოდგენილია შემდეგი ფორმის y და x ცვლადებს შორის კავშირით:

სადაც y არის დამოკიდებული ცვლადი (შედეგის მახასიათებელი), ხოლო x არის დამოუკიდებელი ცვლადი (ახსნა ცვლადი, ან მახასიათებლის ფაქტორი). არსებობს ხაზოვანი რეგრესია და არაწრფივი რეგრესია. ხაზოვანი რეგრესია აღწერილია ფორმის განტოლებით:

y = a + bx + .

არაწრფივი რეგრესია, თავის მხრივ, შეიძლება იყოს არაწრფივი ანალიზში შემავალი ახსნა-განმარტებითი ცვლადების მიმართ, მაგრამ წრფივი შეფასებული პარამეტრების მიმართ. ან შესაძლოა რეგრესია არაწრფივია სავარაუდო პარამეტრების მიხედვით. როგორც რეგრესიის მაგალითები, რომელიც არაწრფივია განმარტებით ცვლადებში, მაგრამ წრფივი სავარაუდო პარამეტრებში, შეიძლება მიუთითოთ სხვადასხვა ხარისხის პოლინომიური დამოკიდებულებები (პოლინომები) და ტოლგვერდა ჰიპერბოლა.

არაწრფივი რეგრესია სავარაუდო პარამეტრებით არის ძალა-კანონი პარამეტრთან მიმართებაში (პარამეტრი არის ექსპონენტში) დამოკიდებულება, ექსპონენციალური დამოკიდებულება, სადაც პარამეტრი არის ხარისხის საფუძველში და ექსპონენციალური დამოკიდებულება, როდესაც მთელი წრფივი დამოკიდებულებაა. მთლიანად არის ექსპონენტში. გაითვალისწინეთ, რომ ამ სამივე შემთხვევაში შემთხვევითი კომპონენტი (შემთხვევითი ნაშთი)  შედის განტოლების მარჯვენა მხარეს, როგორც ფაქტორი და არა როგორც ტერმინი, ე.ი. გამრავლებით! მიღებული მახასიათებლის გამოთვლილი მნიშვნელობების საშუალო გადახრა რეალურიდან ხასიათდება საშუალო მიახლოების შეცდომით. ის გამოხატულია პროცენტულად და არ უნდა აღემატებოდეს 7-8%-ს. ეს საშუალო მიახლოების შეცდომა უბრალოდ გამოიხატება ფაქტობრივ და გამოთვლილ მნიშვნელობებს შორის განსხვავებების შედარებითი მნიშვნელობების საშუალო პროცენტულად.

დიდი მნიშვნელობა აქვს ელასტიურობის საშუალო კოეფიციენტს, რომელიც ემსახურება მრავალი ეკონომიკური ფენომენისა და პროცესის მნიშვნელოვან მახასიათებელს. იგი გამოითვლება, როგორც ამ ფუნქციური დამოკიდებულების წარმოებულის მნიშვნელობის ნამრავლი x საშუალო მნიშვნელობის თანაფარდობით y საშუალო მნიშვნელობასთან. ელასტიურობის კოეფიციენტი გვიჩვენებს, რამდენი პროცენტით, საშუალოდ, შეიცვლება შედეგი y მისი საშუალო მნიშვნელობიდან, როდესაც x ფაქტორი იცვლება მისი (ფაქტორი x) საშუალო მნიშვნელობიდან 1%-ით.

დაწყვილებული რეგრესიით და მრავალჯერადი რეგრესით (როდესაც ბევრი ფაქტორია) და ნარჩენი დისპერსიით, დისპერსიის ანალიზის ამოცანები მჭიდრო კავშირშია. დისპერსიის ანალიზი იკვლევს დამოკიდებული ცვლადის დისპერსიას. ამ შემთხვევაში, კვადრატული გადახრების ჯამი იყოფა ორ ნაწილად. პირველი წევრი არის კვადრატული გადახრების ჯამი რეგრესიის გამო, ან ახსნილი (ფაქტორული). მეორე წევრი არის კვადრატული გადახრების ნარჩენი ჯამი, რომელიც არ არის ახსნილი ფაქტორული რეგრესიით.

რეგრესიით ახსნილი დისპერსიის წილი მიღებული y მახასიათებლის მთლიან დისპერსიაში ხასიათდება განსაზღვრის კოეფიციენტით (ინდექსით), რომელიც სხვა არაფერია, თუ არა რეგრესიის გამო კვადრატული გადახრების ჯამის თანაფარდობა რეგრესიის საერთო ჯამთან. კვადრატული გადახრები (პირველი წევრი მთელ ჯამს).

როდესაც მოდელის პარამეტრები (უცნობების კოეფიციენტები) განისაზღვრება უმცირესი კვადრატების მეთოდით, მაშინ, არსებითად, გვხვდება რამდენიმე შემთხვევითი ცვლადი (შეფასების მიღების პროცესში). განსაკუთრებული მნიშვნელობა აქვს რეგრესიის კოეფიციენტის შეფასებას, რომელიც წარმოადგენს შემთხვევითი ცვლადის რაიმე განსაკუთრებულ ფორმას. ამ შემთხვევითი ცვლადის თვისებები დამოკიდებულია განტოლებაში (მოდელში) დარჩენილი წევრის თვისებებზე. განვიხილოთ ახსნა-განმარტებითი ცვლადი x, როგორც არა შემთხვევითი ეგზოგენური ცვლადი დაწყვილებული ხაზოვანი რეგრესიის მოდელისთვის. ეს უბრალოდ ნიშნავს, რომ x ცვლადის მნიშვნელობები ყველა დაკვირვებაში შეიძლება ჩაითვალოს წინასწარ განსაზღვრულად და არაფერი აქვს საერთო შესწავლილ დამოკიდებულებასთან. ამრიგად, ახსნილი ცვლადის რეალური მნიშვნელობა შედგება ორი კომპონენტისგან: არა შემთხვევითი კომპონენტისგან და შემთხვევითი კომპონენტისგან (ნარჩენი ვადა).

მეორეს მხრივ, უმცირეს კვადრატების მეთოდით (OLS) განსაზღვრული რეგრესიის კოეფიციენტი უდრის x და y ცვლადების კოვარიანტობის x ცვლადის დისპერსიაზე გაყოფის კოეფიციენტს. ამიტომ, ის ასევე შეიცავს შემთხვევით კომპონენტს. ყოველივე ამის შემდეგ, კოვარიანტობა დამოკიდებულია y ცვლადის მნიშვნელობებზე, სადაც y ცვლადის მნიშვნელობები დამოკიდებულია შემთხვევითი ნარჩენი ტერმინის  მნიშვნელობებზე. გარდა ამისა, ადვილია იმის ჩვენება, რომ x და y ცვლადების კოვარიანტობა უდრის შეფასებული რეგრესიის კოეფიციენტის ბეტას () და x ცვლადის დისპერსიას, რომელიც ემატება x და  ცვლადების კოვარიანსს. ამრიგად, ბეტა რეგრესიის კოეფიციენტის შეფასება უდრის თავად ამ უცნობ რეგრესიის კოეფიციენტს, რომელსაც ემატება x და  ცვლადების კოვარიანტობის x ცვლადის დისპერსიაზე გაყოფის კოეფიციენტი. იმათ. ნებისმიერი ნიმუშიდან მიღებული რეგრესიის კოეფიციენტის b შეფასება წარმოდგენილია ორი წევრის ჯამის სახით: მუდმივი მნიშვნელობა ტოლია  (ბეტა) კოეფიციენტის ნამდვილ მნიშვნელობაზე და შემთხვევითი კომპონენტიდან, რომელიც დამოკიდებულია x ცვლადების კოვარიანტზე. და .

23. გაუს-მარკოვის მათემატიკური პირობები და მათი გამოყენება.

იმისათვის, რომ ჩვეულებრივ უმცირეს კვადრატებზე დაფუძნებული რეგრესიის ანალიზმა საუკეთესო შედეგი მისცეს, შემთხვევითი წევრი უნდა აკმაყოფილებდეს გაუს-მარკოვის ოთხ პირობას.

შემთხვევითი ტერმინის მათემატიკური მოლოდინი არის ნული, ე.ი. ეს არის მიუკერძოებელი. თუ რეგრესიის განტოლება მოიცავს მუდმივ წევრს, მაშინ ბუნებრივია, რომ ასეთი მოთხოვნა შესრულებულად ჩაითვალოს, რადგან ეს არის მუდმივი ვადა და მხედველობაში უნდა იქნას მიღებული ნებისმიერი სისტემატური ტენდენცია y ცვლადის მნიშვნელობებში, რაც, პირიქით, არ უნდა შეიცავდეს რეგრესიის განტოლების განმარტებით ცვლადებს.

შემთხვევითი ტერმინის სხვაობა მუდმივია ყველა დაკვირვებისთვის.

ნიმუშის შემქმნელი შემთხვევითი ცვლადების მნიშვნელობების კოვარიანსი უნდა იყოს ნულის ტოლი, ე.ი. არ არსებობს სისტემური კავშირი შემთხვევითი ტერმინის მნიშვნელობებს შორის რომელიმე ორ კონკრეტულ დაკვირვებაში. შემთხვევითი წევრები ერთმანეთისგან დამოუკიდებელი უნდა იყვნენ.

შემთხვევითი ტერმინის განაწილების კანონი დამოუკიდებელი უნდა იყოს განმარტებითი ცვლადებისგან.

უფრო მეტიც, ბევრ აპლიკაციაში ახსნა-განმარტებითი ცვლადები არ არის სტოქასტური; არ აქვს შემთხვევითი კომპონენტი. ნებისმიერი დამოუკიდებელი ცვლადის მნიშვნელობა თითოეულ დაკვირვებაში უნდა ჩაითვალოს ეგზოგენურად, მთლიანად განსაზღვრული გარე მიზეზებით, რომლებიც არ არის გათვალისწინებული რეგრესიის განტოლებაში.

მითითებულ გაუს-მარკოვის პირობებთან ერთად, ასევე ვარაუდობენ, რომ შემთხვევით ტერმინს აქვს ნორმალური განაწილება. ის მოქმედებს ძალიან ფართო პირობებში და ეფუძნება ე.წ. ცენტრალური ლიმიტის თეორემას (CLT). ამ თეორემის არსი იმაში მდგომარეობს, რომ თუ შემთხვევითი ცვლადი არის სხვა შემთხვევითი ცვლადის დიდი რაოდენობის ურთიერთქმედების ზოგადი შედეგი, რომელთაგან არც ერთს არ აქვს უპირატესი გავლენა ამ ზოგადი შედეგის ქცევაზე, მაშინ ასეთი შემთხვევითი ცვლადი იქნება. აღწერილია დაახლოებით ნორმალური განაწილებით. ნორმალურ განაწილებასთან ეს სიახლოვე საშუალებას გვაძლევს გამოვიყენოთ ნორმალური განაწილება და, გარკვეული გაგებით, მისი განზოგადება, სტუდენტური განაწილება, რომელიც შესამჩნევად განსხვავდება ნორმალური განაწილებისგან ძირითადად ე.წ. „კუდებზე“, ე.ი. ნიმუშის ზომის მცირე მნიშვნელობებისთვის. ასევე მნიშვნელოვანია, რომ თუ შემთხვევითი ტერმინი ნორმალურად ნაწილდება, მაშინ რეგრესიის კოეფიციენტებიც გადანაწილდება ნორმალური კანონის მიხედვით.

დადგენილი რეგრესიის მრუდი (რეგრესიის განტოლება) იძლევა ე.წ. წერტილოვანი პროგნოზის პრობლემის გადაჭრის საშუალებას. ასეთ გამოთვლებში x-ის გარკვეული მნიშვნელობა აღებულია შესწავლილი დაკვირვების ინტერვალის გარეთ და ჩანაცვლებულია რეგრესიის განტოლების მარჯვენა მხარეს (ექსტრაპოლაციის პროცედურა). იმიტომ რომ რეგრესიის კოეფიციენტების შეფასებები უკვე ცნობილია, შემდეგ შესაძლებელია გამოითვალოს ახსნილი y ცვლადის მნიშვნელობა, რომელიც შეესაბამება x-ის აღებულ მნიშვნელობას. ბუნებრივია, პროგნოზის (პროგნოზის) მნიშვნელობის შესაბამისად, გამოთვლები ხორციელდება წინ (მომავლის მნიშვნელობების არეალში).

თუმცა, ვინაიდან კოეფიციენტები განისაზღვრა გარკვეული შეცდომით, საინტერესოა არა ქულათა შეფასება (პუნქტიანი პროგნოზი) ეფექტური მახასიათებლისთვის, არამედ იმ საზღვრების ცოდნა, რომლის ფარგლებშიც პროდუქტიული მახასიათებლის მნიშვნელობები შესაბამისია. x ფაქტორის აღებული მნიშვნელობა იქნება გარკვეული ალბათობით.

ამისათვის გამოითვლება სტანდარტული შეცდომის მნიშვნელობა (სტანდარტული გადახრა). მისი მიღება შესაძლებელია შემდეგნაირად ნათქვამის სულისკვეთებით. თავისუფალი ტერმინის გამოხატვა a შეფასებებიდან საშუალო მნიშვნელობებით ჩანაცვლებულია წრფივი რეგრესიის განტოლებაში. შემდეგ გამოდის, რომ სტანდარტული შეცდომა დამოკიდებულია მიღებული y ფაქტორის საშუალო ცდომილებაზე და დამატებით b რეგრესიის კოეფიციენტის შეცდომაზე. უბრალოდ, ამ სტანდარტული შეცდომის კვადრატი უდრის y-ის საშუალო ცდომილების კვადრატის ჯამს და რეგრესიის კოეფიციენტის კვადრატული ცდომილების ნამრავლს x ფაქტორის გადახრის კვადრატსა და მის საშუალოზე. გარდა ამისა, პირველი წევრი, სტატისტიკის კანონების მიხედვით, უდრის საერთო პოპულაციის დისპერსიის გაყოფის კოეფიციენტს ნიმუშის ზომაზე (მოცულობაზე).

უცნობი დისპერსიის ნაცვლად, შეფასების სახით გამოიყენება ნიმუშის დისპერსია. შესაბამისად, რეგრესიის კოეფიციენტის ცდომილება განისაზღვრება, როგორც ნიმუშის დისპერსიის x ფაქტორის დისპერსიაზე გაყოფის კოეფიციენტი. თქვენ შეგიძლიათ მიიღოთ სტანდარტული შეცდომის მნიშვნელობა (სტანდარტული გადახრა) და სხვა მოსაზრებები, უფრო დამოუკიდებელი ხაზოვანი რეგრესიის მოდელისგან. ამისთვის გამოიყენება საშუალო ცდომილების და ზღვრული ცდომილების ცნება და მათ შორის ურთიერთობა.

მაგრამ სტანდარტული შეცდომის მიღების შემდეგაც კი, რჩება კითხვა იმ საზღვრების შესახებ, რომლებშიც იქნება პროგნოზირებული მნიშვნელობა. სხვა სიტყვებით რომ ვთქვათ, გაზომვის შეცდომის ინტერვალის შესახებ, ბუნებრივ დაშვებაში ხშირ შემთხვევაში, რომ ამ ინტერვალის შუა რიცხვები მოცემულია y ეფექტური ფაქტორის გამოთვლილი (საშუალო) მნიშვნელობით. აქ შველის ცენტრალური ლიმიტის თეორემა, რომელიც უბრალოდ მიუთითებს რა ალბათობით არის უცნობი მნიშვნელობა ამ სანდო ინტერვალში.

არსებითად, სტანდარტული შეცდომის ფორმულა, მიუხედავად იმისა, თუ როგორ და რა ფორმით არის მიღებული, ახასიათებს შეცდომას რეგრესიის ხაზის პოზიციაში. სტანდარტული შეცდომის მნიშვნელობა აღწევს მინიმუმს, როდესაც x ფაქტორის მნიშვნელობა ემთხვევა ფაქტორის საშუალო მნიშვნელობას.

24. ჰიპოთეზების სტატისტიკური ტესტირება და ხაზოვანი რეგრესიის მნიშვნელოვნების შეფასება ფიშერის კრიტერიუმით.

ხაზოვანი რეგრესიის განტოლების აღმოჩენის შემდეგ, ფასდება როგორც განტოლების მთლიანობაში, ასევე მისი ცალკეული პარამეტრების მნიშვნელობა. მთლიანობაში რეგრესიის განტოლების მნიშვნელოვნების შეფასება შეიძლება განხორციელდეს სხვადასხვა კრიტერიუმების გამოყენებით. ფიშერის F- კრიტერიუმის გამოყენება საკმაოდ გავრცელებული და ეფექტურია. ამ შემთხვევაში წარმოდგება ნულოვანი ჰიპოთეზა H o, რომ რეგრესიის კოეფიციენტი ნულის ტოლია, ე.ი. b=0 და, შესაბამისად, x ფაქტორი არ ახდენს გავლენას შედეგზე y. F- კრიტერიუმის პირდაპირ გამოთვლას წინ უძღვის დისპერსიის ანალიზი. მასში ცენტრალური ადგილი უჭირავს y ცვლადის კვადრატული გადახრების ჯამის დაშლას y-ის საშუალო მნიშვნელობიდან ორ ნაწილად - "ახსნილი" და "აუხსნელი":

ეფექტური მახასიათებლის y ინდივიდუალური მნიშვნელობების კვადრატული გადახრების ჯამი საშუალო მნიშვნელობიდან y გამოწვეულია მრავალი ფაქტორის გავლენით.

ჩვენ პირობითად ვყოფთ მიზეზების მთელ კომპლექტს ორ ჯგუფად: შესწავლილი ფაქტორი x და სხვა ფაქტორები. თუ ფაქტორი არ მოქმედებს შედეგზე, მაშინ გრაფიკზე რეგრესიის ხაზი პარალელურია x-ღერძისა და y=y. შემდეგ მიღებული ატრიბუტის მთელი დისპერსია განპირობებულია სხვა ფაქტორების გავლენით და კვადრატული გადახრების ჯამი დაემთხვევა ნარჩენს. თუ სხვა ფაქტორები არ მოქმედებს შედეგზე, მაშინ y ფუნქციურად დაკავშირებულია x-თან და კვადრატების ნარჩენი ჯამი არის ნული. ამ შემთხვევაში რეგრესიით ახსნილი კვადრატული გადახრების ჯამი იგივეა, რაც კვადრატების ჯამი. ვინაიდან კორელაციური ველის ყველა წერტილი არ დევს რეგრესიის ხაზზე, მათი გაფანტვა ყოველთვის ხდება x ფაქტორის გავლენის გამო, ე.ი. y-ის რეგრესია x-ზე და გამოწვეული სხვა მიზეზების მოქმედებით (აუხსნელი ვარიაცია). რეგრესიის ხაზის ვარგისიანობა პროგნოზირებისთვის დამოკიდებულია იმაზე, თუ რამდენად არის გათვალისწინებული y თვისების მთლიანი ვარიაცია ახსნილი ვარიაციით.

ცხადია, თუ რეგრესიის გამო კვადრატული გადახრების ჯამი მეტია კვადრატების ნარჩენ ჯამს, მაშინ რეგრესიის განტოლება სტატისტიკურად მნიშვნელოვანია და x ფაქტორი მნიშვნელოვან გავლენას ახდენს შედეგზე. ეს იმის ტოლფასია, რომ განმსაზღვრელი კოეფიციენტი ერთიანობას მიუახლოვდება. კვადრატული გადახრების ნებისმიერი ჯამი დაკავშირებულია თავისუფლების გრადუსების რაოდენობასთან, ე.ი. მახასიათებლის დამოუკიდებელი ვარიაციის თავისუფლების რაოდენობა. თავისუფლების ხარისხების რაოდენობა დაკავშირებულია მოსახლეობის ერთეულების რაოდენობასთან ან მისგან განსაზღვრულ მუდმივებთან. შესწავლილ პრობლემასთან დაკავშირებით, თავისუფლების ხარისხების რაოდენობამ უნდა აჩვენოს, რამდენი დამოუკიდებელი გადახრებია საჭირო n-დან [(y 1 - y), (y 2 - y), ... (y n - y)] კვადრატების მოცემული ჯამის ჩამოყალიბება. ასე რომ, კვადრატების ჯამური ჯამისთვის ∑(y-y cf) საჭიროა 2, (n-1) დამოუკიდებელი გადახრები, ვინაიდან n ერთეულის პოპულაციაში, საშუალო დონის გამოთვლის შემდეგ, მხოლოდ (n-1) თავისუფლად იცვლება გადახრების რაოდენობა. ∑(y-y cf) 2 კვადრატების ახსნილი ან ფაქტორული ჯამის გამოთვლისას გამოიყენება რეგრესიის ხაზის გასწვრივ ნაპოვნი ეფექტური მახასიათებლის y* თეორიული (გამოთვლილი) მნიშვნელობები: y(x)=a+bx.

ახლა დავუბრუნდეთ ეფექტური ფაქტორის კვადრატული გადახრების ჯამის გაფართოებას ამ მნიშვნელობის საშუალოდან. ეს ჯამი შეიცავს ზემოთ უკვე განსაზღვრულ ორ ნაწილს: კვადრატული გადახრების ჯამს, რომელიც აიხსნება რეგრესიით, და სხვა ჯამს, რომელსაც კვადრატული გადახრების ნარჩენი ჯამი ეწოდება. ეს დაშლა დაკავშირებულია დისპერსიის ანალიზთან, რომელიც პირდაპირ პასუხობს ფუნდამენტურ კითხვას: როგორ შევაფასოთ რეგრესიის განტოლების მნიშვნელობა მთლიანობაში და მისი ცალკეული პარამეტრები? ის ასევე დიდწილად განსაზღვრავს ამ კითხვის მნიშვნელობას. რეგრესიის განტოლების მთლიანობაში მნიშვნელოვნების შესაფასებლად გამოიყენება ფიშერის ტესტი (F-ტესტი). ფიშერის მიერ შემოთავაზებული მიდგომის მიხედვით წამოიჭრება ნულოვანი ჰიპოთეზა: რეგრესიის კოეფიციენტი ნულის ტოლია, ე.ი. მნიშვნელობა b=0. ეს ნიშნავს, რომ X ფაქტორი არ მოქმედებს შედეგზე Y.

შეგახსენებთ, რომ თითქმის ყოველთვის სტატისტიკური კვლევის შედეგად მიღებული ქულები ზუსტად არ დევს რეგრესიის ხაზზე. ისინი მიმოფანტული არიან, შორდებიან რეგრესიის ხაზს მეტ-ნაკლებად შორს. ეს გაფანტვა განპირობებულია სხვა ფაქტორების გავლენით, გარდა ახსნითი ფაქტორი X, რომლებიც არ არის გათვალისწინებული რეგრესიის განტოლებაში. კვადრატული გადახრების ახსნილი ან ფაქტორული ჯამის გაანგარიშებისას გამოიყენება რეგრესიის ხაზის გასწვრივ ნაპოვნი მიღებული ატრიბუტის თეორიული მნიშვნელობები.

Y და X ცვლადების მნიშვნელობების მოცემული ნაკრებისთვის, Y-ის საშუალო მნიშვნელობის გამოთვლილი მნიშვნელობა წრფივ რეგრესიაში არის მხოლოდ ერთი პარამეტრის ფუნქცია - რეგრესიის კოეფიციენტი. ამის შესაბამისად, კვადრატული გადახრების ფაქტორულ ჯამს აქვს თავისუფლების გრადუსების რაოდენობა 1-ის ტოლი. ხოლო კვადრატული გადახრების ნარჩენი ჯამის თავისუფლების გრადუსების რაოდენობა წრფივი რეგრესიაში არის n-2.

მაშასადამე, თავდაპირველ დაშლაში კვადრატული გადახრების ყოველი ჯამის გაყოფით თავისუფლების გრადუსების რაოდენობაზე, მივიღებთ საშუალო კვადრატულ გადახრებს (დისპერსია თავისუფლების ერთ გრადუსზე). გარდა ამისა, ფაქტორული დისპერსიის გაყოფით თავისუფლების ერთ ხარისხზე ნარჩენ დისპერსიაზე თავისუფლების ერთ ხარისხზე, მივიღებთ კრიტერიუმს ნულოვანი ჰიპოთეზის შესამოწმებლად, ე.წ. კერძოდ, თუ ნულოვანი ჰიპოთეზა მართალია, ფაქტორული და ნარჩენი დისპერსიები უბრალოდ ერთმანეთის ტოლია.

ნულოვანი ჰიპოთეზის უარყოფა, ე.ი. საპირისპირო ჰიპოთეზის მიღებით, რომელიც გამოხატავს შესწავლილი დამოკიდებულების მნიშვნელობის (ყოფნის) ფაქტს და არა მხოლოდ ფაქტორების არარსებული დამოკიდებულების სიმულაციის ფაქტორების შემთხვევით დამთხვევას, აუცილებელია კრიტიკული მნიშვნელობების ცხრილების გამოყენება. მითითებული თანაფარდობა. ცხრილები განსაზღვრავენ ფიშერის კრიტერიუმის კრიტიკულ (ზღვრულ) მნიშვნელობას. მას ასევე უწოდებენ თეორიულს. შემდეგ დაკვირვების მონაცემებით გამოთვლილი კრიტერიუმის შესაბამის ემპირიულ (ფაქტობრივ) მნიშვნელობასთან შედარებით მოწმდება, აჭარბებს თუ არა თანაფარდობის რეალური მნიშვნელობა ცხრილებიდან კრიტიკულ მნიშვნელობას.

უფრო დეტალურად, ეს კეთდება შემდეგნაირად. არჩეულია ნულოვანი ჰიპოთეზის არსებობის ალბათობის მოცემული დონე და ცხრილებიდან გვხვდება F-კრიტერიუმის კრიტიკული მნიშვნელობა, რომელზედაც შეიძლება კვლავ მოხდეს დისპერსიების შემთხვევითი განსხვავება თავისუფლების 1 ხარისხით, ე.ი. მაქსიმალური ასეთი მნიშვნელობა. მაშინ F- თანაფარდობის გამოთვლილი მნიშვნელობა აღიარებულია საიმედოდ (ანუ გამოხატავს განსხვავებას რეალურ და ნარჩენ დისპერსიებს შორის), თუ ეს თანაფარდობა აღემატება ცხრილს. შემდეგ უარყოფილია ნულოვანი ჰიპოთეზა (არაა მართალი, რომ კავშირის ნიშნები არ არის) და, პირიქით, მივდივართ დასკვნამდე, რომ კავშირი არსებობს და არის მნიშვნელოვანი (ეს არის არა შემთხვევითი, მნიშვნელოვანი).

თუ თანაფარდობის მნიშვნელობა ნაკლებია ცხრილის მნიშვნელობაზე, მაშინ ნულოვანი ჰიპოთეზის ალბათობა აღემატება მითითებულ დონეს (რომელიც თავდაპირველად იყო არჩეული) და ნულოვანი ჰიპოთეზის უარყოფა შეუძლებელია არასწორი დასკვნის შესახებ შესამჩნევი საფრთხის გარეშე. კავშირის არსებობა. შესაბამისად, რეგრესიის განტოლება უმნიშვნელოდ ითვლება.

F- კრიტერიუმის სიდიდე ასოცირდება განსაზღვრის კოეფიციენტთან. რეგრესიის განტოლების მთლიანობაში მნიშვნელოვნების შეფასების გარდა, ფასდება აგრეთვე რეგრესიის განტოლების ცალკეული პარამეტრების მნიშვნელობა. ამავდროულად, რეგრესიის კოეფიციენტის სტანდარტული ცდომილება განისაზღვრება ემპირიული ფაქტობრივი სტანდარტული გადახრის და ემპირიული დისპერსიის გამოყენებით თავისუფლების ერთი ხარისხით. ამის შემდეგ, სტუდენტის განაწილება გამოიყენება რეგრესიის კოეფიციენტის მნიშვნელოვნების შესამოწმებლად მისი ნდობის ინტერვალების გამოსათვლელად.

რეგრესიის და კორელაციის კოეფიციენტების მნიშვნელოვნების შეფასება სტუდენტის t-ტესტის გამოყენებით ხორციელდება ამ მნიშვნელობების მნიშვნელობებისა და სტანდარტული შეცდომის შედარებით. ხაზოვანი რეგრესიის პარამეტრების შეცდომის მნიშვნელობა და კორელაციის კოეფიციენტი განისაზღვრება შემდეგი ფორმულებით:

სადაც S არის ფესვის საშუალო კვადრატული ნარჩენი ნიმუშის გადახრა,

r xy არის კორელაციის კოეფიციენტი.

შესაბამისად, რეგრესიის ხაზით პროგნოზირებული სტანდარტული შეცდომის მნიშვნელობა მოცემულია ფორმულით:

რეგრესიის და კორელაციის კოეფიციენტების მნიშვნელობების შესაბამისი შეფარდება მათ სტანდარტულ ცდომილებასთან აყალიბებს ეგრეთ წოდებულ t- სტატისტიკას და მისი შესაბამისი ცხრილის (კრიტიკული) მნიშვნელობისა და მისი რეალური მნიშვნელობის შედარება იძლევა შესაძლებელია ნულოვანი ჰიპოთეზის მიღება ან უარყოფა. მაგრამ შემდგომში, ნდობის ინტერვალის გამოსათვლელად, თითოეული ინდიკატორის ზღვრული ცდომილება გვხვდება, როგორც t სტატისტიკის ცხრილური მნიშვნელობის ნამრავლი და შესაბამისი ინდიკატორის საშუალო შემთხვევითი ცდომილება. სინამდვილეში, ოდნავ განსხვავებულად, ჩვენ რეალურად დავწერეთ ეს ზემოთ. შემდეგ მიიღება ნდობის ინტერვალების საზღვრები: ქვედა ზღვარი აკლდება შესაბამისი ზღვრული შეცდომის შესაბამის კოეფიციენტებს (ფაქტობრივად საშუალოს) და ემატება (დამატებულია) ზედა ზღვარი.

წრფივ რეგრესიაში ∑(y x -y საშუალო) 2 =b 2 ∑(x-x საშუალო) 2 . ამის გადამოწმება ადვილია წრფივი კორელაციის კოეფიციენტის ფორმულის მითითებით: r 2 xy \u003d b 2 * σ 2 x / σ 2 y

სადაც σ 2 y არის y ატრიბუტის მთლიანი განსხვავება;

σ 2 x - y ატრიბუტის განსხვავება x ფაქტორის გამო. შესაბამისად, წრფივი რეგრესიის გამო კვადრატული გადახრების ჯამი იქნება:

∑(y x -y cf) 2 =b 2 ∑(x-x cf) 2 .

ვინაიდან, x და y-ში დაკვირვების მოცემული რაოდენობისთვის, წრფივი რეგრესიის კვადრატების ფაქტორული ჯამი დამოკიდებულია რეგრესიის კოეფიციენტის მხოლოდ ერთ მუდმივზე, მაშინ კვადრატების ამ ჯამს აქვს თავისუფლების ერთი ხარისხი. განვიხილოთ y ატრიბუტის გამოთვლილი მნიშვნელობის შინაარსის მხარე, ე.ი. x-ზე. y x-ის მნიშვნელობა განისაზღვრება წრფივი რეგრესიის განტოლებით: y x ​​\u003d a + bx.

პარამეტრი a შეიძლება განისაზღვროს როგორც a=y-bx. პარამეტრის a გამოსახულების ჩანაცვლებით ხაზოვან მოდელში, მივიღებთ: y x ​​=y-bx+bx cp =y-b(x-x cf).

y და x ცვლადების მოცემული სიმრავლით, გამოთვლილი მნიშვნელობა y x წრფივ რეგრესიაში არის მხოლოდ ერთი პარამეტრის - რეგრესიის კოეფიციენტის ფუნქცია. შესაბამისად, კვადრატული გადახრების ფაქტორულ ჯამს აქვს თავისუფლების ხარისხი 1-ის ტოლი.

არსებობს თანასწორობა კვადრატების ჯამური, ფაქტორული და ნარჩენი ჯამების თავისუფლების ხარისხების რაოდენობას შორის. წრფივი რეგრესიაში კვადრატების ნარჩენი ჯამის თავისუფლების გრადუსების რაოდენობაა (n-2). კვადრატების საერთო ჯამისთვის თავისუფლების გრადუსების რაოდენობა განისაზღვრება ერთეულების რაოდენობით და რადგან ვიყენებთ ნიმუშის მონაცემებით გამოთვლილ საშუალოს, ვკარგავთ თავისუფლების ერთ ხარისხს, ე.ი. (n-1). ასე რომ, ჩვენ გვაქვს ორი ტოლობა: ჯამებისთვის და თავისუფლების ხარისხების რაოდენობაზე. და ეს, თავის მხრივ, გვაბრუნებს შესადარებელ დისპერსიებთან თავისუფლების ერთი ხარისხით, რომლის თანაფარდობა იძლევა ფიშერის კრიტერიუმს.

25. რეგრესიის განტოლების ცალკეული პარამეტრების და კოეფიციენტების მნიშვნელოვნების შეფასება სტუდენტის კრიტერიუმით.

27. წრფივი და არაწრფივი რეგრესია და მათი შესწავლის მეთოდები.

წრფივი რეგრესია და მისი შესწავლისა და შეფასების მეთოდები არც ისე მნიშვნელოვანი იქნებოდა, თუ ამ ძალიან მნიშვნელოვანი, მაგრამ მაინც უმარტივესი შემთხვევის გარდა, არ გამოვიყენებდით მათ უფრო რთული არაწრფივი დამოკიდებულებების ანალიზის ხელსაწყოს მოსაპოვებლად. არაწრფივი რეგრესია შეიძლება დაიყოს ორ არსებითად განსხვავებულ კლასად. პირველი და მარტივი არის არაწრფივი დამოკიდებულებების კლასი, რომელშიც არის არაწრფივი ახსნა-განმარტებითი ცვლადების მიმართ, მაგრამ ისინი რჩება წრფივი მათში შემავალი და შესაფასებელი პარამეტრების მიხედვით. ეს მოიცავს სხვადასხვა ხარისხის მრავალწევრებს და ტოლგვერდა ჰიპერბოლას.

ახსნაში შემავალი ცვლადების ასეთი არაწრფივი რეგრესია ცვლადების მარტივი ტრანსფორმაციით (ჩანაცვლებით) ადვილად შეიძლება შემცირდეს ახალი ცვლადების ჩვეულებრივ წრფივ რეგრესიამდე. ამიტომ, ამ შემთხვევაში პარამეტრების შეფასება ხორციელდება უბრალოდ უმცირესი კვადრატებით, ვინაიდან დამოკიდებულებები პარამეტრებში წრფივია. ამრიგად, ეკონომიკაში მნიშვნელოვან როლს ასრულებს არაწრფივი დამოკიდებულება, რომელიც აღწერილია ტოლგვერდა ჰიპერბოლით:

მისი პარამეტრები კარგად არის შეფასებული MNC-ის მიერ და ეს დამოკიდებულება თავისთავად ახასიათებს ნედლეულის, საწვავის, მასალების ერთეული ხარჯების ურთიერთობას გამომუშავების მოცულობასთან, საქონლის მიმოქცევის დროს და ყველა ამ ფაქტორთან ბრუნვის ღირებულებასთან. . მაგალითად, ფილიპსის მრუდი ახასიათებს არაწრფივ ურთიერთობას უმუშევრობის დონესა და ხელფასის ზრდის პროცენტს შორის.

სრულიად განსხვავებული სიტუაციაა რეგრესიასთან, რომელიც არაწრფივია სავარაუდო პარამეტრების მიხედვით, მაგალითად, წარმოდგენილია სიმძლავრის ფუნქციით, რომელშიც თავად ხარისხი (მისი მაჩვენებელი) არის პარამეტრი, ან დამოკიდებულია პარამეტრზე. ეს ასევე შეიძლება იყოს ექსპონენციალური ფუნქცია, სადაც ხარისხის საფუძველი არის პარამეტრი, და ექსპონენციალური ფუნქცია, რომელშიც, ისევ, ექსპონენტი შეიცავს პარამეტრს ან პარამეტრთა კომბინაციას. ეს კლასი, თავის მხრივ, იყოფა ორ ქვეკლასად: ერთი მოიცავს გარეგნულად არაწრფივ, მაგრამ არსებითად შინაგანად წრფივ. ამ შემთხვევაში, შეგიძლიათ მოდელი მიიყვანოთ წრფივ ფორმაში ტრანსფორმაციების გამოყენებით. თუმცა, თუ მოდელი არსებითად არაწრფივია, მაშინ ის ვერ დაიყვანება წრფივ ფუნქციამდე.

ამრიგად, მხოლოდ მოდელები, რომლებიც არსებითად არაწრფივია, განიხილება ჭეშმარიტად არაწრფივი რეგრესიის ანალიზში. ყველა დანარჩენი, გარდაქმნების გზით ხაზოვანამდე დაყვანილი, არ განიხილება ასე და სწორედ ისინი განიხილება ყველაზე ხშირად ეკონომიკურ კვლევებში. ამავე დროს, ეს არ ნიშნავს იმას, რომ არსებითად არაწრფივი დამოკიდებულებების შესწავლა შეუძლებელია ეკონომეტრიაში. თუ მოდელი პარამეტრებში შიდა არაწრფივია, მაშინ პარამეტრების შესაფასებლად გამოიყენება განმეორებითი პროცედურები, რომელთა წარმატება დამოკიდებულია გამოყენებული იტერატიული მეთოდის სინგულარობის განტოლების ფორმაზე.

დავუბრუნდეთ წრფივზე დაყვანილ დამოკიდებულებებს. თუ ისინი არაწრფივია როგორც პარამეტრების, ასევე ცვლადების თვალსაზრისით, მაგალითად, y \u003d a გამრავლებული X-ის სიმძლავრეზე, რომლის მაჩვენებელია პარამეტრი -  (ბეტა):

ცხადია, ასეთი თანაფარდობა მარტივი ლოგარითმით ადვილად გარდაიქმნება წრფივ განტოლებად.

ლოგარითმების აღმნიშვნელი ახალი ცვლადების შემოტანის შემდეგ მიიღება წრფივი განტოლება. შემდეგ რეგრესიის შეფასების პროცედურა შედგება ყოველი დაკვირვებისთვის ახალი ცვლადების გამოთვლაში საწყისი მნიშვნელობების ლოგარითმების აღებით. შემდეგ შეფასებულია ახალი ცვლადების რეგრესიული დამოკიდებულება. თავდაპირველ ცვლადებზე გადასასვლელად, თქვენ უნდა აიღოთ ანტილოგარითმი, ანუ, ფაქტობრივად, დაბრუნდეთ თვით ძალებზე მათი მაჩვენებლების ნაცვლად (ბოლოს და ბოლოს, ლოგარითმი არის ექსპონენტი). ანალოგიურად შეიძლება განვიხილოთ ექსპონენციალური ან ექსპონენციალური ფუნქციების შემთხვევა.

არსებითად არაწრფივი რეგრესიისთვის, რეგრესიის შეფასების ჩვეულებრივი პროცედურის გამოყენება შეუძლებელია, რადგან შესაბამისი დამოკიდებულების გარდაქმნა შეუძლებელია წრფივზე. მოქმედებების ზოგადი სქემა ამ შემთხვევაში შემდეგია:

1. მიღებულია ზოგიერთი სავარაუდო საწყისი პარამეტრის მნიშვნელობა;

2. გამოთვალეთ Y მნიშვნელობები ფაქტობრივი X მნიშვნელობებიდან ამ პარამეტრის მნიშვნელობების გამოყენებით;

3. გამოთვალეთ ნარჩენები ყველა დაკვირვებისთვის ნიმუშში და შემდეგ ნარჩენების კვადრატების ჯამი;

4. მცირე ცვლილებები შეტანილია ერთი ან რამდენიმე პარამეტრის შეფასებაში;

5. გამოითვლება ახალი პროგნოზირებული Y მნიშვნელობები, ნარჩენები და კვადრატული ნარჩენების ჯამი;

6. თუ ნარჩენების კვადრატების ჯამი წინაზე ნაკლებია, მაშინ ახალი პარამეტრის შეფასებები უკეთესია, ვიდრე ძველი და გამოყენებული უნდა იქნეს როგორც ახალი საწყისი წერტილი;

7. მე-4, მე-5 და მე-6 საფეხურები კვლავ მეორდება მანამ, სანამ შეუძლებელი იქნება პარამეტრების შეფასებებში ისეთი ცვლილებების შეტანა, რაც გამოიწვევს კვადრატების ნარჩენების ჯამის ცვლილებას;

8. დასკვნა ხდება, რომ ნარჩენების კვადრატების ჯამის მნიშვნელობა მინიმუმამდეა დაყვანილი და პარამეტრების საბოლოო შეფასებები შეფასებულია უმცირესი კვადრატების მეთოდით.

არაწრფივ ფუნქციებს შორის, რომლებიც შეიძლება შემცირდეს წრფივ ფორმამდე, ექსპონენციალური ფუნქცია ფართოდ გამოიყენება ეკონომეტრიაში. მასში b პარამეტრს აქვს მკაფიო ინტერპრეტაცია, არის ელასტიურობის კოეფიციენტი. მოდელებში, რომლებიც არაწრფივია შეფასებული პარამეტრების თვალსაზრისით, მაგრამ შემცირებულია წრფივ ფორმამდე, LSM გამოიყენება ტრანსფორმირებულ განტოლებებზე. ლოგარითმის და, შესაბამისად, მაჩვენებლის პრაქტიკული გამოყენება შესაძლებელია, როდესაც მიღებულ მახასიათებელს არ აქვს უარყოფითი მნიშვნელობები. ფუნქციებს შორის ურთიერთობების შესწავლისას, რომლებიც იყენებენ შედეგიანი მახასიათებლის ლოგარითმს, ძალაუფლების კანონზე დამოკიდებულება ჭარბობს ეკონომეტრიაში (მიწოდებისა და მოთხოვნის მრუდები, წარმოების ფუნქციები, განვითარების მრუდები, რათა ახასიათებდეს კავშირი პროდუქციის შრომის ინტენსივობას, წარმოების მასშტაბს, GNI-ის დამოკიდებულება დასაქმების დონეზე, ენგელის მრუდები).

28. ინვერსიული მოდელი და მისი გამოყენება

ზოგჯერ გამოიყენება ეგრეთ წოდებული ინვერსიული მოდელი, რომელიც შინაგანად არაწრფივია, მაგრამ მასში, ტოლგვერდა ჰიპერბოლისგან განსხვავებით, გარდაიქმნება არა ახსნა-განმარტებადი ცვლადი, არამედ მიღებული მახასიათებელი Y. შესაბამისად, ინვერსიული მოდელი გამოდის იყოს შინაგანად არაწრფივი და LLS მოთხოვნა არ არის შესრულებული შედეგიანი Y მახასიათებლის ფაქტობრივი მნიშვნელობებისთვის და მათი საპასუხო მნიშვნელობებისთვის. არაწრფივი რეგრესიის კორელაციის შესწავლა განსაკუთრებულ ყურადღებას იმსახურებს. ზოგად შემთხვევაში, მეორე ხარისხის პარაბოლა, ისევე როგორც უფრო მაღალი რიგის პოლინომები, როდესაც წრფივდება, იღებს მრავალჯერადი რეგრესიის განტოლების ფორმას. თუ რეგრესიის განტოლება, რომელიც არაწრფივია ახსნილი ცვლადის მიმართ, წრფივი წყვილის რეგრესიის განტოლების ფორმას იღებს, მაშინ წრფივი კორელაციის კოეფიციენტი შეიძლება გამოყენებულ იქნას ურთიერთობის სიმკაცრის შესაფასებლად.

თუ რეგრესიის განტოლების წრფივ ფორმად გადაქცევა დაკავშირებულია დამოკიდებულ ცვლადთან (შედეგი მახასიათებელი), მაშინ ხაზოვანი კორელაციის კოეფიციენტი გარდაქმნილი მახასიათებლის მნიშვნელობებისთვის იძლევა მხოლოდ ურთიერთობის სავარაუდო შეფასებას და რიცხობრივად არ ემთხვევა კორელაციას. ინდექსი. გასათვალისწინებელია, რომ კორელაციის ინდექსის გაანგარიშებისას გამოიყენება Y ეფექტური მახასიათებლის კვადრატული გადახრების ჯამები და არა მათი ლოგარითმები. კორელაციის ინდექსის მნიშვნელოვნების შეფასება ხორციელდება ისევე, როგორც კორელაციის კოეფიციენტის სანდოობის (მნიშვნელოვნების) შეფასება. თავად კორელაციის ინდექსი, ისევე როგორც დეტერმინაციის ინდექსი, გამოიყენება ფიშერის F-ტესტით საერთო არაწრფივი რეგრესიის განტოლების მნიშვნელოვნების შესამოწმებლად.

გაითვალისწინეთ, რომ არაწრფივი მოდელების აგების შესაძლებლობა, როგორც მათი ხაზოვან ფორმამდე შემცირებით, ასევე არაწრფივი რეგრესიის გამოყენებით, ერთი მხრივ, ზრდის რეგრესიის ანალიზის უნივერსალურობას. მეორე მხრივ, ეს მნიშვნელოვნად ართულებს მკვლევარის ამოცანებს. თუ ჩვენ შემოვიფარგლებით წყვილთა რეგრესიის ანალიზზე, მაშინ შეგვიძლია Y და X დაკვირვებები გამოვსახოთ როგორც სკატერული. ხშირად რამდენიმე განსხვავებული არაწრფივი ფუნქცია უახლოვდება დაკვირვებებს, თუ ისინი დევს რაიმე მრუდეზე. მაგრამ მრავალჯერადი რეგრესიის ანალიზის შემთხვევაში, ასეთი გრაფიკის აგება შეუძლებელია.

ალტერნატიული მოდელების განხილვისას დამოკიდებული ცვლადის იგივე განსაზღვრებით, შერჩევის პროცედურა შედარებით მარტივია. თქვენ შეგიძლიათ შეაფასოთ რეგრესია ყველა შესაძლო ფუნქციის საფუძველზე, რომელიც შეგიძლიათ წარმოიდგინოთ და აირჩიოთ ფუნქცია, რომელიც საუკეთესოდ ხსნის დამოკიდებულ ცვლადში ცვლილებებს. ნათელია, რომ როდესაც წრფივი ფუნქცია ხსნის y-ში დისპერსიის დაახლოებით 64%-ს, ხოლო ჰიპერბოლური 99,9%-ს, ეს უკანასკნელი აშკარად უნდა იყოს არჩეული. მაგრამ როდესაც სხვადასხვა მოდელები იყენებენ სხვადასხვა ფუნქციურ ფორმებს, მოდელის არჩევის პრობლემა ბევრად უფრო რთული ხდება.

29. ბოქს-კოქსის ტესტის გამოყენება.

უფრო ზოგადად, ალტერნატიული მოდელების განხილვისას დამოკიდებული ცვლადის იგივე განსაზღვრებით, არჩევანი მარტივია. ყველაზე გონივრულია რეგრესიის შეფასება ყველა შესაძლო ფუნქციის საფუძველზე, შეჩერება იმ ფუნქციაზე, რომელიც საუკეთესოდ ხსნის დამოკიდებულ ცვლადში ცვლილებებს. თუ განმსაზღვრელი კოეფიციენტი ზომავს ერთ შემთხვევაში რეგრესით ახსნილ დისპერსიის პროპორციას, ხოლო მეორე შემთხვევაში რეგრესით ახსნილ ამ დამოკიდებული ცვლადის ლოგარითმის დისპერსიის პროპორციას, მაშინ არჩევანი კეთდება სირთულის გარეშე. სხვა საქმეა, როდესაც ეს მნიშვნელობები ორი მოდელისთვის ძალიან ახლოს არის და არჩევანის პრობლემა ბევრად უფრო რთული ხდება.

შემდეგ უნდა იქნას გამოყენებული სტანდარტული პროცედურა ბოქს-კოქსის ტესტის სახით. თუ თქვენ უბრალოდ გჭირდებათ მოდელების შედარება შედეგიანი ფაქტორისა და მისი ლოგარითმის გამოყენებით, როგორც დამოკიდებული ცვლადის ვარიანტს, მაშინ გამოიყენება ზარემბკას ტესტის ვარიანტი. ის გვთავაზობს Y მასშტაბის ტრანსფორმაციას, რომელიც საშუალებას იძლევა პირდაპირი შედარება ფესვის საშუალო კვადრატული ცდომილების (RMS) წრფივ და ლოგარითმულ მოდელებში. შესაბამისი პროცედურა მოიცავს შემდეგ ნაბიჯებს:

    ნიმუშში Y მნიშვნელობების გეომეტრიული საშუალო გამოითვლება, რომელიც ემთხვევა Y-ის ლოგარითმის საშუალო არითმეტიკული მაჩვენებლის მაჩვენებელს;

    Y დაკვირვებები გადაითვლება ისე, რომ ისინი იყოფა პირველ საფეხურზე მიღებულ მნიშვნელობაზე;

    რეგრესია შეფასებულია წრფივი მოდელისთვის მასშტაბური Y მნიშვნელობების გამოყენებით ორიგინალური Y მნიშვნელობების ნაცვლად და ლოგარითმული მოდელისთვის მასშტაბური Y მნიშვნელობების ლოგარითმის გამოყენებით. ახლა ორი რეგრესიის SD მნიშვნელობები შესადარებელია და, შესაბამისად, მოდელი კვადრატული გადახრების უფრო მცირე ჯამი უკეთ ჯდება დაკვირვებულ მნიშვნელობებზე ნამდვილ დამოკიდებულებასთან;

    იმის შესამოწმებლად, რომ ერთ-ერთი მოდელი არ იძლევა მნიშვნელოვნად უკეთეს მორგებას, შეგიძლიათ გამოიყენოთ დაკვირვებების რაოდენობის ნახევარის ნამრავლი და RMS მნიშვნელობების თანაფარდობის ლოგარითმი მასშტაბურ რეგრესიებში, შემდეგ კი აიღოთ აბსოლუტური მნიშვნელობა. ამ ღირებულებას.

30. ფაქტორთა ურთიერთკორელაციისა და მულტიკოლნეარობის ცნებები.

34. MNC-ის საფუძვლები და მისი გამოყენების მართებულობა.

მოდით ახლა მივმართოთ LSM-ის საფუძვლებს, მისი გამოყენების სისწორეს (მათ შორის მრავალჯერადი რეგრესიის ამოცანებს) და LSM-ის გამოყენებით მიღებული შეფასებების ყველაზე მნიშვნელოვან თვისებებს. დავიწყოთ იმით, რომ რეგრესიის განტოლების მარჯვენა მხარეს ანალიტიკურ დამოკიდებულებასთან ერთად მნიშვნელოვან როლს თამაშობს შემთხვევითი ტერმინიც. ეს შემთხვევითი კომპონენტი არის დაუკვირვებადი რაოდენობა. თავად რეგრესიის პარამეტრების სტატისტიკური ტესტები და კორელაციის ზომები ეფუძნება გადაუმოწმებელ ვარაუდებს მრავალჯერადი რეგრესიის ამ შემთხვევითი კომპონენტის განაწილების შესახებ. ეს ვარაუდები მხოლოდ წინასწარია. მხოლოდ რეგრესიის განტოლების აგების შემდეგ შემოწმდება, აქვს თუ არა შეფასებებს აპრიორი მიღებული თვისებების შემთხვევითი ნარჩენები (შემთხვევითი კომპონენტის ემპირიული ანალოგები). არსებითად, როდესაც მოდელის პარამეტრები ფასდება, გამოითვლება განსხვავებები მიღებული მახასიათებლის თეორიულ და რეალურ მნიშვნელობებს შორის, რათა შეფასდეს თავად შემთხვევითი კომპონენტი. მნიშვნელოვანია გვახსოვდეს, რომ ეს არის მხოლოდ მოცემული განტოლების უცნობი ნაშთის შერჩევითი რეალიზაცია.

ნორმალური განტოლებების სისტემიდან მიღებული რეგრესიის კოეფიციენტები წარმოადგენს კავშირის სიძლიერის ნიმუშს. ცხადია, რომ მათ აქვთ პრაქტიკული მნიშვნელობა მხოლოდ მაშინ, როცა ისინი მიუკერძოებელნი არიან. შეგახსენებთ, რომ ამ შემთხვევაში ნარჩენების საშუალო ტოლია ნულის, ან, რაც იგივეა, შეფასების საშუალო უდრის თავად შეფასებულ პარამეტრს. შემდეგ ნარჩენები არ დაგროვდება დიდი რაოდენობით ნიმუშის შეფასებებით და თავად ნაპოვნი რეგრესიის პარამეტრი შეიძლება ჩაითვალოს როგორც საშუალოდ დიდი რაოდენობის მიუკერძოებელი შეფასებით.

გარდა ამისა, შეფასებებს უნდა ჰქონდეს ყველაზე მცირე განსხვავება, ე.ი. იყოს ეფექტური და შემდეგ შესაძლებელი გახდება პრაქტიკულად შეუფერებელი წერტილოვანი შეფასებებიდან ინტერვალის შეფასებაზე გადასვლა. და ბოლოს, ნდობის ინტერვალები გამოიყენება ეფექტურობის მაღალი ხარისხით, როდესაც პარამეტრის ჭეშმარიტი (უცნობი) მნიშვნელობიდან მოცემულ მანძილზე შეფასების მიღების ალბათობა ერთთან ახლოსაა. ასეთ შეფასებებს უწოდებენ თანმიმდევრულს და თანმიმდევრულობის თვისებას ახასიათებს მათი სიზუსტის მატება ნიმუშის ზომის ზრდით.

თუმცა, თანმიმდევრულობის პირობა ავტომატურად არ არის დაკმაყოფილებული და არსებითად დამოკიდებულია შემდეგი ორი მნიშვნელოვანი მოთხოვნის შესრულებაზე. პირველ რიგში, თავად ნარჩენები უნდა იყოს სტოქასტური ყველაზე გამოხატული შემთხვევითობით, ე.ი. ყველა აშკარად ფუნქციონალური დამოკიდებულება უნდა იყოს ჩართული მრავალჯერადი რეგრესიის ანალიტიკურ კომპონენტში და გარდა ამისა, ნარჩენების მნიშვნელობები უნდა განაწილდეს ერთმანეთისგან დამოუკიდებლად სხვადასხვა ნიმუშებისთვის (ნარჩენების ავტოკორელაცია არ არის). მეორე, არანაკლებ მნიშვნელოვანი მოთხოვნაა, რომ თითოეული გადახრის (ნარჩენი) ვარიაცია ერთნაირი იყოს X ცვლადის ყველა მნიშვნელობისთვის (ჰომოსკედასტიურობა). იმათ. ჰომოსკედასტურობა გამოიხატება დისპერსიის მუდმივობით ყველა დაკვირვებისთვის:

პირიქით, ჰეტეროსკედასტიურობა მდგომარეობს დისპერსიის ასეთი მუდმივობის დარღვევაში სხვადასხვა დაკვირვებისთვის. ამ შემთხვევაში, აპრიორი (დაკვირვებამდე) ალბათობა, რომ მიიღოთ მკვეთრად გადახრილი მნიშვნელობები, შემთხვევითი ტერმინის განსხვავებული თეორიული განაწილებით ნიმუშში სხვადასხვა დაკვირვებისთვის, შედარებით მაღალი იქნება.

ნარჩენების ავტოკორელაცია ან მიმდინარე და წინა (შემდეგი) დაკვირვებების ნარჩენებს შორის კორელაციის არსებობა ჩანს ჩვეულებრივი წრფივი კორელაციის კოეფიციენტის მნიშვნელობით. თუ ის მნიშვნელოვნად განსხვავდება ნულიდან, მაშინ ნარჩენები ავტოკორელირებულია და, შესაბამისად, ალბათობის სიმკვრივის ფუნქცია (ნარჩენების განაწილება) დამოკიდებულია დაკვირვების წერტილზე და ნარჩენი მნიშვნელობების განაწილებაზე სხვა დაკვირვების წერტილებზე. მოსახერხებელია ნარჩენების ავტოკორელაციის დადგენა ხელმისაწვდომი სტატისტიკური ინფორმაციით დაკვირვებების დალაგების არსებობისას X ფაქტორით. ნარჩენების ავტოკორელაციის არარსებობა უზრუნველყოფს რეგრესიის კოეფიციენტების შეფასებების თანმიმდევრულობას და ეფექტურობას.

35. ჰომოსკედასტიურობა და ჰეტეროსკედასტიურობა, ნარჩენების ავტოკორელაცია, განზოგადებული უმცირესი კვადრატების მეთოდი (GMLS).

ნარჩენების დისპერსიების ერთგვაროვნება X ცვლადების ყველა მნიშვნელობისთვის, ანუ ჰომოსკედასტურობა, ასევე აბსოლუტურად აუცილებელია LSM-დან რეგრესიის პარამეტრების თანმიმდევრული შეფასებების მისაღებად. ჰომოსკედასტიურობის პირობის შეუსრულებლობა იწვევს ე.წ. ამან შეიძლება გამოიწვიოს მიკერძოება რეგრესიის კოეფიციენტების შეფასებაში. ჰეტეროსკედასტიურობა ძირითადად გავლენას მოახდენს რეგრესიის კოეფიციენტების შეფასების ეფექტურობის შემცირებაზე. ამ შემთხვევაში განსაკუთრებით რთული ხდება რეგრესიის კოეფიციენტის სტანდარტული შეცდომის ფორმულის გამოყენება, რომლის გამოყენება ითვალისწინებს ნარჩენების ერთჯერადი ვარიაციას ფაქტორის ნებისმიერი მნიშვნელობისთვის. რაც შეეხება რეგრესიის კოეფიციენტების შეფასებების მიუკერძოებლობას, ეს პირველ რიგში დამოკიდებულია ნარჩენების დამოუკიდებლობაზე და თავად ფაქტორების მნიშვნელობებზე.

ჰომოსკედასტურობის შესამოწმებლად საკმაოდ ვიზუალური, თუმცა არა მკაცრი და უნარ-ჩვევების მოთხოვნადი გზაა ნარჩენების დამოკიდებულების ხასიათის გრაფიკული შესწავლა საშუალო გამოთვლილ (თეორიულ) შედეგად მიღებულ მახასიათებელზე ან შესაბამის კორელაციური ველებზე. ჰეტეროსცედასტიურობის შესწავლისა და შეფასების ანალიტიკური მეთოდები უფრო მკაცრია. ჰეტეროსკედასტიურობის მნიშვნელოვანი არსებობით, მიზანშეწონილია გამოიყენოთ განზოგადებული უმცირესი კვადრატები (GLS) უმცირესი კვადრატების ნაცვლად.

უმცირესი კვადრატების გამოყენების შედეგად წარმოქმნილი მრავალჯერადი რეგრესიის მოთხოვნების გარდა, ასევე აუცილებელია მოდელში შემავალი ცვლადების პირობების დაცვა. ეს, უპირველეს ყოვლისა, მოიცავს მოთხოვნებს მოდელის ფაქტორების რაოდენობასთან დაკავშირებით დაკვირვების მოცემული მოცულობისთვის (1-დან 7-მდე). წინააღმდეგ შემთხვევაში, რეგრესიის პარამეტრები სტატისტიკურად უმნიშვნელო იქნება. უმცირესი კვადრატების მეთოდის განხორციელებისას შესაბამისი რიცხვითი მეთოდების გამოყენების ეფექტურობის თვალსაზრისით, აუცილებელია, რომ დაკვირვებების რაოდენობა აღემატებოდეს სავარაუდო პარამეტრების რაოდენობას (განტოლებათა სისტემაში განტოლებათა რაოდენობა მეტია, ვიდრე მოძიებული ცვლადების რაოდენობა).

ეკონომეტრიის ყველაზე მნიშვნელოვანი მიღწევაა თავად უცნობი პარამეტრების შეფასების მეთოდების მნიშვნელოვანი განვითარება და განსახილველი ეფექტების სტატიკური მნიშვნელობის განსაზღვრის კრიტერიუმების გაუმჯობესება. ამასთან დაკავშირებით, ტრადიციული LSM-ის გამოყენების შეუძლებლობა ან მიზანშეწონილობა იმ ჰეტეროსკედასტიურობის გამო, რომელიც ამა თუ იმ ხარისხით ვლინდება, განაპირობა განზოგადებული LSM-ის (GSM) განვითარება. ფაქტობრივად, ამავდროულად, მოდელის კორექტირება ხდება, მისი სპეციფიკაცია იცვლება და საწყისი მონაცემები გარდაიქმნება რეგრესიის კოეფიციენტების შეფასებების მიუკერძოებლობის, ეფექტურობისა და თანმიმდევრულობის უზრუნველსაყოფად.

ვარაუდობენ, რომ ნარჩენების საშუალო ტოლია ნულის, მაგრამ მათი ვარიაცია აღარ არის მუდმივი, არამედ პროპორციულია K i მნიშვნელობების, სადაც ეს მნიშვნელობები არის პროპორციულობის კოეფიციენტები, რომლებიც განსხვავებულია სხვადასხვა მნიშვნელობებისთვის. x ფაქტორიდან. ამრიგად, სწორედ ეს კოეფიციენტები (Ki მნიშვნელობები) ახასიათებს დისპერსიის ჰეტეროგენულობას. ბუნებრივია, ვარაუდობენ, რომ თავად დისპერსიის მნიშვნელობა, რომელიც არის საერთო ფაქტორი ამ პროპორციულობის კოეფიციენტებისთვის, უცნობია.

ორიგინალური მოდელი, ამ კოეფიციენტების მრავალჯერადი რეგრესიის განტოლებაში შეყვანის შემდეგ, აგრძელებს ჰეტეროსკედასტიკურობას (უფრო ზუსტად, ეს არის მოდელის ნარჩენები). დაე, ეს ნარჩენები (ნარჩენები) არ იყოს ავტოკორელირებული. შემოვიღოთ ახალი ცვლადები, რომლებიც მიღებულია საწყისი მოდელის ცვლადების I-ის დაკვირვების შედეგად დაფიქსირებული K i პროპორციულობის კოეფიციენტების კვადრატულ ფესვზე გაყოფით. შემდეგ ტრანსფორმირებულ ცვლადებში ვიღებთ ახალ განტოლებას, რომელშიც ნაშთები უკვე ჰომოსკედასტური იქნება. თავად ახალი ცვლადები შეწონილი ძველი (ორიგინალური) ცვლადებია.

ამრიგად, ჰომოსკედასტური ნარჩენებით ამ გზით მიღებული ახალი განტოლების პარამეტრების შეფასება შემცირდება შეწონილ LSM-მდე (არსებითად, ეს არის GLS). როდესაც გამოიყენება რეგრესიის ცვლადების ნაცვლად, მათი გადახრები რეგრესიის კოეფიციენტების გამოხატვის საშუალოდან იძენს მარტივ და სტანდარტიზებულ (ერთგვაროვან) ფორმას, ოდნავ განსხვავებულ LSM-სა და LMLS-ისთვის მრიცხველსა და მნიშვნელში კორექტირების ფაქტორით 1/K. წილადი, რომელიც იძლევა რეგრესიის კოეფიციენტს.

გასათვალისწინებელია, რომ ტრანსფორმირებული (შესწორებული) მოდელის პარამეტრები არსებითად დამოკიდებულია იმაზე, თუ რა კონცეფციაა აღებული К i პროპორციულობის კოეფიციენტების საფუძვლად. ხშირად ვარაუდობენ, რომ ნარჩენები უბრალოდ პროპორციულია ფაქტორის მნიშვნელობებთან. მოდელი იღებს უმარტივეს ფორმას, როდესაც მიიღება ჰიპოთეზა, რომ შეცდომები პროპორციულია რიგით ბოლო ფაქტორის მნიშვნელობებთან. შემდეგ OLS საშუალებას გაძლევთ გაზარდოთ დაკვირვებების წონა გარდაქმნილი ცვლადების უფრო მცირე მნიშვნელობებით რეგრესიის პარამეტრების განსაზღვრისას სტანდარტული OLS-ის მუშაობასთან შედარებით ორიგინალური ორიგინალური ცვლადებით. მაგრამ ეს ახალი ცვლადები უკვე იღებენ განსხვავებულ ეკონომიკურ შინაარსს.

ჰიპოთეზას, რომ ნარჩენები ფაქტორის მნიშვნელობის პროპორციულია, შეიძლება ჰქონდეს რეალური დასაბუთება. დაე, დამუშავდეს არასაკმარისად ერთგვაროვანი მონაცემთა ნაკრები, მაგალითად, ერთდროულად დიდი და მცირე საწარმოების ჩათვლით. მაშინ ფაქტორის დიდი მოცულობითი მნიშვნელობები შეიძლება შეესაბამებოდეს როგორც შედეგის მახასიათებლის დიდ ვარიაციას, ასევე ნარჩენი მნიშვნელობების დიდ განსხვავებას. გარდა ამისა, GLS-ის გამოყენება და შესაბამისი გადასვლა შედარებით მნიშვნელობებზე არა მხოლოდ ამცირებს ფაქტორის ცვალებადობას, არამედ ამცირებს შეცდომის ცვალებადობას. ამრიგად, რეგრესიის მოდელებში ჰეტეროსცედასტიურობის გათვალისწინების და კორექტირების უმარტივესი შემთხვევა რეალიზებულია GLS-ის გამოყენებით.

ზემოაღნიშნული მიდგომა OLS-ის დანერგვისადმი შეწონილი OLS-ის სახით საკმაოდ პრაქტიკულია - ის უბრალოდ განხორციელებულია და აქვს გამჭვირვალე ეკონომიკური ინტერპრეტაცია. რა თქმა უნდა, ეს არ არის ყველაზე ზოგადი მიდგომა და მათემატიკური სტატისტიკის კონტექსტში, რომელიც ემსახურება ეკონომეტრიის თეორიულ საფუძველს, გვთავაზობენ ბევრად უფრო მკაცრ მეთოდს, რომელიც ახორციელებს GLS-ს ყველაზე ზოგადი ფორმით. მან უნდა იცოდეს შეცდომის ვექტორის კოვარიანტული მატრიცა (ნარჩენების სვეტი). და ეს ჩვეულებრივ უსამართლოა პრაქტიკულ სიტუაციებში და შეუძლებელია ამ მატრიცის, როგორც ასეთის პოვნა. ამიტომ, ზოგადად რომ ვთქვათ, საჭიროა როგორმე შეფასდეს საჭირო მატრიცა, რათა გამოიყენოს ასეთი შეფასება მატრიცის ნაცვლად შესაბამის ფორმულებში. ამრიგად, GLS-ის აღწერილი განხორციელება წარმოადგენს ერთ-ერთ ამ შეფასებას. მას ზოგჯერ უწოდებენ ხელმისაწვდომ განზოგადებულ უმცირეს კვადრატებს.

გასათვალისწინებელია ისიც, რომ განსაზღვრის კოეფიციენტი არ შეიძლება იყოს მორგების ხარისხის დამაკმაყოფილებელი საზომი GLS-ის გამოყენებისას. GLS-ის გამოყენებას რომ დავუბრუნდეთ, ჩვენ ასევე აღვნიშნავთ, რომ თეთრი ფორმით სტანდარტული გადახრების (სტანდარტული შეცდომები) გამოყენების მეთოდს (ე.წ. თანმიმდევრული სტანდარტული შეცდომები ჰეტეროსცედასტიურობის არსებობისას) აქვს საკმარისი ზოგადიობა. ეს მეთოდი გამოიყენება იმ პირობით, რომ შეცდომის ვექტორული კოვარიანსის მატრიცა დიაგონალურია. თუ არსებობს ნარჩენების (შეცდომების) ავტოკორელაცია, როდესაც არის არანულოვანი ელემენტები (კოეფიციენტები) კოვარიანტულ მატრიცაში და მთავარი დიაგონალის გარეთ, მაშინ უნდა იქნას გამოყენებული უფრო ზოგადი სტანდარტული შეცდომის მეთოდი Nevie-West ფორმაში. ამ შემთხვევაში, არსებობს მნიშვნელოვანი შეზღუდვა: გარდა ძირითადი დიაგონალისა, არანულოვანი ელემენტებია მხოლოდ მეზობელ დიაგონალებზე, რომლებიც გამოყოფილია ძირითადი დიაგონალიდან არაუმეტეს გარკვეული რაოდენობით.

ნათქვამიდან ირკვევა, რომ აუცილებელია მონაცემების ჰეტეროსკედასტიურობის შემოწმება. შემდეგი ტესტები ემსახურება ამ მიზანს. ისინი ამოწმებენ ძირითად ჰიპოთეზას ნარჩენების ვარიაციების თანასწორობის შესახებ ალტერნატიულ ჰიპოთეზასთან (ამ ჰიპოთეზების უთანასწორობის შესახებ). გარდა ამისა, არსებობს აპრიორი სტრუქტურული შეზღუდვები ჰეტეროსკედასტიურობის ბუნებაზე. გოლდფელდ-კუანდტის ტესტში, როგორც წესი, გამოიყენება ცდომილების დისპერსიის (ნარჩენი) პირდაპირი დამოკიდებულების ვარაუდი რომელიმე დამოუკიდებელი ცვლადის მნიშვნელობაზე. ამ ტესტის გამოყენების სქემა ასეთია. პირველ რიგში, მონაცემები დალაგებულია დამოუკიდებელი ცვლადის კლებადობით, რომლისთვისაც არსებობს ეჭვი ჰეტეროსკედასტიურობაზე. რამდენიმე საშუალო დაკვირვება გამოირიცხება ამ მოწესრიგებული მონაცემთა ნაკრებიდან, სადაც სიტყვა "რამდენიმე" ნიშნავს ყველა დაკვირვების მთლიანი რაოდენობის დაახლოებით მეოთხედს (25%). შემდეგი, შესრულებულია ორი დამოუკიდებელი რეგრესია დარჩენილი საშუალო დაკვირვებებიდან პირველი (აღრიცხვის შემდეგ) და ამ დარჩენილი საშუალო დაკვირვებებიდან ბოლო ორი. ამის შემდეგ აგებულია ორი შესაბამისი ნარჩენი. ბოლოს შედგენილია ფიშერის F-სტატისტიკა და თუ შესწავლილი ჰიპოთეზა მართალია, მაშინ F ნამდვილად არის ფიშერის განაწილება თავისუფლების შესაბამისი ხარისხით. მაშინ ამ სტატისტიკის დიდი მნიშვნელობა ნიშნავს, რომ შემოწმებული ჰიპოთეზა უარყოფილი უნდა იყოს. დაკვირვების აღმოფხვრის ნაბიჯის გარეშე, ამ ტესტის ძალა მცირდება.

ბრეუშ-პაგანის ტესტი გამოიყენება მაშინ, როდესაც აპრიორი ვარაუდობენ, რომ დისპერსიები დამოკიდებულია ზოგიერთ დამატებით ცვლადზე. ჯერ კეთდება ჩვეულებრივი (სტანდარტული) რეგრესია და მიღებულია ნარჩენების ვექტორი. შემდეგ კეთდება დისპერსიის შეფასება. შემდეგი, ტარდება ნარჩენების ვექტორის კვადრატის რეგრესია, რომელიც იყოფა ემპირიულ დისპერსიაზე (დისპერსიის შეფასება). მისთვის (რეგრესია) იპოვეთ ვარიაციის ახსნილი ნაწილი. და ამ ახსნილი ნაწილის ვარიაცია, გაყოფილი ნახევარი, სტატისტიკა აგებულია. თუ ნულოვანი ჰიპოთეზა მართალია (ჰეტეროსცედასტიურობის არარსებობა მართალია), მაშინ ამ რაოდენობას აქვს განაწილება ჰეი- კვადრატი. თუ, პირიქით, ტესტმა გამოავლინა ჰეტეროსკედასტიურობა, მაშინ ორიგინალური მოდელი გარდაიქმნება ნარჩენების ვექტორის კომპონენტების დაყოფით დაკვირვებული დამოუკიდებელი ცვლადების ვექტორის შესაბამის კომპონენტებზე.

36. სტანდარტული გადახრების მეთოდი უაითის ფორმაში.

შეგვიძლია შემდეგი დასკვნების გამოტანა. GLS-ის გამოყენება ჰეტეროსკედასტიურობის არსებობისას მცირდება შეწონილი კვადრატული გადახრების ჯამის მინიმიზაციისთვის. ხელმისაწვდომი GLS-ის გამოყენება დაკავშირებულია დიდი რაოდენობის დაკვირვების საჭიროებასთან, რომელიც აღემატება სავარაუდო პარამეტრების რაოდენობას. GLS-ის გამოყენებისთვის ყველაზე ხელსაყრელი შემთხვევაა, როდესაც შეცდომა (ნარჩენები) ერთ-ერთი დამოუკიდებელი ცვლადის პროპორციულია და მიღებული შეფასებები თანმიმდევრულია. თუ, მიუხედავად ამისა, ჰეტეროსკედასტიურობის მქონე მოდელში აუცილებელია გამოიყენოთ არა GLS, არამედ სტანდარტული LSM, მაშინ თანმიმდევრული შეფასებების მისაღებად, შეიძლება გამოიყენოთ შეცდომების შეფასებები White ან Nevie-West ფორმით.

დროის სერიების ანალიზისას ხშირად საჭიროა გავითვალისწინოთ დაკვირვებების სტატისტიკური დამოკიდებულება დროის სხვადასხვა მომენტში. ამ შემთხვევაში, არაკორელირებული შეცდომების ვარაუდი არ კმაყოფილდება. განვიხილოთ მარტივი მოდელი, რომელშიც შეცდომები ქმნიან პირველი რიგის ავტორეგრესიულ პროცესს. ამ შემთხვევაში, შეცდომები აკმაყოფილებს მარტივ რეციდივის მიმართებას, რომლის მარჯვენა მხარეს ერთ-ერთი ტერმინია დამოუკიდებელი ნორმალურად განაწილებული შემთხვევითი ცვლადების თანმიმდევრობა ნულოვანი საშუალო და მუდმივი დისპერსიით. მეორე წევრი არის პარამეტრის ნამრავლი (ავტორეგრესიის კოეფიციენტი) და ნარჩენების მნიშვნელობები წინა დროს. შეცდომის მნიშვნელობების თანმიმდევრობა (ნარჩენები) თავად ქმნის სტაციონარული შემთხვევით პროცესს. სტაციონარული შემთხვევითი პროცესი ხასიათდება მისი მახასიათებლების მუდმივობით დროში, კერძოდ, საშუალო და დისპერსიით. ამ შემთხვევაში, ჩვენთვის საინტერესო კოვარიანტული მატრიცა (მისი პირობები) მარტივად შეიძლება ჩაიწეროს პარამეტრის სიმძლავრეების გამოყენებით.

ცნობილი პარამეტრისთვის ავტორეგრესიული მოდელის შეფასება ხორციელდება GLS-ის გამოყენებით. ამ შემთხვევაში, საკმარისია ორიგინალური მოდელის უბრალოდ შემცირება მარტივი ტრანსფორმაციით მოდელამდე, რომლის შეცდომები აკმაყოფილებს სტანდარტული რეგრესიის მოდელის პირობებს. ძალიან იშვიათად, მაგრამ მაინც არის სიტუაცია, როდესაც ცნობილია ავტორეგრესიის პარამეტრი. ამიტომ, ზოგადად აუცილებელია შეფასების ჩატარება უცნობი ავტორეგრესიული პარამეტრით. არსებობს სამი ყველაზე ხშირად გამოყენებული შეფასების პროცედურა. Cochrane-Orcutt მეთოდი, Hildreth-Lou პროცედურა და Durbin მეთოდი.

ზოგადად, შემდეგი დასკვნები მართალია. დროის სერიების ანალიზი მოითხოვს ჩვეულებრივი უმცირესი კვადრატების კორექტირებას, რადგან შეცდომები ამ შემთხვევაში, როგორც წესი, კორელაციაშია. ხშირად ეს შეცდომები ქმნიან პირველი რიგის სტაციონარულ ავტორეგრესიულ პროცესს. პირველი რიგის ავტორეგრესიის OLS შეფასებები არის მიუკერძოებელი, თანმიმდევრული, მაგრამ არაეფექტური. ცნობილი ავტორეგრესიის კოეფიციენტით, OLS მცირდება ორიგინალური სისტემის მარტივ გარდაქმნებამდე (შესწორებამდე) და შემდეგ სტანდარტული უმცირეს კვადრატების გამოყენებამდე. თუ, როგორც უფრო ხშირად ხდება, ავტორეგრესიული კოეფიციენტი უცნობია, მაშინ არსებობს GLS-ის რამდენიმე პროცედურა, რომელიც შედგება უცნობი პარამეტრის (კოეფიციენტის) შეფასებაში, რის შემდეგაც გამოიყენება იგივე გარდაქმნები, როგორც წინა შემთხვევაში. ცნობილი პარამეტრი.

37. ბრეუშ-პაგანური ტესტის ცნება, გოლდფელდტ-კვანდტის ტესტი

რუსეთის ფედერაციის სოფლის მეურნეობის სამინისტრო

ფედერალური სახელმწიფო ბიუჯეტის საგანმანათლებლო

უმაღლესი პროფესიული განათლების დაწესებულება

„პერმის სახელმწიფო სასოფლო-სამეურნეო აკადემია

აკადემიკოს დ.ნ. პრიანიშნიკოვის სახელობის"

საფინანსო, საკრედიტო და ეკონომიკური ანალიზის დეპარტამენტი

საკონტროლო სამუშაო დისციპლინაზე "ეკონომეტრია" ვარიანტი - 10


    მიახლოების შეცდომები და მისი განმარტება…………………………………….3

    დროის სერიების და ფუნქციების გასწორების ანალიზური მეთოდი ამაში …………………………………………………………………………..4

    პრაქტიკული ნაწილი……………………………………………………….. 11

    1. დავალება 1…………………………………………………………………………………………………………………………

      დავალება 2………………………………………………………………………………………………………………………………………………………

გამოყენებული ლიტერატურის სია………………………………………………………………………………………………………………………………

  1. მიახლოების შეცდომები და მისი განმარტება.

საშუალო მიახლოების შეცდომაარის გამოთვლილი მონაცემების საშუალო გადახრა რეალური მონაცემებისგან. იგი განისაზღვრება, როგორც პროცენტული მოდული.

მიღებული ატრიბუტის რეალური მნიშვნელობები განსხვავდება თეორიულიდან. რაც უფრო მცირეა ეს განსხვავება, რაც უფრო ახლოსაა თეორიული მნიშვნელობები ემპირიულ მონაცემებთან, ეს არის მოდელის საუკეთესო ხარისხი. თითოეული დაკვირვებისთვის ეფექტური მახასიათებლის რეალური და გამოთვლილი მნიშვნელობების გადახრების სიდიდე არის მიახლოების შეცდომა. მათი რიცხვი მოსახლეობის რაოდენობას შეესაბამება. ზოგიერთ შემთხვევაში, მიახლოების შეცდომა შეიძლება იყოს ნული. შედარებისთვის გამოიყენება გადახრები, რომლებიც გამოხატულია ფაქტობრივი მნიშვნელობების პროცენტულად.

ვინაიდან ის შეიძლება იყოს როგორც დადებითი, ასევე უარყოფითი, ჩვეულებრივ, მიახლოების შეცდომების დადგენა თითოეული დაკვირვებისთვის პროცენტული მოდულის სახით. გადახრები შეიძლება ჩაითვალოს როგორც აბსოლუტური მიახლოების შეცდომა და როგორც ფარდობითი მიახლოების შეცდომა. თითოეული დაკვირვების შედარებითი გადახრებიდან მოდელის ხარისხის შესახებ ზოგადი მსჯელობის მიზნით, საშუალო მიახლოების შეცდომა განისაზღვრება როგორც მარტივი არითმეტიკული საშუალო.

საშუალო მიახლოების შეცდომა გამოითვლება ფორმულით:

ასევე შესაძლებელია საშუალო მიახლოების შეცდომის კიდევ ერთი განმარტება:

თუ £ 10-12%, მაშინ შეგვიძლია ვისაუბროთ მოდელის კარგ ხარისხზე.

  1. ამ პროცესში გამოყენებული დროის სერიების გასწორების ანალიტიკური მეთოდი და ფუნქციები.

დინამიკის სერიაში განვითარების ძირითადი ტენდენციის იდენტიფიცირების უფრო სრულყოფილი ტექნიკა არის ანალიტიკური გასწორება. ანალიტიკური გასწორების მეთოდით ზოგადი ტენდენციის შესწავლისას, ვარაუდობენ, რომ დინამიკის სერიის დონეებში ცვლილებები შეიძლება გამოიხატოს გარკვეული მათემატიკური ფუნქციებით, მიახლოების სიზუსტის სხვადასხვა ხარისხით. განტოლების ტიპი განისაზღვრება კონკრეტული ფენომენის განვითარების დინამიკის ბუნებით. პრაქტიკაში, არსებული დროის სერიების მიხედვით, დგინდება ფორმა და მოიძებნება y=f(t) ფუნქციის პარამეტრები და შემდეგ ხდება ტენდენციიდან გადახრების ქცევის ანალიზი. გასწორებისას ყველაზე ხშირად გამოიყენება შემდეგი მიმართებები: წრფივი, პარაბოლური და ექსპონენციალური. ხშირ შემთხვევაში, დროის სერიების მოდელირება მრავალწევრების ან ექსპონენციალური ფუნქციის გამოყენებით არ იძლევა დამაკმაყოფილებელ შედეგებს, რადგან დროის სერია შეიცავს შესამჩნევ პერიოდულ რყევებს ზოგადი ტენდენციის გარშემო. ასეთ შემთხვევებში უნდა იქნას გამოყენებული ჰარმონიული ანალიზი (ფურიეს სერიის ჰარმონიები). სასურველია ზუსტად ამ მეთოდის გამოყენება, რადგან ის განსაზღვრავს კანონს, რომლითაც შესაძლებელია სერიის დონეების მნიშვნელობების ზუსტად პროგნოზირება.

დინამიური სერიის ანალიტიკური გასწორების მიზანია y=f(t) ანალიტიკური ან გრაფიკული დამოკიდებულების განსაზღვრა. ფუნქცია y=f(t) ისეა არჩეული, რომ იძლევა საკვლევ პროცესის აზრობრივ ახსნას. ეს შეიძლება იყოს სხვადასხვა ფუნქციები.

y=f(t) ფორმის განტოლებათა სისტემები LSM-ით მრავალწევრების პარამეტრების შესაფასებლად.

(დაწკაპუნებადი)

n რიგის მრავალწევრების გრაფიკული წარმოდგენა

1. თუ რიგის დონეების ცვლილებას ახასიათებს დონეების ერთგვაროვანი მატება (კლება), როცა აბსოლუტური ჯაჭვის ნამატები სიდიდით ახლოსაა, განვითარების ტენდენცია ხასიათდება სწორი ხაზის განტოლებით.

2. თუ დინამიკის ტენდენციის ტიპის ანალიზის შედეგად დგინდება მრუდი დამოკიდებულება, დაახლოებით მუდმივი აჩქარებით, მაშინ ტენდენციის ფორმა გამოიხატება მეორე რიგის პარაბოლის განტოლებით.

3. თუ დინამიკის რიგის დონეების ზრდა ხდება ექსპონენტურად, ე.ი. ჯაჭვის ზრდის ფაქტორები მეტ-ნაკლებად მუდმივია, დინამიკის სერიის გასწორება ხორციელდება ექსპონენციალური ფუნქციის მიხედვით.

განტოლების ტიპის არჩევის შემდეგ აუცილებელია განტოლების პარამეტრების განსაზღვრა. განტოლების პარამეტრების დადგენის ყველაზე გავრცელებული გზაა უმცირესი კვადრატების მეთოდი, რომლის დროსაც ამონახსნის სახით მიიღება თეორიულ (არჩეული განტოლების მიხედვით მორგებული) და ემპირიულ დონეებს შორის კვადრატული გადახრების ჯამის მინიმალური წერტილი.

სწორ ხაზზე გასწორებას (ტენდენციის ხაზის განსაზღვრა) აქვს გამოხატულება: yt=a0+a1t

t-დროის სიმბოლო;

ხოლო 0 და a1 არის სასურველი ხაზის პარამეტრები.

განტოლებათა სისტემის ამონახსნებიდან ვხვდებით სწორი ხაზის პარამეტრებს:

განტოლებათა სისტემა გამარტივებულია, თუ t-ის მნიშვნელობები არჩეულია ისე, რომ მათი ჯამი უდრის Σt = 0, ანუ დროის საწყისი გადატანილია განსახილველი პერიოდის შუაში. თუ საცნობარო წერტილის გადაცემამდე t = 1, 2, 3, 4…, მაშინ გადატანის შემდეგ:

თუ დონეების რაოდენობა სერიაში კენტია t = -4 -3 -2 -1 0 +1 +2 +3 +4

თუ დონეების რაოდენობა სერიაში არის ლუწი t = -7 -5 -3 -1 +1 +3 +5 +7

ამრიგად, ∑t კენტი სიმძლავრის მიმართ ყოველთვის იქნება ნულის ტოლი.

ანალოგიურად, მე -2 რიგის პარაბოლის პარამეტრები ნაპოვნია განტოლებათა სისტემის ამოხსნიდან:

გასწორება საშუალო აბსოლუტური ზრდის ან საშუალო ზრდის ტემპის მიხედვით:

Δ-საშუალო აბსოლუტური ზრდა;

K- საშუალო ზრდის ფაქტორი;

Y0-სერიის საწყისი დონე;

Yn არის სერიის საბოლოო დონე;

t არის დონის რიგითი რიცხვი, დაწყებული ნულიდან.

რეგრესიის განტოლების აგების შემდეგ ტარდება მისი სანდოობის შეფასება. შერჩეული რეგრესიული განტოლების მნიშვნელობა, განტოლების პარამეტრები და კორელაციის კოეფიციენტი უნდა შეფასდეს კრიტიკული შეფასების მეთოდების გამოყენებით:

ფიშერის F-ტესტი, სტუდენტის t-ტესტი, ამ შემთხვევაში, კრიტერიუმების გამოთვლილი მნიშვნელობები შედარებულია ცხრილის (კრიტიკულ) მნიშვნელობებთან მოცემულ დონეზე და თავისუფლების ხარისხით. ფაქტი > Ftheor - რეგრესიის განტოლება ადეკვატურია.

n არის დაკვირვებების რაოდენობა (სერიის დონეები), m არის რეგრესიის განტოლების (მოდელი) პარამეტრების რაოდენობა.

რეგრესიის განტოლების ადეკვატურობის შემოწმება (მოდელის ხარისხი მთლიანად) ხორციელდება საშუალო მიახლოების შეცდომის გამოყენებით, რომლის ღირებულება არ უნდა აღემატებოდეს 10-12%-ს (რეკომენდებულია).

რეგიონის ტერიტორიებზე მონაცემები მოცემულია 200X-ზე.

რეგიონის ნომერი საშუალო ერთ სულ მოსახლეზე საარსებო მინიმუმი დღეში ერთი შრომისუნარიანი ადამიანისთვის, რუბ., x საშუალო დღიური ხელფასი, რუბ., საათზე
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

ვარჯიში:

1. შექმენით კორელაციური ველი და ჩამოაყალიბეთ ჰიპოთეზა ურთიერთობის ფორმის შესახებ.

2. გამოთვალეთ წრფივი რეგრესიის განტოლების პარამეტრები

4. ელასტიურობის საშუალო (ზოგადი) კოეფიციენტის გამოყენებით, მიეცით შედარებითი შეფასება ფაქტორსა და შედეგს შორის კავშირის სიძლიერის შესახებ.

7. გამოთვალეთ შედეგის პროგნოზირებული მნიშვნელობა, თუ ფაქტორის საპროგნოზო მნიშვნელობა იზრდება მისი საშუალო დონიდან 10%-ით. განსაზღვრეთ პროგნოზის ნდობის ინტერვალი მნიშვნელოვნების დონისთვის.

გადაწყვეტილება:

მოდით გადავჭრათ ეს პრობლემა Excel-ის გამოყენებით.

1. x და y ხელმისაწვდომი მონაცემების შედარებისას, მაგალითად, მათი დალაგებით x ფაქტორის აღმავალი მიმდევრობით, შეიძლება დავაკვირდეთ იმ ნიშნებს შორის პირდაპირი კავშირი, როდესაც ერთ სულ მოსახლეზე საარსებო მინიმუმის ზრდა ზრდის საშუალო დღიურ ხელფასს. ამის საფუძველზე შეიძლება ვივარაუდოთ, რომ ნიშანს შორის კავშირი პირდაპირია და მისი აღწერა შესაძლებელია სწორი ხაზის განტოლებით. იგივე დასკვნა დასტურდება გრაფიკული ანალიზის საფუძველზე.

კორელაციის ველის შესაქმნელად შეგიძლიათ გამოიყენოთ Excel PPP. შეიყვანეთ საწყისი მონაცემები თანმიმდევრობით: ჯერ x, შემდეგ y.

აირჩიეთ უჯრედების არე, რომელიც შეიცავს მონაცემებს.

შემდეგ აირჩიეთ: ჩასმა / Scatter / Scatter მარკერებითროგორც ნაჩვენებია ფიგურაში 1.

სურათი 1 კორელაციური ველის მშენებლობა

კორელაციური ველის ანალიზი აჩვენებს დამოკიდებულების არსებობას სწორ ხაზთან ახლოს, რადგან წერტილები განლაგებულია თითქმის სწორ ხაზზე.

2. წრფივი რეგრესიის განტოლების პარამეტრების გამოთვლა
გამოიყენეთ ჩაშენებული სტატისტიკური ფუნქცია LINEST.

Ამისთვის:

1) გახსენით არსებული ფაილი, რომელიც შეიცავს გასაანალიზებელ მონაცემებს;
2) აირჩიეთ ცარიელი უჯრედების არე 5×2 (5 სტრიქონი, 2 სვეტი) რეგრესიის სტატისტიკის შედეგების საჩვენებლად.
3) გააქტიურება ფუნქციის ოსტატი: მთავარ მენიუში აირჩიეთ ფორმულები / ჩასმა ფუნქცია.
4) ფანჯარაში კატეგორიათქვენ იღებთ სტატისტიკურიფუნქციის ფანჯარაში - LINEST. დააჭირეთ ღილაკს კარგიროგორც ნაჩვენებია სურათზე 2;

სურათი 2 Function Wizard Dialog Box

5) შეავსეთ ფუნქციის არგუმენტები:

ცნობილი ღირებულებები

ცნობილი x მნიშვნელობები

მუდმივი- ლოგიკური მნიშვნელობა, რომელიც მიუთითებს განტოლებაში თავისუფალი ტერმინის არსებობაზე ან არარსებობაზე; თუ მუდმივი = 1, მაშინ თავისუფალი წევრი გამოითვლება ჩვეულებრივი გზით, თუ მუდმივი = 0, მაშინ თავისუფალი წევრი არის 0;

სტატისტიკა- ლოგიკური მნიშვნელობა, რომელიც მიუთითებს რეგრესიის ანალიზზე დამატებითი ინფორმაციის ჩვენება თუ არა. თუ სტატისტიკა = 1, მაშინ ნაჩვენებია დამატებითი ინფორმაცია, თუ სტატისტიკა = 0, მაშინ ნაჩვენებია მხოლოდ განტოლების პარამეტრების შეფასება.

დააჭირეთ ღილაკს კარგი;

სურათი 3 LINEST არგუმენტების დიალოგი

6) საბოლოო ცხრილის პირველი ელემენტი გამოჩნდება არჩეული არეალის ზედა მარცხენა უჯრედში. მთელი ცხრილის გასადიდებლად დააჭირეთ ღილაკს და შემდეგ კლავიატურის მალსახმობი ++ .

რეგრესიის დამატებითი სტატისტიკა გამოვა შემდეგი სქემაში ნაჩვენები თანმიმდევრობით:

კოეფიციენტის მნიშვნელობა ბ კოეფიციენტის მნიშვნელობა ა
ბ სტანდარტული შეცდომა სტანდარტული შეცდომა ა
სტანდარტული შეცდომა y
F- სტატისტიკა
კვადრატების რეგრესიული ჯამი

სურათი 4 LINEST ფუნქციის გამოთვლის შედეგი

მივიღეთ რეგრესიის განტოლება:

ჩვენ ვასკვნით: ერთ სულ მოსახლეზე საარსებო მინიმუმის 1 რუბლით გაზრდით. საშუალო დღიური ხელფასი იზრდება საშუალოდ 0,92 რუბლით.

ეს ნიშნავს, რომ ხელფასების (y) ცვალებადობის 52% აიხსნება x ფაქტორის ვარიაციით - საშუალო ერთ სულ მოსახლეზე საარსებო მინიმუმი, ხოლო 48% - სხვა ფაქტორების მოქმედებით, რომლებიც არ შედის მოდელში.

განსაზღვრის გამოთვლილი კოეფიციენტის მიხედვით შესაძლებელია კორელაციის კოეფიციენტის გამოთვლა: .

ურთიერთობა შეფასებულია, როგორც ახლო.

4. ელასტიურობის საშუალო (ზოგადი) კოეფიციენტის გამოყენებით განვსაზღვრავთ შედეგზე ფაქტორის ზემოქმედების სიძლიერეს.

სწორი ხაზის განტოლებისთვის საშუალო (ზოგადი) ელასტიურობის კოეფიციენტი განისაზღვრება ფორმულით:

ჩვენ ვპოულობთ საშუალო მნიშვნელობებს უჯრედების ფართობის არჩევით x მნიშვნელობებით და აირჩიეთ ფორმულები / ავტომატური ჯამი / საშუალოდა იგივე გააკეთეთ y-ის მნიშვნელობებთან.

სურათი 5 ფუნქციისა და არგუმენტის საშუალო მნიშვნელობების გამოთვლა

ამდენად, თუ საშუალო საარსებო მინიმუმი ერთ სულ მოსახლეზე საშუალო მნიშვნელობიდან 1%-ით შეიცვლება, საშუალო დღიური ანაზღაურება შეიცვლება საშუალოდ 0,51%-ით.

მონაცემთა ანალიზის ხელსაწყოს გამოყენებით რეგრესიაშეგიძლიათ მიიღოთ ის:
- რეგრესიის სტატისტიკის შედეგები,
- დისპერსიული ანალიზის შედეგები,
- ნდობის ინტერვალების შედეგები,
- ნარჩენები და რეგრესიის ხაზი შეესაბამება დიაგრამებს,
- ნარჩენები და ნორმალური ალბათობა.

პროცედურა ასეთია:

1) შეამოწმეთ წვდომა საანალიზო პაკეტი. მთავარ მენიუში აირჩიეთ თანმიმდევრობით: ფაილი/პარამეტრები/დამატებები.

2) ვარდნა კონტროლიაირჩიეთ ელემენტი Excel დანამატებიდა დააჭირეთ ღილაკს წადი.

3) ფანჯარაში დანამატებიშეამოწმეთ ყუთი საანალიზო პაკეტი, და შემდეგ დააჭირეთ ღილაკს კარგი.

Თუ საანალიზო პაკეტიველის სიიდან აკლია ხელმისაწვდომი დანამატები, დააჭირეთ ღილაკს Მიმოხილვამოსაძებნად.

თუ მიიღებთ შეტყობინებას, რომ ანალიზის პაკეტი არ არის დაინსტალირებული თქვენს კომპიუტერში, დააწკაპუნეთ დიახრომ დააინსტალიროთ.

4) მთავარ მენიუში აირჩიეთ თანმიმდევრობით: მონაცემები / მონაცემთა ანალიზი / ანალიზის ხელსაწყოები / რეგრესია, და შემდეგ დააჭირეთ ღილაკს კარგი.

5) შეავსეთ მონაცემთა შეყვანისა და გამომავალი პარამეტრების დიალოგური ფანჯარა:

შეყვანის ინტერვალი Y- ეფექტური ატრიბუტის მონაცემების შემცველი დიაპაზონი;

შეყვანის ინტერვალი X- ფაქტორის ატრიბუტის მონაცემების შემცველი დიაპაზონი;

ტეგები- დროშა, რომელიც მიუთითებს, შეიცავს თუ არა პირველი ხაზი სვეტების სახელებს;

მუდმივი - ნული- დროშა, რომელიც მიუთითებს განტოლებაში თავისუფალი ტერმინის არსებობაზე ან არარსებობაზე;

გამომავალი ინტერვალი- საკმარისია მიუთითოთ მომავალი დიაპაზონის ზედა მარცხენა უჯრედი;

6) ახალი სამუშაო ფურცელი - შეგიძლიათ დააყენოთ ახალი ფურცლის თვითნებური სახელი.

შემდეგ დააჭირეთ ღილაკს კარგი.

ნახაზი 6 დიალოგური ფანჯარა რეგრესიის ხელსაწყოს პარამეტრების შესაყვანად

პრობლემური მონაცემების რეგრესიის ანალიზის შედეგები ნაჩვენებია ნახაზში 7.

სურათი 7 რეგრესიის ხელსაწყოს გამოყენების შედეგი

5. მოდით შევაფასოთ განტოლებების ხარისხი საშუალო მიახლოების ცდომილების გამოყენებით. გამოვიყენოთ მე-8 ნახაზზე წარმოდგენილი რეგრესიული ანალიზის შედეგები.

სურათი 8 რეგრესიის ხელსაწყოს "ნარჩენი დასკვნის" გამოყენების შედეგი

მოდით შევადგინოთ ახალი ცხრილი, როგორც ნაჩვენებია სურათზე 9. სვეტში C, ჩვენ ვიანგარიშებთ შედარებითი მიახლოების შეცდომას ფორმულის გამოყენებით:

სურათი 9 საშუალო მიახლოების ცდომილების გამოთვლა

საშუალო მიახლოების შეცდომა გამოითვლება ფორმულით:

აშენებული მოდელის ხარისხი შეფასებულია როგორც კარგი, რადგან ის არ აღემატება 8-10%-ს.

6. რეგრესიის სტატისტიკის ცხრილიდან (სურათი 4), ჩვენ ვწერთ ფიშერის F-ტესტის ფაქტობრივ მნიშვნელობას:

Იმდენად, რამდენადაც 5%-იანი მნიშვნელოვნების დონეზე, მაშინ შეგვიძლია დავასკვნათ, რომ რეგრესიის განტოლება მნიშვნელოვანია (ურთიერთობა დადასტურებულია).

8. ჩვენ შევაფასებთ რეგრესიის პარამეტრების სტატისტიკურ მნიშვნელობას Student-ის t-სტატისტიკის გამოყენებით და თითოეული ინდიკატორის ნდობის ინტერვალის გამოთვლით.

ჩვენ წამოვაყენეთ ჰიპოთეზა H 0 ინდიკატორების სტატისტიკურად უმნიშვნელო სხვაობის შესახებ ნულიდან:

.

თავისუფლების ხარისხების რაოდენობისთვის

სურათზე 7 არის t-სტატისტიკის რეალური მნიშვნელობები:

t-ტესტი კორელაციის კოეფიციენტისთვის შეიძლება გამოითვალოს ორი გზით:

მე გზა:

სადაც - კორელაციის კოეფიციენტის შემთხვევითი შეცდომა.

ჩვენ ვიღებთ მონაცემებს გამოსათვლელად ნახაზი 7-ის ცხრილიდან.

II გზა:

ფაქტობრივი t-სტატისტიკური მნიშვნელობები აღემატება ცხრილის მნიშვნელობებს:

ამრიგად, ჰიპოთეზა H 0 უარყოფილია, ანუ რეგრესიის პარამეტრები და კორელაციის კოეფიციენტი შემთხვევით არ განსხვავდება ნულიდან, მაგრამ სტატისტიკურად მნიშვნელოვანია.

პარამეტრის ნდობის ინტერვალი განისაზღვრება როგორც

პარამეტრისთვის a, 95% საზღვრები, როგორც ნაჩვენებია 7-ში, იყო:

რეგრესიის კოეფიციენტისთვის ნდობის ინტერვალი განისაზღვრება როგორც

რეგრესიის კოეფიციენტისთვის b, 95% ზღვრები, როგორც ნაჩვენებია ნახაზ 7-ში, იყო:

ნდობის ინტერვალების ზედა და ქვედა საზღვრების ანალიზი მივყავართ დასკვნამდე, რომ ალბათობით პარამეტრები a და b, მითითებულ საზღვრებში ყოფნისას, არ იღებენ ნულოვან მნიშვნელობებს, ე.ი. არ არის სტატისტიკურად მნიშვნელოვანი და მნიშვნელოვნად განსხვავდება ნულიდან.

7. რეგრესიის განტოლების მიღებული შეფასებები საშუალებას გვაძლევს გამოვიყენოთ პროგნოზირებისთვის. თუ საარსებო მინიმუმის საპროგნოზო ღირებულებაა:

მაშინ საარსებო მინიმუმის სავარაუდო ღირებულება იქნება:

ჩვენ ვიანგარიშებთ პროგნოზის შეცდომას ფორმულის გამოყენებით:

სადაც

ჩვენ ასევე ვიანგარიშებთ დისპერსიას Excel PPP-ის გამოყენებით. Ამისთვის:

1) გააქტიურება ფუნქციის ოსტატი: მთავარ მენიუში აირჩიეთ ფორმულები / ჩასმა ფუნქცია.

3) შეავსეთ ფაქტორების მახასიათებლის რიცხვითი მონაცემების შემცველი დიაპაზონი. დააწკაპუნეთ კარგი.

სურათი 10 ვარიაციის გაანგარიშება

მიიღეთ დისპერსიის მნიშვნელობა

ნარჩენი დისპერსიის გამოსათვლელად თავისუფლების ერთი ხარისხით, ჩვენ ვიყენებთ დისპერსიის ანალიზის შედეგებს, როგორც ნაჩვენებია 7-ში.

y-ის ინდივიდუალური მნიშვნელობების პროგნოზირებისთვის ნდობის ინტერვალები 0,95 ალბათობით განისაზღვრება გამოხატვით:

ინტერვალი საკმაოდ ფართოა, პირველ რიგში დაკვირვების მცირე მოცულობის გამო. ზოგადად, საშუალო თვიური ხელფასის შესრულებული პროგნოზი საიმედო აღმოჩნდა.

პრობლემის პირობა აღებულია: სემინარი ეკონომიკაზე: პროკ. შემწეობა / ი.ი. ელისეევა, ს.ვ. კურიშევა, ნ.მ. გორდეენკო და სხვები; რედ. ი.ი. ელისეევა. - მ.: ფინანსები და სტატისტიკა, 2003. - 192გვ.: ილ.

აგებული ეკონომეტრიული ხარისხის ზოგადი შეფასებისთვის განისაზღვრება ისეთი მახასიათებლები, როგორიცაა განსაზღვრის კოეფიციენტი, კორელაციის ინდექსი, საშუალო ფარდობითი მიახლოების შეცდომა და რეგრესიის განტოლების მნიშვნელოვნების შემოწმება ხდება გამოყენებით. - ფიშერის კრიტერიუმი. ჩამოთვლილი მახასიათებლები საკმაოდ უნივერსალურია და შეიძლება გამოყენებულ იქნას როგორც წრფივ, ისე არაწრფივ მოდელებზე, ასევე ორი ან მეტი ფაქტორის ცვლადის მქონე მოდელებზე. განმსაზღვრელი მნიშვნელობა ყველა ჩამოთვლილი ხარისხის მახასიათებლის გამოანგარიშებისას ითამაშებს რიგი ნარჩენები ε ი, რომელიც გამოითვლება შესასწავლი თვისების ფაქტობრივი (დაკვირვებით მიღებული) მნიშვნელობების გამოკლებით y მეღირებულებები გამოითვლება მოდელის განტოლების მიხედვით y pi.

განსაზღვრის კოეფიციენტი

გვიჩვენებს შესწავლილი ნიშან-თვისების ცვლილების რა პროპორციაა გათვალისწინებული მოდელში. სხვა სიტყვებით რომ ვთქვათ, განსაზღვრის კოეფიციენტი გვიჩვენებს შესწავლილი ცვლადის ცვლილების რა ნაწილი შეიძლება გამოითვალოს მოდელში შეტანილი ფაქტორების ცვლადების ცვლილებების საფუძველზე შერჩეული ტიპის ფუნქციის გამოყენებით, რომელიც აკავშირებს ფაქტორების ცვლადებსა და შესასწავლ მახასიათებელს. მოდელის განტოლება.

განსაზღვრის კოეფიციენტი R2შეუძლია მიიღოს მნიშვნელობები 0-დან 1-მდე. რაც უფრო ახლოსაა განსაზღვრის კოეფიციენტი R2ერთიანობისთვის, მით უკეთესი იქნება მოდელის ხარისხი.

კორელაციის ინდექსი შეიძლება ადვილად გამოითვალოს განსაზღვრის კოეფიციენტის ცოდნით:

კორელაციის ინდექსი ახასიათებს მოდელის აგებისას არჩეული ურთიერთობის ტიპის სიმკაცრეს მოდელში გათვალისწინებულ ფაქტორებსა და შესასწავლ ცვლადს შორის. ხაზოვანი წყვილის რეგრესიის შემთხვევაში, მისი აბსოლუტური მნიშვნელობა ემთხვევა წყვილის კორელაციის კოეფიციენტს. (x, y), რომელიც ადრე განვიხილეთ და ახასიათებს შორის წრფივი ურთიერთობის სიმკაცრეს xდა . კორელაციის ინდექსის მნიშვნელობები, ცხადია, ასევე დევს 0-დან 1-მდე დიაპაზონში. რაც უფრო ახლოსაა მნიშვნელობა ერთიანობასთან, რაც უფრო მჭიდროდ აკავშირებს ფუნქციის არჩეული ტიპი ფაქტორების ცვლადებსა და შესასწავლ მახასიათებელს, მით უკეთესი იქნება მოდელის ხარისხი.

(2.11)

გამოხატულია პროცენტულად და ახასიათებს მოდელის სიზუსტეს. მოდელის მისაღები სიზუსტე პრაქტიკული პრობლემების გადაჭრაში შეიძლება განისაზღვროს ეკონომიკური მიზანშეწონილობის გათვალისწინებით, კონკრეტული სიტუაციის გათვალისწინებით. ფართოდ გამოყენებული კრიტერიუმი არის ის, რომ სიზუსტე ითვლება დამაკმაყოფილებლად, თუ საშუალო ფარდობითი შეცდომა 15%-ზე ნაკლებია. Თუ E rel.ავ. 5%-ზე ნაკლები, მაშინ ამბობენ, რომ მოდელს აქვს მაღალი სიზუსტე. არ არის რეკომენდებული არადამაკმაყოფილებელი სიზუსტით მოდელების გამოყენება ანალიზისა და პროგნოზირებისთვის, ანუ როცა E rel.ავ. 15%-ზე მეტი.

ფიშერის F-ტესტი გამოიყენება რეგრესიის განტოლების მნიშვნელოვნების შესაფასებლად. F- კრიტერიუმის გამოთვლილი მნიშვნელობა განისაზღვრება თანაფარდობით:

. (2.12)

კრიტიკული ღირებულება -კრიტერიუმი განისაზღვრება ცხრილებიდან α მნიშვნელობის მოცემულ დონეზე და თავისუფლების ხარისხით (შეგიძლიათ გამოიყენოთ FDISP ფუნქცია Excel-ში). აი, მაინც არის მოდელში გათვალისწინებული ფაქტორების რაოდენობა, არის დაკვირვებების რაოდენობა. თუ გამოთვლილი მნიშვნელობა აღემატება კრიტიკულ მნიშვნელობას, მაშინ მოდელის განტოლება აღიარებულია, როგორც მნიშვნელოვანი. რაც უფრო დიდია გამოთვლილი მნიშვნელობა - კრიტერიუმები, მით უკეთესია მოდელის ხარისხი.

მოდით განვსაზღვროთ ხაზოვანი მოდელის ხარისხის მახასიათებლები, რომლისთვისაც ჩვენ შევქმენით მაგალითი 1. გამოვიყენოთ მე-2 ცხრილის მონაცემები. განსაზღვრის კოეფიციენტი:

ამიტომ, ხაზოვანი მოდელის ფარგლებში, გაყიდვების მოცულობის ცვლილება 90,1%-ით აიხსნება ჰაერის ტემპერატურის ცვლილებით.

კორელაციის ინდექსი

.

დაწყვილებული ხაზოვანი მოდელის შემთხვევაში კორელაციის ინდექსის მნიშვნელობა, როგორც ვხედავთ, მართლაც უდრის კორელაციის კოეფიციენტს შესაბამის ცვლადებს შორის (გაყიდვის მოცულობა და ტემპერატურა). ვინაიდან მიღებული მნიშვნელობა საკმარისად ახლოს არის ერთთან, შეგვიძლია დავასკვნათ, რომ არსებობს მჭიდრო წრფივი კავშირი შესასწავლ ცვლადს (გაყიდვების მოცულობა) და ფაქტორის ცვლადს (ტემპერატურა) შორის.

ფიშერის F-ტესტი

კრიტიკული ღირებულება F კრα = 0.1-ზე; v 1 =1; ν 2 =7-1-1=5 უდრის 4,06-ს. სავარაუდო ღირებულება -კრიტერიუმი უფრო დიდია ვიდრე ცხრილი, შესაბამისად, მოდელის განტოლება მნიშვნელოვანია.

საშუალო ფარდობითი მიახლოების შეცდომა

ჩაშენებული ხაზოვანი წყვილის რეგრესიის მოდელს აქვს არადამაკმაყოფილებელი სიზუსტე (>15%) და არ არის რეკომენდებული მისი გამოყენება ანალიზისა და პროგნოზირებისთვის.

შედეგად, მიუხედავად იმისა, რომ სტატისტიკური მახასიათებლების უმეტესობა აკმაყოფილებს მათ კრიტერიუმებს, ხაზოვანი დაწყვილებული რეგრესიის მოდელი არ არის შესაფერისი გაყიდვების მოცულობის პროგნოზირებისთვის, ჰაერის ტემპერატურის მიხედვით. დაკვირვების მონაცემების მიხედვით ამ ცვლადებს შორის ურთიერთობის არაწრფივი ბუნება საკმაოდ ნათლად ჩანს ნახ.1-ზე. ჩატარებულმა ანალიზმა ეს დაადასტურა.