რეგრესიული ანალიზის მაგალითი. Რეგრესიული ანალიზი

რეგრესიული ანალიზის მთავარი მახასიათებელია ის, რომ მისი გამოყენება შესაძლებელია შესწავლილ ცვლადებს შორის ურთიერთობის ფორმისა და ხასიათის შესახებ კონკრეტული ინფორმაციის მისაღებად.

რეგრესიული ანალიზის ეტაპების თანმიმდევრობა

მოკლედ განვიხილოთ რეგრესიული ანალიზის ეტაპები.

    დავალების ფორმულირება. ამ ეტაპზე ყალიბდება წინასწარი ჰიპოთეზები შესწავლილი ფენომენების დამოკიდებულების შესახებ.

    დამოკიდებული და დამოუკიდებელი (განმარტებითი) ცვლადების განმარტება.

    სტატისტიკური მონაცემების შეგროვება. მონაცემები უნდა შეგროვდეს რეგრესიის მოდელში შემავალი თითოეული ცვლადისთვის.

    ჰიპოთეზის ფორმულირება კავშირის ფორმის შესახებ (მარტივი ან მრავალჯერადი, წრფივი ან არაწრფივი).

    განმარტება რეგრესიის ფუნქციები (შედგება რეგრესიის განტოლების პარამეტრების რიცხვითი მნიშვნელობების გამოთვლაში)

    რეგრესიული ანალიზის სიზუსტის შეფასება.

    მიღებული შედეგების ინტერპრეტაცია. რეგრესიული ანალიზის შედეგები შედარებულია წინასწარ ჰიპოთეზებთან. ფასდება მიღებული შედეგების სისწორე და დამაჯერებლობა.

    დამოკიდებული ცვლადის უცნობი მნიშვნელობების პროგნოზირება.

რეგრესიული ანალიზის დახმარებით შესაძლებელია პროგნოზირებისა და კლასიფიკაციის პრობლემის გადაჭრა. პროგნოზირებადი მნიშვნელობები გამოითვლება ახსნა-განმარტებითი ცვლადების მნიშვნელობების რეგრესიის განტოლებაში ჩანაცვლებით. კლასიფიკაციის პრობლემა მოგვარებულია ამ გზით: რეგრესიის ხაზი ყოფს ობიექტების მთელ სიმრავლეს ორ კლასად, ხოლო სიმრავლის ნაწილი, სადაც ფუნქციის მნიშვნელობა ნულზე მეტია, ეკუთვნის ერთ კლასს, ხოლო ნაწილი, სადაც ის ნაკლებია. ვიდრე ნული სხვა კლასს ეკუთვნის.

რეგრესიული ანალიზის ამოცანები

განვიხილოთ რეგრესიული ანალიზის ძირითადი ამოცანები: დამოკიდებულების ფორმის დადგენა, განსაზღვრა რეგრესიის ფუნქციებიდამოკიდებული ცვლადის უცნობი მნიშვნელობების შეფასება.

დამოკიდებულების ფორმის დადგენა.

ცვლადებს შორის ურთიერთობის ბუნება და ფორმა შეიძლება ჩამოაყალიბოს რეგრესიის შემდეგი ტიპები:

    დადებითი წრფივი რეგრესია (გამოხატული ფუნქციის ერთგვაროვანი ზრდა);

    პოზიტიური თანაბრად აჩქარებული რეგრესია;

    დადებითი თანაბრად მზარდი რეგრესია;

    უარყოფითი წრფივი რეგრესია (გამოხატული ფუნქციის ერთგვაროვანი ვარდნის სახით);

    უარყოფითი ერთნაირად დაჩქარებული კლებადი რეგრესია;

    უარყოფითი ერთნაირად კლებადი რეგრესია.

თუმცა, აღწერილი ჯიშები, როგორც წესი, არ გვხვდება სუფთა სახით, არამედ ერთმანეთთან კომბინაციაში. ამ შემთხვევაში საუბარია რეგრესიის კომბინირებულ ფორმებზე.

რეგრესიის ფუნქციის განმარტება.

მეორე ამოცანაა გავარკვიოთ ძირითადი ფაქტორების ან მიზეზების დამოკიდებულ ცვლადზე გავლენა, ყველა სხვა თანაბარი და ექვემდებარება შემთხვევითი ელემენტების დამოკიდებულ ცვლადზე ზემოქმედების გამორიცხვას. რეგრესიის ფუნქციაგანისაზღვრება, როგორც ამა თუ იმ ტიპის მათემატიკური განტოლება.

დამოკიდებული ცვლადის უცნობი მნიშვნელობების შეფასება.

ამ პრობლემის გადაწყვეტა მცირდება ერთ-ერთი შემდეგი ტიპის პრობლემის გადაჭრაზე:

    დამოკიდებული ცვლადის მნიშვნელობების შეფასება საწყისი მონაცემების განხილულ ინტერვალში, ე.ი. დაკარგული მნიშვნელობები; ეს წყვეტს ინტერპოლაციის პრობლემას.

    დამოკიდებული ცვლადის მომავალი მნიშვნელობების შეფასება, ე.ი. საწყისი მონაცემების მოცემული ინტერვალის გარეთ მნიშვნელობების პოვნა; ეს წყვეტს ექსტრაპოლაციის პრობლემას.

ორივე პრობლემა მოგვარებულია დამოუკიდებელი ცვლადების მნიშვნელობების პარამეტრების ნაპოვნი შეფასებების რეგრესიის განტოლებაში ჩანაცვლებით. განტოლების ამოხსნის შედეგი არის სამიზნე (დამოკიდებული) ცვლადის მნიშვნელობის შეფასება.

მოდით შევხედოთ ზოგიერთ დაშვებას, რომელსაც ეყრდნობა რეგრესიული ანალიზი.

წრფივობის ვარაუდი, ე.ი. ვარაუდობენ, რომ განხილულ ცვლადებს შორის კავშირი წრფივია. ამრიგად, ამ მაგალითში ჩვენ ავაშენეთ სკატერპლატი და შევძელით მკაფიო წრფივი ურთიერთობის დანახვა. თუ ცვლადების გაფანტულ ნახაზზე დავინახავთ წრფივი ურთიერთობის აშკარა არარსებობას, ე.ი. არსებობს არაწრფივი ურთიერთობა, უნდა იქნას გამოყენებული ანალიზის არაწრფივი მეთოდები.

ნორმალურობის დაშვება ნარჩენები. იგი ვარაუდობს, რომ პროგნოზირებულ და დაკვირვებულ მნიშვნელობებს შორის სხვაობის განაწილება ნორმალურია. განაწილების ბუნების ვიზუალურად დასადგენად, შეგიძლიათ გამოიყენოთ ჰისტოგრამები ნარჩენები.

რეგრესიული ანალიზის გამოყენებისას უნდა გავითვალისწინოთ მისი მთავარი შეზღუდვა. ის მდგომარეობს იმაში, რომ რეგრესიული ანალიზი საშუალებას გაძლევთ აღმოაჩინოთ მხოლოდ დამოკიდებულებები და არა ურთიერთობები, რომლებიც ამ დამოკიდებულებებს უდევს საფუძველს.

რეგრესიული ანალიზი შესაძლებელს ხდის ცვლადებს შორის ასოცირების ხარისხის შეფასებას ცვლადის მოსალოდნელი მნიშვნელობის გამოთვლით რამდენიმე ცნობილ მნიშვნელობაზე დაყრდნობით.

რეგრესიის განტოლება.

რეგრესიის განტოლება ასე გამოიყურება: Y=a+b*X

ამ განტოლების გამოყენებით ცვლადი Y გამოიხატება a მუდმივის და ბ წრფის (ან დახრილობის) დახრილობის გამრავლებით X ცვლადის მნიშვნელობაზე. მუდმივ a-ს ასევე ეწოდება კვეთა, ხოლო ფერდობზე არის რეგრესია. კოეფიციენტი ან B-ფაქტორი.

უმეტეს შემთხვევაში (თუ არა ყოველთვის) არის დაკვირვებების გარკვეული გაფანტვა რეგრესიის ხაზთან დაკავშირებით.

დარჩენილი არის ცალკეული წერტილის (დაკვირვების) გადახრა რეგრესიის ხაზიდან (პროგნოზირებადი მნიშვნელობა).

MS Excel-ში რეგრესიული ანალიზის პრობლემის გადასაჭრელად აირჩიეთ მენიუდან სერვისი"ანალიზის პაკეტი"და რეგრესიული ანალიზის ინსტრუმენტი. მიუთითეთ X და Y შეყვანის ინტერვალები. Y შეყვანის ინტერვალი არის დამოკიდებული მონაცემების ანალიზის დიაპაზონი და უნდა შეიცავდეს ერთ სვეტს. შეყვანის ინტერვალი X არის გასაანალიზებელი დამოუკიდებელი მონაცემების დიაპაზონი. შეყვანის დიაპაზონების რაოდენობა არ უნდა აღემატებოდეს 16-ს.

პროცედურის გამოსავალზე გამომავალი დიაპაზონში, ჩვენ ვიღებთ მოცემულ მოხსენებას ცხრილი 8.3a-8.3 ვ.

შედეგები

ცხრილი 8.3a. რეგრესიის სტატისტიკა

რეგრესიის სტატისტიკა

მრავალჯერადი რ

R-კვადრატი

ნორმალიზებული R-კვადრატი

სტანდარტული შეცდომა

დაკვირვებები

პირველ რიგში, განიხილეთ გამოთვლების ზედა ნაწილი წარმოდგენილი ცხრილი 8.3a, - რეგრესიის სტატისტიკა.

ღირებულება R-კვადრატი, რომელსაც ასევე უწოდებენ დარწმუნების საზომს, ახასიათებს მიღებული რეგრესიული ხაზის ხარისხს. ეს ხარისხი გამოიხატება ორიგინალურ მონაცემებსა და რეგრესიულ მოდელს შორის შესაბამისობის ხარისხით (გამოთვლილი მონაცემები). დარწმუნების საზომი ყოველთვის არის ინტერვალის ფარგლებში.

უმეტეს შემთხვევაში, ღირებულება R-კვადრატიარის ამ მნიშვნელობებს შორის, ეწოდება უკიდურესი, ე.ი. ნულსა და ერთს შორის.

თუ ღირებულება R-კვადრატიერთიანობასთან ახლოს, ეს ნიშნავს, რომ აგებული მოდელი ხსნის შესაბამისი ცვლადების თითქმის ყველა ცვალებადობას. პირიქით, ღირებულება R-კვადრატინულთან ახლოს, ნიშნავს აშენებული მოდელის უხარისხობას.

ჩვენს მაგალითში, სიზუსტის საზომია 0.99673, რაც მიუთითებს რეგრესიის ხაზის ძალიან კარგ შეხამებაზე თავდაპირველ მონაცემებთან.

მრავლობითი R - მრავალჯერადი კორელაციის კოეფიციენტი R - გამოხატავს დამოუკიდებელი ცვლადების (X) და დამოკიდებული ცვლადის (Y) დამოკიდებულების ხარისხს.

მრავალჯერადი რგანსაზღვრის კოეფიციენტის კვადრატული ფესვის ტოლია, ეს მნიშვნელობა იღებს მნიშვნელობებს ნულიდან ერთამდე დიაპაზონში.

მარტივი წრფივი რეგრესიის ანალიზში მრავლობითი Rპირსონის კორელაციის კოეფიციენტის ტოლია. მართლაც, მრავლობითი Rჩვენს შემთხვევაში, ის უდრის პირსონის კორელაციის კოეფიციენტს წინა მაგალითიდან (0.998364).

ცხრილი 8.3ბ. რეგრესიის კოეფიციენტები

შანსები

სტანდარტული შეცდომა

t-სტატისტიკა

Y-გადაკვეთა

ცვლადი X 1

* მოცემულია გამოთვლების შეკვეცილი ვერსია

ახლა განვიხილოთ გამოთვლების შუა ნაწილი წარმოდგენილი ცხრილი 8.3ბ. აქ მოცემულია რეგრესიის კოეფიციენტი b (2.305454545) და გადაადგილება y-ღერძის გასწვრივ, ე.ი. მუდმივი a (2.694545455).

გამოთვლების საფუძველზე შეგვიძლია დავწეროთ რეგრესიის განტოლება შემდეგნაირად:

Y= x*2.305454545+2.694545455

ცვლადებს შორის ურთიერთობის მიმართულება განისაზღვრება რეგრესიის კოეფიციენტების (ბ კოეფიციენტის) ნიშნების (უარყოფითი ან დადებითი) საფუძველზე.

თუ რეგრესიის კოეფიციენტის ნიშანი დადებითია, დამოკიდებულ ცვლადსა და დამოუკიდებელ ცვლადს შორის კავშირი დადებითი იქნება. ჩვენს შემთხვევაში რეგრესიის კოეფიციენტის ნიშანი დადებითია, შესაბამისად, ურთიერთობაც დადებითია.

თუ რეგრესიის კოეფიციენტის ნიშანი უარყოფითია, დამოკიდებულ ცვლადსა და დამოუკიდებელ ცვლადს შორის კავშირი უარყოფითია (შებრუნებული).

IN ცხრილი 8.3c. წარმოდგენილია გამომავალი შედეგები ნარჩენები. იმისათვის, რომ ეს შედეგები გამოჩნდეს ანგარიშში, საჭიროა გააქტიუროთ ჩამრთველი „ნარჩენები“ „რეგრესიის“ ხელსაწყოს გაშვებისას.

დარჩენილი გატანა

ცხრილი 8.3c. რჩება

დაკვირვება

იწინასწარმეტყველა Y

რჩება

სტანდარტული ნაშთები

ანგარიშის ამ ნაწილის გამოყენებით, ჩვენ შეგვიძლია დავინახოთ თითოეული წერტილის გადახრები აგებული რეგრესიის ხაზიდან. უდიდესი აბსოლუტური ღირებულება ნარჩენიჩვენს შემთხვევაში - 0,778, ყველაზე პატარა - 0,043. ამ მონაცემების უკეთესი ინტერპრეტაციისთვის ჩვენ გამოვიყენებთ ორიგინალური მონაცემების გრაფიკს და აგებულ რეგრესიულ ხაზს, რომელიც წარმოდგენილია ნახ. ბრინჯი. 8.3. როგორც ხედავთ, რეგრესიის ხაზი საკმაოდ ზუსტად არის "მორგებული" ორიგინალური მონაცემების მნიშვნელობებთან.

გასათვალისწინებელია, რომ განხილული მაგალითი საკმაოდ მარტივია და ყოველთვის არ არის შესაძლებელი ხაზოვანი რეგრესიის ხაზის ხარისხობრივად აგება.

ბრინჯი. 8.3.საწყისი მონაცემები და რეგრესიის ხაზი

დამოუკიდებელი ცვლადის ცნობილი მნიშვნელობების საფუძველზე დამოკიდებული ცვლადის უცნობი მომავალი მნიშვნელობების შეფასების პრობლემა განუხილველი დარჩა, ე.ი. პროგნოზირების ამოცანა.

რეგრესიის განტოლების არსებობის შემთხვევაში, პროგნოზირების პრობლემა მცირდება Y= x*2.305454545+2.694545455 განტოლების ამოხსნამდე x-ის ცნობილი მნიშვნელობებით. წარმოდგენილია დამოკიდებული ცვლადის Y პროგნოზირების შედეგები ექვსი ნაბიჯით წინ ცხრილში 8.4.

ცხრილი 8.4. Y ცვლადის პროგნოზირების შედეგები

Y (პროგნოზირებადი)

ამრიგად, Microsoft Excel-ის პაკეტში რეგრესიული ანალიზის გამოყენების შედეგად, ჩვენ:

    ააგო რეგრესიის განტოლება;

    დაადგინა ცვლადებს შორის დამოკიდებულების ფორმა და მიმართულება - დადებითი წრფივი რეგრესია, რომელიც გამოიხატება ფუნქციის ერთგვაროვან ზრდაში;

    დაადგინა ცვლადებს შორის ურთიერთობის მიმართულება;

    შეაფასა მიღებული რეგრესიული ხაზის ხარისხი;

    შეძლეს გამოთვლილი მონაცემების გადახრების დანახვა თავდაპირველი ნაკრების მონაცემებიდან;

    იწინასწარმეტყველა დამოკიდებული ცვლადის მომავალი მნიშვნელობები.

თუ რეგრესიის ფუნქციაარის განსაზღვრული, ინტერპრეტირებული და დასაბუთებული, ხოლო რეგრესიული ანალიზის სიზუსტის შეფასება აკმაყოფილებს მოთხოვნებს, შეგვიძლია ვივარაუდოთ, რომ აგებული მოდელი და პროგნოზირებადი მნიშვნელობები საკმარისად სანდოა.

ამ გზით მიღებული პროგნოზირებული მნიშვნელობები არის საშუალო მნიშვნელობები, რომლებიც შეიძლება მოსალოდნელი იყოს.

ამ სტატიაში ჩვენ განვიხილეთ ძირითადი მახასიათებლები აღწერითი სტატისტიკადა მათ შორის ისეთი ცნებები, როგორიცაა ნიშნავს,მედიანური,მაქსიმუმ,მინიმალურიდა მონაცემთა ცვალებადობის სხვა მახასიათებლები.

ასევე გაიმართა კონცეფციის მოკლე განხილვა გამონაბოლქვი. განხილული მახასიათებლები ეხება ე.წ. საძიებო მონაცემთა ანალიზი გამოიყენება პირველადი დასკვნების გამოსატანად და ზოგადი პოპულაციის შესახებ ჰიპოთეზების ფორმირებისთვის.

ასევე განხილული იქნა კორელაციური და რეგრესიული ანალიზის საფუძვლები, მათი ამოცანები და პრაქტიკული გამოყენების შესაძლებლობები.

რეგრესიული ანალიზი შესწავლილ მახასიათებლებს შორის სტოქასტური ურთიერთობის ანალიტიკური გამოხატვის დადგენის მეთოდია. რეგრესიის განტოლება გვიჩვენებს, თუ როგორ იცვლება საშუალოდ ზერომელიმეს შეცვლისას x მე , და ასე გამოიყურება:

სადაც y -დამოკიდებული ცვლადი (ის ყოველთვის ერთია);

X მე - დამოუკიდებელი ცვლადები (ფაქტორები) (შეიძლება იყოს რამდენიმე მათგანი).

თუ არსებობს მხოლოდ ერთი დამოუკიდებელი ცვლადი, ეს არის მარტივი რეგრესიული ანალიზი. თუ რამდენიმეა 2), მაშინ ასეთ ანალიზს მულტივარიატი ეწოდება.

რეგრესიული ანალიზის დროს წყდება ორი ძირითადი ამოცანა:

    რეგრესიის განტოლების აგება, ე.ი. შედეგის ინდიკატორსა და დამოუკიდებელ ფაქტორებს შორის ურთიერთობის ტიპის პოვნა x 1 , x 2 , …, x .

    მიღებული განტოლების მნიშვნელოვნების შეფასება, ე.ი. იმის განსაზღვრა, თუ რამდენად ხსნის შერჩეული ფაქტორის მახასიათებლები მახასიათებლის ცვალებადობას წ.

რეგრესიული ანალიზი ძირითადად გამოიყენება დაგეგმვისთვის, ასევე მარეგულირებელი ჩარჩოს შემუშავებისთვის.

კორელაციური ანალიზისგან განსხვავებით, რომელიც მხოლოდ პასუხობს კითხვას, არის თუ არა კავშირი გაანალიზებულ მახასიათებლებს შორის, რეგრესიული ანალიზი ასევე იძლევა ფორმალიზებულ გამოხატულებას. გარდა ამისა, თუ კორელაციური ანალიზი სწავლობს ფაქტორების რაიმე ურთიერთობას, მაშინ რეგრესიის ანალიზი სწავლობს ცალმხრივ დამოკიდებულებას, ე.ი. კავშირი, რომელიც აჩვენებს, თუ როგორ მოქმედებს ფაქტორების ნიშნების ცვლილება შედეგზე.

რეგრესიული ანალიზი მათემატიკური სტატისტიკის ერთ-ერთი ყველაზე განვითარებული მეთოდია. მკაცრად რომ ვთქვათ, რეგრესიული ანალიზის განხორციელება მოითხოვს მთელი რიგი სპეციალური მოთხოვნების შესრულებას (კერძოდ, x, x 2 ,..., x ;უნდა იყოს დამოუკიდებელი, ნორმალურად განაწილებული შემთხვევითი ცვლადები მუდმივი ვარიაციებით). რეალურ ცხოვრებაში რეგრესიისა და კორელაციის ანალიზის მოთხოვნების მკაცრი დაცვა ძალზე იშვიათია, მაგრამ ორივე ეს მეთოდი ძალზე გავრცელებულია ეკონომიკურ კვლევებში. ეკონომიკაში დამოკიდებულებები შეიძლება იყოს არა მხოლოდ პირდაპირი, არამედ ინვერსიული და არაწრფივი. რეგრესიის მოდელი შეიძლება აშენდეს ნებისმიერი დამოკიდებულების არსებობისას, თუმცა მრავალვარიანტულ ანალიზში გამოიყენება მხოლოდ ფორმის ხაზოვანი მოდელები:

რეგრესიის განტოლების აგება, როგორც წესი, ხორციელდება უმცირესი კვადრატების მეთოდით, რომლის არსი არის მინიმუმამდე დაყვანილი ატრიბუტის რეალური მნიშვნელობების კვადრატული გადახრების ჯამი მისი გამოთვლილი მნიშვნელობებისგან, ე.ი.

სადაც T -დაკვირვების რაოდენობა;

=a+b 1 x 1 +ბ 2 x 2 + ... + ბ X - შედეგის ფაქტორის გამოთვლილი მნიშვნელობა.

რეგრესიის კოეფიციენტების დადგენა რეკომენდებულია პერსონალური კომპიუტერისთვის ან სპეციალური ფინანსური კალკულატორის ანალიტიკური პაკეტების გამოყენებით. უმარტივეს შემთხვევაში, ფორმის ერთფაქტორიანი წრფივი რეგრესიის განტოლების რეგრესიის კოეფიციენტები y = a + bxშეგიძლიათ იპოვოთ ფორმულების გამოყენებით:

კლასტერული ანალიზი

კლასტერული ანალიზი მულტივარიაციული ანალიზის ერთ-ერთი მეთოდია, რომელიც შექმნილია პოპულაციის დაჯგუფებისთვის (კლასტერირებისთვის), რომლის ელემენტები ხასიათდება მრავალი მახასიათებლით. თითოეული მახასიათებლის მნიშვნელობები ემსახურება როგორც შესწავლილი პოპულაციის თითოეული ერთეულის კოორდინატებს მახასიათებლების მრავალგანზომილებიან სივრცეში. თითოეული დაკვირვება, რომელიც ხასიათდება რამდენიმე ინდიკატორის მნიშვნელობებით, შეიძლება წარმოდგენილი იყოს როგორც წერტილი ამ ინდიკატორების სივრცეში, რომელთა მნიშვნელობები განიხილება როგორც კოორდინატები მრავალგანზომილებიან სივრცეში. მანძილი წერტილებს შორის და დან კოორდინატები განისაზღვრება როგორც:

კლასტერიზაციის მთავარი კრიტერიუმია ის, რომ კლასტერებს შორის განსხვავებები უფრო მნიშვნელოვანი უნდა იყოს, ვიდრე იმავე კლასტერზე მინიჭებულ დაკვირვებებს შორის, ე.ი. მრავალგანზომილებიან სივრცეში უთანასწორობა უნდა იყოს დაცული:

სადაც 1, 2 - მანძილი 1 და 2 კლასტერებს შორის.

ისევე როგორც რეგრესიული ანალიზის პროცედურებს, კლასტერიზაციის პროცედურა საკმაოდ შრომატევადია, მიზანშეწონილია მისი შესრულება კომპიუტერზე.

სწავლის დროს სტუდენტები ძალიან ხშირად აწყდებიან სხვადასხვა განტოლებებს. ერთ-ერთი მათგანი - რეგრესიის განტოლება - განხილულია ამ სტატიაში. ამ ტიპის განტოლება გამოიყენება სპეციალურად მათემატიკურ პარამეტრებს შორის ურთიერთობის მახასიათებლების აღსაწერად. ამ ტიპის თანასწორობა გამოიყენება სტატისტიკასა და ეკონომეტრიაში.

რეგრესიის განმარტება

მათემატიკაში რეგრესია გაგებულია, როგორც გარკვეული რაოდენობა, რომელიც აღწერს მონაცემთა ნაკრების საშუალო მნიშვნელობის დამოკიდებულებას სხვა სიდიდის მნიშვნელობებზე. რეგრესიის განტოლება გვიჩვენებს, როგორც კონკრეტული მახასიათებლის ფუნქცია, სხვა მახასიათებლის საშუალო მნიშვნელობა. რეგრესიის ფუნქციას აქვს მარტივი განტოლების ფორმა y \u003d x, რომელშიც y მოქმედებს როგორც დამოკიდებული ცვლადი, ხოლო x არის დამოუკიდებელი ცვლადი (მახასიათებლის ფაქტორი). სინამდვილეში, რეგრესია გამოიხატება როგორც y = f (x).

როგორია ცვლადებს შორის ურთიერთობის ტიპები

ზოგადად, ურთიერთობის ორი საპირისპირო ტიპი გამოირჩევა: კორელაცია და რეგრესია.

პირველს ახასიათებს პირობითი ცვლადების თანასწორობა. ამ შემთხვევაში, ზუსტად არ არის ცნობილი, რომელი ცვლადია დამოკიდებული მეორეზე.

თუ ცვლადებს შორის თანასწორობა არ არის და პირობები ამბობს, რომელი ცვლადია ახსნითი და რომელი დამოკიდებული, მაშინ შეგვიძლია ვისაუბროთ მეორე ტიპის კავშირის არსებობაზე. წრფივი რეგრესიის განტოლების ასაგებად, საჭირო იქნება იმის გარკვევა, თუ რა ტიპის ურთიერთობა შეინიშნება.

რეგრესიების სახეები

დღეისათვის არსებობს 7 სხვადასხვა ტიპის რეგრესია: ჰიპერბოლური, წრფივი, მრავლობითი, არაწრფივი, წყვილ-წყვილი, ინვერსიული, ლოგარითმულად წრფივი.

ჰიპერბოლური, წრფივი და ლოგარითმული

წრფივი რეგრესიის განტოლება გამოიყენება სტატისტიკაში განტოლების პარამეტრების მკაფიოდ ასახსნელად. როგორც ჩანს, y = c + m * x + E. ჰიპერბოლურ განტოლებას აქვს რეგულარული ჰიპერბოლის ფორმა y \u003d c + m / x + E. ლოგარითმულად წრფივი განტოლება გამოხატავს ურთიერთობას ლოგარითმული ფუნქციის გამოყენებით: In y \u003d In c + m * In x + In E.

მრავალჯერადი და არაწრფივი

რეგრესიის ორი უფრო რთული ტიპია მრავლობითი და არაწრფივი. მრავალჯერადი რეგრესიის განტოლება გამოიხატება ფუნქციით y \u003d f (x 1, x 2 ... x c) + E. ამ სიტუაციაში, y არის დამოკიდებული ცვლადი და x არის განმარტებითი ცვლადი. ცვლადი E არის სტოქასტური და მოიცავს სხვა ფაქტორების გავლენას განტოლებაში. არაწრფივი რეგრესიის განტოლება ცოტა არათანმიმდევრულია. ერთის მხრივ, გათვალისწინებულ ინდიკატორებთან მიმართებაში ის არ არის წრფივი, ხოლო მეორე მხრივ, ინდიკატორების შეფასების როლში წრფივია.

ინვერსიული და წყვილი რეგრესია

ინვერსიული არის ერთგვარი ფუნქცია, რომელიც უნდა გარდაიქმნას წრფივ ფორმაში. ყველაზე ტრადიციულ აპლიკაციურ პროგრამებში მას აქვს ფუნქციის ფორმა y \u003d 1 / c + m * x + E. წყვილთა რეგრესიის განტოლება აჩვენებს მონაცემებს შორის ურთიერთობას y = f(x) + E-ის ფუნქციის სახით. ისევე როგორც სხვა განტოლებები, y დამოკიდებულია x-ზე და E არის სტოქასტური პარამეტრი.

კორელაციის ცნება

ეს არის ინდიკატორი, რომელიც აჩვენებს ორ ფენომენსა თუ პროცესს შორის ურთიერთობის არსებობას. ურთიერთობის სიძლიერე გამოიხატება როგორც კორელაციის კოეფიციენტი. მისი მნიშვნელობა მერყეობს [-1;+1] ინტერვალის ფარგლებში. უარყოფითი მაჩვენებელი მიუთითებს უკუკავშირის არსებობაზე, დადებითი მაჩვენებელი მიუთითებს პირდაპირზე. თუ კოეფიციენტი იღებს 0-ის ტოლ მნიშვნელობას, მაშინ კავშირი არ არის. რაც უფრო ახლოს არის მნიშვნელობა 1-თან - რაც უფრო ძლიერია კავშირი პარამეტრებს შორის, მით უფრო ახლოს არის 0-თან - მით უფრო სუსტია.

მეთოდები

კორელაციის პარამეტრულ მეთოდებს შეუძლიათ შეაფასონ ურთიერთობის სიმკაცრე. ისინი გამოიყენება განაწილების შეფასებების საფუძველზე იმ პარამეტრების შესასწავლად, რომლებიც ემორჩილებიან ნორმალურ განაწილების კანონს.

ხაზოვანი რეგრესიის განტოლების პარამეტრები აუცილებელია დამოკიდებულების ტიპის, რეგრესიის განტოლების ფუნქციის დასადგენად და არჩეული ურთიერთობის ფორმულის ინდიკატორების შესაფასებლად. ურთიერთობის იდენტიფიკაციის მეთოდად გამოიყენება კორელაციის ველი. ამისათვის ყველა არსებული მონაცემი უნდა იყოს წარმოდგენილი გრაფიკულად. მართკუთხა ორგანზომილებიანი კოორდინატთა სისტემაში ყველა ცნობილი მონაცემი უნდა იყოს გამოსახული. ასე ყალიბდება კორელაციური ველი. აღწერის ფაქტორის მნიშვნელობა აღინიშნება აბსცისის გასწვრივ, ხოლო დამოკიდებული ფაქტორის მნიშვნელობები აღინიშნება ორდინატთან. თუ პარამეტრებს შორის არის ფუნქციური კავშირი, ისინი ხაზს უსვამენ ხაზს.

თუ ასეთი მონაცემების კორელაციის კოეფიციენტი 30%-ზე ნაკლებია, შეგვიძლია ვისაუბროთ კავშირის თითქმის სრულ არარსებობაზე. თუ ის 30%-დან 70%-მდეა, მაშინ ეს მიუთითებს საშუალო სიმკვრივის ბმულების არსებობაზე. 100% ინდიკატორი არის ფუნქციური კავშირის მტკიცებულება.

არაწრფივი რეგრესიული განტოლება, ისევე როგორც წრფივი, უნდა დაერთოს კორელაციის ინდექსით (R).

კორელაცია მრავალჯერადი რეგრესიისთვის

განსაზღვრის კოეფიციენტი არის მრავალჯერადი კორელაციის კვადრატის მაჩვენებელი. იგი საუბრობს წარმოდგენილი ინდიკატორთა ნაკრების შესწავლილ მახასიათებელთან ურთიერთობის სიმჭიდროვეზე. მას ასევე შეუძლია ისაუბროს შედეგზე პარამეტრების გავლენის ბუნებაზე. მრავალჯერადი რეგრესიის განტოლება ფასდება ამ ინდიკატორის გამოყენებით.

მრავალჯერადი კორელაციის ინდექსის გამოსათვლელად აუცილებელია მისი ინდექსის გამოთვლა.

მინიმალური კვადრატის მეთოდი

ეს მეთოდი არის რეგრესიის ფაქტორების შეფასების გზა. მისი არსი მდგომარეობს ფუნქციაზე ფაქტორის დამოკიდებულების გამო მიღებული კვადრატული გადახრების ჯამის მინიმიზაციაში.

დაწყვილებული წრფივი რეგრესიის განტოლება შეიძლება შეფასდეს ასეთი მეთოდის გამოყენებით. ამ ტიპის განტოლებები გამოიყენება დაწყვილებული წრფივი ურთიერთობის ინდიკატორებს შორის გამოვლენის შემთხვევაში.

განტოლების ვარიანტები

ხაზოვანი რეგრესიის ფუნქციის თითოეულ პარამეტრს აქვს კონკრეტული მნიშვნელობა. დაწყვილებული წრფივი რეგრესიის განტოლება შეიცავს ორ პარამეტრს: c და m. პარამეტრი t გვიჩვენებს y ფუნქციის საბოლოო მაჩვენებლის საშუალო ცვლილებას, ექვემდებარება x ცვლადის შემცირებას (მატებას) ერთი ჩვეულებრივი ერთეულით. თუ x ცვლადი ნულია, მაშინ ფუნქცია უდრის c პარამეტრს. თუ ცვლადი x არ არის ნული, მაშინ c ფაქტორს არ აქვს ეკონომიკური აზრი. ფუნქციაზე ერთადერთი გავლენა არის ნიშანი c ფაქტორის წინ. თუ არის მინუსი, მაშინ შეგვიძლია ვთქვათ შედეგის ნელი ცვლილების შესახებ ფაქტორთან შედარებით. თუ არსებობს პლუსი, მაშინ ეს მიუთითებს შედეგის დაჩქარებულ ცვლილებაზე.

თითოეული პარამეტრი, რომელიც ცვლის რეგრესიის განტოლების მნიშვნელობას, შეიძლება გამოისახოს განტოლების სახით. მაგალითად, c ფაქტორს აქვს ფორმა c = y - mx.

დაჯგუფებული მონაცემები

არსებობს დავალების ისეთი პირობები, რომლებშიც ყველა ინფორმაცია დაჯგუფებულია x ატრიბუტის მიხედვით, მაგრამ ამავე დროს, გარკვეული ჯგუფისთვის, მითითებულია დამოკიდებული ინდიკატორის შესაბამისი საშუალო მნიშვნელობები. ამ შემთხვევაში, საშუალო მნიშვნელობები ახასიათებს, თუ როგორ არის დამოკიდებული ინდიკატორი x-ზე. ამრიგად, დაჯგუფებული ინფორმაცია გვეხმარება რეგრესიის განტოლების პოვნაში. იგი გამოიყენება როგორც ურთიერთობის ანალიზი. თუმცა, ამ მეთოდს აქვს თავისი ნაკლოვანებები. სამწუხაროდ, საშუალო მაჩვენებლები ხშირად ექვემდებარება გარე რყევებს. ეს რყევები არ არის ურთიერთობის შაბლონების ასახვა, ისინი უბრალოდ ნიღბავს მის „ხმაურს“. საშუალო მაჩვენებელი გვიჩვენებს ურთიერთობის ბევრად უარესს, ვიდრე ხაზოვანი რეგრესიის განტოლება. თუმცა, ისინი შეიძლება გამოყენებულ იქნას, როგორც საფუძველი განტოლების მოსაძებნად. კონკრეტული პოპულაციის ზომის შესაბამის საშუალოზე გამრავლებით, შეგიძლიათ მიიღოთ y-ის ჯამი ჯგუფში. შემდეგი, თქვენ უნდა დაამარცხოთ ყველა მიღებული თანხა და იპოვოთ საბოლოო მაჩვენებელი y. ცოტა უფრო რთულია გამოთვლების გაკეთება ჯამის xy ინდიკატორით. იმ შემთხვევაში, თუ ინტერვალები მცირეა, ჩვენ შეგვიძლია პირობითად ავიღოთ x ინდიკატორი ყველა ერთეულისთვის (ჯგუფში) ერთნაირად. გაამრავლეთ ის y-ის ჯამზე, რათა იპოვოთ x და y-ის ნამრავლების ჯამი. გარდა ამისა, ყველა ჯამი შერეულია და მიიღება xy ჯამი.

მრავალჯერადი წყვილი განტოლების რეგრესია: ურთიერთობის მნიშვნელობის შეფასება

როგორც ადრე განვიხილეთ, მრავალჯერადი რეგრესიას აქვს y \u003d f (x 1, x 2, ..., x m) + E ფორმის ფუნქცია. ყველაზე ხშირად, ასეთი განტოლება გამოიყენება პროდუქტზე მიწოდებისა და მოთხოვნის პრობლემის გადასაჭრელად, გამოსყიდულ აქციებზე საპროცენტო შემოსავლის, წარმოების ღირებულების ფუნქციის მიზეზებისა და ტიპის შესასწავლად. იგი ასევე აქტიურად გამოიყენება მაკროეკონომიკური კვლევებისა და გამოთვლების მრავალფეროვნებაში, მაგრამ მიკროეკონომიკის დონეზე, ასეთი განტოლება გამოიყენება ნაკლებად ხშირად.

მრავალჯერადი რეგრესიის მთავარი ამოცანაა მონაცემთა მოდელის შექმნა, რომელიც შეიცავს უზარმაზარ ინფორმაციას, რათა განისაზღვროს, თუ რა გავლენას ახდენს თითოეული ფაქტორი ინდივიდუალურად და მთლიანობაში მოდელირებულ ინდიკატორსა და მის კოეფიციენტებზე. რეგრესიის განტოლებამ შეიძლება მიიღოს სხვადასხვა მნიშვნელობა. ამ შემთხვევაში, ჩვეულებრივ, ორი ტიპის ფუნქცია გამოიყენება ურთიერთობის შესაფასებლად: წრფივი და არაწრფივი.

წრფივი ფუნქცია გამოსახულია ასეთი ურთიერთობის სახით: y \u003d a 0 + a 1 x 1 + a 2 x 2, + ... + a m x m. ამ შემთხვევაში, a2, a m, ითვლება "სუფთა" რეგრესიის კოეფიციენტებად. ისინი აუცილებელია y პარამეტრის საშუალო ცვლილების დასახასიათებლად ყოველ შესაბამის x პარამეტრში ერთი ერთეულით ცვლილებით (კლებით ან ზრდით), სხვა ინდიკატორების სტაბილური მნიშვნელობის პირობით.

არაწრფივ განტოლებებს აქვთ, მაგალითად, ძაფის ფუნქციის ფორმა y=ax 1 b1 x 2 b2 ...x m bm . ამ შემთხვევაში, ინდიკატორებს b 1, b 2 ..... bm - ეწოდება ელასტიურობის კოეფიციენტები, ისინი აჩვენებენ, თუ როგორ შეიცვლება შედეგი (რამდენად%) შესაბამისი ინდიკატორის x 1% -ით ზრდით (კლებით). და სხვა ფაქტორების სტაბილური მაჩვენებლით.

რა ფაქტორები უნდა იქნას გათვალისწინებული მრავალჯერადი რეგრესიის აგებისას

მრავალჯერადი რეგრესიის სწორად ასაგებად აუცილებელია გაირკვეს, რომელ ფაქტორებს უნდა მიექცეს განსაკუთრებული ყურადღება.

საჭიროა გარკვეული გაგება ეკონომიკურ ფაქტორებსა და მოდელებს შორის ურთიერთობის ბუნების შესახებ. ჩართული ფაქტორები უნდა აკმაყოფილებდეს შემდეგ კრიტერიუმებს:

  • უნდა იყოს გაზომვადი. ობიექტის ხარისხის აღმწერი ფაქტორის გამოსაყენებლად, ნებისმიერ შემთხვევაში, მას უნდა მიეცეს რაოდენობრივი ფორმა.
  • არ უნდა არსებობდეს ფაქტორების ურთიერთკორელაცია, ან ფუნქციური ურთიერთობა. ასეთი ქმედებები ყველაზე ხშირად იწვევს შეუქცევად შედეგებს - ჩვეულებრივი განტოლებების სისტემა ხდება უპირობო, რაც იწვევს მის არასანდოობას და ბუნდოვან შეფასებებს.
  • უზარმაზარი კორელაციის ინდიკატორის შემთხვევაში, არ არსებობს გზა, რათა გაირკვეს ფაქტორების იზოლირებული გავლენა ინდიკატორის საბოლოო შედეგზე, შესაბამისად, კოეფიციენტები ხდება ინტერპრეტაცია.

მშენებლობის მეთოდები

არსებობს უამრავი მეთოდი და გზა იმის ასახსნელად, თუ როგორ შეგიძლიათ აირჩიოთ ფაქტორები განტოლებისთვის. თუმცა, ყველა ეს მეთოდი ეფუძნება კოეფიციენტების შერჩევას კორელაციის ინდექსის გამოყენებით. მათ შორისაა:

  • გამორიცხვის მეთოდი.
  • მეთოდის ჩართვა.
  • ეტაპობრივი რეგრესიული ანალიზი.

პირველი მეთოდი მოიცავს ყველა კოეფიციენტის ამოღებას მთლიანი ნაკრებიდან. მეორე მეთოდი მოიცავს მრავალი დამატებითი ფაქტორის დანერგვას. ისე, მესამე არის ფაქტორების აღმოფხვრა, რომლებიც ადრე იყო გამოყენებული განტოლებისთვის. თითოეულ ამ მეთოდს აქვს არსებობის უფლება. მათ აქვთ დადებითი და უარყოფითი მხარეები, მაგრამ მათ შეუძლიათ საკუთარი გზით გადაჭრას არასაჭირო ინდიკატორების სკრინინგის საკითხი. როგორც წესი, თითოეული ინდივიდუალური მეთოდით მიღებული შედეგები საკმაოდ ახლოსაა.

მრავალვარიანტული ანალიზის მეთოდები

ფაქტორების განსაზღვრის ასეთი მეთოდები ეფუძნება ურთიერთდაკავშირებული მახასიათებლების ცალკეული კომბინაციების განხილვას. მათ შორისაა დისკრიმინაციული ანალიზი, ნიმუშის ამოცნობა, ძირითადი კომპონენტის ანალიზი და კლასტერული ანალიზი. გარდა ამისა, არსებობს ფაქტორული ანალიზიც, თუმცა ის გაჩნდა კომპონენტის მეთოდის შემუშავების შედეგად. ყველა მათგანი გამოიყენება გარკვეულ პირობებში, გარკვეულ პირობებში და ფაქტორებში.

რეგრესიული ანალიზის მთავარი მიზანიმოიცავს ურთიერთობის ანალიტიკური ფორმის განსაზღვრას, რომელშიც შედეგიანი ატრიბუტის ცვლილება განპირობებულია ერთი ან მეტი ფაქტორის ნიშნის გავლენით, ხოლო ყველა სხვა ფაქტორების ნაკრები, რომლებიც ასევე გავლენას ახდენენ შედეგზე, აღებულია როგორც მუდმივი და საშუალო მნიშვნელობები. .
რეგრესიული ანალიზის ამოცანები:
ა) დამოკიდებულების ფორმის დადგენა. რაც შეეხება ფენომენებს შორის ურთიერთობის ბუნებასა და ფორმას, არსებობს დადებითი წრფივი და არაწრფივი და უარყოფითი წრფივი და არაწრფივი რეგრესია.
ბ) რეგრესიის ფუნქციის განსაზღვრა ამა თუ იმ ტიპის მათემატიკური განტოლების სახით და დამოკიდებულ ცვლადზე ახსნითი ცვლადების გავლენის დადგენა.
გ) დამოკიდებული ცვლადის უცნობი მნიშვნელობების შეფასება. რეგრესიის ფუნქციის გამოყენებით შეგიძლიათ დამოკიდებული ცვლადის მნიშვნელობების რეპროდუცირება ახსნა ცვლადების მოცემული მნიშვნელობების ინტერვალში (ანუ ინტერპოლაციის პრობლემის გადაჭრა) ან შეაფასოთ პროცესის მიმდინარეობა მითითებული ინტერვალის მიღმა (ე.ი. ექსტრაპოლაციის პრობლემის გადაჭრა). შედეგი არის დამოკიდებული ცვლადის მნიშვნელობის შეფასება.

წყვილთა რეგრესია - ორი ცვლადის y და x ურთიერთობის განტოლება: y=f(x), სადაც y არის დამოკიდებული ცვლადი (შედეგის ნიშანი); x - დამოუკიდებელი, ახსნა-განმარტებითი ცვლადი (მხატვრული ფაქტორი).

არსებობს წრფივი და არაწრფივი რეგრესია.
წრფივი რეგრესია: y = a + bx + ε
არაწრფივი რეგრესია იყოფა ორ კლასად: რეგრესია, რომელიც არის არაწრფივი ანალიზში შემავალი ახსნა-განმარტებითი ცვლადების მიმართ, მაგრამ წრფივი შეფასებული პარამეტრების მიმართ და რეგრესია, რომელიც არაწრფივია შეფასებული პარამეტრების მიმართ.
რეგრესია, რომელიც არაწრფივია განმარტებით ცვლადებში:

რეგრესია, რომელიც არაწრფივია სავარაუდო პარამეტრებში:

  • სიმძლავრე y=a x b ε
  • ექსპონენციალური y=a b x ε
  • ექსპონენციალური y=e a+b x ε
რეგრესიის განტოლების აგება მცირდება მისი პარამეტრების შეფასებამდე. რეგრესიების პარამეტრების შესაფასებლად, რომლებიც წრფივია პარამეტრებში, გამოიყენება უმცირეს კვადრატების მეთოდი (LSM). LSM საშუალებას გაძლევთ მიიღოთ პარამეტრების ისეთი შეფასებები, რომლებშიც y x ეფექტური მახასიათებლის რეალური მნიშვნელობების კვადრატული გადახრების ჯამი მინიმალურია, ე.ი.
.
წრფივი და არაწრფივი განტოლებისთვის, რომლებიც შემცირდება წრფივზე, შემდეგი სისტემა ამოხსნილია a და b-სთვის:

თქვენ შეგიძლიათ გამოიყენოთ მზა ფორმულები, რომლებიც გამომდინარეობს ამ სისტემისგან:

შესწავლილ ფენომენებს შორის კავშირის სიახლოვე შეფასებულია წრფივი წყვილის კორელაციის კოეფიციენტით r xy წრფივი რეგრესისთვის (-1≤r xy ≤1):

და კორელაციის ინდექსი p xy - არაწრფივი რეგრესიისთვის (0≤p xy ≤1):

აგებული მოდელის ხარისხის შეფასება მიენიჭება განსაზღვრის კოეფიციენტით (ინდექსით), ასევე საშუალო მიახლოების შეცდომით.
საშუალო მიახლოების შეცდომა არის გამოთვლილი მნიშვნელობების საშუალო გადახრა რეალურიდან:
.
მნიშვნელობების დასაშვები ზღვარი A - არაუმეტეს 8-10%.
ელასტიურობის E საშუალო კოეფიციენტი გვიჩვენებს საშუალოდ რამდენ პროცენტს შეიცვლება შედეგი y მისი საშუალო მნიშვნელობიდან, როდესაც x ფაქტორი იცვლება მისი საშუალო მნიშვნელობიდან 1%-ით:
.

დისპერსიის ანალიზის ამოცანაა დამოკიდებული ცვლადის დისპერსიის ანალიზი:
∑(y-y )²=∑(y x -y )²+∑(y-y x)²
სადაც ∑(y-y)² არის გადახრების კვადრატული ჯამი;
∑(y x -y)² - კვადრატული გადახრების ჯამი რეგრესიის გამო („ახსნილი“ ან „ფაქტორული“);
∑(y-y x)² - კვადრატული გადახრების ნარჩენი ჯამი.
რეგრესიით ახსნილი დისპერსიის წილი y ეფექტური მახასიათებლის საერთო ვარიაციაში ხასიათდება R2-ის განსაზღვრის კოეფიციენტით (ინდექსით):

განსაზღვრის კოეფიციენტი არის კოეფიციენტის კვადრატი ან კორელაციის ინდექსი.

F-ტესტი - რეგრესიის განტოლების ხარისხის შეფასება - მოიცავს ჰიპოთეზის შემოწმებას, მაგრამ რეგრესიის განტოლების სტატისტიკური უმნიშვნელოობისა და კავშირის სიახლოვის ინდიკატორის შესახებ. ამისთვის შესრულებულია ფაქტობრივი F ფაქტისა და ფიშერის F კრიტერიუმის მნიშვნელობების კრიტიკული (ტაბულური) F ცხრილის შედარება. F ფაქტი განისაზღვრება ფაქტორული და ნარჩენი დისპერსიების მნიშვნელობების თანაფარდობიდან, რომელიც გამოითვლება თავისუფლების ერთი ხარისხით:
,
სადაც n არის მოსახლეობის ერთეულების რაოდენობა; m არის x ცვლადების პარამეტრების რაოდენობა.
F ცხრილი არის კრიტერიუმის მაქსიმალური შესაძლო მნიშვნელობა შემთხვევითი ფაქტორების გავლენის ქვეშ თავისუფლების მოცემული ხარისხებისა და მნიშვნელოვნების დონისთვის a. მნიშვნელოვნების დონე a - სწორი ჰიპოთეზის უარყოფის ალბათობა, იმ პირობით, რომ ის სიმართლეა. ჩვეულებრივ a აღებულია 0,05 ან 0,01-ის ტოლი.
თუ F მაგიდა< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >F არის ფაქტი, მაშინ არ არის უარყოფილი ჰიპოთეზა H შესახებ და აღიარებულია სტატისტიკური უმნიშვნელოობა, რეგრესიის განტოლების არასანდოობა.
რეგრესიისა და კორელაციის კოეფიციენტების სტატისტიკური მნიშვნელოვნების შესაფასებლად გამოითვლება Student-ის t-ტესტი და ნდობის ინტერვალები თითოეული ინდიკატორისთვის. წამოყენებულია ჰიპოთეზა H ინდიკატორების შემთხვევითობის შესახებ, ე.ი. მათი უმნიშვნელო სხვაობის შესახებ ნულიდან. რეგრესიის და კორელაციის კოეფიციენტების მნიშვნელოვნების შეფასება სტუდენტის t-ტესტის გამოყენებით ხორციელდება მათი მნიშვნელობების შედარებით შემთხვევითი შეცდომის სიდიდესთან:
; ; .
წრფივი რეგრესიის პარამეტრების და კორელაციის კოეფიციენტის შემთხვევითი შეცდომები განისაზღვრება ფორმულებით:



t-სტატისტიკის ფაქტობრივი და კრიტიკული (ტაბულური) მნიშვნელობების შედარება - t tabl და t ფაქტი - ჩვენ ვიღებთ ან უარვყოფთ ჰიპოთეზას H o.
ფიშერის F-ტესტსა და სტუდენტის t-სტატისტიკას შორის კავშირი გამოიხატება თანასწორობით

თუ t მაგიდა< t факт то H o отклоняется, т.е. a , b и r xy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >t ის ფაქტი, რომ ჰიპოთეზა H შესახებ არ არის უარყოფილი და აღიარებულია a, b ან r xy-ის წარმოქმნის შემთხვევითი ბუნება.
ნდობის ინტერვალის გამოსათვლელად, ჩვენ განვსაზღვრავთ ზღვრულ შეცდომას D თითოეული ინდიკატორისთვის:
Δ a =t ცხრილი m a, Δ b =t ცხრილი m b.
ნდობის ინტერვალების გამოთვლის ფორმულები შემდეგია:
γ a \u003d aΔ a; γ a \u003d a-Δ a; γ a =a+Δa
γ b = bΔ b ; γ b = b-Δ b ; γb =b+Δb
თუ ნული ხვდება ნდობის ინტერვალის საზღვრებში, ე.ი. თუ ქვედა ზღვარი უარყოფითია, ხოლო ზედა ზღვარი დადებითია, მაშინ სავარაუდო პარამეტრი ითვლება ნულამდე, რადგან მას არ შეუძლია ერთდროულად მიიღოს როგორც დადებითი, ასევე უარყოფითი მნიშვნელობები.
საპროგნოზო მნიშვნელობა y p განისაზღვრება შესაბამისი (საპროგნოზო) მნიშვნელობის x p ჩანაცვლებით რეგრესიის განტოლებაში y x =a+b·x. m y x პროგნოზის საშუალო სტანდარტული შეცდომა გამოითვლება:
,
სადაც
და აგებულია პროგნოზის ნდობის ინტერვალი:
γ y x =y p Δ y p ; γ y x min=y p -Δ y p ; γ y x max=y p +Δ y p
სადაც Δ y x =t ცხრილი ·m y x.

გადაწყვეტის მაგალითი

დავალება ნომერი 1. ურალის რეგიონის შვიდი ტერიტორიისთვის 199X-სთვის ცნობილია ორი ნიშნის მნიშვნელობა.
ცხრილი 1.

საჭირო: 1. y-ის x-ზე დამოკიდებულების დასახასიათებლად გამოთვალეთ შემდეგი ფუნქციების პარამეტრები:
ა) წრფივი;
ბ) ძალაუფლების კანონი (ადრე საჭირო იყო ცვლადების წრფივიზაციის პროცედურის შესრულება ორივე ნაწილის ლოგარითმის აღებით);
გ) დემონსტრაციული;
დ) ტოლგვერდა ჰიპერბოლა (ასევე უნდა გაარკვიოთ, როგორ მოახდინო ამ მოდელის წინასწარ წრფივება).
2. შეაფასეთ თითოეული მოდელი საშუალო მიახლოების შეცდომით A და ფიშერის F ტესტის საშუალებით.

გამოსავალი (ვარიანტი #1)

y=a+b·x წრფივი რეგრესიის a და b პარამეტრების გამოსათვლელად (გამოთვლა შეიძლება მოხდეს კალკულატორის გამოყენებით).
ამოხსნათ ნორმალური განტოლებების სისტემა მაგრამდა ბ:
საწყის მონაცემებზე დაყრდნობით ვიანგარიშებთ ∑y, ∑x, ∑y x, ∑x², ∑y²:
x yx x2 y2 y xწ-ი xაი
68,8 45,1 3102,88 2034,01 4733,44 61,3 7,5 10,9
2 61,2 59,0 3610,80 3481,00 3745,44 56,5 4,7 7,7
3 59,9 57,2 3426,28 3271,84 3588,01 57,1 2,8 4,7
4 56,7 61,8 3504,06 3819,24 3214,89 55,5 1,2 2,1
5 55,0 58,8 3234,00 3457,44 3025,00 56,5 -1,5 2,7
6 54,3 47,2 2562,96 2227,84 2948,49 60,5 -6,2 11,4
7 49,3 55,2 2721,36 3047,04 2430,49 57,8 -8,5 17,2
სულ405,2 384,3 22162,34 21338,41 23685,76 405,2 0,0 56,7
ოთხ ღირებულება (სულ/ნ)57,89
54,90
x
3166,05
x წ
3048,34
3383,68
XX8,1
5,74 5,86 XXXXXX
s232,92 34,34 XXXXXX


a=y -b x = 57,89+0,35 54,9 ≈ 76,88

რეგრესიის განტოლება: y= 76,88 - 0,35X.საშუალო დღიური ხელფასის ზრდით 1 რუბლით. საკვები პროდუქტების შესყიდვაზე გაწეული ხარჯების წილი მცირდება საშუალოდ 0,35%-იანი პუნქტით.
გამოთვალეთ წყვილის კორელაციის წრფივი კოეფიციენტი:

კომუნიკაცია არის ზომიერი, საპირისპირო.
განვსაზღვროთ განსაზღვრის კოეფიციენტი: r² xy =(-0.35)=0.127
შედეგის 12.7%-იანი ცვალებადობა აიხსნება x ფაქტორის ცვალებადობით. ფაქტობრივი მნიშვნელობების ჩანაცვლება რეგრესიის განტოლებაში Xჩვენ განვსაზღვრავთ y x-ის თეორიულ (გამოთვლილ) მნიშვნელობებს. მოდით ვიპოვოთ საშუალო მიახლოების შეცდომის მნიშვნელობა A:

საშუალოდ, გამოთვლილი მნიშვნელობები 8,1%-ით გადახრის რეალურს.
მოდით გამოვთვალოთ F- კრიტერიუმი:

მიღებული მნიშვნელობა მიუთითებს H 0 ჰიპოთეზის მიღების აუცილებლობაზე გამოვლენილი დამოკიდებულების შემთხვევითი ხასიათისა და განტოლების პარამეტრების და კავშირის სიახლოვის ინდიკატორის სტატისტიკური უმნიშვნელოობის შესახებ.
1ბ. y=a x b სიმძლავრის მოდელის კონსტრუქციას წინ უძღვის ცვლადების წრფივიზაციის პროცედურა. მაგალითში, წრფივირება ხდება განტოლების ორივე მხარის ლოგარითმის აღებით:
lg y=lg a + b lg x
Y=C+b Y
სადაც Y=lg(y), X=lg(x), C=lg(a).

გამოთვლებისთვის ვიყენებთ ცხრილის მონაცემებს. 1.3.
ცხრილი 1.3

X YX Y2 x2 y xწ-ი x(y-yx)²აი
1 1,8376 1,6542 3,0398 3,3768 2,7364 61,0 7,8 60,8 11,3
2 1,7868 1,7709 3,1642 3,1927 3,1361 56,3 4,9 24,0 8,0
3 1,7774 1,7574 3,1236 3,1592 3,0885 56,8 3,1 9,6 5,2
4 1,7536 1,7910 3,1407 3,0751 3,2077 55,5 1,2 1,4 2,1
5 1,7404 1,7694 3,0795 3,0290 3,1308 56,3 -1,3 1,7 2,4
6 1,7348 1,6739 2,9039 3,0095 2,8019 60,2 -5,9 34,8 10,9
7 1,6928 1,7419 2,9487 2,8656 3,0342 57,4 -8,1 65,6 16,4
სულ12,3234 12,1587 21,4003 21,7078 21,1355 403,5 1,7 197,9 56,3
ნიშნავს1,7605 1,7370 3,0572 3,1011 3,0194 XX28,27 8,0
σ 0,0425 0,0484 XXXXXXX
σ20,0018 0,0023 XXXXXXX

გამოთვალეთ C და b:

C=Y -b X = 1.7605+0.298 1.7370 = 2.278126
ვიღებთ წრფივ განტოლებას: Y=2.278-0.298 X
მისი გაძლიერების შემდეგ მივიღებთ: y=10 2.278 x -0.298
ამ განტოლებაში ჩანაცვლება რეალური მნიშვნელობებით X,ჩვენ ვიღებთ შედეგის თეორიულ მნიშვნელობებს. მათზე დაყრდნობით ვიანგარიშებთ ინდიკატორებს: კავშირის სიმჭიდროვე - კორელაციის ინდექსი p xy და საშუალო მიახლოების შეცდომა A .

სიმძლავრის მოდელის მახასიათებლები მიუთითებს იმაზე, რომ ის გარკვეულწილად უკეთ აღწერს ურთიერთობას, ვიდრე ხაზოვანი ფუნქცია.

1ვ. ექსპონენციური მრუდის y \u003d a b x განტოლების კონსტრუქციას წინ უძღვის ცვლადების წრფივირების პროცედურა განტოლების ორივე ნაწილის ლოგარითმის აღებისას:
lg y=lg a + x lg b
Y=C+B x
გამოთვლებისთვის ვიყენებთ ცხრილის მონაცემებს.

x Yx Y2 x2y xწ-ი x(y-yx)²აი
1 1,8376 45,1 82,8758 3,3768 2034,01 60,7 8,1 65,61 11,8
2 1,7868 59,0 105,4212 3,1927 3481,00 56,4 4,8 23,04 7,8
3 1,7774 57,2 101,6673 3,1592 3271,84 56,9 3,0 9,00 5,0
4 1,7536 61,8 108,3725 3,0751 3819,24 55,5 1,2 1,44 2,1
5 1,7404 58,8 102,3355 3,0290 3457,44 56,4 -1,4 1,96 2,5
6 1,7348 47,2 81,8826 3,0095 2227,84 60,0 -5,7 32,49 10,5
7 1,6928 55,2 93,4426 2,8656 3047,04 57,5 -8,2 67,24 16,6
სულ12,3234 384,3 675,9974 21,7078 21338,41 403,4 -1,8 200,78 56,3
ოთხ zn.1,7605 54,9 96,5711 3,1011 3048,34 XX28,68 8,0
σ 0,0425 5,86 XXXXXXX
σ20,0018 34,339 XXXXXXX

რეგრესიის პარამეტრების მნიშვნელობები A და INშეადგინა:

A=Y -B x = 1.7605+0.0023 54.9 = 1.887
მიღებულია წრფივი განტოლება: Y=1,887-0,0023x. ჩვენ ვაძლიერებთ მიღებულ განტოლებას და ვწერთ მას ჩვეულებრივი ფორმით:
y x =10 1.887 10 -0.0023x = 77.1 0.9947 x
ჩვენ ვაფასებთ ურთიერთობის სიმჭიდროვეს კორელაციის ინდექსის p xy მეშვეობით:

3588,01 56,9 3,0 9,00 5,0 4 56,7 0,0162 0,9175 0,000262 3214,89 55,5 1,2 1,44 2,1 5 55 0,0170 0,9354 0,000289 3025,00 56,4 -1,4 1,96 2,5 6 54,3 0,0212 1,1504 0,000449 2948,49 60,8 -6,5 42,25 12,0 7 49,3 0,0181 0,8931 0,000328 2430,49 57,5 -8,2 67,24 16,6 სულ405,2 0,1291 7,5064 0,002413 23685,76 405,2 0,0 194,90 56,5 ნიშნავს57,9 0,0184 1,0723 0,000345 3383,68 XX27,84 8,1 σ 5,74 0,002145 XXXXXXX σ232,9476 0,000005 XX

რეგრესიული ანალიზი არის სტატისტიკური კვლევის მეთოდი, რომელიც საშუალებას გაძლევთ აჩვენოთ პარამეტრის დამოკიდებულება ერთ ან რამდენიმე დამოუკიდებელ ცვლადზე. კომპიუტერამდელ ეპოქაში მისი გამოყენება საკმაოდ რთული იყო, განსაკუთრებით მაშინ, როცა საქმე დიდი მოცულობის მონაცემებს ეხებოდა. დღეს, როდესაც ისწავლეთ თუ როგორ უნდა შექმნათ რეგრესია Excel-ში, შეგიძლიათ გადაჭრათ რთული სტატისტიკური პრობლემები სულ რამდენიმე წუთში. ქვემოთ მოცემულია კონკრეტული მაგალითები ეკონომიკის სფეროდან.

რეგრესიის სახეები

თავად კონცეფცია მათემატიკაში 1886 წელს შევიდა. რეგრესია ხდება:

  • ხაზოვანი;
  • პარაბოლური;
  • ძალა;
  • ექსპონენციალური;
  • ჰიპერბოლური;
  • დემონსტრაციული;
  • ლოგარითმული.

მაგალითი 1

განვიხილოთ პენსიაზე გასული გუნდის წევრების რაოდენობის დამოკიდებულების განსაზღვრის პრობლემა 6 სამრეწველო საწარმოს საშუალო ხელფასზე.

Დავალება. ექვს საწარმოში გავაანალიზეთ საშუალო თვიური ხელფასი და საკუთარი სურვილით წასული თანამშრომლების რაოდენობა. ცხრილის სახით გვაქვს:

წასული ხალხის რაოდენობა

ხელფასი

30000 რუბლი

35000 რუბლი

40000 რუბლი

45000 რუბლი

50000 რუბლი

55000 რუბლი

60000 რუბლი

6 საწარმოში პენსიაზე გასული მუშაკების რაოდენობის დამოკიდებულების საშუალო ხელფასზე დამოკიდებულების დასადგენად, რეგრესიის მოდელს აქვს განტოლების ფორმა Y = a 0 + a 1 x 1 +…+akxk, სადაც xi არის გავლენიანი ცვლადები. , ai არის რეგრესიის კოეფიციენტები, ak არის ფაქტორების რაოდენობა.

ამ ამოცანისთვის Y არის წასული თანამშრომლების მაჩვენებელი, ხოლო გავლენის ფაქტორი არის ხელფასი, რომელსაც X-ით აღვნიშნავთ.

ელცხრილის "Excel" შესაძლებლობების გამოყენება

Excel-ში რეგრესიის ანალიზს წინ უნდა უძღოდეს ჩაშენებული ფუნქციების გამოყენება ხელმისაწვდომი ცხრილის მონაცემებზე. თუმცა, ამ მიზნებისთვის უმჯობესია გამოიყენოთ ძალიან სასარგებლო დანამატი "ანალიზის ინსტრუმენტარიუმი". მის გასააქტიურებლად გჭირდებათ:

  • "ფაილი" ჩანართიდან გადადით "პარამეტრები" განყოფილებაში;
  • ფანჯარაში, რომელიც იხსნება, აირჩიეთ ხაზი "დამატებები";
  • დააჭირეთ ღილაკს "გადასვლა", რომელიც მდებარეობს ბოლოში, "მართვის" ხაზის მარჯვნივ;
  • შეამოწმეთ ყუთი სახელის გვერდით "ანალიზის პაკეტი" და დაადასტურეთ თქვენი ქმედებები "OK" დაწკაპუნებით.

თუ ყველაფერი სწორად გაკეთდა, სასურველი ღილაკი გამოჩნდება მონაცემთა ჩანართის მარჯვენა მხარეს, რომელიც მდებარეობს Excel-ის სამუშაო ფურცლის ზემოთ.

Excel-ში

ახლა, როცა ხელთ გვაქვს ყველა საჭირო ვირტუალური ინსტრუმენტი ეკონომეტრიული გამოთვლების შესასრულებლად, შეგვიძლია დავიწყოთ ჩვენი პრობლემის გადაჭრა. Ამისთვის:

  • დააჭირეთ ღილაკს "მონაცემთა ანალიზი";
  • ფანჯარაში, რომელიც იხსნება, დააჭირეთ ღილაკს "რეგრესია";
  • ჩანართში, რომელიც გამოჩნდება, შეიყვანეთ მნიშვნელობების დიაპაზონი Y-სთვის (თანამშრომლების რაოდენობა, რომლებმაც დატოვეს სამსახური) და X-სთვის (მათი ხელფასები);
  • ჩვენ ვადასტურებთ ჩვენს ქმედებებს ღილაკზე "Ok" დაჭერით.

შედეგად, პროგრამა ავტომატურად შეავსებს ცხრილის ახალ ფურცელს რეგრესიული ანალიზის მონაცემებით. Შენიშვნა! Excel-ს აქვს შესაძლებლობა ხელით დააყენოს თქვენთვის სასურველი მდებარეობა ამ მიზნით. მაგალითად, ეს შეიძლება იყოს იგივე ფურცელი, სადაც არის Y და X მნიშვნელობები, ან თუნდაც ახალი სამუშაო წიგნი, რომელიც სპეციალურად შექმნილია ასეთი მონაცემების შესანახად.

რეგრესიის შედეგების ანალიზი R-კვადრატისთვის

Excel-ში, განხილული მაგალითის მონაცემების დამუშავებისას მიღებული მონაცემები ასე გამოიყურება:

უპირველეს ყოვლისა, ყურადღება უნდა მიაქციოთ R-კვადრატის მნიშვნელობას. ეს არის განსაზღვრის კოეფიციენტი. ამ მაგალითში R-კვადრატი = 0,755 (75,5%), ანუ მოდელის გამოთვლილი პარამეტრები ხსნის 75,5%-ით განხილულ პარამეტრებს შორის ურთიერთობას. რაც უფრო მაღალია განსაზღვრის კოეფიციენტის მნიშვნელობა, მით უფრო გამოსადეგია არჩეული მოდელი კონკრეტული ამოცანისთვის. ითვლება, რომ ის სწორად აღწერს რეალურ სიტუაციას R-კვადრატის მნიშვნელობით 0.8-ზე მეტი. თუ R-კვადრატი<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

თანაფარდობის ანალიზი

რიცხვი 64.1428 გვიჩვენებს, თუ რა იქნება Y-ის მნიშვნელობა, თუ ჩვენ განხილულ მოდელში ყველა xi ცვლადი დაყენებულია ნულზე. სხვა სიტყვებით რომ ვთქვათ, შეიძლება ითქვას, რომ გაანალიზებული პარამეტრის მნიშვნელობაზე გავლენას ახდენს სხვა ფაქტორებიც, რომლებიც არ არის აღწერილი კონკრეტულ მოდელში.

შემდეგი კოეფიციენტი -0,16285, რომელიც მდებარეობს B18 უჯრედში, აჩვენებს X ცვლადის გავლენის წონას Y-ზე. ეს ნიშნავს, რომ თანამშრომლების საშუალო თვიური ხელფასი განსახილველ მოდელში გავლენას ახდენს თანამშრომელთა რაოდენობაზე, რომელთა წონაა -0,16285, ე.ი. მისი გავლენის ხარისხი სულ მცირე. ნიშანი "-" მიუთითებს, რომ კოეფიციენტს აქვს უარყოფითი მნიშვნელობა. ეს აშკარაა, რადგან ყველამ იცის, რომ რაც უფრო მაღალია ხელფასი საწარმოში, მით უფრო ნაკლები ადამიანი გამოთქვამს სურვილს შეწყვიტოს სამუშაო ხელშეკრულება ან დატოვოს სამსახური.

მრავალჯერადი რეგრესია

ეს ტერმინი ეხება კავშირის განტოლებას ფორმის რამდენიმე დამოუკიდებელი ცვლადით:

y \u003d f (x 1 + x 2 + ... x m) + ε, სადაც y არის ეფექტური მახასიათებელი (დამოკიდებული ცვლადი) და x 1, x 2, ... x m არის ფაქტორების ფაქტორები (დამოუკიდებელი ცვლადები).

პარამეტრის შეფასება

მრავალჯერადი რეგრესიისთვის (MR) იგი ხორციელდება უმცირესი კვადრატების მეთოდით (OLS). Y = a + b 1 x 1 +…+b m x m + ε ფორმის წრფივი განტოლებისთვის, ჩვენ ვაშენებთ ნორმალური განტოლებათა სისტემას (იხ. ქვემოთ)

მეთოდის პრინციპის გასაგებად, განიხილეთ ორფაქტორიანი შემთხვევა. შემდეგ გვაქვს ფორმულით აღწერილი სიტუაცია

აქედან ვიღებთ:

სადაც σ არის ინდექსში ასახული შესაბამისი მახასიათებლის სხვაობა.

LSM გამოიყენება MP განტოლებისთვის სტანდარტიზირებადი მასშტაბით. ამ შემთხვევაში ვიღებთ განტოლებას:

სადაც t y , t x 1, ... t xm არის სტანდარტიზებული ცვლადები, რომლებისთვისაც საშუალო მნიშვნელობები არის 0; β i არის სტანდარტიზებული რეგრესიის კოეფიციენტები და სტანდარტული გადახრა არის 1.

გთხოვთ გაითვალისწინოთ, რომ ყველა β i ამ შემთხვევაში დაყენებულია როგორც ნორმალიზებული და ცენტრალიზებული, ამიტომ მათი ერთმანეთთან შედარება სწორად და დასაშვებად ითვლება. გარდა ამისა, ჩვეულებრივ ხდება ფაქტორების გაფილტვრა, უგულებელყოფთ მათ, ვისაც β-ის ყველაზე მცირე მნიშვნელობები აქვს.

პრობლემა ხაზოვანი რეგრესიის განტოლების გამოყენებით

დავუშვათ, არის მოცემული N პროდუქტის ფასის დინამიკის ცხრილი ბოლო 8 თვის განმავლობაში. აუცილებელია გადაწყვეტილების მიღება მისი პარტია 1850 რუბლი/ტ ფასში შეძენის მიზანშეწონილობის შესახებ.

თვის ნომერი

თვის სახელი

ნივთის ფასი N

1750 რუბლი ტონაზე

1755 რუბლი ტონაზე

1767 რუბლი ტონაზე

1760 რუბლი ტონაზე

1770 რუბლი ტონაზე

1790 რუბლი ტონაზე

1810 რუბლი ტონაზე

1840 რუბლი ტონაზე

Excel-ის ცხრილებში ამ პრობლემის გადასაჭრელად, თქვენ უნდა გამოიყენოთ ზემოთ მოყვანილი მაგალითიდან უკვე ცნობილი მონაცემთა ანალიზის ინსტრუმენტი. შემდეგი, აირჩიეთ "რეგრესია" განყოფილება და დააყენეთ პარამეტრები. უნდა გვახსოვდეს, რომ "შეყვანის Y ინტერვალის" ველში უნდა შეიყვანოთ დამოკიდებული ცვლადის მნიშვნელობების დიაპაზონი (ამ შემთხვევაში, პროდუქტის ფასი წელიწადის კონკრეტულ თვეებში), ხოლო "შეყვანა" X ინტერვალი“ - დამოუკიდებელი ცვლადისთვის (თვე ნომერი). დაადასტურეთ მოქმედება "OK" დაწკაპუნებით. ახალ ფურცელზე (თუ ასე იყო მითითებული), ვიღებთ მონაცემებს რეგრესიისთვის.

მათზე დაყრდნობით ვაშენებთ y=ax+b ფორმის წრფივ განტოლებას, სადაც a და b პარამეტრები არის მწკრივის კოეფიციენტები თვის რიცხვის სახელით და კოეფიციენტები და „Y-გადაკვეთის“ მწკრივი. ფურცელი რეგრესიული ანალიზის შედეგებით. ამრიგად, წრფივი რეგრესიის განტოლება (LE) 3 პრობლემისთვის იწერება როგორც:

პროდუქტის ფასი N = 11.714* თვის ნომერი + 1727.54.

ან ალგებრული აღნიშვნით

y = 11,714 x + 1727,54

შედეგების ანალიზი

იმის გადასაწყვეტად, არის თუ არა მიღებული წრფივი რეგრესიის განტოლება ადეკვატური, გამოიყენება მრავალჯერადი კორელაციის კოეფიციენტები (MCC) და განსაზღვრის კოეფიციენტები, ასევე ფიშერის ტესტი და სტუდენტის ტესტი. Excel-ის ცხრილში რეგრესიის შედეგებით, ისინი გამოჩნდება მრავალი R, R-კვადრატის, F-სტატისტიკის და t-სტატისტიკის სახელებით, შესაბამისად.

KMC R შესაძლებელს ხდის შეფასდეს დამოუკიდებელ და დამოკიდებულ ცვლადებს შორის ალბათური ურთიერთობის სიმჭიდროვე. მისი მაღალი ღირებულება მიუთითებს საკმაოდ ძლიერ კავშირზე ცვლადებს შორის "თვიანი რაოდენობა" და "საქონლის ფასი N რუბლებში 1 ტონაზე". თუმცა, ამ ურთიერთობის ბუნება უცნობია.

განსაზღვრის კოეფიციენტის კვადრატი R 2 (RI) არის ჯამური გაფანტვის წილის რიცხვითი მახასიათებელი და აჩვენებს ექსპერიმენტული მონაცემების რომელი ნაწილის გაფანტვას, ე.ი. დამოკიდებული ცვლადის მნიშვნელობები შეესაბამება წრფივი რეგრესიის განტოლებას. განსახილველ პრობლემაში ეს მნიშვნელობა უდრის 84,8%-ს, ანუ სტატისტიკური მონაცემები მაღალი სიზუსტით არის აღწერილი მიღებული SD-ით.

F- სტატისტიკა, რომელსაც ასევე უწოდებენ ფიშერის ტესტს, გამოიყენება ხაზოვანი ურთიერთობის მნიშვნელოვნების შესაფასებლად, მისი არსებობის ჰიპოთეზის გასაუქმებლად ან დასადასტურებლად.

(მოსწავლის კრიტერიუმი) ხელს უწყობს კოეფიციენტის მნიშვნელოვნების შეფასებას წრფივი ურთიერთობის უცნობი ან თავისუფალი წევრით. თუ t-კრიტერიუმის მნიშვნელობა > t cr, მაშინ წრფივი განტოლების თავისუფალი წევრის უმნიშვნელოობის ჰიპოთეზა უარყოფილია.

თავისუფალი წევრის განხილულ პრობლემაში, Excel-ის ინსტრუმენტების გამოყენებით, მიიღეს, რომ t = 169.20903 და p = 2.89E-12, ანუ გვაქვს ნულოვანი ალბათობა იმისა, რომ სწორი ჰიპოთეზა თავისუფალი წევრის უმნიშვნელოობის შესახებ იქნება. იყოს უარყოფილი. კოეფიციენტისთვის უცნობი t=5.79405 და p=0.001158. სხვა სიტყვებით რომ ვთქვათ, ალბათობა იმისა, რომ უცნობისთვის კოეფიციენტის უმნიშვნელოობის შესახებ სწორი ჰიპოთეზა უარყოფილი იქნება არის 0,12%.

ამრიგად, შეიძლება ითქვას, რომ მიღებული წრფივი რეგრესიის განტოლება ადეკვატურია.

აქციების ბლოკის ყიდვის მიზანშეწონილობის პრობლემა

Excel-ში მრავალჯერადი რეგრესია ხორციელდება იგივე მონაცემთა ანალიზის ხელსაწყოს გამოყენებით. განიხილეთ კონკრეტული გამოყენებული პრობლემა.

NNN-ის ხელმძღვანელობამ უნდა მიიღოს გადაწყვეტილება MMM SA-ში 20%-იანი წილის შეძენის მიზანშეწონილობის შესახებ. პაკეტის (JV) ღირებულება 70 მილიონი აშშ დოლარია. NNN-ის სპეციალისტებმა შეაგროვეს მონაცემები მსგავსი ტრანზაქციების შესახებ. გადაწყდა აქციების ბლოკის ღირებულების შეფასება ისეთი პარამეტრების მიხედვით, გამოხატული მილიონ აშშ დოლარებში, როგორიცაა:

  • გადასახდელები (VK);
  • წლიური ბრუნვა (VO);
  • დებიტორული ანგარიშები (VD);
  • ძირითადი საშუალებების ღირებულება (SOF).

გარდა ამისა, გამოიყენება საწარმოს სახელფასო დავალიანების პარამეტრი (V3 P) ათასობით აშშ დოლარში.

გამოსავალი Excel-ის ცხრილის გამოყენებით

უპირველეს ყოვლისა, თქვენ უნდა შექმნათ საწყისი მონაცემების ცხრილი. ეს ასე გამოიყურება:

  • დარეკეთ "მონაცემთა ანალიზის" ფანჯარაში;
  • აირჩიეთ განყოფილება "რეგრესია";
  • ველში "შეყვანის ინტერვალი Y" შეიყვანეთ დამოკიდებული ცვლადების მნიშვნელობების დიაპაზონი G სვეტიდან;
  • დააწკაპუნეთ ხატულაზე წითელი ისრით "შეყვანის ინტერვალი X" ფანჯრის მარჯვნივ და აირჩიეთ ყველა მნიშვნელობის დიაპაზონი სვეტებიდან B, C, D, F ფურცელზე.

აირჩიეთ "ახალი სამუშაო ფურცელი" და დააჭირეთ "OK".

მიიღეთ რეგრესიული ანალიზი მოცემული პრობლემისთვის.

შედეგების და დასკვნების შემოწმება

„ჩვენ ვაგროვებთ“ Excel-ის ცხრილების ფურცელზე ზემოთ წარმოდგენილი მომრგვალებული მონაცემებიდან, რეგრესიის განტოლება:

SP \u003d 0,103 * SOF + 0,541 * VO - 0,031 * VK + 0,405 * VD + 0,691 * VZP - 265,844.

უფრო ნაცნობი მათემატიკური ფორმით, ის შეიძლება დაიწეროს როგორც:

y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

სს „მმმ“-ის მონაცემები წარმოდგენილია ცხრილში:

მათი ჩანაცვლებით რეგრესიის განტოლებაში, ისინი იღებენ ციფრს 64,72 მილიონი აშშ დოლარი. ეს ნიშნავს, რომ სს MMM-ის აქციები არ უნდა იყოს შეძენილი, რადგან მათი 70 მილიონი აშშ დოლარის ღირებულება საკმაოდ გადაჭარბებულია.

როგორც ხედავთ, Excel-ის ცხრილების და რეგრესიის განტოლების გამოყენებამ შესაძლებელი გახადა ინფორმირებული გადაწყვეტილების მიღება ძალიან კონკრეტული ტრანზაქციის მიზანშეწონილობის შესახებ.

ახლა თქვენ იცით, რა არის რეგრესია. Excel-ში ზემოთ განხილული მაგალითები დაგეხმარებათ გადაჭრათ პრაქტიკული პრობლემები ეკონომეტრიის სფეროდან.