უმცირესი კვადრატების ტრადიციული მეთოდი. მინიმალური კვადრატის მეთოდი

მას აქვს მრავალი პროგრამა, რადგან ის იძლევა მოცემული ფუნქციის მიახლოებით წარმოდგენას სხვა უფრო მარტივი ფუნქციებით. LSM შეიძლება იყოს ძალიან სასარგებლო დაკვირვებების დამუშავებისას და ის აქტიურად გამოიყენება ზოგიერთი სიდიდის შესაფასებლად სხვათა გაზომვის შედეგებიდან, რომლებიც შეიცავს შემთხვევით შეცდომებს. ამ სტატიაში თქვენ შეისწავლით თუ როგორ უნდა განახორციელოთ მინიმალური კვადრატების გამოთვლები Excel-ში.

პრობლემის განცხადება კონკრეტულ მაგალითზე

დავუშვათ, რომ არსებობს ორი ინდიკატორი X და Y. უფრო მეტიც, Y დამოკიდებულია X-ზე. ვინაიდან OLS ჩვენთვის საინტერესოა რეგრესიული ანალიზის თვალსაზრისით (ექსელში მისი მეთოდები დანერგილია ჩაშენებული ფუნქციების გამოყენებით), დაუყოვნებლივ უნდა გავაგრძელოთ განიხილოს კონკრეტული პრობლემა.

ასე რომ, მოდით X იყოს სასურსათო მაღაზიის გასაყიდი ფართობი, რომელიც იზომება კვადრატულ მეტრებში, ხოლო Y იყოს წლიური ბრუნვა, რომელიც განისაზღვრება მილიონ რუბლში.

საჭიროა პროგნოზის გაკეთება, თუ რა ბრუნვა (Y) ექნება მაღაზიას, თუ მას აქვს ამა თუ იმ საცალო ფართი. ცხადია, ფუნქცია Y = f (X) იზრდება, ვინაიდან ჰიპერმარკეტი უფრო მეტ საქონელს ყიდის, ვიდრე სადგომი.

რამდენიმე სიტყვა წინასწარმეტყველებისთვის გამოყენებული საწყისი მონაცემების სისწორის შესახებ

ვთქვათ, გვაქვს n მაღაზიის მონაცემებით აგებული ცხრილი.

მათემატიკური სტატისტიკის მიხედვით, შედეგები მეტ-ნაკლებად სწორი იქნება, თუკი მინიმუმ 5-6 ობიექტის მონაცემები შეისწავლება. ასევე, „ანომალიური“ შედეგების გამოყენება შეუძლებელია. კერძოდ, ელიტარულ პატარა ბუტიკს შეიძლება ჰქონდეს მრავალჯერ მეტი ბრუნვა, ვიდრე "მასმარკეტის" კლასის მსხვილი მაღაზიების ბრუნვა.

მეთოდის არსი

ცხრილის მონაცემები შეიძლება გამოისახოს დეკარტის სიბრტყეზე, როგორც წერტილები M 1 (x 1, y 1), ... M n (x n, y n). ახლა ამოცანის ამოხსნა დაიყვანება y = f (x) მიახლოებითი ფუნქციის არჩევით, რომელსაც აქვს გრაფიკი რაც შეიძლება ახლოს გადის M 1, M 2, .. M n წერტილებთან.

რა თქმა უნდა, შეგიძლიათ გამოიყენოთ მაღალი ხარისხის პოლინომი, მაგრამ ეს ვარიანტი არა მხოლოდ რთული განსახორციელებელია, არამედ უბრალოდ არასწორია, რადგან ის არ ასახავს მთავარ ტენდენციას, რომელიც უნდა გამოვლინდეს. ყველაზე გონივრული გამოსავალი არის სწორი ხაზის ძიება y = ax + b, რომელიც საუკეთესოდ აახლოებს ექსპერიმენტულ მონაცემებს და უფრო ზუსტად, კოეფიციენტებს - a და b.

სიზუსტის ქულა

ნებისმიერი მიახლოებისთვის განსაკუთრებული მნიშვნელობა აქვს მისი სიზუსტის შეფასებას. e i-ით აღნიშნეთ განსხვავება (გადახრა) ფუნქციურ და ექსპერიმენტულ მნიშვნელობებს შორის x i წერტილისთვის, ანუ e i = y i - f (x i).

ცხადია, მიახლოების სიზუსტის შესაფასებლად, შეგიძლიათ გამოიყენოთ გადახრების ჯამი, ანუ სწორი ხაზის არჩევისას X-ის დამოკიდებულების მიახლოებითი წარმოდგენისთვის Y-ზე უპირატესობა უნდა მიენიჭოს მას, რომელსაც აქვს ყველაზე მცირე მნიშვნელობა. ჯამი e i ყველა განხილულ პუნქტში. თუმცა, ყველაფერი ასე მარტივი არ არის, რადგან დადებით გადახრებთან ერთად, პრაქტიკულად იქნება უარყოფითიც.

პრობლემის გადაჭრა შეგიძლიათ გადახრის მოდულების ან მათი კვადრატების გამოყენებით. ეს უკანასკნელი მეთოდი ყველაზე ფართოდ გამოიყენება. იგი გამოიყენება ბევრ სფეროში, მათ შორის რეგრესიული ანალიზის ჩათვლით (Excel-ში მისი განხორციელება ხორციელდება ორი ჩაშენებული ფუნქციის გამოყენებით) და დიდი ხანია დადასტურებულია, რომ ეფექტურია.

მინიმალური კვადრატის მეთოდი

Excel-ში, როგორც მოგეხსენებათ, არის ჩაშენებული autosum ფუნქცია, რომელიც საშუალებას გაძლევთ გამოთვალოთ არჩეულ დიაპაზონში მდებარე ყველა მნიშვნელობის მნიშვნელობები. ამგვარად, არაფერი შეგვიშლის ხელს გამოთვლაში გამოხატვის მნიშვნელობის გამოთვლაში (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

მათემატიკური აღნიშვნით, ეს ასე გამოიყურება:

მას შემდეგ, რაც თავდაპირველად გადაწყვეტილება მიიღეს მიახლოებით სწორი ხაზის გამოყენებით, ჩვენ გვაქვს:

ამრიგად, სწორი ხაზის პოვნის ამოცანა, რომელიც საუკეთესოდ აღწერს კონკრეტულ ურთიერთობას X და Y-ს შორის, შეადგენს ორი ცვლადის ფუნქციის მინიმუმის გამოთვლას:

ეს მოითხოვს ნულოვანი ნაწილობრივი წარმოებულების გათანაბრებას ახალ a და b ცვლადებთან მიმართებაში და პრიმიტიული სისტემის ამოხსნას, რომელიც შედგება ორი განტოლებისგან, ფორმის 2 უცნობით:

მარტივი გარდაქმნების შემდეგ, 2-ზე გაყოფის და ჯამებით მანიპულირების ჩათვლით, მივიღებთ:

მისი ამოხსნით, მაგალითად, კრამერის მეთოდით, ვიღებთ სტაციონარულ წერტილს გარკვეული კოეფიციენტებით a * და b * . ეს არის მინიმალური, ანუ იმის პროგნოზირებისთვის, თუ რა ბრუნვა ექნება მაღაზიას გარკვეულ ფართობზე, შესაფერისია სწორი ხაზი y = a * x + b *, რომელიც არის რეგრესიის მოდელი მოცემული მაგალითისთვის. რა თქმა უნდა, ეს არ მოგცემთ საშუალებას იპოვოთ ზუსტი შედეგი, მაგრამ ეს დაგეხმარებათ გაიგოთ, გადაიხდება თუ არა მაღაზიის კრედიტით ყიდვა კონკრეტული ზონისთვის.

როგორ განვახორციელოთ ყველაზე მცირე კვადრატების მეთოდი Excel-ში

Excel-ს აქვს უმცირესი კვადრატების მნიშვნელობის გამოსათვლელი ფუნქცია. მას აქვს შემდეგი ფორმა: TREND (ცნობილი Y მნიშვნელობები; ცნობილი X მნიშვნელობები; ახალი X მნიშვნელობები; მუდმივი). მოდით გამოვიყენოთ Excel-ში OLS-ის გამოთვლის ფორმულა ჩვენს ცხრილში.

ამისათვის, იმ უჯრედში, რომელშიც უნდა იყოს ნაჩვენები გაანგარიშების შედეგი Excel-ში უმცირესი კვადრატების მეთოდით, შეიყვანეთ ნიშანი "=" და აირჩიეთ "TREND" ფუნქცია. ფანჯარაში, რომელიც იხსნება, შეავსეთ შესაბამისი ველები, მონიშნეთ:

  • ცნობილი მნიშვნელობების დიაპაზონი Y-სთვის (ამ შემთხვევაში მონაცემები ბრუნვისთვის);
  • დიაპაზონი x 1, …x n, ანუ საცალო ფართის ზომა;
  • და x-ის ცნობილი და უცნობი მნიშვნელობები, რისთვისაც თქვენ უნდა გაარკვიოთ ბრუნვის ზომა (სამუშაო ფურცელზე მათი მდებარეობის შესახებ ინფორმაციისთვის იხილეთ ქვემოთ).

გარდა ამისა, ფორმულაში არის ლოგიკური ცვლადი "Const". თუ მის შესაბამის ველში შეიყვანთ 1, მაშინ ეს ნიშნავს, რომ გამოთვლები უნდა განხორციელდეს, თუ ვივარაუდებთ, რომ b \u003d 0.

თუ საჭიროა იცოდეთ პროგნოზი ერთზე მეტი x მნიშვნელობისთვის, მაშინ ფორმულის შეყვანის შემდეგ არ უნდა დააჭიროთ "Enter", არამედ უნდა აკრიფოთ კომბინაცია "Shift" + "Control" + "Enter" ("Enter" ) კლავიატურაზე.

ზოგიერთი მახასიათებელი

რეგრესიის ანალიზი შეიძლება ხელმისაწვდომი იყოს დუმებისთვისაც კი. Excel-ის ფორმულა უცნობი ცვლადების მასივის მნიშვნელობის პროგნოზირებისთვის - "TREND" - შეიძლება გამოიყენონ მათაც, ვისაც არასოდეს სმენია უმცირესი კვადრატების მეთოდის შესახებ. საკმარისია მხოლოდ მისი მუშაობის ზოგიერთი მახასიათებლის ცოდნა. Კერძოდ:

  • თუ თქვენ აწყობთ y ცვლადის ცნობილი მნიშვნელობების დიაპაზონს ერთ რიგში ან სვეტში, მაშინ თითოეული მწკრივი (სვეტი) x-ის ცნობილი მნიშვნელობებით აღიქმება პროგრამის მიერ, როგორც ცალკე ცვლადი.
  • თუ დიაპაზონი ცნობილი x-ით არ არის მითითებული TREND ფანჯარაში, მაშინ Excel-ში ფუნქციის გამოყენების შემთხვევაში, პროგრამა განიხილავს მას, როგორც მთელი რიცხვებისგან შემდგარ მასივს, რომელთა რიცხვი შეესაბამება დიაპაზონს მოცემული მნიშვნელობებით . ცვლადის y.
  • "პროგნოზირებადი" მნიშვნელობების მასივის გამოსატანად, ტენდენციის გამოხატულება უნდა იყოს შეყვანილი, როგორც მასივის ფორმულა.
  • თუ ახალი x მნიშვნელობები არ არის მითითებული, მაშინ TREND ფუნქცია მათ ცნობილთა ტოლად მიიჩნევს. თუ ისინი არ არის მითითებული, მაშინ მასივი 1 მიიღება არგუმენტად; 2; 3; 4;…, რომელიც შეესაბამება დიაპაზონს უკვე მოცემული პარამეტრებით y.
  • დიაპაზონი, რომელიც შეიცავს ახალ x მნიშვნელობებს, უნდა ჰქონდეს იგივე ან მეტი მწკრივი ან სვეტი, როგორც დიაპაზონი მოცემული y მნიშვნელობებით. სხვა სიტყვებით რომ ვთქვათ, ის უნდა იყოს პროპორციული დამოუკიდებელი ცვლადების მიმართ.
  • მასივი ცნობილი x მნიშვნელობებით შეიძლება შეიცავდეს მრავალ ცვლადს. თუმცა, თუ ჩვენ ვსაუბრობთ მხოლოდ ერთზე, მაშინ საჭიროა, რომ დიაპაზონი x და y მოცემული მნიშვნელობებით იყოს თანაზომიერი. რამდენიმე ცვლადის შემთხვევაში, აუცილებელია, რომ დიაპაზონი მოცემული y მნიშვნელობებით მოთავსდეს ერთ სვეტში ან ერთ რიგში.

FORECAST ფუნქცია

იგი ხორციელდება რამდენიმე ფუნქციის გამოყენებით. ერთ-ერთ მათგანს "პროგნოზირება" ჰქვია. ის TREND-ის მსგავსია, ანუ იძლევა გამოთვლების შედეგს უმცირესი კვადრატების მეთოდით. თუმცა, მხოლოდ ერთი X-ისთვის, რომლისთვისაც Y-ის მნიშვნელობა უცნობია.

ახლა თქვენ იცით ექსელის ფორმულები დუმებისთვის, რომლებიც საშუალებას გაძლევთ იწინასწარმეტყველოთ ინდიკატორის მომავალი მნიშვნელობის მნიშვნელობა წრფივი ტენდენციის მიხედვით.

ექსპერიმენტული მონაცემების დაახლოება არის მეთოდი, რომელიც დაფუძნებულია ექსპერიმენტულად მიღებული მონაცემების ჩანაცვლებაზე ანალიტიკური ფუნქციით, რომელიც ყველაზე ახლოს გადის ან ემთხვევა კვანძების წერტილებში საწყის მნიშვნელობებს (ცდის ან ექსპერიმენტის დროს მიღებული მონაცემები). ამჟამად ანალიტიკური ფუნქციის განსაზღვრის ორი გზა არსებობს:

n-ხარისხიანი ინტერპოლაციის მრავალწევრის აგებით, რომელიც გადის პირდაპირ ყველა პუნქტითმოცემული მონაცემთა მასივი. ამ შემთხვევაში, მიახლოებითი ფუნქცია წარმოდგენილია როგორც: ინტერპოლაციის პოლინომი ლაგრანგის ფორმით ან ინტერპოლაციის პოლინომი ნიუტონის ფორმით.

n-ხარისხის მიახლოებითი მრავალწევრის აგებით, რომელიც გადის წერტილებთან ახლოსმოცემული მონაცემთა მასივიდან. ამრიგად, მიახლოებითი ფუნქცია არბილებს ყველა შემთხვევით ხმაურს (ან შეცდომებს), რომლებიც შეიძლება წარმოიშვას ექსპერიმენტის დროს: ექსპერიმენტის დროს გაზომილი მნიშვნელობები დამოკიდებულია შემთხვევით ფაქტორებზე, რომლებიც მერყეობენ საკუთარი შემთხვევითი კანონების მიხედვით (გაზომვის ან ინსტრუმენტის შეცდომები, უზუსტობა ან ექსპერიმენტული შეცდომები). ამ შემთხვევაში მიახლოების ფუნქცია განისაზღვრება უმცირესი კვადრატების მეთოდით.

მინიმალური კვადრატის მეთოდი(ინგლისურ ლიტერატურაში Ordinary Least Squares, OLS) არის მათემატიკური მეთოდი, რომელიც დაფუძნებულია მიახლოებითი ფუნქციის განსაზღვრაზე, რომელიც აგებულია ექსპერიმენტული მონაცემების მოცემული მასივის წერტილებთან ყველაზე ახლოს. საწყისი და მიახლოებითი ფუნქციების F(x) სიახლოვე განისაზღვრება რიცხვითი საზომით, კერძოდ: ექსპერიმენტული მონაცემების კვადრატული გადახრების ჯამი მიახლოებითი მრუდიდან F(x) უნდა იყოს ყველაზე მცირე.

დამაგრების მრუდი აგებულია უმცირესი კვადრატების მეთოდით

ყველაზე მცირე კვადრატების მეთოდი გამოიყენება:

ზედმეტად განსაზღვრული განტოლებათა სისტემების ამოხსნა, როცა განტოლებათა რაოდენობა აჭარბებს უცნობის რაოდენობას;

ამოხსნის ძიება განტოლებათა ჩვეულებრივი (არა ზედმეტად განსაზღვრული) არაწრფივი სისტემების შემთხვევაში;

პუნქტების მნიშვნელობების მიახლოებისთვის რაიმე მიახლოებითი ფუნქციით.

უმცირესი კვადრატების მეთოდით მიახლოების ფუნქცია განისაზღვრება ექსპერიმენტული მონაცემების მოცემული მასივიდან გამოთვლილი მიახლოებითი ფუნქციის კვადრატული გადახრების მინიმალური ჯამის პირობიდან. უმცირესი კვადრატების მეთოდის ეს კრიტერიუმი იწერება შემდეგი გამოთქმის სახით:

გამოთვლილი მიახლოებითი ფუნქციის მნიშვნელობები კვანძოვან წერტილებში,

ექსპერიმენტული მონაცემების განსაზღვრული მასივი კვანძოვან წერტილებზე.

კვადრატულ კრიტერიუმს აქვს მრავალი „კარგი“ თვისება, როგორიცაა დიფერენციალურობა, რომელიც უზრუნველყოფს მიახლოების პრობლემის უნიკალურ გადაწყვეტას პოლინომიური მიახლოებითი ფუნქციებით.

ამოცანის პირობებიდან გამომდინარე, მიახლოებითი ფუნქცია არის m ხარისხის მრავალწევრი

მიახლოებითი ფუნქციის ხარისხი არ არის დამოკიდებული კვანძოვანი წერტილების რაოდენობაზე, მაგრამ მისი განზომილება ყოველთვის უნდა იყოს ექსპერიმენტული მონაცემების მოცემული მასივის განზომილებაზე (პუნქტების რაოდენობაზე) ნაკლები.

∙ თუ მიახლოებითი ფუნქციის ხარისხი არის m=1, მაშინ ცხრილის ფუნქციას მივაახლოებთ სწორი ხაზით (წრფივი რეგრესია).

∙ თუ მიახლოებითი ფუნქციის ხარისხი არის m=2, მაშინ ცხრილის ფუნქციას ვაახლოებთ კვადრატული პარაბოლით (კვადრატული მიახლოება).

∙ თუ მიახლოებითი ფუნქციის ხარისხი არის m=3, მაშინ ცხრილის ფუნქციას ვაახლოებთ კუბურ პარაბოლას (კუბური მიახლოება).

ზოგად შემთხვევაში, როდესაც საჭიროა m გრადუსის მიახლოებითი მრავალწევრის აგება მოცემული ცხრილის მნიშვნელობებისთვის, ყველა კვანძის წერტილზე კვადრატული გადახრების მინიმალური ჯამის პირობა ხელახლა იწერება შემდეგი სახით:

- m ხარისხის მიახლოებითი მრავალწევრის უცნობი კოეფიციენტები;

ცხრილის მითითებული მნიშვნელობების რაოდენობა.

ფუნქციის მინიმუმის არსებობის აუცილებელი პირობაა მისი ნაწილობრივი წარმოებულების ნულის ტოლობა უცნობი ცვლადების მიმართ. . შედეგად, ჩვენ ვიღებთ განტოლებების შემდეგ სისტემას:

გადავცვალოთ მიღებული განტოლებათა წრფივი სისტემა: გავხსნათ ფრჩხილები და გადავიტანოთ თავისუფალი ტერმინები გამოხატვის მარჯვენა მხარეს. შედეგად, ხაზოვანი ალგებრული გამონათქვამების სისტემა დაიწერება შემდეგი ფორმით:

ხაზოვანი ალგებრული გამონათქვამების ეს სისტემა შეიძლება გადაიწეროს მატრიცის სახით:

შედეგად მიღებული იქნა m + 1 განზომილების წრფივი განტოლებათა სისტემა, რომელიც შედგება m + 1 უცნობისაგან. ამ სისტემის ამოხსნა შესაძლებელია წრფივი ალგებრული განტოლებების ამოხსნის ნებისმიერი მეთოდის გამოყენებით (მაგალითად, გაუსის მეთოდი). ამოხსნის შედეგად მოიძებნება მიახლოებითი ფუნქციის უცნობი პარამეტრები, რომლებიც უზრუნველყოფენ მიახლოებითი ფუნქციის კვადრატული გადახრების მინიმალურ ჯამს საწყისი მონაცემებისგან, ე.ი. საუკეთესო შესაძლო კვადრატული დაახლოება. უნდა გვახსოვდეს, რომ თუ საწყისი მონაცემების ერთი მნიშვნელობაც კი შეიცვლება, ყველა კოეფიციენტი შეიცვლება მნიშვნელობებს, რადგან ისინი მთლიანად განისაზღვრება საწყისი მონაცემებით.

საწყისი მონაცემების დაახლოება წრფივი დამოკიდებულებით

(წრფივი რეგრესია)

მაგალითად, განვიხილოთ მიახლოებითი ფუნქციის განსაზღვრის მეთოდი, რომელიც მოცემულია როგორც წრფივი მიმართება. უმცირესი კვადრატების მეთოდის მიხედვით, კვადრატული გადახრების მინიმალური ჯამის პირობა იწერება შემდეგნაირად:

ცხრილის კვანძოვანი წერტილების კოორდინატები;

მიახლოებითი ფუნქციის უცნობი კოეფიციენტები, რომელიც მოცემულია როგორც წრფივი მიმართება.

ფუნქციის მინიმუმის არსებობის აუცილებელი პირობაა მისი ნაწილობრივი წარმოებულების ნულის ტოლობა უცნობი ცვლადების მიმართ. შედეგად, ჩვენ ვიღებთ განტოლებების შემდეგ სისტემას:

მოდით გარდავქმნათ მიღებული განტოლებათა წრფივი სისტემა.

ჩვენ ვხსნით სწორხაზოვან განტოლებათა სისტემას. ანალიტიკური ფორმით მიახლოებითი ფუნქციის კოეფიციენტები განისაზღვრება შემდეგნაირად (კრამერის მეთოდი):

ეს კოეფიციენტები უზრუნველყოფს წრფივი მიახლოებითი ფუნქციის აგებას კრიტერიუმის შესაბამისად მიახლოებითი ფუნქციის კვადრატების ჯამის მინიმიზაციის კრიტერიუმის შესაბამისად მოცემული ცხრილური მნიშვნელობებიდან (ექსპერიმენტული მონაცემები).

უმცირესი კვადრატების მეთოდის განხორციელების ალგორითმი

1. საწყისი მონაცემები:

მოცემულია ექსპერიმენტული მონაცემების მასივი გაზომვების რაოდენობით N

მოცემულია მიახლოებითი მრავალწევრის ხარისხი (m).

2. გაანგარიშების ალგორითმი:

2.1. კოეფიციენტები განისაზღვრება განზომილების მქონე განტოლებათა სისტემის ასაგებად

განტოლებათა სისტემის კოეფიციენტები (განტოლების მარცხენა მხარე)

- განტოლებათა სისტემის კვადრატული მატრიცის სვეტის ნომრის ინდექსი

წრფივი განტოლებათა სისტემის თავისუფალი წევრები (განტოლების მარჯვენა მხარე)

- განტოლებათა სისტემის კვადრატული მატრიცის მწკრივის რიცხვის ინდექსი

2.2. წრფივი განტოლებათა სისტემის ფორმირება განზომილებით .

2.3. m ხარისხის მიახლოებითი მრავალწევრის უცნობი კოეფიციენტების დასადგენად წრფივი განტოლებათა სისტემის ამოხსნა.

2.4 მიახლოებითი მრავალწევრის კვადრატული გადახრების ჯამის განსაზღვრა საწყისი მნიშვნელობებიდან ყველა კვანძის წერტილზე

კვადრატული გადახრების ჯამის ნაპოვნი მნიშვნელობა არის მინიმალური შესაძლო.

სხვა ფუნქციებთან დაახლოება

უნდა აღინიშნოს, რომ უმცირესი კვადრატების მეთოდის მიხედვით საწყისი მონაცემების მიახლოებისას ზოგჯერ მიახლოებით ფუნქციად გამოიყენება ლოგარითმული ფუნქცია, ექსპონენციალური ფუნქცია და სიმძლავრის ფუნქცია.

ჟურნალის მიახლოება

განვიხილოთ შემთხვევა, როდესაც მიახლოებითი ფუნქცია მოცემულია ფორმის ლოგარითმული ფუნქციით:

უმცირესი კვადრატების მეთოდის არსი არის ტენდენციის მოდელის პარამეტრების პოვნაში, რომელიც საუკეთესოდ აღწერს ნებისმიერი შემთხვევითი ფენომენის განვითარების ტენდენციას დროში ან სივრცეში (ტენდენცია არის ხაზი, რომელიც ახასიათებს ამ განვითარების ტენდენციას). უმცირესი კვადრატების მეთოდის (OLS) ამოცანაა იპოვოთ არა მხოლოდ ტენდენციის მოდელი, არამედ იპოვოთ საუკეთესო ან ოპტიმალური მოდელი. ეს მოდელი იქნება ოპტიმალური, თუ დაკვირვებულ რეალურ მნიშვნელობებსა და შესაბამის გამოთვლილ ტრენდულ მნიშვნელობებს შორის კვადრატული გადახრების ჯამი მინიმალურია (უმცირესი):

სად არის სტანდარტული გადახრა დაკვირვებულ ფაქტობრივ მნიშვნელობას შორის

და შესაბამისი გამოთვლილი ტენდენციის მნიშვნელობა,

შესწავლილი ფენომენის რეალური (დაკვირვებული) მნიშვნელობა,

ტენდენციის მოდელის სავარაუდო ღირებულება,

შესწავლილ ფენომენზე დაკვირვებების რაოდენობა.

MNC იშვიათად გამოიყენება დამოუკიდებლად. როგორც წესი, ყველაზე ხშირად იგი გამოიყენება მხოლოდ როგორც აუცილებელი ტექნიკა კორელაციულ კვლევებში. უნდა გვახსოვდეს, რომ LSM-ის საინფორმაციო საფუძველი შეიძლება იყოს მხოლოდ სანდო სტატისტიკური სერია და დაკვირვებების რაოდენობა არ უნდა იყოს 4-ზე ნაკლები, წინააღმდეგ შემთხვევაში, LSM-ის გამარტივების პროცედურებმა შეიძლება დაკარგოს საღი აზრი.

OLS ხელსაწყოების ნაკრები დაყვანილია შემდეგ პროცედურებზე:

პირველი პროცედურა. გამოდის, არის თუ არა რაიმე ტენდენცია, რომ შეიცვალოს მიღებული ატრიბუტი, როდესაც იცვლება შერჩეული ფაქტორი-არგუმენტი, ან სხვა სიტყვებით რომ ვთქვათ, არის თუ არა კავშირი "-ს შორის. ზე "და" X ».

მეორე პროცედურა. დგინდება, რომელი ხაზი (ტრაექტორია) შეუძლია ამ ტენდენციის აღწერას ან დახასიათებას ყველაზე კარგად.

მესამე პროცედურა.

მაგალითი. დავუშვათ, გვაქვს ინფორმაცია შესასწავლი მეურნეობის საშუალო მზესუმზირის მოსავლიანობის შესახებ (ცხრილი 9.1).

ცხრილი 9.1

დაკვირვების ნომერი

პროდუქტიულობა, ც/ჰა

ვინაიდან ჩვენს ქვეყანაში მზესუმზირის წარმოების ტექნოლოგია დიდად არ შეცვლილა ბოლო 10 წლის განმავლობაში, ეს ნიშნავს, რომ, სავარაუდოდ, მოსავლიანობის რყევები გაანალიზებულ პერიოდში ძალიან იყო დამოკიდებული ამინდისა და კლიმატური პირობების რყევებზე. Მართალია?

პირველი MNC პროცედურა. შემოწმებულია ჰიპოთეზა მზესუმზირის მოსავლიანობის ცვლილების ტენდენციის არსებობის შესახებ, რომელიც დამოკიდებულია ამინდისა და კლიმატური პირობების ცვლილებაზე გაანალიზებული 10 წლის განმავლობაში.

ამ მაგალითში, " » მიზანშეწონილია მზესუმზირის მოსავლის აღება და « x » არის დაკვირვებული წლის რიცხვი საანალიზო პერიოდში. ჰიპოთეზის ტესტირება რაიმე ურთიერთობის არსებობის შესახებ " x "და" » შეიძლება გაკეთდეს ორი გზით: ხელით და კომპიუტერული პროგრამების დახმარებით. რა თქმა უნდა, კომპიუტერული ტექნოლოგიების ხელმისაწვდომობით, ეს პრობლემა თავისთავად მოგვარებულია. მაგრამ იმისათვის, რომ უკეთ გავიგოთ OLS ინსტრუმენტები, მიზანშეწონილია შეამოწმოთ ჰიპოთეზა ურთიერთობის არსებობის შესახებ " x "და" » ხელით, როცა ხელთ მხოლოდ კალამი და ჩვეულებრივი კალკულატორია. ასეთ შემთხვევებში, ტენდენციის არსებობის ჰიპოთეზა საუკეთესოდ შემოწმდება ვიზუალურად გაანალიზებული დროის სერიების გრაფიკული გამოსახულების მდებარეობით - კორელაციის ველით:

ჩვენს მაგალითში კორელაციის ველი მდებარეობს ნელა მზარდი ხაზის გარშემო. ეს თავისთავად მიუთითებს მზესუმზირის მოსავლიანობის ცვლილების გარკვეული ტენდენციის არსებობაზე. შეუძლებელია რაიმე ტენდენციის არსებობაზე საუბარი მხოლოდ მაშინ, როდესაც კორელაციური ველი ჰგავს წრეს, წრეს, მკაცრად ვერტიკალურ ან მკაცრად ჰორიზონტალურ ღრუბელს, ან შედგება შემთხვევით გაფანტული წერტილებისგან. ყველა სხვა შემთხვევაში, აუცილებელია დაადასტუროს ჰიპოთეზა ურთიერთობის არსებობის შესახებ " x "და" და გააგრძელე კვლევა.

მეორე MNC პროცედურა. დგინდება, რომელი ხაზი (ტრაექტორია) უკეთ აღწერს ან ახასიათებს მზესუმზირის მოსავლიანობის ცვლილების ტენდენციას გაანალიზებული პერიოდისთვის.

კომპიუტერული ტექნოლოგიების ხელმისაწვდომობით, ოპტიმალური ტენდენციის შერჩევა ხდება ავტომატურად. „ხელით“ დამუშავებით ოპტიმალური ფუნქციის არჩევა ხდება, როგორც წესი, ვიზუალურად - კორელაციური ველის მდებარეობით. ანუ სქემის ტიპის მიხედვით შეირჩევა წრფის განტოლება, რომელიც ყველაზე კარგად შეეფერება ემპირიულ ტენდენციას (ფაქტობრივ ტრაექტორიას).

მოგეხსენებათ, ბუნებაში არსებობს ფუნქციური დამოკიდებულებების უზარმაზარი მრავალფეროვნება, ამიტომ მათი მცირე ნაწილის ვიზუალური ანალიზიც კი უკიდურესად რთულია. საბედნიეროდ, რეალურ ეკონომიკურ პრაქტიკაში, ურთიერთობების უმეტესობა შეიძლება ზუსტად იყოს აღწერილი პარაბოლით, ჰიპერბოლით ან სწორი ხაზით. ამასთან დაკავშირებით, საუკეთესო ფუნქციის შერჩევის „სახელმძღვანელო“ ოფციით შეგიძლიათ შემოიფარგლოთ მხოლოდ ამ სამი მოდელით.

ჰიპერბოლა:

მეორე რიგის პარაბოლა: :

ადვილი მისახვედრია, რომ ჩვენს მაგალითში მზესუმზირის მოსავლიანობის ცვლილების ტენდენცია გაანალიზებულ 10 წელიწადში საუკეთესოდ ხასიათდება სწორი ხაზით, ამიტომ რეგრესიის განტოლება იქნება სწორი ხაზის განტოლება.

მესამე პროცედურა. გამოითვლება რეგრესიის განტოლების პარამეტრები, რომლებიც ახასიათებს ამ ხაზს, ან სხვა სიტყვებით რომ ვთქვათ, განისაზღვრება ანალიტიკური ფორმულა, რომელიც აღწერს საუკეთესო ტრენდის მოდელს.

რეგრესიის განტოლების პარამეტრების მნიშვნელობების პოვნა, ჩვენს შემთხვევაში, პარამეტრები და , არის LSM-ის ბირთვი. ეს პროცესი მცირდება ნორმალური განტოლებების სისტემის ამოხსნამდე.

(9.2)

განტოლებათა ეს სისტემა საკმაოდ მარტივად ამოხსნილია გაუსის მეთოდით. შეგახსენებთ, რომ გადაწყვეტის შედეგად, ჩვენს მაგალითში, ნაპოვნია პარამეტრების მნიშვნელობები და. ამრიგად, ნაპოვნი რეგრესიის განტოლებას შემდეგი ფორმა ექნება:

გასწორების შემდეგ ვიღებთ შემდეგი ფორმის ფუნქციას: g (x) = x + 1 3 + 1 .

ჩვენ შეგვიძლია დავაახლოოთ ეს მონაცემები y = a x + b წრფივი დამოკიდებულებით შესაბამისი პარამეტრების გამოთვლით. ამისათვის ჩვენ დაგვჭირდება ეგრეთ წოდებული უმცირესი კვადრატების მეთოდის გამოყენება. თქვენ ასევე დაგჭირდებათ ნახაზის გაკეთება, რათა შეამოწმოთ რომელი ხაზი საუკეთესოდ ასწორებს ექსპერიმენტულ მონაცემებს.

Yandex.RTB R-A-339285-1

რა არის ზუსტად OLS (უმცირესი კვადრატების მეთოდი)

მთავარი, რაც უნდა გავაკეთოთ არის ისეთი წრფივი დამოკიდებულების კოეფიციენტების პოვნა, რომლებშიც ორი ცვლადის ფუნქციის მნიშვნელობა F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 იქნება ყველაზე პატარა. . სხვა სიტყვებით რომ ვთქვათ, a და b-ის გარკვეული მნიშვნელობებისთვის, წარმოდგენილი მონაცემების კვადრატული გადახრების ჯამს მიღებული სწორი ხაზიდან ექნება მინიმალური მნიშვნელობა. ეს არის უმცირესი კვადრატების მეთოდის მნიშვნელობა. მაგალითის ამოსახსნელად ყველაფერი რაც უნდა გავაკეთოთ არის ორი ცვლადის ფუნქციის ექსტრემის პოვნა.

როგორ გამოვიტანოთ ფორმულები კოეფიციენტების გამოსათვლელად

კოეფიციენტების გამოთვლის ფორმულების გამოსაყვანად აუცილებელია განტოლებათა სისტემის შედგენა და ამოხსნა ორი ცვლადით. ამისთვის გამოვთვლით F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 გამოთქმის ნაწილობრივ წარმოებულებს a და b-სთან მიმართებაში და ვატოლებთ 0-ს.

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ a i = ∑ i = ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

განტოლებათა სისტემის ამოსახსნელად შეგიძლიათ გამოიყენოთ ნებისმიერი მეთოდი, როგორიცაა ჩანაცვლება ან კრამერის მეთოდი. შედეგად, უნდა მივიღოთ ფორმულები, რომლებიც გამოთვლიან კოეფიციენტებს უმცირესი კვადრატების მეთოდით.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n

ჩვენ გამოვთვალეთ იმ ცვლადების მნიშვნელობები, რომლებისთვისაც არის ფუნქცია
F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 მიიღებს მინიმალურ მნიშვნელობას. მესამე აბზაცში დავამტკიცებთ, რატომ არის ასე.

ეს არის უმცირესი კვადრატების მეთოდის გამოყენება პრაქტიკაში. მისი ფორმულა, რომელიც გამოიყენება a პარამეტრის საპოვნელად, მოიცავს ∑ i = 1 n x i , ∑ i = 1 n y i , ∑ i = 1 n x i y i , ∑ i = 1 n x i 2 და პარამეტრს
n - აღნიშნავს ექსპერიმენტული მონაცემების რაოდენობას. გირჩევთ, თითოეული თანხა ცალკე გამოთვალოთ. კოეფიციენტის მნიშვნელობა b გამოითვლება a-ს შემდეგ დაუყოვნებლივ.

დავუბრუნდეთ თავდაპირველ მაგალითს.

მაგალითი 1

აქ გვაქვს n უდრის ხუთს. იმისათვის, რომ უფრო მოსახერხებელი იყოს კოეფიციენტების ფორმულებში შეტანილი საჭირო თანხების გამოთვლა, ჩვენ ვავსებთ ცხრილს.

მე = 1 მე = 2 მე = 3 მე = 4 მე = 5 ∑ i = 1 5
x i 0 1 2 4 5 12
y მე 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x i y i 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x i 2 0 1 4 16 25 46

გადაწყვეტილება

მეოთხე სტრიქონი შეიცავს მონაცემებს, რომლებიც მიიღება მეორე რიგის მნიშვნელობების გამრავლებით მესამის მნიშვნელობებზე თითოეული ინდივიდისთვის i. მეხუთე სტრიქონი შეიცავს მონაცემებს მეორე კვადრატიდან. ბოლო სვეტი აჩვენებს ცალკეული რიგების მნიშვნელობების ჯამს.

გამოვიყენოთ უმცირესი კვადრატების მეთოდი ჩვენთვის საჭირო a და b კოეფიციენტების გამოსათვლელად. ამისათვის შეცვალეთ სასურველი მნიშვნელობები ბოლო სვეტიდან და გამოთვალეთ ჯამები:

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i =3 a, ∑ i = 1 n - 12 12, 9 5 46 - 12 2 b = 12, 9 - a 12 5 ⇒ a ≈ 0, 165 b ≈ 2, 184

მივიღეთ, რომ სასურველი მიახლოებითი სწორი ხაზი გამოიყურება y = 0, 165 x + 2, 184. ახლა ჩვენ უნდა განვსაზღვროთ, რომელი ხაზი იქნება საუკეთესოდ მიახლოებით მონაცემებს - g (x) = x + 1 3 + 1 ან 0 , 165 x + 2 , 184 . მოდით შევაფასოთ უმცირესი კვადრატების მეთოდის გამოყენებით.

შეცდომის გამოსათვლელად, ჩვენ უნდა ვიპოვოთ მონაცემების კვადრატული გადახრების ჯამები σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 და σ 2 = ∑ i = 1 n (y i - g (x i)) 2, მინიმალური მნიშვნელობა შეესაბამება უფრო შესაფერის ხაზს.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0 , 165 x i + 2, 184)) 2 ≈ 0, 019 σ 2 = ∑ i = 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0 , 096

პასუხი:σ 1 წლიდან< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0, 165 x + 2, 184.

უმცირესი კვადრატების მეთოდი ნათლად არის ნაჩვენები გრაფიკულ ილუსტრაციაზე. წითელი ხაზი აღნიშნავს სწორ ხაზს g (x) = x + 1 3 + 1, ლურჯი ხაზი აღნიშნავს y = 0, 165 x + 2, 184. ნედლი მონაცემები მონიშნულია ვარდისფერი წერტილებით.

მოდით განვმარტოთ, რატომ არის საჭირო ზუსტად ამ ტიპის მიახლოებები.

მათი გამოყენება შესაძლებელია იმ პრობლემებში, რომლებიც საჭიროებენ მონაცემთა გამარტივებას, ასევე იმ პრობლემებში, სადაც მონაცემთა ინტერპოლაცია ან ექსტრაპოლაციაა საჭირო. მაგალითად, ზემოთ განხილულ პრობლემაში შეიძლება ვიპოვოთ დაკვირვებული y სიდიდის მნიშვნელობა x = 3-ზე ან x = 6-ზე. ასეთ მაგალითებს ცალკე სტატია მივუძღვენით.

LSM მეთოდის დადასტურება

იმისათვის, რომ ფუნქციამ მიიღოს მინიმალური მნიშვნელობა a და b გამოთვლისთვის, აუცილებელია მოცემულ წერტილში F (a, b) ფორმის ფუნქციის დიფერენციალური კვადრატული ფორმის მატრიცა = ∑ i = 1 n ( y i - (a x i + b)) 2 იყოს დადებითი განსაზღვრული. მოდით გაჩვენოთ, როგორ უნდა გამოიყურებოდეს.

მაგალითი 2

ჩვენ გვაქვს შემდეგი ფორმის მეორე რიგის დიფერენციალი:

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; ბ) δ a δ b d a d b + δ 2 F (a ; b) δ b 2 d 2ბ

გადაწყვეტილება

δ 2 F (a ; ბ) δ a 2 = δ δ F (ა ; ბ) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + ბ)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a ; ბ) δ a δ b = δ δ F (a ; ბ) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; ბ) δ b 2 = δ δ F (a ; ბ) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + ბ)) δ b = 2 ∑ i = 1 n (1) = 2 n

სხვა სიტყვებით რომ ვთქვათ, ის შეიძლება დაიწეროს შემდეგნაირად: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b .

მივიღეთ M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n კვადრატული ფორმის მატრიცა.

ამ შემთხვევაში, ცალკეული ელემენტების მნიშვნელობები არ შეიცვლება a და b-ის მიხედვით. ეს მატრიცა დადებითია გარკვეული? ამ კითხვაზე პასუხის გასაცემად შევამოწმოთ დადებითია თუ არა მისი კუთხური მინორები.

გამოთვალეთ პირველი რიგის კუთხოვანი მინორი: 2 ∑ i = 1 n (x i) 2 > 0 . ვინაიდან x i წერტილები არ ემთხვევა, უტოლობა მკაცრია. ამას გავითვალისწინებთ შემდგომ გამოთვლებში.

ჩვენ ვიანგარიშებთ მეორე რიგის კუთხური მცირეს:

d e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2

ამის შემდეგ ვაგრძელებთ n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 უტოლობის მტკიცებას მათემატიკური ინდუქციის გამოყენებით.

  1. მოდით შევამოწმოთ, მოქმედებს თუ არა ეს უტოლობა თვითნებური n-ისთვის. ავიღოთ 2 და გამოვთვალოთ:

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

მივიღეთ სწორი თანასწორობა (თუ მნიშვნელობები x 1 და x 2 არ ემთხვევა).

  1. მოდით დავუშვათ, რომ ეს უტოლობა იქნება ჭეშმარიტი n-ისთვის, ე.ი. n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – მართალია.
  2. ახლა დავამტკიცოთ n + 1-ის მართებულობა, ე.ი. რომ (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 > 0 თუ n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 .

ჩვენ ვიანგარიშებთ:

(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - ∑ i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1 n x i + ∑ i = n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1 - x 2) 2 + . . . + (x n - 1 - x n) 2 > 0

ხვეული ბრეკეტებში ჩასმული გამოხატულება იქნება 0-ზე მეტი (იმზე დაფუძნებული, რაც ჩვენ ვივარაუდეთ მე-2 საფეხურზე), ხოლო დანარჩენი ტერმინები იქნება 0-ზე მეტი, რადგან ისინი ყველა რიცხვების კვადრატია. ჩვენ დავამტკიცეთ უთანასწორობა.

პასუხი:ნაპოვნი a და b შეესაბამება F ფუნქციის უმცირეს მნიშვნელობას (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2, რაც ნიშნავს, რომ ისინი ყველაზე მცირე კვადრატების მეთოდის სასურველი პარამეტრებია. (LSM).

თუ შეამჩნევთ შეცდომას ტექსტში, მონიშნეთ იგი და დააჭირეთ Ctrl+Enter

იგი ფართოდ გამოიყენება ეკონომეტრიაში მისი პარამეტრების მკაფიო ეკონომიკური ინტერპრეტაციის სახით.

წრფივი რეგრესია მცირდება ფორმის განტოლების პოვნამდე

ან

ტიპის განტოლება საშუალებას იძლევა მოცემული პარამეტრის მნიშვნელობები Xაქვს ეფექტური მახასიათებლის თეორიული მნიშვნელობები, ანაცვლებს მასში ფაქტორის ფაქტობრივ მნიშვნელობებს X.

წრფივი რეგრესიის აგება ხდება მისი პარამეტრების შეფასებაზე − და in.ხაზოვანი რეგრესიის პარამეტრების შეფასებები შეიძლება მოიძებნოს სხვადასხვა მეთოდით.

ხაზოვანი რეგრესიის პარამეტრების შეფასების კლასიკური მიდგომა ეფუძნება უმცირესი კვადრატები(MNK).

LSM საშუალებას გაძლევთ მიიღოთ ასეთი პარამეტრების შეფასებები და in,რომლის მიხედვითაც ხდება შედეგიანი ნიშან-თვისების რეალური მნიშვნელობების კვადრატული გადახრების ჯამი (y)გათვლილიდან (თეორიული) მინი-მინიმუმი:

ფუნქციის მინიმალური საპოვნელად საჭიროა გამოვთვალოთ ნაწილობრივი წარმოებულები თითოეულ პარამეტრთან მიმართებაში. და და გაუტოლეთ ისინი ნულს.

აღნიშნეთ S-ის მეშვეობით, შემდეგ:

ფორმულის გარდაქმნით, ვიღებთ ნორმალური განტოლების შემდეგ სისტემას პარამეტრების შესაფასებლად და in:

ნორმალურ განტოლებათა სისტემის (3.5) ამოხსნით ან ცვლადების თანმიმდევრული აღმოფხვრის მეთოდით ან განმსაზღვრელების მეთოდით, ვპოულობთ სასურველ პარამეტრებს. და in.

Პარამეტრი inუწოდა რეგრესიის კოეფიციენტი. მისი მნიშვნელობა გვიჩვენებს შედეგის საშუალო ცვლილებას ფაქტორის ერთი ერთეულით ცვლილებით.

რეგრესიის განტოლებას ყოველთვის ემატება ურთიერთობის სიმკაცრის მაჩვენებელი. ხაზოვანი რეგრესიის გამოყენებისას, ხაზოვანი კორელაციის კოეფიციენტი მოქმედებს, როგორც ასეთი მაჩვენებელი. არსებობს ხაზოვანი კორელაციის კოეფიციენტის ფორმულის სხვადასხვა მოდიფიკაცია. ზოგიერთი მათგანი ჩამოთვლილია ქვემოთ:

მოგეხსენებათ, წრფივი კორელაციის კოეფიციენტი საზღვრებშია: -1 1.

წრფივი ფუნქციის შერჩევის ხარისხის შესაფასებლად გამოითვლება კვადრატი

წრფივი კორელაციის კოეფიციენტი ე.წ განსაზღვრის კოეფიციენტი .განსაზღვრის კოეფიციენტი ახასიათებს ეფექტური მახასიათებლის დისპერსიის პროპორციას y,აიხსნება რეგრესიით, შედეგად მიღებული ნიშან-თვისების მთლიან დისპერსიაში:

შესაბამისად, მნიშვნელობა 1 - ახასიათებს დისპერსიის პროპორციას y,გამოწვეული სხვა ფაქტორების გავლენით, რომლებიც არ არის გათვალისწინებული მოდელში.

კითხვები თვითკონტროლისთვის

1. უმცირესი კვადრატების მეთოდის არსი?

2. რამდენი ცვლადი იძლევა წყვილ რეგრესიას?

3. რა კოეფიციენტი განსაზღვრავს ცვლილებებს შორის კავშირის სიმჭიდროვეს?

4. რა საზღვრებში დგინდება განსაზღვრის კოეფიციენტი?

5. b პარამეტრის შეფასება კორელაციულ-რეგრესიულ ანალიზში?

1. კრისტოფერ დოუერტი. შესავალი ეკონომიკაში. - M.: INFRA - M, 2001 - 402 გვ.

2. ს.ა. ბოროდიჩი. ეკონომიკა. მინსკი შპს "ახალი ცოდნა" 2001 წ.


3. რ.უ. რახმეტოვა მოკლე კურსი ეკონომიკაში. სახელმძღვანელო. ალმათი. 2004. -78წ.

4. ი.ი. ელისეევა.ეკონომეტრია. - მ.: „ფინანსები და სტატისტიკა“, 2002 წ

5. ყოველთვიური საინფორმაციო და ანალიტიკური ჟურნალი.

არაწრფივი ეკონომიკური მოდელები. არაწრფივი რეგრესიის მოდელები. ცვლადი კონვერტაცია.

არაწრფივი ეკონომიკური მოდელები..

ცვლადი კონვერტაცია.

ელასტიურობის კოეფიციენტი.

თუ ეკონომიკურ ფენომენებს შორის არის არაწრფივი მიმართებები, მაშინ ისინი გამოიხატება შესაბამისი არაწრფივი ფუნქციების გამოყენებით: მაგალითად, ტოლგვერდა ჰიპერბოლა. , მეორე ხარისხის პარაბოლები და ა.შ.

არსებობს არაწრფივი რეგრესიების ორი კლასი:

1. რეგრესია, რომელიც არის არაწრფივი ანალიზში შემავალი ახსნა-განმარტებითი ცვლადების მიმართ, მაგრამ წრფივია სავარაუდო პარამეტრების მიმართ, მაგალითად:

სხვადასხვა ხარისხის პოლინომები - , ;

ტოლგვერდა ჰიპერბოლა - ;

სემილოგარითმული ფუნქცია - .

2. რეგრესია, რომელიც არაწრფივია სავარაუდო პარამეტრებში, მაგალითად:

Ძალა - ;

დემონსტრაციული -;

ექსპონენციალური - .

მიღებული ატრიბუტის ინდივიდუალური მნიშვნელობების კვადრატული გადახრების ჯამი ზესაშუალო მნიშვნელობიდან გამოწვეულია მრავალი ფაქტორის გავლენით. ჩვენ პირობითად ვყოფთ მიზეზების მთელ კრებულს ორ ჯგუფად: შესწავლილი ფაქტორი xდა სხვა ფაქტორები.

თუ ფაქტორი არ მოქმედებს შედეგზე, მაშინ გრაფიკზე რეგრესიის ხაზი ღერძის პარალელურია. ოჰდა

შემდეგ მიღებული ატრიბუტის მთელი დისპერსია განპირობებულია სხვა ფაქტორების გავლენით და კვადრატული გადახრების ჯამი დაემთხვევა ნარჩენს. თუ სხვა ფაქტორები არ იმოქმედებს შედეგზე, მაშინ თქვენ შეკრულითან Xფუნქციურად და კვადრატების ნარჩენი ჯამი არის ნული. ამ შემთხვევაში რეგრესიით ახსნილი კვადრატული გადახრების ჯამი იგივეა, რაც კვადრატების ჯამი.

ვინაიდან კორელაციური ველის ყველა წერტილი არ დევს რეგრესიის ხაზზე, მათი გაფანტვა ყოველთვის ხდება ფაქტორის გავლენის გამო. X, ანუ რეგრესია ზე on X,და გამოწვეული სხვა მიზეზების მოქმედებით (აუხსნელი ვარიაციით). პროგნოზისთვის რეგრესიული ხაზის ვარგისიანობა დამოკიდებულია მახასიათებლის მთლიანი ვარიაციის რა ნაწილზე ზეითვალისწინებს ახსნილ ვარიაციას

ცხადია, თუ რეგრესიის გამო კვადრატული გადახრების ჯამი მეტია კვადრატების ნარჩენი ჯამისა, მაშინ რეგრესიის განტოლება სტატისტიკურად მნიშვნელოვანია და ფაქტორი Xმნიშვნელოვან გავლენას ახდენს შედეგზე. წ.

, ანუ მახასიათებლის დამოუკიდებელი ვარიაციის თავისუფლების რიცხვით. თავისუფლების ხარისხების რაოდენობა დაკავშირებულია n პოპულაციის ერთეულების რაოდენობასთან და მისგან განსაზღვრულ მუდმივთა რაოდენობასთან. შესწავლილ პრობლემასთან დაკავშირებით, თავისუფლების ხარისხების რაოდენობამ უნდა აჩვენოს, რამდენი დამოუკიდებელი გადახრებია

რეგრესიის განტოლების მთლიანობაში მნიშვნელოვნების შეფასება მოცემულია დახმარებით - ფიშერის კრიტერიუმი. ამ შემთხვევაში დგება ნულოვანი ჰიპოთეზა, რომ რეგრესიის კოეფიციენტი ნულის ტოლია, ე.ი. b= 0 და აქედან გამომდინარე ფაქტორი Xარ იმოქმედებს შედეგზე წ.

F- კრიტერიუმის პირდაპირ გამოთვლას წინ უძღვის დისპერსიის ანალიზი. მასში ცენტრალურია ცვლადის კვადრატული გადახრების ჯამის გაფართოება ზესაშუალო მნიშვნელობიდან ზეორ ნაწილად - "ახსნილი" და "აუხსნელი":

- კვადრატული გადახრების ჯამი;

- რეგრესიით ახსნილი კვადრატული გადახრების ჯამი;

არის გადახრის კვადრატების ნარჩენი ჯამი.

კვადრატული გადახრების ნებისმიერი ჯამი დაკავშირებულია თავისუფლების გრადუსების რაოდენობასთან , ანუ მახასიათებლის დამოუკიდებელი ვარიაციის თავისუფლების რიცხვით. თავისუფლების ხარისხების რაოდენობა დაკავშირებულია მოსახლეობის ერთეულების რაოდენობასთან და მისგან განსაზღვრული მუდმივების რაოდენობით. შესწავლილ პრობლემასთან დაკავშირებით, თავისუფლების ხარისხების რაოდენობამ უნდა აჩვენოს, რამდენი დამოუკიდებელი გადახრებია შესაძლებელია საჭიროა კვადრატების მოცემული ჯამის ფორმირება.

დისპერსია თავისუფლების ხარისხზე.

F- კოეფიციენტები (F-კრიტერიუმი):

თუ ნულოვანი ჰიპოთეზა მართალია, მაშინ ფაქტორი და ნარჩენი ვარიაციები არ განსხვავდება ერთმანეთისგან. H 0-სთვის აუცილებელია უარყოფა ისე, რომ ფაქტორების განსხვავება რამდენჯერმე გადააჭარბოს ნარჩენს. ინგლისელმა სტატისტიკოსმა სნედეკორმა შეიმუშავა კრიტიკული მნიშვნელობების ცხრილები -დამოკიდებულებები ნულოვანი ჰიპოთეზის მნიშვნელობის სხვადასხვა დონეზე და თავისუფლების სხვადასხვა ხარისხით. ცხრილის ღირებულება - კრიტერიუმი არის დისპერსიების თანაფარდობის მაქსიმალური მნიშვნელობა, რომელიც შეიძლება მოხდეს, თუ ისინი შემთხვევით განსხვავდებიან ნულოვანი ჰიპოთეზის არსებობის ალბათობის მოცემულ დონეზე. გამოთვლილი მნიშვნელობა -ურთიერთობა აღიარებულია საიმედოდ, თუ o მეტია ცხრილზე.

ამ შემთხვევაში უარყოფილია ნულოვანი ჰიპოთეზა მახასიათებლების ურთიერთობის არარსებობის შესახებ და კეთდება დასკვნა ამ ურთიერთობის მნიშვნელობის შესახებ: F ფაქტი > F ცხრილი H 0 უარყოფილია.

თუ მნიშვნელობა ნაკლებია ცხრილში F ფაქტი ‹, F ცხრილი, მაშინ ნულოვანი ჰიპოთეზის ალბათობა აღემატება მოცემულ დონეს და მისი უარყოფა შეუძლებელია ურთიერთობის არსებობის შესახებ არასწორი დასკვნის გამოტანის სერიოზული რისკის გარეშე. ამ შემთხვევაში რეგრესიის განტოლება სტატისტიკურად უმნიშვნელოდ ითვლება. N o არ გადაუხვევს.

რეგრესიის კოეფიციენტის სტანდარტული შეცდომა

რეგრესიის კოეფიციენტის მნიშვნელოვნების შესაფასებლად მისი მნიშვნელობა შედარებულია მის სტანდარტულ შეცდომასთან, ანუ განისაზღვრება ფაქტობრივი მნიშვნელობა. -სტუდენტური კრიტერიუმი: რომელიც შემდეგ შედარებულია ტაბულურ მნიშვნელობასთან მნიშვნელობის გარკვეულ დონეზე და თავისუფლების ხარისხით ( - 2).

პარამეტრის სტანდარტული შეცდომა :

წრფივი კორელაციის კოეფიციენტის მნიშვნელობა შემოწმებულია შეცდომის სიდიდის მიხედვით კორელაციის კოეფიციენტი r:

მახასიათებლის მთლიანი განსხვავება X:

მრავალჯერადი ხაზოვანი რეგრესია

მოდელის შენობა

მრავალჯერადი რეგრესიაარის ეფექტური მახასიათებლის რეგრესია ორი ან მეტი ფაქტორით, ანუ ფორმის მოდელი

რეგრესიას შეუძლია კარგი შედეგი მოგვცეს მოდელირებაში, თუ შეიძლება უგულებელყო სხვა ფაქტორების გავლენა, რომლებიც გავლენას ახდენენ კვლევის ობიექტზე. ცალკეული ეკონომიკური ცვლადების ქცევის კონტროლი შეუძლებელია, ანუ შეუძლებელია ყველა სხვა პირობის თანასწორობის უზრუნველყოფა ერთი შესწავლილი ფაქტორის გავლენის შესაფასებლად. ამ შემთხვევაში, თქვენ უნდა სცადოთ სხვა ფაქტორების გავლენის იდენტიფიცირება მოდელში მათი შეყვანით, ანუ ააგოთ მრავალჯერადი რეგრესიის განტოლება: y = a+b 1 x 1 +b 2 +…+b p x p + .

მრავალჯერადი რეგრესიის მთავარი მიზანია მოდელის აგება ფაქტორების დიდი რაოდენობით, თითოეული მათგანის ინდივიდუალურად გავლენის განსაზღვრისას, ასევე მათი კუმულაციური ზემოქმედების მოდელირებულ ინდიკატორზე. მოდელის სპეციფიკაცია მოიცავს კითხვების ორ სფეროს: ფაქტორების შერჩევას და რეგრესიის განტოლების ტიპის არჩევას.