कम से कम वर्गों की पारंपरिक विधि। कम से कम वर्ग विधि

इसके कई अनुप्रयोग हैं, क्योंकि यह किसी दिए गए फ़ंक्शन के अन्य सरल लोगों द्वारा अनुमानित प्रतिनिधित्व की अनुमति देता है। एलएसएम अवलोकनों को संसाधित करने में बेहद उपयोगी हो सकता है, और यह सक्रिय रूप से यादृच्छिक त्रुटियों वाले अन्य लोगों के माप के परिणामों से कुछ मात्राओं का अनुमान लगाने के लिए सक्रिय रूप से उपयोग किया जाता है। इस लेख में, आप सीखेंगे कि एक्सेल में कम से कम वर्ग गणना कैसे लागू करें।

एक विशिष्ट उदाहरण पर समस्या का विवरण

मान लीजिए कि दो संकेतक एक्स और वाई हैं। इसके अलावा, वाई एक्स पर निर्भर करता है। चूंकि ओएलएस प्रतिगमन विश्लेषण के दृष्टिकोण से हमारे लिए रूचि रखता है (एक्सेल में, इसकी विधियों को अंतर्निहित कार्यों का उपयोग करके कार्यान्वित किया जाता है), हमें तुरंत आगे बढ़ना चाहिए एक विशिष्ट समस्या पर विचार करने के लिए।

तो, एक्स को एक किराने की दुकान का विक्रय क्षेत्र होने दें, जिसे वर्ग मीटर में मापा जाता है, और वाई वार्षिक कारोबार, लाखों रूबल में परिभाषित होता है।

यह भविष्यवाणी करना आवश्यक है कि अगर एक या कोई अन्य खुदरा स्थान है तो स्टोर का टर्नओवर (Y) क्या होगा। जाहिर है, फ़ंक्शन Y = f (X) बढ़ रहा है, क्योंकि हाइपरमार्केट स्टाल से अधिक सामान बेचता है।

भविष्यवाणी के लिए उपयोग किए गए प्रारंभिक डेटा की शुद्धता के बारे में कुछ शब्द

मान लें कि हमारे पास n स्टोर्स के लिए डेटा के साथ निर्मित एक टेबल है।

गणितीय आँकड़ों के अनुसार, कम से कम 5-6 वस्तुओं के डेटा की जांच करने पर परिणाम कमोबेश सही होंगे। साथ ही, "विसंगतिपूर्ण" परिणामों का उपयोग नहीं किया जा सकता है। विशेष रूप से, एक कुलीन छोटे बुटीक का टर्नओवर "मासमार्केट" वर्ग के बड़े आउटलेट्स के टर्नओवर से कई गुना अधिक हो सकता है।

विधि का सार

तालिका डेटा को कार्तीय तल पर बिंदु M 1 (x 1, y 1), ... M n (x n, y n) के रूप में प्रदर्शित किया जा सकता है। अब समस्या का समाधान एक सन्निकट फलन y = f (x) के चयन तक सीमित कर दिया जाएगा, जिसमें एक ग्राफ जितना संभव हो सके बिंदुओं M 1, M 2, .. M n के करीब से गुजर रहा हो।

बेशक, आप एक उच्च डिग्री बहुपद का उपयोग कर सकते हैं, लेकिन यह विकल्प न केवल लागू करना मुश्किल है, बल्कि बस गलत है, क्योंकि यह उस मुख्य प्रवृत्ति को प्रतिबिंबित नहीं करेगा जिसका पता लगाने की आवश्यकता है। सबसे उचित समाधान एक सीधी रेखा y = ax + b की खोज करना है, जो प्रयोगात्मक डेटा का सबसे अच्छा अनुमान लगाता है, और अधिक सटीक रूप से, गुणांक - a और b।

शुद्धता स्कोर

किसी भी सन्निकटन के लिए, उसकी सटीकता के आकलन का विशेष महत्व है। बिंदु x i के लिए कार्यात्मक और प्रायोगिक मूल्यों के बीच अंतर (विचलन) को e i द्वारा निरूपित करें, अर्थात e i = y i - f (x i)।

जाहिर है, सन्निकटन की सटीकता का आकलन करने के लिए, आप विचलन के योग का उपयोग कर सकते हैं, अर्थात, Y पर X की निर्भरता के अनुमानित प्रतिनिधित्व के लिए एक सीधी रेखा का चयन करते समय, उस व्यक्ति को वरीयता दी जानी चाहिए जिसका सबसे छोटा मान हो विचाराधीन सभी बिंदुओं पर योग ई। हालांकि, सब कुछ इतना सरल नहीं है, क्योंकि सकारात्मक विचलन के साथ, व्यावहारिक रूप से नकारात्मक भी होंगे।

आप विचलन मॉड्यूल या उनके वर्गों का उपयोग करके समस्या का समाधान कर सकते हैं। बाद की विधि सबसे व्यापक रूप से उपयोग की जाती है। इसका उपयोग कई क्षेत्रों में किया जाता है, जिसमें प्रतिगमन विश्लेषण शामिल है (एक्सेल में, इसका कार्यान्वयन दो अंतर्निहित कार्यों का उपयोग करके किया जाता है), और लंबे समय से प्रभावी साबित हुआ है।

कम से कम वर्ग विधि

एक्सेल में, जैसा कि आप जानते हैं, एक अंतर्निहित ऑटोसम फ़ंक्शन है जो आपको चयनित श्रेणी में स्थित सभी मूल्यों के मूल्यों की गणना करने की अनुमति देता है। इस प्रकार, हमें व्यंजक के मान की गणना करने से कोई नहीं रोकेगा (e 1 2 + e 2 2 + e 3 2 + ... e n 2)।

गणितीय संकेतन में, ऐसा दिखता है:

चूंकि निर्णय शुरू में एक सीधी रेखा का उपयोग करके अनुमानित करने के लिए किया गया था, हमारे पास है:

इस प्रकार, एक सीधी रेखा खोजने का कार्य जो एक्स और वाई के बीच एक विशिष्ट संबंध का सबसे अच्छा वर्णन करता है, दो चर के न्यूनतम फ़ंक्शन की गणना करने के बराबर है:

इसके लिए नए चर ए और बी के संबंध में शून्य आंशिक डेरिवेटिव के बराबर होना आवश्यक है, और एक आदिम प्रणाली को हल करना जिसमें दो अज्ञात फॉर्म के साथ दो समीकरण शामिल हैं:

सरल परिवर्तनों के बाद, जिसमें 2 से भाग देना और योगों में हेर-फेर करना शामिल है, हम प्राप्त करते हैं:

इसे हल करना, उदाहरण के लिए, क्रैमर की विधि द्वारा, हम कुछ गुणांक a * और b * के साथ एक स्थिर बिंदु प्राप्त करते हैं। यह न्यूनतम है, यानी यह अनुमान लगाने के लिए कि किसी निश्चित क्षेत्र के लिए स्टोर का टर्नओवर क्या होगा, सीधी रेखा y = a * x + b * उपयुक्त है, जो प्रश्न में उदाहरण के लिए एक प्रतिगमन मॉडल है। बेशक, यह आपको सटीक परिणाम खोजने की अनुमति नहीं देगा, लेकिन इससे आपको यह अंदाजा लगाने में मदद मिलेगी कि क्या किसी विशेष क्षेत्र के लिए क्रेडिट पर स्टोर खरीदने से भुगतान होगा।

एक्सेल में कम से कम वर्ग विधि को कैसे लागू करें

एक्सेल में कम से कम वर्गों के मूल्य की गणना के लिए एक फ़ंक्शन है। इसका निम्न रूप है: TREND (ज्ञात Y मान; ज्ञात X मान; नए X मान; स्थिर)। आइए एक्सेल में ओएलएस की गणना के लिए हमारी तालिका में सूत्र लागू करें।

ऐसा करने के लिए, उस सेल में जिसमें एक्सेल में कम से कम वर्ग विधि का उपयोग करके गणना का परिणाम प्रदर्शित किया जाना चाहिए, "=" चिह्न दर्ज करें और "ट्रेंड" फ़ंक्शन का चयन करें। खुलने वाली विंडो में, हाइलाइट करते हुए उपयुक्त फ़ील्ड भरें:

  • वाई के लिए ज्ञात मूल्यों की श्रेणी (इस मामले में कारोबार के लिए डेटा);
  • रेंज x 1 , …x n , यानी खुदरा स्थान का आकार;
  • और x के ज्ञात और अज्ञात मान, जिसके लिए आपको टर्नओवर के आकार का पता लगाना होगा (वर्कशीट पर उनके स्थान के बारे में जानकारी के लिए, नीचे देखें)।

इसके अलावा, सूत्र में एक तार्किक चर "कॉन्स्ट" है। यदि आप इसके अनुरूप क्षेत्र में 1 दर्ज करते हैं, तो इसका मतलब यह होगा कि गणना की जानी चाहिए, यह मानते हुए कि बी \u003d 0।

यदि आपको एक से अधिक x मान के लिए पूर्वानुमान जानने की आवश्यकता है, तो सूत्र दर्ज करने के बाद, आपको "एंटर" नहीं दबाना चाहिए, लेकिन आपको संयोजन "Shift" + "Control" + "Enter" ("Enter" टाइप करना होगा) ) कीबोर्ड पर।

कुछ सुविधाएं

प्रतिगमन विश्लेषण डमी के लिए भी सुलभ हो सकता है। अज्ञात चरों की एक सरणी के मूल्य की भविष्यवाणी करने के लिए एक्सेल फॉर्मूला - "ट्रेंड" - का उपयोग उन लोगों द्वारा भी किया जा सकता है जिन्होंने कम से कम वर्ग विधि के बारे में कभी नहीं सुना है। इसके काम की कुछ विशेषताओं को जानना ही काफी है। विशेष रूप से:

  • यदि आप चर y के ज्ञात मानों की श्रेणी को एक पंक्ति या स्तंभ में व्यवस्थित करते हैं, तो x के ज्ञात मानों वाली प्रत्येक पंक्ति (स्तंभ) को प्रोग्राम द्वारा एक अलग चर के रूप में माना जाएगा।
  • यदि ज्ञात x के साथ श्रेणी TREND विंडो में निर्दिष्ट नहीं है, तो एक्सेल में फ़ंक्शन का उपयोग करने के मामले में, प्रोग्राम इसे पूर्णांकों से युक्त एक सरणी के रूप में मानेगा, जिसकी संख्या दिए गए मानों के साथ श्रेणी से मेल खाती है। चर y.
  • "अनुमानित" मानों की एक सरणी को आउटपुट करने के लिए, प्रवृत्ति अभिव्यक्ति को एक सरणी सूत्र के रूप में दर्ज किया जाना चाहिए।
  • यदि कोई नया x मान निर्दिष्ट नहीं है, तो TREND फ़ंक्शन उन्हें ज्ञात मान के बराबर मानता है। यदि वे निर्दिष्ट नहीं हैं, तो सरणी 1 को तर्क के रूप में लिया जाता है; 2; 3; 4;…, जो पहले से दिए गए पैरामीटर y के साथ सीमा के अनुरूप है।
  • नए x मानों वाली श्रेणी में दिए गए y मानों वाली श्रेणी के समान या अधिक पंक्तियाँ या स्तंभ होने चाहिए। दूसरे शब्दों में, यह स्वतंत्र चर के अनुपात में होना चाहिए।
  • ज्ञात x मानों वाली एक सरणी में कई चर हो सकते हैं। हालांकि, अगर हम केवल एक के बारे में बात कर रहे हैं, तो यह आवश्यक है कि x और y के दिए गए मानों वाली श्रेणियां अनुरूप हों। कई चरों के मामले में, यह आवश्यक है कि दिए गए y मानों वाली श्रेणी एक कॉलम या एक पंक्ति में फिट हो।

पूर्वानुमान समारोह

इसे कई कार्यों का उपयोग करके कार्यान्वित किया जाता है। उनमें से एक को "प्रेडिक्शन" कहा जाता है। यह ट्रेंड के समान है, यानी यह कम से कम वर्ग विधि का उपयोग करके गणना का परिणाम देता है। हालाँकि, केवल एक X के लिए, जिसके लिए Y का मान अज्ञात है।

अब आप डमी के लिए एक्सेल फ़ार्मुलों को जानते हैं जो आपको एक रेखीय प्रवृत्ति के अनुसार एक संकेतक के भविष्य के मूल्य के मूल्य की भविष्यवाणी करने की अनुमति देते हैं।

प्रयोगात्मक डेटा का अनुमान एक विश्लेषणात्मक फ़ंक्शन के साथ प्रयोगात्मक रूप से प्राप्त डेटा के प्रतिस्थापन के आधार पर एक विधि है जो प्रारंभिक मूल्यों (प्रयोग या प्रयोग के दौरान प्राप्त डेटा) के साथ नोडल बिंदुओं पर सबसे निकट से गुजरता है या मेल खाता है। विश्लेषणात्मक फ़ंक्शन को परिभाषित करने के लिए वर्तमान में दो तरीके हैं:

एक एन-डिग्री इंटरपोलेशन बहुपद का निर्माण करके जो गुजरता है सीधे सभी बिंदुओं के माध्यम सेडेटा की दी गई सरणी। इस मामले में, सन्निकटन फलन को इस प्रकार दर्शाया जाता है: लैग्रेंज रूप में एक प्रक्षेप बहुपद या न्यूटन रूप में एक प्रक्षेप बहुपद।

एक n-डिग्री सन्निकटन बहुपद का निर्माण करके जो गुजरता है अंक के करीबदिए गए डेटा सरणी से। इस प्रकार, अनुमानित कार्य प्रयोग के दौरान होने वाले सभी यादृच्छिक शोर (या त्रुटियों) को सुचारू करता है: प्रयोग के दौरान मापा गया मान यादृच्छिक कारकों पर निर्भर करता है जो अपने स्वयं के यादृच्छिक कानूनों (माप या उपकरण त्रुटियों, अशुद्धि या प्रयोगात्मक) के अनुसार उतार-चढ़ाव करते हैं। त्रुटियां)। इस मामले में, सन्निकटन फ़ंक्शन कम से कम वर्ग विधि द्वारा निर्धारित किया जाता है।

कम से कम वर्ग विधि(अंग्रेजी साहित्य में साधारण कम से कम वर्ग, ओएलएस) एक अनुमानित कार्य की परिभाषा के आधार पर एक गणितीय विधि है, जो प्रयोगात्मक डेटा के दिए गए सरणी से बिंदुओं के निकटतम निकटता में बनाया गया है। प्रारंभिक और अनुमानित कार्यों की निकटता F(x) एक संख्यात्मक माप द्वारा निर्धारित की जाती है, अर्थात्: अनुमानित वक्र F(x) से प्रयोगात्मक डेटा के वर्ग विचलन का योग सबसे छोटा होना चाहिए।

कम से कम वर्ग विधि द्वारा निर्मित फिटिंग वक्र

कम से कम वर्ग विधि का उपयोग किया जाता है:

समीकरणों की संख्या अज्ञात की संख्या से अधिक होने पर समीकरणों की अतिनिर्धारित प्रणालियों को हल करने के लिए;

समीकरणों के साधारण (अतिनिर्धारित नहीं) गैर-रेखीय प्रणालियों के मामले में समाधान खोजने के लिए;

कुछ अनुमानित फ़ंक्शन द्वारा बिंदु मानों को अनुमानित करने के लिए।

न्यूनतम वर्ग विधि द्वारा सन्निकटन फलन प्रायोगिक डेटा के दिए गए सरणी से परिकलित सन्निकटन फलन के वर्ग विचलन के न्यूनतम योग की स्थिति से निर्धारित होता है। न्यूनतम वर्ग विधि का यह मानदंड निम्नलिखित व्यंजक के रूप में लिखा गया है:

नोडल बिंदुओं पर परिकलित सन्निकटन फलन के मान,

नोडल बिंदुओं पर प्रयोगात्मक डेटा की निर्दिष्ट सरणी।

द्विघात मानदंड में कई "अच्छे" गुण हैं, जैसे कि भिन्नता, बहुपद सन्निकटन कार्यों के साथ सन्निकटन समस्या का एक अनूठा समाधान प्रदान करना।

समस्या की स्थितियों के आधार पर, सन्निकटन फलन घात m . का एक बहुपद है

सन्निकटन फलन की डिग्री नोडल बिंदुओं की संख्या पर निर्भर नहीं करती है, लेकिन इसका आयाम हमेशा प्रयोगात्मक डेटा के दिए गए सरणी के आयाम (अंकों की संख्या) से कम होना चाहिए।

यदि सन्निकटन फलन की घात m=1 है, तो हम एक सीधी रेखा (रैखिक प्रतिगमन) के साथ तालिका फलन का अनुमान लगाते हैं।

यदि सन्निकटन फलन की घात m=2 है, तो हम एक द्विघात परवलय (द्विघात सन्निकटन) के साथ तालिका फलन का अनुमान लगाते हैं।

यदि सन्निकटन फलन की घात m=3 है, तो हम तालिका फलन को घन परवलय (घन सन्निकटन) के साथ सन्निकटित करते हैं।

सामान्य स्थिति में, जब दिए गए सारणीबद्ध मानों के लिए घात m का एक सन्निकट बहुपद बनाना आवश्यक होता है, तो सभी नोडल बिंदुओं पर वर्ग विचलन के न्यूनतम योग की शर्त को निम्न रूप में फिर से लिखा जाता है:

- डिग्री एम के अनुमानित बहुपद के अज्ञात गुणांक;

निर्दिष्ट तालिका मानों की संख्या।

किसी फ़ंक्शन के न्यूनतम अस्तित्व के लिए एक आवश्यक शर्त अज्ञात चर के संबंध में इसके आंशिक व्युत्पन्न के शून्य की समानता है . नतीजतन, हम समीकरणों की निम्नलिखित प्रणाली प्राप्त करते हैं:

आइए समीकरणों की परिणामी रैखिक प्रणाली को रूपांतरित करें: कोष्ठक खोलें और मुक्त पदों को व्यंजक के दाईं ओर ले जाएं। परिणामस्वरूप, रैखिक बीजीय व्यंजकों की परिणामी प्रणाली निम्नलिखित रूप में लिखी जाएगी:

रैखिक बीजीय व्यंजकों की इस प्रणाली को मैट्रिक्स रूप में फिर से लिखा जा सकता है:

नतीजतन, आयाम एम + 1 के रैखिक समीकरणों की एक प्रणाली प्राप्त हुई, जिसमें एम + 1 अज्ञात शामिल हैं। इस प्रणाली को रैखिक बीजीय समीकरणों को हल करने के लिए किसी भी विधि का उपयोग करके हल किया जा सकता है (उदाहरण के लिए, गॉस विधि)। समाधान के परिणामस्वरूप, अनुमानित फ़ंक्शन के अज्ञात पैरामीटर पाए जाएंगे जो मूल डेटा से अनुमानित फ़ंक्शन के वर्ग विचलन का न्यूनतम योग प्रदान करते हैं, यानी। सर्वोत्तम संभव द्विघात सन्निकटन। यह याद रखना चाहिए कि यदि प्रारंभिक डेटा का एक भी मान बदलता है, तो सभी गुणांक अपने मूल्यों को बदल देंगे, क्योंकि वे प्रारंभिक डेटा द्वारा पूरी तरह से निर्धारित होते हैं।

रैखिक निर्भरता द्वारा प्रारंभिक डेटा का अनुमान

(रेखीय प्रतिगमन)

एक उदाहरण के रूप में, सन्निकटन फलन को निर्धारित करने की विधि पर विचार करें, जिसे रैखिक संबंध के रूप में दिया गया है। न्यूनतम वर्ग विधि के अनुसार, वर्ग विचलनों के न्यूनतम योग की शर्त इस प्रकार लिखी जाती है:

तालिका के नोडल बिंदुओं के निर्देशांक;

सन्निकटन फलन के अज्ञात गुणांक, जो रैखिक संबंध के रूप में दिए गए हैं।

किसी फ़ंक्शन के न्यूनतम अस्तित्व के लिए एक आवश्यक शर्त अज्ञात चर के संबंध में इसके आंशिक व्युत्पन्न के शून्य की समानता है। नतीजतन, हम समीकरणों की निम्नलिखित प्रणाली प्राप्त करते हैं:

आइए हम समीकरणों की परिणामी रैखिक प्रणाली को रूपांतरित करें।

हम रैखिक समीकरणों की परिणामी प्रणाली को हल करते हैं। विश्लेषणात्मक रूप में अनुमानित कार्य के गुणांक निम्नानुसार निर्धारित किए जाते हैं (क्रैमर की विधि):

ये गुणांक दिए गए सारणीबद्ध मानों (प्रायोगिक डेटा) से अनुमानित फ़ंक्शन के वर्गों के योग को कम करने के मानदंड के अनुसार एक रैखिक सन्निकटन फ़ंक्शन का निर्माण प्रदान करते हैं।

कम से कम वर्गों की विधि को लागू करने के लिए एल्गोरिदम

1. प्रारंभिक डेटा:

माप की संख्या के साथ प्रयोगात्मक डेटा की एक सरणी को देखते हुए N

सन्निकट बहुपद (m) की घात दी गई है

2. गणना एल्गोरिथ्म:

2.1. आयाम के साथ समीकरणों की एक प्रणाली के निर्माण के लिए गुणांक निर्धारित किए जाते हैं

समीकरणों की प्रणाली के गुणांक (समीकरण के बाईं ओर)

- समीकरणों की प्रणाली के वर्ग मैट्रिक्स के स्तंभ संख्या का सूचकांक

रैखिक समीकरणों की प्रणाली के मुक्त सदस्य (समीकरण के दाईं ओर)

- समीकरणों की प्रणाली के वर्ग मैट्रिक्स की पंक्ति संख्या का सूचकांक

2.2. आयाम के साथ रैखिक समीकरणों की एक प्रणाली का गठन।

2.3. घात m के सन्निकट बहुपद के अज्ञात गुणांक ज्ञात करने के लिए रैखिक समीकरणों के निकाय का हल।

2.4 सभी नोडल बिंदुओं पर प्रारंभिक मूल्यों से अनुमानित बहुपद के वर्ग विचलन के योग का निर्धारण

वर्ग विचलन के योग का पाया गया मान न्यूनतम संभव है।

अन्य कार्यों के साथ सन्निकटन

यह ध्यान दिया जाना चाहिए कि कम से कम वर्ग विधि के अनुसार प्रारंभिक डेटा का अनुमान लगाते समय, एक लॉगरिदमिक फ़ंक्शन, एक घातीय फ़ंक्शन, और एक पावर फ़ंक्शन को कभी-कभी अनुमानित फ़ंक्शन के रूप में उपयोग किया जाता है।

लॉग सन्निकटन

उस मामले पर विचार करें जब फॉर्म के लॉगरिदमिक फ़ंक्शन द्वारा अनुमानित कार्य दिया जाता है:

कम से कम वर्ग विधि का सार है प्रवृत्ति मॉडल के मापदंडों को खोजने में जो समय या स्थान में किसी भी यादृच्छिक घटना के विकास की प्रवृत्ति का सबसे अच्छा वर्णन करता है (एक प्रवृत्ति एक ऐसी रेखा है जो इस विकास की प्रवृत्ति को दर्शाती है)। कम से कम वर्ग विधि (ओएलएस) का कार्य न केवल कुछ प्रवृत्ति मॉडल ढूंढना है, बल्कि सबसे अच्छा या इष्टतम मॉडल ढूंढना है। यह मॉडल इष्टतम होगा यदि देखे गए वास्तविक मूल्यों और संबंधित परिकलित प्रवृत्ति मूल्यों के बीच चुकता विचलन का योग न्यूनतम (सबसे छोटा) है:

प्रेक्षित वास्तविक मान के बीच मानक विचलन कहाँ है

और संगत परिकलित प्रवृत्ति मूल्य,

अध्ययन के तहत घटना का वास्तविक (मनाया) मूल्य,

ट्रेंड मॉडल का अनुमानित मूल्य,

अध्ययन के तहत घटना की टिप्पणियों की संख्या।

MNC का उपयोग शायद ही कभी अपने आप होता है। एक नियम के रूप में, अक्सर इसका उपयोग केवल सहसंबंध अध्ययन में एक आवश्यक तकनीक के रूप में किया जाता है। यह याद रखना चाहिए कि एलएसएम का सूचना आधार केवल एक विश्वसनीय सांख्यिकीय श्रृंखला हो सकती है, और टिप्पणियों की संख्या 4 से कम नहीं होनी चाहिए, अन्यथा, एलएसएम की चौरसाई प्रक्रियाएं अपना सामान्य ज्ञान खो सकती हैं।

OLS टूलकिट को निम्न प्रक्रियाओं में घटाया गया है:

पहली प्रक्रिया। यह पता चलता है कि क्या चयनित कारक-तर्क में परिवर्तन होने पर परिणामी विशेषता को बदलने की कोई प्रवृत्ति है, या दूसरे शब्दों में, क्या "के बीच कोई संबंध है या नहीं" पर " और " एक्स ».

दूसरी प्रक्रिया। यह निर्धारित किया जाता है कि कौन सी रेखा (प्रक्षेपवक्र) इस प्रवृत्ति का वर्णन या वर्णन करने में सबसे अच्छी है।

तीसरी प्रक्रिया।

उदाहरण. मान लीजिए हमारे पास अध्ययनाधीन खेत के लिए सूरजमुखी की औसत उपज के बारे में जानकारी है (सारणी 9.1)।

तालिका 9.1

अवलोकन संख्या

उत्पादकता, सी/हे

चूंकि हमारे देश में सूरजमुखी के उत्पादन में प्रौद्योगिकी का स्तर पिछले 10 वर्षों में ज्यादा नहीं बदला है, इसका मतलब है कि, सबसे अधिक संभावना है, विश्लेषण की अवधि में उपज में उतार-चढ़ाव मौसम और जलवायु परिस्थितियों में उतार-चढ़ाव पर निर्भर करता है। क्या यह सच है?

पहली बहुराष्ट्रीय कंपनी प्रक्रिया। विश्लेषण किए गए 10 वर्षों में मौसम और जलवायु परिस्थितियों में परिवर्तन के आधार पर सूरजमुखी की उपज में परिवर्तन की प्रवृत्ति के अस्तित्व के बारे में परिकल्पना का परीक्षण किया जा रहा है।

इस उदाहरण में, के लिए " आप » सूरजमुखी की उपज लेने की सलाह दी जाती है, और « एक्स » विश्लेषण की गई अवधि में देखे गए वर्ष की संख्या है। के बीच किसी भी संबंध के अस्तित्व के बारे में परिकल्पना का परीक्षण करना " एक्स " और " आप » दो तरीकों से किया जा सकता है: मैन्युअल रूप से और कंप्यूटर प्रोग्राम की मदद से। बेशक, कंप्यूटर प्रौद्योगिकी की उपलब्धता के साथ, यह समस्या अपने आप हल हो जाती है। लेकिन, ओएलएस टूलकिट को बेहतर ढंग से समझने के लिए, "के बीच संबंध के अस्तित्व के बारे में परिकल्पना का परीक्षण करना उचित है" एक्स " और " आप » मैन्युअल रूप से, जब केवल एक पेन और एक साधारण कैलकुलेटर हाथ में हों। ऐसे मामलों में, एक प्रवृत्ति के अस्तित्व की परिकल्पना को विश्लेषण की गई समय श्रृंखला की ग्राफिक छवि के स्थान से दृष्टि से सबसे अच्छी तरह से जांचा जाता है - सहसंबंध क्षेत्र:

हमारे उदाहरण में सहसंबंध क्षेत्र धीरे-धीरे बढ़ती रेखा के आसपास स्थित है। यह अपने आप में सूरजमुखी की उपज में परिवर्तन में एक निश्चित प्रवृत्ति के अस्तित्व को इंगित करता है। किसी भी प्रवृत्ति की उपस्थिति के बारे में केवल तभी बोलना असंभव है जब सहसंबंध क्षेत्र एक वृत्त, एक वृत्त, एक कड़ाई से लंबवत या कड़ाई से क्षैतिज बादल जैसा दिखता है, या इसमें बेतरतीब ढंग से बिखरे हुए बिंदु होते हैं। अन्य सभी मामलों में, "के बीच संबंध के अस्तित्व की परिकल्पना की पुष्टि करना आवश्यक है" एक्स " और " आप और अनुसंधान जारी रखें।

दूसरी बहुराष्ट्रीय कंपनी प्रक्रिया। यह निर्धारित किया जाता है कि विश्लेषण की गई अवधि के लिए कौन सी रेखा (प्रक्षेपवक्र) सूरजमुखी की उपज में परिवर्तन की प्रवृत्ति का वर्णन या विशेषता बताने में सक्षम है।

कंप्यूटर प्रौद्योगिकी की उपलब्धता के साथ, इष्टतम प्रवृत्ति का चयन स्वचालित रूप से होता है। "मैनुअल" प्रसंस्करण के साथ, इष्टतम फ़ंक्शन का चुनाव, एक नियम के रूप में, दृश्य तरीके से - सहसंबंध क्षेत्र के स्थान से किया जाता है। यही है, चार्ट के प्रकार के अनुसार, रेखा के समीकरण का चयन किया जाता है, जो अनुभवजन्य प्रवृत्ति (वास्तविक प्रक्षेपवक्र के लिए) के लिए सबसे उपयुक्त है।

जैसा कि आप जानते हैं, प्रकृति में कार्यात्मक निर्भरता की एक विशाल विविधता है, इसलिए उनमें से एक छोटे से हिस्से का भी नेत्रहीन विश्लेषण करना बेहद मुश्किल है। सौभाग्य से, वास्तविक आर्थिक व्यवहार में, अधिकांश संबंधों को या तो एक परवलय, या एक अतिपरवलय, या एक सीधी रेखा द्वारा सटीक रूप से वर्णित किया जा सकता है। इस संबंध में, सर्वोत्तम फ़ंक्शन का चयन करने के लिए "मैनुअल" विकल्प के साथ, आप स्वयं को केवल इन तीन मॉडलों तक सीमित कर सकते हैं।

अतिपरवलय:

दूसरे क्रम का परवलय: :

यह देखना आसान है कि हमारे उदाहरण में, विश्लेषण किए गए 10 वर्षों में सूरजमुखी की उपज में बदलाव की प्रवृत्ति एक सीधी रेखा द्वारा सबसे अच्छी विशेषता है, इसलिए प्रतिगमन समीकरण एक सीधी रेखा समीकरण होगा।

तीसरी प्रक्रिया। इस रेखा की विशेषता वाले प्रतिगमन समीकरण के मापदंडों की गणना की जाती है, या दूसरे शब्दों में, एक विश्लेषणात्मक सूत्र निर्धारित किया जाता है जो सर्वोत्तम प्रवृत्ति मॉडल का वर्णन करता है।

प्रतिगमन समीकरण के मापदंडों के मूल्यों को ढूँढना, हमारे मामले में, पैरामीटर और , एलएसएम का मूल है। यह प्रक्रिया सामान्य समीकरणों की एक प्रणाली को हल करने के लिए कम हो जाती है।

(9.2)

गॉस विधि द्वारा समीकरणों की यह प्रणाली काफी आसानी से हल हो जाती है। याद रखें कि समाधान के परिणामस्वरूप, हमारे उदाहरण में, मापदंडों के मूल्य और पाए जाते हैं। इस प्रकार, पाया गया प्रतिगमन समीकरण का निम्न रूप होगा:

संरेखण के बाद, हमें निम्नलिखित रूप का एक फलन मिलता है: g (x) = x + 1 3 + 1।

हम उपयुक्त मापदंडों की गणना करके इस डेटा को रैखिक संबंध y = a x + b के साथ अनुमानित कर सकते हैं। ऐसा करने के लिए, हमें तथाकथित कम से कम वर्ग विधि को लागू करने की आवश्यकता होगी। प्रयोगात्मक डेटा को सबसे अच्छी तरह से संरेखित करने के लिए आपको यह जांचने के लिए एक चित्र बनाने की भी आवश्यकता होगी।

यांडेक्स.आरटीबी आर-ए-339285-1

OLS वास्तव में क्या है (न्यूनतम वर्ग विधि)

मुख्य चीज जो हमें करने की आवश्यकता है वह है ऐसे रैखिक निर्भरता गुणांकों को खोजना, जिन पर दो चर F (a, b) = i = 1 n (y i - (a x i + b)) 2 के फलन का मान सबसे छोटा होगा। . दूसरे शब्दों में, ए और बी के कुछ मूल्यों के लिए, परिणामी सीधी रेखा से प्रस्तुत डेटा के वर्ग विचलन के योग का न्यूनतम मूल्य होगा। यह न्यूनतम वर्ग विधि का अर्थ है। उदाहरण को हल करने के लिए हमें केवल दो चरों के फलन का चरम ज्ञात करना है।

गुणांक की गणना के लिए सूत्र कैसे प्राप्त करें

गुणांकों की गणना के लिए सूत्र प्राप्त करने के लिए, दो चर वाले समीकरणों की एक प्रणाली को बनाना और हल करना आवश्यक है। ऐसा करने के लिए, हम अभिव्यक्ति F (a , b) = i = 1 n (y i - (a x i + b)) 2 के आंशिक अवकलज की गणना a और b के संबंध में करते हैं और उन्हें 0 के बराबर करते हैं।

एफ (ए, बी) δ ए = 0 δ एफ (ए, बी) δ बी = 0 ⇔ - 2 ∑ मैं = 1 एन (वाई मैं - (ए एक्स आई + बी)) एक्स i = 0 - 2 ∑ मैं = 1 एन ( y i - (a x i + b)) = 0 a i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i ⇔ a i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a i = 1 n x i + n b = ∑ i = 1 n y i

समीकरणों की एक प्रणाली को हल करने के लिए, आप किसी भी तरीके का उपयोग कर सकते हैं, जैसे प्रतिस्थापन या क्रैमर की विधि। नतीजतन, हमें ऐसे सूत्र प्राप्त करने चाहिए जो कम से कम वर्ग विधि का उपयोग करके गुणांक की गणना करें।

n i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n

हमने उन चरों के मानों की गणना की है जिनके लिए फ़ंक्शन
F (a , b) = i = 1 n (y i - (a x i + b)) 2 न्यूनतम मान लेगा। तीसरे पैराग्राफ में हम साबित करेंगे कि ऐसा क्यों है।

यह व्यवहार में कम से कम वर्ग विधि का अनुप्रयोग है। उसके सूत्र, जिसका उपयोग पैरामीटर a को खोजने के लिए किया जाता है, में i = 1 n x i, ∑ i = 1 n y i, ∑ i = 1 n x i y i, ∑ i = 1 n x i 2 और पैरामीटर शामिल हैं।
n - यह प्रयोगात्मक डेटा की मात्रा को दर्शाता है। हम आपको प्रत्येक राशि की अलग से गणना करने की सलाह देते हैं। गुणांक मान b की गणना a के तुरंत बाद की जाती है।

आइए मूल उदाहरण पर वापस जाएं।

उदाहरण 1

यहाँ हमारे पास n बराबर पाँच है। गुणांक सूत्रों में शामिल आवश्यक राशियों की गणना करना अधिक सुविधाजनक बनाने के लिए, हम तालिका को भरते हैं।

मैं = 1 मैं = 2 मैं = 3 मैं = 4 मैं = 5 मैं = 1 5
एक्स मैं 0 1 2 4 5 12
यी 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
एक्स मैं वाई मैं 0 2 , 4 5 , 2 11 , 2 15 33 , 8
एक्स मैं 2 0 1 4 16 25 46

फेसला

चौथी पंक्ति में प्रत्येक व्यक्ति i के लिए तीसरी पंक्ति के मानों को दूसरी पंक्ति के मानों से गुणा करके प्राप्त डेटा होता है। पांचवीं पंक्ति में दूसरे वर्ग का डेटा होता है। अंतिम कॉलम अलग-अलग पंक्तियों के मूल्यों का योग दिखाता है।

आइए हम आवश्यक गुणांक a और b की गणना करने के लिए कम से कम वर्ग विधि का उपयोग करें। ऐसा करने के लिए, अंतिम कॉलम से वांछित मानों को प्रतिस्थापित करें और रकम की गणना करें:

n i = 1 n x i y i - i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n ⇒ a = 5 33 , 8 - 12 12, 9 5 46 - 12 2 बी = 12, 9 - ए 12 5 ए 0, 165 बी ≈ 2, 184

हमने पाया कि वांछित सन्निकटन सीधी रेखा y = 0 , 165 x + 2 , 184 जैसी दिखेगी। अब हमें यह निर्धारित करने की आवश्यकता है कि कौन सी रेखा डेटा का सबसे अच्छा अनुमान लगाएगी - g (x) = x + 1 3 + 1 या 0 , 165 x + 2 , 184 । आइए कम से कम वर्ग विधि का उपयोग करके एक अनुमान लगाएं।

त्रुटि की गणना करने के लिए, हमें 1 = i = 1 n (y i - (a x i + b i)) 2 और σ 2 = ∑ i = 1 n (y i - g (x i)) 2 , न्यूनतम मान एक अधिक उपयुक्त रेखा के अनुरूप होगा।

1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = i = 1 5 (y i - (0, 165 x i + 2, 184)) 2 0, 019 σ 2 = i = 1 n (y i - g (x i)) 2 = = i = 1 5 (y i - (x i + 1 3 + 1)) 2 0 , 096

जवाब: 1 . के बाद से< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
वाई = 0, 165 x + 2, 184।

कम से कम वर्ग विधि को ग्राफिक चित्रण में स्पष्ट रूप से दिखाया गया है। लाल रेखा सीधी रेखा g (x) = x + 1 3 + 1 को चिह्नित करती है, नीली रेखा y = 0, 165 x + 2, 184 को चिह्नित करती है। कच्चे डेटा को गुलाबी बिंदुओं से चिह्नित किया जाता है।

आइए हम बताते हैं कि वास्तव में इस प्रकार के सन्निकटन की आवश्यकता क्यों है।

उनका उपयोग उन समस्याओं में किया जा सकता है जिनके लिए डेटा स्मूथिंग की आवश्यकता होती है, साथ ही उन मामलों में जहां डेटा को प्रक्षेपित या एक्सट्रपलेशन की आवश्यकता होती है। उदाहरण के लिए, ऊपर चर्चा की गई समस्या में, कोई प्रेक्षित मात्रा y का मान x = 3 या x = 6 पर ज्ञात कर सकता है। हमने ऐसे उदाहरणों के लिए एक अलग लेख समर्पित किया है।

एलएसएम विधि का प्रमाण

ए और बी की गणना करते समय न्यूनतम मान लेने के लिए फ़ंक्शन के लिए, यह आवश्यक है कि किसी दिए गए बिंदु पर फॉर्म एफ (ए, बी) के फ़ंक्शन के अंतर के द्विघात रूप का मैट्रिक्स = i = 1 n (y i - (a x i + b)) 2 धनात्मक निश्चित हो। आइए आपको दिखाते हैं कि यह कैसा दिखना चाहिए।

उदाहरण 2

हमारे पास निम्नलिखित फॉर्म का दूसरा क्रम अंतर है:

डी 2 एफ (ए; बी) = δ 2 एफ (ए; बी) δ ए 2 डी 2 ए + 2 δ 2 एफ (ए; बी) δ ए बी डी ए डी बी + δ 2 एफ (ए; बी) δ बी 2 डी 2 बी

फेसला

2 एफ (ए; बी) δ ए 2 = एफ (ए; बी) ए δ ए = = - 2 ∑ आई = 1 एन (वाई आई - (ए एक्स आई + बी)) एक्स आई δ ए = 2 ∑ मैं = 1 n (x i) 2 δ 2 F (a ; b) a b = F (a ; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; b) b 2 = F (a ; b) b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + बी)) बी = 2 ∑ मैं = 1 एन (1) = 2 एन

दूसरे शब्दों में, इसे इस प्रकार लिखा जा सकता है: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 x i = 1 n d a d b + (2 n) d 2 b।

हमने द्विघात रूप M = 2 i = 1 n (x i) 2 2 i = 1 n x i 2 ∑ i = 1 n x i 2 n का मैट्रिक्स प्राप्त किया है।

इस मामले में, व्यक्तिगत तत्वों के मान a और b के आधार पर नहीं बदलेंगे। क्या यह मैट्रिक्स सकारात्मक निश्चित है? इस प्रश्न का उत्तर देने के लिए, आइए देखें कि क्या इसके कोणीय अवयस्क सकारात्मक हैं।

पहले क्रम की गणना कोणीय नाबालिग: 2 i = 1 n (x i) 2 > 0 । चूँकि बिंदु x मैं संपाती नहीं हैं, असमानता सख्त है। आगे की गणना में हम इसे ध्यान में रखेंगे।

हम दूसरे क्रम के कोणीय नाबालिग की गणना करते हैं:

डी ई टी (एम) = 2 ∑ i = 1 n (x i) 2 2 i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - i = 1 n x i 2

उसके बाद, हम गणितीय प्रेरण का उपयोग करके असमानता n i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 के प्रमाण के लिए आगे बढ़ते हैं।

  1. आइए जाँच करें कि क्या यह असमानता मनमानी n के लिए मान्य है। आइए 2 लें और गणना करें:

2 i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = एक्स 1 + एक्स 2 2 > 0

हमें सही समानता मिली (यदि मान x 1 और x 2 मेल नहीं खाते हैं)।

  1. आइए मान लें कि यह असमानता n के लिए सही होगी, अर्थात। n i = 1 n (x i) 2 - i = 1 n x i 2 > 0 - सत्य।
  2. आइए अब n + 1 की वैधता सिद्ध करें, अर्थात्। कि (n + 1) ∑ i = 1 n + 1 (x i) 2 - i = 1 n + 1 x i 2 > 0 यदि n i = 1 n (x i) 2 - i = 1 n x i 2 > 0 ।

हम गणना करते हैं:

(एन + 1) ∑ i = 1 n + 1 (x i) 2 - i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - i = 1 n x i 2 + n x n + 1 2 - x n + 1 i = 1 n x i + ∑ i = 1 n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 एक्स 2 + एक्स 2 2 +। . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1 - एक्स 2) 2 +। . . + (एक्स एन - 1 - एक्स एन) 2 > 0

घुंघराले ब्रेसिज़ में संलग्न अभिव्यक्ति 0 से अधिक होगी (चरण 2 में हमने जो ग्रहण किया था उसके आधार पर), और शेष शब्द 0 से अधिक होंगे क्योंकि वे सभी संख्याओं के वर्ग हैं। हमने असमानता साबित की है।

जवाब:पाया गया a और b फलन F (a, b) = i = 1 n (y i - (a x i + b)) 2 के सबसे छोटे मान के अनुरूप होंगे, जिसका अर्थ है कि वे न्यूनतम वर्ग विधि के आवश्यक पैरामीटर हैं। (एलएसएम)।

यदि आप टेक्स्ट में कोई गलती देखते हैं, तो कृपया उसे हाइलाइट करें और Ctrl+Enter दबाएं

इसका व्यापक रूप से अर्थमिति में इसके मापदंडों की स्पष्ट आर्थिक व्याख्या के रूप में उपयोग किया जाता है।

रेखीय प्रतिगमन को फॉर्म का समीकरण खोजने के लिए कम किया जाता है

या

समीकरण टाइप करें दिए गए पैरामीटर मानों के लिए अनुमति देता है एक्सप्रभावी विशेषता के सैद्धांतिक मूल्य हैं, इसमें कारक के वास्तविक मूल्यों को प्रतिस्थापित करना एक्स.

एक रेखीय प्रतिगमन का निर्माण इसके मापदंडों का अनुमान लगाने के लिए नीचे आता है - और में।रैखिक प्रतिगमन पैरामीटर अनुमान विभिन्न तरीकों से पाए जा सकते हैं।

रेखीय प्रतीपगमन प्राचलों के आकलन के लिए शास्त्रीय उपागम पर आधारित है कम से कम वर्गों(एमएनके)।

एलएसएम किसी को ऐसे पैरामीटर अनुमान प्राप्त करने की अनुमति देता है और में,जिसके तहत परिणामी गुण के वास्तविक मूल्यों के वर्ग विचलन का योग (वाई)गणना से (सैद्धांतिक) मिनी-न्यूनतम:

किसी फ़ंक्शन के न्यूनतम को खोजने के लिए, प्रत्येक पैरामीटर के संबंध में आंशिक डेरिवेटिव की गणना करना आवश्यक है और बीऔर उन्हें शून्य के बराबर करें।

निरूपित एस के माध्यम से, फिर:

सूत्र को बदलने से, हम मापदंडों के आकलन के लिए सामान्य समीकरणों की निम्नलिखित प्रणाली प्राप्त करते हैं: और में:

सामान्य समीकरणों की प्रणाली (3.5) को या तो चर के क्रमिक उन्मूलन की विधि द्वारा या निर्धारकों की विधि द्वारा हल करने पर, हम वांछित पैरामीटर अनुमान पाते हैं और में।

पैरामीटर मेंप्रतिगमन गुणांक कहा जाता है। इसका मान एक इकाई द्वारा कारक में परिवर्तन के साथ परिणाम में औसत परिवर्तन को दर्शाता है।

प्रतिगमन समीकरण हमेशा कनेक्शन की जकड़न के संकेतक के साथ पूरक होता है। रैखिक प्रतिगमन का उपयोग करते समय, रैखिक सहसंबंध गुणांक ऐसे संकेतक के रूप में कार्य करता है। रैखिक सहसंबंध गुणांक सूत्र के विभिन्न संशोधन हैं। उनमें से कुछ नीचे सूचीबद्ध हैं:

जैसा कि आप जानते हैं, रैखिक सहसंबंध गुणांक सीमा के भीतर है: -1 1.

एक रैखिक फ़ंक्शन के चयन की गुणवत्ता का आकलन करने के लिए, वर्ग की गणना की जाती है

एक रैखिक सहसंबंध गुणांक कहा जाता है निर्धारण गुणांक।निर्धारण का गुणांक प्रभावी विशेषता के विचरण के अनुपात को दर्शाता है वाई,परिणामी विशेषता के कुल विचरण में प्रतिगमन द्वारा समझाया गया:

तदनुसार, मान 1 - फैलाव के अनुपात को दर्शाता है वाई,अन्य कारकों के प्रभाव के कारण मॉडल में ध्यान नहीं दिया गया।

आत्म-नियंत्रण के लिए प्रश्न

1. कम से कम वर्गों की विधि का सार?

2. कितने चर एक जोड़ीदार प्रतिगमन प्रदान करते हैं?

3. कौन सा गुणांक परिवर्तनों के बीच संबंध की जकड़न को निर्धारित करता है?

4. निर्धारण का गुणांक किस सीमा के भीतर निर्धारित किया जाता है?

5. सहसंबंध-प्रतिगमन विश्लेषण में पैरामीटर बी का अनुमान?

1. क्रिस्टोफर डौघर्टी। अर्थमिति का परिचय। - एम .: इंफ्रा - एम, 2001 - 402 पी।

2. एस.ए. बोरोडिच। अर्थमिति। मिन्स्क एलएलसी "नया ज्ञान" 2001।


3. आर.यू. अर्थमिति में राखमेतोवा लघु पाठ्यक्रम। ट्यूटोरियल। अल्माटी। 2004. -78s।

4. आई.आई. एलिसेवा। अर्थमिति। - एम .: "वित्त और सांख्यिकी", 2002

5. मासिक सूचना और विश्लेषणात्मक पत्रिका।

गैर-रेखीय आर्थिक मॉडल। नॉनलाइनियर रिग्रेशन मॉडल। परिवर्तनीय रूपांतरण।

अरेखीय आर्थिक मॉडल ..

परिवर्तनीय रूपांतरण।

लोच गुणांक।

यदि आर्थिक घटनाओं के बीच गैर-रेखीय संबंध हैं, तो उन्हें संबंधित गैर-रैखिक कार्यों का उपयोग करके व्यक्त किया जाता है: उदाहरण के लिए, एक समबाहु अतिपरवलय , दूसरी डिग्री परवलय और आदि।

गैर-रैखिक प्रतिगमन के दो वर्ग हैं:

1. ऐसे प्रतिगमन जो विश्लेषण में शामिल व्याख्यात्मक चर के संबंध में गैर-रैखिक हैं, लेकिन अनुमानित मापदंडों के संबंध में रैखिक हैं, उदाहरण के लिए:

विभिन्न अंशों के बहुपद - , ;

समबाहु अतिशयोक्ति - ;

सेमीलॉगरिदमिक फंक्शन - .

2. अनुमानित मापदंडों में गैर-रैखिक प्रतिगमन, उदाहरण के लिए:

शक्ति - ;

प्रदर्शनकारी -;

घातांक - .

परिणामी विशेषता के व्यक्तिगत मूल्यों के वर्ग विचलन का कुल योग परऔसत मूल्य से कई कारकों के प्रभाव के कारण होता है। हम सशर्त रूप से कारणों के पूरे सेट को दो समूहों में विभाजित करते हैं: अध्ययन कारक xऔर अन्य कारक।

यदि कारक परिणाम को प्रभावित नहीं करता है, तो ग्राफ पर प्रतिगमन रेखा अक्ष के समानांतर होती है ओहऔर

तब परिणामी विशेषता का संपूर्ण फैलाव अन्य कारकों के प्रभाव के कारण होता है और वर्ग विचलन का कुल योग अवशिष्ट के साथ मेल खाएगा। यदि अन्य कारक परिणाम को प्रभावित नहीं करते हैं, तो तुम बंधे होसाथ एक्सकार्यात्मक रूप से, और वर्गों का अवशिष्ट योग शून्य है। इस मामले में, प्रतिगमन द्वारा समझाया गया वर्ग विचलन का योग वर्गों के कुल योग के समान है।

चूंकि सहसंबंध क्षेत्र के सभी बिंदु प्रतिगमन रेखा पर नहीं होते हैं, इसलिए उनका बिखराव हमेशा कारक के प्रभाव के कारण होता है एक्स, यानी प्रतिगमन परपर एक्स,और अन्य कारणों (अस्पष्टीकृत भिन्नता) की कार्रवाई के कारण होता है। पूर्वानुमान के लिए प्रतीपगमन रेखा की उपयुक्तता इस बात पर निर्भर करती है कि विशेषता के कुल परिवर्तन का कौन सा भाग है परसमझाया भिन्नता के लिए खाते

जाहिर है, यदि प्रतिगमन के कारण वर्ग विचलन का योग वर्गों के अवशिष्ट योग से अधिक है, तो प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण है और कारक एक्सपरिणाम पर महत्वपूर्ण प्रभाव पड़ता है। वाई

, यानी सुविधा की स्वतंत्र भिन्नता की स्वतंत्रता की संख्या के साथ। स्वतंत्रता की डिग्री की संख्या जनसंख्या n की इकाइयों की संख्या और इससे निर्धारित स्थिरांक की संख्या से संबंधित है। अध्ययन के तहत समस्या के संबंध में, स्वतंत्रता की डिग्री की संख्या से पता चलता है कि कितने स्वतंत्र विचलन हैं पी

समग्र रूप से समाश्रयण समीकरण के महत्व का आकलन किसकी सहायता से दिया गया है? एफ- फिशर की कसौटी। इस मामले में, एक शून्य परिकल्पना सामने रखी जाती है कि प्रतिगमन गुणांक शून्य के बराबर है, अर्थात। ख = 0, और इसलिए कारक एक्सपरिणाम को प्रभावित नहीं करता वाई

एफ-मानदंड की प्रत्यक्ष गणना विचरण के विश्लेषण से पहले होती है। इसका केंद्र चर के वर्ग विचलन के कुल योग का विस्तार है परऔसत मूल्य से परदो भागों में - "समझाया" और "अस्पष्टीकृत":

- चुकता विचलन का कुल योग;

- प्रतिगमन द्वारा समझाया गया वर्ग विचलन का योग;

विचलन के वर्गों का अवशिष्ट योग है।

वर्ग विचलन का कोई भी योग स्वतंत्रता की डिग्री की संख्या से संबंधित है , यानी सुविधा की स्वतंत्र भिन्नता की स्वतंत्रता की संख्या के साथ। स्वतंत्रता की डिग्री की संख्या जनसंख्या इकाइयों की संख्या से संबंधित है एनऔर इससे निर्धारित स्थिरांक की संख्या के साथ। अध्ययन के तहत समस्या के संबंध में, स्वतंत्रता की डिग्री की संख्या से पता चलता है कि कितने स्वतंत्र विचलन हैं पीदिए गए वर्गों का योग बनाने के लिए संभव है।

स्वतंत्रता की प्रति डिग्री फैलावडी.

एफ-अनुपात (एफ-मानदंड):

यदि शून्य परिकल्पना सत्य है, तो कारक और अवशिष्ट प्रसरण एक दूसरे से भिन्न नहीं होते हैं। एच 0 के लिए, एक खंडन आवश्यक है ताकि कारक विचरण कई बार अवशिष्ट से अधिक हो। अंग्रेजी सांख्यिकीविद् स्नेडेकोर ने महत्वपूर्ण मूल्यों की सारणी विकसित की एफ-अशक्त परिकल्पना के महत्व के विभिन्न स्तरों पर संबंध और स्वतंत्रता की एक अलग संख्या। तालिका मूल्य एफ-मानदंड भिन्नताओं के अनुपात का अधिकतम मूल्य है जो तब हो सकता है जब वे एक शून्य परिकल्पना की उपस्थिति की संभावना के दिए गए स्तर के लिए यादृच्छिक रूप से विचलन करते हैं। परिकलित मूल्य एफ-संबंध को विश्वसनीय माना जाता है यदि o सारणीबद्ध से बड़ा है।

इस मामले में, सुविधाओं के संबंध की अनुपस्थिति के बारे में शून्य परिकल्पना को खारिज कर दिया जाता है और इस संबंध के महत्व के बारे में निष्कर्ष निकाला जाता है: एफ तथ्य> एफ टेबलएच 0 खारिज कर दिया है।

यदि मान तालिका से कम है एफ तथ्य ‹, एफ तालिका, तो शून्य परिकल्पना की संभावना किसी दिए गए स्तर से अधिक है और रिश्ते की उपस्थिति के बारे में गलत निष्कर्ष निकालने के गंभीर जोखिम के बिना इसे खारिज नहीं किया जा सकता है। इस मामले में, प्रतिगमन समीकरण को सांख्यिकीय रूप से महत्वहीन माना जाता है। एन ओ विचलित नहीं होता है।

प्रतिगमन गुणांक की मानक त्रुटि

प्रतिगमन गुणांक के महत्व का आकलन करने के लिए, इसके मूल्य की तुलना इसकी मानक त्रुटि से की जाती है, अर्थात वास्तविक मूल्य निर्धारित किया जाता है टी-छात्र की कसौटी: जो तब एक निश्चित स्तर के महत्व और स्वतंत्रता की डिग्री की संख्या पर सारणीबद्ध मूल्य के साथ तुलना की जाती है ( एन- 2).

पैरामीटर मानक त्रुटि :

त्रुटि के परिमाण के आधार पर रैखिक सहसंबंध गुणांक के महत्व की जाँच की जाती है सहसंबंध गुणांक आर:

एक विशेषता का कुल विचरण एक्स:

एकाधिक रेखीय प्रतिगमन

प्रतिरूप निर्माण

बहु - प्रतिगमनदो या दो से अधिक कारकों के साथ एक प्रभावी विशेषता का प्रतिगमन है, यानी फॉर्म का एक मॉडल

यदि अध्ययन की वस्तु को प्रभावित करने वाले अन्य कारकों के प्रभाव की उपेक्षा की जा सकती है, तो प्रतिगमन मॉडलिंग में एक अच्छा परिणाम दे सकता है। व्यक्तिगत आर्थिक चरों के व्यवहार को नियंत्रित नहीं किया जा सकता है, अर्थात् अध्ययन के तहत एक कारक के प्रभाव का आकलन करने के लिए अन्य सभी स्थितियों की समानता सुनिश्चित करना संभव नहीं है। इस मामले में, आपको अन्य कारकों के प्रभाव को मॉडल में पेश करके पहचानने की कोशिश करनी चाहिए, यानी एक बहु प्रतिगमन समीकरण का निर्माण करना चाहिए: वाई = ए+बी 1 एक्स 1 +बी 2 +…+बी पी एक्स पी + .

एकाधिक प्रतिगमन का मुख्य लक्ष्य बड़ी संख्या में कारकों के साथ एक मॉडल का निर्माण करना है, जबकि उनमें से प्रत्येक के प्रभाव को व्यक्तिगत रूप से निर्धारित करना, साथ ही साथ मॉडलिंग संकेतक पर उनके संचयी प्रभाव का निर्धारण करना है। मॉडल के विनिर्देश में प्रश्नों के दो क्षेत्र शामिल हैं: कारकों का चयन और प्रतिगमन समीकरण के प्रकार का चुनाव