गुणांकों और समीकरणों के महत्व का आकलन। युग्मित रैखिक प्रतिगमन के समीकरण के मापदंडों के महत्व का अनुमान

प्रतिगमन विश्लेषण एक सांख्यिकीय अनुसंधान पद्धति है जो आपको एक या अधिक स्वतंत्र चर पर एक पैरामीटर की निर्भरता दिखाने की अनुमति देती है। प्री-कंप्यूटर युग में, इसका उपयोग काफी कठिन था, खासकर जब यह बड़ी मात्रा में डेटा की बात आती थी। आज, एक्सेल में रिग्रेशन बनाने का तरीका जानने के बाद, आप कुछ ही मिनटों में जटिल सांख्यिकीय समस्याओं को हल कर सकते हैं। अर्थशास्त्र के क्षेत्र से विशिष्ट उदाहरण नीचे दिए गए हैं।

प्रतिगमन के प्रकार

इस अवधारणा को ही 1886 में गणित में पेश किया गया था। प्रतिगमन होता है:

  • रैखिक;
  • परवलयिक;
  • शक्ति;
  • घातीय;
  • अतिपरवलिक;
  • प्रदर्शनकारी;
  • लघुगणक

उदाहरण 1

6 औद्योगिक उद्यमों में औसत वेतन पर सेवानिवृत्त टीम के सदस्यों की संख्या की निर्भरता निर्धारित करने की समस्या पर विचार करें।

काम। छह उद्यमों में, हमने औसत मासिक वेतन और कर्मचारियों की संख्या का विश्लेषण किया, जो अपनी मर्जी से चले गए। सारणीबद्ध रूप में हमारे पास है:

छोड़ने वालों की संख्या

वेतन

30000 रूबल

35000 रूबल

40000 रूबल

45000 रूबल

50000 रूबल

55000 रूबल

60000 रूबल

6 उद्यमों में औसत वेतन पर सेवानिवृत्त श्रमिकों की संख्या की निर्भरता निर्धारित करने की समस्या के लिए, प्रतिगमन मॉडल में समीकरण Y = a 0 + a 1 x 1 +…+a k x k का रूप होता है, जहां x i प्रभावित करने वाले चर हैं , a i प्रतिगमन गुणांक हैं, a k कारकों की संख्या है।

इस कार्य के लिए, Y छोड़ने वाले कर्मचारियों का संकेतक है, और प्रभावित करने वाला कारक वेतन है, जिसे हम X से दर्शाते हैं।

स्प्रेडशीट "एक्सेल" की क्षमताओं का उपयोग करना

एक्सेल में रिग्रेशन विश्लेषण उपलब्ध सारणीबद्ध डेटा के लिए अंतर्निहित कार्यों के आवेदन से पहले होना चाहिए। हालांकि, इन उद्देश्यों के लिए, बहुत उपयोगी ऐड-इन "विश्लेषण टूलकिट" का उपयोग करना बेहतर है। इसे सक्रिय करने के लिए आपको चाहिए:

  • "फ़ाइल" टैब से, "विकल्प" अनुभाग पर जाएं;
  • खुलने वाली विंडो में, "ऐड-ऑन" लाइन का चयन करें;
  • "प्रबंधन" लाइन के दाईं ओर नीचे स्थित "गो" बटन पर क्लिक करें;
  • "विश्लेषण पैकेज" नाम के बगल में स्थित बॉक्स को चेक करें और "ओके" पर क्लिक करके अपने कार्यों की पुष्टि करें।

यदि सब कुछ सही ढंग से किया जाता है, तो वांछित बटन एक्सेल वर्कशीट के ऊपर स्थित डेटा टैब के दाईं ओर दिखाई देगा।

एक्सेल में

अब जब हमारे पास अर्थमितीय गणना करने के लिए सभी आवश्यक आभासी उपकरण हैं, तो हम अपनी समस्या को हल करना शुरू कर सकते हैं। इसके लिए:

  • "डेटा विश्लेषण" बटन पर क्लिक करें;
  • खुलने वाली विंडो में, "रिग्रेशन" बटन पर क्लिक करें;
  • दिखाई देने वाले टैब में, Y (छोड़ने वाले कर्मचारियों की संख्या) और X (उनका वेतन) के लिए मानों की श्रेणी दर्ज करें;
  • हम "ओके" बटन दबाकर अपने कार्यों की पुष्टि करते हैं।

परिणामस्वरूप, प्रोग्राम स्वचालित रूप से प्रतिगमन विश्लेषण डेटा के साथ स्प्रेडशीट की एक नई शीट को पॉप्युलेट करेगा। टिप्पणी! एक्सेल में इस उद्देश्य के लिए आपके द्वारा पसंद किए जाने वाले स्थान को मैन्युअल रूप से सेट करने की क्षमता है। उदाहरण के लिए, यह वही शीट हो सकती है जहां वाई और एक्स मान हैं, या यहां तक ​​​​कि विशेष रूप से ऐसे डेटा को स्टोर करने के लिए डिज़ाइन की गई एक नई कार्यपुस्तिका भी हो सकती है।

आर-स्क्वायर के लिए प्रतिगमन परिणामों का विश्लेषण

एक्सेल में, माना उदाहरण के डेटा के प्रसंस्करण के दौरान प्राप्त डेटा इस तरह दिखता है:

सबसे पहले आपको आर-स्क्वायर की वैल्यू पर ध्यान देना चाहिए। यह निर्धारण का गुणांक है। इस उदाहरण में, आर-स्क्वायर = 0.755 (75.5%), यानी, मॉडल के परिकलित पैरामीटर 75.5% द्वारा माने गए मापदंडों के बीच संबंध की व्याख्या करते हैं। निर्धारण गुणांक का मान जितना अधिक होगा, किसी विशेष कार्य के लिए चुना गया मॉडल उतना ही अधिक लागू होगा। ऐसा माना जाता है कि यह 0.8 से ऊपर के आर-वर्ग मान के साथ वास्तविक स्थिति का सही वर्णन करता है। अगर R-वर्ग<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

अनुपात विश्लेषण

संख्या 64.1428 दर्शाती है कि Y का मान क्या होगा यदि हम जिस मॉडल पर विचार कर रहे हैं उसमें सभी चर xi शून्य पर सेट हैं। दूसरे शब्दों में, यह तर्क दिया जा सकता है कि विश्लेषण किए गए पैरामीटर का मूल्य अन्य कारकों से भी प्रभावित होता है जो किसी विशेष मॉडल में वर्णित नहीं हैं।

सेल B18 में स्थित अगला गुणांक -0.16285, Y पर चर X के प्रभाव के भार को दर्शाता है। इसका मतलब है कि विचाराधीन मॉडल के भीतर कर्मचारियों का औसत मासिक वेतन -0.16285 के वजन के साथ छोड़ने वालों की संख्या को प्रभावित करता है, अर्थात। इसके प्रभाव की डिग्री बिल्कुल छोटी है। "-" चिह्न इंगित करता है कि गुणांक का ऋणात्मक मान है। यह स्पष्ट है, क्योंकि हर कोई जानता है कि उद्यम में वेतन जितना अधिक होता है, उतने ही कम लोग रोजगार अनुबंध को समाप्त करने या छोड़ने की इच्छा व्यक्त करते हैं।

बहु - प्रतिगमन

यह शब्द फॉर्म के कई स्वतंत्र चर के साथ एक कनेक्शन समीकरण को संदर्भित करता है:

y \u003d f (x 1 + x 2 + ... x m) + , जहां y प्रभावी विशेषता (आश्रित चर) है, और x 1 , x 2 , ... x m कारक कारक (स्वतंत्र चर) हैं।

पैरामीटर अनुमान

एकाधिक प्रतिगमन (MR) के लिए इसे कम से कम वर्गों (OLS) की विधि का उपयोग करके किया जाता है। Y = a + b 1 x 1 +…+b m x m + के रूप के रैखिक समीकरणों के लिए, हम सामान्य समीकरणों की एक प्रणाली का निर्माण करते हैं (नीचे देखें)

विधि के सिद्धांत को समझने के लिए, दो-कारक मामले पर विचार करें। तब हमारे पास सूत्र द्वारा वर्णित स्थिति होती है

यहाँ से हमें मिलता है:

जहां सूचकांक में परिलक्षित संबंधित विशेषता का प्रसरण है।

एलएसएम एक मानक पैमाने पर एमपी समीकरण पर लागू होता है। इस मामले में, हमें समीकरण मिलता है:

जहाँ t y , t x 1,… t xm मानकीकृत चर हैं जिनके लिए माध्य मान 0 हैं; β मैं मानकीकृत प्रतिगमन गुणांक हैं, और मानक विचलन 1 है।

कृपया ध्यान दें कि इस मामले में सभी β i को सामान्यीकृत और केंद्रीकृत के रूप में सेट किया गया है, इसलिए एक दूसरे के साथ उनकी तुलना को सही और स्वीकार्य माना जाता है। इसके अलावा, यह βi के सबसे छोटे मूल्यों वाले कारकों को छोड़कर, कारकों को फ़िल्टर करने के लिए प्रथागत है।

रैखिक प्रतिगमन समीकरण का उपयोग करने में समस्या

मान लीजिए कि पिछले 8 महीनों के दौरान किसी विशेष उत्पाद एन की कीमत की गतिशीलता की एक तालिका है। 1850 रूबल / टी की कीमत पर इसके बैच को खरीदने की सलाह पर निर्णय लेना आवश्यक है।

माह संख्या

महीने का नाम

आइटम नंबर की कीमत

1750 रूबल प्रति टन

1755 रूबल प्रति टन

1767 रूबल प्रति टन

1760 रूबल प्रति टन

1770 रूबल प्रति टन

1790 रूबल प्रति टन

1810 रूबल प्रति टन

1840 रूबल प्रति टन

एक्सेल स्प्रेडशीट में इस समस्या को हल करने के लिए, आपको उपरोक्त उदाहरण से पहले से ज्ञात डेटा विश्लेषण टूल का उपयोग करने की आवश्यकता है। अगला, "रिग्रेशन" अनुभाग चुनें और पैरामीटर सेट करें। यह याद रखना चाहिए कि "इनपुट वाई अंतराल" फ़ील्ड में, आश्रित चर के लिए मूल्यों की एक श्रृंखला (इस मामले में, वर्ष के विशिष्ट महीनों में उत्पाद की कीमत) दर्ज की जानी चाहिए, और "इनपुट" में X अंतराल" - स्वतंत्र चर (माह संख्या) के लिए। "ओके" पर क्लिक करके कार्रवाई की पुष्टि करें। एक नई शीट पर (यदि ऐसा संकेत दिया गया था), हमें प्रतिगमन के लिए डेटा मिलता है।

उनके आधार पर, हम y=ax+b फॉर्म का एक रैखिक समीकरण बनाते हैं, जहां पैरामीटर ए और बी महीने की संख्या के नाम के साथ पंक्ति के गुणांक हैं और गुणांक और "वाई-चौराहे" पंक्ति से प्रतिगमन विश्लेषण के परिणामों के साथ शीट। इस प्रकार, समस्या 3 के लिए रैखिक समाश्रयण समीकरण (LE) को इस प्रकार लिखा जाता है:

उत्पाद की कीमत एन = 11.714* माह संख्या + 1727.54।

या बीजीय संकेतन में

वाई = 11.714 एक्स + 1727.54

परिणामों का विश्लेषण

यह तय करने के लिए कि परिणामी रैखिक प्रतिगमन समीकरण पर्याप्त है, एकाधिक सहसंबंध गुणांक (एमसीसी) और निर्धारण गुणांक का उपयोग किया जाता है, साथ ही फिशर का परीक्षण और छात्र का परीक्षण। प्रतिगमन परिणामों के साथ एक्सेल तालिका में, वे क्रमशः एकाधिक आर, आर-वर्ग, एफ-सांख्यिकी और टी-सांख्यिकी के नामों के तहत दिखाई देते हैं।

केएमसी आर स्वतंत्र और आश्रित चर के बीच संभाव्य संबंध की मजबूती का आकलन करना संभव बनाता है। इसका उच्च मूल्य चर "महीने की संख्या" और "माल की कीमत एन प्रति 1 टन रूबल में" के बीच काफी मजबूत संबंध को इंगित करता है। हालाँकि, इस रिश्ते की प्रकृति अज्ञात बनी हुई है।

निर्धारण गुणांक का वर्ग R 2 (RI) कुल प्रकीर्णन के हिस्से की एक संख्यात्मक विशेषता है और प्रयोगात्मक डेटा के किस भाग के बिखराव को दर्शाता है, अर्थात। आश्रित चर के मान रैखिक प्रतिगमन समीकरण से मेल खाते हैं। विचाराधीन समस्या में, यह मान 84.8% के बराबर है, अर्थात्, प्राप्त एसडी द्वारा सांख्यिकीय डेटा को उच्च स्तर की सटीकता के साथ वर्णित किया गया है।

एफ-सांख्यिकी, जिसे फिशर का परीक्षण भी कहा जाता है, का उपयोग एक रैखिक संबंध के महत्व का आकलन करने के लिए किया जाता है, इसके अस्तित्व की परिकल्पना का खंडन या पुष्टि करता है।

(छात्र की कसौटी) एक रैखिक संबंध के अज्ञात या मुक्त पद के साथ गुणांक के महत्व का मूल्यांकन करने में मदद करता है। यदि t-मानदंड का मान> t करोड़, तो रैखिक समीकरण के मुक्त पद के महत्व की परिकल्पना को खारिज कर दिया जाता है।

मुक्त सदस्य के लिए विचाराधीन समस्या में, एक्सेल टूल्स का उपयोग करके, यह प्राप्त किया गया था कि t = 169.20903, और p = 2.89E-12, यानी, हमारे पास एक शून्य संभावना है कि स्वतंत्र सदस्य के महत्व के बारे में सही परिकल्पना होगी खारिज किया जाए। अज्ञात t=5.79405, और p=0.001158 पर गुणांक के लिए। दूसरे शब्दों में, अज्ञात के लिए गुणांक के महत्व के बारे में सही परिकल्पना के खारिज होने की संभावना 0.12% है।

इस प्रकार, यह तर्क दिया जा सकता है कि परिणामी रैखिक प्रतिगमन समीकरण पर्याप्त है।

शेयरों का एक ब्लॉक खरीदने की समीचीनता की समस्या

एक्सेल में मल्टीपल रिग्रेशन एक ही डेटा एनालिसिस टूल का उपयोग करके किया जाता है। एक विशिष्ट लागू समस्या पर विचार करें।

NNN के प्रबंधन को MMM SA में 20% हिस्सेदारी खरीदने की उपयुक्तता पर निर्णय लेना चाहिए। पैकेज की लागत (जेवी) 70 मिलियन अमेरिकी डॉलर है। एनएनएन विशेषज्ञों ने समान लेनदेन पर डेटा एकत्र किया। लाखों अमेरिकी डॉलर में व्यक्त किए गए ऐसे मापदंडों के अनुसार शेयरों के ब्लॉक के मूल्य का मूल्यांकन करने का निर्णय लिया गया, जैसे:

  • देय खाते (वीके);
  • वार्षिक कारोबार (वीओ);
  • प्राप्य खाते (वीडी);
  • अचल संपत्तियों की लागत (एसओएफ)।

इसके अलावा, हजारों अमेरिकी डॉलर में उद्यम (V3 P) के पैरामीटर पेरोल बकाया का उपयोग किया जाता है।

एक्सेल स्प्रेडशीट का उपयोग कर समाधान

सबसे पहले, आपको प्रारंभिक डेटा की एक तालिका बनाने की आवश्यकता है। यह इस तरह दिख रहा है:

  • "डेटा विश्लेषण" विंडो को कॉल करें;
  • "प्रतिगमन" अनुभाग का चयन करें;
  • बॉक्स में "इनपुट अंतराल वाई" कॉलम जी से आश्रित चर के मूल्यों की श्रेणी दर्ज करें;
  • "इनपुट अंतराल X" विंडो के दाईं ओर लाल तीर वाले आइकन पर क्लिक करें और शीट पर कॉलम B, C, D, F से सभी मानों की श्रेणी चुनें।

"नई वर्कशीट" चुनें और "ओके" पर क्लिक करें।

दी गई समस्या के लिए प्रतिगमन विश्लेषण प्राप्त करें।

परिणामों और निष्कर्षों की जांच

एक्सेल स्प्रेडशीट शीट पर ऊपर प्रस्तुत गोल डेटा से "हम एकत्र करते हैं", प्रतिगमन समीकरण:

एसपी \u003d 0.103 * एसओएफ + 0.541 * वीओ - 0.031 * वीके + 0.405 * वीडी + 0.691 * वीजेडपी - 265.844।

अधिक परिचित गणितीय रूप में, इसे इस प्रकार लिखा जा सकता है:

y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

JSC "MMM" के लिए डेटा तालिका में प्रस्तुत किया गया है:

उन्हें प्रतिगमन समीकरण में प्रतिस्थापित करने पर, उन्हें 64.72 मिलियन अमेरिकी डॉलर का आंकड़ा मिलता है। इसका मतलब है कि जेएससी एमएमएम के शेयर नहीं खरीदे जाने चाहिए, क्योंकि उनका मूल्य 70 मिलियन अमेरिकी डॉलर अधिक है।

जैसा कि आप देख सकते हैं, एक्सेल स्प्रेडशीट और रिग्रेशन समीकरण के उपयोग ने एक बहुत ही विशिष्ट लेनदेन की व्यवहार्यता के बारे में एक सूचित निर्णय लेना संभव बना दिया है।

अब आप जानते हैं कि प्रतिगमन क्या है। ऊपर चर्चा किए गए एक्सेल में उदाहरण आपको अर्थमिति के क्षेत्र से व्यावहारिक समस्याओं को हल करने में मदद करेंगे।

रेखीय प्रतिगमन समीकरण मिलने के बाद, समग्र रूप से समीकरण और उसके व्यक्तिगत मापदंडों दोनों के महत्व का आकलन किया जाता है।

प्रतिगमन समीकरण के महत्व की जाँच करें - इसका मतलब यह स्थापित करना है कि गणितीय मॉडल जो चर के बीच संबंध व्यक्त करता है, प्रयोगात्मक डेटा से मेल खाता है और क्या आश्रित चर का वर्णन करने के लिए समीकरण (एक या अधिक) में पर्याप्त व्याख्यात्मक चर शामिल हैं।

महत्व परीक्षण विचरण के विश्लेषण पर आधारित है।

विचरण के विश्लेषण के विचार के अनुसार, माध्य मान से y के वर्ग विचलन (RMS) का कुल योग दो भागों में विघटित होता है - समझाया और अस्पष्टीकृत:

या, क्रमशः:

यहां दो चरम मामले हैं: जब कुल मानक विचलन बिल्कुल अवशिष्ट के बराबर होता है और जब कुल मानक विचलन भाज्य के बराबर होता है।

पहले मामले में, x कारक परिणाम को प्रभावित नहीं करता है, y का संपूर्ण विचरण अन्य कारकों के प्रभाव के कारण होता है, प्रतिगमन रेखा ऑक्स अक्ष के समानांतर होती है, और समीकरण जैसा दिखना चाहिए।

दूसरे मामले में, अन्य कारक परिणाम को प्रभावित नहीं करते हैं, y कार्यात्मक रूप से x से संबंधित है, और अवशिष्ट मानक विचलन शून्य है।

हालाँकि, व्यवहार में दोनों शब्द दायीं ओर मौजूद हैं। भविष्यवाणी के लिए प्रतिगमन रेखा की उपयुक्तता इस बात पर निर्भर करती है कि y में कुल विचरण का कितना हिस्सा समझाया गया है। यदि समझाया गया आरएमएसडी अवशिष्ट आरएमएसडी से अधिक है, तो प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण है और x कारक का y परिणाम पर महत्वपूर्ण प्रभाव पड़ता है। यह इस तथ्य के बराबर है कि दृढ़ संकल्प का गुणांक एकता के करीब पहुंच जाएगा।

स्वतंत्रता की डिग्री की संख्या (डीएफ-स्वतंत्रता की डिग्री) स्वतंत्र रूप से चर विशेषता मूल्यों की संख्या है।

समग्र मानक विचलन के लिए (n-1) स्वतंत्र विचलन की आवश्यकता होती है,

फैक्टोरियल मानक विचलन में स्वतंत्रता की एक डिग्री होती है, और

इस प्रकार, हम लिख सकते हैं:

इस संतुलन से, हम यह निर्धारित करते हैं कि = n-2।

प्रत्येक मानक विचलन को उसकी स्वतंत्रता की डिग्री की संख्या से विभाजित करके, हमें विचलन का माध्य वर्ग, या प्रति एक डिग्री स्वतंत्रता का विचरण मिलता है: - कुल विचरण, - भाज्य, - अवशिष्ट।

रैखिक प्रतिगमन गुणांक के सांख्यिकीय महत्व का विश्लेषण

यद्यपि रैखिक निर्भरता समीकरण के गुणांकों के सैद्धांतिक मूल्यों को स्थिर माना जाता है, यादृच्छिक नमूनाकरण डेटा से समीकरण के निर्माण के दौरान प्राप्त इन गुणांकों के ए और बी के अनुमान यादृच्छिक चर हैं। यदि प्रतिगमन त्रुटियों को सामान्य रूप से वितरित किया जाता है, तो गुणांक अनुमान भी सामान्य रूप से वितरित किए जाते हैं और उनके साधनों और विचरण की विशेषता हो सकती है। इसलिए, इन विशेषताओं की गणना के साथ गुणांक का विश्लेषण शुरू होता है।

गुणांक प्रसरणों की गणना सूत्रों द्वारा की जाती है:

प्रतिगमन गुणांक का प्रसरण:

प्रति एक डिग्री स्वतंत्रता के लिए अवशिष्ट फैलाव कहाँ है।

पैरामीटर फैलाव:

इसलिए, प्रतिगमन गुणांक की मानक त्रुटि सूत्र द्वारा निर्धारित की जाती है:

पैरामीटर की मानक त्रुटि सूत्र द्वारा निर्धारित की जाती है:

वे अशक्त परिकल्पनाओं का परीक्षण करने के लिए कार्य करते हैं कि प्रतिगमन गुणांक b या अवरोधन a का सही मान शून्य है:।

वैकल्पिक परिकल्पना का रूप है:।

टी-सांख्यिकी में स्वतंत्रता की डिग्री के साथ टी-छात्र वितरण है। विद्यार्थी की वितरण सारणी के अनुसार, महत्व के एक निश्चित स्तर b और स्वतंत्रता की डिग्री पर, एक महत्वपूर्ण मूल्य पाया जाता है।

यदि, तो, शून्य परिकल्पना को अस्वीकार कर दिया जाना चाहिए, गुणांक को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है।

यदि, तो शून्य परिकल्पना को अस्वीकार नहीं किया जा सकता है। (यदि गुणांक b सांख्यिकीय रूप से महत्वहीन है, तो समीकरण इस तरह दिखना चाहिए, और इसका मतलब है कि सुविधाओं के बीच कोई संबंध नहीं है। यदि गुणांक a सांख्यिकीय रूप से महत्वहीन है, तो फॉर्म में नए समीकरण का मूल्यांकन करने की अनुशंसा की जाती है)।

रैखिक प्रतिगमन समीकरण के गुणांक के अंतराल अनुमान:

के लिए कॉन्फिडेंस इंटरवलए: ।

के लिए कॉन्फिडेंस इंटरवलबी:

इसका मतलब यह है कि दी गई विश्वसनीयता (जहां महत्व स्तर है) के साथ, ए, बी के सही मूल्य संकेतित अंतराल में हैं।

प्रतिगमन गुणांक की स्पष्ट आर्थिक व्याख्या है, इसलिए अंतराल की आत्मविश्वास सीमा में असंगत परिणाम नहीं होने चाहिए, उदाहरण के लिए, उनमें शून्य शामिल नहीं होना चाहिए।

समग्र रूप से समीकरण के सांख्यिकीय महत्व का विश्लेषण।

प्रतिगमन विश्लेषण में फिशर वितरण

समग्र रूप से प्रतिगमन समीकरण के महत्व का आकलन फिशर के एफ-परीक्षण का उपयोग करके दिया गया है। इस मामले में, शून्य परिकल्पना को आगे रखा गया है कि सभी प्रतिगमन गुणांक, मुक्त शब्द a के अपवाद के साथ, शून्य के बराबर हैं और इसलिए, x कारक परिणाम y (या) को प्रभावित नहीं करता है।

एफ-मानदंड का मान निर्धारण के गुणांक के साथ जुड़ा हुआ है। कब बहु - प्रतिगमन:

जहाँ m स्वतंत्र चरों की संख्या है।

कब जोड़ीदार प्रतिगमनफॉर्मूला एफ - आंकड़े फॉर्म लेते हैं:

F-मानदंड का सारणीबद्ध मान ज्ञात करते समय, एक महत्व स्तर निर्धारित किया जाता है (आमतौर पर 0.05 या 0.01) और स्वतंत्रता की दो डिग्री: - एकाधिक प्रतिगमन के मामले में, - युग्मित प्रतिगमन के लिए।

यदि, तो इसे अस्वीकार कर दिया जाता है और y और x के बीच सांख्यिकीय संबंध के महत्व के बारे में निष्कर्ष निकाला जाता है।

यदि, तो सांख्यिकीय रूप से महत्वहीन माने जाने वाले प्रतिगमन समीकरण की संभावना को अस्वीकार नहीं किया जाता है।

टिप्पणी। जोड़ीदार रैखिक प्रतिगमन में। इसके अलावा, इसलिए। इस प्रकार, प्रतिगमन और सहसंबंध गुणांक के महत्व के बारे में परिकल्पना का परीक्षण रेखीय प्रतिगमन समीकरण के महत्व के बारे में परिकल्पना के परीक्षण के बराबर है।

फिशर वितरण का उपयोग न केवल इस परिकल्पना का परीक्षण करने के लिए किया जा सकता है कि सभी रैखिक प्रतिगमन गुणांक एक साथ शून्य के बराबर हैं, बल्कि यह भी परिकल्पना है कि इनमें से कुछ गुणांक शून्य के बराबर हैं। यह एक रेखीय प्रतिगमन मॉडल के विकास में महत्वपूर्ण है, क्योंकि यह अलग-अलग चर या उनके समूहों को व्याख्यात्मक चर की संख्या से बाहर करने की वैधता का आकलन करने की अनुमति देता है, या, इसके विपरीत, उन्हें इस संख्या में शामिल करता है।

उदाहरण के लिए, उदाहरण के लिए, बहु रेखीय प्रतिगमन का अनुमान पहले m व्याख्यात्मक चर के साथ n टिप्पणियों के लिए लगाया गया था, और निर्धारण का गुणांक बराबर है, फिर अंतिम k चर को व्याख्यात्मक चर की सूची से बाहर रखा गया है, और वह समीकरण जिसके लिए गुणांक का गुणांक है निर्धारण है (, क्योंकि (प्रत्येक अतिरिक्त चर आश्रित चर में भिन्नता के एक भाग, चाहे वह कितना ही छोटा क्यों न हो) की व्याख्या करता है।

बहिष्कृत चर वाले सभी गुणांकों के शून्य से समकालिक समानता के बारे में परिकल्पना का परीक्षण करने के लिए, मान की गणना की जाती है

जिसमें स्वतंत्रता की डिग्री के साथ फिशर वितरण है।

फिशर की वितरण सारणी के अनुसार, एक दिए गए महत्व स्तर पर, वे पाते हैं। और यदि, तो शून्य परिकल्पना अस्वीकृत हो जाती है। इस मामले में, सभी k चर को समीकरण से बाहर करना गलत है।

समाश्रयण समीकरण में एक या एक से अधिक k नए व्याख्यात्मक चरों को शामिल करने की वैधता के बारे में समान तर्क किया जा सकता है।

इस मामले में, एफ की गणना की जाती है - आंकड़े

वितरण कर रहा है। और यदि यह एक महत्वपूर्ण स्तर से अधिक है, तो नए चरों का समावेश आश्रित चर के पहले अस्पष्टीकृत विचरण का एक महत्वपूर्ण हिस्सा बताता है (यानी, नए व्याख्यात्मक चर का समावेश उचित है)।

टिप्पणियों। 1. यह सलाह दी जाती है कि एक बार में एक नए चर शामिल करें।

2. एफ - आंकड़ों की गणना करने के लिए, समीकरण में व्याख्यात्मक चर को शामिल करने पर विचार करते समय, स्वतंत्रता की डिग्री की संख्या के लिए समायोजित निर्धारण के गुणांक पर विचार करना वांछनीय है।

एफ - फिशर सांख्यिकी का उपयोग अवलोकन के अलग-अलग समूहों के लिए प्रतिगमन समीकरणों के संयोग के बारे में परिकल्पना का परीक्षण करने के लिए भी किया जाता है।

मान लीजिए कि 2 नमूने हैं, जिनमें क्रमशः प्रेक्षण हैं। इनमें से प्रत्येक नमूने के लिए, प्रजाति प्रतिगमन समीकरण का मूल्यांकन किया गया था। मान लीजिए कि समाश्रयण रेखा (अर्थात) से मानक विचलन क्रमशः उनके लिए समान है।

शून्य परिकल्पना का परीक्षण किया जाता है: कि इन समीकरणों के सभी संगत गुणांक एक दूसरे के बराबर हैं, अर्थात। इन नमूनों के लिए प्रतिगमन समीकरण समान है।

एक ही प्रकार के प्रतिगमन समीकरण को एक ही बार में सभी अवलोकनों और आरएमएस के लिए अनुमानित होने दें।

फिर F की गणना की जाती है - सूत्र के अनुसार आँकड़े:

इसमें स्वतंत्रता की डिग्री के साथ फिशर वितरण है। एफ - आंकड़े शून्य के करीब होंगे यदि दोनों नमूनों के लिए समीकरण समान है, क्योंकि इस मामले में। वे। है, तो शून्य परिकल्पना स्वीकृत होती है।

यदि, तो शून्य परिकल्पना को खारिज कर दिया जाता है, और एक एकल प्रतिगमन समीकरण का निर्माण नहीं किया जा सकता है।

मापदंडों का मूल्यांकन करने के बाद और बी, हमने एक प्रतिगमन समीकरण प्राप्त किया है जिसके द्वारा हम मूल्यों का अनुमान लगा सकते हैं आपनिर्धारित मूल्यों द्वारा एक्स. यह मान लेना स्वाभाविक है कि आश्रित चर के परिकलित मान वास्तविक मूल्यों के साथ मेल नहीं खाएंगे, क्योंकि प्रतिगमन रेखा सामान्य रूप से केवल औसतन संबंध का वर्णन करती है। इसके चारों ओर अलग-अलग अर्थ बिखरे हुए हैं। इस प्रकार, प्रतिगमन समीकरण से प्राप्त गणना मूल्यों की विश्वसनीयता काफी हद तक प्रतिगमन रेखा के आसपास देखे गए मूल्यों के फैलाव से निर्धारित होती है। व्यवहार में, एक नियम के रूप में, त्रुटि विचरण अज्ञात है और प्रतिगमन मापदंडों के साथ-साथ टिप्पणियों से अनुमान लगाया जाता है। और बी. यह मान लेना काफी तर्कसंगत है कि अनुमान प्रतिगमन अवशेषों के वर्गों के योग से संबंधित है। मात्रा सैद्धांतिक मॉडल में निहित गड़बड़ी के विचरण का एक नमूना अनुमान है . यह दिखाया जा सकता है कि एक युग्मित प्रतिगमन मॉडल के लिए

परिकलित मान से आश्रित चर के वास्तविक मान का विचलन कहाँ है।

यदि एक , फिर सभी अवलोकनों के लिए आश्रित चर के वास्तविक मान परिकलित (सैद्धांतिक) मानों के साथ मेल खाते हैं . ग्राफिक रूप से, इसका मतलब है कि सैद्धांतिक प्रतिगमन रेखा (फ़ंक्शन से निर्मित रेखा) सहसंबंध क्षेत्र के सभी बिंदुओं से गुजरती है, जो केवल एक सख्ती से कार्यात्मक कनेक्शन के साथ ही संभव है। इसलिए, प्रभावी संकेत परपूरी तरह से कारक के प्रभाव के कारण एक्स।

आमतौर पर, व्यवहार में, सैद्धांतिक प्रतिगमन रेखा के सापेक्ष सहसंबंध क्षेत्र के बिंदुओं का कुछ फैलाव होता है, अर्थात सैद्धांतिक लोगों से अनुभवजन्य डेटा का विचलन। यह बिखराव दोनों कारकों के प्रभाव के कारण है एक्स, अर्थात। वापसी आपपर एक्स, (इस तरह के विचरण को समझाया जाता है, क्योंकि इसे प्रतिगमन समीकरण द्वारा समझाया गया है), और अन्य कारणों की कार्रवाई (अस्पष्टीकृत भिन्नता, यादृच्छिक)। इन विचलनों का परिमाण समीकरण के गुणवत्ता संकेतकों की गणना को रेखांकित करता है।

विचरण के विश्लेषण के मूल सिद्धांत के अनुसार, आश्रित चर के वर्ग विचलन का कुल योग आपमाध्य मान से दो घटकों में विघटित किया जा सकता है: प्रतिगमन समीकरण द्वारा समझाया गया और अस्पष्टीकृत:

,

जहां - मान आप, समीकरण द्वारा परिकलित।

आइए, प्रतिगमन समीकरण द्वारा बताए गए वर्ग विचलनों के योग का वर्गों के कुल योग से अनुपात ज्ञात करें:

, कहाँ पे

. (7.6)

प्रतिगमन समीकरण द्वारा समझाया गया विचरण के भाग का परिणामी विशेषता के कुल विचरण के अनुपात को निर्धारण का गुणांक कहा जाता है। मान एक से अधिक नहीं हो सकता है और यह अधिकतम मान केवल पर ही पहुँचा जाएगा, अर्थात। जब प्रत्येक विचलन शून्य होता है और इसलिए स्कैटरप्लॉट के सभी बिंदु बिल्कुल एक सीधी रेखा पर होते हैं।

निर्धारण का गुणांक निर्भर चर के विचरण के कुल मूल्य में प्रतिगमन द्वारा समझाया गया विचरण के हिस्से की विशेषता है . तदनुसार, मान भिन्नता (फैलाव) के अनुपात को दर्शाता है वाई,प्रतिगमन समीकरण द्वारा अस्पष्टीकृत, और इसलिए मॉडल में ध्यान में नहीं रखे गए अन्य कारकों के प्रभाव के कारण होता है। एक के करीब, मॉडल की गुणवत्ता जितनी अधिक होगी।



युग्मित रैखिक प्रतिगमन के साथ, निर्धारण का गुणांक युग्मित रैखिक सहसंबंध गुणांक के वर्ग के बराबर होता है: .

निर्धारण के इस गुणांक का मूल बहु सहसंबंध का गुणांक (सूचकांक) या सैद्धांतिक सहसंबंध अनुपात है।

यह पता लगाने के लिए कि क्या प्रतिगमन के मूल्यांकन के दौरान प्राप्त निर्धारण गुणांक का मूल्य वास्तव में के बीच के सच्चे संबंध को दर्शाता है आपऔर एक्ससंपूर्ण और व्यक्तिगत मापदंडों के रूप में निर्मित समीकरण के महत्व की जाँच करें। प्रतिगमन समीकरण का महत्व परीक्षण आपको यह पता लगाने की अनुमति देता है कि क्या प्रतिगमन समीकरण व्यावहारिक उपयोग के लिए उपयुक्त है, उदाहरण के लिए, पूर्वानुमान के लिए या नहीं।

उसी समय, मुख्य परिकल्पना को समग्र रूप से समीकरण के महत्व के बारे में सामने रखा जाता है, जो औपचारिक रूप से इस परिकल्पना को कम कर देता है कि प्रतिगमन पैरामीटर शून्य के बराबर हैं, या, क्या समान है, कि निर्धारण का गुणांक बराबर है शून्य करने के लिए:। समीकरण के महत्व के बारे में एक वैकल्पिक परिकल्पना यह परिकल्पना है कि प्रतिगमन पैरामीटर शून्य के बराबर नहीं हैं या निर्धारण गुणांक शून्य के बराबर नहीं है:।

प्रतिगमन मॉडल के महत्व का परीक्षण करने के लिए, उपयोग करें एफ-फिशर की कसौटी, वर्गों के योग (प्रति एक स्वतंत्र चर) के अनुपात के रूप में गणना की जाती है और वर्गों के अवशिष्ट योग (स्वतंत्रता की प्रति एक डिग्री) के अनुपात के रूप में गणना की जाती है:

, (7.7)

कहाँ पे स्वतंत्र चर की संख्या है।

आश्रित चर के वर्ग विचलन के कुल योग से संबंध के अंश और हर (7.7) को विभाजित करने के बाद, एफ-मानदंड को गुणांक के रूप में समान रूप से व्यक्त किया जा सकता है:

.

यदि शून्य परिकल्पना सत्य है, तो प्रतिगमन समीकरण द्वारा समझाया गया विचरण और अस्पष्टीकृत (अवशिष्ट) विचरण एक दूसरे से भिन्न नहीं होते हैं।

अनुमानित मूल्य एफ-मानदंड की तुलना एक महत्वपूर्ण मूल्य से की जाती है जो स्वतंत्र चर की संख्या पर निर्भर करता है , और स्वतंत्रता की डिग्री की संख्या पर (एन-के-1). तालिका (महत्वपूर्ण) मान एफ-मानदंड - यह भिन्नताओं के अनुपात का अधिकतम मूल्य है, जो तब हो सकता है जब वे एक शून्य परिकल्पना की उपस्थिति की संभावना के दिए गए स्तर के लिए यादृच्छिक रूप से विचलन करते हैं। यदि परिकलित मान एफ-मानदंड किसी दिए गए महत्व स्तर पर सारणीबद्ध से अधिक है, तो कनेक्शन की अनुपस्थिति के बारे में शून्य परिकल्पना को खारिज कर दिया जाता है और इस कनेक्शन के महत्व के बारे में निष्कर्ष निकाला जाता है, यानी। मॉडल महत्वपूर्ण माना जाता है।

युग्मित प्रतिगमन मॉडल के लिए

.

रैखिक प्रतिगमन में, न केवल समग्र रूप से समीकरण के महत्व का, बल्कि इसके व्यक्तिगत गुणांकों का भी आमतौर पर अनुमान लगाया जाता है। ऐसा करने के लिए, प्रत्येक पैरामीटर की मानक त्रुटि निर्धारित की जाती है। मापदंडों के प्रतिगमन गुणांक की मानक त्रुटियां सूत्रों द्वारा निर्धारित की जाती हैं:

, (7.8)

(7.9)

प्रतिगमन गुणांक की मानक त्रुटियां या सूत्र (7.8,7.9) द्वारा गणना किए गए मानक विचलन, एक नियम के रूप में, सांख्यिकीय पैकेजों में प्रतिगमन मॉडल के गणना परिणामों में दिए गए हैं।

प्रतिगमन गुणांक की मानक त्रुटियों के आधार पर, सांख्यिकीय परिकल्पनाओं के परीक्षण के लिए सामान्य योजना का उपयोग करके इन गुणांकों के महत्व की जाँच की जाती है।

मुख्य परिकल्पना के रूप में, "सत्य" प्रतिगमन गुणांक के शून्य से एक महत्वहीन अंतर के बारे में एक परिकल्पना सामने रखी जाती है। इस मामले में एक वैकल्पिक परिकल्पना रिवर्स परिकल्पना है, यानी, "सच्चे" प्रतिगमन पैरामीटर की शून्य से असमानता के बारे में। इस परिकल्पना का परीक्षण किया जाता है टी-सांख्यिकी जो है टी-छात्र वितरण:

फिर परिकलित मान टी-आँकड़ों की तुलना महत्वपूर्ण मूल्यों से की जाती है टी-छात्र वितरण तालिकाओं से निर्धारित आँकड़े। महत्वपूर्ण मान का निर्धारण महत्व स्तर के आधार पर किया जाता है α और स्वतंत्रता की डिग्री की संख्या, जो है (एन-के-1), एन -अवलोकनों की संख्या - स्वतंत्र चर की संख्या। रैखिक युग्म प्रतिगमन के मामले में, स्वतंत्रता की डिग्री की संख्या है (पी- 2))। एक्सेल के बिल्ट-इन STUDISP फ़ंक्शन का उपयोग करके कंप्यूटर पर महत्वपूर्ण मान की गणना भी की जा सकती है।

यदि परिकलित मान टी-आंकड़े आलोचनात्मक से अधिक हैं, तो मुख्य परिकल्पना को खारिज कर दिया जाता है और यह माना जाता है कि संभावना के साथ (1-α)"सच्चा" प्रतिगमन गुणांक शून्य से काफी अलग है, जो संबंधित चर के बीच एक रैखिक संबंध के अस्तित्व की एक सांख्यिकीय पुष्टि है।

यदि परिकलित मान टी-सांख्यिकी आलोचनात्मक से कम है, तो मुख्य परिकल्पना को अस्वीकार करने का कोई कारण नहीं है, अर्थात, "सच्चा" प्रतिगमन गुणांक महत्व स्तर पर शून्य से महत्वपूर्ण रूप से भिन्न नहीं है α . इस मामले में, इस गुणांक के अनुरूप कारक को मॉडल से बाहर रखा जाना चाहिए।

एक विश्वास अंतराल का निर्माण करके प्रतिगमन गुणांक का महत्व स्थापित किया जा सकता है। प्रतिगमन मापदंडों के लिए विश्वास अंतराल और बीनिम्नानुसार परिभाषित किया गया है:

,

,

महत्व स्तर के लिए विद्यार्थी की वितरण तालिका से कहाँ निर्धारित किया जाता है α और स्वतंत्रता की डिग्री की संख्या (पी- 2) जोड़ीदार प्रतिगमन के लिए।

चूंकि अर्थमितीय अध्ययनों में प्रतिगमन गुणांक की स्पष्ट आर्थिक व्याख्या होती है, इसलिए विश्वास अंतराल में शून्य नहीं होना चाहिए। प्रतिगमन गुणांक के सही मूल्य में शून्य सहित सकारात्मक और नकारात्मक मान एक साथ नहीं हो सकते हैं, अन्यथा हमें गुणांक की आर्थिक व्याख्या में विरोधाभासी परिणाम मिलते हैं, जो नहीं हो सकते। इस प्रकार, गुणांक महत्वपूर्ण है यदि प्राप्त आत्मविश्वास अंतराल शून्य को कवर नहीं करता है।

उदाहरण 7.4.उदाहरण 7.1 के अनुसार:

ए) डेटा प्रोसेसिंग सॉफ्टवेयर का उपयोग करके बिक्री मूल्य पर बिक्री लाभ की निर्भरता का एक युग्मित रैखिक प्रतिगमन मॉडल बनाएं।

b) का उपयोग करते हुए समग्र रूप से प्रतिगमन समीकरण के महत्व का आकलन करें एफ-फिशर की कसौटी α = 0.05।

सी) का उपयोग कर प्रतिगमन मॉडल गुणांक के महत्व का आकलन करें टी-छात्र की कसौटी α=0.05और α=0.1.

प्रतिगमन विश्लेषण के लिए हम मानक कार्यालय कार्यक्रम एक्सेल का उपयोग करते हैं। हम विश्लेषण पैकेज सेटिंग्स (चित्र 7.5) के रिग्रेशन टूल का उपयोग करके एक रिग्रेशन मॉडल तैयार करेंगे, जिसे निम्नानुसार लॉन्च किया गया है:

सर्विसडाटा विश्लेषणREGRESSIONOK.

चित्र 7.5. रिग्रेशन टूल का उपयोग करना

प्रतिगमन संवाद बॉक्स में, इनपुट अंतराल Y फ़ील्ड में, आश्रित चर वाले कक्षों की श्रेणी का पता दर्ज करें। इनपुट अंतराल X फ़ील्ड में, एक या अधिक श्रेणियों के पते दर्ज करें जिनमें स्वतंत्र चर के मान हों। पहली पंक्ति के चेकबॉक्स में लेबल सक्रिय स्थिति पर सेट होते हैं यदि स्तंभ शीर्षक भी चुने जाते हैं। अंजीर पर। 7.6. रिग्रेशन टूल का उपयोग करके रिग्रेशन मॉडल की गणना का स्क्रीन फॉर्म दिखाया गया है।

चावल। 7.6. एक युग्मित प्रतिगमन मॉडल का निर्माण

रिग्रेशन टूल

रिग्रेशन टूल के काम के परिणामस्वरूप, निम्नलिखित रिग्रेशन विश्लेषण प्रोटोकॉल बनता है (चित्र। 7.7)।

चावल। 7.7. प्रतिगमन विश्लेषण प्रोटोकॉल

बिक्री मूल्य पर बिक्री से लाभ की निर्भरता के समीकरण का रूप है:

हम प्रतिगमन समीकरण के महत्व का अनुमान लगाएंगे एफ-फिशर की कसौटी। अर्थ एफ-फिशर की कसौटी EXCEL प्रोटोकॉल (चित्र। 7.7.) की तालिका "अवेरिएंस विश्लेषण" से ली गई है। अनुमानित मूल्य एफ-मानदंड 53,372। तालिका मूल्य एफ-महत्व स्तर पर मानदंड α=0.05और स्वतंत्रता की डिग्री की संख्या 4.964 है। जैसा , तो समीकरण महत्वपूर्ण माना जाता है।

अनुमानित मूल्य टी-प्रतिगमन समीकरण के गुणांकों के लिए छात्र के मानदंड परिणामी तालिका (चित्र। 7.7) में दिए गए हैं। तालिका मूल्य टी-महत्व के स्तर पर छात्र की परीक्षा α=0.05और 10 डिग्री स्वतंत्रता 2.228 है। प्रतिगमन गुणांक के लिए , इसलिए गुणांक महत्वपूर्ण नहीं है। प्रतिगमन गुणांक के लिए बी, इसलिए, गुणांक बीसार्थक।

विषय 4. संबंधों के अध्ययन के लिए सांख्यिकीय तरीके

प्रतिगमन समीकरण -यह सहसंबंध निर्भरता का एक विश्लेषणात्मक प्रतिनिधित्व है। प्रतिगमन समीकरण प्रभावी विशेषता के सशर्त औसत मूल्य और सुविधा के मूल्य - कारक (कारक) के बीच एक काल्पनिक कार्यात्मक संबंध का वर्णन करता है, अर्थात। व्यसन की अंतर्निहित प्रवृत्ति।

जोड़ी सहसंबंध निर्भरता जोड़ी प्रतिगमन समीकरण द्वारा वर्णित है, एकाधिक सहसंबंध निर्भरता - एकाधिक प्रतिगमन समीकरण द्वारा।

प्रतिगमन समीकरण में सुविधा-परिणाम आश्रित चर (प्रतिक्रिया, व्याख्यात्मक चर) है, और सुविधा-कारक स्वतंत्र चर (तर्क, व्याख्यात्मक चर) है।

प्रतिगमन समीकरण का सबसे सरल प्रकार एक युग्मित रैखिक संबंध का समीकरण है:

जहाँ y आश्रित चर (चिह्न-परिणाम) है; x एक स्वतंत्र चर (साइन-फैक्टर) है; और समाश्रयण समीकरण के प्राचल हैं; - अनुमान त्रुटि।

प्रतिगमन समीकरण के रूप में विभिन्न गणितीय कार्यों का उपयोग किया जा सकता है। रैखिक निर्भरता, परवलय, अतिपरवलय, स्टेपी फलन आदि के समीकरणों का व्यावहारिक प्रयोग बार-बार होता है।

एक नियम के रूप में, विश्लेषण एक रैखिक संबंध से शुरू होता है, क्योंकि परिणाम अर्थपूर्ण रूप से व्याख्या करना आसान होता है। विश्लेषण में बाधा समीकरण के प्रकार का चुनाव एक महत्वपूर्ण कदम है। "पूर्व-कंप्यूटर" युग में, यह प्रक्रिया कुछ कठिनाइयों से जुड़ी थी और विश्लेषक को गणितीय कार्यों के गुणों को जानने की आवश्यकता थी। वर्तमान में, विशेष कार्यक्रमों के आधार पर, संचार समीकरणों के एक सेट का निर्माण करना संभव है और औपचारिक मानदंडों के आधार पर, सर्वोत्तम मॉडल का चयन करें (हालांकि, एक विश्लेषक की गणितीय साक्षरता ने अपनी प्रासंगिकता नहीं खोई है)।

सहसंबंध क्षेत्र के निर्माण के परिणामों के आधार पर सहसंबंध निर्भरता के प्रकार के बारे में एक परिकल्पना सामने रखी जा सकती है (व्याख्यान 6 देखें)। ग्राफ पर बिंदुओं के स्थान की प्रकृति के आधार पर (अंकों के निर्देशांक आश्रित और स्वतंत्र चर के मूल्यों के अनुरूप होते हैं), संकेतों (संकेतक) के बीच संबंध की प्रवृत्ति का पता चलता है। यदि प्रतिगमन रेखा सहसंबंध क्षेत्र के सभी बिंदुओं से होकर गुजरती है, तो यह एक कार्यात्मक संबंध को इंगित करता है। सामाजिक-आर्थिक अनुसंधान के अभ्यास में, ऐसी तस्वीर नहीं देखी जा सकती है, क्योंकि एक सांख्यिकीय (सहसंबंध) निर्भरता है। सहसंबंध निर्भरता की शर्तों के तहत, स्कैटरप्लॉट पर एक प्रतिगमन रेखा खींचते समय, प्रतिगमन रेखा से सहसंबंध क्षेत्र के बिंदुओं का विचलन देखा जाता है, जो तथाकथित अवशिष्ट या अनुमान त्रुटियों को प्रदर्शित करता है (चित्र 7.1 देखें)।

एक समीकरण त्रुटि की उपस्थिति इस तथ्य के कारण है कि:

प्रतिगमन समीकरण में परिणाम को प्रभावित करने वाले सभी कारकों को ध्यान में नहीं रखा जाता है;

कनेक्शन का रूप गलत तरीके से चुना जा सकता है - प्रतिगमन समीकरण;

सभी कारक समीकरण में शामिल नहीं हैं।

प्रतिगमन समीकरण का निर्माण करने का अर्थ है इसके मापदंडों के मूल्यों की गणना करना। प्रतिगमन समीकरण विश्लेषण की गई विशेषताओं के वास्तविक मूल्यों के आधार पर बनाया गया है। मापदंडों की गणना आमतौर पर का उपयोग करके की जाती है कम से कम वर्गों (LSM) की विधि।

MNC . का सारयह है कि समीकरण के मापदंडों के ऐसे मूल्यों को प्राप्त करना संभव है, जिस पर विशेषता-परिणाम (प्रतिगमन समीकरण के आधार पर गणना) के सैद्धांतिक मूल्यों के वर्ग विचलन का योग इसके वास्तविक से मान कम से कम किया गया है:

,

जहां - जनसंख्या की i-th इकाई के साइन-परिणाम का वास्तविक मूल्य; - प्रतिगमन समीकरण () द्वारा प्राप्त जनसंख्या की i-वें इकाई के साइन-परिणाम का मूल्य।

इस प्रकार, समस्या को एक चरम सीमा के लिए हल किया जाता है, अर्थात, यह पता लगाना आवश्यक है कि मापदंडों के किन मूल्यों पर, फ़ंक्शन S न्यूनतम तक पहुंचता है।

विभेदन करना, आंशिक व्युत्पन्न को शून्य के बराबर करना:



, (7.3)

, (7.4)

कारक और परिणाम मूल्यों का औसत उत्पाद कहां है; - संकेत का औसत मूल्य - कारक; - साइन-परिणाम का औसत मूल्य; - साइन-फैक्टर का विचरण।

प्रतिगमन समीकरण में पैरामीटर ग्राफ़ पर प्रतिगमन रेखा के ढलान को दर्शाता है। इस विकल्प को कहा जाता है प्रतिगमन गुणांकऔर इसका मान इस बात की विशेषता है कि इसके माप की इकाई द्वारा साइन-फैक्टर में परिवर्तन होने पर इसके माप की कितनी इकाइयाँ साइन-परिणाम बदल जाएगा। प्रतिगमन गुणांक का संकेत निर्भरता (प्रत्यक्ष या उलटा) की दिशा को दर्शाता है और सहसंबंध गुणांक (युग्मित निर्भरता की शर्तों के तहत) के संकेत के साथ मेल खाता है।

विचाराधीन उदाहरण के ढांचे के भीतर, STATISTICA कार्यक्रम ने प्रतिगमन समीकरण के मापदंडों की गणना की, जो जनसंख्या की औसत प्रति व्यक्ति मौद्रिक आय के स्तर और रूस के क्षेत्रों में प्रति व्यक्ति सकल क्षेत्रीय उत्पाद के मूल्य के बीच संबंध का वर्णन करता है। तालिका 7.1 देखें।

तालिका 7.1 - जनसंख्या की औसत प्रति व्यक्ति नकद आय के स्तर और रूस के क्षेत्रों में प्रति व्यक्ति सकल क्षेत्रीय उत्पाद के मूल्य के बीच संबंध का वर्णन करने वाले समीकरण के मापदंडों की गणना और मूल्यांकन, 2013

तालिका के कॉलम "बी" में जोड़ी प्रतिगमन समीकरण के मापदंडों के मान शामिल हैं, इसलिए, हम लिख सकते हैं: = 13406.89 + 22.82 x। यह समीकरण विश्लेषण की गई विशेषताओं के बीच संबंधों की प्रवृत्ति का वर्णन करता है। पैरामीटर प्रतिगमन गुणांक है। इस मामले में, यह 22.82 के बराबर है और निम्नलिखित की विशेषता है: प्रति व्यक्ति जीआरपी में 1 हजार रूबल की वृद्धि के साथ, प्रति व्यक्ति औसत नकद आय औसतन 22.28 रूबल से बढ़ जाती है (जैसा कि "+" संकेत द्वारा इंगित किया गया है)।

सामाजिक-आर्थिक अध्ययनों में प्रतिगमन समीकरण के पैरामीटर, एक नियम के रूप में, अर्थपूर्ण रूप से व्याख्या नहीं की जाती है। औपचारिक रूप से, यह संकेत के मूल्य को दर्शाता है - परिणाम, बशर्ते कि संकेत - कारक शून्य के बराबर हो। पैरामीटर ग्राफ़ पर प्रतिगमन रेखा के स्थान को दर्शाता है, चित्र 7.1 देखें।

चित्र 7.1 - सहसंबंध क्षेत्र और प्रतिगमन रेखा, रूस के क्षेत्रों में जनसंख्या की औसत प्रति व्यक्ति मौद्रिक आय के स्तर की निर्भरता और प्रति व्यक्ति जीआरपी के मूल्य को दर्शाती है

पैरामीटर मान X = 0 पर Y-अक्ष के साथ प्रतिगमन रेखा के प्रतिच्छेदन बिंदु से मेल खाता है।

प्रतिगमन समीकरण का निर्माण समग्र रूप से समीकरण के सांख्यिकीय महत्व और इसके मापदंडों के आकलन के साथ होता है। ऐसी प्रक्रियाओं की आवश्यकता सीमित मात्रा में डेटा से जुड़ी होती है, जो बड़ी संख्या के कानून के संचालन को रोक सकती है और इसलिए, विश्लेषण किए गए संकेतकों के संबंध में एक वास्तविक प्रवृत्ति की पहचान होती है। इसके अलावा, किसी भी अध्ययन की गई आबादी को सामान्य आबादी के नमूने के रूप में माना जा सकता है, और विश्लेषण के दौरान प्राप्त विशेषताओं को सामान्य मापदंडों के अनुमान के रूप में माना जा सकता है।

मापदंडों के सांख्यिकीय महत्व और समग्र रूप से समीकरण का आकलन प्रबंधकीय निर्णय लेने और पूर्वानुमान (मॉडलिंग) करने के लिए निर्मित संचार मॉडल का उपयोग करने की संभावना की पुष्टि है।

प्रतिगमन समीकरण का सांख्यिकीय महत्वसामान्य रूप से अनुमान लगाया जाता है फिशर एफ-टेस्ट, जो स्वतंत्रता की एक डिग्री के लिए परिकलित भाज्य और अवशिष्ट प्रसरणों का अनुपात है:

कहाँ पे - सुविधा का कारक विचरण - परिणाम; k तथ्यात्मक फैलाव की स्वतंत्रता की डिग्री की संख्या है (प्रतिगमन समीकरण में कारकों की संख्या); - आश्रित चर का माध्य मान; - जनसंख्या की i-वें इकाई के लिए आश्रित चर का सैद्धांतिक (प्रतिगमन समीकरण द्वारा प्राप्त) मान; - साइन का अवशिष्ट विचरण - परिणाम; n जनसंख्या का आयतन है; n-k-1 अवशिष्ट फैलाव की स्वतंत्रता की डिग्री की संख्या है।

फिशर के एफ-टेस्ट का मूल्य, सूत्र के अनुसार, आश्रित चर के कारक और अवशिष्ट भिन्नताओं के बीच के अनुपात को दर्शाता है, संक्षेप में, कितनी बार भिन्नता के समझाया भाग का मूल्य अस्पष्टीकृत से अधिक है।

फिशर का एफ-टेस्ट सारणीबद्ध है, तालिका में इनपुट फैक्टोरियल और अवशिष्ट भिन्नताओं की स्वतंत्रता की डिग्री की संख्या है। सारणीबद्ध (महत्वपूर्ण) के साथ मानदंड के परिकलित मूल्य की तुलना प्रश्न का उत्तर देने की अनुमति देती है: क्या विशेषता-परिणाम की भिन्नता का वह हिस्सा है जिसे सांख्यिकीय रूप से महत्वपूर्ण इस प्रकार के समीकरण में शामिल कारकों द्वारा समझाया जा सकता है? यदि एक , तो प्रतिगमन समीकरण को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है और तदनुसार, निर्धारण का गुणांक भी सांख्यिकीय रूप से महत्वपूर्ण है। अन्यथा ( ), समीकरण सांख्यिकीय रूप से महत्वहीन है, अर्थात। समीकरण में ध्यान में रखे गए कारकों की भिन्नता विशेषता-परिणाम की भिन्नता के सांख्यिकीय रूप से महत्वपूर्ण भाग की व्याख्या नहीं करती है, या संबंध समीकरण सही ढंग से नहीं चुना गया है।

समीकरण के मापदंडों के सांख्यिकीय महत्व का अनुमानके आधार पर किया गया टी सांख्यिकी, जिसे प्रतिगमन समीकरण के मापदंडों के निरपेक्ष मान के अनुपात के रूप में उनकी मानक त्रुटियों के रूप में परिकलित किया जाता है ( ):

, कहाँ पे ; (7.6)

, कहाँ पे ; (7.7)

कहाँ पे - संकेत के मानक विचलन - कारक और संकेत - परिणाम; - दृढ़ संकल्प का गुणांक।

विशिष्ट सांख्यिकीय कार्यक्रमों में, मापदंडों की गणना हमेशा उनके मानक (मूल माध्य वर्ग) त्रुटियों और टी-सांख्यिकी की गणना के साथ होती है (तालिका 7.1 देखें)। t-सांख्यिकी के परिकलित मान की तुलना सारणी से की जाती है, यदि अध्ययन की गई जनसंख्या का आयतन 30 इकाइयों (निश्चित रूप से एक छोटा सा नमूना) से कम है, तो किसी को छात्र की t-वितरण तालिका का उल्लेख करना चाहिए, यदि जनसंख्या की मात्रा बड़ी है , किसी को सामान्य वितरण तालिका (लाप्लास की संभाव्यता अभिन्न) का उपयोग करना चाहिए। एक समीकरण पैरामीटर को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है यदि।

टी-सांख्यिकी के आधार पर मापदंडों का अनुमान, संक्षेप में, सामान्य मापदंडों की शून्य (एच 0: = 0; एच 0: = 0;) की समानता के बारे में शून्य परिकल्पना का एक परीक्षण है, जो कि सांख्यिकीय रूप से महत्वहीन है प्रतिगमन समीकरण के मापदंडों का मूल्य। परिकल्पना का महत्व स्तर, एक नियम के रूप में, लिया जाता है: = 0.05। यदि परिकलित महत्व स्तर 0.05 से कम है, तो शून्य परिकल्पना को अस्वीकार कर दिया जाता है और वैकल्पिक एक को स्वीकार किया जाता है - पैरामीटर के सांख्यिकीय महत्व के बारे में।

आइए उदाहरण के साथ जारी रखें। कॉलम "बी" में तालिका 7.1 पैरामीटर के मान दिखाती है, कॉलम Std.Err.ofB में - पैरामीटर की मानक त्रुटियों के मान ( ), कॉलम t (77 - स्वतंत्रता की डिग्री की संख्या) में t - आँकड़ों के मूल्यों की गणना स्वतंत्रता की डिग्री की संख्या को ध्यान में रखते हुए की जाती है। मापदंडों के सांख्यिकीय महत्व का आकलन करने के लिए, टी-सांख्यिकी के परिकलित मूल्यों की तुलना तालिका मूल्य से की जानी चाहिए। सामान्य वितरण तालिका में दिया गया महत्व का स्तर (0.05) t = 1.96 से मेल खाता है। 18.02, 10.84 से, अर्थात्। , किसी को प्राप्त पैरामीटर मानों के सांख्यिकीय महत्व को पहचानना चाहिए, अर्थात। ये मान गैर-यादृच्छिक कारकों के प्रभाव में बनते हैं और विश्लेषण किए गए संकेतकों के बीच संबंधों की प्रवृत्ति को दर्शाते हैं।

समग्र रूप से समीकरण के सांख्यिकीय महत्व का आकलन करने के लिए, हम फिशर के एफ-परीक्षण के मूल्य की ओर मुड़ते हैं (तालिका 7.1 देखें)। F-मानदंड का परिकलित मान = 117.51, स्वतंत्रता की डिग्री की संगत संख्या के आधार पर मानदंड का सारणीबद्ध मान (कारक विचरण d.f. =1 के लिए, अवशिष्ट प्रसरण d.f. = 77 के लिए), 4.00 है (देखें परिशिष्ट .. ..।) इस प्रकार, इसलिए, समग्र रूप से प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण है। ऐसे में हम निर्धारण गुणांक के मान के सांख्यिकीय महत्व के बारे में भी बात कर सकते हैं, अर्थात्। रूस के क्षेत्रों में जनसंख्या की औसत प्रति व्यक्ति आय में 60 प्रतिशत भिन्नता को प्रति व्यक्ति सकल क्षेत्रीय उत्पाद की मात्रा में भिन्नता द्वारा समझाया जा सकता है।

प्रतिगमन समीकरण और उसके मापदंडों के सांख्यिकीय महत्व का आकलन करके, हम परिणामों का एक अलग संयोजन प्राप्त कर सकते हैं।

एफ-टेस्ट द्वारा समीकरण सांख्यिकीय रूप से महत्वपूर्ण है और टी-सांख्यिकी द्वारा समीकरण के सभी पैरामीटर भी सांख्यिकीय रूप से महत्वपूर्ण हैं। इस समीकरण का उपयोग प्रबंधकीय निर्णय लेने के लिए किया जा सकता है (वांछित परिणाम प्राप्त करने के लिए किन कारकों को प्रभावित किया जाना चाहिए), और कारकों के कुछ मूल्यों के लिए परिणाम विशेषता के व्यवहार की भविष्यवाणी करने के लिए।

· एफ-मानदंड के अनुसार, समीकरण सांख्यिकीय रूप से महत्वपूर्ण है, लेकिन समीकरण के पैरामीटर (पैरामीटर) महत्वहीन हैं। समीकरण का उपयोग प्रबंधन निर्णय लेने के लिए किया जा सकता है (उन कारकों के संबंध में जिनके लिए उनके प्रभाव के सांख्यिकीय महत्व की पुष्टि की गई है), लेकिन समीकरण का उपयोग पूर्वानुमान के लिए नहीं किया जा सकता है।

· एफ-परीक्षण समीकरण सांख्यिकीय रूप से महत्वपूर्ण नहीं है। समीकरण का उपयोग नहीं किया जा सकता है। तर्क और प्रतिक्रिया के बीच महत्वपूर्ण संकेत-कारकों या संबंध के विश्लेषणात्मक रूप की खोज जारी रखी जानी चाहिए।

यदि समीकरण और उसके मापदंडों के सांख्यिकीय महत्व की पुष्टि की जाती है, तो तथाकथित बिंदु पूर्वानुमान को लागू किया जा सकता है, अर्थात। गुणक (x) के कुछ मानों के लिए गुण-परिणाम (y) के मान का अनुमान प्राप्त किया गया था।

यह बिल्कुल स्पष्ट है कि संबंध समीकरण के आधार पर परिकलित आश्रित चर का अनुमानित मान, इसके वास्तविक मान से मेल नहीं खाएगा ( ग्राफिक रूप से, इस स्थिति की पुष्टि इस तथ्य से होती है कि सहसंबंध क्षेत्र के सभी बिंदु प्रतिगमन रेखा पर नहीं होते हैं, केवल एक कार्यात्मक कनेक्शन के साथ प्रतिगमन रेखा स्कैटर आरेख के सभी बिंदुओं से होकर गुजरेगी। आश्रित चर के वास्तविक और सैद्धांतिक मूल्यों के बीच विसंगतियों की उपस्थिति मुख्य रूप से सहसंबंध निर्भरता के बहुत सार के कारण होती है: एक ही समय में, कई कारक परिणाम को प्रभावित करते हैं, जिनमें से केवल एक हिस्से को ध्यान में रखा जा सकता है विशिष्ट संबंध समीकरण इसके अलावा, परिणाम और कारक (प्रतिगमन समीकरण का प्रकार) के बीच संबंध के रूप को गलत तरीके से चुना जा सकता है। इस संबंध में, प्रश्न उठता है कि निर्मित बाधा समीकरण कितना जानकारीपूर्ण है। इस प्रश्न का उत्तर दो संकेतकों द्वारा दिया गया है: निर्धारण का गुणांक (इसकी पहले ही ऊपर चर्चा की जा चुकी है) और अनुमान की मानक त्रुटि।

आश्रित चर के वास्तविक और सैद्धांतिक मूल्यों के बीच के अंतर को कहा जाता है विचलन या त्रुटियां, या बचा हुआ. इन मूल्यों के आधार पर, अवशिष्ट विचरण की गणना की जाती है। अवशिष्ट प्रसरण का वर्गमूल है रूट-माध्य-वर्ग (मानक) अनुमान त्रुटि:

= (7.8)

समीकरण की मानक त्रुटि को अनुमानित दर के समान इकाइयों में मापा जाता है। यदि समीकरण त्रुटियां एक सामान्य वितरण (बड़ी मात्रा में डेटा के साथ) का पालन करती हैं, तो 95 प्रतिशत मान प्रतिगमन रेखा से 2S से अधिक की दूरी पर होना चाहिए (सामान्य वितरण की संपत्ति के आधार पर - नियम तीन सिग्मा)। अनुमान के मानक त्रुटि के मूल्य का उपयोग किसी संकेत के मूल्य की भविष्यवाणी करते समय आत्मविश्वास अंतराल की गणना में किया जाता है - जनसंख्या की एक विशिष्ट इकाई के लिए परिणाम।

व्यावहारिक अनुसंधान में, अक्सर एक विशेषता के औसत मूल्य की भविष्यवाणी करना आवश्यक हो जाता है - विशेषता के एक विशेष मूल्य के लिए परिणाम - कारक। इस मामले में, आश्रित चर के औसत मूल्य के लिए विश्वास अंतराल की गणना में ()

औसत त्रुटि के मूल्य को ध्यान में रखा जाता है:

(7.9)

विभिन्न त्रुटि मूल्यों के उपयोग को इस तथ्य से समझाया गया है कि जनसंख्या की विशिष्ट इकाइयों के लिए संकेतकों के स्तर की परिवर्तनशीलता औसत मूल्य की परिवर्तनशीलता से बहुत अधिक है, इसलिए, औसत मूल्य की पूर्वानुमान त्रुटि छोटी है।

आश्रित चर के औसत मूल्य के पूर्वानुमान का विश्वास अंतराल:

, (7.10)

कहाँ पे - सीमांत अनुमान त्रुटि (नमूना सिद्धांत देखें); t आत्मविश्वास गुणांक है, जिसका मान शोधकर्ता द्वारा अपनाई गई संभाव्यता के स्तर (स्वतंत्रता की डिग्री की संख्या) के आधार पर संबंधित तालिका में है (नमूना सिद्धांत देखें)।

परिणाम विशेषता के अनुमानित मूल्य के लिए विश्वास अंतराल की गणना प्रतिगमन रेखा के बदलाव (शिफ्ट) के लिए सुधार को ध्यान में रखते हुए भी की जा सकती है। सुधार कारक का मूल्य इसके द्वारा निर्धारित किया जाता है:

(7.11)

विशेषता-कारक का मूल्य कहाँ है, जिसके आधार पर विशेषता-परिणाम के मूल्य की भविष्यवाणी की जाती है।

यह इस प्रकार है कि जितना अधिक मूल्य विशेषता-कारक के औसत मूल्य से भिन्न होता है, सुधार कारक का मूल्य जितना अधिक होगा, पूर्वानुमान त्रुटि उतनी ही अधिक होगी। इस गुणांक को देखते हुए, पूर्वानुमान के विश्वास अंतराल की गणना की जाएगी:

प्रतिगमन समीकरण पर आधारित पूर्वानुमान की सटीकता विभिन्न कारणों से प्रभावित हो सकती है। सबसे पहले, यह ध्यान में रखा जाना चाहिए कि समीकरण की गुणवत्ता और उसके मापदंडों का मूल्यांकन यादृच्छिक अवशेषों के सामान्य वितरण की धारणा पर आधारित है। इस धारणा का उल्लंघन डेटा में तेजी से भिन्न मूल्यों की उपस्थिति के कारण हो सकता है, गैर-समान भिन्नता के साथ, गैर-रैखिक संबंध की उपस्थिति के साथ। इस मामले में, पूर्वानुमान की गुणवत्ता कम हो जाती है। ध्यान रखने वाली दूसरी बात यह है कि परिणाम की भविष्यवाणी करते समय ध्यान में रखे गए कारकों के मूल्यों को उस डेटा में भिन्नता की सीमा से आगे नहीं जाना चाहिए जिस पर समीकरण बनाया गया है।

©2015-2019 साइट
सभी अधिकार उनके लेखकों के हैं। यह साइट लेखकत्व का दावा नहीं करती है, लेकिन मुफ्त उपयोग प्रदान करती है।
पेज बनाने की तारीख: 2018-01-08

सामाजिक-आर्थिक अनुसंधान में, अक्सर सीमित आबादी की स्थितियों में या चुनिंदा डेटा के साथ काम करना पड़ता है। इसलिए, प्रतिगमन समीकरण के गणितीय मापदंडों के बाद, सांख्यिकीय महत्व के लिए उनका और समीकरण का समग्र रूप से मूल्यांकन करना आवश्यक है, अर्थात। यह सुनिश्चित करना आवश्यक है कि परिणामी समीकरण और उसके पैरामीटर गैर-यादृच्छिक कारकों के प्रभाव में बनते हैं।

सबसे पहले, समग्र रूप से समीकरण के सांख्यिकीय महत्व का मूल्यांकन किया जाता है। मूल्यांकन आमतौर पर फिशर के एफ-परीक्षण का उपयोग करके किया जाता है। F-मानदंड की गणना प्रसरणों को जोड़ने के नियम पर आधारित है। अर्थात्, सामान्य विचरण संकेत-परिणाम = कारक विचरण + अवशिष्ट विचरण।

वास्तविक कीमत

सैद्धांतिक मूल्य
प्रतिगमन समीकरण का निर्माण करने के बाद, संकेत-परिणाम के सैद्धांतिक मूल्य की गणना करना संभव है, अर्थात। इसके मापदंडों को ध्यान में रखते हुए प्रतिगमन समीकरण द्वारा गणना की जाती है।

ये मान विश्लेषण में शामिल कारकों के प्रभाव में बने संकेत-परिणाम की विशेषता होंगे।

विश्लेषण में शामिल नहीं किए गए अन्य कारकों के प्रभाव के कारण, परिणाम विशेषता के वास्तविक मूल्यों और प्रतिगमन समीकरण के आधार पर गणना किए गए लोगों के बीच हमेशा विसंगतियां (अवशिष्ट) होती हैं।

गुण-परिणाम के सैद्धांतिक और वास्तविक मूल्यों के बीच के अंतर को अवशिष्ट कहा जाता है। गुण-परिणाम की सामान्य भिन्नता:

विश्लेषण में शामिल कारकों के लक्षणों में भिन्नता के कारण गुण-परिणाम में भिन्नता का अनुमान परिणाम के सैद्धांतिक मूल्यों की तुलना के माध्यम से लगाया जाता है। विशेषता और उसके माध्य मान। परिणामी विशेषता के सैद्धांतिक और वास्तविक मूल्यों की तुलना के माध्यम से अवशिष्ट भिन्नता। कुल भिन्नता, अवशिष्ट और वास्तविक में स्वतंत्रता की डिग्री की एक अलग संख्या होती है।

आम, पी- अध्ययन की गई जनसंख्या में इकाइयों की संख्या

वास्तविक, पी- विश्लेषण में शामिल कारकों की संख्या

अवशिष्ट

फिशर के एफ-टेस्ट की गणना अनुपात के रूप में की जाती है, और स्वतंत्रता की एक डिग्री के लिए गणना की जाती है।

प्रतिगमन समीकरण के सांख्यिकीय महत्व के अनुमान के रूप में फिशर के एफ-परीक्षण का उपयोग बहुत तार्किक है। परिणाम है। विशेषता, विश्लेषण में शामिल कारकों के कारण, अर्थात। यह समझाया परिणाम का अनुपात है। संकेत। - यह उन कारकों के कारण परिणाम के संकेत का (भिन्नता) है जिनके प्रभाव को ध्यान में नहीं रखा जाता है, अर्थात। विश्लेषण में शामिल नहीं है।

उस। एफ-मानदंड को मूल्यांकन करने के लिए डिज़ाइन किया गया है सार्थकअधिक से अधिक। यदि यह कम से कम है, और इससे भी अधिक यदि यह अधिक है, तो विश्लेषण में वे कारक शामिल नहीं हैं जो वास्तव में परिणाम विशेषता को प्रभावित करते हैं।

फिशर का एफ-परीक्षण सारणीबद्ध है, वास्तविक मूल्य की तुलना तालिका से की जाती है। यदि , तो प्रतिगमन समीकरण को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है। यदि, इसके विपरीत, समीकरण सांख्यिकीय रूप से महत्वपूर्ण नहीं है और व्यवहार में इसका उपयोग नहीं किया जा सकता है, तो समग्र रूप से समीकरण का महत्व सहसंबंध संकेतकों के सांख्यिकीय महत्व को इंगित करता है।

समीकरण का समग्र रूप से मूल्यांकन करने के बाद, समीकरण के मापदंडों के सांख्यिकीय महत्व का मूल्यांकन करना आवश्यक है। यह अनुमान विद्यार्थी के t-सांख्यिकी का उपयोग करके बनाया गया है। टी-सांख्यिकी की गणना उनके मानक माध्य वर्ग त्रुटि के समीकरण मापदंडों (मॉड्यूलो) के अनुपात के रूप में की जाती है। यदि एक-कारक मॉडल का मूल्यांकन किया जाता है, तो 2 आँकड़ों की गणना की जाती है।

सभी कंप्यूटर प्रोग्रामों में, मानकों के लिए मानक त्रुटि और टी-सांख्यिकी की गणना स्वयं मापदंडों की गणना के साथ की जाती है। टी-सांख्यिकी सारणीबद्ध हैं। यदि मान है , तो पैरामीटर को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है, अर्थात। गैर-यादृच्छिक कारकों के प्रभाव में गठित।

टी-सांख्यिकी की गणना का अर्थ अनिवार्य रूप से शून्य परिकल्पना का परीक्षण करना है कि पैरामीटर महत्वहीन है, अर्थात। शून्य से इसकी समानता। एक-कारक मॉडल के साथ, 2 परिकल्पनाओं का मूल्यांकन किया जाता है: तथा

शून्य परिकल्पना को स्वीकार करने के महत्व का स्तर स्वीकृत विश्वास स्तर के स्तर पर निर्भर करता है। इसलिए यदि शोधकर्ता 95% की संभाव्यता स्तर निर्दिष्ट करता है, तो स्वीकृति महत्व स्तर की गणना की जाएगी, इसलिए, यदि महत्व स्तर 0.05 है, तो इसे स्वीकार किया जाता है और मापदंडों को सांख्यिकीय रूप से महत्वहीन माना जाता है। यदि , तो विकल्प को अस्वीकार कर दिया जाता है और स्वीकार कर लिया जाता है : तथा .

सांख्यिकीय अनुप्रयोग पैकेज भी शून्य परिकल्पनाओं को स्वीकार करने के लिए एक महत्वपूर्ण स्तर प्रदान करते हैं। प्रतिगमन समीकरण और उसके मापदंडों के महत्व का आकलन निम्नलिखित परिणाम दे सकता है:

सबसे पहले, समग्र रूप से समीकरण महत्वपूर्ण है (एफ-परीक्षण के अनुसार) और समीकरण के सभी पैरामीटर भी सांख्यिकीय रूप से महत्वपूर्ण हैं। इसका मतलब यह है कि परिणामी समीकरण का उपयोग प्रबंधकीय निर्णय लेने और पूर्वानुमान लगाने के लिए दोनों के लिए किया जा सकता है।

दूसरे, एफ-मानदंड के अनुसार, समीकरण सांख्यिकीय रूप से महत्वपूर्ण है, लेकिन समीकरण के कम से कम एक पैरामीटर महत्वपूर्ण नहीं है। विश्लेषण किए गए कारकों के संबंध में प्रबंधन निर्णय लेने के लिए समीकरण का उपयोग किया जा सकता है, लेकिन पूर्वानुमान के लिए इसका उपयोग नहीं किया जा सकता है।

तीसरा, समीकरण सांख्यिकीय रूप से महत्वपूर्ण नहीं है, या एफ-मानदंड के अनुसार समीकरण महत्वपूर्ण है, लेकिन परिणामी समीकरण के सभी पैरामीटर महत्वपूर्ण नहीं हैं। समीकरण का उपयोग किसी भी उद्देश्य के लिए नहीं किया जा सकता है।

प्रतिगमन समीकरण को विशेषता-परिणाम और गुण-कारकों के बीच संबंध के एक मॉडल के रूप में मान्यता प्राप्त करने के लिए, यह आवश्यक है कि इसमें परिणाम निर्धारित करने वाले सभी सबसे महत्वपूर्ण कारक शामिल हों, ताकि समीकरण की सार्थक व्याख्या हो सके। पैरामीटर अध्ययन के तहत घटना में सैद्धांतिक रूप से उचित संबंधों से मेल खाते हैं। निर्धारण का गुणांक R 2> 0.5 होना चाहिए।

एक बहु प्रतिगमन समीकरण का निर्माण करते समय, निर्धारण के तथाकथित समायोजित गुणांक (आर 2) द्वारा मूल्यांकन करने की सलाह दी जाती है। विश्लेषण में शामिल कारकों की संख्या में वृद्धि के साथ R 2 (साथ ही सहसंबंध) का मान बढ़ता है। छोटी आबादी की स्थितियों में गुणांक का मूल्य विशेष रूप से कम करके आंका जाता है। आर 2 के नकारात्मक प्रभाव को बुझाने के लिए और स्वतंत्रता की डिग्री की संख्या को ध्यान में रखते हुए सहसंबंधों को ठीक किया जाता है, अर्थात। कुछ कारकों को शामिल करने पर स्वतंत्र रूप से भिन्न तत्वों की संख्या।

निर्धारण का समायोजित गुणांक

पी-सेट आकार/प्रेक्षणों की संख्या

- विश्लेषण में शामिल कारकों की संख्या

एन-1स्वतंत्रता की डिग्री की संख्या है

(1-R2)- परिणामी विशेषता के अवशिष्ट / अस्पष्टीकृत विचरण का मान

हमेशा कम R2. विश्लेषण किए गए कारकों की एक अलग संख्या के साथ समीकरणों के अनुमानों की तुलना करना संभव है।

34. समय श्रृंखला के अध्ययन की समस्याएं।

गतिकी की श्रृंखला को समय श्रृंखला या समय श्रृंखला कहा जाता है। एक गतिशील श्रृंखला एक विशेष घटना (90 से 98 वर्ष तक सकल घरेलू उत्पाद की मात्रा) की विशेषता वाले संकेतकों का एक समय-क्रमबद्ध अनुक्रम है। गतिकी की श्रृंखला का अध्ययन करने का उद्देश्य इस आधार पर अध्ययन (मुख्य प्रवृत्ति) और पूर्वानुमान के तहत घटना के विकास में पैटर्न की पहचान करना है। आरडी की परिभाषा से यह इस प्रकार है कि किसी भी श्रृंखला में दो तत्व होते हैं: समय टी और श्रृंखला का स्तर (सूचक के वे विशिष्ट मूल्य जिनके आधार पर डीआर श्रृंखला बनाई जाती है)। DR श्रृंखला 1) क्षणिक-श्रृंखला हो सकती है, जिसके संकेतक एक निश्चित समय पर, एक विशिष्ट तिथि पर, 2) अंतराल-श्रृंखला पर निर्धारित होते हैं, जिसके संकेतक एक निश्चित अवधि के लिए प्राप्त किए जाते हैं (1. की जनसंख्या सेंट पीटर्सबर्ग, 2. अवधि के लिए जीडीपी)। श्रृंखला को क्षण और अंतराल में विभाजित करना आवश्यक है, क्योंकि यह DR श्रृंखला के कुछ संकेतकों की गणना की बारीकियों को निर्धारित करता है। अंतराल श्रृंखला के स्तरों का योग एक सार्थक रूप से व्याख्या किया गया परिणाम देता है, जिसे क्षण श्रृंखला के स्तरों के योग के बारे में नहीं कहा जा सकता है, क्योंकि बाद में बार-बार गिनती होती है। समय श्रृंखला के विश्लेषण में सबसे महत्वपूर्ण समस्या श्रृंखला के स्तरों की तुलना की समस्या है। यह अवधारणा बहुत बहुमुखी है। गणना विधियों के संदर्भ में और क्षेत्र और जनसंख्या इकाइयों के कवरेज के संदर्भ में स्तरों की तुलना की जानी चाहिए। यदि डीआर श्रृंखला लागत के संदर्भ में बनाई गई है, तो सभी स्तरों को तुलनीय कीमतों में प्रस्तुत या गणना की जानी चाहिए। अंतराल श्रृंखला का निर्माण करते समय, स्तरों को समान अवधियों की विशेषता होनी चाहिए। पल श्रृंखला डी का निर्माण करते समय, स्तरों को उसी तिथि पर तय किया जाना चाहिए। पंक्तियाँ पूर्ण या अपूर्ण हो सकती हैं। आधिकारिक प्रकाशनों (1980,1985,1990,1995,1996,1997,1998,1999…) में अपूर्ण श्रृंखला का उपयोग किया जाता है। आरडी के व्यापक विश्लेषण में निम्नलिखित बिंदुओं का अध्ययन शामिल है:

1. आरडी स्तरों में परिवर्तन के संकेतकों की गणना

2. आरडी के औसत संकेतकों की गणना

3. श्रृंखला की मुख्य प्रवृत्ति की पहचान करना, प्रवृत्ति मॉडल बनाना

4. आरडी में ऑटोसहसंबंध का आकलन, ऑटोरेग्रेसिव मॉडल का निर्माण

5. आरडी . का सहसंबंध

6. आरडी पूर्वानुमान।

35. समय श्रृंखला के स्तरों में परिवर्तन के संकेतक .

सामान्य तौर पर, श्रृंखला डी को इस प्रकार दर्शाया जा सकता है:

y DR स्तर है, t समय का वह क्षण या अवधि है जिसे स्तर (संकेतक) संदर्भित करता है, n DR श्रृंखला (अवधि की संख्या) की लंबाई है। गतिशीलता की एक श्रृंखला का अध्ययन करते समय, निम्नलिखित संकेतकों की गणना की जाती है: 1. पूर्ण विकास, 2. विकास कारक (विकास दर), 3. त्वरण, 4. विकास कारक (विकास दर), 5. 1% विकास का पूर्ण मूल्य। परिकलित संकेतक हो सकते हैं: 1. श्रृंखला - श्रृंखला के प्रत्येक स्तर की तुलना तुरंत पूर्ववर्ती एक के साथ की जाती है, 2. मूल - तुलना आधार के रूप में चुने गए स्तर के साथ तुलना करके प्राप्त किया जाता है (जब तक अन्यथा निर्दिष्ट नहीं किया जाता है, श्रृंखला का पहला स्तर आधार के रूप में लिया जाता है।) 1. श्रृंखला पूर्ण लाभ:. दिखाता है कि कितना कम या ज्यादा। श्रृंखला निरपेक्ष वृद्धि को गतिशील श्रृंखला के स्तरों में परिवर्तन की दर के संकेतक कहा जाता है। आधार पूर्ण वृद्धि: . यदि श्रृंखला के स्तर सापेक्ष संकेतक हैं, जो% में व्यक्त किए गए हैं, तो पूर्ण वृद्धि परिवर्तन के बिंदुओं में व्यक्त की जाती है। 2. विकास कारक (विकास दर):इसकी गणना पंक्ति के स्तर के अनुपात के रूप में तत्काल पूर्ववर्ती (श्रृंखला वृद्धि कारक), या तुलना आधार (मूल विकास कारक) के रूप में किए गए स्तर के अनुपात के रूप में की जाती है: । यह दर्शाता है कि श्रृंखला के प्रत्येक स्तर पर कितनी बार > or< предшествующего или базисного. На основе коэффициентов роста рассчитываются темпы роста. Это коэффициенты роста, выраженные в %ах: 3. निरपेक्ष वृद्धि के आधार पर संकेतक की गणना की जाती है - निरपेक्ष वृद्धि का त्वरण: . त्वरण निरपेक्ष वृद्धि की पूर्ण वृद्धि है। मूल्यांकन करता है कि वेतन वृद्धि स्वयं कैसे बदलती है, चाहे वे स्थिर हों या त्वरित (बढ़ती)। 4. विकास दरतुलना के आधार से वृद्धि का अनुपात है। में व्यक्त किया %: ; . विकास दर विकास दर शून्य से 100% है। दिखाता है कि यह पंक्ति स्तर कितना % है > or< предшествующего либо базисного. 5. абсолютное значение 1% прироста. Рассчитывается как отношение абсолютного прироста к темпу прироста, т.е.: - сотая доля предыдущего уровня. Все эти показатели рассчитываются для оценки степени изменения уровней ряда. Цепные коэффициенты и темпы роста называются показателями интенсивности изменения уровней ДРядов.

2. आरडी के औसत संकेतकों की गणना श्रृंखला के औसत स्तर, औसत पूर्ण लाभ, औसत वृद्धि दर और औसत विकास दर की गणना करें। औसत संकेतकों की गणना जानकारी को सारांशित करने और विभिन्न श्रृंखलाओं में उनके परिवर्तन के स्तरों और संकेतकों की तुलना करने में सक्षम होने के लिए की जाती है। 1. औसत पंक्ति स्तरए) अंतराल समय श्रृंखला के लिए इसकी गणना सरल अंकगणितीय माध्य द्वारा की जाती है: जहां n समय श्रृंखला में स्तरों की संख्या है; बी) पल श्रृंखला के लिए, औसत स्तर की गणना एक विशिष्ट सूत्र के अनुसार की जाती है, जिसे कालानुक्रमिक औसत कहा जाता है: . 2. औसत पूर्ण वृद्धिअंकगणितीय माध्य सरल के अनुसार श्रृंखला निरपेक्ष वेतन वृद्धि के आधार पर गणना की जाती है:

. 3. औसत वृद्धि कारकज्यामितीय माध्य सूत्र का उपयोग करके श्रृंखला वृद्धि कारकों के आधार पर गणना की जाती है: . डीआर श्रृंखला के औसत संकेतकों पर टिप्पणी करते समय, 2 बिंदुओं को इंगित करना आवश्यक है: वह अवधि जो विश्लेषण किए गए संकेतक की विशेषता है और वह समय अंतराल जिसके लिए डीआर श्रृंखला बनाई गई है। 4. औसत वृद्धि दर: . 5. औसत वृद्धि दर: .