माध्य सन्निकटन त्रुटि मानों की अनुमेय सीमा। प्रतिगमन मॉडलिंग के परिणामों की सांख्यिकीय विश्वसनीयता के फिशर एफ-मानदंड का उपयोग करके अनुमान

5. एफ-मानदंड का उपयोग करते हुए, यह पाया गया कि समग्र रूप से प्राप्त जोड़ी प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वहीन है, और मासिक पेंशन y और निर्वाह न्यूनतम x के बीच संबंधों की अध्ययन की गई घटना का अपर्याप्त रूप से वर्णन करता है।

6. बहु रेखीय प्रतिगमन का एक अर्थमितीय मॉडल बनाया गया है, जो एक सशर्त फर्म y की शुद्ध आय के मूल्य को पूंजी कारोबार x1 और पूंजी नियोजित x2 के साथ जोड़ता है।

7. लोच गुणांक की गणना करके, यह दिखाया गया है कि पूंजी कारोबार में 1% के परिवर्तन के साथ, कंपनी की शुद्ध आय का मूल्य 0.0008% बदल जाता है, और उपयोग की गई पूंजी में 1% के परिवर्तन के साथ, कंपनी का मूल्य शुद्ध आय में 0.56% की वृद्धि।

8. टी-टेस्ट का उपयोग करके, प्रतिगमन गुणांक के सांख्यिकीय महत्व का आकलन किया गया था। यह पाया गया कि व्याख्यात्मक चर x 1 सांख्यिकीय रूप से महत्वहीन है और इसे प्रतिगमन समीकरण से बाहर रखा जा सकता है, जबकि व्याख्यात्मक चर x 2 सांख्यिकीय रूप से महत्वपूर्ण है।

9. एफ-मानदंड का उपयोग करते हुए, यह पाया गया कि समग्र रूप से प्राप्त युग्म प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण है, और पूंजी टर्नओवर x 1 के साथ एक सशर्त फर्म y की शुद्ध आय के मूल्य के बीच संबंध की अध्ययन की गई घटना का पर्याप्त रूप से वर्णन करता है। और प्रयुक्त पूंजी x 2।

10. बहु समाश्रयण के रैखिक समीकरण द्वारा सांख्यिकीय आंकड़ों के सन्निकटन की औसत त्रुटि की गणना की गई, जो कि 29.8% थी। यह दिखाया जाता है कि सांख्यिकीय डेटाबेस में किस अवलोकन के कारण इस त्रुटि का मान स्वीकार्य मान से अधिक है।

14. एक्सेल का उपयोग किए बिना एक युग्मित प्रतिगमन मॉडल का निर्माण।

तालिका 3.5 में दी गई सांख्यिकीय सामग्री का उपयोग करते हुए, यह आवश्यक है:

2. सहसंबंध और निर्धारण के संकेतकों का उपयोग करके कनेक्शन की मजबूती का मूल्यांकन करें।

3. लोच के गुणांक का उपयोग करके, कारक विशेषता और परिणामी के बीच संबंध की डिग्री निर्धारित करें।

4. औसत सन्निकटन त्रुटि ज्ञात कीजिए।

5. फिशर एफ-टेस्ट का उपयोग करके सिमुलेशन की सांख्यिकीय विश्वसनीयता का मूल्यांकन करें।

तालिका 3.5. आरंभिक डेटा।

प्रति व्यक्ति औसत नकद आय की कुल राशि में, जमा, ऋण, प्रमाण पत्र और विदेशी मुद्रा की खरीद में बचत बढ़ाने के उद्देश्य से नकद आय का हिस्सा,%

औसत मासिक उपार्जित मजदूरी, सी.यू.

कलुगा

कोस्तरोमा

ऑर्लोव्स्काया

रायज़ान

स्मोलेंस्क

अज्ञात मापदंडों को निर्धारित करने के लिए b 0 , b 1 युग्मित रैखिक प्रतिगमन समीकरण, हम सामान्य समीकरणों की मानक प्रणाली का उपयोग करते हैं, जिसका रूप है

(3.7)

इस प्रणाली को हल करने के लिए, पहले Sx 2 और Sxy के मूल्यों को निर्धारित करना आवश्यक है। ये मान प्रारंभिक डेटा की तालिका से निर्धारित होते हैं, इसे उपयुक्त कॉलम (तालिका 3.6) के साथ पूरक करते हैं।

तालिका 3.6। प्रतिगमन गुणांक की गणना के लिए।

तब तंत्र (3.7) रूप लेता है

पहले समीकरण से b 0 को व्यक्त करने और परिणामी व्यंजक को दूसरे समीकरण में प्रतिस्थापित करने पर, हम प्राप्त करते हैं:

पद-दर-अवधि गुणन और कोष्ठक का विस्तार करने पर, हम प्राप्त करते हैं:

अंत में, युग्मित रैखिक प्रतिगमन का समीकरण, जो औसत मासिक अर्जित मजदूरी x के साथ बचत y बढ़ाने के उद्देश्य से जनसंख्या की मौद्रिक आय के हिस्से से संबंधित है, का रूप है:

इसलिए, जैसा कि युग्मित रैखिक प्रतिगमन समीकरण का निर्माण किया जाता है, हम निर्भरता से रैखिक सहसंबंध गुणांक निर्धारित करते हैं:

संबंधित मापदंडों के मानक विचलन के मूल्य कहां हैं।

निर्भरता (3.9) से रैखिक सहसंबंध गुणांक की गणना करने के लिए, हम मध्यवर्ती गणना करेंगे।

पाए गए मापदंडों के मूल्यों को अभिव्यक्ति (3.9) में प्रतिस्थापित करते हुए, हम प्राप्त करते हैं

.

रैखिक सहसंबंध गुणांक का प्राप्त मूल्य जनसंख्या की मौद्रिक आय के हिस्से के बीच एक कमजोर उलटा सांख्यिकीय संबंध की उपस्थिति को इंगित करता है जिसका उद्देश्य बचत y और औसत मासिक अर्जित मजदूरी x बढ़ाना है।

निर्धारण का गुणांक है, जिसका अर्थ है कि केवल 9.6% व्याख्यात्मक चर के प्रतिगमन द्वारा y द्वारा समझाया गया है। तदनुसार, 1 का मान 90.4% के बराबर है, जो कि अर्थमितीय मॉडल में ध्यान में नहीं रखे गए अन्य सभी व्याख्यात्मक चर के प्रभाव के कारण होने वाले चर के विचरण के हिस्से को दर्शाता है।

लोच का गुणांक बराबर होता है

नतीजतन, औसत मासिक अर्जित मजदूरी के मूल्य में 1% की वृद्धि के साथ, बचत बढ़ाने के उद्देश्य से जनसंख्या की नकद आय का हिस्सा भी 1% कम हो जाता है, और मजदूरी में वृद्धि के साथ, के हिस्से में कमी होती है बचत बढ़ाने के उद्देश्य से जनसंख्या की नकद आय। यह निष्कर्ष सामान्य ज्ञान के विपरीत है और इसे केवल गठित गणितीय मॉडल की गलतता से समझाया जा सकता है।

आइए औसत सन्निकटन त्रुटि की गणना करें।

तालिका 3.7. औसत सन्निकटन त्रुटि की गणना पर।

प्राप्त मूल्य (12…15)% से अधिक है, जो वास्तविक डेटा से गणना किए गए डेटा के औसत विचलन के महत्व को इंगित करता है, जिस पर अर्थमितीय मॉडल बनाया गया है।

सांख्यिकीय मॉडलिंग की विश्वसनीयता फिशर के एफ-मानदंड के आधार पर की जाती है। फिशर मानदंड Fcalc का सैद्धांतिक मूल्य सूत्र के अनुसार स्वतंत्रता की एक डिग्री के लिए गणना किए गए भाज्य और अवशिष्ट प्रसरण के मूल्यों के अनुपात से निर्धारित होता है

जहाँ n प्रेक्षणों की संख्या है;

m व्याख्यात्मक चरों की संख्या है (माना गया उदाहरण m m = 1 के लिए)।

महत्वपूर्ण मान Fcrit सांख्यिकीय तालिकाओं से निर्धारित किया जाता है और महत्व स्तर के लिए a = 0.05 बराबर 10.13 होता है। चूंकि एफ कैल्क

15. एक्सेल का उपयोग किए बिना एक बहु प्रतिगमन मॉडल का निर्माण।

तालिका 3.8 में दी गई सांख्यिकीय सामग्री का उपयोग करते हुए, आपको यह करना होगा:

1. एक रेखीय बहु समाश्रयण समीकरण बनाइए, इसके प्राचलों का आर्थिक अर्थ समझाइए।

2. औसत (सामान्य) लोच गुणांक का उपयोग करके उत्पादक विशेषता वाले कारकों के संबंध की निकटता का तुलनात्मक मूल्यांकन देना।

3. टी-टेस्ट का उपयोग करके प्रतिगमन गुणांक के सांख्यिकीय महत्व का आकलन करें और एफ-टेस्ट का उपयोग करके समीकरण के महत्वहीन होने की शून्य परिकल्पना का आकलन करें।

4. औसत सन्निकटन त्रुटि का निर्धारण करके समीकरण की गुणवत्ता का मूल्यांकन करें।

तालिका 3.8. आरंभिक डेटा।

शुद्ध आय, एमएलएन यूएसडी

पूंजी USD mln . का कारोबार

प्रयुक्त पूंजी, एमएलएन। USD

बहु रेखीय समाश्रयण समीकरण के अज्ञात पैरामीटर b 0 , b 1 , b 2 निर्धारित करने के लिए, हम सामान्य समीकरणों की मानक प्रणाली का उपयोग करते हैं, जिसका रूप है

(3.11)

इस प्रणाली को हल करने के लिए, पहले Sx 1 2 , Sx 2 2 , Sx 1 y, Sx 2 y, Sx 1 x 2 के मान निर्धारित करना आवश्यक है। ये मान प्रारंभिक डेटा की तालिका से निर्धारित होते हैं, इसे उपयुक्त कॉलम (तालिका 3.9) के साथ पूरक करते हैं।

तालिका 3.9. प्रतिगमन गुणांक की गणना के लिए।

तब तंत्र (3.11) रूप लेता है

इस प्रणाली को हल करने के लिए, हम गॉस विधि का उपयोग करते हैं, जिसमें अज्ञात के क्रमिक उन्मूलन शामिल हैं: हम सिस्टम के पहले समीकरण को 10 से विभाजित करते हैं, फिर हम परिणामी समीकरण को 370.6 से गुणा करते हैं और इसे सिस्टम के दूसरे समीकरण से घटाते हैं, फिर हम परिणामी समीकरण को 158.20 से गुणा करते हैं और इसे सिस्टम के तीसरे समीकरण से घटाते हैं। सिस्टम के रूपांतरित दूसरे और तीसरे समीकरणों के लिए संकेतित एल्गोरिथम को दोहराते हुए, हम प्राप्त करते हैं:

Þ Þ

Þ .

परिवर्तन के बाद हमारे पास है:

फिर, अंत में, पूंजी कारोबार पर शुद्ध आय की निर्भरता और एक रैखिक बहु प्रतिगमन समीकरण के रूप में नियोजित पूंजी का रूप है:

परिणामी अर्थमितीय समीकरण से, यह देखा जा सकता है कि नियोजित पूंजी में वृद्धि के साथ, शुद्ध आय में वृद्धि होती है, और इसके विपरीत, पूंजी कारोबार में वृद्धि के साथ, शुद्ध आय घट जाती है। इसके अलावा, प्रतिगमन गुणांक जितना बड़ा होगा, आश्रित चर पर व्याख्यात्मक चर का प्रभाव उतना ही अधिक होगा। इस उदाहरण में, प्रतिगमन गुणांक का मूल्य गुणांक के मूल्य से अधिक है, इसलिए उपयोग की गई पूंजी का पूंजी कारोबार की तुलना में शुद्ध आय पर बहुत अधिक प्रभाव पड़ता है। इस निष्कर्ष को मापने के लिए, हम लोच के आंशिक गुणांक निर्धारित करते हैं।

प्राप्त परिणामों के विश्लेषण से यह भी पता चलता है कि प्रयुक्त पूंजी का शुद्ध आय पर अधिक प्रभाव पड़ता है। इसलिए, विशेष रूप से, नियोजित पूंजी में 1% की वृद्धि के साथ, शुद्ध आय में 1.17% की वृद्धि होती है। इसी समय, पूंजी कारोबार में 1% की वृद्धि के साथ, शुद्ध आय 0.5% घट जाती है।

फिशर मानदंड का सैद्धांतिक मूल्य एफ कैल्क

महत्वपूर्ण मान F क्रिट का मान सांख्यिकीय तालिकाओं द्वारा निर्धारित किया जाता है और महत्व स्तर के लिए a = 0.05, 4.74 के बराबर होता है। चूंकि एफ कैल्क> एफ क्रिट, शून्य परिकल्पना को खारिज कर दिया गया है, और परिणामी प्रतिगमन समीकरण को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है।

टी-मानदंड के अनुसार प्रतिगमन गुणांक के सांख्यिकीय महत्व का आकलन इन गुणांकों के संख्यात्मक मूल्य की तुलना उनकी यादृच्छिक त्रुटियों के परिमाण के साथ और निर्भरता के अनुसार किया जाता है:

टी-सांख्यिकी के सैद्धांतिक मूल्य की गणना के लिए कार्य सूत्र है:

, (3.13)

जहां युग्म सहसंबंध गुणांक और बहु ​​सहसंबंध गुणांक की गणना निर्भरता से की जाती है:

तब t-सांख्यिकी के सैद्धांतिक (गणना) मान क्रमशः इसके बराबर होते हैं:

चूंकि टी-सांख्यिकी का महत्वपूर्ण मूल्य, महत्व स्तर के लिए सांख्यिकीय तालिकाओं के अनुसार निर्धारित किया गया है a=0.05, tcrit=2.36 के बराबर निरपेक्ष मान में = - 1.798 से अधिक है, तो शून्य परिकल्पना को अस्वीकार नहीं किया जाता है और व्याख्यात्मक चर x 1 सांख्यिकीय रूप से महत्वहीन है और इसे प्रतिगमन समीकरण से बाहर रखा जा सकता है। इसके विपरीत, दूसरे प्रतिगमन गुणांक> टी क्रिट (3.3> 2.36) के लिए, और व्याख्यात्मक चर x 2 सांख्यिकीय रूप से महत्वपूर्ण है।

आइए औसत सन्निकटन त्रुटि की गणना करें।

तालिका 3.10. औसत सन्निकटन त्रुटि की गणना पर।

तब औसत सन्निकटन त्रुटि बराबर होती है

प्राप्त मूल्य (12…15)% के बराबर स्वीकार्य सीमा से अधिक नहीं है।

16. माप के सिद्धांत के विकास का इतिहास

सबसे पहले, TI को साइकोफिजिकल मापन के सिद्धांत के रूप में विकसित किया गया था। युद्ध के बाद के प्रकाशनों में, अमेरिकी मनोवैज्ञानिक एस.एस. स्टीफंस ने माप पैमानों पर ध्यान केंद्रित किया। XX सदी के उत्तरार्ध में। टीआई का दायरा तेजी से बढ़ रहा है। 1950 के दशक में संयुक्त राज्य अमेरिका में प्रकाशित "एनसाइक्लोपीडिया ऑफ साइकोलॉजिकल साइंसेज" के संस्करणों में से एक को "मनोवैज्ञानिक माप" कहा जाता था। इस प्रकाशन के संकलनकर्ताओं ने सामान्य रूप से मनोविज्ञान से मनोविज्ञान तक TI के दायरे का विस्तार किया है। इस संग्रह के लेख "माप के सिद्धांत के मूल सिद्धांत" में, प्रस्तुति किसी भी विशिष्ट क्षेत्र के संदर्भ के बिना, एक अमूर्त-गणितीय स्तर पर चली गई। इसमें, "संख्यात्मक में संबंधों के साथ अनुभवजन्य प्रणालियों के समरूपता" पर जोर दिया गया था (यहां इन गणितीय शब्दों में जाने की कोई आवश्यकता नहीं है), और एस.एस. के कार्यों की तुलना में प्रस्तुति की गणितीय जटिलता बढ़ गई। स्टीवंस।

टीआई (60 के दशक के उत्तरार्ध) पर पहले घरेलू लेखों में से एक में, यह पाया गया कि विशेषज्ञों द्वारा निर्दिष्ट बिंदुओं को विशेषज्ञता की वस्तुओं का मूल्यांकन करते समय, एक नियम के रूप में, एक क्रमिक पैमाने पर मापा जाता है। 1970 के दशक की शुरुआत में दिखाई देने वाले कार्यों ने TI के उपयोग के क्षेत्र का एक महत्वपूर्ण विस्तार किया। यह शैक्षणिक योग्यता (छात्रों के ज्ञान की गुणवत्ता को मापने), सिस्टम अध्ययन में, विशेषज्ञ मूल्यांकन के सिद्धांत के विभिन्न कार्यों में, उत्पाद गुणवत्ता संकेतकों को एकत्र करने के लिए, समाजशास्त्रीय अध्ययन आदि में लागू किया गया था।

विशिष्ट डेटा को मापने के लिए पैमाने के प्रकार की स्थापना के साथ, डेटा विश्लेषण एल्गोरिदम की खोज को TI की दो मुख्य समस्याओं के रूप में सामने रखा गया था, जिसका परिणाम पैमाने के किसी भी स्वीकार्य परिवर्तन के साथ नहीं बदलता है (अर्थात, सम्मान के साथ अपरिवर्तनीय है) इस परिवर्तन के लिए) भूगोल में सामान्य पैमाने ब्यूफोर्ट स्केल हवाएं ("शांत", "कमजोर हवा", "मध्यम हवा", आदि), भूकंप की ताकत का एक पैमाना है। जाहिर है, यह तर्क नहीं दिया जा सकता है कि 2 परिमाण का भूकंप (छत के नीचे झूला हुआ दीपक) 10 परिमाण के भूकंप (पृथ्वी की सतह पर सब कुछ का पूर्ण विनाश) की तुलना में ठीक 5 गुना कमजोर है।

चिकित्सा में, क्रमिक तराजू उच्च रक्तचाप (मायास्निकोव के अनुसार), दिल की विफलता की डिग्री का पैमाना (स्ट्रैज़ेस्को-वासिलेंको-लैंग के अनुसार), कोरोनरी अपर्याप्तता की गंभीरता का पैमाना (फोगेलसन के अनुसार), आदि हैं। ये सभी तराजू योजना के अनुसार बनाए गए हैं: बीमारी का पता नहीं चला है; रोग का पहला चरण; दूसरे चरण; तीसरा चरण ... कभी-कभी चरण 1a, 16, आदि प्रतिष्ठित होते हैं। प्रत्येक चरण में केवल इसके लिए एक चिकित्सा विशेषता होती है। विकलांगता समूहों का वर्णन करते समय, संख्याओं का उपयोग विपरीत क्रम में किया जाता है: सबसे गंभीर - पहला विकलांगता समूह, फिर - दूसरा, सबसे हल्का - तीसरा।

घरों की संख्या भी एक क्रमिक पैमाने में मापी जाती है - वे उस क्रम को दिखाते हैं जिसमें घर सड़क के किनारे होते हैं। किसी लेखक के एकत्रित कार्यों में वॉल्यूम संख्याएं या किसी उद्यम के संग्रह में केस नंबर आमतौर पर कालानुक्रमिक क्रम से जुड़े होते हैं जिसमें वे बनाए गए थे।

उत्पादों और सेवाओं की गुणवत्ता का आकलन करते समय, तथाकथित क्वालिमेट्री (शाब्दिक अनुवाद - गुणवत्ता माप) में क्रमिक पैमाने लोकप्रिय हैं। अर्थात्, उत्पादन की एक इकाई का मूल्यांकन अच्छे या बुरे के रूप में किया जाता है। अधिक गहन विश्लेषण में, तीन ग्रेडेशन वाले पैमाने का उपयोग किया जाता है: महत्वपूर्ण दोष हैं - केवल मामूली दोष हैं - कोई दोष नहीं हैं। कभी-कभी चार ग्रेडेशन का उपयोग किया जाता है: गंभीर दोष हैं (इसका उपयोग करना असंभव है) - महत्वपूर्ण दोष हैं - केवल मामूली दोष मौजूद हैं - कोई दोष नहीं हैं। उत्पाद ग्रेड का एक समान अर्थ है - उच्चतम ग्रेड, पहला ग्रेड, दूसरा ग्रेड, ...

पर्यावरणीय प्रभावों का आकलन करते समय, पहला, सबसे सामान्यीकृत मूल्यांकन आमतौर पर क्रमिक होता है, उदाहरण के लिए: प्राकृतिक पर्यावरण स्थिर है - प्राकृतिक पर्यावरण उत्पीड़ित (अपमानजनक) है। पर्यावरण-चिकित्सा पैमाना समान है: लोगों के स्वास्थ्य पर कोई स्पष्ट प्रभाव नहीं पड़ता है - स्वास्थ्य पर नकारात्मक प्रभाव पड़ता है।

क्रमिक पैमाने का उपयोग अन्य क्षेत्रों में भी किया जाता है। अर्थमिति में, ये मुख्य रूप से विशेषज्ञ आकलन के विभिन्न तरीके हैं।

सभी माप पैमानों को दो समूहों में बांटा गया है - गुणात्मक संकेतों के पैमाने और मात्रात्मक संकेतों के पैमाने। क्रमिक पैमाने और नामों का पैमाना गुणात्मक विशेषताओं के मुख्य पैमाने हैं, इसलिए, कई विशिष्ट क्षेत्रों में, गुणात्मक विश्लेषण के परिणामों को इन पैमानों पर माप के रूप में माना जा सकता है। मात्रात्मक संकेतों के पैमाने अंतराल, अनुपात, अंतर, निरपेक्ष के पैमाने हैं। अंतराल का पैमाना स्थितिज ऊर्जा के मान या एक सीधी रेखा पर किसी बिंदु के निर्देशांक को मापता है। इन मामलों में, न तो प्राकृतिक संदर्भ बिंदु और न ही माप की प्राकृतिक इकाई को पैमाने पर चिह्नित किया जा सकता है। शोधकर्ता को स्वयं संदर्भ बिंदु निर्धारित करना चाहिए और माप की इकाई का चयन स्वयं करना चाहिए। अंतराल पैमाने में मान्य परिवर्तन रैखिक बढ़ते परिवर्तन हैं, अर्थात। रैखिक कार्य। सेल्सियस और फ़ारेनहाइट तापमान तराजू बस इस तरह के संबंध से जुड़े हुए हैं: ° C \u003d 5/9 (° F - 32), जहाँ ° C सेल्सियस पैमाने पर तापमान (डिग्री में) होता है, और ° F तापमान होता है फारेनहाइट पैमाने।

मात्रात्मक पैमानों में से, विज्ञान और व्यवहार में सबसे आम अनुपात पैमाने हैं। उनके पास एक प्राकृतिक संदर्भ बिंदु है - शून्य, अर्थात। कोई मात्रा नहीं, लेकिन माप की कोई प्राकृतिक इकाई नहीं। अधिकांश भौतिक इकाइयों को अनुपात पैमाने पर मापा जाता है: शरीर द्रव्यमान, लंबाई, चार्ज, साथ ही अर्थव्यवस्था में कीमतें। संबंधों के पैमाने में अनुमेय परिवर्तन समान हैं (केवल पैमाने बदलते हैं)। दूसरे शब्दों में, बिना किसी अवरोध के रैखिक वृद्धिशील रूपांतरण, जैसे कीमतों को एक मुद्रा से दूसरी मुद्रा में निश्चित दर पर परिवर्तित करना। मान लीजिए कि हम रूबल में कीमतों का उपयोग करके दो निवेश परियोजनाओं की आर्थिक दक्षता की तुलना कर रहे हैं। पहली परियोजना को दूसरे से बेहतर होने दें। अब चलिए एक निश्चित विनिमय दर का उपयोग करते हुए चीन की मुद्रा, युआन पर स्विच करते हैं। जाहिर है, पहली परियोजना फिर से दूसरी की तुलना में अधिक लाभदायक होनी चाहिए। हालांकि, गणना एल्गोरिदम स्वचालित रूप से इस शर्त की पूर्ति सुनिश्चित नहीं करते हैं, और यह जांचना आवश्यक है कि यह पूरा हो गया है। औसत मूल्यों के लिए इस तरह के परीक्षण के परिणाम नीचे वर्णित हैं।

अंतर के पैमाने में माप की एक प्राकृतिक इकाई होती है, लेकिन कोई प्राकृतिक संदर्भ बिंदु नहीं होता है। समय को अंतर के पैमाने पर मापा जाता है, यदि वर्ष (या दिन - दोपहर से दोपहर तक) को माप की एक प्राकृतिक इकाई के रूप में लिया जाता है, और सामान्य मामले में अंतराल के पैमाने पर। ज्ञान के वर्तमान स्तर पर, एक प्राकृतिक संदर्भ बिंदु निर्दिष्ट नहीं किया जा सकता है। अलग-अलग लेखक दुनिया के निर्माण की तारीख की गणना अलग-अलग तरीकों से करते हैं, साथ ही साथ मसीह के जन्म के क्षण की भी गणना करते हैं।

केवल निरपेक्ष पैमाने के लिए, माप परिणाम शब्द के सामान्य अर्थों में संख्याएं हैं, जैसे कि एक कमरे में लोगों की संख्या। पूर्ण पैमाने के लिए, केवल पहचान परिवर्तन की अनुमति है।

ज्ञान के संबंधित क्षेत्र के विकास की प्रक्रिया में, पैमाने का प्रकार बदल सकता है। तो, सबसे पहले तापमान को एक क्रमिक पैमाने (ठंडा - गर्म) पर मापा गया था। फिर - अंतराल पैमाने पर (सेल्सियस, फ़ारेनहाइट, रेउमुर)। अंत में, परम शून्य की खोज के बाद, तापमान को अनुपात पैमाने (केल्विन स्केल) पर मापा जा सकता है। यह ध्यान दिया जाना चाहिए कि कभी-कभी विशेषज्ञों के बीच असहमति होती है कि कुछ वास्तविक मात्राओं को मापने के लिए किस पैमाने का उपयोग किया जाना चाहिए। दूसरे शब्दों में, मापन प्रक्रिया में पैमाने के प्रकार की परिभाषा शामिल होती है (साथ में किसी विशेष प्रकार के पैमाने को चुनने के औचित्य के साथ)। सूचीबद्ध छह मुख्य प्रकार के पैमानों के अलावा, कभी-कभी अन्य पैमानों का भी उपयोग किया जाता है।

17. अपरिवर्तनीय एल्गोरिदम और माध्य मान।

आइए हम TI में डेटा विश्लेषण एल्गोरिदम के लिए मुख्य आवश्यकता तैयार करें: एक निश्चित प्रकार के पैमाने पर मापे गए डेटा के आधार पर निकाले गए निष्कर्ष इन डेटा के माप पैमाने के स्वीकार्य परिवर्तन के साथ नहीं बदलना चाहिए। दूसरे शब्दों में, अनुमत पैमाने के परिवर्तनों के संबंध में निष्कर्ष अपरिवर्तनीय होना चाहिए।

इस प्रकार, माप के सिद्धांत के मुख्य लक्ष्यों में से एक वास्तविक वस्तुओं को संख्यात्मक मान निर्दिष्ट करते समय शोधकर्ता की व्यक्तिपरकता के खिलाफ लड़ाई है। तो, दूरियों को आर्शिन, मीटर, माइक्रोन, मील, पारसेक और माप की अन्य इकाइयों में मापा जा सकता है। मास (वजन) - पाउंड, किलोग्राम, पाउंड, आदि में। वस्तुओं और सेवाओं की कीमतों को युआन, रूबल, टेन्ज, रिव्निया, लैट्स, क्रून्स, मार्क्स, यूएस डॉलर और अन्य मुद्राओं (निर्दिष्ट रूपांतरण दरों के अधीन) में दर्शाया जा सकता है। आइए हम एक बहुत ही महत्वपूर्ण, हालांकि काफी स्पष्ट, परिस्थिति पर जोर दें: माप की इकाइयों का चुनाव शोधकर्ता पर निर्भर करता है, अर्थात। व्यक्तिपरक। सांख्यिकीय निष्कर्ष वास्तविकता के लिए तभी पर्याप्त हो सकते हैं जब वे इस बात पर निर्भर न हों कि शोधकर्ता किस माप की इकाई को पसंद करता है, जब वे स्वीकार्य पैमाने परिवर्तन के तहत अपरिवर्तनीय होते हैं। अर्थमितीय डेटा विश्लेषण के लिए कई एल्गोरिदम में से केवल कुछ ही इस शर्त को पूरा करते हैं। आइए इसे औसत मूल्यों की तुलना के उदाहरण पर दिखाते हैं।

मान लीजिए X 1, X 2,.., X n आकार n का एक नमूना है। अंकगणित माध्य का अक्सर उपयोग किया जाता है। अंकगणित माध्य का उपयोग इतना सामान्य है कि शब्द में दूसरे शब्द को अक्सर छोड़ दिया जाता है और विशिष्ट आर्थिक डेटा के लिए औसत वेतन, औसत आय और अन्य औसत के रूप में संदर्भित किया जाता है, जिसका अर्थ है "औसत" अंकगणितीय माध्य। इस तरह की परंपरा से गलत निष्कर्ष निकल सकते हैं। आइए इसे एक सशर्त उद्यम के कर्मचारियों के औसत वेतन (औसत आय) की गणना के उदाहरण से दिखाते हैं। 100 श्रमिकों में से केवल 5 के पास इससे अधिक मजदूरी है, और शेष 95 की मजदूरी अंकगणितीय औसत से काफी कम है। कारण स्पष्ट है - एक व्यक्ति - सामान्य निदेशक - का वेतन 95 श्रमिकों - निम्न-कुशल और उच्च कुशल श्रमिकों, इंजीनियरों और कर्मचारियों के वेतन से अधिक है। स्थिति अस्पताल के बारे में प्रसिद्ध कहानी में वर्णित है, जिसमें 10 रोगियों में से 9 का तापमान 40 डिग्री सेल्सियस है, और एक पहले से ही समाप्त हो चुका है, 0 डिग्री सेल्सियस के तापमान के साथ मुर्दाघर में है। इस बीच, अस्पताल में औसत तापमान 36 डिग्री सेल्सियस है - यह बेहतर नहीं होता है!

इस प्रकार, अंकगणित माध्य का उपयोग केवल काफी सजातीय आबादी के लिए किया जा सकता है (बिना एक दिशा या किसी अन्य में बड़े आउटलेयर के)। और मजदूरी का वर्णन करने के लिए उपयोग करने के लिए औसत क्या हैं? 50वें और 51वें कर्मचारियों के औसत-अंकगणितीय माध्य का उपयोग करना काफी स्वाभाविक है, यदि उनका वेतन गैर-घटते क्रम में है। पहले 40 कम-कुशल श्रमिकों का वेतन आता है, और फिर - 41वें से 70वें तक – अत्यधिक कुशल श्रमिकों की मजदूरी। नतीजतन, मंझला ठीक उन पर पड़ता है और 200 के बराबर होता है। 50 श्रमिकों के लिए, वेतन 200 से अधिक नहीं होता है, और 50 के लिए - कम से कम 200, इसलिए माध्य "केंद्र" दिखाता है, जिसके चारों ओर अध्ययन किए गए मूल्यों का बड़ा हिस्सा होता है समूहीकृत हैं। एक और औसत मोड है, जो सबसे अधिक बार होने वाला मान है। विचाराधीन मामले में, यह निम्न-कुशल श्रमिकों का वेतन है, अर्थात। 100. इस प्रकार, वेतन का वर्णन करने के लिए, हमारे पास तीन औसत मान हैं - मोड (100 इकाइयाँ), माध्यिका (200 इकाइयाँ) और अंकगणितीय माध्य (400 इकाइयाँ)।

वास्तविक जीवन में देखे गए आय और मजदूरी के वितरण के लिए, वही पैटर्न सत्य है: बहुलक औसत से कम है, और औसत अंकगणितीय माध्य से कम है।

अर्थशास्त्र में औसत का उपयोग क्यों किया जाता है? आमतौर पर, संख्याओं के एक सेट को एक संख्या से बदलने के लिए, औसत का उपयोग करके सेट की तुलना करना। उदाहरण के लिए, Y 1 , Y 2 ,..., Y n विशेषज्ञता की एक वस्तु (उदाहरण के लिए, कंपनी के रणनीतिक विकास के विकल्पों में से एक) के लिए "दिए गए" विशेषज्ञ आकलन का एक सेट हो, Z 1, Z 2 ,..., Z n - दूसरा (इस तरह के विकास का दूसरा संस्करण)। इन समुच्चय की तुलना कैसे की जा सकती है? जाहिर है, सबसे आसान तरीका औसत से है।

औसत की गणना कैसे करें? विभिन्न प्रकार के औसत ज्ञात हैं: अंकगणित माध्य, माध्यिका, बहुलक, ज्यामितीय माध्य, हार्मोनिक माध्य, माध्य वर्ग। स्मरण करो कि औसत मूल्य की सामान्य अवधारणा 19वीं शताब्दी के पूर्वार्द्ध के फ्रांसीसी गणितज्ञ द्वारा प्रस्तुत की गई थी। शिक्षाविद ओ. कोशी। यह इस प्रकार है: औसत मान कोई भी फ़ंक्शन Ф(X 1, X 2,..., X n) है जैसे कि तर्कों के सभी संभावित मानों के लिए, इस फ़ंक्शन का मान न्यूनतम से कम नहीं है संख्याएँ X 1, X 2,... , X n , और इनमें से अधिकतम संख्या से अधिक नहीं। उपरोक्त सभी प्रकार के औसत कॉची औसत हैं।

स्वीकार्य पैमाने के परिवर्तन के साथ, माध्य का मूल्य स्पष्ट रूप से बदल जाता है। लेकिन निष्कर्ष जिसके बारे में औसत जनसंख्या अधिक है, और जिसके लिए यह कम है, को नहीं बदलना चाहिए (निष्कर्षों के अपरिवर्तनीयता की आवश्यकता के अनुसार, टीआई में मुख्य आवश्यकता के रूप में अपनाया गया)। आइए हम औसत मूल्यों के रूप को खोजने की संबंधित गणितीय समस्या तैयार करें, जिसकी तुलना का परिणाम स्वीकार्य पैमाने के परिवर्तनों के संबंध में स्थिर है।

मान लीजिए F(X 1 X 2 ,..., X n) कॉची माध्य है। पहली आबादी के लिए औसत दूसरी आबादी के औसत से कम होने दें: फिर, टीआई के अनुसार, साधनों की तुलना के परिणाम की स्थिरता के लिए, यह आवश्यक है कि किसी भी स्वीकार्य परिवर्तन के लिए स्वीकार्य परिवर्तनों के समूह से जी इसी पैमाने में यह सच है कि पहली आबादी से रूपांतरित मूल्यों का औसत दूसरे सेट के लिए रूपांतरित मूल्यों के औसत से भी कम था। इसके अलावा, किसी भी दो संग्रह Y 1, Y 2,...,Y n और Z 1, Z 2,..., Z n और, किसी भी स्वीकार्य परिवर्तन के लिए तैयार की गई शर्त सही होनी चाहिए। तैयार की गई स्थिति को संतुष्ट करने वाले औसत मूल्यों को स्वीकार्य (संबंधित पैमाने में) कहा जाएगा। टीआई के अनुसार, केवल इस तरह के औसत का उपयोग विशेषज्ञ की राय और विचाराधीन पैमाने में मापा गया अन्य डेटा के विश्लेषण में किया जा सकता है।

1970 के दशक में विकसित गणितीय सिद्धांत की सहायता से, मुख्य पैमानों में स्वीकार्य साधनों के रूप का वर्णन करना संभव है। यह स्पष्ट है कि नामों के पैमाने में मापे गए डेटा के लिए, केवल मोड ही औसत के रूप में उपयुक्त है।

18. एक क्रमिक पैमाने में औसत मान

आइए एक क्रमिक पैमाने में मापी गई विशेषज्ञ राय के प्रसंस्करण पर विचार करें। निम्नलिखित कथन सत्य है।

प्रमेय1 . सभी कॉची औसतों में से, केवल परिवर्तनशील श्रृंखला के सदस्य (आदेश आँकड़े) क्रमिक पैमाने में स्वीकार्य औसत हैं।

प्रमेय 1 इस शर्त के तहत मान्य है कि माध्य (Х 1 Х 2 ,..., n) निरंतर (चरों की समग्रता से अधिक) और एक सममित फलन है। उत्तरार्द्ध का अर्थ है कि जब तर्कों को पुनर्व्यवस्थित किया जाता है, तो फ़ंक्शन Ф(X 1 X 2 ,..., X n) का मान नहीं बदलता है। यह स्थिति काफी स्वाभाविक है, क्योंकि हम समग्रता (सेट) के लिए औसत मान पाते हैं, न कि अनुक्रम के लिए। सेट उस क्रम के आधार पर नहीं बदलता है जिसमें हम इसके तत्वों को सूचीबद्ध करते हैं।

प्रमेय 1 के अनुसार, एक क्रमिक पैमाने पर मापे गए डेटा के लिए, कोई व्यक्ति, विशेष रूप से, माध्यिका को औसत (एक विषम नमूना आकार के लिए) के रूप में उपयोग कर सकता है। सम आयतन के साथ, परिवर्तनशील श्रृंखला के दो केंद्रीय सदस्यों में से एक का उपयोग किया जाना चाहिए - जैसा कि उन्हें कभी-कभी कहा जाता है, बायां मध्य या दायां मध्य। बहुलक का भी उपयोग किया जा सकता है - यह हमेशा भिन्नता श्रृंखला का सदस्य होता है। लेकिन आप कभी भी अंकगणितीय माध्य, ज्यामितीय माध्य आदि की गणना नहीं कर सकते।

निम्नलिखित प्रमेय सत्य है।

प्रमेय 2. मान लीजिए Y 1, Y 2 ,...,Y m वितरण फलन F(x), और Z 1, Z 2 ,..., Z n के साथ समान रूप से वितरित यादृच्छिक चर स्वतंत्र हैं, फ़ंक्शन के साथ समान रूप से वितरित यादृच्छिक चर हैं। वितरण H(x), इसके अलावा, नमूने Y 1 , Y 2 ,...,Y m और Z 1, Z 2 ,..., Z n एक दूसरे से स्वतंत्र हैं और MY X > MZ X । किसी घटना की प्रायिकता के लिए 1 के रूप में न्यूनतम (m, n) के रूप में किसी भी सख्ती से बढ़ते निरंतर कार्य g की स्थिति को संतुष्ट करने के लिए |g i |>X, यह आवश्यक और पर्याप्त है कि असमानता F(x)< Н(х), причем существовало число х 0 , для которого F(x 0)

टिप्पणी।ऊपरी सीमा की स्थिति विशुद्ध रूप से अंतर-गणितीय है। वास्तव में, फलन g क्रमिक पैमाने में एक मनमाना वैध परिवर्तन है।

प्रमेय 2 के अनुसार, अंकगणित माध्य का उपयोग क्रमिक पैमाने पर भी किया जा सकता है यदि प्रमेय में दी गई असमानता को संतुष्ट करने वाले दो वितरणों के नमूनों की तुलना की जाती है। सीधे शब्दों में कहें, वितरण कार्यों में से एक हमेशा दूसरे के ऊपर होना चाहिए। वितरण कार्य प्रतिच्छेद नहीं कर सकते, उन्हें केवल एक दूसरे को छूने की अनुमति है। यह स्थिति संतुष्ट है, उदाहरण के लिए, यदि वितरण कार्य केवल शिफ्ट में भिन्न होते हैं:

एफ (एक्स) = एच (एक्स + )

कुछ के लिए

अंतिम शर्त संतुष्ट होती है यदि एक निश्चित मात्रा के दो मूल्यों को एक ही माप उपकरण का उपयोग करके मापा जाता है, जिसमें एक मात्रा के एक मूल्य को मापने से दूसरे को मापने के लिए स्थानांतरित होने पर त्रुटियों का वितरण नहीं बदलता है।

कोलमोगोरोव औसत

ऊपर सूचीबद्ध कई औसतों का सामान्यीकरण कोलमोगोरोव औसत है। संख्या X 1, X 2,..., X n के लिए, कोलमोगोरोव माध्य की गणना सूत्र द्वारा की जाती है

जी((एफ(एक्स एल) + एफ(एक्स 2)+...एफ(एक्स एन))/एन),

जहां एफ एक सख्ती से मोनोटोनिक फ़ंक्शन है (यानी सख्ती से बढ़ रहा है या सख्ती से घट रहा है),

G, F का व्युत्क्रम फलन है।

कोलमोगोरोव औसत में कई प्रसिद्ध पात्र हैं। तो, यदि F(x) = x, तो कोलमोगोरोव माध्य अंकगणितीय माध्य है, यदि F(x) = lnx, तो ज्यामितीय माध्य, यदि F(x) = 1/x, तो हार्मोनिक माध्य, यदि F( x) \u003d x 2, फिर माध्य वर्ग, आदि। कोलमोगोरोव माध्य कॉची माध्य का एक विशेष मामला है। दूसरी ओर, लोकप्रिय औसत जैसे माध्यिका और बहुलक को कोलमोगोरोव औसत के रूप में प्रदर्शित नहीं किया जा सकता है। निम्नलिखित कथन मोनोग्राफ में सिद्ध होते हैं।

प्रमेय3 . यदि अंतराल पैमाने में कुछ अंतर-गणितीय नियमितता की स्थिति सही है, तो सभी कोलमोगोरोव औसत में से केवल अंकगणितीय औसत ही स्वीकार्य है। इस प्रकार, ज्यामितीय माध्य या मूल माध्य तापमान का वर्ग (सेल्सियस में) या दूरियाँ अर्थहीन हैं। अंकगणितीय माध्य का उपयोग माध्य के रूप में किया जाना चाहिए। आप माध्यिका या बहुलक का भी उपयोग कर सकते हैं।

प्रमेय 4. यदि सभी कोलमोगोरोव औसत के अनुपात पैमाने में कुछ अंतर-गणितीय नियमितता की स्थिति सही है, तो केवल एफ (एक्स) = एक्स सी और ज्यामितीय औसत के साथ पावर-लॉ औसत स्वीकार्य हैं।

टिप्पणी। ज्यामितीय माध्य c > 0 के लिए शक्ति साधन की सीमा है।

क्या कोलमोगोरोव औसत हैं जिनका उपयोग अनुपात पैमाने में नहीं किया जाना चाहिए? बेशक है। उदाहरण के लिए एफ (एक्स) = ई एक्स।

औसत मूल्यों के समान, अन्य सांख्यिकीय विशेषताओं का अध्ययन किया जा सकता है - प्रसार, कनेक्शन, दूरी आदि के संकेतक। उदाहरण के लिए, यह दिखाना आसान है कि सहसंबंध गुणांक अंतराल के कटोरे में किसी भी स्वीकार्य परिवर्तन के तहत नहीं बदलता है, जैसे भिन्नताओं का अनुपात, भिन्नता के पैमाने में भिन्नता नहीं बदलती है, भिन्नता का गुणांक - में अनुपात का पैमाना, आदि।

न केवल अर्थशास्त्र, प्रबंधन, विशेषज्ञ आकलन या समाजशास्त्र के सिद्धांत में, बल्कि इंजीनियरिंग में भी, औसतन उपरोक्त परिणामों का व्यापक रूप से उपयोग किया जाता है, उदाहरण के लिए, ब्लास्ट फर्नेस के एपीसीएस में सेंसर के एकत्रीकरण के तरीकों का विश्लेषण करने के लिए। मानकीकरण और गुणवत्ता प्रबंधन की समस्याओं में, विशेष रूप से क्वालिमेट्री में, जहां दिलचस्प सैद्धांतिक परिणाम प्राप्त हुए हैं, TI का बहुत महत्व है। इसलिए, उदाहरण के लिए, उत्पाद की गुणवत्ता के व्यक्तिगत संकेतकों के भार गुणांक में किसी भी परिवर्तन से भारित औसत के अनुसार उत्पादों के क्रम में परिवर्तन होता है (यह प्रमेय प्रो। वी.वी. पोडिनोवस्की द्वारा सिद्ध किया गया था)। इसलिए, TI और इसके तरीकों के बारे में उपरोक्त संक्षिप्त जानकारी एक निश्चित अर्थ में अर्थशास्त्र, समाजशास्त्र और इंजीनियरिंग विज्ञान को जोड़ती है और सबसे जटिल समस्याओं को हल करने के लिए एक पर्याप्त उपकरण है जो पहले प्रभावी विश्लेषण के लिए उत्तरदायी नहीं थे, इसके अलावा, इस प्रकार। यथार्थवादी मॉडल बनाने और पूर्वानुमान की समस्या को हल करने का रास्ता खोलता है।

22. युग्मित रैखिक प्रतिगमन

आइए अब हम जोड़ीवार रैखिक समाश्रयण के सरलतम मामले के अधिक विस्तृत अध्ययन की ओर मुड़ें। रैखिक प्रतिगमन को एक सीधी रेखा समीकरण के रूप में सबसे सरल कार्यात्मक निर्भरता द्वारा वर्णित किया गया है और यह मॉडल मापदंडों (समीकरण गुणांक) की पारदर्शी व्याख्या की विशेषता है। समीकरण का दाहिना भाग आपको प्रतिगामी (व्याख्यात्मक चर) के दिए गए मानों से परिणामी (व्याख्या) चर के सैद्धांतिक (गणना) मान प्राप्त करने की अनुमति देता है। इन मूल्यों को कभी-कभी भविष्य कहनेवाला (उसी अर्थ में) भी कहा जाता है, अर्थात। सैद्धांतिक सूत्रों से प्राप्त हालाँकि, निर्भरता की प्रकृति के बारे में एक परिकल्पना को सामने रखते हुए, समीकरण के गुणांक अभी भी अज्ञात हैं। सामान्यतया, विभिन्न तरीकों से इन गुणांकों के अनुमानित मूल्य प्राप्त करना संभव है।

लेकिन उनमें से सबसे महत्वपूर्ण और व्यापक रूप से कम से कम वर्गों (एलएसएम) की विधि है। यह गणना (सैद्धांतिक) वाले से परिणामी विशेषता के वास्तविक मूल्यों के वर्ग विचलन के योग को कम करने की आवश्यकता पर (जैसा कि पहले ही समझाया गया है) आधारित है। सैद्धांतिक मूल्यों (उन्हें प्राप्त करने के लिए) के बजाय, प्रतिगमन समीकरण के दाहिने हाथ को वर्ग विचलन के योग में प्रतिस्थापित किया जाता है, और फिर इस फ़ंक्शन के आंशिक व्युत्पन्न पाए जाते हैं (वास्तविक मूल्यों के वर्ग विचलन का योग) सैद्धांतिक लोगों से प्रभावी विशेषता)। ये आंशिक व्युत्पन्न चर x और y के संबंध में नहीं, बल्कि पैरामीटर a और b के संबंध में लिए गए हैं। आंशिक डेरिवेटिव को शून्य के बराबर किया जाता है और सरल लेकिन बोझिल परिवर्तनों के बाद, मापदंडों को निर्धारित करने के लिए सामान्य समीकरणों की एक प्रणाली प्राप्त की जाती है। चर x के साथ गुणांक, अर्थात। b को प्रतिगमन गुणांक कहा जाता है, यह एक इकाई द्वारा कारक में परिवर्तन के साथ परिणाम में औसत परिवर्तन को दर्शाता है। पैरामीटर a की आर्थिक व्याख्या नहीं हो सकती है, खासकर अगर इस गुणांक का संकेत नकारात्मक है।

पेयरवाइज लीनियर रिग्रेशन का उपयोग उपभोग फलन का अध्ययन करने के लिए किया जाता है। उपभोग फलन में समाश्रयण गुणांक का उपयोग गुणक की गणना के लिए किया जाता है। लगभग हमेशा, प्रतिगमन समीकरण को रिश्ते की जकड़न के एक संकेतक के साथ पूरक किया जाता है। रैखिक प्रतिगमन के सबसे सरल मामले के लिए, रिश्ते की जकड़न का यह संकेतक रैखिक सहसंबंध गुणांक है। लेकिन चूंकि रैखिक सहसंबंध गुणांक एक रैखिक रूप में सुविधाओं के संबंध की निकटता की विशेषता है, इसलिए रैखिक सहसंबंध गुणांक के शून्य से निरपेक्ष मान की निकटता अभी तक सुविधाओं के बीच संबंध की अनुपस्थिति के संकेतक के रूप में काम नहीं करती है।

यह मॉडल विनिर्देश की एक अलग पसंद के साथ है और इसके परिणामस्वरूप, निर्भरता का प्रकार है कि वास्तविक संबंध एकता के काफी करीब हो सकता है। लेकिन एक रैखिक फ़ंक्शन के चयन की गुणवत्ता रैखिक सहसंबंध गुणांक के वर्ग का उपयोग करके निर्धारित की जाती है - निर्धारण का गुणांक। यह परिणामी विशेषता y के प्रसरण के अनुपात की विशेषता है, परिणामी विशेषता के कुल विचरण में प्रतिगमन द्वारा समझाया गया है। वह मान जो 1 के निर्धारण के गुणांक को पूरक करता है, मॉडल (अवशिष्ट विचरण) में अन्य कारकों के प्रभाव के कारण होने वाले विचरण के अनुपात को दर्शाता है।

युग्म समाश्रयण निम्नलिखित रूप के दो चर y और x के बीच संबंध द्वारा दर्शाया गया है:

जहाँ y आश्रित चर (परिणाम विशेषता) है, और x स्वतंत्र चर (व्याख्यात्मक चर, या विशेषता कारक) है। रैखिक प्रतिगमन और गैर-रेखीय प्रतिगमन है। रैखिक प्रतिगमन को फॉर्म के समीकरण द्वारा वर्णित किया गया है:

वाई = ए + बीएक्स + ।

गैर-रेखीय प्रतिगमन, बदले में, विश्लेषण में शामिल व्याख्यात्मक चर के संबंध में गैर-रैखिक हो सकता है, लेकिन अनुमानित मापदंडों के संबंध में रैखिक हो सकता है। या हो सकता है कि प्रतिगमन अनुमानित मापदंडों के संदर्भ में गैर-रैखिक हो। एक प्रतिगमन के उदाहरण के रूप में जो व्याख्यात्मक चर में गैर-रैखिक है, लेकिन अनुमानित मापदंडों में रैखिक है, कोई विभिन्न डिग्री (बहुपद) और एक समबाहु अतिपरवलय की बहुपद निर्भरता को इंगित कर सकता है।

अनुमानित मापदंडों द्वारा गैर-रैखिक प्रतिगमन पैरामीटर के सापेक्ष एक शक्ति-कानून है (पैरामीटर घातांक में है) निर्भरता, घातीय निर्भरता, जहां पैरामीटर डिग्री के आधार पर है, और घातीय निर्भरता, जब संपूर्ण रैखिक निर्भरता पूर्णतया प्रतिपादक में है। ध्यान दें कि इन तीनों मामलों में, यादृच्छिक घटक (यादृच्छिक शेष) समीकरण के दाईं ओर एक कारक के रूप में प्रवेश करता है, न कि एक पद के रूप में, अर्थात। गुणनात्मक रूप से! वास्तविक से परिणामी विशेषता के परिकलित मानों का औसत विचलन औसत सन्निकटन त्रुटि की विशेषता है। इसे प्रतिशत के रूप में व्यक्त किया जाता है और यह 7-8% से अधिक नहीं होना चाहिए। यह औसत सन्निकटन त्रुटि केवल वास्तविक और परिकलित मूल्यों के बीच अंतर के सापेक्ष मूल्यों के औसत के प्रतिशत के रूप में व्यक्त की जाती है।

लोच का औसत गुणांक बहुत महत्व का है, जो कई आर्थिक घटनाओं और प्रक्रियाओं की एक महत्वपूर्ण विशेषता के रूप में कार्य करता है। इसकी गणना इस कार्यात्मक निर्भरता के व्युत्पन्न के मूल्य के उत्पाद के रूप में औसत मान x के औसत मान y के अनुपात से की जाती है। लोच गुणांक दिखाता है कि कितने प्रतिशत, औसतन, परिणाम y अपने औसत मूल्य से बदल जाएगा जब कारक x अपने (कारक x) औसत मूल्य से 1% बदलता है।

युग्मित प्रतिगमन के साथ और कई प्रतिगमन के साथ (जब कई कारक होते हैं) और अवशिष्ट विचरण के साथ, विचरण के विश्लेषण के कार्य निकटता से संबंधित होते हैं। प्रसरण का विश्लेषण आश्रित चर के प्रसरण की जांच करता है। इस मामले में, वर्ग विचलन का कुल योग दो भागों में बांटा गया है। पहला पद प्रतिगमन, या समझाया (फैक्टोरियल) के कारण वर्ग विचलन का योग है। दूसरा पद वर्ग विचलनों का अवशिष्ट योग है जो भाज्य प्रतिगमन द्वारा स्पष्ट नहीं किया गया है।

परिणामी विशेषता y के कुल विचरण में प्रतिगमन द्वारा समझाया गया विचरण का हिस्सा निर्धारण के गुणांक (सूचकांक) की विशेषता है, जो प्रतिगमन के कारण वर्ग विचलन के योग के कुल योग के अनुपात से अधिक कुछ नहीं है। चुकता विचलन (संपूर्ण योग का पहला पद)।

जब मॉडल पैरामीटर (अज्ञात के गुणांक) को कम से कम वर्ग विधि का उपयोग करके निर्धारित किया जाता है, तो, संक्षेप में, कुछ यादृच्छिक चर पाए जाते हैं (अनुमान प्राप्त करने की प्रक्रिया में)। विशेष महत्व के प्रतिगमन गुणांक का अनुमान है, जो एक यादृच्छिक चर का कुछ विशेष रूप है। इस यादृच्छिक चर के गुण समीकरण (मॉडल में) में शेष पद के गुणों पर निर्भर करते हैं। आइए हम व्याख्यात्मक चर x को एक युग्मित रैखिक प्रतिगमन मॉडल के लिए एक गैर-यादृच्छिक बहिर्जात चर के रूप में मानते हैं। इसका सीधा सा मतलब है कि सभी अवलोकनों में चर x के मूल्यों को पूर्व निर्धारित माना जा सकता है और इसका अध्ययन के तहत निर्भरता से कोई लेना-देना नहीं है। इस प्रकार, व्याख्या किए गए चर के वास्तविक मूल्य में दो घटक होते हैं: एक गैर-यादृच्छिक घटक और एक यादृच्छिक घटक (अवशिष्ट शब्द)।

दूसरी ओर, कम से कम वर्गों (OLS) की विधि द्वारा निर्धारित प्रतिगमन गुणांक x चर के प्रसरण द्वारा x और y चर के सहप्रसरण को विभाजित करने के भागफल के बराबर है। इसलिए, इसमें एक यादृच्छिक घटक भी शामिल है। आखिरकार, सहप्रसरण चर y के मानों पर निर्भर करता है, जहाँ चर y के मान यादृच्छिक अवशिष्ट पद के मानों पर निर्भर करते हैं। इसके अलावा, यह दिखाना आसान है कि चर x और y का सहप्रसरण अनुमानित प्रतिगमन गुणांक बीटा () के गुणनफल के बराबर है और चर x का प्रसरण, चर x और के सहप्रसरण में जोड़ा जाता है। इस प्रकार, बीटा प्रतिगमन गुणांक का अनुमान स्वयं इस अज्ञात प्रतिगमन गुणांक के बराबर है, जो चर x और के सहप्रसरण को चर x के प्रसरण से विभाजित करने के भागफल में जोड़ा जाता है। वे। किसी भी नमूने से प्राप्त प्रतिगमन गुणांक b का अनुमान दो पदों के योग के रूप में प्रस्तुत किया जाता है: गुणांक (बीटा) के वास्तविक मान के बराबर एक स्थिर मान, और एक यादृच्छिक घटक से जो चर x के सहप्रसरण पर निर्भर करता है और .

23. गॉस-मार्कोव की गणितीय शर्तें और उनका अनुप्रयोग।

सर्वोत्तम परिणाम देने के लिए साधारण न्यूनतम वर्गों पर आधारित प्रतिगमन विश्लेषण के लिए, यादृच्छिक शब्द को चार गॉस-मार्कोव शर्तों को पूरा करना चाहिए।

यादृच्छिक पद की गणितीय अपेक्षा शून्य है, अर्थात। यह निष्पक्ष है। यदि प्रतिगमन समीकरण में एक स्थिर पद शामिल है, तो इस तरह की आवश्यकता को पूरा करने पर विचार करना स्वाभाविक है, क्योंकि यह एक स्थिर शब्द है और इसे चर y के मूल्यों में किसी भी व्यवस्थित प्रवृत्ति को ध्यान में रखना चाहिए, जो इसके विपरीत, प्रतिगमन समीकरण के व्याख्यात्मक चर शामिल नहीं होने चाहिए।

यादृच्छिक पद का प्रसरण सभी प्रेक्षणों के लिए स्थिर होता है।

नमूना बनाने वाले यादृच्छिक चर के मूल्यों का सहप्रसरण शून्य के बराबर होना चाहिए, अर्थात। किन्हीं दो विशिष्ट प्रेक्षणों में यादृच्छिक पद के मानों के बीच कोई व्यवस्थित संबंध नहीं है। यादृच्छिक सदस्यों को एक दूसरे से स्वतंत्र होना चाहिए।

यादृच्छिक पद का वितरण नियम व्याख्यात्मक चरों से स्वतंत्र होना चाहिए।

इसके अलावा, कई अनुप्रयोगों में, व्याख्यात्मक चर स्टोकेस्टिक नहीं हैं; एक यादृच्छिक घटक नहीं है। प्रत्येक अवलोकन में किसी भी स्वतंत्र चर का मान बहिर्जात माना जाना चाहिए, जो पूरी तरह से बाहरी कारणों से निर्धारित होता है जिसे प्रतिगमन समीकरण में ध्यान में नहीं रखा जाता है।

संकेतित गॉस-मार्कोव स्थितियों के साथ, यह भी माना जाता है कि यादृच्छिक शब्द का सामान्य वितरण होता है। यह बहुत व्यापक परिस्थितियों में मान्य है और तथाकथित केंद्रीय सीमा प्रमेय (CLT) पर आधारित है। इस प्रमेय का सार यह है कि यदि एक यादृच्छिक चर बड़ी संख्या में अन्य यादृच्छिक चर की बातचीत का सामान्य परिणाम है, जिनमें से कोई भी इस सामान्य परिणाम के व्यवहार पर प्रमुख प्रभाव नहीं डालता है, तो ऐसा परिणामी यादृच्छिक चर होगा लगभग सामान्य वितरण द्वारा वर्णित। सामान्य वितरण के लिए यह निकटता हमें सामान्य वितरण का उपयोग करने की अनुमति देती है, और एक अर्थ में, इसका सामान्यीकरण, छात्र वितरण, जो मुख्य रूप से तथाकथित "पूंछ" पर सामान्य वितरण से अलग है, अर्थात। नमूना आकार के छोटे मूल्यों के लिए। यह भी महत्वपूर्ण है कि यदि यादृच्छिक शब्द सामान्य रूप से वितरित किया जाता है, तो प्रतिगमन गुणांक भी सामान्य कानून के अनुसार वितरित किया जाएगा।

स्थापित प्रतिगमन वक्र (प्रतिगमन समीकरण) तथाकथित बिंदु पूर्वानुमान की समस्या को हल करने की अनुमति देता है। ऐसी गणनाओं में, x के कुछ मान को अध्ययन किए गए अवलोकन अंतराल के बाहर ले जाया जाता है और प्रतिगमन समीकरण (एक्सट्रपलेशन प्रक्रिया) के दाईं ओर प्रतिस्थापित किया जाता है। क्योंकि प्रतिगमन गुणांक के अनुमान पहले से ही ज्ञात हैं, फिर x के लिए गए मान के अनुरूप व्याख्या किए गए चर y के मान की गणना करना संभव है। स्वाभाविक रूप से, भविष्यवाणी (पूर्वानुमान) के अर्थ के अनुसार, गणना आगे (भविष्य के मूल्यों के क्षेत्र में) की जाती है।

हालांकि, चूंकि गुणांक एक निश्चित त्रुटि के साथ निर्धारित किए गए थे, यह प्रभावी विशेषता के लिए बिंदु अनुमान (बिंदु पूर्वानुमान) नहीं है, बल्कि उस सीमा का ज्ञान है जिसके भीतर उत्पादक विशेषता के मूल्यों के अनुरूप है गुणनखंड x का लिया गया मान एक निश्चित प्रायिकता के साथ होगा।

ऐसा करने के लिए, मानक त्रुटि (मानक विचलन) के मान की गणना की जाती है। इसे अभी जो कहा गया है उसकी भावना से प्राप्त किया जा सकता है। औसत मानों के संदर्भ में अनुमानों से मुक्त पद a की अभिव्यक्ति को रेखीय प्रतिगमन समीकरण में प्रतिस्थापित किया जाता है। तब यह पता चलता है कि मानक त्रुटि परिणामी कारक y के औसत की त्रुटि पर और योगात्मक रूप से प्रतिगमन गुणांक b की त्रुटि पर निर्भर करती है। बस, इस मानक त्रुटि का वर्ग माध्य y की चुकता त्रुटि के योग के बराबर होता है और प्रतिगमन गुणांक की चुकता त्रुटि का गुणनफल गुणनखंड x और उसके माध्य के विचलन के वर्ग के गुणनफल के बराबर होता है। इसके अलावा, पहला पद, सांख्यिकी के नियमों के अनुसार, नमूने के आकार (आयतन) द्वारा सामान्य जनसंख्या के विचरण को विभाजित करने के भागफल के बराबर है।

अज्ञात विचरण के बजाय, नमूना विचरण का उपयोग अनुमान के रूप में किया जाता है। तदनुसार, प्रतिगमन गुणांक की त्रुटि को x कारक के प्रसरण द्वारा नमूना विचरण को विभाजित करने के भागफल के रूप में परिभाषित किया गया है। आप मानक त्रुटि (मानक विचलन) और अन्य विचारों का मान प्राप्त कर सकते हैं, जो रैखिक प्रतिगमन मॉडल से अधिक स्वतंत्र हैं। इसके लिए औसत त्रुटि और सीमांत त्रुटि की अवधारणा और उनके बीच संबंध का उपयोग किया जाता है।

लेकिन मानक त्रुटि प्राप्त करने के बाद भी, उन सीमाओं के बारे में प्रश्न बना रहता है जिनके भीतर अनुमानित मूल्य निहित होगा। दूसरे शब्दों में, माप त्रुटि के अंतराल के बारे में, कई मामलों में प्राकृतिक धारणा में कि इस अंतराल के मध्य को प्रभावी कारक y के परिकलित (औसत) मान द्वारा दिया जाता है। यहां केंद्रीय सीमा प्रमेय बचाव के लिए आता है, जो सिर्फ यह इंगित करता है कि इस विश्वास अंतराल के भीतर अज्ञात मूल्य किस संभावना के साथ है।

संक्षेप में, मानक त्रुटि सूत्र, इस पर ध्यान दिए बिना कि इसे कैसे और किस रूप में प्राप्त किया जाता है, प्रतिगमन रेखा की स्थिति में त्रुटि की विशेषता है। मानक त्रुटि का मान न्यूनतम तक पहुंच जाता है जब कारक x का मान कारक के औसत मान के साथ मेल खाता है।

24. परिकल्पनाओं का सांख्यिकीय परीक्षण और फिशर मानदंड द्वारा रैखिक प्रतिगमन के महत्व का मूल्यांकन।

रैखिक प्रतिगमन समीकरण मिलने के बाद, समग्र रूप से समीकरण और उसके व्यक्तिगत मापदंडों दोनों के महत्व का आकलन किया जाता है। समग्र रूप से प्रतिगमन समीकरण के महत्व का आकलन विभिन्न मानदंडों का उपयोग करके किया जा सकता है। फिशर एफ-टेस्ट का उपयोग काफी सामान्य और प्रभावी है। इस मामले में, शून्य परिकल्पना एच o को सामने रखा जाता है कि प्रतिगमन गुणांक शून्य के बराबर है, अर्थात। b = 0, और इसलिए कारक x का परिणाम y पर कोई प्रभाव नहीं पड़ता है। एफ-मानदंड की प्रत्यक्ष गणना विचरण के विश्लेषण से पहले होती है। इसमें केंद्रीय स्थान पर y के औसत मान से चर y के वर्ग विचलन के कुल योग के अपघटन द्वारा दो भागों में कब्जा कर लिया गया है - "व्याख्या" और "अस्पष्ट":

औसत मूल्य y से प्रभावी विशेषता y के व्यक्तिगत मूल्यों के चुकता विचलन का कुल योग कई कारकों के प्रभाव के कारण होता है।

हम सशर्त रूप से कारणों के पूरे सेट को दो समूहों में विभाजित करते हैं: अध्ययन किया गया कारक x और अन्य कारक। यदि कारक परिणाम को प्रभावित नहीं करता है, तो ग्राफ पर प्रतिगमन रेखा x-अक्ष और y=y के समानांतर होती है। तब परिणामी विशेषता का संपूर्ण फैलाव अन्य कारकों के प्रभाव के कारण होता है और वर्ग विचलन का कुल योग अवशिष्ट के साथ मेल खाएगा। यदि अन्य कारक परिणाम को प्रभावित नहीं करते हैं, तो y कार्यात्मक रूप से x से संबंधित है और वर्गों का अवशिष्ट योग शून्य है। इस मामले में, प्रतिगमन द्वारा समझाया गया वर्ग विचलन का योग वर्गों के कुल योग के समान है। चूँकि सहसंबंध क्षेत्र के सभी बिंदु प्रतीपगमन रेखा पर नहीं होते हैं, उनका प्रकीर्णन हमेशा कारक x के प्रभाव के कारण होता है, अर्थात। x पर y का प्रतिगमन, और अन्य कारणों (अस्पष्टीकृत भिन्नता) की कार्रवाई के कारण होता है। भविष्यवाणी के लिए प्रतिगमन रेखा की उपयुक्तता इस बात पर निर्भर करती है कि व्याख्या की गई भिन्नता के कारण विशेषता y की कुल भिन्नता का कितना हिस्सा है।

जाहिर है, यदि प्रतिगमन के कारण वर्ग विचलन का योग वर्गों के अवशिष्ट योग से अधिक है, तो प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण है और परिणाम पर x कारक का महत्वपूर्ण प्रभाव पड़ता है। यह इस तथ्य के बराबर है कि दृढ़ संकल्प का गुणांक एकता के करीब पहुंच जाएगा। वर्ग विचलन का कोई भी योग स्वतंत्रता की डिग्री की संख्या से संबंधित है, अर्थात। किसी विशेषता के स्वतंत्र रूपांतर की स्वतंत्रता की संख्या। स्वतंत्रता की डिग्री की संख्या जनसंख्या इकाइयों की संख्या या इससे निर्धारित स्थिरांक की संख्या से संबंधित है। अध्ययन के तहत समस्या के संबंध में, स्वतंत्रता की डिग्री की संख्या को दिखाना चाहिए कि n में से कितने स्वतंत्र विचलन संभव हैं [(y 1 - y), (y 2 - y), ... (y n - y)] की आवश्यकता है दिए गए वर्गों का योग बनाने के लिए। तो, वर्गों के कुल योग के लिए (y-y cf) 2, (n-1) स्वतंत्र विचलन की आवश्यकता है, क्योंकि n इकाइयों की आबादी में, औसत स्तर की गणना के बाद, केवल (n-1) विचलन की संख्या स्वतंत्र रूप से भिन्न होती है। वर्गों (y-y cf) 2 की व्याख्या या तथ्यात्मक योग की गणना करते समय, प्रतिगमन रेखा के साथ पाए जाने वाले प्रभावी फीचर y* के सैद्धांतिक (गणना) मूल्यों का उपयोग किया जाता है: y(x)=a+bx।

आइए अब हम इस मान के औसत से प्रभावी कारक के वर्ग विचलन के कुल योग के विस्तार पर लौटते हैं। इस योग में पहले से ऊपर परिभाषित दो भाग होते हैं: वर्ग विचलन का योग, प्रतिगमन द्वारा समझाया गया, और दूसरा योग, जिसे चुकता विचलन का अवशिष्ट योग कहा जाता है। यह अपघटन विचरण के विश्लेषण से संबंधित है, जो सीधे मौलिक प्रश्न का उत्तर देता है: समग्र रूप से प्रतिगमन समीकरण के महत्व और इसके व्यक्तिगत मापदंडों का मूल्यांकन कैसे करें? यह काफी हद तक इस प्रश्न का अर्थ भी निर्धारित करता है। समग्र रूप से प्रतीपगमन समीकरण के महत्व का आकलन करने के लिए फिशर परीक्षण (एफ-परीक्षण) का उपयोग किया जाता है। फिशर द्वारा प्रस्तावित दृष्टिकोण के अनुसार, एक शून्य परिकल्पना सामने रखी गई है: प्रतिगमन गुणांक शून्य के बराबर है, अर्थात। मूल्य बी = 0। इसका मतलब है कि कारक X का परिणाम Y पर कोई प्रभाव नहीं पड़ता है।

याद रखें कि लगभग हमेशा एक सांख्यिकीय अध्ययन के परिणामस्वरूप प्राप्त अंक प्रतिगमन रेखा पर बिल्कुल नहीं होते हैं। वे बिखरे हुए हैं, कमोबेश प्रतिगमन रेखा से दूर हटाए जा रहे हैं। यह प्रकीर्णन व्याख्यात्मक कारक X के अलावा अन्य कारकों के प्रभाव के कारण होता है, जिन्हें प्रतिगमन समीकरण में ध्यान में नहीं रखा जाता है। वर्ग विचलन की व्याख्या या भाज्य योग की गणना करते समय, प्रतिगमन रेखा के साथ पाए जाने वाले परिणामी विशेषता के सैद्धांतिक मूल्यों का उपयोग किया जाता है।

चर Y और X के मानों के दिए गए सेट के लिए, रैखिक प्रतिगमन में Y के औसत मान का परिकलित मान केवल एक पैरामीटर का एक कार्य है - प्रतिगमन गुणांक। इसके अनुसार, वर्ग विचलन के भाज्य योग में स्वतंत्रता की डिग्री की संख्या 1 के बराबर होती है और रैखिक प्रतिगमन में वर्ग विचलन के अवशिष्ट योग की स्वतंत्रता की डिग्री की संख्या n-2 है।

इसलिए, मूल विस्तार में वर्ग विचलन के प्रत्येक योग को स्वतंत्रता की डिग्री की संख्या से विभाजित करके, हम औसत वर्ग विचलन (स्वतंत्रता की एक डिग्री प्रति फैलाव) प्राप्त करते हैं। इसके अलावा, स्वतंत्रता की एक डिग्री द्वारा स्वतंत्रता की एक डिग्री द्वारा तथ्यात्मक भिन्नता को विभाजित करके, हम शून्य परिकल्पना, तथाकथित एफ-संबंध, या उसी नाम की कसौटी के परीक्षण के लिए एक मानदंड प्राप्त करते हैं। अर्थात्, यदि शून्य परिकल्पना सत्य है, तो भाज्य और अवशिष्ट प्रसरण एक दूसरे के बराबर हो जाते हैं।

शून्य परिकल्पना को अस्वीकार करने के लिए, अर्थात। विपरीत परिकल्पना को स्वीकार करना, जो अध्ययन के तहत निर्भरता के महत्व (उपस्थिति) के तथ्य को व्यक्त करता है, और न केवल एक निर्भरता का अनुकरण करने वाले कारकों का एक यादृच्छिक संयोग जो वास्तव में मौजूद नहीं है, के महत्वपूर्ण मूल्यों की तालिकाओं का उपयोग करना आवश्यक है निर्दिष्ट अनुपात। तालिकाएँ फिशर मानदंड के महत्वपूर्ण (दहलीज) मान को निर्धारित करती हैं। इसे सैद्धांतिक भी कहा जाता है। फिर, अवलोकन संबंधी डेटा से गणना की गई कसौटी के संबंधित अनुभवजन्य (वास्तविक) मूल्य के साथ इसकी तुलना करके, यह जांचा जाता है कि अनुपात का वास्तविक मूल्य तालिकाओं से महत्वपूर्ण मूल्य से अधिक है या नहीं।

अधिक विस्तार से, यह निम्नानुसार किया जाता है। एक शून्य परिकल्पना की उपस्थिति की संभावना का एक निश्चित स्तर चुना जाता है और एफ-मानदंड का महत्वपूर्ण मूल्य तालिकाओं से पाया जाता है, जिस पर 1 डिग्री स्वतंत्रता से भिन्नताओं का यादृच्छिक विचलन अभी भी हो सकता है, यानी। अधिकतम ऐसा मूल्य। तब अनुपात F- के परिकलित मान को विश्वसनीय माना जाता है (अर्थात, वास्तविक और अवशिष्ट प्रसरणों के बीच अंतर को व्यक्त करते हुए), यदि यह अनुपात सारणीबद्ध से अधिक है। तब शून्य परिकल्पना को खारिज कर दिया जाता है (यह सच नहीं है कि कनेक्शन के कोई संकेत नहीं हैं) और, इसके विपरीत, हम इस निष्कर्ष पर पहुंचते हैं कि कनेक्शन मौजूद है और महत्वपूर्ण है (यह गैर-यादृच्छिक, महत्वपूर्ण है)।

यदि अनुपात का मान सारणीबद्ध मान से कम है, तो शून्य परिकल्पना की संभावना निर्दिष्ट स्तर (जिसे शुरू में चुना गया था) से अधिक है और शून्य परिकल्पना को खारिज नहीं किया जा सकता है, इसके बारे में गलत निष्कर्ष प्राप्त करने के एक उल्लेखनीय खतरे के बिना खारिज नहीं किया जा सकता है। एक कनेक्शन की उपस्थिति। तदनुसार, प्रतिगमन समीकरण को महत्वहीन माना जाता है।

एफ-मानदंड का मूल्य निर्धारण के गुणांक के साथ जुड़ा हुआ है। समग्र रूप से प्रतिगमन समीकरण के महत्व का आकलन करने के अलावा, प्रतिगमन समीकरण के अलग-अलग मापदंडों के महत्व का भी मूल्यांकन किया जाता है। इस मामले में, प्रतिगमन गुणांक की मानक त्रुटि अनुभवजन्य वास्तविक मानक विचलन और प्रति एक डिग्री स्वतंत्रता के अनुभवजन्य भिन्नता का उपयोग करके निर्धारित की जाती है। उसके बाद, छात्र के वितरण का उपयोग उसके आत्मविश्वास अंतराल की गणना के लिए प्रतिगमन गुणांक के महत्व का परीक्षण करने के लिए किया जाता है।

छात्र के टी-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन इन मूल्यों के मूल्यों और मानक त्रुटि की तुलना करके किया जाता है। रेखीय प्रतिगमन मापदंडों और सहसंबंध गुणांक का त्रुटि मान निम्नलिखित सूत्रों द्वारा निर्धारित किया जाता है:

जहाँ S मूल माध्य वर्ग अवशिष्ट नमूना विचलन है,

r xy सहसंबंध गुणांक है।

तदनुसार, प्रतिगमन रेखा द्वारा अनुमानित मानक त्रुटि का मान सूत्र द्वारा दिया गया है:

प्रतिगमन और सहसंबंध गुणांक के मूल्यों के संबंधित अनुपात उनकी मानक त्रुटि के लिए तथाकथित टी-सांख्यिकी बनाते हैं, और इसके संबंधित सारणीबद्ध (महत्वपूर्ण) मूल्य और इसके वास्तविक मूल्य की तुलना करता है शून्य परिकल्पना को स्वीकार या अस्वीकार करना संभव है। लेकिन आगे, विश्वास अंतराल की गणना करने के लिए, प्रत्येक संकेतक के लिए सीमांत त्रुटि को सांख्यिकी t के सारणीबद्ध मान और संबंधित संकेतक की औसत यादृच्छिक त्रुटि के उत्पाद के रूप में पाया जाता है। वास्तव में, थोड़ा अलग तरीके से, हमने वास्तव में इसे ठीक ऊपर लिखा है। फिर विश्वास अंतराल की सीमाएँ प्राप्त की जाती हैं: निचली सीमा को संबंधित सीमांत त्रुटि के संबंधित गुणांक (वास्तव में, औसत वाले) से घटाया जाता है, और ऊपरी सीमा को जोड़ा जाता है (जोड़ा जाता है)।

रैखिक प्रतिगमन में ∑(y x -y avg) 2 =b 2 ∑(x-x avg) 2 । रैखिक सहसंबंध गुणांक के सूत्र का हवाला देकर इसे सत्यापित करना आसान है: r 2 xy \u003d b 2 * 2 x / σ 2 y

जहां 2 y विशेषता y का कुल प्रसरण है;

2 x - गुणक x के कारण गुण y का प्रसरण। तदनुसार, रैखिक प्रतिगमन के कारण वर्ग विचलन का योग होगा:

(y x -y cf) 2 =b 2 ∑(x-x cf) 2 ।

चूँकि, x और y में दी गई प्रेक्षणों की मात्रा के लिए, रैखिक समाश्रयण में वर्गों का भाज्य योग, समाश्रयण गुणांक b के केवल एक स्थिरांक पर निर्भर करता है, तो वर्गों के इस योग में स्वतंत्रता की एक डिग्री होती है। गुण y के परिकलित मान के सामग्री पक्ष पर विचार करें, अर्थात। एक्स पर y x का मान रैखिक प्रतिगमन समीकरण द्वारा निर्धारित किया जाता है: y x ​​\u003d a + bx।

पैरामीटर a को a=y-bx के रूप में परिभाषित किया जा सकता है। पैरामीटर के लिए अभिव्यक्ति को रैखिक मॉडल में प्रतिस्थापित करते हुए, हम प्राप्त करते हैं: y x ​​=y-bx+bx cp =y-b(x-x cf)।

चर y और x के दिए गए सेट के साथ, रैखिक प्रतिगमन में परिकलित मान y x केवल एक पैरामीटर का एक कार्य है - प्रतिगमन गुणांक। तदनुसार, वर्ग विचलन के भाज्य योग में स्वतंत्रता की कई डिग्री 1 के बराबर होती है।

वर्गों के कुल, भाज्य और अवशिष्ट योगों की स्वतंत्रता की डिग्री की संख्या के बीच एक समानता है। रैखिक प्रतिगमन में वर्गों के अवशिष्ट योग की स्वतंत्रता की डिग्री की संख्या (n-2) है। वर्गों के कुल योग के लिए स्वतंत्रता की डिग्री की संख्या इकाइयों की संख्या से निर्धारित होती है, और चूंकि हम नमूना डेटा से गणना की गई औसत का उपयोग करते हैं, हम स्वतंत्रता की एक डिग्री खो देते हैं, अर्थात। (एन -1)। तो, हमारे पास दो समानताएं हैं: रकम के लिए और स्वतंत्रता की डिग्री की संख्या के लिए। और यह, बदले में, हमें प्रति एक डिग्री स्वतंत्रता के तुलनीय फैलाव पर वापस लाता है, जिसका अनुपात फिशर मानदंड देता है।

25. विद्यार्थी की कसौटी के अनुसार समाश्रयण समीकरण और गुणांकों के अलग-अलग मापदंडों के महत्व का आकलन।

27. रैखिक और गैर-रेखीय प्रतिगमन और उनके अध्ययन के तरीके।

रैखिक प्रतिगमन और इसके अध्ययन और मूल्यांकन के तरीके इतने महत्वपूर्ण नहीं होंगे यदि, इसके अलावा, यह बहुत महत्वपूर्ण है, लेकिन फिर भी सबसे सरल मामला है, हमने उनका उपयोग अधिक जटिल गैर-रैखिक निर्भरता का विश्लेषण करने के लिए एक उपकरण प्राप्त करने के लिए नहीं किया है। गैर-रेखीय प्रतिगमन को दो अनिवार्य रूप से अलग-अलग वर्गों में विभाजित किया जा सकता है। पहला और सरल गैर-रेखीय निर्भरता का वर्ग है, जिसमें व्याख्यात्मक चर के संबंध में गैर-रैखिकता है, लेकिन जो उनमें शामिल मापदंडों के संदर्भ में रैखिक रहते हैं और अनुमान लगाया जाता है। इसमें अलग-अलग डिग्री के बहुपद और एक समबाहु अतिपरवलय शामिल हैं।

चर के एक साधारण परिवर्तन (प्रतिस्थापन) द्वारा स्पष्टीकरण में शामिल चर के लिए इस तरह के एक गैर-रेखीय प्रतिगमन को आसानी से नए चर के लिए सामान्य रैखिक प्रतिगमन में कम किया जा सकता है। इसलिए, इस मामले में मापदंडों का अनुमान केवल कम से कम वर्गों द्वारा किया जाता है, क्योंकि निर्भरताएं मापदंडों में रैखिक होती हैं। इस प्रकार, एक समबाहु अतिशयोक्ति द्वारा वर्णित एक गैर-रेखीय निर्भरता द्वारा अर्थव्यवस्था में एक महत्वपूर्ण भूमिका निभाई जाती है:

इसके मापदंडों का बहुराष्ट्रीय कंपनी द्वारा अच्छी तरह से अनुमान लगाया जाता है, और यह निर्भरता ही कच्चे माल, ईंधन, उत्पादन की मात्रा के साथ सामग्री, माल के संचलन के समय और टर्नओवर के मूल्य के साथ इन सभी कारकों की इकाई लागत के संबंध को दर्शाती है। . उदाहरण के लिए, फिलिप्स वक्र बेरोजगारी दर और मजदूरी वृद्धि के प्रतिशत के बीच गैर-रैखिक संबंध को दर्शाता है।

स्थिति एक प्रतिगमन के साथ पूरी तरह से अलग है जो अनुमानित मापदंडों के संदर्भ में गैर-रैखिक है, उदाहरण के लिए, एक पावर फ़ंक्शन द्वारा दर्शाया गया है, जिसमें डिग्री ही (इसका संकेतक) एक पैरामीटर है, या पैरामीटर पर निर्भर करता है। यह एक घातांकीय फलन भी हो सकता है, जहां डिग्री का आधार एक पैरामीटर और एक घातांकीय फलन है, जिसमें, फिर से, संकेतक में एक पैरामीटर या मापदंडों का संयोजन होता है। यह वर्ग, बदले में, दो उपवर्गों में विभाजित है: एक में बाहरी रूप से गैर-रैखिक, लेकिन अनिवार्य रूप से आंतरिक रूप से रैखिक शामिल है। इस मामले में, आप रूपांतरणों का उपयोग करके मॉडल को रैखिक रूप में ला सकते हैं। हालाँकि, यदि मॉडल आंतरिक रूप से गैर-रैखिक है, तो इसे एक रैखिक फ़ंक्शन में कम नहीं किया जा सकता है।

इस प्रकार, केवल मॉडल जो आंतरिक रूप से गैर-रैखिक हैं, उन्हें प्रतिगमन विश्लेषण में वास्तव में गैर-रैखिक माना जाता है। अन्य सभी, परिवर्तनों के माध्यम से रैखिक में कम हो गए, ऐसा नहीं माना जाता है, और उन्हें अक्सर अर्थमितीय अध्ययनों में माना जाता है। साथ ही, इसका मतलब यह नहीं है कि अर्थमिति में अनिवार्य रूप से गैर-रेखीय निर्भरताओं का अध्ययन नहीं किया जा सकता है। यदि मॉडल आंतरिक रूप से मापदंडों में गैर-रैखिक है, तो मापदंडों का अनुमान लगाने के लिए पुनरावृत्त प्रक्रियाओं का उपयोग किया जाता है, जिसकी सफलता उपयोग की जाने वाली पुनरावृत्ति विधि की विलक्षणताओं के समीकरण के प्रकार पर निर्भर करती है।

आइए हम उन निर्भरताओं पर लौटते हैं जो रेखीय तक कम हो जाती हैं। यदि वे पैरामीटर और चर दोनों के संदर्भ में गैर-रैखिक हैं, उदाहरण के लिए, फॉर्म y \u003d एक्स की शक्ति से गुणा किया जाता है, जिसका संकेतक पैरामीटर है - (बीटा):

जाहिर है, इस तरह के अनुपात को एक साधारण लघुगणक द्वारा आसानी से एक रैखिक समीकरण में बदल दिया जाता है।

लघुगणक को निरूपित करने वाले नए चरों को प्रस्तुत करने के बाद, एक रैखिक समीकरण प्राप्त होता है। फिर प्रतिगमन अनुमान प्रक्रिया में मूल मूल्यों के लघुगणक लेकर प्रत्येक अवलोकन के लिए नए चर की गणना करना शामिल है। फिर नए चर के प्रतिगमन निर्भरता का अनुमान लगाया जाता है। मूल चरों को पास करने के लिए, किसी को एंटीलॉगरिदम लेना चाहिए, यानी, वास्तव में, अपने घातांक के बजाय स्वयं शक्तियों पर लौटना चाहिए (आखिरकार, लघुगणक घातांक है)। घातीय या घातीय कार्यों के मामले को इसी तरह माना जा सकता है।

अनिवार्य रूप से गैर-रेखीय प्रतिगमन के लिए, सामान्य प्रतिगमन आकलन प्रक्रिया का उपयोग नहीं किया जा सकता है, क्योंकि संबंधित निर्भरता को रैखिक में परिवर्तित नहीं किया जा सकता है। इस मामले में कार्रवाई की सामान्य योजना इस प्रकार है:

1. कुछ प्रशंसनीय प्रारंभिक पैरामीटर मान स्वीकार किए जाते हैं;

2. इन पैरामीटर मानों का उपयोग करके वास्तविक X मानों से अनुमानित Y मानों की गणना करें;

3. नमूने में सभी प्रेक्षणों के लिए अवशिष्टों की गणना करें और फिर अवशिष्टों के वर्गों का योग;

4. एक या अधिक पैरामीटर अनुमानों में छोटे परिवर्तन किए जाते हैं;

5. नए अनुमानित Y मान, अवशिष्ट और चुकता अवशिष्टों के योग की गणना की जाती है;

6. यदि अवशेषों के वर्गों का योग पहले की तुलना में कम है, तो नए पैरामीटर अनुमान पुराने लोगों की तुलना में बेहतर हैं और उन्हें एक नए शुरुआती बिंदु के रूप में इस्तेमाल किया जाना चाहिए;

7. चरण 4, 5 और 6 को फिर से दोहराया जाता है जब तक कि पैरामीटर अनुमानों में ऐसे परिवर्तन करना संभव न हो जिससे वर्गों के अवशेषों के योग में परिवर्तन हो;

8. यह निष्कर्ष निकाला गया है कि अवशिष्टों के वर्गों के योग का मान न्यूनतम किया जाता है और पैरामीटरों का अंतिम अनुमान न्यूनतम वर्ग विधि द्वारा अनुमान लगाया जाता है।

गैर-रैखिक कार्यों में से एक रैखिक रूप में कम किया जा सकता है, घातीय कार्य व्यापक रूप से अर्थमिति में उपयोग किया जाता है। लोच के गुणांक होने के कारण इसमें पैरामीटर बी की स्पष्ट व्याख्या है। उन मॉडलों में जो अनुमानित मापदंडों के संदर्भ में गैर-रैखिक हैं, लेकिन एक रैखिक रूप में कम हो गए हैं, एलएसएम को रूपांतरित समीकरणों पर लागू किया जाता है। लघुगणक का व्यावहारिक अनुप्रयोग और, तदनुसार, घातांक संभव है जब परिणामी विशेषता में नकारात्मक मान न हों। परिणामी विशेषता के लघुगणक का उपयोग करने वाले कार्यों के बीच संबंधों के अध्ययन में, शक्ति-कानून निर्भरता अर्थमिति में प्रबल होती है (आपूर्ति और मांग वक्र, उत्पादन कार्य, उत्पादों की श्रम तीव्रता के बीच संबंधों को चिह्नित करने के लिए विकास वक्र, उत्पादन का पैमाना, रोजगार के स्तर पर जीएनआई की निर्भरता, एंगेल कर्व्स)।

28. उलटा मॉडल और इसका उपयोग

कभी-कभी तथाकथित व्युत्क्रम मॉडल का उपयोग किया जाता है, जो आंतरिक रूप से गैर-रैखिक होता है, लेकिन इसमें, समबाहु अतिशयोक्ति के विपरीत, यह व्याख्यात्मक चर नहीं है जो रूपांतरित होता है, लेकिन परिणामी विशेषता Y। इसलिए, उलटा मॉडल निकलता है आंतरिक रूप से गैर-रैखिक हो और एलएलएस आवश्यकता परिणामी सुविधा वाई के वास्तविक मूल्यों और उनके पारस्परिक मूल्यों के लिए पूरी नहीं होती है। गैर-रैखिक प्रतिगमन के लिए सहसंबंध का अध्ययन विशेष ध्यान देने योग्य है। सामान्य स्थिति में, दूसरी डिग्री का एक परवलय, साथ ही एक उच्च क्रम के बहुपद, जब रैखिक किया जाता है, तो एक बहु प्रतिगमन समीकरण का रूप ले लेता है। यदि प्रतिगमन समीकरण, जो समझाया जा रहा चर के संबंध में गैर-रैखिक है, रैखिककरण के दौरान एक रैखिक जोड़ी प्रतिगमन समीकरण का रूप लेता है, तो रिश्ते की मजबूती का आकलन करने के लिए एक रैखिक सहसंबंध गुणांक का उपयोग किया जा सकता है।

यदि प्रतिगमन समीकरण का रैखिक रूप में परिवर्तन एक आश्रित चर (परिणामी विशेषता) के साथ जुड़ा हुआ है, तो रूपांतरित विशेषता मानों के लिए रैखिक सहसंबंध गुणांक केवल संबंध का अनुमानित अनुमान देता है और संख्यात्मक रूप से सहसंबंध के साथ मेल नहीं खाता है अनुक्रमणिका। यह ध्यान में रखा जाना चाहिए कि सहसंबंध सूचकांक की गणना करते समय, प्रभावी सुविधा वाई के वर्ग विचलन के योग का उपयोग किया जाता है, न कि उनके लघुगणक। सहसंबंध सूचकांक के महत्व का आकलन उसी तरह किया जाता है जैसे सहसंबंध गुणांक की विश्वसनीयता (महत्व) का आकलन किया जाता है। सहसंबंध सूचकांक, साथ ही निर्धारण सूचकांक, का उपयोग फिशर के एफ-परीक्षण द्वारा समग्र गैर-रेखीय प्रतिगमन समीकरण के महत्व का परीक्षण करने के लिए किया जाता है।

ध्यान दें कि गैर-रैखिक मॉडल बनाने की क्षमता, दोनों को एक रेखीय रूप में कम करके, और एक ओर गैर-रेखीय प्रतिगमन का उपयोग करके, प्रतिगमन विश्लेषण की सार्वभौमिकता को बढ़ाता है। दूसरी ओर, यह शोधकर्ता के कार्यों को महत्वपूर्ण रूप से जटिल बनाता है। यदि हम खुद को जोड़ीदार प्रतिगमन विश्लेषण तक सीमित रखते हैं, तो हम वाई और एक्स अवलोकनों को स्कैटरप्लॉट के रूप में प्लॉट कर सकते हैं। अक्सर कई अलग-अलग गैर-रैखिक कार्य अवलोकनों का अनुमान लगाते हैं यदि वे किसी वक्र पर स्थित होते हैं। लेकिन कई प्रतिगमन विश्लेषण के मामले में, ऐसा ग्राफ नहीं बनाया जा सकता है।

आश्रित चर की समान परिभाषा वाले वैकल्पिक मॉडलों पर विचार करते समय, चयन प्रक्रिया अपेक्षाकृत सरल होती है। आप कल्पनीय सभी संभावित कार्यों के आधार पर प्रतिगमन का मूल्यांकन कर सकते हैं और उस फ़ंक्शन का चयन कर सकते हैं जो आश्रित चर में परिवर्तनों को सर्वोत्तम रूप से समझाता है। यह स्पष्ट है कि जब एक रैखिक फ़ंक्शन y में लगभग 64% विचरण की व्याख्या करता है, और एक अतिशयोक्तिपूर्ण एक 99.9%, तो बाद वाले को स्पष्ट रूप से चुना जाना चाहिए। लेकिन जब विभिन्न मॉडल विभिन्न कार्यात्मक रूपों का उपयोग करते हैं, तो मॉडल चुनने की समस्या बहुत अधिक जटिल हो जाती है।

29. बॉक्स-कॉक्स परीक्षण का उपयोग।

अधिक सामान्यतः, आश्रित चर की समान परिभाषा वाले वैकल्पिक मॉडलों पर विचार करते समय, चुनाव सरल होता है। सभी संभावित कार्यों के आधार पर प्रतिगमन का मूल्यांकन करना सबसे उचित है, उस फ़ंक्शन पर रोकना जो आश्रित चर में परिवर्तनों को सर्वोत्तम रूप से समझाता है। यदि निर्धारण का गुणांक एक मामले में प्रतिगमन द्वारा समझाया गया विचरण के अनुपात को मापता है, और दूसरे मामले में प्रतिगमन द्वारा समझाया गया इस आश्रित चर के लघुगणक के विचरण का अनुपात है, तो चुनाव बिना किसी कठिनाई के किया जाता है। एक और बात यह है कि जब दो मॉडलों के लिए ये मान बहुत करीब होते हैं और पसंद की समस्या बहुत अधिक जटिल हो जाती है।

फिर बॉक्स-कॉक्स परीक्षण के रूप में मानक प्रक्रिया लागू की जानी चाहिए। यदि आपको केवल परिणामी कारक और उसके लघुगणक का उपयोग करके आश्रित चर के एक प्रकार के रूप में मॉडल की तुलना करने की आवश्यकता है, तो ज़रेम्बका परीक्षण के एक प्रकार का उपयोग किया जाता है। यह एक वाई-स्केल परिवर्तन का प्रस्ताव करता है जो रैखिक और लॉगरिदमिक मॉडल में रूट माध्य वर्ग त्रुटि (आरएमएस) की प्रत्यक्ष तुलना की अनुमति देता है। संबंधित प्रक्रिया में निम्नलिखित चरण शामिल हैं:

    नमूने में Y मानों के ज्यामितीय माध्य की गणना की जाती है, जो Y के लघुगणक के अंकगणितीय माध्य के घातांक के साथ मेल खाता है;

    प्रेक्षण Y की पुनर्गणना इस प्रकार की जाती है कि वे पहले चरण में प्राप्त मान से विभाजित हो जाते हैं;

    मूल Y मानों के बजाय स्केल किए गए Y मानों का उपयोग करते हुए एक रैखिक मॉडल के लिए प्रतिगमन का अनुमान लगाया जाता है, और स्केल किए गए Y मानों के लघुगणक का उपयोग करते हुए एक लघुगणक मॉडल के लिए। अब दो प्रतिगमन के लिए एसडी मान तुलनीय हैं और इसलिए एक मॉडल के साथ वर्ग विचलन का एक छोटा योग मनाया मूल्यों की वास्तविक निर्भरता के साथ बेहतर फिट प्रदान करता है;

    यह जांचने के लिए कि मॉडल में से एक काफी बेहतर फिट प्रदान नहीं करता है, आप अवलोकनों की आधी संख्या के उत्पाद का उपयोग कर सकते हैं और स्केल किए गए प्रतिगमन में आरएमएस मूल्यों के अनुपात के लघुगणक का उपयोग कर सकते हैं, और फिर निरपेक्ष मान ले सकते हैं यह मान।

30. कारकों के अंतर्संबंध और बहुसंरेखण की अवधारणाएँ।

34. बहुराष्ट्रीय कंपनी के मूल तत्व और उसके आवेदन की वैधता।

आइए अब हम एलएसएम की मूल बातें, इसके आवेदन की वैधता (बहु प्रतिगमन की समस्याओं सहित) और एलएसएम का उपयोग करके प्राप्त अनुमानों के सबसे महत्वपूर्ण गुणों की ओर मुड़ें। आइए इस तथ्य से शुरू करें कि, प्रतिगमन समीकरण के दाईं ओर विश्लेषणात्मक निर्भरता के साथ, यादृच्छिक शब्द भी एक महत्वपूर्ण भूमिका निभाता है। यह यादृच्छिक घटक एक अचूक मात्रा है। प्रतिगमन मापदंडों और सहसंबंध उपायों के सांख्यिकीय परीक्षण स्वयं बहु प्रतिगमन के इस यादृच्छिक घटक के वितरण के बारे में असत्यापित मान्यताओं पर आधारित हैं। ये धारणाएं केवल प्रारंभिक हैं। प्रतिगमन समीकरण का निर्माण करने के बाद ही यह जांचा जाता है कि क्या अनुमानों में एक प्राथमिकता मानी गई संपत्तियों के यादृच्छिक अवशेष (यादृच्छिक घटक के अनुभवजन्य अनुरूप) हैं। संक्षेप में, जब मॉडल मापदंडों का अनुमान लगाया जाता है, तो परिणामी सुविधा के सैद्धांतिक और वास्तविक मूल्यों के बीच अंतर की गणना यादृच्छिक घटक का मूल्यांकन करने के लिए की जाती है। यह ध्यान रखना महत्वपूर्ण है कि यह दिए गए समीकरण के अज्ञात शेष का केवल एक चयनात्मक कार्यान्वयन है।

सामान्य समीकरणों की प्रणाली से प्राप्त प्रतिगमन गुणांक कनेक्शन की ताकत के नमूना अनुमान हैं। यह स्पष्ट है कि उनका व्यावहारिक महत्व तभी है जब वे निष्पक्ष हों। याद रखें कि इस मामले में अवशिष्ट का माध्य शून्य के बराबर है, या, क्या समान है, अनुमान का माध्य अनुमानित पैरामीटर के बराबर है। तब अवशिष्ट बड़ी संख्या में नमूना अनुमानों के साथ जमा नहीं होंगे, और पाया गया प्रतिगमन पैरामीटर को बड़ी संख्या में निष्पक्ष अनुमानों का औसत माना जा सकता है।

इसके अलावा, अनुमानों में सबसे छोटा विचरण होना चाहिए, अर्थात। प्रभावी हो, और फिर व्यावहारिक रूप से अनुपयुक्त बिंदु अनुमानों से अंतराल अनुमान तक जाना संभव हो जाता है। अंत में, आत्मविश्वास अंतराल उच्च स्तर की दक्षता के साथ लागू होते हैं जब किसी पैरामीटर के सही (अज्ञात) मान से एक निश्चित दूरी पर अनुमान प्राप्त करने की संभावना एक के करीब होती है। इस तरह के अनुमानों को संगत कहा जाता है और स्थिरता गुण नमूना आकार में वृद्धि के साथ उनकी सटीकता में वृद्धि की विशेषता है।

हालाँकि, संगति की स्थिति स्वचालित रूप से संतुष्ट नहीं होती है और अनिवार्य रूप से निम्नलिखित दो महत्वपूर्ण आवश्यकताओं की पूर्ति पर निर्भर करती है। सबसे पहले, अवशिष्ट स्वयं को सबसे स्पष्ट यादृच्छिकता के साथ स्टोकेस्टिक होना चाहिए, अर्थात। सभी स्पष्ट रूप से कार्यात्मक निर्भरता को कई प्रतिगमन के विश्लेषणात्मक घटक में शामिल किया जाना चाहिए, और इसके अलावा, अलग-अलग नमूनों के लिए अवशिष्ट के मूल्यों को एक दूसरे से स्वतंत्र रूप से वितरित किया जाना चाहिए (अवशिष्ट का कोई स्वत: सहसंबंध नहीं)। दूसरी, कोई कम महत्वपूर्ण आवश्यकता नहीं है कि प्रत्येक विचलन (अवशिष्ट) का विचरण चर X (होमोसेडैस्टिसिटी) के सभी मानों के लिए समान हो। वे। समरूपता सभी टिप्पणियों के लिए भिन्नता की स्थिरता द्वारा व्यक्त की जाती है:

इसके विपरीत, विषमलैंगिकता में विभिन्न टिप्पणियों के लिए भिन्नता की ऐसी स्थिरता का उल्लंघन होता है। इस मामले में, नमूने में विभिन्न अवलोकनों के लिए यादृच्छिक शब्द के विभिन्न सैद्धांतिक वितरण के साथ दृढ़ता से विचलित मूल्य प्राप्त करने की प्राथमिकता (टिप्पणियों से पहले) संभावना अपेक्षाकृत अधिक होगी।

अवशिष्टों का स्वत: सहसंबंध, या वर्तमान और पिछले (बाद के) अवलोकनों के अवशेषों के बीच एक सहसंबंध की उपस्थिति, सामान्य रैखिक सहसंबंध गुणांक के मूल्य से देखी जाती है। यदि यह शून्य से काफी अलग है, तो अवशिष्ट स्वत: सहसंबद्ध होते हैं और इसलिए, संभाव्यता घनत्व फ़ंक्शन (अवशिष्ट का वितरण) अवलोकन बिंदु पर और अन्य अवलोकन बिंदुओं पर अवशिष्ट मूल्यों के वितरण पर निर्भर करता है। एक्स कारक द्वारा अवलोकनों के क्रम की उपस्थिति में उपलब्ध सांख्यिकीय जानकारी से अवशेषों के स्वत: सहसंबंध को निर्धारित करना सुविधाजनक है। अवशेषों के स्वत: सहसंबंध की अनुपस्थिति प्रतिगमन गुणांक के अनुमानों की स्थिरता और दक्षता सुनिश्चित करती है।

35. समरूपता और विषमलैंगिकता, अवशिष्टों का स्वत: सहसंबंध, सामान्यीकृत न्यूनतम वर्ग विधि (जीएमएलएस)।

चर X, या समरूपता के सभी मानों के लिए अवशिष्टों के प्रसरणों की समानता, LSM से प्रतिगमन मापदंडों के सुसंगत अनुमान प्राप्त करने के लिए भी नितांत आवश्यक है। समलैंगिकता की स्थिति की पूर्ति न करने से तथाकथित विषमलैंगिकता होती है। यह प्रतिगमन गुणांक के अनुमानों में पूर्वाग्रह पैदा कर सकता है। विषमलैंगिकता मुख्य रूप से प्रतिगमन गुणांक के अनुमानों की दक्षता में कमी को प्रभावित करेगी। इस मामले में, प्रतिगमन गुणांक की मानक त्रुटि के लिए सूत्र का उपयोग करना विशेष रूप से कठिन हो जाता है, जिसके उपयोग से कारक के किसी भी मूल्य के लिए अवशिष्टों का एकल विचरण माना जाता है। प्रतिगमन गुणांक के अनुमानों की निष्पक्षता के लिए, यह मुख्य रूप से अवशिष्टों की स्वतंत्रता और स्वयं कारकों के मूल्यों पर निर्भर करता है।

एक बल्कि दृश्य, हालांकि समरूपता का परीक्षण करने के लिए कठोर और कौशल-आवश्यक तरीका नहीं है, औसत गणना (सैद्धांतिक) परिणामी विशेषता, या संबंधित सहसंबंध क्षेत्रों पर अवशेषों की निर्भरता की प्रकृति का एक चित्रमय अध्ययन है। विषमलैंगिकता के अध्ययन और मूल्यांकन के लिए विश्लेषणात्मक तरीके अधिक कठोर हैं। विषमलैंगिकता की एक महत्वपूर्ण उपस्थिति के साथ, कम से कम वर्गों के बजाय सामान्यीकृत कम से कम वर्गों (जीएलएस) का उपयोग करने की सलाह दी जाती है।

कम से कम वर्गों के आवेदन से उत्पन्न होने वाले कई प्रतिगमन की आवश्यकताओं के अलावा, मॉडल में शामिल चर के लिए शर्तों का पालन करना भी आवश्यक है। इनमें, सबसे पहले, अवलोकनों की दी गई मात्रा (1 से 7) के लिए मॉडल कारकों की संख्या के संबंध में आवश्यकताएं शामिल हैं। अन्यथा, प्रतिगमन पैरामीटर सांख्यिकीय रूप से महत्वहीन होंगे। कम से कम वर्ग विधि के कार्यान्वयन में संबंधित संख्यात्मक विधियों के आवेदन की प्रभावशीलता के दृष्टिकोण से, यह आवश्यक है कि अवलोकनों की संख्या अनुमानित मानकों की संख्या से अधिक हो (समीकरणों की प्रणाली में, समीकरणों की संख्या मांगे जा रहे चरों की संख्या से अधिक है)।

अर्थमिति की सबसे महत्वपूर्ण उपलब्धि स्वयं अज्ञात मापदंडों का आकलन करने के तरीकों का महत्वपूर्ण विकास और विचाराधीन प्रभावों के स्थिर महत्व की पहचान करने के लिए मानदंडों में सुधार है। इस संबंध में, विषमलैंगिकता के कारण पारंपरिक एलएसएम का उपयोग करने की असंभवता या अक्षमता जो खुद को एक डिग्री या किसी अन्य तक प्रकट करती है, ने सामान्यीकृत एलएसएम (जीएसएम) के विकास को जन्म दिया है। वास्तव में, एक ही समय में, मॉडल को सही किया जाता है, इसके विनिर्देश को बदल दिया जाता है, और प्रारंभिक डेटा को प्रतिगमन गुणांक के अनुमानों की निष्पक्षता, दक्षता और स्थिरता सुनिश्चित करने के लिए बदल दिया जाता है।

यह माना जाता है कि अवशिष्टों का माध्य शून्य के बराबर है, लेकिन उनका विचरण अब स्थिर नहीं है, बल्कि K i के मूल्यों के समानुपाती है, जहाँ ये मान आनुपातिकता गुणांक हैं जो विभिन्न मूल्यों के लिए भिन्न हैं। एक्स फैक्टर का इस प्रकार, ये गुणांक (की मान) हैं जो फैलाव की विविधता की विशेषता रखते हैं। स्वाभाविक रूप से, यह माना जाता है कि फैलाव का मूल्य, जो इन आनुपातिकता गुणांक के लिए एक सामान्य कारक है, अज्ञात है।

मूल मॉडल, इन गुणांकों को कई प्रतिगमन समीकरण में पेश करने के बाद, विषमलैंगिक बना हुआ है (अधिक सटीक रूप से, ये मॉडल के अवशेष हैं)। इन अवशिष्टों (अवशिष्टों) को स्वतः सहसंबद्ध न होने दें। आइए हम i-वें अवलोकन के परिणाम के रूप में तय किए गए प्रारंभिक मॉडल चर को आनुपातिकता गुणांक K i के वर्गमूल से विभाजित करके प्राप्त नए चरों का परिचय दें। फिर हम रूपांतरित चरों में एक नया समीकरण प्राप्त करते हैं, जिसमें शेष पहले से ही समलिंगी होंगे। नए चर स्वयं भारित पुराने (मूल) चर हैं।

इसलिए, होमोसेडैस्टिक अवशेषों के साथ इस तरह से प्राप्त नए समीकरण के मापदंडों का अनुमान एक भारित एलएसएम (अनिवार्य रूप से, यह जीएलएस है) तक कम हो जाएगा। जब प्रतिगमन चर के बजाय स्वयं का उपयोग किया जाता है, तो प्रतिगमन गुणांक के लिए अभिव्यक्ति के औसत से उनके विचलन एक सरल और मानकीकृत (समान) रूप प्राप्त करते हैं, एलएसएम और एलएमएलएस के लिए अंश और हर में सुधार कारक 1/के द्वारा थोड़ा अलग होता है। प्रतिगमन गुणांक देने वाला अंश।

यह ध्यान में रखा जाना चाहिए कि रूपांतरित (संशोधित) मॉडल के पैरामीटर अनिवार्य रूप से इस बात पर निर्भर करते हैं कि आनुपातिकता गुणांक i के आधार के रूप में किस अवधारणा को लिया जाता है। अक्सर यह माना जाता है कि अवशिष्ट कारक के मूल्यों के समानुपाती होते हैं। मॉडल सबसे सरल रूप लेता है जब यह परिकल्पना स्वीकार की जाती है कि त्रुटियाँ क्रम में अंतिम कारक के मूल्यों के समानुपाती हैं। फिर ओएलएस मूल मूल चर के साथ मानक ओएलएस के काम की तुलना में प्रतिगमन मापदंडों को निर्धारित करने में रूपांतरित चर के छोटे मूल्यों के साथ टिप्पणियों के वजन को बढ़ाने की अनुमति देता है। लेकिन ये नए चर पहले से ही एक अलग आर्थिक सामग्री प्राप्त करते हैं।

यह परिकल्पना कि अवशिष्ट कारक के मूल्य के समानुपाती हैं, का वास्तविक औचित्य हो सकता है। डेटा के कुछ अपर्याप्त सजातीय सेट को संसाधित करने दें, उदाहरण के लिए, एक ही समय में बड़े और छोटे उद्यमों सहित। फिर कारक के बड़े वॉल्यूमेट्रिक मान परिणामी विशेषता के बड़े विचरण और अवशिष्ट मूल्यों के बड़े विचरण दोनों के अनुरूप हो सकते हैं। इसके अलावा, जीएलएस का उपयोग और सापेक्ष मूल्यों के अनुरूप संक्रमण न केवल कारक की भिन्नता को कम करता है, बल्कि त्रुटि भिन्नता को भी कम करता है। इस प्रकार, प्रतिगमन मॉडल में खाते में लेने और विषमलैंगिकता को ठीक करने का सबसे सरल मामला जीएलएस के उपयोग के माध्यम से महसूस किया जाता है।

भारित ओएलएस के रूप में ओएलएस के कार्यान्वयन के लिए उपरोक्त दृष्टिकोण काफी व्यावहारिक है - इसे बस लागू किया गया है और इसकी पारदर्शी आर्थिक व्याख्या है। बेशक, यह सबसे सामान्य दृष्टिकोण नहीं है, और गणितीय आँकड़ों के संदर्भ में, जो अर्थमिति के सैद्धांतिक आधार के रूप में कार्य करता है, हमें एक अधिक कठोर विधि की पेशकश की जाती है जो जीएलएस को सबसे सामान्य रूप में लागू करती है। इसे त्रुटि वेक्टर (अवशिष्ट के स्तंभ) के सहप्रसरण मैट्रिक्स को जानने की आवश्यकता है। और यह आमतौर पर व्यावहारिक स्थितियों में अनुचित है, और इस मैट्रिक्स को इस तरह खोजना असंभव है। इसलिए, आम तौर पर बोलते हुए, किसी को मैट्रिक्स के बजाय संबंधित सूत्रों में इस तरह के अनुमान का उपयोग करने के लिए आवश्यक मैट्रिक्स का अनुमान लगाना पड़ता है। इस प्रकार, जीएलएस का वर्णित कार्यान्वयन इन अनुमानों में से एक का प्रतिनिधित्व करता है। इसे कभी-कभी सुलभ सामान्यीकृत कम से कम वर्ग कहा जाता है।

यह भी ध्यान में रखा जाना चाहिए कि निर्धारण का गुणांक जीएलएस का उपयोग करते समय फिट की गुणवत्ता के संतोषजनक उपाय के रूप में काम नहीं कर सकता है। जीएलएस के उपयोग पर लौटते हुए, हम यह भी ध्यान देते हैं कि सफेद रूप में मानक विचलन (मानक त्रुटियां) का उपयोग करने की विधि (विषमलैंगिकता की उपस्थिति में तथाकथित सुसंगत मानक त्रुटियां) में पर्याप्त व्यापकता है। यह विधि इस शर्त के तहत लागू होती है कि त्रुटि वेक्टर सहप्रसरण मैट्रिक्स विकर्ण है। यदि अवशिष्टों (त्रुटियों) का स्वत: सहसंबंध है, जब सहप्रसरण मैट्रिक्स में और मुख्य विकर्ण के बाहर गैर-शून्य तत्व (गुणांक) होते हैं, तो नेवी-वेस्ट रूप में एक अधिक सामान्य मानक त्रुटि विधि का उपयोग किया जाना चाहिए। इस मामले में, एक महत्वपूर्ण सीमा है: गैर-शून्य तत्व, मुख्य विकर्ण के अलावा, केवल पड़ोसी विकर्णों पर होते हैं जो मुख्य विकर्ण से एक निश्चित राशि से अधिक नहीं होते हैं।

जो कहा गया है, उससे यह स्पष्ट है कि विषमलैंगिकता के लिए डेटा की जाँच करने में सक्षम होना आवश्यक है। निम्नलिखित परीक्षण इस उद्देश्य की पूर्ति करते हैं। वे वैकल्पिक परिकल्पना (इन परिकल्पनाओं की असमानता के बारे में) के खिलाफ अवशिष्ट के भिन्नताओं की समानता के बारे में मुख्य परिकल्पना का परीक्षण करते हैं। इसके अलावा, विषमलैंगिकता की प्रकृति पर एक प्राथमिक संरचनात्मक बाधाएं हैं। गोल्डफेल्ड-कुंड्ट परीक्षण में, एक नियम के रूप में, कुछ स्वतंत्र चर के मूल्य पर त्रुटि भिन्नता (अवशिष्ट) की प्रत्यक्ष निर्भरता की धारणा का उपयोग किया जाता है। इस परीक्षण के आवेदन की योजना इस प्रकार है। सबसे पहले, डेटा को स्वतंत्र चर के अवरोही क्रम में क्रमबद्ध किया जाता है जिसके लिए विषमलैंगिकता का संदेह होता है। कुछ औसत अवलोकनों को इस आदेशित डेटासेट से बाहर रखा गया है, जहां "कुछ" शब्द का अर्थ सभी अवलोकनों की कुल संख्या का लगभग एक चौथाई (25%) है। इसके बाद, शेष में से पहले (उन्मूलन के बाद) माध्य प्रेक्षणों के लिए दो स्वतंत्र प्रतीपगमन किए जाते हैं और इनमें से अंतिम दो शेष माध्य प्रेक्षणों के लिए किए जाते हैं। उसके बाद, दो संबंधित अवशेषों का निर्माण किया जाता है। अंत में, फिशर का एफ-सांख्यिकी संकलित किया जाता है, और यदि अध्ययन के तहत परिकल्पना सत्य है, तो एफ वास्तव में स्वतंत्रता की इसी डिग्री के साथ एक फिशर वितरण है। फिर इस आंकड़े के एक बड़े मूल्य का मतलब है कि परीक्षण की जा रही परिकल्पना को खारिज कर दिया जाना चाहिए। अवलोकनों को समाप्त करने के चरण के बिना, इस परीक्षण की शक्ति कम हो जाती है।

Breusch-Pagan परीक्षण का उपयोग तब किया जाता है जब यह एक प्राथमिकता मानी जाती है कि प्रसरण कुछ अतिरिक्त चर पर निर्भर करता है। सबसे पहले, सामान्य (मानक) प्रतिगमन किया जाता है और अवशिष्टों का एक वेक्टर प्राप्त किया जाता है। फिर विचरण का अनुमान तैयार किया जाता है। अगला, अनुभवजन्य विचरण (विचरण का अनुमान) द्वारा विभाजित अवशिष्ट वेक्टर के वर्ग का प्रतिगमन किया जाता है। उसके लिए (प्रतिगमन) भिन्नता का स्पष्ट भाग ज्ञात कीजिए। और इसके लिए भिन्नता का समझाया गया हिस्सा, आधे में विभाजित, आँकड़े बनाए जाते हैं। यदि शून्य परिकल्पना सत्य है (विषमलैंगिकता की अनुपस्थिति सत्य है), तो इस मात्रा का वितरण होता है ही-वर्ग। यदि, इसके विपरीत, परीक्षण ने विषमलैंगिकता का खुलासा किया, तो मूल मॉडल को अवशिष्ट के वेक्टर के घटकों को देखे गए स्वतंत्र चर के वेक्टर के संबंधित घटकों द्वारा विभाजित करके बदल दिया जाता है।

36. व्हाइट के रूप में मानक विचलन की विधि।

हम निम्नलिखित निष्कर्ष निकाल सकते हैं। भारित वर्ग विचलन के योग को कम करने के लिए विषमलैंगिकता की उपस्थिति में GLS का उपयोग कम किया जाता है। उपलब्ध जीएलएस का उपयोग बड़ी संख्या में टिप्पणियों की आवश्यकता से जुड़ा है जो अनुमानित मापदंडों की संख्या से अधिक है। जीएलएस के उपयोग के लिए सबसे अनुकूल वह स्थिति है जब त्रुटि (अवशिष्ट) एक स्वतंत्र चर के समानुपाती होती है और परिणामी अनुमान सुसंगत होते हैं। यदि, फिर भी, विषमलैंगिकता वाले मॉडल में, GLS नहीं, बल्कि मानक LSM का उपयोग करना आवश्यक है, तो सुसंगत अनुमान प्राप्त करने के लिए, कोई व्यक्ति व्हाइट या नेवी-वेस्ट रूप में त्रुटि अनुमानों का उपयोग कर सकता है।

समय श्रृंखला का विश्लेषण करते समय, समय में विभिन्न बिंदुओं पर टिप्पणियों की सांख्यिकीय निर्भरता को ध्यान में रखना अक्सर आवश्यक होता है। इस मामले में, असंबद्ध त्रुटियों की धारणा संतुष्ट नहीं है। एक साधारण मॉडल पर विचार करें जिसमें त्रुटियां प्रथम-क्रम ऑटोरेग्रेसिव प्रक्रिया बनाती हैं। इस मामले में, त्रुटियां एक साधारण पुनरावृत्ति संबंध को संतुष्ट करती हैं, जिसमें से एक शब्द शून्य माध्य और निरंतर विचरण के साथ स्वतंत्र रूप से वितरित यादृच्छिक चर का एक क्रम है। दूसरा शब्द पिछले समय के पैरामीटर (ऑटोरेग्रेशन गुणांक) और अवशेषों के मूल्यों का उत्पाद है। त्रुटि मानों (अवशिष्ट) का क्रम स्वयं एक स्थिर यादृच्छिक प्रक्रिया बनाता है। एक स्थिर यादृच्छिक प्रक्रिया को समय के साथ इसकी विशेषताओं की स्थिरता, विशेष रूप से, माध्य और विचरण की विशेषता है। इस मामले में, हमारे (इसके सदस्यों) के लिए ब्याज की सहप्रसरण मैट्रिक्स को पैरामीटर की शक्तियों का उपयोग करके आसानी से लिखा जा सकता है।

एक ज्ञात पैरामीटर के लिए ऑटोरेग्रेसिव मॉडल का अनुमान GLS का उपयोग करके किया जाता है। इस मामले में, मूल मॉडल को एक ऐसे मॉडल में एक साधारण परिवर्तन द्वारा कम करने के लिए पर्याप्त है जिसकी त्रुटियां मानक प्रतिगमन मॉडल की शर्तों को पूरा करती हैं। बहुत कम ही, लेकिन फिर भी ऐसी स्थिति होती है जिसमें ऑटोरेग्रेशन पैरामीटर ज्ञात होता है। इसलिए, आम तौर पर एक अज्ञात ऑटोरेग्रेसिव पैरामीटर के साथ आकलन करना आवश्यक होता है। तीन सबसे अधिक इस्तेमाल की जाने वाली मूल्यांकन प्रक्रियाएं हैं। कोक्रेन-ऑर्कट विधि, हिल्ड्रेथ-लू प्रक्रिया और डर्बिन विधि।

सामान्य तौर पर, निम्नलिखित निष्कर्ष सत्य हैं। समय श्रृंखला विश्लेषण के लिए सामान्य न्यूनतम वर्गों के सुधार की आवश्यकता होती है, क्योंकि इस मामले में त्रुटियां, एक नियम के रूप में, सहसंबद्ध हैं। अक्सर ये त्रुटियां पहले क्रम की स्थिर ऑटोरेग्रेसिव प्रक्रिया बनाती हैं। प्रथम-क्रम ऑटोरिग्रेशन के लिए ओएलएस अनुमान निष्पक्ष, सुसंगत, लेकिन अक्षम हैं। एक ज्ञात ऑटोरेग्रेशन गुणांक के साथ, ओएलएस मूल प्रणाली के सरल परिवर्तनों (सुधार) और फिर मानक कम से कम वर्गों के आवेदन के लिए कम हो जाता है। यदि, जैसा कि अक्सर होता है, ऑटोरेग्रेसिव गुणांक अज्ञात है, तो उपलब्ध जीएलएस की कई प्रक्रियाएं हैं, जो अज्ञात पैरामीटर (गुणांक) का अनुमान लगाने में शामिल हैं, जिसके बाद पिछले मामले की तरह ही परिवर्तन लागू होते हैं। ज्ञात पैरामीटर।

37. ब्रुश-पागन परीक्षण की अवधारणा, गोल्डफेल्ड-क्वांड्ट परीक्षण

रूसी संघ के कृषि मंत्रालय

संघीय राज्य बजट शैक्षिक

उच्च व्यावसायिक शिक्षा संस्थान

"पर्म राज्य कृषि अकादमी

शिक्षाविद डी.एन. प्रियनिश्निकोव के नाम पर रखा गया"

वित्त विभाग, ऋण और आर्थिक विश्लेषण

अनुशासन "अर्थमिति" विकल्प पर नियंत्रण कार्य - 10


    सन्निकटन त्रुटियाँ और इसकी परिभाषा………………………………….3

    समय श्रृंखला के संरेखण की विश्लेषणात्मक विधि और इसमें प्रयुक्त कार्य ………………………………………………………..4

    व्यावहारिक भाग……………………………………………………….11

    1. कार्य 1……………………………………………………………… 11

      टास्क 2………………………………………………………………………………19

प्रयुक्त साहित्य की सूची…………………………………….25

  1. सन्निकटन त्रुटियां और इसकी परिभाषा।

औसत सन्निकटन त्रुटिवास्तविक डेटा से परिकलित डेटा का औसत विचलन है। इसे प्रतिशत मॉड्यूलो के रूप में परिभाषित किया गया है।

परिणामी विशेषता के वास्तविक मूल्य सैद्धांतिक लोगों से भिन्न होते हैं। यह अंतर जितना छोटा होगा, सैद्धांतिक मूल्य अनुभवजन्य डेटा के उतने ही करीब होंगे, यह मॉडल की सबसे अच्छी गुणवत्ता है। प्रत्येक अवलोकन के लिए प्रभावी विशेषता के वास्तविक और परिकलित मूल्यों के विचलन का परिमाण एक सन्निकटन त्रुटि है। उनकी संख्या जनसंख्या की मात्रा से मेल खाती है। कुछ मामलों में, सन्निकटन त्रुटि शून्य हो सकती है। तुलना के लिए, विचलन का उपयोग किया जाता है, वास्तविक मूल्यों के प्रतिशत के रूप में व्यक्त किया जाता है।

चूंकि यह सकारात्मक और नकारात्मक दोनों हो सकता है, यह प्रत्येक अवलोकन के लिए अनुमानित त्रुटियों को प्रतिशत मॉड्यूलो के रूप में निर्धारित करने के लिए प्रथागत है। विचलन को एक पूर्ण सन्निकटन त्रुटि के रूप में और एक सापेक्ष सन्निकटन त्रुटि के रूप में माना जा सकता है। प्रत्येक अवलोकन के लिए सापेक्ष विचलन से मॉडल की गुणवत्ता के बारे में एक सामान्य निर्णय लेने के लिए, औसत सन्निकटन त्रुटि को सरल अंकगणितीय माध्य के रूप में निर्धारित किया जाता है।

औसत सन्निकटन त्रुटि की गणना सूत्र द्वारा की जाती है:

औसत सन्निकटन त्रुटि की एक अन्य परिभाषा भी संभव है:

अगर ए £ 10-12%, तो हम मॉडल की अच्छी गुणवत्ता के बारे में बात कर सकते हैं।

  1. इस प्रक्रिया में प्रयुक्त समय श्रृंखला संरेखण और कार्यों की विश्लेषणात्मक विधि।

गतिकी की श्रृंखला में मुख्य विकास प्रवृत्ति की पहचान करने के लिए एक अधिक सटीक तकनीक विश्लेषणात्मक संरेखण है। विश्लेषणात्मक संरेखण की विधि द्वारा सामान्य प्रवृत्ति का अध्ययन करते समय, यह माना जाता है कि गतिकी की एक श्रृंखला के स्तरों में परिवर्तन कुछ गणितीय कार्यों द्वारा सन्निकटन सटीकता की बदलती डिग्री के साथ व्यक्त किया जा सकता है। समीकरण का प्रकार किसी विशेष घटना के विकास की गतिशीलता की प्रकृति से निर्धारित होता है। व्यवहार में, मौजूदा समय श्रृंखला के अनुसार, प्रपत्र सेट किया जाता है और फ़ंक्शन y=f(t) के पैरामीटर पाए जाते हैं, और फिर प्रवृत्ति से विचलन के व्यवहार का विश्लेषण किया जाता है। निम्नलिखित संबंध अक्सर संरेखण में उपयोग किए जाते हैं: रैखिक, परवलयिक और घातीय। कई मामलों में, बहुपद या एक घातांक फ़ंक्शन का उपयोग करके मॉडलिंग समय श्रृंखला संतोषजनक परिणाम नहीं देती है, क्योंकि समय श्रृंखला में एक सामान्य प्रवृत्ति के आसपास ध्यान देने योग्य आवधिक उतार-चढ़ाव होते हैं। ऐसे मामलों में, हार्मोनिक विश्लेषण (फूरियर श्रृंखला हार्मोनिक्स) का उपयोग किया जाना चाहिए। इस पद्धति का सटीक उपयोग बेहतर है, क्योंकि यह उस कानून को निर्धारित करता है जिसके द्वारा श्रृंखला के स्तरों के मूल्यों की सटीक भविष्यवाणी करना संभव है।

गतिशील श्रृंखला के विश्लेषणात्मक संरेखण का उद्देश्य विश्लेषणात्मक या ग्राफिकल निर्भरता y=f(t) निर्धारित करना है। फलन y=f(t) को इस प्रकार चुना गया है कि यह अध्ययन की जा रही प्रक्रिया की अर्थपूर्ण व्याख्या करता है। ये अलग-अलग कार्य हो सकते हैं।

LSM द्वारा बहुपदों के प्राचलों के आकलन के लिए y=f(t) रूप के समीकरणों के निकाय

(क्लिक करने योग्य)

n-क्रम बहुपदों का आलेखीय निरूपण

1. यदि किसी श्रृंखला के स्तरों में परिवर्तन स्तरों में एकसमान वृद्धि (कमी) की विशेषता है, जब निरपेक्ष श्रृंखला वृद्धि परिमाण में करीब होती है, तो विकास की प्रवृत्ति एक सीधी रेखा समीकरण द्वारा विशेषता होती है।

2. यदि, गतिकी की प्रवृत्ति के प्रकार के विश्लेषण के परिणामस्वरूप, लगभग स्थिर त्वरण के साथ एक वक्रतापूर्ण निर्भरता स्थापित की जाती है, तो प्रवृत्ति का आकार दूसरे क्रम के परवलय समीकरण द्वारा व्यक्त किया जाता है।

3. यदि गतिकी की एक श्रृंखला के स्तरों की वृद्धि घातीय रूप से होती है, अर्थात। श्रृंखला वृद्धि कारक कमोबेश स्थिर होते हैं, गतिकी श्रृंखला का संरेखण घातीय कार्य के अनुसार किया जाता है।

समीकरण के प्रकार को चुनने के बाद, समीकरण के मापदंडों को परिभाषित करना आवश्यक है। एक समीकरण के मापदंडों को निर्धारित करने का सबसे आम तरीका कम से कम वर्गों की विधि है, जिसमें सैद्धांतिक (चुने हुए समीकरण के अनुसार समायोजित) और अनुभवजन्य स्तरों के बीच वर्ग विचलन के योग का न्यूनतम बिंदु समाधान के रूप में लिया जाता है।

एक सीधी रेखा में संरेखण (एक प्रवृत्ति रेखा की परिभाषा) का व्यंजक है: yt=a0+a1t

समय का टी-प्रतीक;

जबकि 0 और a1 वांछित रेखा के पैरामीटर हैं।

सरल रेखा के पैरामीटर समीकरणों की प्रणाली के समाधान से पाए जाते हैं:

समीकरणों की प्रणाली को सरल बनाया जाता है यदि t के मानों को चुना जाता है ताकि उनका योग Σt = 0 के बराबर हो, अर्थात, समय की उत्पत्ति विचाराधीन अवधि के मध्य में चली जाती है। यदि संदर्भ बिंदु के स्थानांतरण से पहले t = 1, 2, 3, 4…, तो स्थानांतरण के बाद:

यदि श्रृंखला में स्तरों की संख्या विषम है t = -4 -3 -2 -1 0 +1 +2 +3 +4

यदि श्रृंखला में स्तरों की संख्या सम t = -7 -5 -3 -1 +1 +3 +5 +7 . है

इस प्रकार, विषम घात के लिए t हमेशा शून्य के बराबर होगा।

इसी तरह, दूसरे क्रम के परवलय के पैरामीटर समीकरणों की प्रणाली के समाधान से पाए जाते हैं:

औसत पूर्ण वृद्धि या औसत वृद्धि दर से संरेखण:

Δ-औसत पूर्ण वृद्धि;

के-औसत वृद्धि कारक;

Y0-श्रृंखला का प्रारंभिक स्तर;

Yn श्रृंखला का अंतिम स्तर है;

टी शून्य से शुरू होने वाले स्तर की क्रमिक संख्या है।

प्रतिगमन समीकरण के निर्माण के बाद, इसकी विश्वसनीयता का आकलन किया जाता है। महत्वपूर्ण मूल्यांकन विधियों को लागू करके चयनित प्रतिगमन समीकरण, समीकरण मापदंडों और सहसंबंध गुणांक के महत्व का मूल्यांकन किया जाना चाहिए:

फिशर का एफ-टेस्ट, स्टूडेंट का टी-टेस्ट, इस मामले में, मानदंड के परिकलित मूल्यों की तुलना महत्व के दिए गए स्तर और स्वतंत्रता की डिग्री की संख्या पर सारणीबद्ध (महत्वपूर्ण) लोगों के साथ की जाती है। तथ्य > Ftheor - समाश्रयण समीकरण पर्याप्त है।

n प्रेक्षणों की संख्या (श्रृंखला के स्तर) है, m प्रतिगमन समीकरण (मॉडल) के मापदंडों की संख्या है।

प्रतिगमन समीकरण (एक पूरे के रूप में मॉडल की गुणवत्ता) की पर्याप्तता की जाँच औसत सन्निकटन त्रुटि का उपयोग करके की जाती है, जिसका मान 10-12% (अनुशंसित) से अधिक नहीं होना चाहिए।

क्षेत्र के क्षेत्रों के लिए, डेटा 200X के लिए दिया गया है।

क्षेत्र संख्या औसत प्रति व्यक्ति निर्वाह न्यूनतम प्रति दिन एक सक्षम व्यक्ति के लिए, रगड़।, x औसत दैनिक वेतन, रगड़।, पर
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

व्यायाम:

1. एक सहसंबंध क्षेत्र बनाएं और कनेक्शन के रूप के बारे में एक परिकल्पना तैयार करें।

2. रैखिक प्रतिगमन समीकरण के मापदंडों की गणना करें

4. लोच के औसत (सामान्य) गुणांक का उपयोग करते हुए, कारक और परिणाम के बीच संबंध की ताकत का तुलनात्मक मूल्यांकन दें।

7. परिणाम के अनुमानित मूल्य की गणना करें यदि कारक का अनुमानित मूल्य उसके औसत स्तर से 10% बढ़ जाता है। महत्व स्तर के लिए भविष्यवाणी का विश्वास अंतराल निर्धारित करें।

फेसला:

आइए एक्सेल का उपयोग करके इस समस्या को हल करें।

1. उपलब्ध डेटा x और y की तुलना करना, उदाहरण के लिए, उन्हें x कारक के आरोही क्रम में क्रमबद्ध करना, कोई भी संकेतों के बीच प्रत्यक्ष संबंध की उपस्थिति का निरीक्षण कर सकता है जब प्रति व्यक्ति निर्वाह न्यूनतम में वृद्धि से औसत दैनिक मजदूरी बढ़ जाती है। इसके आधार पर, यह माना जा सकता है कि सुविधाओं के बीच संबंध प्रत्यक्ष है और इसे एक सीधी रेखा के समीकरण द्वारा वर्णित किया जा सकता है। चित्रमय विश्लेषण के आधार पर उसी निष्कर्ष की पुष्टि की जाती है।

सहसंबंध क्षेत्र बनाने के लिए, आप एक्सेल पीपीपी का उपयोग कर सकते हैं। अनुक्रम में प्रारंभिक डेटा दर्ज करें: पहले x, फिर y।

डेटा युक्त कोशिकाओं के क्षेत्र का चयन करें।

उसके बाद चुनो: मार्करों के साथ डालें / स्कैटर / स्कैटरजैसा कि चित्र एक में दिखाया गया है।

चित्र 1 सहसंबंध क्षेत्र निर्माण

सहसंबंध क्षेत्र का विश्लेषण रेक्टिलिनियर के करीब एक निर्भरता की उपस्थिति को दर्शाता है, क्योंकि बिंदु लगभग एक सीधी रेखा में स्थित होते हैं।

2. रेखीय प्रतीपगमन समीकरण के प्राचलों की गणना करने के लिए
अंतर्निहित सांख्यिकीय फ़ंक्शन का उपयोग करें लाइनस्ट.

इसके लिए:

1) विश्लेषण किए जाने वाले डेटा वाली मौजूदा फ़ाइल खोलें;
2) प्रतिगमन आँकड़ों के परिणामों को प्रदर्शित करने के लिए खाली सेल 5×2 (5 पंक्तियाँ, 2 कॉलम) के क्षेत्र का चयन करें।
3) सक्रिय करें फंक्शन विजार्ड: मुख्य मेनू में, चुनें सूत्र / सम्मिलित कार्य.
4) खिड़की में श्रेणीतुम ले रहे हो सांख्यिकीय, फंक्शन विंडो में - लाइनस्ट. बटन पर क्लिक करें ठीक हैजैसा कि चित्र 2 में दिखाया गया है;

चित्र 2 फंक्शन विजार्ड डायलॉग बॉक्स

5) फ़ंक्शन तर्क भरें:

ज्ञात मूल्य

ज्ञात x मान

नियत- एक तार्किक मान जो समीकरण में एक मुक्त पद की उपस्थिति या अनुपस्थिति को इंगित करता है; यदि स्थिरांक = 1 है, तो मुक्त पद की गणना सामान्य तरीके से की जाती है, यदि स्थिरांक = 0 है, तो मुक्त पद 0 है;

आंकड़े- एक बूलियन मान जो इंगित करता है कि प्रतिगमन विश्लेषण पर अतिरिक्त जानकारी प्रदर्शित करना है या नहीं। यदि सांख्यिकी = 1 है, तो अतिरिक्त जानकारी प्रदर्शित होती है, यदि सांख्यिकी = 0 है, तो केवल समीकरण मापदंडों के अनुमान प्रदर्शित होते हैं।

बटन पर क्लिक करें ठीक है;

चित्र 3 LINEST तर्क संवाद बॉक्स

6) अंतिम तालिका का पहला तत्व चयनित क्षेत्र के ऊपरी बाएँ कक्ष में दिखाई देगा। संपूर्ण तालिका का विस्तार करने के लिए, बटन दबाएं और फिर कीबोर्ड शॉर्टकट पर ++ .

अतिरिक्त प्रतिगमन आँकड़े निम्न स्कीमा में दिखाए गए क्रम में आउटपुट होंगे:

गुणांक b . का मान गुणांक का मान a
बी मानक त्रुटि मानक त्रुटि a
मानक त्रुटि y
एफ आंकड़ा
वर्गों का प्रतिगमन योग

चित्र 4 LINEST फ़ंक्शन की गणना का परिणाम

हमें प्रतिगमन समीकरण मिला:

हम निष्कर्ष निकालते हैं: प्रति व्यक्ति निर्वाह में न्यूनतम 1 रगड़ की वृद्धि के साथ। औसत दैनिक वेतन में औसतन 0.92 रूबल की वृद्धि होती है।

इसका मतलब यह है कि मजदूरी (y) में भिन्नता का 52% कारक x की भिन्नता द्वारा समझाया गया है - औसत प्रति व्यक्ति निर्वाह न्यूनतम, और 48% - अन्य कारकों की कार्रवाई से जो मॉडल में शामिल नहीं हैं।

निर्धारण के परिकलित गुणांक के अनुसार, सहसंबंध गुणांक की गणना करना संभव है: .

रिश्ते को करीब का दर्जा दिया गया है।

4. लोच के औसत (सामान्य) गुणांक का उपयोग करके, हम परिणाम पर कारक के प्रभाव की ताकत निर्धारित करते हैं।

सीधी रेखा समीकरण के लिए, औसत (सामान्य) लोच गुणांक सूत्र द्वारा निर्धारित किया जाता है:

हम x मान वाले कक्षों के क्षेत्र का चयन करके औसत मान ज्ञात करते हैं, और चयन करते हैं सूत्र / ऑटोसम / औसत, और y के मानों के साथ भी ऐसा ही करें।

चित्र 5 किसी फ़ंक्शन और तर्क के माध्य मानों की गणना

इस प्रकार, यदि औसत प्रति व्यक्ति निर्वाह न्यूनतम अपने औसत मूल्य से 1% बदलता है, तो औसत दैनिक वेतन औसतन 0.51% बदल जाएगा।

डेटा विश्लेषण उपकरण का उपयोग करना वापसीआप ये पा सकते हैं:
- प्रतिगमन आँकड़ों के परिणाम,
- फैलाव विश्लेषण के परिणाम,
- विश्वास अंतराल के परिणाम,
- अवशिष्ट और प्रतिगमन रेखा चार्ट फिट होते हैं,
- अवशिष्ट और सामान्य संभावना।

प्रक्रिया निम्नलिखित है:

1) तक पहुंच की जांच करें विश्लेषण पैकेज. मुख्य मेनू में, क्रम में चयन करें: फ़ाइल/सेटिंग्स/ऐड-ऑन.

2) ड्रॉप नियंत्रणवस्तु चुनें एक्सेल ऐड-इन्सऔर बटन दबाएं जाना।

3) खिड़की में ऐड-ऑनबॉक्स को चेक करें विश्लेषण पैकेज, और फिर बटन पर क्लिक करें ठीक है.

यदि एक विश्लेषण पैकेजक्षेत्र सूची से गायब उपलब्ध ऐड-ऑन, बटन दबाएँ समीक्षाखोजना।

यदि आपको यह संदेश मिलता है कि आपके कंप्यूटर पर विश्लेषण पैक स्थापित नहीं है, तो क्लिक करें हांइसे स्थापित करने के लिए।

4) मुख्य मेनू में, क्रम में चयन करें: डेटा / डेटा विश्लेषण / विश्लेषण उपकरण / प्रतिगमन, और फिर बटन पर क्लिक करें ठीक है.

5) डेटा प्रविष्टि और आउटपुट विकल्प संवाद बॉक्स भरें:

इनपुट अंतराल Y- प्रभावी विशेषता के डेटा वाली श्रेणी;

इनपुट अंतराल X- कारक विशेषता के डेटा वाली श्रेणी;

टैग- एक ध्वज जो इंगित करता है कि पहली पंक्ति में स्तंभों के नाम हैं या नहीं;

स्थिर - शून्य- समीकरण में एक मुक्त पद की उपस्थिति या अनुपस्थिति का संकेत देने वाला ध्वज;

आउटपुट अंतराल- यह भविष्य की सीमा के ऊपरी बाएँ सेल को इंगित करने के लिए पर्याप्त है;

6) नई वर्कशीट - आप नई शीट के लिए मनमाना नाम सेट कर सकते हैं।

फिर बटन दबाएं ठीक है.

चित्र 6 रिग्रेशन टूल के पैरामीटर दर्ज करने के लिए डायलॉग बॉक्स

समस्या डेटा के लिए प्रतिगमन विश्लेषण के परिणाम चित्र 7 में दिखाए गए हैं।

चित्र 7 प्रतिगमन उपकरण लागू करने का परिणाम

5. आइए औसत सन्निकटन त्रुटि का उपयोग करके समीकरणों की गुणवत्ता का अनुमान लगाएं। आइए चित्र 8 में प्रस्तुत प्रतीपगमन विश्लेषण के परिणामों का उपयोग करें।

चित्र 8 प्रतिगमन उपकरण "अवशिष्ट अनुमान" को लागू करने का परिणाम

आइए एक नई तालिका संकलित करें जैसा कि चित्र 9 में दिखाया गया है। कॉलम C में, हम सूत्र का उपयोग करके सापेक्ष सन्निकटन त्रुटि की गणना करते हैं:

चित्र 9 औसत सन्निकटन त्रुटि की गणना

औसत सन्निकटन त्रुटि की गणना सूत्र द्वारा की जाती है:

निर्मित मॉडल की गुणवत्ता का मूल्यांकन अच्छे के रूप में किया जाता है, क्योंकि यह 8 - 10% से अधिक नहीं होता है।

6. समाश्रयण आँकड़ों वाली तालिका से (चित्र 4), हम फिशर के F-परीक्षण का वास्तविक मान लिखते हैं:

जहां तक ​​कि 5% महत्व स्तर पर, तो हम यह निष्कर्ष निकाल सकते हैं कि प्रतिगमन समीकरण महत्वपूर्ण है (संबंध सिद्ध होता है)।

8. हम छात्र के टी-सांख्यिकी का उपयोग करके और प्रत्येक संकेतक के लिए आत्मविश्वास अंतराल की गणना करके प्रतिगमन मापदंडों के सांख्यिकीय महत्व का मूल्यांकन करेंगे।

हम शून्य से संकेतकों के सांख्यिकीय रूप से महत्वहीन अंतर के बारे में परिकल्पना एच 0 को सामने रखते हैं:

.

स्वतंत्रता की डिग्री की संख्या के लिए

चित्र 7 में t-सांख्यिकी के वास्तविक मान हैं:

सहसंबंध गुणांक के लिए टी-परीक्षण की गणना दो तरीकों से की जा सकती है:

मेरा तरीका:

कहाँ पे - सहसंबंध गुणांक की यादृच्छिक त्रुटि।

हम चित्र 7 में तालिका से गणना के लिए डेटा लेते हैं।

दूसरा रास्ता:

वास्तविक टी-सांख्यिकीय मान तालिका मानों से बेहतर हैं:

इसलिए, परिकल्पना एच 0 को खारिज कर दिया जाता है, यानी प्रतिगमन पैरामीटर और सहसंबंध गुणांक शून्य से यादृच्छिक रूप से भिन्न नहीं होते हैं, लेकिन सांख्यिकीय रूप से महत्वपूर्ण होते हैं।

पैरामीटर a के लिए विश्वास अंतराल को इस प्रकार परिभाषित किया गया है

पैरामीटर ए के लिए, 95% सीमाएं, जैसा कि चित्र 7 में दिखाया गया है:

प्रतिगमन गुणांक के लिए विश्वास अंतराल को परिभाषित किया गया है

प्रतीपगमन गुणांक b के लिए, चित्र 7 में दर्शाए अनुसार 95% सीमाएँ थीं:

विश्वास अंतराल की ऊपरी और निचली सीमाओं के विश्लेषण से यह निष्कर्ष निकलता है कि संभावना के साथ पैरामीटर ए और बी, निर्दिष्ट सीमाओं के भीतर होने के कारण, शून्य मान नहीं लेते हैं, अर्थात। सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं और शून्य से काफी भिन्न हैं।

7. प्रतिगमन समीकरण के प्राप्त अनुमान हमें पूर्वानुमान के लिए इसका उपयोग करने की अनुमति देते हैं। यदि निर्वाह का पूर्वानुमान मूल्य न्यूनतम है:

तब निर्वाह का अनुमानित मूल्य न्यूनतम होगा:

हम सूत्र का उपयोग करके पूर्वानुमान त्रुटि की गणना करते हैं:

कहाँ पे

हम एक्सेल पीपीपी का उपयोग करके विचरण की गणना भी करते हैं। इसके लिए:

1) सक्रिय करें फंक्शन विजार्ड: मुख्य मेनू में, चुनें सूत्र / सम्मिलित कार्य.

3) कारक विशेषता के संख्यात्मक डेटा वाले श्रेणी को भरें। क्लिक ठीक है.

चित्र 10 प्रसरण गणना

विचरण मान प्राप्त करें

प्रति एक डिग्री स्वतंत्रता के अवशिष्ट विचरण की गणना करने के लिए, हम विचरण के विश्लेषण के परिणामों का उपयोग करते हैं जैसा कि चित्र 7 में दिखाया गया है।

0.95 की संभावना के साथ y के व्यक्तिगत मूल्यों की भविष्यवाणी के लिए विश्वास अंतराल अभिव्यक्ति द्वारा निर्धारित किया जाता है:

अंतराल काफी व्यापक है, मुख्यतः टिप्पणियों की छोटी मात्रा के कारण। सामान्य तौर पर, औसत मासिक वेतन का पूरा पूर्वानुमान विश्वसनीय निकला।

समस्या की स्थिति से लिया गया है: अर्थमिति पर कार्यशाला: प्रोक। भत्ता / आई.आई. एलिसेवा, एस.वी. कुरीशेवा, एन.एम. गोर्डीन्को और अन्य; ईडी। आई.आई. एलिसेवा। - एम .: वित्त और सांख्यिकी, 2003. - 192 पी .: बीमार।

निर्मित अर्थमितीय एक की गुणवत्ता के सामान्य मूल्यांकन के लिए, निर्धारण के गुणांक, सहसंबंध सूचकांक, औसत सापेक्ष सन्निकटन त्रुटि जैसी विशेषताओं को निर्धारित किया जाता है, और प्रतिगमन समीकरण के महत्व का उपयोग करके जाँच की जाती है एफ- फिशर की कसौटी। सूचीबद्ध विशेषताएं काफी सार्वभौमिक हैं और दोनों रैखिक और गैर-रैखिक मॉडल के साथ-साथ दो या दो से अधिक कारक चर वाले मॉडल पर लागू की जा सकती हैं। सभी सूचीबद्ध गुणवत्ता विशेषताओं की गणना में कई अवशेष निर्णायक भूमिका निभाते हैं मैं, जिसकी गणना अध्ययन के तहत विशेषता के वास्तविक (अवलोकन से प्राप्त) मूल्यों से घटाकर की जाती है यीमॉडल समीकरण के अनुसार परिकलित मान y pi.

निर्धारण गुणांक

दिखाता है कि मॉडल में अध्ययन किए गए गुण में परिवर्तन के किस अनुपात को ध्यान में रखा गया है। दूसरे शब्दों में, निर्धारण के गुणांक से पता चलता है कि अध्ययन के तहत चर में परिवर्तन के किस हिस्से की गणना मॉडल में शामिल कारक चर में परिवर्तन के आधार पर की जा सकती है, जो चयनित प्रकार के फ़ंक्शन का उपयोग करके कारक चर और अध्ययन के तहत विशेषता को जोड़ता है। मॉडल समीकरण।

निर्धारण गुणांक R2 0 से 1 तक मान ले सकते हैं। निर्धारण का गुणांक जितना करीब होगा R2एकता के लिए, मॉडल की गुणवत्ता बेहतर है।

सहसंबंध सूचकांक निर्धारण के गुणांक को जानकर आसानी से गणना की जा सकती है:

सहसंबंध सूचकांक आरमॉडल में ध्यान में रखे गए कारकों और अध्ययन के तहत चर के बीच मॉडल का निर्माण करते समय चुने गए संबंधों के प्रकार की जकड़न की विशेषता है। रैखिक युग्म प्रतिगमन के मामले में, इसका निरपेक्ष मान युग्म सहसंबंध गुणांक के साथ मेल खाता है आर(एक्स, वाई), जिसे हमने पहले माना था, और के बीच रैखिक संबंध की जकड़न की विशेषता है एक्सऔर आप. सहसंबंध सूचकांक के मूल्य, जाहिर है, 0 से 1 की सीमा में भी हैं। मूल्य के करीब आरएकता के लिए, चयनित प्रकार के फ़ंक्शन कारक चर और अध्ययन के तहत विशेषता को जितना अधिक निकटता से जोड़ते हैं, मॉडल की गुणवत्ता उतनी ही बेहतर होती है।

(2.11)

प्रतिशत के रूप में व्यक्त किया गया और मॉडल की सटीकता की विशेषता है। व्यावहारिक समस्याओं को हल करने में मॉडल की स्वीकार्य सटीकता एक विशिष्ट स्थिति को ध्यान में रखते हुए आर्थिक व्यवहार्यता के विचारों के आधार पर निर्धारित की जा सकती है। व्यापक रूप से इस्तेमाल किया जाने वाला मानदंड यह है कि औसत सापेक्ष त्रुटि 15% से कम होने पर सटीकता को संतोषजनक माना जाता है। यदि एक ई रिले.ए.वी. 5% से कम है, तो कहा जाता है कि मॉडल में उच्च सटीकता है। विश्लेषण और पूर्वानुमान के लिए असंतोषजनक सटीकता वाले मॉडल का उपयोग करने की अनुशंसा नहीं की जाती है, अर्थात जब ई रिले.ए.वी. 15% से अधिक।

फिशर एफ-टेस्ट प्रतिगमन समीकरण के महत्व का मूल्यांकन करने के लिए प्रयोग किया जाता है। एफ-मानदंड का परिकलित मूल्य अनुपात से निर्धारित होता है:

. (2.12)

महत्वपूर्ण मान एफ-मानदंड α और स्वतंत्रता की डिग्री के दिए गए स्तर पर तालिकाओं से निर्धारित किया जाता है (आप एक्सेल में FDISP फ़ंक्शन का उपयोग कर सकते हैं)। यहाँ, अभी भी एममॉडल में ध्यान में रखे गए कारकों की संख्या है, एनअवलोकनों की संख्या है। यदि परिकलित मान महत्वपूर्ण मान से अधिक है, तो मॉडल समीकरण को सार्थक माना जाता है। परिकलित मान जितना बड़ा होगा एफ-मानदंड, मॉडल की गुणवत्ता जितनी बेहतर होगी।

आइए हम उस रैखिक मॉडल की गुणवत्ता विशेषताओं को निर्धारित करें जिसका हमने निर्माण किया है उदाहरण 1. आइए तालिका 2 के डेटा का उपयोग करें। निर्धारण गुणांक:

इसलिए, रैखिक मॉडल के भीतर, बिक्री की मात्रा में 90.1% की वृद्धि को हवा के तापमान में परिवर्तन द्वारा समझाया गया है।

सहसंबंध सूचकांक

.

एक युग्मित रैखिक मॉडल के मामले में सहसंबंध सूचकांक का मूल्य, जैसा कि हम देख सकते हैं, वास्तव में संबंधित चर (बिक्री मात्रा और तापमान) के बीच सहसंबंध गुणांक के बराबर मॉड्यूल है। चूंकि प्राप्त मूल्य एक के काफी करीब है, हम यह निष्कर्ष निकाल सकते हैं कि अध्ययन के तहत चर (बिक्री की मात्रा) और कारक चर (तापमान) के बीच एक करीबी रैखिक संबंध है।

फिशर एफ-टेस्ट

महत्वपूर्ण मान एफ क्रेα = 0.1 पर; वी 1 = 1; ν 2 =7-1-1=5 4.06 के बराबर है। अनुमानित मूल्य एफ-मानदंड सारणीबद्ध से बड़ा है, इसलिए, मॉडल समीकरण महत्वपूर्ण है।

औसत सापेक्ष सन्निकटन त्रुटि

निर्मित रैखिक जोड़ी प्रतिगमन मॉडल में असंतोषजनक सटीकता (> 15%) है, और इसे विश्लेषण और पूर्वानुमान के लिए उपयोग करने की अनुशंसा नहीं की जाती है।

नतीजतन, इस तथ्य के बावजूद कि अधिकांश सांख्यिकीय विशेषताएं उनके लिए मानदंडों को पूरा करती हैं, रैखिक युग्मित प्रतिगमन मॉडल हवा के तापमान के आधार पर बिक्री की मात्रा की भविष्यवाणी करने के लिए उपयुक्त नहीं है। अवलोकन संबंधी आंकड़ों के अनुसार इन चरों के बीच संबंध की गैर-रैखिक प्रकृति चित्र 1 में काफी स्पष्ट रूप से दिखाई देती है। किए गए विश्लेषण ने इसकी पुष्टि की।