प्रतिगमन विश्लेषण उदाहरण प्रतिगमन विश्लेषण

प्रतिगमन विश्लेषण की मुख्य विशेषता यह है कि इसका उपयोग अध्ययन के तहत चर के बीच संबंधों के रूप और प्रकृति के बारे में विशिष्ट जानकारी प्राप्त करने के लिए किया जा सकता है।

प्रतिगमन विश्लेषण के चरणों का क्रम

आइए हम संक्षेप में प्रतिगमन विश्लेषण के चरणों पर विचार करें।

    कार्य सूत्रीकरण। इस स्तर पर, अध्ययन की गई घटनाओं की निर्भरता के बारे में प्रारंभिक परिकल्पनाएं बनती हैं।

    आश्रित और स्वतंत्र (व्याख्यात्मक) चर की परिभाषा।

    सांख्यिकीय डेटा का संग्रह। प्रतिगमन मॉडल में शामिल प्रत्येक चर के लिए डेटा एकत्र किया जाना चाहिए।

    कनेक्शन के रूप (सरल या एकाधिक, रैखिक या गैर-रैखिक) के बारे में एक परिकल्पना तैयार करना।

    परिभाषा प्रतिगमन कार्य (प्रतिगमन समीकरण के मापदंडों के संख्यात्मक मूल्यों की गणना में शामिल है)

    प्रतिगमन विश्लेषण की सटीकता का मूल्यांकन।

    प्राप्त परिणामों की व्याख्या। प्रतिगमन विश्लेषण के परिणामों की तुलना प्रारंभिक परिकल्पनाओं से की जाती है। प्राप्त परिणामों की शुद्धता और संभाव्यता का मूल्यांकन किया जाता है।

    आश्रित चर के अज्ञात मानों की भविष्यवाणी।

प्रतिगमन विश्लेषण की मदद से पूर्वानुमान और वर्गीकरण की समस्या को हल करना संभव है। प्रतीपगमन समीकरण में व्याख्यात्मक चर के मानों को प्रतिस्थापित करके पूर्वानुमानित मानों की गणना की जाती है। वर्गीकरण की समस्या को इस तरह से हल किया जाता है: प्रतिगमन रेखा वस्तुओं के पूरे सेट को दो वर्गों में विभाजित करती है, और सेट का वह भाग जहाँ फ़ंक्शन का मान शून्य से अधिक होता है, एक वर्ग का होता है, और वह भाग जहाँ यह कम होता है शून्य से दूसरे वर्ग से संबंधित है।

प्रतिगमन विश्लेषण के कार्य

प्रतिगमन विश्लेषण के मुख्य कार्यों पर विचार करें: निर्भरता के रूप की स्थापना, निर्धारण प्रतिगमन कार्य, आश्रित चर के अज्ञात मूल्यों का अनुमान।

निर्भरता के रूप की स्थापना।

चरों के बीच संबंध की प्रकृति और रूप निम्न प्रकार के प्रतिगमन बना सकते हैं:

    सकारात्मक रैखिक प्रतिगमन (फ़ंक्शन की एक समान वृद्धि के रूप में व्यक्त);

    सकारात्मक समान रूप से त्वरित प्रतिगमन;

    सकारात्मक समान रूप से बढ़ती प्रतिगमन;

    नकारात्मक रैखिक प्रतिगमन (फ़ंक्शन में एक समान गिरावट के रूप में व्यक्त);

    नकारात्मक समान रूप से त्वरित घटते प्रतिगमन;

    नकारात्मक समान रूप से घटते प्रतिगमन।

हालांकि, वर्णित किस्में आमतौर पर शुद्ध रूप में नहीं, बल्कि एक दूसरे के संयोजन में पाई जाती हैं। इस मामले में, कोई प्रतिगमन के संयुक्त रूपों की बात करता है।

प्रतिगमन समारोह की परिभाषा।

दूसरा कार्य मुख्य कारकों या कारणों के आश्रित चर पर प्रभाव का पता लगाना है, अन्य सभी चीजें समान हैं, और यादृच्छिक तत्वों के आश्रित चर पर प्रभाव के बहिष्करण के अधीन हैं। प्रतिगमन समारोहएक प्रकार या किसी अन्य के गणितीय समीकरण के रूप में परिभाषित।

आश्रित चर के अज्ञात मानों का अनुमान।

इस समस्या का समाधान निम्न में से किसी एक प्रकार की समस्या को हल करने के लिए कम किया गया है:

    प्रारंभिक डेटा के विचारित अंतराल के भीतर आश्रित चर के मूल्यों का अनुमान, अर्थात लापता मूल्य; यह प्रक्षेप की समस्या को हल करता है।

    आश्रित चर के भविष्य के मूल्यों का अनुमान लगाना, अर्थात्। प्रारंभिक डेटा के दिए गए अंतराल के बाहर मान ढूँढना; यह एक्सट्रपलेशन की समस्या को हल करता है।

प्रतिगमन समीकरण में स्वतंत्र चर के मूल्यों के मापदंडों के पाए गए अनुमानों को प्रतिस्थापित करके दोनों समस्याओं का समाधान किया जाता है। समीकरण को हल करने का परिणाम लक्ष्य (आश्रित) चर के मूल्य का अनुमान है।

आइए कुछ मान्यताओं को देखें जिन पर प्रतिगमन विश्लेषण निर्भर करता है।

रैखिकता धारणा, यानी। यह माना जाता है कि विचाराधीन चरों के बीच संबंध रैखिक है। इसलिए, इस उदाहरण में, हमने एक स्कैटरप्लॉट बनाया और एक स्पष्ट रैखिक संबंध देखने में सक्षम थे। यदि, चरों के बिखराव पर, हम एक रैखिक संबंध की स्पष्ट अनुपस्थिति देखते हैं, अर्थात। एक गैर-रेखीय संबंध है, विश्लेषण के गैर-रैखिक तरीकों का उपयोग किया जाना चाहिए।

सामान्यता धारणा कूड़ा. यह मानता है कि अनुमानित और देखे गए मूल्यों के बीच अंतर का वितरण सामान्य है। वितरण की प्रकृति को दृष्टिगत रूप से निर्धारित करने के लिए, आप हिस्टोग्राम का उपयोग कर सकते हैं कूड़ा.

प्रतिगमन विश्लेषण का उपयोग करते समय, इसकी मुख्य सीमा को ध्यान में रखना चाहिए। यह इस तथ्य में समाहित है कि प्रतिगमन विश्लेषण आपको केवल निर्भरता का पता लगाने की अनुमति देता है, न कि उन संबंधों को जो इन निर्भरताओं को रेखांकित करते हैं।

प्रतिगमन विश्लेषण कई ज्ञात मूल्यों के आधार पर एक चर के अपेक्षित मूल्य की गणना करके चर के बीच संबंध की डिग्री का आकलन करना संभव बनाता है।

प्रतिगमन समीकरण।

प्रतिगमन समीकरण इस तरह दिखता है: Y=a+b*X

इस समीकरण का उपयोग करते हुए, चर Y को स्थिरांक a और रेखा के ढलान (या ढलान) b को चर X के मान से गुणा करके व्यक्त किया जाता है। स्थिरांक a को अवरोधन भी कहा जाता है, और ढलान प्रतिगमन है गुणांक या बी-कारक।

ज्यादातर मामलों में (यदि हमेशा नहीं) तो प्रतिगमन रेखा के बारे में टिप्पणियों का एक निश्चित बिखराव होता है।

शेष प्रतिगमन रेखा (अनुमानित मान) से एक व्यक्तिगत बिंदु (अवलोकन) का विचलन है।

MS Excel में प्रतिगमन विश्लेषण की समस्या को हल करने के लिए, मेनू से चयन करें सेवा"विश्लेषण पैकेज"और प्रतिगमन विश्लेषण उपकरण। X और Y इनपुट अंतराल निर्दिष्ट करें। Y इनपुट अंतराल विश्लेषण किए जा रहे निर्भर डेटा की श्रेणी है और इसमें एक कॉलम शामिल होना चाहिए। इनपुट अंतराल एक्स विश्लेषण किए जाने वाले स्वतंत्र डेटा की श्रेणी है। इनपुट रेंज की संख्या 16 से अधिक नहीं होनी चाहिए।

आउटपुट रेंज में प्रक्रिया के आउटपुट पर, हमें दी गई रिपोर्ट मिलती है तालिका 8.3क-8.3v.

परिणाम

तालिका 8.3क. प्रतिगमन आँकड़े

प्रतिगमन आँकड़े

एकाधिक आर

आर स्कवेयर

सामान्यीकृत आर-वर्ग

मानक त्रुटि

टिप्पणियों

सबसे पहले, प्रस्तुत गणनाओं के ऊपरी भाग पर विचार करें तालिका 8.3क, - प्रतिगमन आँकड़े।

मूल्य आर स्कवेयर, जिसे निश्चितता का माप भी कहा जाता है, परिणामी प्रतिगमन रेखा की गुणवत्ता की विशेषता है। यह गुण मूल डेटा और रिग्रेशन मॉडल (परिकलित डेटा) के बीच पत्राचार की डिग्री द्वारा व्यक्त किया जाता है। निश्चितता का माप हमेशा अंतराल के भीतर होता है।

ज्यादातर मामलों में, मूल्य आर स्कवेयरइन मूल्यों के बीच है, जिसे चरम कहा जाता है, अर्थात। शून्य और एक के बीच।

यदि मान आर स्कवेयरएकता के करीब, इसका मतलब है कि निर्मित मॉडल संबंधित चर की लगभग सभी परिवर्तनशीलता की व्याख्या करता है। इसके विपरीत, मान आर स्कवेयर, शून्य के करीब, का अर्थ है निर्मित मॉडल की खराब गुणवत्ता।

हमारे उदाहरण में, निश्चितता का माप 0.99673 है, जो मूल डेटा के लिए प्रतिगमन रेखा के बहुत अच्छे फिट होने का संकेत देता है।

बहुवचन आर - बहु सहसंबंध का गुणांक R - स्वतंत्र चर (X) और आश्रित चर (Y) की निर्भरता की डिग्री को व्यक्त करता है।

एकाधिक आरनिर्धारण गुणांक के वर्गमूल के बराबर, यह मान शून्य से एक तक की सीमा में मान लेता है।

सरल रैखिक प्रतिगमन विश्लेषण में बहुवचन आरपियर्सन सहसंबंध गुणांक के बराबर। सच में, बहुवचन आरहमारे मामले में, यह पिछले उदाहरण (0.998364) से पियर्सन सहसंबंध गुणांक के बराबर है।

तालिका 8.3ख. प्रतिगमन गुणांक

कठिनाइयाँ

मानक त्रुटि

टी आंकड़ा

वाई-चौराहा

चर एक्स 1

* गणना का एक छोटा संस्करण दिया गया है

अब प्रस्तुत गणनाओं के मध्य भाग पर विचार करें तालिका 8.3बी. यहाँ, समाश्रयण गुणांक b (2.305454545) और y-अक्ष के अनुदिश ऑफसेट दिए गए हैं, अर्थात्। स्थिरांक (2.694545455)।

गणना के आधार पर, हम प्रतिगमन समीकरण इस प्रकार लिख सकते हैं:

वाई= एक्स*2.305454545+2.694545455

प्रतिगमन गुणांक (गुणांक बी) के संकेतों (नकारात्मक या सकारात्मक) के आधार पर चर के बीच संबंध की दिशा निर्धारित की जाती है।

यदि समाश्रयण गुणांक का चिह्न धनात्मक है, तो आश्रित चर और स्वतंत्र चर के बीच संबंध धनात्मक होगा। हमारे मामले में, प्रतिगमन गुणांक का संकेत सकारात्मक है, इसलिए संबंध भी सकारात्मक है।

यदि प्रतीपगमन गुणांक का चिह्न ऋणात्मक है, तो आश्रित चर और स्वतंत्र चर के बीच संबंध ऋणात्मक (उलटा) है।

पर तालिका 8.3c. आउटपुट परिणाम प्रस्तुत किए जाते हैं कूड़ा. इन परिणामों को रिपोर्ट में प्रदर्शित करने के लिए, "रिग्रेशन" टूल लॉन्च करते समय "अवशिष्ट" चेकबॉक्स को सक्रिय करना आवश्यक है।

शेष आहरण

तालिका 8.3ग. खंडहर

अवलोकन

भविष्यवाणी Y

खंडहर

मानक शेष

रिपोर्ट के इस भाग का उपयोग करके, हम निर्मित प्रतिगमन रेखा से प्रत्येक बिंदु के विचलन को देख सकते हैं। सबसे बड़ा निरपेक्ष मूल्य शेषहमारे मामले में - 0.778, सबसे छोटा - 0.043। इन आंकड़ों की बेहतर व्याख्या के लिए, हम मूल डेटा के ग्राफ और अंजीर में प्रस्तुत निर्मित प्रतिगमन रेखा का उपयोग करेंगे। चावल। 8.3. जैसा कि आप देख सकते हैं, प्रतिगमन रेखा मूल डेटा के मूल्यों के लिए काफी सटीक रूप से "फिट" है।

यह ध्यान में रखा जाना चाहिए कि विचाराधीन उदाहरण काफी सरल है और गुणात्मक रूप से रैखिक प्रतिगमन रेखा का निर्माण करना हमेशा संभव नहीं होता है।

चावल। 8.3.प्रारंभिक डेटा और प्रतिगमन रेखा

स्वतंत्र चर के ज्ञात मूल्यों के आधार पर आश्रित चर के अज्ञात भविष्य के मूल्यों का अनुमान लगाने की समस्या पर विचार नहीं किया गया, अर्थात्। पूर्वानुमान कार्य।

प्रतिगमन समीकरण होने पर, समीकरण Y= x*2.305454545+2.694545455 को x के ज्ञात मानों के साथ हल करने के लिए पूर्वानुमान समस्या कम हो जाती है। आश्रित चर Y के छह कदम आगे की भविष्यवाणी के परिणाम प्रस्तुत किए गए हैं तालिका 8.4 . में.

तालिका 8.4. वाई चर भविष्यवाणी परिणाम

वाई (अनुमानित)

इस प्रकार, Microsoft Excel पैकेज में प्रतिगमन विश्लेषण का उपयोग करने के परिणामस्वरूप, हम:

    एक प्रतिगमन समीकरण बनाया;

    निर्भरता के रूप और चर के बीच संबंध की दिशा की स्थापना की - एक सकारात्मक रैखिक प्रतिगमन, जो फ़ंक्शन की एक समान वृद्धि में व्यक्त किया गया है;

    चरों के बीच संबंध की दिशा स्थापित की;

    परिणामी प्रतिगमन रेखा की गुणवत्ता का आकलन किया;

    मूल सेट के डेटा से परिकलित डेटा के विचलन को देखने में सक्षम थे;

    आश्रित चर के भविष्य के मूल्यों की भविष्यवाणी की।

यदि एक प्रतिगमन समारोहपरिभाषित, व्याख्या और उचित है, और प्रतिगमन विश्लेषण की सटीकता का आकलन आवश्यकताओं को पूरा करता है, हम मान सकते हैं कि निर्मित मॉडल और भविष्य कहनेवाला मूल्य पर्याप्त रूप से विश्वसनीय हैं।

इस तरह से प्राप्त अनुमानित मूल्य औसत मूल्य हैं जिनकी उम्मीद की जा सकती है।

इस पत्र में, हमने मुख्य विशेषताओं की समीक्षा की वर्णनात्मक आँकड़ेऔर उनमें से इस तरह की अवधारणाएं अर्थ,मंझला,ज्यादा से ज्यादा,न्यूनतमऔर डेटा भिन्नता की अन्य विशेषताएं।

अवधारणा की एक संक्षिप्त चर्चा भी हुई उत्सर्जन. मानी गई विशेषताएँ तथाकथित खोजपूर्ण डेटा विश्लेषण को संदर्भित करती हैं, इसके निष्कर्ष सामान्य आबादी पर लागू नहीं हो सकते हैं, लेकिन केवल डेटा नमूने पर लागू होते हैं। खोजपूर्ण डेटा विश्लेषण का उपयोग प्राथमिक निष्कर्ष निकालने और जनसंख्या के बारे में अनुमान लगाने के लिए किया जाता है।

सहसंबंध और प्रतिगमन विश्लेषण की मूल बातें, उनके कार्यों और व्यावहारिक उपयोग की संभावनाओं पर भी विचार किया गया।

प्रतिगमन विश्लेषण अध्ययन की गई विशेषताओं के बीच एक स्टोकेस्टिक संबंध की विश्लेषणात्मक अभिव्यक्ति स्थापित करने की एक विधि है। प्रतिगमन समीकरण दिखाता है कि औसतन कैसे बदलता है परमें से किसी को बदलते समय एक्स मैं , और ऐसा दिखता है:

कहाँ पे वाई -आश्रित चर (यह हमेशा एक होता है);

एक्स मैं - स्वतंत्र चर (कारक) (उनमें से कई हो सकते हैं)।

यदि केवल एक स्वतंत्र चर है, तो यह एक सरल प्रतिगमन विश्लेषण है। अगर कई हैं पी 2), तो ऐसे विश्लेषण को बहुभिन्नरूपी कहा जाता है।

प्रतिगमन विश्लेषण के दौरान, दो मुख्य कार्य हल किए जाते हैं:

    प्रतिगमन समीकरण का निर्माण, अर्थात्। परिणाम संकेतक और स्वतंत्र कारकों के बीच संबंध के प्रकार का पता लगाना एक्स 1 , एक्स 2 , …, एक्स एन .

    परिणामी समीकरण के महत्व का आकलन, अर्थात्। यह निर्धारित करना कि चयनित कारक विशेषताएँ विशेषता की भिन्नता को कितना स्पष्ट करती हैं वाई

प्रतिगमन विश्लेषण मुख्य रूप से नियोजन के साथ-साथ एक नियामक ढांचे के विकास के लिए उपयोग किया जाता है।

सहसंबंध विश्लेषण के विपरीत, जो केवल इस सवाल का जवाब देता है कि क्या विश्लेषण की गई विशेषताओं के बीच कोई संबंध है, प्रतिगमन विश्लेषण भी इसकी औपचारिक अभिव्यक्ति देता है। इसके अलावा, यदि सहसंबंध विश्लेषण कारकों के किसी भी संबंध का अध्ययन करता है, तो प्रतिगमन विश्लेषण एकतरफा निर्भरता का अध्ययन करता है, अर्थात। एक कनेक्शन यह दर्शाता है कि कारक संकेतों में परिवर्तन परिणामी संकेत को कैसे प्रभावित करता है।

प्रतिगमन विश्लेषण गणितीय आँकड़ों के सबसे विकसित तरीकों में से एक है। कड़ाई से बोलते हुए, प्रतिगमन विश्लेषण के कार्यान्वयन के लिए कई विशेष आवश्यकताओं की पूर्ति की आवश्यकता होती है (विशेष रूप से, एक्समैं ,एक्स 2 ,...,एक्स एन ;आपस्वतंत्र होना चाहिए, सामान्य रूप से निरंतर भिन्नता वाले यादृच्छिक चर वितरित किए जाते हैं)। वास्तविक जीवन में, प्रतिगमन और सहसंबंध विश्लेषण की आवश्यकताओं का कड़ाई से अनुपालन बहुत दुर्लभ है, लेकिन आर्थिक अनुसंधान में ये दोनों विधियां बहुत आम हैं। अर्थव्यवस्था में निर्भरता न केवल प्रत्यक्ष, बल्कि व्युत्क्रम और अरैखिक भी हो सकती है। एक प्रतिगमन मॉडल किसी भी निर्भरता की उपस्थिति में बनाया जा सकता है, हालांकि, बहुभिन्नरूपी विश्लेषण में, केवल फॉर्म के रैखिक मॉडल का उपयोग किया जाता है:

प्रतिगमन समीकरण का निर्माण, एक नियम के रूप में, कम से कम वर्ग विधि द्वारा किया जाता है, जिसका सार इसकी गणना मूल्यों से परिणामी विशेषता के वास्तविक मूल्यों के वर्ग विचलन के योग को कम करना है, अर्थात:

कहाँ पे टी -टिप्पणियों की संख्या;

जे =ए+बी 1 एक्स 1 जे +बी 2 एक्स 2 जे + ... + बी एन एक्स एन जे - परिणाम कारक की गणना मूल्य।

एक व्यक्तिगत कंप्यूटर या एक विशेष वित्तीय कैलकुलेटर के लिए विश्लेषणात्मक पैकेजों का उपयोग करके प्रतिगमन गुणांक निर्धारित करने की सिफारिश की जाती है। सरलतम मामले में, फॉर्म के एक-कारक रैखिक प्रतिगमन समीकरण के प्रतिगमन गुणांक वाई = ए + बीएक्ससूत्रों का उपयोग करके पाया जा सकता है:

समूह विश्लेषण

क्लस्टर विश्लेषण बहुभिन्नरूपी विश्लेषण के तरीकों में से एक है, जिसे एक आबादी को समूहीकृत (क्लस्टरिंग) करने के लिए डिज़ाइन किया गया है, जिसके तत्व कई विशेषताओं की विशेषता है। सुविधाओं में से प्रत्येक के मूल्य सुविधाओं के बहुआयामी स्थान में अध्ययन की गई आबादी की प्रत्येक इकाई के निर्देशांक के रूप में कार्य करते हैं। कई संकेतकों के मूल्यों की विशेषता वाले प्रत्येक अवलोकन को इन संकेतकों के स्थान में एक बिंदु के रूप में दर्शाया जा सकता है, जिसके मूल्यों को एक बहुआयामी अंतरिक्ष में निर्देशांक के रूप में माना जाता है। बिंदुओं के बीच की दूरी आरऔर क्यूसाथ निर्देशांक के रूप में परिभाषित किया गया है:

क्लस्टरिंग के लिए मुख्य मानदंड यह है कि समूहों के बीच अंतर एक ही क्लस्टर को सौंपे गए अवलोकनों की तुलना में अधिक महत्वपूर्ण होना चाहिए, अर्थात। एक बहुआयामी अंतरिक्ष में, असमानता देखी जानी चाहिए:

कहाँ पे आर 1, 2 - क्लस्टर 1 और 2 के बीच की दूरी।

साथ ही प्रतिगमन विश्लेषण प्रक्रियाओं, क्लस्टरिंग प्रक्रिया काफी श्रमसाध्य है, इसे कंप्यूटर पर करने की सलाह दी जाती है।

अपने अध्ययन के दौरान, छात्रों को अक्सर कई तरह के समीकरणों का सामना करना पड़ता है। उनमें से एक - प्रतिगमन समीकरण - इस लेख में माना जाता है। इस प्रकार के समीकरण का उपयोग विशेष रूप से गणितीय मापदंडों के बीच संबंधों की विशेषताओं का वर्णन करने के लिए किया जाता है। इस प्रकार की समानता का उपयोग सांख्यिकी और अर्थमिति में किया जाता है।

प्रतिगमन की परिभाषा

गणित में, प्रतिगमन को एक निश्चित मात्रा के रूप में समझा जाता है जो किसी अन्य मात्रा के मूल्यों पर सेट किए गए डेटा के औसत मूल्य की निर्भरता का वर्णन करता है। समाश्रयण समीकरण, किसी विशेष विशेषता के फलन के रूप में, किसी अन्य विशेषता के औसत मान को दर्शाता है। प्रतिगमन फ़ंक्शन में एक साधारण समीकरण y \u003d x का रूप होता है, जिसमें y एक आश्रित चर के रूप में कार्य करता है, और x एक स्वतंत्र चर (सुविधा कारक) है। वास्तव में, समाश्रयण को y = f (x) के रूप में व्यक्त किया जाता है।

चरों के बीच संबंध कितने प्रकार के होते हैं

सामान्य तौर पर, दो विपरीत प्रकार के संबंध प्रतिष्ठित होते हैं: सहसंबंध और प्रतिगमन।

पहले सशर्त चर की समानता की विशेषता है। इस मामले में, यह निश्चित रूप से ज्ञात नहीं है कि कौन सा चर दूसरे पर निर्भर करता है।

यदि चरों और शर्तों के बीच कोई समानता नहीं है, तो कहते हैं कि कौन सा चर व्याख्यात्मक है और कौन सा निर्भर है, तो हम दूसरे प्रकार के कनेक्शन की उपस्थिति के बारे में बात कर सकते हैं। एक रैखिक प्रतिगमन समीकरण बनाने के लिए, यह पता लगाना आवश्यक होगा कि किस प्रकार का संबंध देखा जाता है।

प्रतिगमन के प्रकार

आज तक, प्रतिगमन के 7 अलग-अलग प्रकार हैं: अतिपरवलयिक, रैखिक, एकाधिक, अरेखीय, जोड़ीवार, उलटा, लघुगणकीय रूप से रैखिक।

अतिशयोक्तिपूर्ण, रैखिक और लघुगणक

रेखीय प्रतीपगमन समीकरण का प्रयोग सांख्यिकी में समीकरण के प्राचलों को स्पष्ट रूप से समझाने के लिए किया जाता है। यह y = c + m * x + E जैसा दिखता है। हाइपरबोलिक समीकरण में एक नियमित हाइपरबोला y \u003d c + m / x + E का रूप होता है। लॉगरिदमिक रूप से रैखिक समीकरण लॉगरिदमिक फ़ंक्शन का उपयोग करके संबंध को व्यक्त करता है: y \u003d में c + m * में x + में E।

एकाधिक और गैर-रैखिक

दो और जटिल प्रकार के प्रतिगमन बहु और गैर-रेखीय हैं। बहु समाश्रयण समीकरण फ़ंक्शन y \u003d f (x 1, x 2 ... x c) + E द्वारा व्यक्त किया जाता है। इस स्थिति में, y आश्रित चर है और x व्याख्यात्मक चर है। चर ई स्टोकेस्टिक है और समीकरण में अन्य कारकों के प्रभाव को शामिल करता है। गैर-रैखिक प्रतिगमन समीकरण थोड़ा असंगत है। एक ओर, ध्यान में रखे गए संकेतकों के संबंध में, यह रैखिक नहीं है, और दूसरी ओर, संकेतकों के आकलन की भूमिका में, यह रैखिक है।

व्युत्क्रम और जोड़ीदार प्रतिगमन

व्युत्क्रम एक प्रकार का कार्य है जिसे एक रैखिक रूप में परिवर्तित करने की आवश्यकता होती है। सबसे पारंपरिक अनुप्रयोग कार्यक्रमों में, इसका एक फ़ंक्शन y \u003d 1 / c + m * x + E का रूप होता है। युग्मित प्रतिगमन समीकरण डेटा के बीच संबंध को y = f(x) + E के एक फलन के रूप में दर्शाता है। अन्य समीकरणों की तरह, y x पर निर्भर करता है और E एक स्टोकेस्टिक पैरामीटर है।

सहसंबंध की अवधारणा

यह एक संकेतक है जो दो घटनाओं या प्रक्रियाओं के बीच संबंध के अस्तित्व को प्रदर्शित करता है। रिश्ते की ताकत को सहसंबंध गुणांक के रूप में व्यक्त किया जाता है। इसका मान अंतराल [-1;+1] के भीतर उतार-चढ़ाव करता है। एक नकारात्मक संकेतक प्रतिक्रिया की उपस्थिति को इंगित करता है, एक सकारात्मक संकेतक एक प्रत्यक्ष को इंगित करता है। यदि गुणांक 0 के बराबर मान लेता है, तो कोई संबंध नहीं है। मान 1 के जितना करीब होगा - मापदंडों के बीच संबंध उतना ही मजबूत होगा, 0 के करीब - कमजोर।

तरीकों

सहसंबंध पैरामीट्रिक विधियां रिश्ते की मजबूती का अनुमान लगा सकती हैं। उनका उपयोग वितरण अनुमानों के आधार पर उन मानकों का अध्ययन करने के लिए किया जाता है जो सामान्य वितरण कानून का पालन करते हैं।

रैखिक प्रतिगमन समीकरण के पैरामीटर निर्भरता के प्रकार, प्रतिगमन समीकरण के कार्य की पहचान करने और चुने हुए संबंध सूत्र के संकेतकों का मूल्यांकन करने के लिए आवश्यक हैं। संबंध की पहचान के लिए एक विधि के रूप में सहसंबंध क्षेत्र का उपयोग किया जाता है। ऐसा करने के लिए, सभी मौजूदा डेटा को ग्राफिक रूप से दर्शाया जाना चाहिए। एक आयताकार द्वि-आयामी समन्वय प्रणाली में, सभी ज्ञात डेटा को प्लॉट किया जाना चाहिए। इस प्रकार सहसंबंध क्षेत्र का निर्माण होता है। वर्णन करने वाले कारक का मान भुज के साथ चिह्नित किया जाता है, जबकि आश्रित कारक के मान कोर्डिनेट के साथ चिह्नित किया जाता है। यदि मापदंडों के बीच एक कार्यात्मक संबंध है, तो वे एक पंक्ति के रूप में पंक्तिबद्ध होते हैं।

यदि ऐसे डेटा का सहसंबंध गुणांक 30% से कम है, तो हम कनेक्शन की लगभग पूर्ण अनुपस्थिति के बारे में बात कर सकते हैं। यदि यह 30% और 70% के बीच है, तो यह मध्यम जकड़न के लिंक की उपस्थिति को इंगित करता है। एक 100% संकेतक एक कार्यात्मक कनेक्शन का प्रमाण है।

एक गैर-रेखीय प्रतिगमन समीकरण, एक रैखिक की तरह, एक सहसंबंध सूचकांक (R) के साथ पूरक होना चाहिए।

एकाधिक प्रतिगमन के लिए सहसंबंध

निर्धारण का गुणांक बहु सहसंबंध के वर्ग का सूचक है। वह अध्ययन के तहत विशेषता के साथ संकेतकों के प्रस्तुत सेट के संबंध की जकड़न के बारे में बोलता है। यह परिणाम पर मापदंडों के प्रभाव की प्रकृति के बारे में भी बात कर सकता है। इस सूचक का उपयोग करके बहु प्रतिगमन समीकरण का मूल्यांकन किया जाता है।

बहु सहसंबंध सूचकांक की गणना करने के लिए, इसके सूचकांक की गणना करना आवश्यक है।

कम से कम वर्ग विधि

यह विधि प्रतिगमन कारकों का अनुमान लगाने का एक तरीका है। इसका सार फलन पर कारक की निर्भरता के कारण प्राप्त वर्ग विचलन के योग को कम करने में निहित है।

इस तरह की विधि का उपयोग करके एक युग्मित रैखिक प्रतिगमन समीकरण का अनुमान लगाया जा सकता है। एक युग्मित रैखिक संबंध के संकेतकों के बीच पता लगाने के मामले में इस प्रकार के समीकरणों का उपयोग किया जाता है।

समीकरण विकल्प

रैखिक प्रतिगमन फ़ंक्शन के प्रत्येक पैरामीटर का एक विशिष्ट अर्थ होता है। युग्मित रैखिक प्रतिगमन समीकरण में दो पैरामीटर होते हैं: c और m। पैरामीटर t फ़ंक्शन y के अंतिम संकेतक में औसत परिवर्तन को दर्शाता है, जो एक पारंपरिक इकाई द्वारा चर x में कमी (वृद्धि) के अधीन है। यदि चर x शून्य है, तो फ़ंक्शन पैरामीटर c के बराबर है। यदि चर x शून्य नहीं है, तो कारक c का आर्थिक अर्थ नहीं है। फ़ंक्शन पर एकमात्र प्रभाव कारक c के सामने का चिन्ह है। यदि कोई ऋण है, तो हम कारक की तुलना में परिणाम में धीमे परिवर्तन के बारे में कह सकते हैं। यदि कोई प्लस है, तो यह परिणाम में त्वरित परिवर्तन को इंगित करता है।

प्रतीपगमन समीकरण के मान को बदलने वाले प्रत्येक पैरामीटर को समीकरण के रूप में व्यक्त किया जा सकता है। उदाहरण के लिए, गुणनखंड c का रूप c = y - mx है।

समूहीकृत डेटा

कार्य की ऐसी स्थितियां हैं जिनमें सभी सूचनाओं को विशेषता x के अनुसार समूहीकृत किया जाता है, लेकिन साथ ही, एक निश्चित समूह के लिए, आश्रित संकेतक के संबंधित औसत मूल्यों को इंगित किया जाता है। इस मामले में, औसत मान यह दर्शाते हैं कि संकेतक x पर कैसे निर्भर करता है। इस प्रकार, समूहीकृत जानकारी प्रतिगमन समीकरण को खोजने में मदद करती है। इसका उपयोग संबंध विश्लेषण के रूप में किया जाता है। हालांकि, इस पद्धति की अपनी कमियां हैं। दुर्भाग्य से, औसत अक्सर बाहरी उतार-चढ़ाव के अधीन होते हैं। ये उतार-चढ़ाव रिश्ते के पैटर्न का प्रतिबिंब नहीं हैं, वे सिर्फ इसके "शोर" को छुपाते हैं। औसत एक रैखिक प्रतिगमन समीकरण की तुलना में संबंध के पैटर्न को बहुत खराब दिखाते हैं। हालांकि, उन्हें समीकरण खोजने के लिए आधार के रूप में इस्तेमाल किया जा सकता है। किसी विशेष जनसंख्या के आकार को संबंधित औसत से गुणा करके, आप समूह के भीतर y का योग प्राप्त कर सकते हैं। अगला, आपको सभी प्राप्त राशियों को बाहर निकालने और अंतिम संकेतक y खोजने की आवश्यकता है। योग संकेतक xy के साथ गणना करना थोड़ा अधिक कठिन है। इस घटना में कि अंतराल छोटा है, हम सशर्त रूप से सभी इकाइयों (समूह के भीतर) के लिए संकेतक x समान ले सकते हैं। x और y के गुणनफलों का योग ज्ञात करने के लिए इसे y के योग से गुणा करें। इसके अलावा, सभी योगों को एक साथ खटखटाया जाता है और कुल योग xy प्राप्त होता है।

एकाधिक जोड़ी समीकरण प्रतिगमन: एक रिश्ते के महत्व का आकलन

जैसा कि पहले चर्चा की गई थी, एकाधिक प्रतिगमन में y \u003d f (x 1, x 2, ..., x m) + E के रूप का एक कार्य होता है। सबसे अधिक बार, इस तरह के समीकरण का उपयोग माल की आपूर्ति और मांग की समस्या को हल करने के लिए किया जाता है, पुनर्खरीद शेयरों पर ब्याज आय, उत्पादन लागत फ़ंक्शन के कारणों और प्रकार का अध्ययन करना। यह व्यापक रूप से व्यापक आर्थिक अध्ययनों और गणनाओं में भी सक्रिय रूप से उपयोग किया जाता है, लेकिन सूक्ष्मअर्थशास्त्र के स्तर पर, इस तरह के समीकरण का उपयोग अक्सर कम किया जाता है।

मल्टीपल रिग्रेशन का मुख्य कार्य एक डेटा मॉडल का निर्माण करना है जिसमें बड़ी मात्रा में जानकारी होती है ताकि आगे यह निर्धारित किया जा सके कि प्रत्येक कारक का व्यक्तिगत रूप से और उनकी समग्रता में संकेतक और उसके गुणांक पर क्या प्रभाव पड़ता है। प्रतिगमन समीकरण विभिन्न मूल्यों पर ले सकता है। इस मामले में, संबंध का आकलन करने के लिए आमतौर पर दो प्रकार के कार्यों का उपयोग किया जाता है: रैखिक और अरेखीय।

एक रैखिक कार्य को इस तरह के संबंध के रूप में दर्शाया गया है: y \u003d a 0 + a 1 x 1 + a 2 x 2, + ... + a m x m। इस मामले में, a2, a m को "शुद्ध" प्रतिगमन के गुणांक माना जाता है। वे अन्य संकेतकों के स्थिर मूल्य की स्थिति के साथ, एक इकाई द्वारा प्रत्येक संबंधित पैरामीटर x में परिवर्तन (कमी या वृद्धि) के साथ पैरामीटर y में औसत परिवर्तन को चिह्नित करने के लिए आवश्यक हैं।

उदाहरण के लिए, अरैखिक समीकरणों में एक शक्ति फलन y=ax 1 b1 x 2 b2 ...x m bm का रूप होता है। इस मामले में, संकेतक बी 1, बी 2 ..... बी एम - को लोच गुणांक कहा जाता है, वे प्रदर्शित करते हैं कि संबंधित संकेतक x में 1% की वृद्धि (कमी) के साथ परिणाम कैसे बदलेगा (कितना%) और अन्य कारकों के एक स्थिर संकेतक के साथ।

एकाधिक प्रतिगमन का निर्माण करते समय किन कारकों पर विचार किया जाना चाहिए

एकाधिक प्रतिगमन को सही ढंग से बनाने के लिए, यह पता लगाना आवश्यक है कि किन कारकों पर विशेष ध्यान दिया जाना चाहिए।

आर्थिक कारकों और प्रतिरूपों के बीच संबंधों की प्रकृति की कुछ समझ होना आवश्यक है। शामिल किए जाने वाले कारकों को निम्नलिखित मानदंडों को पूरा करना होगा:

  • मापने योग्य होना चाहिए। किसी वस्तु की गुणवत्ता का वर्णन करने वाले कारक का उपयोग करने के लिए, किसी भी मामले में, इसे मात्रात्मक रूप दिया जाना चाहिए।
  • कोई कारक अंतर्संबंध या कार्यात्मक संबंध नहीं होना चाहिए। इस तरह की कार्रवाइयां अक्सर अपरिवर्तनीय परिणाम देती हैं - सामान्य समीकरणों की प्रणाली बिना शर्त हो जाती है, और इसके लिए इसकी अविश्वसनीयता और अस्पष्ट अनुमान शामिल होते हैं।
  • एक विशाल सहसंबंध संकेतक के मामले में, संकेतक के अंतिम परिणाम पर कारकों के पृथक प्रभाव का पता लगाने का कोई तरीका नहीं है, इसलिए, गुणांक निर्वचनीय हो जाते हैं।

निर्माण के तरीके

आप समीकरण के लिए कारकों का चयन कैसे कर सकते हैं, यह समझाने के लिए बड़ी संख्या में विधियाँ और तरीके हैं। हालाँकि, ये सभी विधियाँ सहसंबंध सूचकांक का उपयोग करके गुणांक के चयन पर आधारित हैं। उनमें से हैं:

  • बहिष्करण विधि।
  • विधि चालू करें।
  • चरणबद्ध प्रतिगमन विश्लेषण।

पहली विधि में कुल समुच्चय से सभी गुणांकों को बाहर निकालना शामिल है। दूसरी विधि में कई अतिरिक्त कारकों की शुरूआत शामिल है। खैर, तीसरा उन कारकों का उन्मूलन है जो पहले समीकरण पर लागू होते थे। इनमें से प्रत्येक विधि को अस्तित्व का अधिकार है। उनके अपने फायदे और नुकसान हैं, लेकिन वे अनावश्यक संकेतकों को बाहर निकालने के मुद्दे को अपने तरीके से हल कर सकते हैं। एक नियम के रूप में, प्रत्येक व्यक्तिगत विधि द्वारा प्राप्त परिणाम काफी करीब हैं।

बहुभिन्नरूपी विश्लेषण के तरीके

कारकों के निर्धारण के लिए ऐसी विधियां परस्पर संबंधित विशेषताओं के अलग-अलग संयोजनों पर विचार करने पर आधारित हैं। इनमें विभेदक विश्लेषण, पैटर्न मान्यता, प्रमुख घटक विश्लेषण और क्लस्टर विश्लेषण शामिल हैं। इसके अलावा, कारक विश्लेषण भी है, हालांकि, यह घटक पद्धति के विकास के परिणामस्वरूप दिखाई दिया। उन सभी को कुछ परिस्थितियों में, कुछ शर्तों और कारकों के तहत लागू किया जाता है।

प्रतिगमन विश्लेषण का मुख्य लक्ष्यसंबंध के विश्लेषणात्मक रूप को निर्धारित करने में शामिल है, जिसमें परिणामी विशेषता में परिवर्तन एक या एक से अधिक कारक संकेतों के प्रभाव के कारण होता है, और अन्य सभी कारकों का सेट जो परिणामी विशेषता को भी प्रभावित करता है, को स्थिर और औसत मान के रूप में लिया जाता है। .
प्रतिगमन विश्लेषण के कार्य:
ए) निर्भरता के रूप की स्थापना। घटना के बीच संबंध की प्रकृति और रूप के संबंध में, सकारात्मक रैखिक और गैर-रेखीय और नकारात्मक रैखिक और गैर-रेखीय प्रतिगमन हैं।
बी) एक प्रकार या दूसरे के गणितीय समीकरण के रूप में प्रतिगमन समारोह की परिभाषा और आश्रित चर पर व्याख्यात्मक चर के प्रभाव को स्थापित करना।
c) आश्रित चर के अज्ञात मानों का अनुमान। रिग्रेशन फ़ंक्शन का उपयोग करके, आप व्याख्यात्मक चर के दिए गए मानों के अंतराल के भीतर आश्रित चर के मानों को पुन: उत्पन्न कर सकते हैं (यानी, इंटरपोलेशन समस्या को हल करें) या निर्दिष्ट अंतराल के बाहर प्रक्रिया के पाठ्यक्रम का मूल्यांकन करें (यानी, एक्सट्रपलेशन समस्या को हल करें)। परिणाम आश्रित चर के मूल्य का एक अनुमान है।

जोड़ी प्रतिगमन - दो चर y और x के संबंध का समीकरण: y=f(x), जहां y आश्रित चर (परिणामी चिह्न) है; एक्स - स्वतंत्र, व्याख्यात्मक चर (सुविधा-कारक)।

रैखिक और गैर-रेखीय प्रतिगमन हैं।
रैखिक प्रतिगमन: y = a + bx +
गैर-रेखीय प्रतिगमन दो वर्गों में विभाजित हैं: प्रतिगमन जो विश्लेषण में शामिल व्याख्यात्मक चर के संबंध में गैर-रेखीय हैं, लेकिन अनुमानित मापदंडों के संबंध में रैखिक हैं, और प्रतिगमन जो अनुमानित मापदंडों के संबंध में गैर-रैखिक हैं।
व्याख्यात्मक चर में गैर-रैखिक प्रतिगमन:

अनुमानित मापदंडों में गैर-रैखिक प्रतिगमन:

  • शक्ति y=a x b
  • घातांक y=a b x
  • घातांक y=e a+b x
प्रतिगमन समीकरण का निर्माण इसके मापदंडों का अनुमान लगाने के लिए कम किया गया है। प्रतिगमन के मापदंडों का अनुमान लगाने के लिए जो मापदंडों में रैखिक हैं, कम से कम वर्गों (एलएसएम) की विधि का उपयोग किया जाता है। एलएसएम ऐसे पैरामीटर अनुमान प्राप्त करना संभव बनाता है जिसके लिए सैद्धांतिक मूल्यों y x से प्रभावी फीचर y के वास्तविक मूल्यों के वर्ग विचलन का योग न्यूनतम है, अर्थात।
.
रैखिक और अरेखीय समीकरणों के लिए रैखिक के लिए कम करने के लिए, निम्नलिखित प्रणाली को ए और बी के लिए हल किया जाता है:

आप तैयार किए गए फ़ार्मुलों का उपयोग कर सकते हैं जो इस प्रणाली से अनुसरण करते हैं:

अध्ययन की गई परिघटनाओं के बीच संबंध की निकटता का अनुमान रैखिक युग्म सहसंबंध गुणांक r xy द्वारा रेखीय प्रतिगमन (-1≤r xy ≤1) के लिए लगाया जाता है:

और सहसंबंध सूचकांक p xy - गैर-रैखिक प्रतिगमन के लिए (0≤p xy ≤1):

निर्मित मॉडल की गुणवत्ता का आकलन निर्धारण के गुणांक (सूचकांक) के साथ-साथ औसत सन्निकटन त्रुटि द्वारा दिया जाएगा।
औसत सन्निकटन त्रुटि वास्तविक से परिकलित मानों का औसत विचलन है:
.
मूल्यों की अनुमेय सीमा ए - 8-10% से अधिक नहीं।
लोच E का औसत गुणांक दर्शाता है कि जब कारक x अपने औसत मान से 1% बदलता है, तो परिणाम y अपने औसत मान से औसतन कितने प्रतिशत बदलेगा:
.

प्रसरण के विश्लेषण का कार्य आश्रित चर के प्रसरण का विश्लेषण करना है:
(y-y )²=∑(y x -y )²+∑(y-y x)²
जहां ∑(y-y)² वर्ग विचलन का कुल योग है;
∑(y x -y)² - प्रतिगमन के कारण वर्ग विचलन का योग ("समझा गया" या "फैक्टोरियल");
(y-y x)² - वर्ग विचलन का अवशिष्ट योग।
प्रभावी सुविधा y के कुल विचरण में प्रतिगमन द्वारा समझाया गया विचरण का हिस्सा निर्धारण R2 के गुणांक (सूचकांक) द्वारा विशेषता है:

निर्धारण का गुणांक गुणांक या सहसंबंध सूचकांक का वर्ग है।

एफ-परीक्षण - प्रतिगमन समीकरण की गुणवत्ता का मूल्यांकन - परिकल्पना का परीक्षण करना शामिल है लेकिन प्रतिगमन समीकरण के सांख्यिकीय महत्व और कनेक्शन की निकटता के संकेतक के बारे में। इसके लिए फिशर एफ-मानदंड के मूल्यों की वास्तविक एफ तथ्य और महत्वपूर्ण (सारणीबद्ध) एफ तालिका की तुलना की जाती है। एफ तथ्य स्वतंत्रता की एक डिग्री के लिए गणना की गई फैक्टोरियल और अवशिष्ट भिन्नताओं के मूल्यों के अनुपात से निर्धारित होता है:
,
जहाँ n जनसंख्या इकाइयों की संख्या है; m चर x के लिए मापदंडों की संख्या है।
एफ तालिका स्वतंत्रता और महत्व स्तर की दी गई डिग्री के लिए यादृच्छिक कारकों के प्रभाव में मानदंड का अधिकतम संभव मूल्य है। महत्व स्तर ए - सही परिकल्पना को खारिज करने की संभावना, बशर्ते कि यह सच हो। आमतौर पर a को 0.05 या 0.01 के बराबर लिया जाता है।
अगर एफ टेबल< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >एफ एक तथ्य है, तो परिकल्पना एच के बारे में खारिज नहीं किया जाता है और सांख्यिकीय महत्वहीन, प्रतिगमन समीकरण की अविश्वसनीयता को मान्यता दी जाती है।
प्रतिगमन और सहसंबंध गुणांक के सांख्यिकीय महत्व का आकलन करने के लिए, प्रत्येक संकेतक के लिए छात्र के टी-परीक्षण और आत्मविश्वास अंतराल की गणना की जाती है। संकेतकों की यादृच्छिक प्रकृति के बारे में एक परिकल्पना एच सामने रखी गई है, अर्थात। शून्य से उनके महत्वहीन अंतर के बारे में। छात्र के टी-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन उनके मूल्यों की तुलना यादृच्छिक त्रुटि के परिमाण के साथ किया जाता है:
; ; .
रैखिक प्रतिगमन मापदंडों और सहसंबंध गुणांक की यादृच्छिक त्रुटियां सूत्रों द्वारा निर्धारित की जाती हैं:



टी-सांख्यिकी के वास्तविक और महत्वपूर्ण (सारणीबद्ध) मूल्यों की तुलना - टी टेबल और टी तथ्य - हम परिकल्पना एच ओ को स्वीकार या अस्वीकार करते हैं।
फिशर के एफ-परीक्षण और छात्र के टी-सांख्यिकी के बीच संबंध समानता द्वारा व्यक्त किया जाता है

अगर टी टेबल< t факт то H o отклоняется, т.е. a , b и r xy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >टी तथ्य यह है कि परिकल्पना एच के बारे में खारिज नहीं किया गया है और ए, बी या आर xy के गठन की यादृच्छिक प्रकृति को मान्यता दी गई है।
विश्वास अंतराल की गणना करने के लिए, हम प्रत्येक संकेतक के लिए सीमांत त्रुटि D निर्धारित करते हैं:
Δ ए = टी टेबल एम ए, Δ बी = टी टेबल एम बी।
विश्वास अंतराल की गणना के लिए सूत्र इस प्रकार हैं:
γ ए \u003d एΔ ए; γ ए \u003d ए-Δ ए; γ ए = ए + Δए
बी = बीΔ बी; γ बी = बी-Δ बी; γबी =बी+Δबी
यदि शून्य विश्वास अंतराल की सीमाओं के भीतर आता है, अर्थात यदि निचली सीमा नकारात्मक है और ऊपरी सीमा सकारात्मक है, तो अनुमानित पैरामीटर शून्य माना जाता है, क्योंकि यह एक साथ सकारात्मक और नकारात्मक दोनों मूल्यों को नहीं ले सकता है।
पूर्वानुमान मान y p को समाश्रयण समीकरण y x =a+b·x में संगत (पूर्वानुमान) मान x p को प्रतिस्थापित करके निर्धारित किया जाता है। पूर्वानुमान m y x की औसत मानक त्रुटि की गणना की जाती है:
,
कहाँ पे
और पूर्वानुमान का विश्वास अंतराल निर्मित होता है:
y x =y p Δ y p ; y x min=y p -Δ y p ; y x अधिकतम=y p +Δ y p
जहाँ y x =t तालिका ·m y x ।

समाधान उदाहरण

टास्क नंबर 1. यूराल क्षेत्र के सात क्षेत्रों के लिए 199X के लिए, दो संकेतों के मूल्य ज्ञात हैं।
तालिका नंबर एक।

आवश्यक: 1. x पर y की निर्भरता को चिह्नित करने के लिए, निम्नलिखित कार्यों के मापदंडों की गणना करें:
ए) रैखिक;
बी) शक्ति कानून (पहले दोनों भागों के लघुगणक को लेकर चर के रैखिककरण की प्रक्रिया को निष्पादित करना आवश्यक है);
ग) प्रदर्शनकारी;
d) समबाहु अतिपरवलय (आपको यह भी पता लगाना होगा कि इस मॉडल को पूर्व-रैखिक कैसे बनाया जाए)।
2. औसत सन्निकटन त्रुटि ए और फिशर के एफ-परीक्षण के माध्यम से प्रत्येक मॉडल का मूल्यांकन करें।

समाधान (विकल्प # 1)

रैखिक प्रतिगमन y=a+b·x के पैरामीटर a और b की गणना करने के लिए (कैलकुलेटर का उपयोग करके गणना की जा सकती है)।
के संबंध में सामान्य समीकरणों की प्रणाली को हल करें और बी:
प्रारंभिक डेटा के आधार पर, हम y, ∑x, y x, ∑x², y² की गणना करते हैं:
आप एक्स वाईएक्स x2 y2 वाई एक्सवाई-वाई एक्स
मैं68,8 45,1 3102,88 2034,01 4733,44 61,3 7,5 10,9
2 61,2 59,0 3610,80 3481,00 3745,44 56,5 4,7 7,7
3 59,9 57,2 3426,28 3271,84 3588,01 57,1 2,8 4,7
4 56,7 61,8 3504,06 3819,24 3214,89 55,5 1,2 2,1
5 55,0 58,8 3234,00 3457,44 3025,00 56,5 -1,5 2,7
6 54,3 47,2 2562,96 2227,84 2948,49 60,5 -6,2 11,4
7 49,3 55,2 2721,36 3047,04 2430,49 57,8 -8,5 17,2
कुल405,2 384,3 22162,34 21338,41 23685,76 405,2 0,0 56,7
बुध मूल्य (कुल/एन)57,89
आप
54,90
एक्स
3166,05
एक्स वाई
3048,34
3383,68
आप
एक्सएक्स8,1
एस 5,74 5,86 एक्सएक्सएक्सएक्सएक्सएक्स
एस 232,92 34,34 एक्सएक्सएक्सएक्सएक्सएक्स


a=y -b x = 57.89+0.35 54.9 ≈ 76.88

प्रतिगमन समीकरण: वाई = 76,88 - 0,35एक्स।औसत दैनिक वेतन में 1 रगड़ की वृद्धि के साथ। खाद्य उत्पादों की खरीद पर खर्च का हिस्सा औसतन 0.35% अंक कम हो जाता है।
जोड़ी सहसंबंध के रैखिक गुणांक की गणना करें:

संचार मध्यम, उल्टा है।
आइए निर्धारण का गुणांक निर्धारित करें: r² xy =(-0.35)=0.127
परिणाम में 12.7% भिन्नता को x कारक में भिन्नता द्वारा समझाया गया है। वास्तविक मूल्यों को प्रतिगमन समीकरण में प्रतिस्थापित करना एक्स, हम y x के सैद्धांतिक (गणना) मान निर्धारित करते हैं। आइए हम औसत सन्निकटन त्रुटि A का मान ज्ञात करें:

औसतन, परिकलित मान वास्तविक मान से 8.1% विचलित होते हैं।
आइए एफ-मानदंड की गणना करें:

प्राप्त मूल्य प्रकट निर्भरता की यादृच्छिक प्रकृति और समीकरण के मापदंडों के सांख्यिकीय महत्व और कनेक्शन की निकटता के संकेतक के बारे में परिकल्पना एच 0 को स्वीकार करने की आवश्यकता को इंगित करता है।
1बी.शक्ति मॉडल y=a x b का निर्माण चरों के रैखिककरण की प्रक्रिया से पहले किया जाता है। उदाहरण में, समीकरण के दोनों पक्षों का लघुगणक लेकर रैखिककरण किया जाता है:
एलजी वाई = एलजी ए + बी एलजी एक्स
वाई=सी+बी वाई
जहां वाई = एलजी (वाई), एक्स = एलजी (एक्स), सी = एलजी (ए)।

गणना के लिए, हम तालिका में डेटा का उपयोग करते हैं। 1.3.
तालिका 1.3

यूएक्स वाईएक्स Y2 x2 वाई एक्सवाई-वाई एक्स(वाई-वाईएक्स)²
1 1,8376 1,6542 3,0398 3,3768 2,7364 61,0 7,8 60,8 11,3
2 1,7868 1,7709 3,1642 3,1927 3,1361 56,3 4,9 24,0 8,0
3 1,7774 1,7574 3,1236 3,1592 3,0885 56,8 3,1 9,6 5,2
4 1,7536 1,7910 3,1407 3,0751 3,2077 55,5 1,2 1,4 2,1
5 1,7404 1,7694 3,0795 3,0290 3,1308 56,3 -1,3 1,7 2,4
6 1,7348 1,6739 2,9039 3,0095 2,8019 60,2 -5,9 34,8 10,9
7 1,6928 1,7419 2,9487 2,8656 3,0342 57,4 -8,1 65,6 16,4
कुल12,3234 12,1587 21,4003 21,7078 21,1355 403,5 1,7 197,9 56,3
अर्थ1,7605 1,7370 3,0572 3,1011 3,0194 एक्सएक्स28,27 8,0
σ 0,0425 0,0484 एक्सएक्सएक्सएक्सएक्सएक्सएक्स
20,0018 0,0023 एक्सएक्सएक्सएक्सएक्सएक्सएक्स

सी और बी की गणना करें:

सी = वाई-बी एक्स = 1.7605+0.298 1.7370 = 2.278126
हमें एक रैखिक समीकरण मिलता है: Y=2.278-0.298 X
इसे प्रबल करने के बाद, हम प्राप्त करते हैं: y=10 2.278 x -0.298
इस समीकरण में वास्तविक मान रखने पर एक्स,हम परिणाम के सैद्धांतिक मूल्य प्राप्त करते हैं। उनके आधार पर, हम संकेतकों की गणना करते हैं: कनेक्शन की जकड़न - सहसंबंध सूचकांक p xy और औसत सन्निकटन त्रुटि A ।

पावर मॉडल की विशेषताओं से संकेत मिलता है कि यह रैखिक फ़ंक्शन की तुलना में कुछ हद तक संबंध का वर्णन करता है।

1v. घातीय वक्र y \u003d a b x के समीकरण का निर्माण समीकरण के दोनों भागों के लघुगणक लेते समय चर को रैखिक करने की प्रक्रिया से पहले होता है:
एलजी वाई = एलजी ए + एक्स एलजी बी
वाई = सी + बी एक्स
गणना के लिए, हम तालिका डेटा का उपयोग करते हैं।

यूएक्स Yx Y2 x2वाई एक्सवाई-वाई एक्स(वाई-वाईएक्स)²
1 1,8376 45,1 82,8758 3,3768 2034,01 60,7 8,1 65,61 11,8
2 1,7868 59,0 105,4212 3,1927 3481,00 56,4 4,8 23,04 7,8
3 1,7774 57,2 101,6673 3,1592 3271,84 56,9 3,0 9,00 5,0
4 1,7536 61,8 108,3725 3,0751 3819,24 55,5 1,2 1,44 2,1
5 1,7404 58,8 102,3355 3,0290 3457,44 56,4 -1,4 1,96 2,5
6 1,7348 47,2 81,8826 3,0095 2227,84 60,0 -5,7 32,49 10,5
7 1,6928 55,2 93,4426 2,8656 3047,04 57,5 -8,2 67,24 16,6
कुल12,3234 384,3 675,9974 21,7078 21338,41 403,4 -1,8 200,78 56,3
बुध जेडएन1,7605 54,9 96,5711 3,1011 3048,34 एक्सएक्स28,68 8,0
σ 0,0425 5,86 एक्सएक्सएक्सएक्सएक्सएक्सएक्स
20,0018 34,339 एक्सएक्सएक्सएक्सएक्सएक्सएक्स

प्रतिगमन पैरामीटर ए और . के मान परकुल राषि का जोड़:

ए = वाई-बी एक्स = 1.7605+0.0023 54.9 = 1.887
एक रैखिक समीकरण प्राप्त होता है: Y=1.887-0.0023x। हम परिणामी समीकरण को प्रबल करते हैं और इसे सामान्य रूप में लिखते हैं:
वाई एक्स =10 1.887 10 -0.0023x = 77.1 0.9947 x
हम सहसंबंध सूचकांक p xy के माध्यम से संबंधों की जकड़न का अनुमान लगाते हैं:

3588,01 56,9 3,0 9,00 5,0 4 56,7 0,0162 0,9175 0,000262 3214,89 55,5 1,2 1,44 2,1 5 55 0,0170 0,9354 0,000289 3025,00 56,4 -1,4 1,96 2,5 6 54,3 0,0212 1,1504 0,000449 2948,49 60,8 -6,5 42,25 12,0 7 49,3 0,0181 0,8931 0,000328 2430,49 57,5 -8,2 67,24 16,6 कुल405,2 0,1291 7,5064 0,002413 23685,76 405,2 0,0 194,90 56,5 अर्थ57,9 0,0184 1,0723 0,000345 3383,68 एक्सएक्स27,84 8,1 σ 5,74 0,002145 एक्सएक्सएक्सएक्सएक्सएक्सएक्स 232,9476 0,000005 एक्सएक्स

प्रतिगमन विश्लेषण एक सांख्यिकीय अनुसंधान पद्धति है जो आपको एक या अधिक स्वतंत्र चर पर एक पैरामीटर की निर्भरता दिखाने की अनुमति देती है। प्री-कंप्यूटर युग में, इसका उपयोग काफी कठिन था, खासकर जब यह बड़ी मात्रा में डेटा की बात आती थी। आज, एक्सेल में रिग्रेशन बनाने का तरीका जानने के बाद, आप कुछ ही मिनटों में जटिल सांख्यिकीय समस्याओं को हल कर सकते हैं। अर्थशास्त्र के क्षेत्र से विशिष्ट उदाहरण नीचे दिए गए हैं।

प्रतिगमन के प्रकार

इस अवधारणा को ही 1886 में गणित में पेश किया गया था। प्रतिगमन होता है:

  • रैखिक;
  • परवलयिक;
  • शक्ति;
  • घातीय;
  • अतिपरवलिक;
  • प्रदर्शनकारी;
  • लघुगणक

उदाहरण 1

6 औद्योगिक उद्यमों में औसत वेतन पर सेवानिवृत्त टीम के सदस्यों की संख्या की निर्भरता निर्धारित करने की समस्या पर विचार करें।

काम। छह उद्यमों में, हमने औसत मासिक वेतन और कर्मचारियों की संख्या का विश्लेषण किया, जो अपनी मर्जी से चले गए। सारणीबद्ध रूप में हमारे पास है:

छोड़ने वालों की संख्या

वेतन

30000 रूबल

35000 रूबल

40000 रूबल

45000 रूबल

50000 रूबल

55000 रूबल

60000 रूबल

6 उद्यमों में औसत वेतन पर सेवानिवृत्त श्रमिकों की संख्या की निर्भरता निर्धारित करने की समस्या के लिए, प्रतिगमन मॉडल में समीकरण Y = a 0 + a 1 x 1 +…+a k x k का रूप होता है, जहां x i प्रभावित करने वाले चर हैं , a i प्रतिगमन गुणांक हैं, a k कारकों की संख्या है।

इस कार्य के लिए, Y छोड़ने वाले कर्मचारियों का संकेतक है, और प्रभावित करने वाला कारक वेतन है, जिसे हम X से दर्शाते हैं।

स्प्रेडशीट "एक्सेल" की क्षमताओं का उपयोग करना

एक्सेल में रिग्रेशन विश्लेषण उपलब्ध सारणीबद्ध डेटा में अंतर्निहित कार्यों के अनुप्रयोग से पहले होना चाहिए। हालांकि, इन उद्देश्यों के लिए, बहुत उपयोगी ऐड-इन "विश्लेषण टूलकिट" का उपयोग करना बेहतर है। इसे सक्रिय करने के लिए आपको चाहिए:

  • "फ़ाइल" टैब से, "विकल्प" अनुभाग पर जाएं;
  • खुलने वाली विंडो में, "ऐड-ऑन" लाइन चुनें;
  • "प्रबंधन" लाइन के दाईं ओर नीचे स्थित "गो" बटन पर क्लिक करें;
  • "विश्लेषण पैकेज" नाम के बगल में स्थित बॉक्स को चेक करें और "ओके" पर क्लिक करके अपने कार्यों की पुष्टि करें।

यदि सब कुछ सही ढंग से किया जाता है, तो वांछित बटन एक्सेल वर्कशीट के ऊपर स्थित डेटा टैब के दाईं ओर दिखाई देगा।

एक्सेल में

अब जब हमारे पास अर्थमितीय गणना करने के लिए सभी आवश्यक आभासी उपकरण हैं, तो हम अपनी समस्या को हल करना शुरू कर सकते हैं। इसके लिए:

  • "डेटा विश्लेषण" बटन पर क्लिक करें;
  • खुलने वाली विंडो में, "रिग्रेशन" बटन पर क्लिक करें;
  • दिखाई देने वाले टैब में, Y (छोड़ने वाले कर्मचारियों की संख्या) और X (उनका वेतन) के लिए मानों की श्रेणी दर्ज करें;
  • हम "ओके" बटन दबाकर अपने कार्यों की पुष्टि करते हैं।

परिणामस्वरूप, प्रोग्राम स्वचालित रूप से प्रतिगमन विश्लेषण डेटा के साथ स्प्रेडशीट की एक नई शीट को पॉप्युलेट करेगा। टिप्पणी! एक्सेल में इस उद्देश्य के लिए आपके द्वारा पसंद किए जाने वाले स्थान को मैन्युअल रूप से सेट करने की क्षमता है। उदाहरण के लिए, यह वही शीट हो सकती है जहां वाई और एक्स मान हैं, या यहां तक ​​​​कि विशेष रूप से ऐसे डेटा को स्टोर करने के लिए डिज़ाइन की गई एक नई कार्यपुस्तिका भी हो सकती है।

आर-स्क्वायर के लिए प्रतिगमन परिणामों का विश्लेषण

एक्सेल में, माना उदाहरण के डेटा के प्रसंस्करण के दौरान प्राप्त डेटा इस तरह दिखता है:

सबसे पहले आपको आर-स्क्वायर की वैल्यू पर ध्यान देना चाहिए। यह निर्धारण का गुणांक है। इस उदाहरण में, आर-स्क्वायर = 0.755 (75.5%), यानी, मॉडल के परिकलित पैरामीटर 75.5% द्वारा माने गए मापदंडों के बीच संबंध की व्याख्या करते हैं। निर्धारण गुणांक का मान जितना अधिक होगा, किसी विशेष कार्य के लिए चुना गया मॉडल उतना ही अधिक लागू होगा। ऐसा माना जाता है कि यह 0.8 से ऊपर के आर-वर्ग मान के साथ वास्तविक स्थिति का सही वर्णन करता है। अगर R-वर्ग<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

अनुपात विश्लेषण

संख्या 64.1428 दर्शाती है कि Y का मान क्या होगा यदि हम जिस मॉडल पर विचार कर रहे हैं उसमें सभी चर xi शून्य पर सेट हैं। दूसरे शब्दों में, यह तर्क दिया जा सकता है कि विश्लेषण किए गए पैरामीटर का मूल्य अन्य कारकों से भी प्रभावित होता है जो किसी विशेष मॉडल में वर्णित नहीं हैं।

सेल B18 में स्थित अगला गुणांक -0.16285, Y पर चर X के प्रभाव के भार को दर्शाता है। इसका मतलब है कि विचाराधीन मॉडल के भीतर कर्मचारियों का औसत मासिक वेतन -0.16285 के वजन के साथ छोड़ने वालों की संख्या को प्रभावित करता है, अर्थात। इसके प्रभाव की डिग्री बिल्कुल छोटी है। "-" चिह्न इंगित करता है कि गुणांक का ऋणात्मक मान है। यह स्पष्ट है, क्योंकि हर कोई जानता है कि उद्यम में वेतन जितना अधिक होता है, उतने ही कम लोग रोजगार अनुबंध को समाप्त करने या छोड़ने की इच्छा व्यक्त करते हैं।

बहु - प्रतिगमन

यह शब्द फॉर्म के कई स्वतंत्र चर के साथ एक कनेक्शन समीकरण को संदर्भित करता है:

y \u003d f (x 1 + x 2 + ... x m) + , जहां y प्रभावी विशेषता (आश्रित चर) है, और x 1 , x 2 , ... x m कारक कारक (स्वतंत्र चर) हैं।

पैरामीटर अनुमान

एकाधिक प्रतिगमन (MR) के लिए इसे कम से कम वर्गों (OLS) की विधि का उपयोग करके किया जाता है। Y = a + b 1 x 1 +…+b m x m + के रूप के रैखिक समीकरणों के लिए, हम सामान्य समीकरणों की एक प्रणाली का निर्माण करते हैं (नीचे देखें)

विधि के सिद्धांत को समझने के लिए, दो-कारक मामले पर विचार करें। तब हमारे पास सूत्र द्वारा वर्णित स्थिति होती है

यहाँ से हमें मिलता है:

जहां सूचकांक में परिलक्षित संबंधित विशेषता का प्रसरण है।

एलएसएम एक मानक पैमाने पर एमपी समीकरण पर लागू होता है। इस मामले में, हमें समीकरण मिलता है:

जहाँ t y , t x 1,… t xm मानकीकृत चर हैं जिनके लिए माध्य मान 0 हैं; β मैं मानकीकृत प्रतिगमन गुणांक हैं, और मानक विचलन 1 है।

कृपया ध्यान दें कि इस मामले में सभी β i को सामान्यीकृत और केंद्रीकृत के रूप में सेट किया गया है, इसलिए एक दूसरे के साथ उनकी तुलना को सही और स्वीकार्य माना जाता है। इसके अलावा, यह βi के सबसे छोटे मूल्यों वाले कारकों को छोड़कर, कारकों को फ़िल्टर करने के लिए प्रथागत है।

रैखिक प्रतिगमन समीकरण का उपयोग करने में समस्या

मान लीजिए कि पिछले 8 महीनों के दौरान किसी विशेष उत्पाद एन की कीमत की गतिशीलता की एक तालिका है। 1850 रूबल / टी की कीमत पर इसके बैच को खरीदने की सलाह पर निर्णय लेना आवश्यक है।

माह संख्या

महीने का नाम

आइटम नंबर की कीमत

1750 रूबल प्रति टन

1755 रूबल प्रति टन

1767 रूबल प्रति टन

1760 रूबल प्रति टन

1770 रूबल प्रति टन

1790 रूबल प्रति टन

1810 रूबल प्रति टन

1840 रूबल प्रति टन

एक्सेल स्प्रेडशीट में इस समस्या को हल करने के लिए, आपको उपरोक्त उदाहरण से पहले से ज्ञात डेटा विश्लेषण टूल का उपयोग करने की आवश्यकता है। अगला, "रिग्रेशन" अनुभाग चुनें और पैरामीटर सेट करें। यह याद रखना चाहिए कि "इनपुट वाई अंतराल" फ़ील्ड में, आश्रित चर के लिए मूल्यों की एक श्रृंखला (इस मामले में, वर्ष के विशिष्ट महीनों में उत्पाद की कीमत) दर्ज की जानी चाहिए, और "इनपुट" में X अंतराल" - स्वतंत्र चर (माह संख्या) के लिए। "ओके" पर क्लिक करके कार्रवाई की पुष्टि करें। एक नई शीट पर (यदि ऐसा संकेत दिया गया था), हमें प्रतिगमन के लिए डेटा मिलता है।

उनके आधार पर, हम y=ax+b फॉर्म का एक रैखिक समीकरण बनाते हैं, जहां पैरामीटर ए और बी महीने की संख्या के नाम के साथ पंक्ति के गुणांक हैं और गुणांक और "वाई-चौराहे" पंक्ति से प्रतिगमन विश्लेषण के परिणामों के साथ शीट। इस प्रकार, समस्या 3 के लिए रैखिक समाश्रयण समीकरण (LE) को इस प्रकार लिखा जाता है:

उत्पाद की कीमत एन = 11.714* माह संख्या + 1727.54।

या बीजीय संकेतन में

वाई = 11.714 एक्स + 1727.54

परिणामों का विश्लेषण

यह तय करने के लिए कि परिणामी रैखिक प्रतिगमन समीकरण पर्याप्त है, एकाधिक सहसंबंध गुणांक (एमसीसी) और निर्धारण गुणांक का उपयोग किया जाता है, साथ ही फिशर का परीक्षण और छात्र का परीक्षण। प्रतिगमन परिणामों के साथ एक्सेल तालिका में, वे क्रमशः एकाधिक आर, आर-वर्ग, एफ-सांख्यिकी और टी-सांख्यिकी के नामों के तहत दिखाई देते हैं।

केएमसी आर स्वतंत्र और आश्रित चर के बीच संभाव्य संबंध की मजबूती का आकलन करना संभव बनाता है। इसका उच्च मूल्य चर "महीने की संख्या" और "माल की कीमत एन प्रति 1 टन रूबल में" के बीच काफी मजबूत संबंध को इंगित करता है। हालाँकि, इस रिश्ते की प्रकृति अज्ञात बनी हुई है।

निर्धारण गुणांक का वर्ग R 2 (RI) कुल प्रकीर्णन के हिस्से की एक संख्यात्मक विशेषता है और प्रयोगात्मक डेटा के किस भाग के बिखराव को दर्शाता है, अर्थात। आश्रित चर के मान रैखिक प्रतिगमन समीकरण से मेल खाते हैं। विचाराधीन समस्या में, यह मान 84.8% के बराबर है, अर्थात्, प्राप्त एसडी द्वारा सांख्यिकीय डेटा को उच्च स्तर की सटीकता के साथ वर्णित किया गया है।

एफ-सांख्यिकी, जिसे फिशर का परीक्षण भी कहा जाता है, का उपयोग एक रैखिक संबंध के महत्व का आकलन करने के लिए किया जाता है, इसके अस्तित्व की परिकल्पना का खंडन या पुष्टि करता है।

(छात्र की कसौटी) एक रैखिक संबंध के अज्ञात या मुक्त पद के साथ गुणांक के महत्व का मूल्यांकन करने में मदद करता है। यदि t-मानदंड का मान> t करोड़, तो रैखिक समीकरण के मुक्त पद के महत्व की परिकल्पना को खारिज कर दिया जाता है।

मुक्त सदस्य के लिए विचाराधीन समस्या में, एक्सेल टूल्स का उपयोग करके, यह प्राप्त किया गया था कि t = 169.20903, और p = 2.89E-12, यानी, हमारे पास एक शून्य संभावना है कि स्वतंत्र सदस्य के महत्व के बारे में सही परिकल्पना होगी खारिज किया जाए। अज्ञात t=5.79405, और p=0.001158 पर गुणांक के लिए। दूसरे शब्दों में, अज्ञात के लिए गुणांक के महत्व के बारे में सही परिकल्पना के खारिज होने की संभावना 0.12% है।

इस प्रकार, यह तर्क दिया जा सकता है कि परिणामी रैखिक प्रतिगमन समीकरण पर्याप्त है।

शेयरों का एक ब्लॉक खरीदने की समीचीनता की समस्या

एक्सेल में मल्टीपल रिग्रेशन एक ही डेटा एनालिसिस टूल का उपयोग करके किया जाता है। एक विशिष्ट लागू समस्या पर विचार करें।

NNN के प्रबंधन को MMM SA में 20% हिस्सेदारी खरीदने की उपयुक्तता पर निर्णय लेना चाहिए। पैकेज की लागत (जेवी) 70 मिलियन अमेरिकी डॉलर है। एनएनएन विशेषज्ञों ने समान लेनदेन पर डेटा एकत्र किया। लाखों अमेरिकी डॉलर में व्यक्त किए गए ऐसे मापदंडों के अनुसार शेयरों के ब्लॉक के मूल्य का मूल्यांकन करने का निर्णय लिया गया, जैसे:

  • देय खाते (वीके);
  • वार्षिक कारोबार (वीओ);
  • प्राप्य खाते (वीडी);
  • अचल संपत्तियों की लागत (एसओएफ)।

इसके अलावा, हजारों अमेरिकी डॉलर में उद्यम (V3 P) के पैरामीटर पेरोल बकाया का उपयोग किया जाता है।

एक्सेल स्प्रेडशीट का उपयोग कर समाधान

सबसे पहले, आपको प्रारंभिक डेटा की एक तालिका बनाने की आवश्यकता है। यह इस तरह दिख रहा है:

  • "डेटा विश्लेषण" विंडो को कॉल करें;
  • "प्रतिगमन" अनुभाग का चयन करें;
  • बॉक्स में "इनपुट अंतराल वाई" कॉलम जी से आश्रित चर के मूल्यों की श्रेणी दर्ज करें;
  • "इनपुट अंतराल X" विंडो के दाईं ओर लाल तीर वाले आइकन पर क्लिक करें और शीट पर कॉलम B, C, D, F से सभी मानों की श्रेणी चुनें।

"नई वर्कशीट" चुनें और "ओके" पर क्लिक करें।

दी गई समस्या के लिए प्रतिगमन विश्लेषण प्राप्त करें।

परिणामों और निष्कर्षों की जांच

एक्सेल स्प्रेडशीट शीट पर ऊपर प्रस्तुत गोल डेटा से "हम एकत्र करते हैं", प्रतिगमन समीकरण:

एसपी \u003d 0.103 * एसओएफ + 0.541 * वीओ - 0.031 * वीके + 0.405 * वीडी + 0.691 * वीजेडपी - 265.844।

अधिक परिचित गणितीय रूप में, इसे इस प्रकार लिखा जा सकता है:

वाई = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

JSC "MMM" के लिए डेटा तालिका में प्रस्तुत किया गया है:

उन्हें प्रतिगमन समीकरण में प्रतिस्थापित करने पर, उन्हें 64.72 मिलियन अमेरिकी डॉलर का आंकड़ा मिलता है। इसका मतलब है कि जेएससी एमएमएम के शेयर नहीं खरीदे जाने चाहिए, क्योंकि उनका मूल्य 70 मिलियन अमेरिकी डॉलर अधिक है।

जैसा कि आप देख सकते हैं, एक्सेल स्प्रेडशीट और रिग्रेशन समीकरण के उपयोग ने एक बहुत ही विशिष्ट लेनदेन की व्यवहार्यता के बारे में एक सूचित निर्णय लेना संभव बना दिया है।

अब आप जानते हैं कि प्रतिगमन क्या है। ऊपर चर्चा किए गए एक्सेल में उदाहरण आपको अर्थमिति के क्षेत्र से व्यावहारिक समस्याओं को हल करने में मदद करेंगे।