सहसंबंध क्षेत्र और सहसंबंध के प्रारंभिक विश्लेषण में उनका उपयोग।

सहसंबंध क्षेत्र सहसंबंध तालिका के दृश्य प्रतिनिधित्व के रूप में कार्य करता है। यह एक ऐसा ग्राफ है जहां एक्स मान एब्सिस्सा अक्ष पर प्लॉट किए जाते हैं, वाई मान कोऑर्डिनेट अक्ष के साथ प्लॉट किए जाते हैं, और एक्स और वाई के संयोजन डॉट्स द्वारा दिखाए जाते हैं। कनेक्शन की उपस्थिति का अनुमान लगाया जा सकता है बिन्दु।

ग्राफिक विधि का उपयोग करना।

इस पद्धति का उपयोग अध्ययन किए गए आर्थिक संकेतकों के बीच संचार के रूप की कल्पना करने के लिए किया जाता है। ऐसा करने के लिए, एक आयताकार समन्वय प्रणाली में एक ग्राफ बनाया गया है, परिणामी विशेषता Y के व्यक्तिगत मूल्यों को निर्देशांक अक्ष के साथ प्लॉट किया जाता है, और कारक विशेषता X के व्यक्तिगत मान एब्सिस्सा अक्ष के साथ प्लॉट किए जाते हैं।

प्रभावी और कारक विशेषताओं के बिंदुओं के समूह को सहसंबंध क्षेत्र कहा जाता है।

सहसंबंध क्षेत्र के आधार पर, कोई (सामान्य जनसंख्या के लिए) परिकल्पना कर सकता है कि एक्स और वाई के सभी संभावित मूल्यों के बीच संबंध रैखिक है।

रैखिक समाश्रयण समीकरण y = bx + a + . है

यहाँ ε एक यादृच्छिक त्रुटि है (विचलन, गड़बड़ी)।

यादृच्छिक त्रुटि के अस्तित्व के कारण:

1. प्रतिगमन मॉडल में महत्वपूर्ण व्याख्यात्मक चर शामिल नहीं हैं;

2. चर का एकत्रीकरण। उदाहरण के लिए, कुल उपभोग फलन व्यक्तियों के व्यक्तिगत व्यय निर्णयों की समग्रता की सामान्य अभिव्यक्ति का एक प्रयास है। यह अलग-अलग मापदंडों वाले व्यक्तिगत संबंधों का केवल एक अनुमान है।

3. मॉडल संरचना का गलत विवरण;

4. गलत कार्यात्मक विनिर्देश;

21. सहसंबंध और प्रतिगमन विश्लेषण।

एक सामान्य अवधारणा के रूप में सहसंबंध-प्रतिगमन विश्लेषण में कनेक्शन की मजबूती और दिशा को मापना और कनेक्शन (प्रतिगमन विश्लेषण) की विश्लेषणात्मक अभिव्यक्ति (रूप) स्थापित करना शामिल है।

समाश्रयण विश्लेषण का उद्देश्य गुणनखंडों (x1, x2, ..., xk) पर प्रभावी विशेषता (Y) के सशर्त औसत मूल्य की कार्यात्मक निर्भरता का मूल्यांकन करना है।

प्रतिगमन समीकरण, या सामाजिक-आर्थिक घटना के संबंध का एक सांख्यिकीय मॉडल, फ़ंक्शन द्वारा व्यक्त किया जाता है:

वाईएक्स = एफ (एक्स 1, एक्स 2, …, एक्सएन),

जहां "एन" मॉडल में शामिल कारकों की संख्या है;

शी - परिणाम को प्रभावित करने वाले कारक Y।

सहसंबंध और प्रतिगमन विश्लेषण के चरण:

प्रारंभिक (एक प्राथमिकता) विश्लेषण। यदि पर्याप्त रूप से योग्य शोधकर्ता द्वारा किया जाए तो यह अच्छे परिणाम देता है।

सूचना का संग्रह और उसका प्राथमिक प्रसंस्करण।

एक मॉडल बनाना (प्रतिगमन समीकरण)। एक नियम के रूप में, यह प्रक्रिया मानक कार्यक्रमों का उपयोग करके पीसी पर की जाती है।

फ़ीचर संबंधों की जकड़न का मूल्यांकन, प्रतिगमन समीकरण का मूल्यांकन और मॉडल का विश्लेषण।

प्रतिगमन समीकरण के अनुसार विश्लेषित प्रणाली के विकास का पूर्वानुमान लगाना।

पहले चरण में, अध्ययन का कार्य तैयार किया जाता है, संकेतकों को मापने या जानकारी एकत्र करने की पद्धति निर्धारित की जाती है, कारकों की संख्या निर्धारित की जाती है, डुप्लिकेट कारकों को बाहर रखा जाता है या एक कठोर नियतात्मक प्रणाली में जोड़ा जाता है।

दूसरे चरण में, इकाइयों की मात्रा का विश्लेषण किया जाता है: जनसंख्या इकाइयों और टिप्पणियों की संख्या (एन>> 50) के संदर्भ में पर्याप्त रूप से बड़ी होनी चाहिए, कारकों की संख्या "एन" को टिप्पणियों की संख्या के अनुरूप होना चाहिए "एन" " डेटा मात्रात्मक और गुणात्मक रूप से सजातीय होना चाहिए।

तीसरे चरण में, कनेक्शन के रूप और विश्लेषणात्मक कार्य के प्रकार (पैराबोला, हाइपरबोला, सीधी रेखा) निर्धारित किए जाते हैं और इसके पैरामीटर पाए जाते हैं।

चौथे चरण में, फिशर या छात्र विश्वसनीयता मानदंड का उपयोग करके सहसंबंध संबंध और प्रतिगमन समीकरण की सभी विशेषताओं की विश्वसनीयता का मूल्यांकन किया जाता है, और मापदंडों का एक आर्थिक और तकनीकी विश्लेषण किया जाता है।

पांचवें चरण में, संभावित परिणाम मूल्यों का पूर्वानुमान मॉडल में शामिल कारक विशेषताओं के सर्वोत्तम मूल्यों के अनुसार किया जाता है। यहां, कारकों और परिणाम के सर्वोत्तम और सबसे खराब मूल्यों का चयन किया जाता है।

22. प्रतिगमन समीकरणों के प्रकार।

सांख्यिकी में आर्थिक चरों के बीच संबंध के मात्रात्मक विवरण के लिए प्रतिगमन और सहसंबंध विधियों का उपयोग किया जाता है।

प्रतिगमन एक मान है जो एक यादृच्छिक चर y के औसत मान की निर्भरता को यादृच्छिक चर x के मानों पर व्यक्त करता है।

प्रतिगमन समीकरण एक विशेषता के औसत मूल्य को दूसरे के कार्य के रूप में व्यक्त करता है।

प्रतिगमन फ़ंक्शन y \u003d l "के रूप का एक मॉडल है, जहां y आश्रित चर (परिणामी संकेत) है; x एक स्वतंत्र, या व्याख्यात्मक, चर (संकेत-कारक) है।

प्रतिगमन रेखा फ़ंक्शन y \u003d f (x) का एक ग्राफ है।

x और y के बीच 2 प्रकार के संबंध:

1) यह ज्ञात नहीं हो सकता है कि दोनों में से कौन सा चर स्वतंत्र है और कौन सा आश्रित है, चर समान हैं, यह एक सहसंबंध प्रकार का संबंध है;

2) यदि x और y बराबर नहीं हैं और उनमें से एक को व्याख्यात्मक (स्वतंत्र) चर के रूप में माना जाता है, और दूसरे को आश्रित के रूप में माना जाता है, तो यह एक प्रतिगमन-प्रकार का संबंध है।

प्रतिगमन के प्रकार:

1) अतिशयोक्तिपूर्ण - एक समबाहु अतिपरवलय का प्रतिगमन: y \u003d a + b / x + E;

2) रैखिक - इसके मापदंडों की स्पष्ट आर्थिक व्याख्या के रूप में आंकड़ों में प्रयुक्त प्रतिगमन: y \u003d a + b * x + E;

3) लघुगणकीय रूप से रैखिक - रूप का प्रतिगमन: y \u003d में a + b * में x + में E

4) बहु - चर y और x1, x2 ... xm के बीच प्रतिगमन, यानी। फॉर्म का मॉडल: y \u003d f (x1, x2 ... xm) + E, जहां y एक आश्रित चर (प्रभावी संकेत) है, x1, х2 ...xm - स्वतंत्र, व्याख्यात्मक चर (संकेत-कारक), Е - मॉडल में बेहिसाब कारकों के प्रभाव सहित गड़बड़ी या स्टोकेस्टिक चर;

5) गैर-रेखीय - प्रतिगमन, विश्लेषण में शामिल व्याख्यात्मक चर के संबंध में गैर-रेखीय, लेकिन अनुमानित मापदंडों के संबंध में रैखिक; या प्रतिगमन जो अनुमानित मापदंडों में गैर-रैखिक है।

6) उलटा - प्रतिगमन एक रेखीय रूप में कम हो गया, प्रपत्र के मानक अनुप्रयोग पैकेजों में लागू किया गया: y \u003d 1 / a + b * x + E;

    युग्मित - दो चर y और x के बीच प्रतिगमन, अर्थात, प्रपत्र का एक मॉडल: y \u003d f (x) + E, जहां y एक आश्रित चर (प्रभावी विशेषता) है, x एक स्वतंत्र, व्याख्यात्मक चर (सुविधा - कारक) है ), ई - गड़बड़ी, या एक स्टोकेस्टिक चर जिसमें मॉडल में कारकों के लिए बेहिसाब का प्रभाव शामिल है।

    गतिकी की श्रृंखला और उनके प्रकार

एक समय श्रृंखला में हमेशा 2 तत्व होते हैं: 1) समय में एक बिंदु या एक समय अवधि जिसके संबंध में सांख्यिकीय डेटा दिया जाता है, 2) एक सांख्यिकीय संकेतक, जिसे समय श्रृंखला का स्तर कहा जाता है।

समय संकेतक की सामग्री के आधार पर, गतिकी की श्रृंखला क्षणिक या अंतराल होती है

सांख्यिकीय संकेतक के प्रकार के आधार पर, गतिशील श्रृंखला को निरपेक्ष, सापेक्ष और औसत मूल्यों की श्रृंखला में विभाजित किया जाता है

निरपेक्ष शो सटीक मान

रिश्तेदार कुल जनसंख्या में संकेतक के अनुपात में परिवर्तन दिखाते हैं

औसत मूल्यों में संकेतक के समय में परिवर्तन के बारे में होता है, जो कि घटना का औसत स्तर है

    गतिकी की एक श्रृंखला के संकेतक। गतिकी की सीमा का मध्य स्तर।

संकेतक: 1) गतिशील श्रृंखला का औसत स्तर, 2) पूर्ण वृद्धि, श्रृंखला और बुनियादी, औसत पूर्ण वृद्धि, 3) वृद्धि और विकास दर, श्रृंखला और बुनियादी, औसत विकास दर और विकास, 4) fmcjk.nyst मान 1 % बढ़ोतरी

औसत गतिकी

गतिशीलता की एक श्रृंखला की सामान्यीकृत विशेषताएं, उनकी मदद से, विभिन्न वस्तुओं के संबंध में घटना के विकास की तीव्रता की तुलना करती हैं, उदाहरण के लिए, देशों, उद्योगों, उद्यमों द्वारा

इस समय औसत स्तर यी। औसत स्तर की गणना करने की विधि श्रृंखला के प्रकार (तात्कालिक / अंतराल) (बराबर / विभिन्न अंतरालों के साथ) पर निर्भर करती है। यदि समान समय अंतराल के साथ निरपेक्ष या औसत मूल्यों की गतिशीलता की एक अंतराल श्रृंखला दी जाती है, तो औसत स्तर की गणना के लिए औसत सरल की गणना के लिए सूत्र का उपयोग किया जाता है। यदि अंतराल श्रृंखला के समय अंतराल असमान हैं, तो औसत स्तर अंकगणितीय भारित औसत से ज्ञात होता है। Usr=smmUi*Ti/smmTi

25. पूर्ण विकास(डेल्टा और) गतिशील श्रृंखला के दो स्तरों के बीच का अंतर है, जो दर्शाता है कि श्रृंखला का यह स्तर तुलना आधार के रूप में लिए गए स्तर से कितना अधिक है। डेल्टा यू=यूआई-यू0

डेल्टा यू=यूआई-यूआई-1

पूर्ण त्वरण- दी गई अवधि के लिए पूर्ण वृद्धि और उसी अवधि की पिछली अवधि के लिए पूर्ण वृद्धि के बीच का अंतर: डेल्टा और एक बार = डेल्टा और - डेल्टा और -1 के साथ। निरपेक्ष त्वरण दर्शाता है कि संकेतक के परिवर्तन की दर कितनी बढ़ी है (घटी हुई)। त्वरण संकेतक का उपयोग श्रृंखला पूर्ण लाभ के लिए किया जाता है। एक नकारात्मक त्वरण मान वृद्धि में मंदी या श्रृंखला के स्तरों में गिरावट में तेजी को इंगित करता है।

    गतिकी की एक श्रृंखला के स्तरों में सापेक्ष परिवर्तन के संकेतक।

वृद्धि कारक (विकास दर)- यह दो तुलनात्मक स्तरों का अनुपात है, जो दर्शाता है कि यह स्तर कितनी बार आधार अवधि के स्तर से अधिक है। यह गतिकी की एक श्रृंखला के स्तरों में परिवर्तन की तीव्रता को दर्शाता है और दिखाता है कि आधार स्तर की तुलना में स्तर कितनी बार बढ़ा है, और कमी की स्थिति में, आधार स्तर का कौन सा भाग तुलनात्मक स्तर है।

ग्रोथ फैक्टर फॉर्मूला: जब एक कॉन्स्टेंट बेस की तुलना में: के मैं .=y मैं /y 0 , जब एक चर आधार के साथ तुलना की जाती है: के मैं .=y मैं /y मैं -1 .

विकास दरविकास दर है, जिसे प्रतिशत के रूप में व्यक्त किया जाता है:

टी आर = सेवा 100 %.

किसी भी समय श्रृंखला के लिए विकास दर अंतराल संकेतक हैं, अर्थात। समय की एक विशेष अवधि (अंतराल) की विशेषता।

वृद्धि दर- वृद्धि का सापेक्ष मूल्य, यानी पिछले या आधार स्तर पर पूर्ण वृद्धि का अनुपात। यह इस बात की विशेषता है कि दी गई अवधि का स्तर आधार स्तर से कितने प्रतिशत अधिक (या कम) है।

वृद्धि दर- तुलना के आधार के रूप में लिए गए स्तर पर पूर्ण वृद्धि का अनुपात:

टीपीआर \u003d यूआई-यू0 / यू0 * 100%

वृद्धि दर- विकास दर (प्रतिशत में) और 100 के बीच का अंतर,

आपको चाहिये होगा

  • - आश्रित और स्वतंत्र चर की वितरण श्रृंखला;
  • - कागज, पेंसिल;
  • - कंप्यूटर और स्प्रेडशीट सॉफ्टवेयर।

अनुदेश

दो चुनें जो आपको लगता है कि एक रिश्ता है, आमतौर पर लेते हैं, जो समय के साथ बदलते हैं। ध्यान दें कि चरों में से एक स्वतंत्र होना चाहिए, यह एक कारण के रूप में कार्य करेगा। इसके साथ दूसरा बदलना चाहिए - कमी, वृद्धि या बेतरतीब ढंग से बदलना।

प्रत्येक स्वतंत्र चर के लिए आश्रित चर के मान को मापें। परिणामों को एक तालिका में, दो पंक्तियों या दो स्तंभों में रिकॉर्ड करें। एक कनेक्शन का पता लगाने के लिए कम से कम 30 रीडिंग की आवश्यकता होती है, लेकिन अधिक सटीक परिणाम के लिए, कम से कम 100 अंक का ध्यान रखें।

निर्देशांक अक्ष पर आश्रित चर के मानों और भुज अक्ष पर स्वतंत्र चर की साजिश रचते हुए एक समन्वय विमान बनाएं। कुल्हाड़ियों पर हस्ताक्षर करें और प्रत्येक संकेतक के लिए माप की इकाइयों को इंगित करें।

ग्राफ पर सहसंबंध क्षेत्र के बिंदुओं को चिह्नित करें। x-अक्ष पर, स्वतंत्र चर का प्रथम मान ज्ञात कीजिए और y-अक्ष पर आश्रित चर का संगत मान ज्ञात कीजिए। इन अनुमानों के लंबवत बनाएं और पहला बिंदु खोजें। इसे चिह्नित करें, इसे एक नरम पेंसिल या पेन से गोल करें। इसी प्रकार अन्य सभी बिन्दुओं की रचना कीजिए।

अंक के परिणामी सेट को सहसंबंध कहा जाता है खेत. परिणामी ग्राफ का विश्लेषण करें, एक मजबूत या कमजोर कारण संबंध की उपस्थिति, या इसकी अनुपस्थिति के बारे में निष्कर्ष निकालें।

अनुसूची से यादृच्छिक विचलन पर ध्यान दें। यदि, सामान्य तौर पर, एक रैखिक या अन्य निर्भरता का पता लगाया जाता है, लेकिन पूरी "तस्वीर" एक या दो बिंदुओं से खराब हो जाती है जो कुल आबादी के किनारे पर हैं, तो वे यादृच्छिक त्रुटियां हो सकती हैं और ग्राफ की व्याख्या करते समय इसे ध्यान में नहीं रखा जाता है। .

यदि आपको किसी क्षेत्र का निर्माण और विश्लेषण करने की आवश्यकता है सहसम्बन्धबड़ी मात्रा में डेटा के लिए, एक्सेल जैसे स्प्रेडशीट प्रोग्राम का उपयोग करें, या विशेष सॉफ़्टवेयर ख़रीदें।

कई राशियों का संबंध, जिसके दौरान एक में परिवर्तन से शेष राशि में परिवर्तन होता है, सहसंबंध कहलाता है। यह सरल, एकाधिक या आंशिक हो सकता है। इस अवधारणा को न केवल गणित में, बल्कि जीव विज्ञान में भी स्वीकार किया जाता है।

शब्द सह - संबंधलैटिन सहसंबंध, संबंध से व्युत्पन्न। सभी घटनाएं, घटनाएं और वस्तुएं, साथ ही साथ उनकी विशेषता वाली मात्राएं परस्पर जुड़ी हुई हैं। सहसंबंध निर्भरता कार्यात्मक एक से भिन्न होती है जिसमें इस प्रकार की निर्भरता में, किसी को केवल औसतन, लगभग मापा जा सकता है। सहसंबंध निर्भरता मानती है कि एक चर मान केवल एक निश्चित डिग्री की संभावना के साथ एक स्वतंत्र मूल्य में परिवर्तन से मेल खाता है। निर्भरता की डिग्री को सहसंबंध गुणांक कहा जाता है। सहसंबंध की अवधारणा शरीर के अलग-अलग हिस्सों की संरचना और कार्यों का अनुपात है। अक्सर, अवधारणा सह - संबंधसांख्यिकी का प्रयोग करें। आंकड़ों में, यह सांख्यिकीय मात्राओं, श्रृंखलाओं और समूहों के बीच का संबंध है। सहसंबंध की उपस्थिति या अनुपस्थिति या उपस्थिति का निर्धारण करने के लिए, एक विशेष विधि का उपयोग किया जाता है। सहसंबंध विधि का उपयोग श्रृंखला में संख्याओं में होने वाले परिवर्तनों में प्रत्यक्ष या विपरीत को निर्धारित करने के लिए किया जाता है जिनकी तुलना की जा रही है। जब पाया जाता है, तो माप स्वयं या समांतरता की डिग्री। लेकिन इस तरह से आंतरिक कारण कारक नहीं पाए जाते हैं। एक विज्ञान के रूप में सांख्यिकी का मुख्य कार्य अन्य विज्ञानों के लिए ऐसी कारण निर्भरता की खोज करना है। रूप में, एक सहसंबंध रैखिक या गैर-रेखीय, सकारात्मक या नकारात्मक हो सकता है। जब एक चर के बढ़ने या घटने पर दूसरा भी बढ़ता या घटता है, तो संबंध रैखिक होता है। यदि, एक राशि को बदलते समय, दूसरी राशि में परिवर्तन की प्रकृति अरेखीय है, तो यह सह - संबंधगैर-रैखिक। सकारात्मक सह - संबंधतब माना जाता है जब एक मात्रा के स्तर में वृद्धि के साथ दूसरे के स्तर में वृद्धि होती है। उदाहरण के लिए, जब ध्वनि में वृद्धि उसके स्वर में वृद्धि की भावना के साथ होती है। एक सहसंबंध, जब एक चर के स्तर में वृद्धि दूसरे के स्तर में कमी के साथ होती है, को नकारात्मक कहा जाता है। समुदायों में, किसी व्यक्ति की चिंता का एक बढ़ा हुआ स्तर इस संभावना में कमी की ओर जाता है कि यह व्यक्ति साथियों के बीच एक प्रमुख स्थान पर कब्जा कर लेगा। जब चर के बीच कोई संबंध नहीं होता है, सह - संबंधशून्य कहा जाता है।

संबंधित वीडियो

स्रोत:

  • 2019 में अरेखीय सहसंबंध

सहसंबंध दो यादृच्छिक चर (अधिक बार - चर के दो समूह) की पारस्परिक निर्भरता है, जिसमें उनमें से एक में परिवर्तन से दूसरे में परिवर्तन होता है। सहसंबंध गुणांक दर्शाता है कि दूसरे मान में परिवर्तन की कितनी संभावना है जब पहले परिवर्तन के मान, अर्थात। निर्भरता की डिग्री। इस मान की गणना करने का सबसे आसान तरीका माइक्रोसॉफ्ट ऑफिस एक्सेल स्प्रेडशीट संपादक में निर्मित संबंधित फ़ंक्शन का उपयोग करना है।

आपको चाहिये होगा

  • स्प्रेडशीट संपादक माइक्रोसॉफ्ट ऑफिस एक्सेल।

अनुदेश

एक्सेल शुरू करें और एक दस्तावेज़ खोलें जिसमें डेटा के समूह हों जिनके सहसंबंध गुणांक की आप गणना करना चाहते हैं। यदि ऐसा कोई दस्तावेज़ अभी तक नहीं बनाया गया है, तो डेटा दर्ज करें - प्रोग्राम शुरू होने पर स्प्रेडशीट संपादक इसे स्वचालित रूप से बनाता है। मूल्यों के प्रत्येक समूह को दर्ज करें, जिस सहसंबंध में आप रुचि रखते हैं, एक अलग कॉलम में दर्ज करें। इन्हें आसन्न कॉलम नहीं होना चाहिए, आप तालिका को सबसे सुविधाजनक तरीके से व्यवस्थित करने के लिए स्वतंत्र हैं - डेटा के स्पष्टीकरण के साथ अतिरिक्त कॉलम जोड़ें, कॉलम हेडिंग, कुल या औसत मानों के साथ कुल सेल आदि। आप डेटा को लंबवत (कॉलम में) नहीं, बल्कि क्षैतिज (पंक्तियों में) दिशा में भी व्यवस्थित कर सकते हैं। एकमात्र आवश्यकता जिसे देखा जाना चाहिए वह यह है कि प्रत्येक समूह के डेटा के साथ कोशिकाओं को क्रमिक रूप से एक के बाद एक स्थित होना चाहिए, ताकि इस तरह से एक निरंतर सरणी बनाई जा सके।

उस सेल पर जाएँ जिसमें दो सरणियों के डेटा के सहसंबंध का मान होगा, और एक्सेल मेनू में "सूत्र" टैब पर क्लिक करें। "फ़ंक्शन लाइब्रेरी" कमांड समूह में, नवीनतम आइकन - "अन्य कार्य" पर क्लिक करें। एक ड्रॉप-डाउन सूची खुलेगी, जिसमें आपको "सांख्यिकीय" अनुभाग में जाना चाहिए और CORREL फ़ंक्शन का चयन करना चाहिए। परिणामस्वरूप, फंक्शन विजार्ड विंडो एक फॉर्म के साथ खुलेगी जिसे भरना है। उसी विंडो को "सूत्र" टैब के बिना भी कॉल किया जा सकता है, बस फॉर्मूला बार के बाईं ओर स्थित फ़ंक्शन इंसर्ट आइकन पर क्लिक करके।

सूत्र विज़ार्ड के Array1 फ़ील्ड में सहसंबद्ध डेटा के पहले समूह को निर्दिष्ट करें। मैन्युअल रूप से कक्षों की एक श्रेणी दर्ज करने के लिए, पहले और अंतिम कक्षों का पता टाइप करें, उन्हें एक कोलन (कोई रिक्त स्थान नहीं) से अलग करें। एक अन्य विकल्प केवल माउस के साथ वांछित श्रेणी का चयन करना है, और एक्सेल इस फॉर्म फ़ील्ड में वांछित प्रविष्टि को अपने आप रख देगा। वही ऑपरेशन "Array2" फ़ील्ड में डेटा के दूसरे समूह के साथ किया जाना चाहिए।

ओके बटन पर क्लिक करें। स्प्रेडशीट संपादक सूत्र के साथ सेल में सहसंबंध मान की गणना करेगा और प्रदर्शित करेगा। यदि आवश्यक हो, तो आप इस दस्तावेज़ को भविष्य में उपयोग के लिए सहेज सकते हैं (शॉर्टकट Ctrl + S)।

सहसंबंध का अध्ययन प्रायोगिक डेटा के आधार पर किया जाता है, जो दो विशेषताओं के मापा मान (xi, yi) हैं। यदि कुछ प्रयोगात्मक डेटा हैं, तो द्वि-आयामी अनुभवजन्य वितरण को xi और yi के मूल्यों की दोहरी श्रृंखला के रूप में दर्शाया जाता है। इस मामले में, सुविधाओं के बीच संबंध को विभिन्न तरीकों से वर्णित किया जा सकता है। एक तर्क और एक फ़ंक्शन के बीच पत्राचार एक तालिका, सूत्र, ग्राफ आदि द्वारा दिया जा सकता है।

सहसंबंध विश्लेषण, अन्य सांख्यिकीय विधियों की तरह, संभाव्य मॉडल के उपयोग पर आधारित है जो एक निश्चित सामान्य आबादी में अध्ययन की गई विशेषताओं के व्यवहार का वर्णन करता है, जिससे xi और y के प्रयोगात्मक मूल्य प्राप्त होते हैं। जब मात्रात्मक विशेषताओं के बीच सहसंबंध, जिसके मूल्यों को मीट्रिक तराजू (मीटर, सेकंड, किलोग्राम, आदि) की इकाइयों में सटीक रूप से मापा जा सकता है, की जांच की जाती है, तो सामान्य रूप से वितरित सामान्य आबादी के द्वि-आयामी मॉडल का मॉडल बहुत बार होता है। मुह बोली बहन। ऐसा मॉडल एक आयताकार समन्वय प्रणाली में बिंदुओं के स्थान के रूप में xi और yi चर के बीच संबंध को ग्राफिक रूप से प्रदर्शित करता है। इस ग्राफिकल निर्भरता को स्कैटरप्लॉट या सहसंबंध क्षेत्र भी कहा जाता है।

द्वि-आयामी सामान्य वितरण (सहसंबंध क्षेत्र) का यह मॉडल आपको सहसंबंध गुणांक की एक दृश्य चित्रमय व्याख्या देने की अनुमति देता है, क्योंकि कुल में वितरण पांच मापदंडों पर निर्भर करता है: μx, μy - औसत मान (गणितीय अपेक्षाएं); x,σy यादृच्छिक चर X और Y के मानक विचलन हैं, और p सहसंबंध गुणांक है, जो यादृच्छिक चर X और Y के बीच संबंध का एक माप है।

यदि p \u003d 0, तो मान, xi, yi, द्वि-आयामी सामान्य जनसंख्या से प्राप्त, x में ग्राफ़ पर स्थित हैं, y एक वृत्त (चित्र 5, a) से घिरे क्षेत्र के भीतर निर्देशांक करता है। इस मामले में, यादृच्छिक चर X और Y के बीच कोई संबंध नहीं है और उन्हें असंबद्ध कहा जाता है। द्वि-आयामी सामान्य वितरण के लिए, असंबद्धता का अर्थ एक ही समय में यादृच्छिक चर X और Y की स्वतंत्रता है।

यदि पी = 1 या पी = -1, तो यादृच्छिक चर एक्स और वाई (वाई = सी + डीएक्स) के बीच एक रैखिक कार्यात्मक संबंध है। इस मामले में, एक पूर्ण सहसंबंध की बात करता है। पी = 1 पर, मान xi, y एक सकारात्मक ढलान के साथ एक सीधी रेखा पर स्थित बिंदुओं को परिभाषित करता है (xi में वृद्धि के साथ, y का मान भी बढ़ता है), p = -1 पर, सीधी रेखा है एक नकारात्मक ढलान (चित्रा 5, बी)। मध्यवर्ती मामलों में (-1< p < 1) точки, соответствующие значениям xi, yi, попадают в область, ограниченную некоторым эллипсом (рисунок 5, в, г), причем при p >0, एक सकारात्मक सहसंबंध है (xi बढ़ने के साथ, y का मान बढ़ता है), p . पर< 0 корреляция отрицательная. Чем ближе р к, тем уже эллипс и тем теснее экспериментальные значения группируются около прямой линии. Здесь же следует обратить внимание на то, что линия, вдоль которой группируются точки, может быть не только прямой, а иметь любую другую форму: парабола, гипербола и т. д. В этих случаях мы рассматривали бы так называемую, нелинейную (или криволинейную) корреляцию.



इस प्रकार, सहसंबंध क्षेत्र का एक दृश्य विश्लेषण न केवल अध्ययन की गई विशेषताओं के बीच एक सांख्यिकीय संबंध (रैखिक या गैर-रेखीय) की उपस्थिति की पहचान करने में मदद करता है, बल्कि इसकी जकड़न और आकार भी है। विश्लेषण में अगले चरण के लिए यह आवश्यक है, उपयुक्त सहसंबंध गुणांक का चयन और गणना।

सुविधाओं के बीच सहसंबंध निर्भरता को विभिन्न तरीकों से वर्णित किया जा सकता है। विशेष रूप से, कनेक्शन के किसी भी रूप को एक सामान्य समीकरण Y = f(X) द्वारा व्यक्त किया जा सकता है, जहां Y एक आश्रित चर है, या स्वतंत्र चर X का एक कार्य है, जिसे तर्क कहा जाता है। एक तर्क और एक फ़ंक्शन के बीच पत्राचार एक तालिका, सूत्र, ग्राफ आदि द्वारा दिया जा सकता है।

ग्राफिक रूप से, दो विशेषताओं के संबंध को सहसंबंध क्षेत्र का उपयोग करके दर्शाया गया है। समन्वय प्रणाली में, कारक विशेषता के मूल्यों को एब्सिस्सा अक्ष पर प्लॉट किया जाता है, और परिणामी विशेषता को ऑर्डिनेट अक्ष पर प्लॉट किया जाता है। इन अक्षों के माध्यम से खींची गई रेखाओं के प्रत्येक चौराहे को एक बिंदु द्वारा दर्शाया गया है। करीबी कनेक्शन के अभाव में, ग्राफ पर बिंदुओं की एक यादृच्छिक व्यवस्था होती है (चित्र 11.1)।


आइए निर्देशांक तल के बिंदुओं के साथ प्राप्त निर्भरता को ग्राफिक रूप से चित्रित करें (चित्र। 3.1)। सांख्यिकीय संबंध की ऐसी छवि को सहसंबंध क्षेत्र कहा जाता है।

एक सहसंबंध क्षेत्र बनाएं और कनेक्शन के रूप के बारे में एक परिकल्पना तैयार करें।

दो विशेषताओं के बीच संबंध का अध्ययन करते समय, प्रतिगमन समीकरण के प्रकार का चयन करने के लिए चित्रमय विधि काफी स्पष्ट है। यह सहसंबंध क्षेत्र पर आधारित है। संबंधों के मात्रात्मक मूल्यांकन में उपयोग किए जाने वाले मुख्य प्रकार के वक्रों को अंजीर में दिखाया गया है। 2.1.

चूंकि सहसंबंध क्षेत्र के सभी बिंदु प्रतिगमन रेखा पर नहीं होते हैं, इसलिए कारक x के प्रभाव के कारण, यानी x के लिए प्रतिगमन y, और अन्य कारणों (अस्पष्टीकृत भिन्नता) के कारण दोनों में हमेशा एक बिखराव होता है। भविष्यवाणी के लिए प्रतिगमन रेखा की उपयुक्तता इस बात पर निर्भर करती है कि व्याख्या की गई भिन्नता के कारण विशेषता y की कुल भिन्नता का कितना हिस्सा है। जाहिर है, अगर प्रतिगमन के कारण वर्ग विचलन का योग वर्गों के अवशिष्ट योग से अधिक है, तो प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण है और परिणाम पर x कारक का महत्वपूर्ण प्रभाव पड़ता है। यह इस तथ्य के बराबर है कि निर्धारण गुणांक r2 एकता के करीब पहुंच जाएगा।

तदनुसार, अंजीर के सहसंबंध क्षेत्रों में दर्शाए गए निर्भरता के लिए। 3.5 बी) और सी), अवशेषों की विषमता को अंजीर में दिखाया गया है। 3.9 और 3.10।

यदि मान स्वतंत्र हैं, तो "सहसंबंध क्षेत्र" या पा-

यदि सहसंबंध क्षेत्र को एक सीधी रेखा द्वारा अनुमानित किया जा सकता है, जिसे प्रतिगमन रेखा कहा जाता है, तो जोड़ी सहसंबंध गुणांक r की गणना के लिए आगे बढ़ें। इसके संख्यात्मक मान अंतराल [-1, 1] में हैं। यदि r 1 या -1 के बराबर है, तो एक कार्यात्मक फ़ीड या प्रतिक्रिया है। जब r शून्य के करीब होता है, तो घटना के बीच कोई संबंध नहीं होता है, और r 0.7 पर कनेक्शन को महत्वपूर्ण माना जाता है। सहसंबंध गुणांक की गणना सूत्र द्वारा की जाती है

रेलवे सुविधाओं के उपरोक्त समूहों की पहचान करने के बाद, रेलवे सुविधाओं के प्रत्येक समूह के लिए जनसंख्या की एकरूपता के प्रारंभिक विश्लेषण की एक और अनुमानित विधि का उपयोग किया गया था - परिवहन की लागत के साथ अध्ययन में शामिल प्रत्येक कारक के लिए सहसंबंध क्षेत्रों का निर्माण। चयनित आबादी की समरूपता या विविधता का मुख्य संकेत सहसंबंध क्षेत्रों में बिंदुओं के स्थान में अंतराल और छलांग की अनुपस्थिति या उपस्थिति थी।

अध्ययन के लिए, सभी संभावित कारकों को पेशेवर तार्किक विश्लेषण द्वारा प्रारंभिक रूप से चुना गया था, परिवर्तनों पर डेटा जिसमें उद्यमों के लिए मंत्रालय की रिपोर्टिंग में उपलब्ध हैं। ऐसे कारकों को परिवहन की कुल मात्रा, काम कर रहे बेड़े के वैगनों और इंजनों की औसत उत्पादकता, माल ढुलाई की तीव्रता, परिवहन इकाई की पूंजी तीव्रता और श्रम उत्पादकता आदि (कुल 11 कारक) पर विचार किया जाना चाहिए। इस प्रकार, उद्यमों के चार समूहों के लिए 44 सहसंबंध क्षेत्रों का निर्माण किया गया।

संकेतित मानों को निर्धारित करने के बाद, एक जोड़ी निर्भरता समीकरण प्राप्त होता है, जिसका ग्राफिकल प्रतिनिधित्व समन्वय अक्षों में सैद्धांतिक प्रतिगमन रेखा कहलाता है। यदि सभी माप ऐसे क्षेत्र पर लागू होते हैं, न कि केवल सैद्धांतिक प्रतिगमन रेखा पर, तो हमें एक सहसंबंध क्षेत्र मिलेगा।

हम स्रोत सामग्री को सहसंबंध के क्षेत्र में और सहसंबंध तालिका में व्यवस्थित करते हैं। हमारे उदाहरण में, कारक मशीन सेमी की लागत है, और फ़ंक्शन श्रमिकों की औसत वार्षिक संख्या पी है।

अंतराल में टूटने के परिणामस्वरूप, संपूर्ण विमान जिस पर k और y दोनों संकेतों के लिए माप प्लॉट किए जाते हैं, जिसे सहसंबंध क्षेत्र कहा जाता है, कोशिकाएं होंगी, और प्रत्येक माप को इसके निर्देशांक के सटीक मूल्यों की विशेषता नहीं है, लेकिन केवल उस अंतराल के मूल्यों से जिसमें इसे सौंपा गया है।

अंजीर पर। 16 सहसंबंध क्षेत्र को दर्शाता है, जिस पर तर्क के मानों के अंतराल को भुज अक्ष के साथ दिया जाता है, और फ़ंक्शन P के मान के लिए अंतराल को निर्देशांक अक्ष के साथ दिया जाता है। इस तरह से निर्मित सहसंबंध क्षेत्र माध्यमिक कहा जाता है।

अंतराल का चयन करने के लिए एक प्राथमिक सहसंबंध क्षेत्र भी बनाया जा सकता है। इस क्षेत्र के सभी बिंदुओं को उनके निर्देशांक के मूल्यों को ध्यान में रखते हुए चिह्नित किया गया है। बिंदुओं के घनत्व के अनुसार, अंतरालों को रेखांकित किया जाता है।

सहसंबंध क्षेत्र के निर्माण के साथ, जैसा कि ऊपर बताया गया है, एक सहसंबंध तालिका संकलित की जाती है जिसमें औसत के निर्धारण से संबंधित सभी गणनाएं, एक अनुभवजन्य प्रतिगमन रेखा का निर्माण और सामान्य की प्रणाली में मापदंडों को निर्धारित करने के लिए प्रारंभिक डेटा। समीकरणों का प्रदर्शन किया जाता है।

तालिका में। 36 सभी सामग्री को अंतराल में विभाजित किया गया है। इसका उपयोग करते हुए, हम एक द्वितीयक सहसंबंध क्षेत्र का निर्माण करते हैं, जिस पर हम चर के सभी मूल्यों को प्लॉट करते हैं, और अंतराल पर औसत मान (/, //, ..., yn) निर्धारित करते हैं। औसत मूल्यों को जोड़ना। सीधी रेखा के खंडों के साथ प्रत्येक अंतराल में, हम एक अनुभवजन्य प्रतिगमन रेखा प्राप्त करते हैं (चित्र 16 देखें)।

प्रत्येक अंतराल के केंद्र से एब्सिस्सा अक्ष के लंबवत को बहाल करते हुए, हम उनमें से प्रत्येक पर y के संबंधित मानों को अलग रखते हैं, लेकिन अंतराल r /, \u003d 1081, 1/2 \u003d 1774, आदि। हम कनेक्ट करते हैं सीधी रेखा खंडों द्वारा एक दूसरे के साथ अंक प्राप्त किए। परिणामी टूटी हुई रेखा मशीनों की लागत Cm और श्रमिकों की संख्या P के बीच संबंध के लिए एक अनुभवजन्य प्रतिगमन रेखा है। प्रदर्शन की गई गणनाओं के अनुरूप, हम श्रमिकों की संख्या P के बीच संबंध की पहचान करने के लिए सहसंबंध तालिकाओं और सहसंबंध क्षेत्रों का निर्माण कर सकते हैं। , काम की मात्रा ओ, पूर्वनिर्मित कंक्रीट और प्रबलित कंक्रीट संरचनाओं की संख्या / Izh.b।
चावल। 18. श्रमिकों की संख्या और प्रीकास्ट कंक्रीट संरचनाओं के उपयोग की मात्रा की निर्भरता के सहसंबंध तालिका और द्वितीयक क्षेत्र /info/5440"> जोड़ी प्रतिगमन और बाद में प्राप्त कई प्रतिगमन के समीकरण लागू होते हैं यदि चर निम्नलिखित सीमाओं के भीतर बदलते हैं: श्रमिकों की संख्या - 850 से 7850 लोगों तक, मशीनों की लागत - 0.15 से 3.15 मिलियन रूबल तक । , पूर्वनिर्मित संरचनाओं की मात्रा - 10 से 230 हजार मीटर तक और ऊर्ध्वाधर अक्ष के साथ, स्वतंत्र मूल्यों में - क्षैतिज के साथ प्लॉट की जाती है। सहसंबंध क्षेत्र का उपयोग बीच के संबंध के रूप को निर्धारित करने के लिए किया जाता है चर, ग्राफ शोधकर्ता को पहले देता है

कम से कम वर्गों के तीसरे आधार के लिए आवश्यक है कि अवशिष्टों का विचरण समरूप हो। इसका अर्थ यह है कि गुणनखंड Xj के प्रत्येक मान के लिए, अवशिष्ट e, - का प्रसरण समान होता है। यदि एलएसएम लगाने की यह शर्त पूरी नहीं होती है, तो विषमलैंगिकता होती है। विषमलैंगिकता की उपस्थिति को सहसंबंध क्षेत्र (चित्र 3.5) से स्पष्ट रूप से देखा जा सकता है।

एक अन्य विशिष्ट शोध कार्य - घटना के बीच संबंध का आकलन - गणितीय आँकड़ों में सहसंबंध के सिद्धांत के अच्छी तरह से विकसित तंत्र का उपयोग करके हल किया जाता है। ऐसा करने के लिए, विभिन्न विषयों (उदाहरण के लिए, डी और सी) के नक्शे पर दिखाए गए तुलनात्मक घटनाओं के लिए नमूने होना आवश्यक है। मान a और b समान /-वें बिंदुओं पर लिए गए हैं, अर्थात। कड़ाई से समन्वित, और फिर सहसंबंध क्षेत्र की साजिश रचें।

1. काम का विषय।

2. संक्षिप्त सैद्धांतिक जानकारी।

3. काम का क्रम।

4. गणितीय मॉडल के विकास के लिए प्रारंभिक डेटा।

5. गणितीय मॉडल के विकास के परिणाम।

6. मॉडल के अध्ययन के परिणाम। एक पूर्वानुमान का निर्माण।

7। निष्कर्ष।

कार्य 2-4 में, आप मॉडल प्रदर्शन की गणना करने के लिए एक्सेल पीपीपी का उपयोग कर सकते हैं।

कार्य संख्या 1।

युग्मित प्रतिगमन मॉडल का निर्माण। विषमलैंगिकता के लिए अवशेषों की जाँच करना।

एक ही प्रकार के उत्पाद का उत्पादन करने वाले 15 उद्यमों के लिए, दो विशेषताओं के मूल्य ज्ञात हैं:

एक्स -उत्पादन, हजार इकाइयां;

वाई -उत्पादन लागत, मिलियन रूबल

एक्स आप
5,3 18,4
15,1 22,0
24,2 32,3
7,1 16,4
11,0 22,2
8,5 21,7
14,5 23,6
10,2 18,5
18,6 26,1
19,7 30,2
21,3 28,6
22,1 34,0
4,1 14,2
12,0 22,1
18,3 28,2

आवश्यक:

1. एक सहसंबंध क्षेत्र बनाएं और संबंध के रूप के बारे में एक परिकल्पना तैयार करें.

2. मॉडल बनाएं:

रैखिक जोड़ी प्रतिगमन।

अर्ध-लॉग जोड़ीवार प्रतिगमन।

2.3 पावर जोड़ी प्रतिगमन।
इसके लिए:


2. गुणांक (सूचकांक) का उपयोग करके रिश्ते की मजबूती का मूल्यांकन करें
सहसंबंध।

3. गुणांक (सूचकांक) का उपयोग करके मॉडल की गुणवत्ता का मूल्यांकन करें
निर्धारण और सन्निकटन की औसत त्रुटि
.

4. लोच के औसत गुणांक का उपयोग करके लिखें
कारक और परिणाम के बीच संबंध की ताकत का तुलनात्मक मूल्यांकन
.

5. का उपयोग करना एफ- प्रतिगमन मॉडलिंग के परिणामों की सांख्यिकीय विश्वसनीयता का मूल्यांकन करने के लिए फिशर का मानदंड.

पैराग्राफ 2-5 में गणना की गई विशेषताओं के मूल्यों के अनुसार, सबसे अच्छा प्रतिगमन समीकरण चुनें।

गोल्फरेल्ड-क्वांड्ट पद्धति का उपयोग करते हुए, हेटेरोसेडैस्टिसिटी के लिए अवशेषों की जांच करें।

हम एक सहसंबंध क्षेत्र बनाते हैं।

सहसंबंध क्षेत्र के बिंदुओं के स्थान का विश्लेषण करते हुए, हम मानते हैं कि संकेतों के बीच संबंध एक्सऔर पररैखिक हो सकता है, अर्थात्। वाई=ए+बीएक्स, या गैर-रैखिक रूप: y=a+blnx, y=ax b.

अध्ययन के तहत संबंध के सिद्धांत के आधार पर, हम निर्भरता प्राप्त करने की उम्मीद करते हैं परसे एक्सतरह वाई = ए + बीएक्स,क्योंकि उत्पादन लागत आपदो प्रकारों में विभाजित किया जा सकता है: स्थिर, उत्पादन की मात्रा से स्वतंत्र - जैसे किराया, प्रशासन रखरखाव, आदि; और चर जो आउटपुट के अनुपात में बदलते हैं बीएक्स,जैसे सामग्री, बिजली आदि की खपत।


2.1.रैखिक जोड़ी प्रतिगमन मॉडल.

2.1.1. आइए मापदंडों की गणना करें और बीरेखीय प्रतिगमन वाई=ए+बीएक्स.

हम एक गणना तालिका 1 बनाते हैं।

तालिका नंबर एक

विकल्प और बीसमीकरण

वाई एक्स = ए + बीएक्स


द्वारा विभाजित एन बी:

प्रतिगमन समीकरण:

=11.591+0.871x

उत्पादन में 1 हजार रूबल की वृद्धि के साथ। उत्पादन लागत में 0.871 मिलियन रूबल की वृद्धि हुई। औसतन, निश्चित लागत 11.591 मिलियन रूबल है।

2.1.2. हम जोड़ी सहसंबंध के रैखिक गुणांक का उपयोग करके संबंध की निकटता का अनुमान लगाते हैं।

आइए हम सुविधाओं के मानक विचलन को प्रारंभिक रूप से निर्धारित करें।

मानक विचलन:

सहसंबंध गुणांक:

संकेतों के बीच एक्सऔर यूएक बहुत मजबूत रैखिक सहसंबंध है।

2.1.3. आइए हम निर्मित मॉडल की गुणवत्ता का मूल्यांकन करें।

यानी यह मॉडल कुल विचरण का 90.5% बताता है पर, अस्पष्टीकृत विचरण की हिस्सेदारी 9.5% है।

इसलिए, मॉडल की गुणवत्ता उच्च है।

लेकिनमैं .

सबसे पहले, प्रतिगमन समीकरण से, हम कारक के प्रत्येक मूल्य के लिए सैद्धांतिक मान निर्धारित करते हैं।

सन्निकटन त्रुटि ए आई, आई=1…15:

औसत सन्निकटन त्रुटि:

2.1.4. आइए लोच के औसत गुणांक को परिभाषित करें:

यह दर्शाता है कि उत्पादन में 1% की वृद्धि के साथ, उत्पादन लागत में औसतन 0.515% की वृद्धि होती है।

2.1.5. आइए हम परिणामी समीकरण के सांख्यिकीय महत्व का अनुमान लगाएं।
आइए परिकल्पना का परीक्षण करें एच0कि प्रकट निर्भरता परसे एक्सयादृच्छिक है, अर्थात्, परिणामी समीकरण सांख्यिकीय रूप से महत्वहीन है। आइए α=0.05 लें। आइए सारणीबद्ध (महत्वपूर्ण) मान ज्ञात करें एफ-फिशर की कसौटी:

वास्तविक मान ज्ञात कीजिए एफ- फिशर की कसौटी:

इसलिए परिकल्पना एच0 एच 1 एक्सऔर आपआकस्मिक नहीं है।

आइए परिणामी समीकरण का निर्माण करें।

2.2. सेमीलॉग जोड़ीवार प्रतिगमन मॉडल.

2.2.1. आइए मापदंडों की गणना करें और बीप्रतिगमन में:

y x \u003d a + blnx.

हम इस समीकरण को रैखिक करते हैं, जो दर्शाते हैं:

y=a + bz.

विकल्प और बीसमीकरण

= ए+बीजेड

कम से कम वर्ग विधि द्वारा निर्धारित:


हम तालिका 2 की गणना करते हैं।

तालिका 2

द्वारा विभाजित एनऔर क्रैमर विधि द्वारा हल करने पर, हम निर्धारण के लिए एक सूत्र प्राप्त करते हैं बी:

प्रतिगमन समीकरण:

= -1.136 + 9.902z

2.2.2. आइए हम सुविधाओं के बीच संबंध की निकटता का अनुमान लगाएं परऔर एक्स.

समीकरण के बाद से वाई = ए + ब्लन एक्समापदंडों के संबंध में रैखिक और बीऔर इसका रैखिकरण आश्रित चर _ के परिवर्तन से संबंधित नहीं था। पर, फिर चर के बीच संबंध की जकड़न परऔर एक्स, जोड़ी सहसंबंध सूचकांक का उपयोग करके अनुमान लगाया गया Rxy, रैखिक जोड़ी सहसंबंध गुणांक का उपयोग करके भी निर्धारित किया जा सकता है आर yz

मानक विचलन जेड:

सहसंबंध सूचकांक का मान 1 के करीब है, इसलिए, चर के बीच परऔर एक्सबहुत घनिष्ठ संबंध है = ए + बीजेड।

2.2.3. आइए हम निर्मित मॉडल की गुणवत्ता का मूल्यांकन करें।

आइए निर्धारण के गुणांक को परिभाषित करें:

यानी यह मॉडल परिणाम में कुल भिन्नता का 83.8% बताता है पर, अस्पष्टीकृत भिन्नता का हिस्सा 16.2% है। इसलिए, मॉडल की गुणवत्ता उच्च है।

आइए हम औसत सन्निकटन त्रुटि का मान ज्ञात करें लेकिनमैं .

सबसे पहले, प्रतिगमन समीकरण से, हम कारक के प्रत्येक मूल्य के लिए सैद्धांतिक मान निर्धारित करते हैं। सन्निकटन त्रुटि और मैं ,:

, मैं=1…15.

औसत सन्निकटन त्रुटि:

.

त्रुटि छोटी है, मॉडल की गुणवत्ता अधिक है।

2.2.4 आइए लोच का औसत गुणांक निर्धारित करें:

यह दर्शाता है कि उत्पादन में 1% की वृद्धि के साथ, उत्पादन लागत में औसतन 0.414% की वृद्धि होती है।

2.2.5. आइए हम परिणामी समीकरण के सांख्यिकीय महत्व का अनुमान लगाएं।
आइए परिकल्पना का परीक्षण करें एच0कि प्रकट निर्भरता परसे एक्सयादृच्छिक है, अर्थात्। परिणामी समीकरण सांख्यिकीय रूप से महत्वहीन है। आइए α=0.05 लें।

आइए सारणीबद्ध (महत्वपूर्ण) मान ज्ञात करें एफ- फिशर की कसौटी:

वास्तविक मान ज्ञात कीजिए एफ- फिशर की कसौटी:

इसलिए परिकल्पना एच0अस्वीकृत, वैकल्पिक परिकल्पना स्वीकृत एच 1: 1-α = 0.95 की संभावना के साथ परिणामी समीकरण सांख्यिकीय रूप से महत्वपूर्ण है, चर के बीच संबंध एक्सऔर आपआकस्मिक नहीं है।

आइए सहसंबंध क्षेत्र पर एक प्रतिगमन समीकरण बनाएं

2.3. पावर जोड़ी रिग्रेशन मॉडल।

2.3.1. आइए मापदंडों की गणना करें और बीशक्ति प्रतिगमन:

मापदंडों की गणना इस समीकरण के रैखिककरण की प्रक्रिया से पहले की जाती है:

और चर का परिवर्तन:

Y=lny, X=lnx, A=lna

समीकरण पैरामीटर:

कम से कम वर्ग विधि द्वारा निर्धारित:


हम तालिका 3 की गणना करते हैं।

हम परिभाषित करते हैं बी:

प्रतिगमन समीकरण:

आइए सहसंबंध क्षेत्र पर एक प्रतिगमन समीकरण बनाएं:

2.3.2. आइए हम सुविधाओं के बीच संबंध की निकटता का अनुमान लगाएं परऔर एक्सयुग्म सहसंबंध सूचकांक का उपयोग करना आर वाईएक्स।

प्रारंभिक रूप से सैद्धांतिक मूल्य की गणना करें प्रत्येक कारक मूल्य के लिए एक्स,और फिर:

सहसंबंध सूचकांक मूल्य Rxy 1 के करीब, इसलिए चर के बीच परऔर एक्सफॉर्म का बहुत करीबी संबंध है:

2.3.3. आइए हम निर्मित मॉडल की गुणवत्ता का मूल्यांकन करें।

आइए निर्धारण सूचकांक को परिभाषित करें:

R2=0,936 2 =0,878,

यानी यह मॉडल परिणाम में कुल भिन्नता का 87.6% बताता है वाई,और अस्पष्टीकृत भिन्नता का हिस्सा 12.4% है।

मॉडल की गुणवत्ता उच्च है।

आइए हम औसत सन्निकटन त्रुटि का मान ज्ञात करें।

सन्निकटन त्रुटि ए आई, आई=1…15:

औसत सन्निकटन त्रुटि:

त्रुटि छोटी है, मॉडल की गुणवत्ता अधिक है।

2.3.4. आइए लोच के औसत गुणांक को परिभाषित करें:

यह दर्शाता है कि उत्पादन में 1% की वृद्धि के साथ, उत्पादन लागत में औसतन 0.438% की वृद्धि होती है।

2.3.5 आइए परिणामी समीकरण के सांख्यिकीय महत्व का मूल्यांकन करें।

आइए परिकल्पना का परीक्षण करें एच0कि प्रकट निर्भरता परसे एक्सयादृच्छिक है, अर्थात्, परिणामी समीकरण सांख्यिकीय रूप से महत्वहीन है। आइए α=0.05 लें।

सारणीबद्ध (महत्वपूर्ण) मान एफ- फिशर की कसौटी:

वास्तविक मूल्य एफ- फिशर की कसौटी:

इसलिए परिकल्पना एच0अस्वीकृत, वैकल्पिक परिकल्पना स्वीकृत एच 1: 1-α = 0.95 की संभावना के साथ परिणामी समीकरण सांख्यिकीय रूप से महत्वपूर्ण है, चर के बीच संबंध एक्सऔर आपआकस्मिक नहीं है।

टेबल तीन

3. सबसे अच्छा समीकरण चुनना।

आइए अध्ययन के परिणामों की एक तालिका बनाएं।

तालिका 4

हम तालिका का विश्लेषण करते हैं और निष्कर्ष निकालते हैं।

सभी तीन समीकरण सांख्यिकीय रूप से महत्वपूर्ण और विश्वसनीय साबित हुए, 1 के करीब एक सहसंबंध गुणांक (सूचकांक) है, एक उच्च (1 के करीब) गुणांक (सूचकांक) का निर्धारण, और स्वीकार्य सीमा के भीतर एक सन्निकटन त्रुटि है।

साथ ही, रैखिक मॉडल की विशेषताओं से संकेत मिलता है कि यह संकेतों के बीच संबंध का वर्णन करता है एक्सऔर वाई

इसलिए, हम प्रतिगमन समीकरण के रूप में एक रैखिक मॉडल चुनते हैं।