प्रतिगमन और सहसंबंध विश्लेषण - सांख्यिकीय अनुसंधान के तरीके। एक या अधिक स्वतंत्र चर पर पैरामीटर की निर्भरता दिखाने के ये सबसे आम तरीके हैं।
नीचे, ठोस व्यावहारिक उदाहरणों का उपयोग करते हुए, हम अर्थशास्त्रियों के बीच इन दो बहुत लोकप्रिय विश्लेषणों पर विचार करेंगे। हम संयुक्त होने पर परिणाम प्राप्त करने का एक उदाहरण भी देंगे।
एक्सेल में प्रतिगमन विश्लेषण
आश्रित चर पर कुछ मूल्यों (स्वतंत्र, स्वतंत्र) के प्रभाव को दर्शाता है। उदाहरण के लिए, आर्थिक रूप से सक्रिय जनसंख्या की संख्या उद्यमों की संख्या, मजदूरी और अन्य मापदंडों पर कैसे निर्भर करती है। या: विदेशी निवेश, ऊर्जा की कीमतें आदि जीडीपी के स्तर को कैसे प्रभावित करते हैं।
विश्लेषण का नतीजा आपको प्राथमिकता देने की अनुमति देता है। और मुख्य कारकों के आधार पर, भविष्यवाणी करने के लिए, प्राथमिकता वाले क्षेत्रों के विकास की योजना बनाएं, प्रबंधन निर्णय लें।
प्रतिगमन होता है:
- रैखिक (वाई = ए + बीएक्स);
- परवलयिक (y = a + bx + cx 2);
- घातीय (वाई = ए * एक्सप (बीएक्स));
- शक्ति (वाई = ए * एक्स ^ बी);
- अतिशयोक्तिपूर्ण (y = b/x + a);
- लघुगणक (y = b * 1n(x) + a);
- घातीय (वाई = ए * बी^एक्स)।
एक्सेल में एक रिग्रेशन मॉडल बनाने और परिणामों की व्याख्या करने के उदाहरण पर विचार करें। आइए एक रेखीय प्रकार का प्रतिगमन लें।
काम। 6 उद्यमों में, औसत मासिक वेतन और छोड़ने वाले कर्मचारियों की संख्या का विश्लेषण किया गया। औसत वेतन पर सेवानिवृत्त कर्मचारियों की संख्या की निर्भरता निर्धारित करना आवश्यक है।
रैखिक प्रतिगमन मॉडल के निम्नलिखित रूप हैं:
वाई \u003d ए 0 + ए 1 एक्स 1 + ... + ए के एक्स के।
जहाँ a प्रतिगमन गुणांक हैं, x प्रभावशाली चर हैं, और k कारकों की संख्या है।
हमारे उदाहरण में, Y नौकरी छोड़ने का सूचक है। प्रभावित करने वाला कारक मजदूरी (x) है।
एक्सेल में अंतर्निहित कार्य हैं जिनका उपयोग एक रेखीय प्रतिगमन मॉडल के मापदंडों की गणना के लिए किया जा सकता है। लेकिन एनालिसिस टूलपैक एड-इन इसे तेजी से करेगा।
एक शक्तिशाली विश्लेषणात्मक उपकरण को सक्रिय करें:
एक बार सक्रिय होने के बाद, ऐड-ऑन डेटा टैब के अंतर्गत उपलब्ध होगा।
अब हम सीधे प्रतिगमन विश्लेषण से निपटेंगे।
सबसे पहले, हम आर-स्क्वायर और गुणांकों पर ध्यान देते हैं।
आर-स्क्वायर दृढ़ संकल्प का गुणांक है। हमारे उदाहरण में, यह 0.755, या 75.5% है। इसका मतलब है कि मॉडल के परिकलित पैरामीटर 75.5% द्वारा अध्ययन किए गए मापदंडों के बीच संबंध की व्याख्या करते हैं। निर्धारण का गुणांक जितना अधिक होगा, मॉडल उतना ही बेहतर होगा। अच्छा - 0.8 से ऊपर। खराब - 0.5 से कम (इस तरह के विश्लेषण को शायद ही उचित माना जा सकता है)। हमारे उदाहरण में - "बुरा नहीं"।
गुणांक 64.1428 दिखाता है कि Y क्या होगा यदि विचाराधीन मॉडल में सभी चर 0 के बराबर हैं। अर्थात, अन्य कारक जो मॉडल में वर्णित नहीं हैं, वे भी विश्लेषण किए गए पैरामीटर के मान को प्रभावित करते हैं।
गुणांक -0.16285 Y पर चर X का भार दर्शाता है। यानी, इस मॉडल के भीतर औसत मासिक वेतन -0.16285 के भार के साथ छोड़ने वालों की संख्या को प्रभावित करता है (यह प्रभाव का एक छोटा अंश है)। "-" चिह्न एक नकारात्मक प्रभाव को इंगित करता है: वेतन जितना अधिक होगा, उतनी ही कम नौकरी छोड़नी होगी। जो उचित है।
एक्सेल में सहसंबंध विश्लेषण
सहसंबंध विश्लेषण यह स्थापित करने में मदद करता है कि एक या दो नमूनों में संकेतकों के बीच संबंध है या नहीं। उदाहरण के लिए, मशीन के परिचालन समय और मरम्मत की लागत, उपकरण की कीमत और संचालन की अवधि, बच्चों की ऊंचाई और वजन आदि के बीच।
यदि कोई संबंध है, तो क्या एक पैरामीटर में वृद्धि दूसरे में वृद्धि (सकारात्मक सहसंबंध) या कमी (नकारात्मक) की ओर ले जाती है। सहसंबंध विश्लेषण विश्लेषक को यह निर्धारित करने में मदद करता है कि क्या एक संकेतक का मूल्य दूसरे के संभावित मूल्य की भविष्यवाणी कर सकता है।
सहसंबंध गुणांक को निरूपित किया जाता है। +1 से -1 तक भिन्न होता है। विभिन्न क्षेत्रों के लिए सहसंबंधों का वर्गीकरण अलग-अलग होगा। जब गुणांक मान 0 होता है, तो नमूनों के बीच कोई रैखिक संबंध नहीं होता है।
सहसंबंध गुणांक खोजने के लिए एक्सेल का उपयोग कैसे करें, इस पर विचार करें।
CORREL फ़ंक्शन का उपयोग युग्मित गुणांकों को खोजने के लिए किया जाता है।
कार्य: यह निर्धारित करें कि खराद के परिचालन समय और उसके रखरखाव की लागत के बीच कोई संबंध है या नहीं।
कर्सर को किसी भी सेल में रखें और fx बटन दबाएं।
- "सांख्यिकीय" श्रेणी में, CORREL फ़ंक्शन का चयन करें।
- तर्क "ऐरे 1" - मानों की पहली श्रेणी - मशीन का समय: A2: A14।
- तर्क "सरणी 2" - मूल्यों की दूसरी श्रेणी - मरम्मत की लागत: B2:B14। ओके पर क्लिक करें।
कनेक्शन के प्रकार को निर्धारित करने के लिए, आपको गुणांक की पूर्ण संख्या को देखने की आवश्यकता है (गतिविधि के प्रत्येक क्षेत्र का अपना पैमाना है)।
कई मापदंडों (2 से अधिक) के सहसंबंध विश्लेषण के लिए, "डेटा विश्लेषण" ("विश्लेषण पैकेज" ऐड-ऑन) का उपयोग करना अधिक सुविधाजनक है। सूची में, आपको एक सहसंबंध का चयन करने और एक सरणी निर्दिष्ट करने की आवश्यकता है। सभी।
परिणामी गुणांक सहसंबंध मैट्रिक्स में प्रदर्शित किए जाएंगे। इसे लाईक करें:
सहसंबंध-प्रतिगमन विश्लेषण
व्यवहार में, इन दो तकनीकों का अक्सर एक साथ उपयोग किया जाता है।
उदाहरण:
अब प्रतिगमन विश्लेषण डेटा दिखाई दे रहा है।
सांख्यिकीय मॉडलिंग में, प्रतिगमन विश्लेषण एक अध्ययन है जिसका उपयोग चर के बीच संबंधों का मूल्यांकन करने के लिए किया जाता है। इस गणितीय पद्धति में मॉडलिंग और कई चरों का विश्लेषण करने के लिए कई अन्य तरीके शामिल हैं, जब एक आश्रित चर और एक या अधिक स्वतंत्र चर के बीच संबंध पर ध्यान केंद्रित किया जाता है। अधिक विशेष रूप से, प्रतिगमन विश्लेषण आपको यह समझने में मदद करता है कि आश्रित चर के विशिष्ट मूल्य कैसे बदलते हैं यदि एक स्वतंत्र चर में परिवर्तन होता है जबकि अन्य स्वतंत्र चर स्थिर रहते हैं।
सभी मामलों में, लक्ष्य स्कोर स्वतंत्र चर का एक कार्य है और इसे प्रतिगमन फ़ंक्शन कहा जाता है। प्रतिगमन विश्लेषण में, प्रतिगमन के एक समारोह के रूप में निर्भर चर में परिवर्तन को चिह्नित करने के लिए भी रुचि है, जिसे संभाव्यता वितरण का उपयोग करके वर्णित किया जा सकता है।
प्रतिगमन विश्लेषण के कार्य
इस सांख्यिकीय अनुसंधान पद्धति का व्यापक रूप से पूर्वानुमान के लिए उपयोग किया जाता है, जहां इसके उपयोग का एक महत्वपूर्ण लाभ है, लेकिन कभी-कभी यह भ्रम या झूठे संबंधों को जन्म दे सकता है, इसलिए इसे इस प्रश्न में सावधानी से उपयोग करने की अनुशंसा की जाती है, उदाहरण के लिए, सहसंबंध का अर्थ नहीं है कारण।
प्रतिगमन विश्लेषण करने के लिए बड़ी संख्या में विधियाँ विकसित की गई हैं, जैसे रैखिक और साधारण न्यूनतम वर्ग प्रतिगमन, जो पैरामीट्रिक हैं। उनका सार यह है कि प्रतिगमन फ़ंक्शन को डेटा से अनुमानित अज्ञात मापदंडों की एक सीमित संख्या के संदर्भ में परिभाषित किया गया है। गैर पैरामीट्रिक प्रतिगमन अपने कार्य को कार्यों के एक निश्चित सेट में झूठ बोलने की अनुमति देता है, जो कि अनंत-आयामी हो सकता है।
एक सांख्यिकीय अनुसंधान पद्धति के रूप में, अभ्यास में प्रतिगमन विश्लेषण डेटा निर्माण प्रक्रिया के रूप पर निर्भर करता है और यह कैसे प्रतिगमन दृष्टिकोण से संबंधित है। चूंकि डेटा प्रक्रिया उत्पन्न करने का वास्तविक रूप आम तौर पर एक अज्ञात संख्या है, डेटा प्रतिगमन विश्लेषण अक्सर प्रक्रिया के बारे में धारणाओं पर कुछ हद तक निर्भर करता है। पर्याप्त डेटा उपलब्ध होने पर ये धारणाएँ कभी-कभी परीक्षण योग्य होती हैं। प्रतिगमन मॉडल अक्सर तब भी उपयोगी होते हैं जब धारणाओं का सामान्य रूप से उल्लंघन किया जाता है, हालांकि वे अपने सर्वश्रेष्ठ प्रदर्शन नहीं कर सकते हैं।
संकीर्ण अर्थ में, प्रतिगमन विशेष रूप से निरंतर प्रतिक्रिया चर के अनुमान को संदर्भित कर सकता है, जैसा कि वर्गीकरण में उपयोग किए जाने वाले असतत प्रतिक्रिया चर के विपरीत है। निरंतर आउटपुट चर के मामले को संबंधित समस्याओं से अलग करने के लिए मीट्रिक प्रतिगमन भी कहा जाता है।
कहानी
प्रतिगमन का सबसे प्रारंभिक रूप कम से कम वर्गों की प्रसिद्ध विधि है। इसे 1805 में लीजेंड्रे और 1809 में गॉस द्वारा प्रकाशित किया गया था। लीजेंड्रे और गॉस ने खगोलीय अवलोकनों से सूर्य के चारों ओर पिंडों की कक्षाओं (मुख्य रूप से धूमकेतु, लेकिन बाद में नए खोजे गए छोटे ग्रहों) के निर्धारण की समस्या के लिए विधि लागू की। गॉस ने 1821 में गॉस-मार्कोव प्रमेय के एक संस्करण सहित कम से कम वर्गों के सिद्धांत का एक और विकास प्रकाशित किया।
"प्रतिगमन" शब्द 19वीं शताब्दी में फ्रांसिस गैल्टन द्वारा एक जैविक घटना का वर्णन करने के लिए गढ़ा गया था। लब्बोलुआब यह था कि पूर्वजों की वृद्धि से वंशजों की वृद्धि, एक नियम के रूप में, सामान्य औसत तक कम हो जाती है। गैल्टन के लिए, प्रतिगमन का केवल यही जैविक अर्थ था, लेकिन बाद में उनके काम को उदनी योले और कार्ल पियर्सन ने लिया और एक अधिक सामान्य सांख्यिकीय संदर्भ में ले लिया। यूल और पियर्सन के काम में, प्रतिक्रिया और व्याख्यात्मक चर का संयुक्त वितरण गॉसियन माना जाता है। इस धारणा को फिशर ने 1922 और 1925 के पत्रों में खारिज कर दिया था। फिशर ने सुझाव दिया कि प्रतिक्रिया चर का सशर्त वितरण गाऊसी है, लेकिन संयुक्त वितरण की आवश्यकता नहीं है। इस संबंध में, फिशर का सुझाव गॉस के 1821 सूत्रीकरण के करीब है। 1970 से पहले, प्रतिगमन विश्लेषण का परिणाम प्राप्त करने में कभी-कभी 24 घंटे तक लग जाते थे।
प्रतिगमन विश्लेषण विधियाँ सक्रिय अनुसंधान का एक क्षेत्र बनी हुई हैं। हाल के दशकों में, मजबूत प्रतिगमन के लिए नए तरीके विकसित किए गए हैं; सहसंबद्ध प्रतिक्रियाओं से जुड़े प्रतिगमन; प्रतिगमन विधियाँ जो विभिन्न प्रकार के लापता डेटा को समायोजित करती हैं; गैर पैरामीट्रिक प्रतिगमन; बायेसियन प्रतिगमन विधियां; प्रतिगमन जिसमें पूर्वसूचक चर त्रुटि के साथ मापा जाता है; अवलोकनों की तुलना में अधिक भविष्यवक्ताओं के साथ प्रतिगमन और प्रतिगमन के साथ कारण संबंधी निष्कर्ष।
प्रतिगमन मॉडल
प्रतिगमन विश्लेषण मॉडल में निम्नलिखित चर शामिल हैं:
- अज्ञात पैरामीटर, जिसे बीटा के रूप में दर्शाया गया है, जो एक अदिश या सदिश हो सकता है।
- स्वतंत्र चर, एक्स।
- आश्रित चर, वाई।
विज्ञान के विभिन्न क्षेत्रों में जहां प्रतिगमन विश्लेषण लागू किया जाता है, निर्भर और स्वतंत्र चर के बजाय अलग-अलग शब्दों का उपयोग किया जाता है, लेकिन सभी मामलों में प्रतिगमन मॉडल Y को X और β के कार्य से संबंधित करता है।
सन्निकटन आमतौर पर E (Y | X) = F (X, β) के रूप में तैयार किया जाता है। प्रतिगमन विश्लेषण करने के लिए, फ़ंक्शन f का रूप निर्धारित किया जाना चाहिए। शायद ही कभी, यह वाई और एक्स के बीच संबंधों के बारे में ज्ञान पर आधारित है जो डेटा पर भरोसा नहीं करता है। यदि ऐसा ज्ञान उपलब्ध नहीं है, तो एक लचीला या सुविधाजनक रूप F चुना जाता है।
आश्रित चर वाई
आइए अब मान लें कि अज्ञात पैरामीटर β के वेक्टर की लंबाई k है। प्रतिगमन विश्लेषण करने के लिए, उपयोगकर्ता को आश्रित चर Y के बारे में जानकारी प्रदान करनी चाहिए:
- यदि प्रपत्र (Y, X) के N डेटा बिंदु देखे जाते हैं, जहाँ N< k, большинство классических подходов к регрессионному анализу не могут быть выполнены, так как система уравнений, определяющих модель регрессии в качестве недоопределенной, не имеет достаточного количества данных, чтобы восстановить β.
- यदि वास्तव में N = K देखा जाता है, और फ़ंक्शन F रैखिक है, तो समीकरण Y = F(X, β) को ठीक से हल किया जा सकता है, लगभग नहीं। यह N-अज्ञात (β के तत्व) के साथ N-समीकरणों के एक सेट को हल करने के लिए उबलता है जिसका एक अद्वितीय समाधान है जब तक कि X रैखिक रूप से स्वतंत्र है। यदि F अरैखिक है, तो समाधान मौजूद नहीं हो सकता है, या कई समाधान हो सकते हैं।
- सबसे आम स्थिति वह है जहां डेटा में N > बिंदु होते हैं। इस मामले में, β के अद्वितीय मूल्य का अनुमान लगाने के लिए डेटा में पर्याप्त जानकारी है जो डेटा के लिए सबसे उपयुक्त है, और डेटा पर लागू होने पर प्रतिगमन मॉडल को β में ओवरराइड सिस्टम के रूप में देखा जा सकता है।
बाद के मामले में, प्रतिगमन विश्लेषण इसके लिए उपकरण प्रदान करता है:
- अज्ञात पैरामीटर β के लिए एक समाधान खोजना, जो, उदाहरण के लिए, Y के मापा और अनुमानित मान के बीच की दूरी को कम करेगा।
- कुछ सांख्यिकीय मान्यताओं के तहत, प्रतिगमन विश्लेषण अज्ञात मापदंडों β और आश्रित चर Y के अनुमानित मूल्यों के बारे में सांख्यिकीय जानकारी प्रदान करने के लिए अतिरिक्त जानकारी का उपयोग करता है।
स्वतंत्र माप की आवश्यक संख्या
एक प्रतिगमन मॉडल पर विचार करें जिसमें तीन अज्ञात पैरामीटर हैं: β 0, β 1 और β 2। मान लेते हैं कि प्रयोगकर्ता सदिश X के स्वतंत्र चर के समान मान में 10 माप करता है। इस मामले में, प्रतिगमन विश्लेषण मूल्यों का एक अनूठा सेट नहीं देता है। आप जो सबसे अच्छा कर सकते हैं, वह निर्भर चर Y के माध्य और मानक विचलन का अनुमान है। इसी तरह, X के दो अलग-अलग मानों को मापकर, आप दो अज्ञात के साथ प्रतिगमन के लिए पर्याप्त डेटा प्राप्त कर सकते हैं, लेकिन तीन या अधिक अज्ञात के लिए नहीं।
यदि प्रयोगकर्ता के माप स्वतंत्र वेक्टर चर एक्स के तीन अलग-अलग मूल्यों पर लिए गए थे, तो प्रतिगमन विश्लेषण β में तीन अज्ञात मापदंडों के लिए अनुमानों का एक अनूठा सेट प्रदान करेगा।
सामान्य रेखीय प्रतिगमन के मामले में, उपरोक्त कथन इस आवश्यकता के बराबर है कि मैट्रिक्स X T X व्युत्क्रमणीय है।
सांख्यिकीय अनुमान
जब माप N की संख्या अज्ञात पैरामीटर k और माप त्रुटियों ε i की संख्या से अधिक होती है, तो, एक नियम के रूप में, माप में निहित अतिरिक्त जानकारी वितरित की जाती है और अज्ञात पैरामीटर के संबंध में सांख्यिकीय भविष्यवाणियों के लिए उपयोग की जाती है। सूचना की इस अधिकता को प्रतिगमन की स्वतंत्रता की डिग्री कहा जाता है।
निहित मान्यताएं
प्रतिगमन विश्लेषण के लिए क्लासिक मान्यताओं में शामिल हैं:
- नमूनाकरण अनुमान भविष्यवाणी का प्रतिनिधि है।
- त्रुटि शून्य के औसत मान के साथ एक यादृच्छिक चर है, जो व्याख्यात्मक चर पर सशर्त है।
- स्वतंत्र चरों को त्रुटियों के बिना मापा जाता है।
- स्वतंत्र चर (भविष्यवक्ता) के रूप में, वे रैखिक रूप से स्वतंत्र हैं, अर्थात किसी भी भविष्यवक्ता को दूसरों के रैखिक संयोजन के रूप में व्यक्त करना संभव नहीं है।
- त्रुटियां असंबंधित हैं, अर्थात्, विकर्णों की त्रुटि सहप्रसरण मैट्रिक्स और प्रत्येक गैर-शून्य तत्व त्रुटि का विचरण है।
- त्रुटि विचरण प्रेक्षणों (समरूपता) में स्थिर है। यदि नहीं, तो भारित न्यूनतम वर्ग या अन्य विधियों का उपयोग किया जा सकता है।
कम से कम वर्गों के अनुमान के लिए इन पर्याप्त स्थितियों में आवश्यक गुण हैं, विशेष रूप से इन धारणाओं का मतलब है कि पैरामीटर अनुमान वस्तुनिष्ठ, सुसंगत और कुशल होंगे, खासकर जब रैखिक अनुमानों की कक्षा में ध्यान में रखा जाता है। यह ध्यान रखना महत्वपूर्ण है कि वास्तविक डेटा शायद ही कभी शर्तों को पूरा करता हो। अर्थात धारणा सही न होने पर भी विधि का प्रयोग किया जाता है। कभी-कभी धारणाओं से भिन्नता का उपयोग इस बात के माप के रूप में किया जा सकता है कि मॉडल कितना उपयोगी है। इनमें से कई धारणाओं को अधिक उन्नत तरीकों से शिथिल किया जा सकता है। सांख्यिकीय विश्लेषण रिपोर्ट में आमतौर पर मॉडल की उपयोगिता के लिए नमूना डेटा और कार्यप्रणाली के विरुद्ध परीक्षणों का विश्लेषण शामिल होता है।
इसके अलावा, कुछ मामलों में चर बिंदु स्थानों पर मापे गए मानों को संदर्भित करते हैं। सांख्यिकीय धारणाओं का उल्लंघन करने वाले चर में स्थानिक रुझान और स्थानिक स्वसंबंध हो सकते हैं। भौगोलिक भारित प्रतिगमन एकमात्र तरीका है जो ऐसे डेटा से संबंधित है।
रेखीय प्रतिगमन में, विशेषता यह है कि आश्रित चर, जो कि Y i है, मापदंडों का एक रैखिक संयोजन है। उदाहरण के लिए, सरल रेखीय प्रतिगमन में, एन-पॉइंट मॉडलिंग एक स्वतंत्र चर, x i और दो पैरामीटर, β 0 और β 1 का उपयोग करता है।
एकाधिक रैखिक प्रतिगमन में, कई स्वतंत्र चर या उनके कार्य होते हैं।
जब किसी आबादी से बेतरतीब ढंग से नमूना लिया जाता है, तो इसके पैरामीटर एक रेखीय प्रतिगमन मॉडल का नमूना प्राप्त करना संभव बनाते हैं।
इस पहलू में, सबसे कम वर्ग विधि सबसे लोकप्रिय है। यह पैरामीटर अनुमान प्रदान करता है जो अवशिष्टों के वर्गों के योग को कम करता है। इस प्रकार के न्यूनीकरण (जो रैखिक प्रतिगमन के लिए विशिष्ट है) इस फ़ंक्शन के सामान्य समीकरणों के एक सेट और पैरामीटर के साथ रैखिक समीकरणों के एक सेट की ओर जाता है, जो पैरामीटर अनुमान प्राप्त करने के लिए हल किए जाते हैं।
यह मानते हुए कि जनसंख्या त्रुटि आम तौर पर फैलती है, शोधकर्ता मानक त्रुटियों के इन अनुमानों का उपयोग विश्वास अंतराल बनाने और इसके मापदंडों के बारे में परिकल्पना परीक्षण करने के लिए कर सकता है।
अरेखीय प्रतिगमन विश्लेषण
एक उदाहरण जहां पैरामीटर के संबंध में फ़ंक्शन रैखिक नहीं है, यह इंगित करता है कि वर्गों का योग पुनरावृत्त प्रक्रिया के साथ कम किया जाना चाहिए। यह कई जटिलताओं का परिचय देता है जो रैखिक और गैर-रैखिक कम से कम वर्ग विधियों के बीच अंतर को परिभाषित करता है। नतीजतन, गैर-रैखिक विधि का उपयोग करते समय प्रतिगमन विश्लेषण के परिणाम कभी-कभी अप्रत्याशित होते हैं।
शक्ति और नमूना आकार की गणना
यहां, एक नियम के रूप में, मॉडल में स्वतंत्र चर की संख्या की तुलना में अवलोकनों की संख्या के संबंध में कोई सुसंगत तरीके नहीं हैं। पहला नियम डोबरा और हार्डिन द्वारा प्रस्तावित किया गया था और एन = टी ^ एन जैसा दिखता है, जहां एन नमूना आकार है, एन व्याख्यात्मक चर की संख्या है, और टी वांछित सटीकता प्राप्त करने के लिए आवश्यक अवलोकनों की संख्या है यदि मॉडल था केवल एक व्याख्यात्मक चर। उदाहरण के लिए, एक शोधकर्ता एक डेटासेट का उपयोग करके एक रेखीय प्रतिगमन मॉडल बनाता है जिसमें 1000 रोगी (N) होते हैं। यदि शोधकर्ता यह निर्णय लेता है कि रेखा (एम) को सटीक रूप से निर्धारित करने के लिए पांच अवलोकनों की आवश्यकता है, तो मॉडल द्वारा समर्थित व्याख्यात्मक चर की अधिकतम संख्या 4 है।
अन्य तरीके
हालांकि एक प्रतिगमन मॉडल के मापदंडों का अनुमान आमतौर पर कम से कम वर्ग विधि का उपयोग करके लगाया जाता है, फिर भी ऐसी अन्य विधियाँ हैं जिनका उपयोग बहुत कम बार किया जाता है। उदाहरण के लिए, ये निम्न विधियाँ हैं:
- बायेसियन तरीके (उदाहरण के लिए, रैखिक प्रतिगमन की बायेसियन विधि)।
- प्रतिशत प्रतिगमन उन स्थितियों के लिए उपयोग किया जाता है जहां प्रतिशत त्रुटियों को कम करना अधिक उपयुक्त माना जाता है।
- सबसे छोटा निरपेक्ष विचलन, जो मात्रात्मक प्रतिगमन की ओर ले जाने वाले आउटलेयर की उपस्थिति में अधिक मजबूत होता है।
- बड़ी संख्या में टिप्पणियों और गणनाओं की आवश्यकता वाले गैर पैरामीट्रिक प्रतिगमन।
- दिए गए इनपुट स्थान में एक सार्थक दूरी मीट्रिक की खोज में सीखी गई सीखने की मीट्रिक की दूरी।
सॉफ़्टवेयर
सभी प्रमुख सांख्यिकीय सॉफ़्टवेयर पैकेज न्यूनतम वर्ग प्रतिगमन विश्लेषण का उपयोग करके किए जाते हैं। सरल रेखीय प्रतिगमन और एकाधिक प्रतिगमन विश्लेषण का उपयोग कुछ स्प्रेडशीट अनुप्रयोगों के साथ-साथ कुछ कैलकुलेटरों में भी किया जा सकता है। जबकि कई सांख्यिकीय सॉफ़्टवेयर पैकेज विभिन्न प्रकार के गैरपारंपरिक और मजबूत प्रतिगमन का प्रदर्शन कर सकते हैं, ये विधियाँ कम मानकीकृत हैं; अलग-अलग सॉफ्टवेयर पैकेज अलग-अलग तरीकों को लागू करते हैं। सर्वेक्षण विश्लेषण और न्यूरोइमेजिंग जैसे क्षेत्रों में उपयोग के लिए विशिष्ट प्रतिगमन सॉफ्टवेयर विकसित किया गया है।
कारक और परिणामी संकेतों के बीच एक सहसंबंध की उपस्थिति में, डॉक्टरों को अक्सर यह निर्धारित करना पड़ता है कि एक संकेत का मूल्य कितना बदल सकता है जब दूसरे को माप की एक इकाई द्वारा बदल दिया जाता है जिसे आम तौर पर स्वयं शोधकर्ता द्वारा स्वीकार या स्थापित किया जाता है।
उदाहरण के लिए, पहली कक्षा (लड़कियों या लड़कों) के स्कूली बच्चों के शरीर का वजन कैसे बदलेगा यदि उनकी ऊंचाई 1 सेमी बढ़ जाती है इस प्रयोजन के लिए, प्रतिगमन विश्लेषण पद्धति का उपयोग किया जाता है।
अक्सर, भौतिक विकास के लिए नियामक पैमानों और मानकों को विकसित करने के लिए प्रतिगमन विश्लेषण पद्धति का उपयोग किया जाता है।
- प्रतिगमन की परिभाषा. प्रतिगमन एक ऐसा कार्य है जो एक विशेषता के औसत मूल्य के आधार पर, किसी अन्य विशेषता के औसत मूल्य को निर्धारित करने की अनुमति देता है जो पहले एक से संबंधित है।
इस प्रयोजन के लिए, प्रतिगमन गुणांक और कई अन्य मापदंडों का उपयोग किया जाता है। उदाहरण के लिए, आप शरद ऋतु-सर्दियों की अवधि में औसत मासिक हवा के तापमान के कुछ मूल्यों पर औसतन सर्दी की संख्या की गणना कर सकते हैं।
- प्रतिगमन गुणांक की परिभाषा. प्रतिगमन गुणांक वह निरपेक्ष मान है जिसके द्वारा माप की स्थापित इकाई द्वारा इससे जुड़ी एक अन्य विशेषता में परिवर्तन होने पर एक विशेषता का मान औसतन बदल जाता है।
- प्रतिगमन गुणांक सूत्र. आर y / x \u003d r xy x (σ y / σ x)
जहाँ आर वाई / एक्स - प्रतिगमन गुणांक;
r xy - विशेषताओं x और y के बीच सहसंबंध गुणांक;
(σ y और σ x) - सुविधाओं x और y के मानक विचलन।हमारे उदाहरण में;
σ x = 4.6 (शरद ऋतु-सर्दियों की अवधि में हवा के तापमान का मानक विचलन;
σ y = 8.65 (संक्रामक जुकाम की संख्या का मानक विचलन)।
इस प्रकार, R y/x प्रतिगमन गुणांक है।
आर वाई / एक्स \u003d -0.96 एक्स (4.6 / 8.65) \u003d 1.8, यानी। औसत मासिक हवा के तापमान (x) में 1 डिग्री की कमी के साथ, शरद ऋतु-सर्दियों की अवधि में संक्रामक सर्दी (y) की औसत संख्या 1.8 मामलों में बदल जाएगी। - प्रतिगमन समीकरण. वाई \u003d एम वाई + आर वाई / एक्स (एक्स - एम एक्स)
जहां y विशेषता का औसत मूल्य है, जिसे किसी अन्य विशेषता (x) के औसत मूल्य में परिवर्तन होने पर निर्धारित किया जाना चाहिए;
x - किसी अन्य विशेषता का ज्ञात औसत मान;
आर वाई/एक्स - प्रतिगमन गुणांक;
एम एक्स, एम वाई - एक्स और वाई सुविधाओं के ज्ञात औसत मूल्य।उदाहरण के लिए, औसत मासिक वायु तापमान (x) के किसी भी औसत मूल्य पर विशेष माप के बिना संक्रामक सर्दी (y) की औसत संख्या निर्धारित की जा सकती है। तो, यदि x \u003d - 9 °, R y / x \u003d 1.8 रोग, M x \u003d -7 °, M y \u003d 20 रोग, तो y \u003d 20 + 1.8 x (9-7) \u003d 20 + 3 .6 = 23.6 रोग।
यह समीकरण दो विशेषताओं (x और y) के बीच सीधी रेखा संबंध के मामले में लागू होता है। - प्रतिगमन समीकरण का उद्देश्य. प्रतिगमन समीकरण का उपयोग प्रतिगमन रेखा को प्लॉट करने के लिए किया जाता है। उत्तरार्द्ध, विशेष माप के बिना, एक विशेषता के किसी भी औसत मूल्य (y) को निर्धारित करने की अनुमति देता है, यदि किसी अन्य विशेषता का मान (x) बदल जाता है। इन आंकड़ों के आधार पर एक ग्राफ बनाया जाता है - प्रतिगमन लाइन, जिसका उपयोग सर्दी की संख्या के परिकलित मूल्यों के बीच की सीमा के भीतर औसत मासिक तापमान के किसी भी मूल्य पर सर्दी की औसत संख्या निर्धारित करने के लिए किया जा सकता है।
- प्रतिगमन सिग्मा (सूत्र).
जहाँ σ Ru/x - प्रतिगमन का सिग्मा (मानक विचलन);
σ y विशेषता y का मानक विचलन है;
r xy - विशेषताओं x और y के बीच सहसंबंध गुणांक।इसलिए, यदि σ y शीतों की संख्या का मानक विचलन = 8.65 है; r xy - सर्दी की संख्या (y) और शरद ऋतु-सर्दियों की अवधि (x) में औसत मासिक हवा के तापमान के बीच सहसंबंध गुणांक - 0.96 है, फिर
- सिग्मा प्रतिगमन का उद्देश्य. परिणामी विशेषता (y) की विविधता के माप की एक विशेषता देता है।
उदाहरण के लिए, यह शरद ऋतु-सर्दियों की अवधि में औसत मासिक हवा के तापमान के एक निश्चित मूल्य पर सर्दी की संख्या की विविधता को दर्शाता है। तो, हवा के तापमान x 1 \u003d -6 ° पर जुकाम की औसत संख्या 15.78 रोगों से लेकर 20.62 रोगों तक हो सकती है।
x 2 = -9° पर, जुकाम की औसत संख्या 21.18 रोगों से लेकर 26.02 रोगों आदि तक हो सकती है।प्रतिगमन सिग्मा का उपयोग प्रतिगमन पैमाने के निर्माण में किया जाता है, जो प्रतिगमन रेखा पर प्लॉट किए गए औसत मूल्य से प्रभावी विशेषता के मूल्यों के विचलन को दर्शाता है।
- प्रतिगमन पैमाने की गणना और प्लॉट करने के लिए आवश्यक डेटा
- प्रतिगमन गुणांक - ry/x;
- प्रतिगमन समीकरण - y \u003d M y + R y / x (x-M x);
- प्रतिगमन सिग्मा - σ Rx/y
- प्रतिगमन पैमाने की गणना और ग्राफिक प्रतिनिधित्व का क्रम.
- सूत्र द्वारा प्रतिगमन गुणांक निर्धारित करें (पैराग्राफ 3 देखें)। उदाहरण के लिए, किसी को यह निर्धारित करना चाहिए कि औसत ऊंचाई 1 सेमी से बदलने पर शरीर के वजन में औसतन (लिंग के आधार पर एक निश्चित उम्र में) कितना बदलाव आएगा।
- प्रतिगमन समीकरण के सूत्र के अनुसार (पैराग्राफ 4 देखें), निर्धारित करें कि औसत क्या होगा, उदाहरण के लिए, शरीर का वजन (y, y 2, y 3 ...) * एक निश्चित वृद्धि मूल्य (x, x 2, एक्स 3 ...) .
________________
* "Y" के मान की गणना "x" के कम से कम तीन ज्ञात मानों के लिए की जानी चाहिए।इसी समय, एक निश्चित आयु और लिंग के लिए शरीर के वजन और ऊंचाई (एम एक्स, और एम वाई) के औसत मूल्यों को जाना जाता है
- प्रतिगमन के सिग्मा की गणना करें, σ y और r xy के संगत मानों को जानें और उनके मानों को सूत्र में प्रतिस्थापित करें (पैराग्राफ 6 देखें)।
- ज्ञात मूल्यों के आधार पर x 1, x 2, x 3 और उनके संबंधित औसत मान y 1, y 2 y 3, साथ ही सबसे छोटा (y - σ ru / x) और सबसे बड़ा (y + σ ru) / x) मान (y) एक प्रतिगमन पैमाने का निर्माण करते हैं।
प्रतिगमन पैमाने के चित्रमय प्रतिनिधित्व के लिए, मान x, x 2, x 3 (y- अक्ष) को पहले ग्राफ़ पर अंकित किया जाता है, अर्थात। एक प्रतिगमन रेखा निर्मित होती है, उदाहरण के लिए, ऊंचाई (x) पर शरीर के वजन (y) की निर्भरता।
फिर, संबंधित बिंदुओं पर y 1 , y 2 , y 3 प्रतिगमन सिग्मा के संख्यात्मक मान चिह्नित हैं, अर्थात। ग्राफ पर y 1 , y 2 , y 3 के सबसे छोटे और सबसे बड़े मान ज्ञात कीजिए।
- प्रतिगमन पैमाने का व्यावहारिक उपयोग. विशेष रूप से भौतिक विकास के लिए नियामक पैमाने और मानक विकसित किए जा रहे हैं। मानक पैमाने के अनुसार, बच्चों के विकास का व्यक्तिगत मूल्यांकन देना संभव है। साथ ही, शारीरिक विकास को सामंजस्यपूर्ण के रूप में मूल्यांकन किया जाता है, उदाहरण के लिए, एक निश्चित ऊंचाई पर, बच्चे के शरीर का वजन शरीर के वजन की औसत गणना इकाई के प्रतिगमन सिग्मा के भीतर होता है - (y) किसी दिए गए ऊंचाई (x) के लिए ( वाई ± 1 σ आरवाई / एक्स)।
शारीरिक विकास को शरीर के वजन के मामले में असंगत माना जाता है यदि एक निश्चित ऊंचाई के लिए बच्चे के शरीर का वजन दूसरे प्रतिगमन सिग्मा के भीतर है: (y ± 2 σ Ry/x)
यदि एक निश्चित ऊंचाई के लिए शरीर का वजन प्रतिगमन के तीसरे सिग्मा (y ± 3 σ Ry/x) के भीतर है, तो शरीर के अतिरिक्त और अपर्याप्त वजन दोनों के कारण शारीरिक विकास तेजी से असंगत होगा।
5 वर्षीय लड़कों के शारीरिक विकास के एक सांख्यिकीय अध्ययन के परिणामों के अनुसार, यह ज्ञात है कि उनकी औसत ऊंचाई (x) 109 सेमी है, और उनके शरीर का औसत वजन (y) 19 किलोग्राम है। ऊंचाई और शरीर के वजन के बीच सहसंबंध गुणांक +0.9 है, मानक विचलन तालिका में प्रस्तुत किए गए हैं।
आवश्यक:
- प्रतिगमन गुणांक की गणना करें;
- प्रतिगमन समीकरण का उपयोग करते हुए, निर्धारित करें कि x1 = 100 सेमी, x2 = 110 सेमी, x3 = 120 सेमी के बराबर ऊंचाई के साथ 5 वर्षीय लड़कों का अपेक्षित शरीर का वजन क्या होगा;
- प्रतिगमन सिग्मा की गणना करें, एक प्रतिगमन पैमाने का निर्माण करें, इसके समाधान के परिणामों को रेखांकन प्रस्तुत करें;
- उचित निष्कर्ष निकालें।
समस्या की स्थिति और उसके समाधान के परिणाम सारांश तालिका में प्रस्तुत किए गए हैं।
तालिका नंबर एक
समस्या की शर्तें | समस्या समाधान परिणाम | ||||||||
प्रतिगमन समीकरण | सिग्मा प्रतिगमन | प्रतिगमन पैमाने (अपेक्षित शरीर का वजन (किलो में)) | |||||||
एम | σ | आर xy | आर वाई / एक्स | एक्स | पर | σआरएक्स/वाई | वाई - σ आरयू/एच | वाई + σ आरयू/एच | |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
ऊंचाई (एक्स) | 109 सेमी | ± 4.4 सेमी | +0,9 | 0,16 | 100 सेमी | 17.56 किग्रा | ± 0.35 किग्रा | 17.21 किग्रा | 17.91 किग्रा |
शरीर का वजन (वाई) | 19 किग्रा | ± 0.8 किग्रा | 110 सेमी | 19.16 किग्रा | 18.81 किग्रा | 19.51 किग्रा | |||
120 सेमी | 20.76 किग्रा | 20.41 किग्रा | 21.11 किग्रा |
समाधान.
निष्कर्ष।इस प्रकार, शरीर के वजन के परिकलित मूल्यों के भीतर प्रतिगमन पैमाने आपको इसे किसी अन्य विकास मूल्य के लिए निर्धारित करने या बच्चे के व्यक्तिगत विकास का आकलन करने की अनुमति देता है। ऐसा करने के लिए, प्रतिगमन रेखा के लंब को पुनर्स्थापित करें।
- व्लासोव वी.वी. महामारी विज्ञान। - एम .: जियोटार-मेड, 2004. - 464 पी।
- लिसित्सिन यू.पी. सार्वजनिक स्वास्थ्य और स्वास्थ्य देखभाल। हाई स्कूल के लिए पाठ्यपुस्तक। - एम .: जियोटार-मेड, 2007. - 512 पी।
- मेडिक वी.ए., यूरीव वी.के. सार्वजनिक स्वास्थ्य और स्वास्थ्य देखभाल पर व्याख्यान का एक कोर्स: भाग 1। सार्वजनिक स्वास्थ्य। - एम .: मेडिसिन, 2003. - 368 पी।
- मिनियाव वी.ए., विष्णकोव एन.आई. और अन्य सामाजिक चिकित्सा और स्वास्थ्य सेवा संगठन (2 खंडों में मार्गदर्शिका)। - सेंट पीटर्सबर्ग, 1998. -528 पी।
- कुचेरेंको वी.जेड., अगरकोव एन.एम. और अन्य सामाजिक स्वच्छता और स्वास्थ्य देखभाल संगठन (ट्यूटोरियल) - मास्को, 2000. - 432 पी।
- एस ग्लैंट्ज़। औषधीय-जैविक सांख्यिकी। अंग्रेजी से प्रति। - एम।, प्रैक्टिस, 1998. - 459 पी।
सहसंबंध विश्लेषण के बाद चर के बीच सांख्यिकीय संबंधों की उपस्थिति का पता चला है और उनकी निकटता की डिग्री का आकलन किया गया है, वे आमतौर पर प्रतिगमन विश्लेषण का उपयोग करके एक विशिष्ट प्रकार की निर्भरता के गणितीय विवरण के लिए आगे बढ़ते हैं। इस प्रयोजन के लिए, कार्यों की एक श्रेणी का चयन किया जाता है जो प्रभावी संकेतक y और तर्कों x 1, x 2, ..., x को सबसे अधिक जानकारीपूर्ण तर्कों से संबंधित करता है, लिंक के मापदंडों के अज्ञात मूल्यों का अनुमान चुना जाता है समीकरण की गणना की जाती है और परिणामी समीकरण के गुणों का विश्लेषण किया जाता है।
फ़ंक्शन f (x 1, x 2, ..., x k) तर्कों के दिए गए मानों पर प्रभावी विशेषता y के औसत मूल्य की निर्भरता का वर्णन करते हुए प्रतिगमन फ़ंक्शन (समीकरण) कहलाता है। शब्द "प्रतिगमन" (अव्य। - प्रतिगमन - पीछे हटना, किसी चीज़ पर लौटना) अंग्रेजी मनोवैज्ञानिक और मानवविज्ञानी एफ। गैल्टन द्वारा पेश किया गया था और विशेष रूप से पहले ठोस उदाहरणों में से एक की बारीकियों से जुड़ा है जिसमें इस अवधारणा का उपयोग किया गया था। इसलिए, विकास की आनुवंशिकता के विश्लेषण के संबंध में सांख्यिकीय डेटा को संसाधित करते हुए, एफ। गैल्टन ने पाया कि यदि पिता x इंच से सभी पिताओं की औसत ऊंचाई से विचलित होते हैं, तो उनके बेटे x से कम सभी बेटों की औसत ऊंचाई से विचलित हो जाते हैं। इंच। प्रकट प्रवृत्ति को "औसत अवस्था में प्रतिगमन" कहा जाता था। तब से, सांख्यिकीय साहित्य में "रिग्रेशन" शब्द का व्यापक रूप से उपयोग किया गया है, हालांकि कई मामलों में यह सांख्यिकीय निर्भरता की अवधारणा को सटीक रूप से वर्णित नहीं करता है।
प्रतिगमन समीकरण के सटीक विवरण के लिए, प्रभावी संकेतक y के वितरण के नियम को जानना आवश्यक है। सांख्यिकीय अभ्यास में, आमतौर पर अज्ञात सच्चे प्रतिगमन समारोह के लिए उपयुक्त सन्निकटन की खोज के लिए खुद को सीमित करना आवश्यक होता है, क्योंकि शोधकर्ता को दिए गए मानों के लिए विश्लेषण किए गए परिणाम संकेतक y के संभाव्यता वितरण के सशर्त कानून का सटीक ज्ञान नहीं है। तर्क x का।
सही f(x) = M(y1x), मॉडल प्रतिगमन के बीच संबंध पर विचार करें? और प्रतिगमन का y स्कोर। प्रभावी संकेतक y को तर्क x से अनुपात से संबंधित होने दें:
जहाँ - e एक यादृच्छिक चर है जिसमें एक सामान्य वितरण कानून है, जिसमें Me \u003d 0 और D e \u003d y 2 है। इस मामले में सही समाश्रयण फलन है: f(x) = M(y/x) = 2x 1.5।
मान लीजिए कि हम सही समाश्रयण समीकरण के सटीक रूप को नहीं जानते हैं, लेकिन हमारे पास yi = 2x1.5 + e के अनुपात से संबंधित द्वि-आयामी यादृच्छिक चर पर नौ अवलोकन हैं, और चित्र 3 में दिखाया गया है। 1
चित्र 1 - सत्य f (x) और सैद्धांतिक की पारस्परिक व्यवस्था? प्रतिगमन मॉडल
अंजीर में बिंदुओं का स्थान। 1 आपको फॉर्म की रैखिक निर्भरताओं की कक्षा में खुद को सीमित करने की अनुमति देता है? = 0 + 1 x पर। कम से कम वर्ग विधि का उपयोग करके, हम प्रतिगमन समीकरण y = b 0 + b 1 x का अनुमान लगाते हैं। तुलना के लिए, चित्र में। 1 वास्तविक प्रतिगमन फ़ंक्शन y \u003d 2x 1.5, सैद्धांतिक सन्निकटन प्रतिगमन फ़ंक्शन के ग्राफ़ दिखाता है? = 0 + 1 x पर।
चूंकि हमने प्रतिगमन समारोह के वर्ग को चुनने में गलती की है, और यह सांख्यिकीय अनुसंधान के अभ्यास में काफी आम है, हमारे सांख्यिकीय निष्कर्ष और अनुमान गलत साबित होंगे। और इससे कोई फर्क नहीं पड़ता कि हम अवलोकनों की मात्रा में कितना वृद्धि करते हैं, y का हमारा नमूना अनुमान सही प्रतिगमन फ़ंक्शन f(x) के करीब नहीं होगा। यदि हमने प्रतिगमन कार्यों के वर्ग को सही ढंग से चुना है, तो f (x) का उपयोग करते हुए विवरण में अशुद्धि? केवल सीमित नमूना आकार द्वारा समझाया जा सकता है।
प्रारंभिक सांख्यिकीय डेटा से प्रभावी संकेतक y(x) और अज्ञात प्रतिगमन फ़ंक्शन f(x) = M(y/x) के सशर्त मूल्य को सर्वोत्तम रूप से पुनर्स्थापित करने के लिए, निम्नलिखित पर्याप्तता मानदंड (हानि फ़ंक्शन) का सबसे अधिक उपयोग किया जाता है .
कम से कम वर्ग विधि। इसके अनुसार, मॉडल मानों से प्रभावी संकेतक y, (i = 1,2,..., n) के देखे गए मानों का वर्ग विचलन न्यूनतम किया जाता है। = f(x i), जहां x i i-वें अवलोकन में तर्कों के सदिश का मान है:
कम से कम मॉड्यूल की विधि। इसके अनुसार, मॉड्यूलर मूल्यों से प्रभावी संकेतक के देखे गए मूल्यों के पूर्ण विचलन का योग कम से कम है। और हमें मिलता है = f(x i), मतलब पूर्ण औसत प्रतिगमन? |वाई आई - एफ(एच आई)| > मि.
प्रतिगमन विश्लेषण चर x j = (j = 1,2, ..., k) पर एक यादृच्छिक चर y की निर्भरता के सांख्यिकीय विश्लेषण की एक विधि है, जिसे प्रतिगमन विश्लेषण में गैर-यादृच्छिक चर के रूप में माना जाता है, भले ही सही वितरण कानून की परवाह किए बिना एक्स जे।
आमतौर पर यह माना जाता है कि यादृच्छिक चर y में एक सशर्त गणितीय अपेक्षा y के साथ एक सामान्य वितरण कानून है, जो कि तर्कों x/ (/ = 1, 2, ..., k) का एक कार्य है और एक स्थिर, स्वतंत्र है। तर्क, विचरण y 2 ।
सामान्य तौर पर, प्रतिगमन विश्लेषण के रैखिक मॉडल का रूप होता है:
वाई = वाई क जे = 0वी जेसी जे(एक्स 1 , एक्स 2 . . .. ,एक्स क)+ई
जहाँ c j इसके चरों का कुछ फलन है - x 1 , x 2 । . .. ,x k , E शून्य गणितीय अपेक्षा और प्रसरण y 2 के साथ एक यादृच्छिक चर है।
प्रतिगमन विश्लेषण में, अध्ययन के तहत घटना की भौतिक प्रकृति और अवलोकन के परिणामों के आधार पर प्रतिगमन समीकरण का प्रकार चुना जाता है।
समाश्रयण समीकरण के अज्ञात प्राचलों के अनुमान सामान्यतः न्यूनतम वर्ग विधि द्वारा प्राप्त किए जाते हैं। नीचे हम इस समस्या पर अधिक विस्तार से ध्यान केन्द्रित करेंगे।
द्वि-आयामी रैखिक प्रतिगमन समीकरण। अध्ययन के तहत घटना के विश्लेषण के आधार पर, यह माना जाता है कि "औसत" y में x का एक रैखिक कार्य है, अर्थात, एक प्रतिगमन समीकरण है
y \u003d एम (y / x) \u003d 0 + पर 1 x)
जहाँ M(y1x) किसी दिए गए x के लिए यादृच्छिक चर y की सशर्त गणितीय अपेक्षा है; 0 और 1 पर - सामान्य जनसंख्या के अज्ञात पैरामीटर, जिनका अनुमान नमूना टिप्पणियों के परिणामों से लगाया जाना चाहिए।
मान लीजिए कि 0 और 1 पर प्राचलों का अनुमान लगाने के लिए, आकार n का एक नमूना द्वि-आयामी सामान्य जनसंख्या (x, y) से लिया जाता है, जहाँ (x, y,) i-वें अवलोकन का परिणाम है (i) = 1, 2,..., एन) . इस मामले में, प्रतिगमन विश्लेषण मॉडल का रूप है:
y j = at 0 + at 1 x+e j ।
जहाँ e j.- शून्य गणितीय अपेक्षा और विचरण y 2 के साथ स्वतंत्र सामान्य रूप से वितरित यादृच्छिक चर, यानी M e j। = 0;
डी ई जे। = वाई 2 सबके लिए मैं = 1, 2,..., एन।
कम से कम वर्ग विधि के अनुसार, 0 और 1 पर अज्ञात मापदंडों के अनुमान के रूप में, किसी को नमूना विशेषताओं b 0 और b 1 के ऐसे मान लेने चाहिए जो परिणामी मूल्यों के वर्ग विचलन के योग को कम करते हैं सशर्त गणितीय अपेक्षा से विशेषता y i? मैं
हम औसत आकार और आर्थिक गतिविधि के संकेतकों के साथ सत्रह विशिष्ट उद्यमों के उदाहरण का उपयोग करके किसी उद्यम के लाभ पर विपणन विशेषताओं के प्रभाव को निर्धारित करने की पद्धति पर विचार करेंगे।
समस्या को हल करते समय, निम्नलिखित विशेषताओं को ध्यान में रखा गया, जिन्हें प्रश्नावली सर्वेक्षण के परिणामस्वरूप सबसे महत्वपूर्ण (महत्वपूर्ण) के रूप में पहचाना गया:
* उद्यम की अभिनव गतिविधि;
* उत्पादों की श्रेणी की योजना बनाना;
* मूल्य निर्धारण नीति का गठन;
* जनसंपर्क;
* विपणन प्रणाली;
* कर्मचारी प्रोत्साहन प्रणाली।
कारकों द्वारा तुलना की प्रणाली के आधार पर, वर्ग आसन्न मैट्रिसेस का निर्माण किया गया था, जिसमें प्रत्येक कारक के सापेक्ष प्राथमिकताओं के मूल्यों की गणना की गई थी: उद्यम की नवीन गतिविधि, उत्पाद रेंज की योजना, मूल्य निर्धारण नीति, विज्ञापन, जनसंपर्क, बिक्री प्रणाली, कर्मचारी प्रोत्साहन प्रणाली।
कंपनी के विशेषज्ञों के एक सर्वेक्षण के परिणामस्वरूप "जनता के साथ संबंध" कारक के लिए प्राथमिकताओं का अनुमान प्राप्त किया गया था। निम्नलिखित पदनाम स्वीकार किए जाते हैं: > (बेहतर), > (बेहतर या समान), = (बराबर),< (хуже или одинаково), <
अगला, उद्यम के विपणन स्तर के व्यापक मूल्यांकन की समस्या हल हो गई। संकेतक की गणना करते समय, विशेष सुविधाओं के महत्व (वजन) को निर्धारित किया गया था और विशेष संकेतकों के रैखिक संकल्प की समस्या हल हो गई थी। डाटा प्रोसेसिंग विशेष रूप से विकसित कार्यक्रमों के अनुसार किया गया था।
अगला, उद्यम के विपणन के स्तर के एक व्यापक मूल्यांकन की गणना की जाती है - विपणन गुणांक, जिसे तालिका 1 में दर्ज किया गया है। इसके अलावा, उपरोक्त तालिका में उद्यम को समग्र रूप से दर्शाने वाले संकेतक शामिल हैं। तालिका में डेटा का उपयोग प्रतिगमन विश्लेषण के लिए किया जाएगा। परिणाम लाभ है। विपणन गुणांक के साथ, निम्नलिखित संकेतक कारक संकेतों के रूप में उपयोग किए गए थे: सकल उत्पादन की मात्रा, अचल संपत्तियों की लागत, कर्मचारियों की संख्या, विशेषज्ञता का गुणांक।
तालिका 1 - प्रतिगमन विश्लेषण के लिए प्रारंभिक डेटा
तालिका में डेटा के आधार पर और सहसंबंध गुणांक के सबसे महत्वपूर्ण मूल्यों वाले कारकों के आधार पर, कारकों पर लाभ की निर्भरता के प्रतिगमन कार्यों का निर्माण किया गया था।
हमारे मामले में प्रतिगमन समीकरण रूप लेगा:
प्रतिगमन समीकरण के गुणांक लाभ की मात्रा पर ऊपर चर्चा किए गए कारकों के मात्रात्मक प्रभाव के बारे में बोलते हैं। वे दिखाते हैं कि जब कारक चिन्ह एक इकाई से बदलता है तो कितने हजार रूबल का मूल्य बदल जाता है। जैसा कि समीकरण से होता है, विपणन मिश्रण अनुपात में एक इकाई की वृद्धि से लाभ में 1547.7 हजार रूबल की वृद्धि होती है। इससे पता चलता है कि विपणन गतिविधियों में सुधार के लिए उद्यमों के आर्थिक प्रदर्शन में सुधार की बहुत बड़ी संभावना है।
विपणन प्रभावशीलता के अध्ययन में, सबसे दिलचस्प और सबसे महत्वपूर्ण कारक विशेषता X5 कारक है - विपणन गुणांक। आँकड़ों के सिद्धांत के अनुसार, मौजूदा एकाधिक प्रतिगमन समीकरण का लाभ विपणन कारक सहित प्रत्येक कारक के पृथक प्रभाव का मूल्यांकन करने की क्षमता है।
किए गए प्रतिगमन विश्लेषण के परिणाम भी समीकरण के मापदंडों की गणना के लिए अधिक व्यापक रूप से उपयोग किए जाते हैं। अपेक्षाकृत बेहतर या अपेक्षाकृत बदतर के रूप में वर्गीकृत (केएफ) उद्यमों का मानदंड परिणाम के सापेक्ष संकेतक पर आधारित है:
जहां Y facti i-वें उद्यम का वास्तविक मूल्य है, हजार रूबल;
Y गणना - प्रतिगमन समीकरण के अनुसार गणना द्वारा प्राप्त i-वें उद्यम के लाभ का मूल्य
समस्या के समाधान के संदर्भ में, मूल्य को "दक्षता कारक" कहा जाता है। उद्यम की गतिविधि को उन मामलों में प्रभावी माना जा सकता है जहां गुणांक का मूल्य एक से अधिक है। इसका अर्थ है कि वास्तविक लाभ नमूने के औसत लाभ से अधिक है।
वास्तविक और परिकलित लाभ मान तालिका में प्रस्तुत किए गए हैं। 2.
तालिका 2 - प्रतिगमन मॉडल में प्रभावी विशेषता का विश्लेषण
तालिका के विश्लेषण से पता चलता है कि हमारे मामले में, समीक्षाधीन अवधि के लिए उद्यम 3, 5, 7, 9, 12, 14, 15, 17 की गतिविधियों को सफल माना जा सकता है।
प्रतिगमन विश्लेषण का मुख्य लक्ष्यरिश्ते के विश्लेषणात्मक रूप को निर्धारित करने में शामिल है, जिसमें परिणामी विशेषता में परिवर्तन एक या अधिक कारक संकेतों के प्रभाव के कारण होता है, और परिणामी विशेषता को प्रभावित करने वाले अन्य सभी कारकों के सेट को निरंतर और औसत मान के रूप में लिया जाता है .प्रतिगमन विश्लेषण के कार्य:
a) निर्भरता के रूप की स्थापना। घटना के बीच संबंध की प्रकृति और रूप के संबंध में, सकारात्मक रैखिक और गैर-रैखिक और नकारात्मक रैखिक और गैर-रैखिक प्रतिगमन हैं।
बी) एक या दूसरे प्रकार के गणितीय समीकरण के रूप में प्रतिगमन समारोह की परिभाषा और आश्रित चर पर व्याख्यात्मक चर के प्रभाव की स्थापना।
c) आश्रित चर के अज्ञात मूल्यों का अनुमान। प्रतिगमन फ़ंक्शन का उपयोग करके, आप व्याख्यात्मक चर के दिए गए मानों के अंतराल के भीतर आश्रित चर के मूल्यों को पुन: उत्पन्न कर सकते हैं (यानी, इंटरपोलेशन समस्या को हल करें) या निर्दिष्ट अंतराल के बाहर प्रक्रिया के पाठ्यक्रम का मूल्यांकन करें (यानी, एक्सट्रपलेशन समस्या को हल करें)। परिणाम निर्भर चर के मूल्य का अनुमान है।
जोड़ी प्रतिगमन - दो चर y और x के संबंध का समीकरण: y=f(x), जहां y निर्भर चर (परिणाम चिह्न) है; एक्स - स्वतंत्र, व्याख्यात्मक चर (फीचर-फैक्टर)।
रैखिक और गैर-रैखिक प्रतिगमन हैं।
रैखिक प्रतिगमन: y = a + bx + ε
गैर-रैखिक प्रतिगमन को दो वर्गों में विभाजित किया गया है: प्रतिगमन जो विश्लेषण में शामिल व्याख्यात्मक चर के संबंध में गैर-रैखिक हैं, लेकिन अनुमानित मापदंडों के संबंध में रैखिक हैं, और प्रतिगमन जो अनुमानित मापदंडों के संबंध में गैर-रैखिक हैं।
प्रतिगमन जो व्याख्यात्मक चर में गैर-रैखिक हैं:
प्रतिगमन जो अनुमानित मापदंडों में गैर-रैखिक हैं:
- घात y=a x b ε
- चरघातांकी y=a b x ε
- चरघातांकी y=e a+b x ε
.
रेखीय और अरैखिक समीकरणों के लिए रेखीय के लिए कम करने योग्य, निम्नलिखित प्रणाली a और b के लिए हल की जाती है:
आप तैयार किए गए फ़ार्मुलों का उपयोग कर सकते हैं जो इस प्रणाली से अनुसरण करते हैं:
अध्ययन की गई घटनाओं के बीच संबंध की निकटता का अनुमान रैखिक जोड़ी सहसंबंध गुणांक r xy द्वारा रैखिक प्रतिगमन (-1≤r xy ≤1) के लिए लगाया जाता है:
और सहसंबंध सूचकांक p xy - अरेखीय प्रतीपगमन के लिए (0≤p xy ≤1):
निर्मित मॉडल की गुणवत्ता का आकलन निर्धारण के गुणांक (सूचकांक) के साथ-साथ औसत सन्निकटन त्रुटि द्वारा दिया जाएगा।
औसत सन्निकटन त्रुटि वास्तविक लोगों से परिकलित मानों का औसत विचलन है:
.
मूल्यों की अनुमेय सीमा ए - 8-10% से अधिक नहीं।
लोच E का औसत गुणांक दिखाता है कि औसतन कितने प्रतिशत, परिणाम y अपने औसत मूल्य से औसतन बदल जाएगा जब कारक x अपने औसत मूल्य से 1% बदलता है:
.
विचरण के विश्लेषण का कार्य निर्भर चर के विचरण का विश्लेषण करना है:
∑(y-y )²=∑(y x -y )²+∑(y-y x)²
जहां ∑(y-y)² वर्ग विचलनों का कुल योग है;
∑(y x -y)² - प्रतीपगमन के कारण विचलनों के वर्ग का योग ("व्याख्या" या "तथ्यात्मक");
∑(y-y x)² - विचलनों के वर्ग का अवशिष्ट योग।
प्रभावी विशेषता y के कुल विचरण में प्रतिगमन द्वारा समझाया गया विचरण का हिस्सा निर्धारण R2 के गुणांक (सूचकांक) द्वारा विशेषता है:
निर्धारण का गुणांक गुणांक या सहसंबंध सूचकांक का वर्ग है।
एफ-परीक्षण - प्रतिगमन समीकरण की गुणवत्ता का मूल्यांकन - परिकल्पना के परीक्षण में शामिल है लेकिन प्रतिगमन समीकरण के सांख्यिकीय महत्व और कनेक्शन की निकटता के संकेतक के बारे में। इसके लिए, फिशर एफ-मानदंड के मूल्यों के वास्तविक एफ तथ्य और महत्वपूर्ण (सारणीबद्ध) एफ तालिका की तुलना की जाती है। एफ तथ्य स्वतंत्रता की एक डिग्री के लिए गणना किए गए फैक्टोरियल और अवशिष्ट भिन्नताओं के मूल्यों के अनुपात से निर्धारित होता है:
,
जहाँ n जनसंख्या इकाइयों की संख्या है; m चर x के लिए पैरामीटर्स की संख्या है।
एफ तालिका स्वतंत्रता और महत्व स्तर ए की दी गई डिग्री के लिए यादृच्छिक कारकों के प्रभाव में मानदंड का अधिकतम संभव मूल्य है। महत्व स्तर ए - सही परिकल्पना को अस्वीकार करने की संभावना, बशर्ते कि यह सच हो। आमतौर पर a को 0.05 या 0.01 के बराबर लिया जाता है।
अगर एफ टेबल< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >F एक तथ्य है, तो परिकल्पना H के बारे में अस्वीकार नहीं किया जाता है और सांख्यिकीय महत्वहीनता, प्रतिगमन समीकरण की अविश्वसनीयता को मान्यता दी जाती है।
प्रतिगमन और सहसंबंध गुणांक के सांख्यिकीय महत्व का आकलन करने के लिए, प्रत्येक संकेतक के लिए छात्र के टी-परीक्षण और विश्वास अंतराल की गणना की जाती है। संकेतकों की यादृच्छिक प्रकृति के बारे में एक परिकल्पना एच को आगे रखा गया है, अर्थात शून्य से उनके महत्वहीन अंतर के बारे में। छात्र के टी-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन यादृच्छिक त्रुटि के परिमाण के साथ उनके मूल्यों की तुलना करके किया जाता है:
; ; .
रेखीय प्रतिगमन मापदंडों और सहसंबंध गुणांक की यादृच्छिक त्रुटियां सूत्रों द्वारा निर्धारित की जाती हैं:
टी-सांख्यिकी के वास्तविक और महत्वपूर्ण (सारणीबद्ध) मूल्यों की तुलना - टी टेबल और टी तथ्य - हम परिकल्पना एच ओ को स्वीकार या अस्वीकार करते हैं।
फिशर के एफ-परीक्षण और छात्र के टी-सांख्यिकी के बीच संबंध समानता द्वारा व्यक्त किया गया है
यदि टी टेबल< t факт то H o отклоняется, т.е. a , b и r xy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >तथ्य यह है कि परिकल्पना H के बारे में अस्वीकार नहीं किया गया है और a, b या r xy के गठन की यादृच्छिक प्रकृति को मान्यता दी गई है।
विश्वास अंतराल की गणना करने के लिए, हम प्रत्येक सूचक के लिए सीमांत त्रुटि डी निर्धारित करते हैं:
Δ a =t टेबल m a , Δ b =t टेबल m b ।
कॉन्फिडेंस इंटरवल की गणना के सूत्र इस प्रकार हैं:
γ ए \u003d एΔ ए; γ ए \u003d ए-Δ ए; γ ए = ए + Δए
γ बी = बीΔ बी; γ बी = बी-Δ बी; γb = b + Δb
यदि शून्य विश्वास अंतराल की सीमाओं के भीतर आता है, अर्थात यदि निचली सीमा ऋणात्मक है और ऊपरी सीमा धनात्मक है, तो अनुमानित पैरामीटर शून्य माना जाता है, क्योंकि यह एक साथ सकारात्मक और नकारात्मक दोनों मान नहीं ले सकता है।
पूर्वानुमान मूल्य y p को प्रतिगमन समीकरण y x =a+b·x में संबंधित (पूर्वानुमान) मान x p को प्रतिस्थापित करके निर्धारित किया जाता है। पूर्वानुमान m y x की औसत मानक त्रुटि की गणना की जाती है:
,
कहाँ
और पूर्वानुमान का विश्वास अंतराल बनाया गया है:
γ y x =y p Δ y p ; γ y x मिनट=y p -Δ y p ; γ y x max=y p +Δ y p
जहाँ Δ y x =t तालिका ·m y x .
समाधान उदाहरण
टास्क नंबर 1। यूराल क्षेत्र के सात क्षेत्रों के लिए 199X के लिए, दो संकेतों के मान ज्ञात हैं।तालिका नंबर एक।
आवश्यक: 1. x पर y की निर्भरता को चिह्नित करने के लिए, निम्नलिखित कार्यों के मापदंडों की गणना करें:
ए) रैखिक;
बी) शक्ति कानून (पहले दोनों भागों के लघुगणक को लेकर चर के रैखिककरण की प्रक्रिया को निष्पादित करना आवश्यक है);
ग) प्रदर्शनकारी;
डी) समबाहु अतिपरवलय (आपको यह भी पता लगाने की आवश्यकता है कि इस मॉडल को पूर्व-रैखिक कैसे बनाया जाए)।
2. औसत सन्निकटन त्रुटि A और फिशर के F-परीक्षण के माध्यम से प्रत्येक मॉडल का मूल्यांकन करें।
समाधान (विकल्प #1)
रैखिक प्रतिगमन y=a+b·x के पैरामीटर a और b की गणना करने के लिए (कैलकुलेटर का उपयोग करके गणना की जा सकती है)।के संबंध में सामान्य समीकरणों की प्रणाली को हल करें एऔर बी:
प्रारंभिक डेटा के आधार पर, हम ∑y, ∑x, ∑y x, ∑x², ∑y² की गणना करते हैं:
वाई | एक्स | वाईएक्स | x2 | y2 | वाई एक्स | वाई-वाई एक्स | ए आई | |
एल | 68,8 | 45,1 | 3102,88 | 2034,01 | 4733,44 | 61,3 | 7,5 | 10,9 |
2 | 61,2 | 59,0 | 3610,80 | 3481,00 | 3745,44 | 56,5 | 4,7 | 7,7 |
3 | 59,9 | 57,2 | 3426,28 | 3271,84 | 3588,01 | 57,1 | 2,8 | 4,7 |
4 | 56,7 | 61,8 | 3504,06 | 3819,24 | 3214,89 | 55,5 | 1,2 | 2,1 |
5 | 55,0 | 58,8 | 3234,00 | 3457,44 | 3025,00 | 56,5 | -1,5 | 2,7 |
6 | 54,3 | 47,2 | 2562,96 | 2227,84 | 2948,49 | 60,5 | -6,2 | 11,4 |
7 | 49,3 | 55,2 | 2721,36 | 3047,04 | 2430,49 | 57,8 | -8,5 | 17,2 |
कुल | 405,2 | 384,3 | 22162,34 | 21338,41 | 23685,76 | 405,2 | 0,0 | 56,7 |
बुध कीमत (कुल/एन) | 57,89 वाई | 54,90 एक्स | 3166,05 एक्स वाई | 3048,34 x² | 3383,68 वाई² | एक्स | एक्स | 8,1 |
एस | 5,74 | 5,86 | एक्स | एक्स | एक्स | एक्स | एक्स | एक्स |
एस 2 | 32,92 | 34,34 | एक्स | एक्स | एक्स | एक्स | एक्स | एक्स |
ए=वाई -बी एक्स = 57.89+0.35 54.9 ≈ 76.88
प्रतिगमन समीकरण: वाई = 76,88 - 0,35एक्स।औसत दैनिक मजदूरी में 1 रगड़ की वृद्धि के साथ। खाद्य उत्पादों की खरीद पर खर्च का हिस्सा औसतन 0.35% अंक कम हो जाता है।
जोड़ी सहसंबंध के रैखिक गुणांक की गणना करें:
संचार मध्यम, उल्टा है।
आइए दृढ़ संकल्प का गुणांक निर्धारित करें: r² xy =(-0.35)=0.127
परिणाम में 12.7% भिन्नता को x कारक में भिन्नता द्वारा समझाया गया है। प्रतिगमन समीकरण में वास्तविक मूल्यों को प्रतिस्थापित करना एक्स, हम y x के सैद्धांतिक (परिकलित) मान निर्धारित करते हैं। आइए हम औसत सन्निकटन त्रुटि A का मान ज्ञात करें:
औसतन, परिकलित मान वास्तविक से 8.1% तक विचलित होते हैं।
आइए एफ-मानदंड की गणना करें:
प्राप्त मूल्य प्रकट निर्भरता की यादृच्छिक प्रकृति और समीकरण के मापदंडों के सांख्यिकीय महत्व और कनेक्शन की जकड़न के संकेतक के बारे में परिकल्पना एच 0 को स्वीकार करने की आवश्यकता को इंगित करता है।
1बी।पावर मॉडल y=a x b का निर्माण चरों के रैखिककरण की प्रक्रिया से पहले होता है। उदाहरण में, समीकरण के दोनों पक्षों का लघुगणक लेकर रैखिककरण किया जाता है:
एलजी वाई = एलजी ए + बी एलजी एक्स
वाई = सी + बी वाई
जहां वाई = एलजी (वाई), एक्स = एलजी (एक्स), सी = एलजी (ए)।
गणना के लिए, हम तालिका में डेटा का उपयोग करते हैं। 1.3।
तालिका 1.3
वाई | एक्स | YX | वाई2 | x2 | वाई एक्स | वाई-वाई एक्स | (वाई-वाईएक्स)² | ए आई | |
1 | 1,8376 | 1,6542 | 3,0398 | 3,3768 | 2,7364 | 61,0 | 7,8 | 60,8 | 11,3 |
2 | 1,7868 | 1,7709 | 3,1642 | 3,1927 | 3,1361 | 56,3 | 4,9 | 24,0 | 8,0 |
3 | 1,7774 | 1,7574 | 3,1236 | 3,1592 | 3,0885 | 56,8 | 3,1 | 9,6 | 5,2 |
4 | 1,7536 | 1,7910 | 3,1407 | 3,0751 | 3,2077 | 55,5 | 1,2 | 1,4 | 2,1 |
5 | 1,7404 | 1,7694 | 3,0795 | 3,0290 | 3,1308 | 56,3 | -1,3 | 1,7 | 2,4 |
6 | 1,7348 | 1,6739 | 2,9039 | 3,0095 | 2,8019 | 60,2 | -5,9 | 34,8 | 10,9 |
7 | 1,6928 | 1,7419 | 2,9487 | 2,8656 | 3,0342 | 57,4 | -8,1 | 65,6 | 16,4 |
कुल | 12,3234 | 12,1587 | 21,4003 | 21,7078 | 21,1355 | 403,5 | 1,7 | 197,9 | 56,3 |
औसत मूल्य | 1,7605 | 1,7370 | 3,0572 | 3,1011 | 3,0194 | एक्स | एक्स | 28,27 | 8,0 |
σ | 0,0425 | 0,0484 | एक्स | एक्स | एक्स | एक्स | एक्स | एक्स | एक्स |
σ2 | 0,0018 | 0,0023 | एक्स | एक्स | एक्स | एक्स | एक्स | एक्स | एक्स |
सी और बी की गणना करें:
सी = वाई -बी एक्स = 1.7605 + 0.298 1.7370 = 2.278126
हमें एक रेखीय समीकरण मिलता है: Y=2.278-0.298 X
इसे प्रबल करने के बाद, हमें मिलता है: y=10 2.278 x -0.298
इस समीकरण में वास्तविक मूल्यों को प्रतिस्थापित करना एक्स,हम परिणाम के सैद्धांतिक मूल्य प्राप्त करते हैं। उनके आधार पर, हम संकेतकों की गणना करते हैं: कनेक्शन की जकड़न - सहसंबंध सूचकांक p xy और औसत सन्निकटन त्रुटि A ।
पावर मॉडल की विशेषताओं से संकेत मिलता है कि यह रैखिक कार्य से कुछ हद तक संबंध का वर्णन करता है।
1 सी. घातीय वक्र y \u003d a b x के समीकरण का निर्माण समीकरण के दोनों भागों का लघुगणक लेते समय चर को रैखिक करने की प्रक्रिया से पहले होता है:
एलजी वाई = एलजी ए + एक्स एलजी बी
वाई = सी + बी एक्स
गणना के लिए, हम तालिका डेटा का उपयोग करते हैं।
वाई | एक्स | वाईएक्स | वाई2 | x2 | वाई एक्स | वाई-वाई एक्स | (वाई-वाईएक्स)² | ए आई | |
1 | 1,8376 | 45,1 | 82,8758 | 3,3768 | 2034,01 | 60,7 | 8,1 | 65,61 | 11,8 |
2 | 1,7868 | 59,0 | 105,4212 | 3,1927 | 3481,00 | 56,4 | 4,8 | 23,04 | 7,8 |
3 | 1,7774 | 57,2 | 101,6673 | 3,1592 | 3271,84 | 56,9 | 3,0 | 9,00 | 5,0 |
4 | 1,7536 | 61,8 | 108,3725 | 3,0751 | 3819,24 | 55,5 | 1,2 | 1,44 | 2,1 |
5 | 1,7404 | 58,8 | 102,3355 | 3,0290 | 3457,44 | 56,4 | -1,4 | 1,96 | 2,5 |
6 | 1,7348 | 47,2 | 81,8826 | 3,0095 | 2227,84 | 60,0 | -5,7 | 32,49 | 10,5 |
7 | 1,6928 | 55,2 | 93,4426 | 2,8656 | 3047,04 | 57,5 | -8,2 | 67,24 | 16,6 |
कुल | 12,3234 | 384,3 | 675,9974 | 21,7078 | 21338,41 | 403,4 | -1,8 | 200,78 | 56,3 |
बुध जेएन। | 1,7605 | 54,9 | 96,5711 | 3,1011 | 3048,34 | एक्स | एक्स | 28,68 | 8,0 |
σ | 0,0425 | 5,86 | एक्स | एक्स | एक्स | एक्स | एक्स | एक्स | एक्स |
σ2 | 0,0018 | 34,339 | एक्स | एक्स | एक्स | एक्स | एक्स | एक्स | एक्स |
प्रतिगमन पैरामीटर ए और के मान मेंकुल राषि का जोड़:
ए = वाई -बी एक्स = 1.7605 + 0.0023 54.9 = 1.887
एक रेखीय समीकरण प्राप्त होता है: Y=1.887-0.0023x। हम परिणामी समीकरण को प्रबल करते हैं और इसे सामान्य रूप में लिखते हैं:
y x =10 1.887 10 -0.0023x = 77.1 0.9947 x
हम सहसंबंध सूचकांक p xy के माध्यम से संबंधों की मजबूती का अनुमान लगाते हैं: