प्रतिगमन विश्लेषण चरण दर चरण। रैखिक प्रतिगमन के मूल तत्व

प्रतिगमन और सहसंबंध विश्लेषण - सांख्यिकीय अनुसंधान के तरीके। एक या अधिक स्वतंत्र चर पर पैरामीटर की निर्भरता दिखाने के ये सबसे आम तरीके हैं।

नीचे, ठोस व्यावहारिक उदाहरणों का उपयोग करते हुए, हम अर्थशास्त्रियों के बीच इन दो बहुत लोकप्रिय विश्लेषणों पर विचार करेंगे। हम संयुक्त होने पर परिणाम प्राप्त करने का एक उदाहरण भी देंगे।

एक्सेल में प्रतिगमन विश्लेषण

आश्रित चर पर कुछ मूल्यों (स्वतंत्र, स्वतंत्र) के प्रभाव को दर्शाता है। उदाहरण के लिए, आर्थिक रूप से सक्रिय जनसंख्या की संख्या उद्यमों की संख्या, मजदूरी और अन्य मापदंडों पर कैसे निर्भर करती है। या: विदेशी निवेश, ऊर्जा की कीमतें आदि जीडीपी के स्तर को कैसे प्रभावित करते हैं।

विश्लेषण का नतीजा आपको प्राथमिकता देने की अनुमति देता है। और मुख्य कारकों के आधार पर, भविष्यवाणी करने के लिए, प्राथमिकता वाले क्षेत्रों के विकास की योजना बनाएं, प्रबंधन निर्णय लें।

प्रतिगमन होता है:

  • रैखिक (वाई = ए + बीएक्स);
  • परवलयिक (y = a + bx + cx 2);
  • घातीय (वाई = ए * एक्सप (बीएक्स));
  • शक्ति (वाई = ए * एक्स ^ बी);
  • अतिशयोक्तिपूर्ण (y = b/x + a);
  • लघुगणक (y = b * 1n(x) + a);
  • घातीय (वाई = ए * बी^एक्स)।

एक्सेल में एक रिग्रेशन मॉडल बनाने और परिणामों की व्याख्या करने के उदाहरण पर विचार करें। आइए एक रेखीय प्रकार का प्रतिगमन लें।

काम। 6 उद्यमों में, औसत मासिक वेतन और छोड़ने वाले कर्मचारियों की संख्या का विश्लेषण किया गया। औसत वेतन पर सेवानिवृत्त कर्मचारियों की संख्या की निर्भरता निर्धारित करना आवश्यक है।

रैखिक प्रतिगमन मॉडल के निम्नलिखित रूप हैं:

वाई \u003d ए 0 + ए 1 एक्स 1 + ... + ए के एक्स के।

जहाँ a प्रतिगमन गुणांक हैं, x प्रभावशाली चर हैं, और k कारकों की संख्या है।

हमारे उदाहरण में, Y नौकरी छोड़ने का सूचक है। प्रभावित करने वाला कारक मजदूरी (x) है।

एक्सेल में अंतर्निहित कार्य हैं जिनका उपयोग एक रेखीय प्रतिगमन मॉडल के मापदंडों की गणना के लिए किया जा सकता है। लेकिन एनालिसिस टूलपैक एड-इन इसे तेजी से करेगा।

एक शक्तिशाली विश्लेषणात्मक उपकरण को सक्रिय करें:

एक बार सक्रिय होने के बाद, ऐड-ऑन डेटा टैब के अंतर्गत उपलब्ध होगा।

अब हम सीधे प्रतिगमन विश्लेषण से निपटेंगे।



सबसे पहले, हम आर-स्क्वायर और गुणांकों पर ध्यान देते हैं।

आर-स्क्वायर दृढ़ संकल्प का गुणांक है। हमारे उदाहरण में, यह 0.755, या 75.5% है। इसका मतलब है कि मॉडल के परिकलित पैरामीटर 75.5% द्वारा अध्ययन किए गए मापदंडों के बीच संबंध की व्याख्या करते हैं। निर्धारण का गुणांक जितना अधिक होगा, मॉडल उतना ही बेहतर होगा। अच्छा - 0.8 से ऊपर। खराब - 0.5 से कम (इस तरह के विश्लेषण को शायद ही उचित माना जा सकता है)। हमारे उदाहरण में - "बुरा नहीं"।

गुणांक 64.1428 दिखाता है कि Y क्या होगा यदि विचाराधीन मॉडल में सभी चर 0 के बराबर हैं। अर्थात, अन्य कारक जो मॉडल में वर्णित नहीं हैं, वे भी विश्लेषण किए गए पैरामीटर के मान को प्रभावित करते हैं।

गुणांक -0.16285 Y पर चर X का भार दर्शाता है। यानी, इस मॉडल के भीतर औसत मासिक वेतन -0.16285 के भार के साथ छोड़ने वालों की संख्या को प्रभावित करता है (यह प्रभाव का एक छोटा अंश है)। "-" चिह्न एक नकारात्मक प्रभाव को इंगित करता है: वेतन जितना अधिक होगा, उतनी ही कम नौकरी छोड़नी होगी। जो उचित है।



एक्सेल में सहसंबंध विश्लेषण

सहसंबंध विश्लेषण यह स्थापित करने में मदद करता है कि एक या दो नमूनों में संकेतकों के बीच संबंध है या नहीं। उदाहरण के लिए, मशीन के परिचालन समय और मरम्मत की लागत, उपकरण की कीमत और संचालन की अवधि, बच्चों की ऊंचाई और वजन आदि के बीच।

यदि कोई संबंध है, तो क्या एक पैरामीटर में वृद्धि दूसरे में वृद्धि (सकारात्मक सहसंबंध) या कमी (नकारात्मक) की ओर ले जाती है। सहसंबंध विश्लेषण विश्लेषक को यह निर्धारित करने में मदद करता है कि क्या एक संकेतक का मूल्य दूसरे के संभावित मूल्य की भविष्यवाणी कर सकता है।

सहसंबंध गुणांक को निरूपित किया जाता है। +1 से -1 तक भिन्न होता है। विभिन्न क्षेत्रों के लिए सहसंबंधों का वर्गीकरण अलग-अलग होगा। जब गुणांक मान 0 होता है, तो नमूनों के बीच कोई रैखिक संबंध नहीं होता है।

सहसंबंध गुणांक खोजने के लिए एक्सेल का उपयोग कैसे करें, इस पर विचार करें।

CORREL फ़ंक्शन का उपयोग युग्मित गुणांकों को खोजने के लिए किया जाता है।

कार्य: यह निर्धारित करें कि खराद के परिचालन समय और उसके रखरखाव की लागत के बीच कोई संबंध है या नहीं।

कर्सर को किसी भी सेल में रखें और fx बटन दबाएं।

  1. "सांख्यिकीय" श्रेणी में, CORREL फ़ंक्शन का चयन करें।
  2. तर्क "ऐरे 1" - मानों की पहली श्रेणी - मशीन का समय: A2: A14।
  3. तर्क "सरणी 2" - मूल्यों की दूसरी श्रेणी - मरम्मत की लागत: B2:B14। ओके पर क्लिक करें।

कनेक्शन के प्रकार को निर्धारित करने के लिए, आपको गुणांक की पूर्ण संख्या को देखने की आवश्यकता है (गतिविधि के प्रत्येक क्षेत्र का अपना पैमाना है)।

कई मापदंडों (2 से अधिक) के सहसंबंध विश्लेषण के लिए, "डेटा विश्लेषण" ("विश्लेषण पैकेज" ऐड-ऑन) का उपयोग करना अधिक सुविधाजनक है। सूची में, आपको एक सहसंबंध का चयन करने और एक सरणी निर्दिष्ट करने की आवश्यकता है। सभी।

परिणामी गुणांक सहसंबंध मैट्रिक्स में प्रदर्शित किए जाएंगे। इसे लाईक करें:

सहसंबंध-प्रतिगमन विश्लेषण

व्यवहार में, इन दो तकनीकों का अक्सर एक साथ उपयोग किया जाता है।

उदाहरण:


अब प्रतिगमन विश्लेषण डेटा दिखाई दे रहा है।

सांख्यिकीय मॉडलिंग में, प्रतिगमन विश्लेषण एक अध्ययन है जिसका उपयोग चर के बीच संबंधों का मूल्यांकन करने के लिए किया जाता है। इस गणितीय पद्धति में मॉडलिंग और कई चरों का विश्लेषण करने के लिए कई अन्य तरीके शामिल हैं, जब एक आश्रित चर और एक या अधिक स्वतंत्र चर के बीच संबंध पर ध्यान केंद्रित किया जाता है। अधिक विशेष रूप से, प्रतिगमन विश्लेषण आपको यह समझने में मदद करता है कि आश्रित चर के विशिष्ट मूल्य कैसे बदलते हैं यदि एक स्वतंत्र चर में परिवर्तन होता है जबकि अन्य स्वतंत्र चर स्थिर रहते हैं।

सभी मामलों में, लक्ष्य स्कोर स्वतंत्र चर का एक कार्य है और इसे प्रतिगमन फ़ंक्शन कहा जाता है। प्रतिगमन विश्लेषण में, प्रतिगमन के एक समारोह के रूप में निर्भर चर में परिवर्तन को चिह्नित करने के लिए भी रुचि है, जिसे संभाव्यता वितरण का उपयोग करके वर्णित किया जा सकता है।

प्रतिगमन विश्लेषण के कार्य

इस सांख्यिकीय अनुसंधान पद्धति का व्यापक रूप से पूर्वानुमान के लिए उपयोग किया जाता है, जहां इसके उपयोग का एक महत्वपूर्ण लाभ है, लेकिन कभी-कभी यह भ्रम या झूठे संबंधों को जन्म दे सकता है, इसलिए इसे इस प्रश्न में सावधानी से उपयोग करने की अनुशंसा की जाती है, उदाहरण के लिए, सहसंबंध का अर्थ नहीं है कारण।

प्रतिगमन विश्लेषण करने के लिए बड़ी संख्या में विधियाँ विकसित की गई हैं, जैसे रैखिक और साधारण न्यूनतम वर्ग प्रतिगमन, जो पैरामीट्रिक हैं। उनका सार यह है कि प्रतिगमन फ़ंक्शन को डेटा से अनुमानित अज्ञात मापदंडों की एक सीमित संख्या के संदर्भ में परिभाषित किया गया है। गैर पैरामीट्रिक प्रतिगमन अपने कार्य को कार्यों के एक निश्चित सेट में झूठ बोलने की अनुमति देता है, जो कि अनंत-आयामी हो सकता है।

एक सांख्यिकीय अनुसंधान पद्धति के रूप में, अभ्यास में प्रतिगमन विश्लेषण डेटा निर्माण प्रक्रिया के रूप पर निर्भर करता है और यह कैसे प्रतिगमन दृष्टिकोण से संबंधित है। चूंकि डेटा प्रक्रिया उत्पन्न करने का वास्तविक रूप आम तौर पर एक अज्ञात संख्या है, डेटा प्रतिगमन विश्लेषण अक्सर प्रक्रिया के बारे में धारणाओं पर कुछ हद तक निर्भर करता है। पर्याप्त डेटा उपलब्ध होने पर ये धारणाएँ कभी-कभी परीक्षण योग्य होती हैं। प्रतिगमन मॉडल अक्सर तब भी उपयोगी होते हैं जब धारणाओं का सामान्य रूप से उल्लंघन किया जाता है, हालांकि वे अपने सर्वश्रेष्ठ प्रदर्शन नहीं कर सकते हैं।

संकीर्ण अर्थ में, प्रतिगमन विशेष रूप से निरंतर प्रतिक्रिया चर के अनुमान को संदर्भित कर सकता है, जैसा कि वर्गीकरण में उपयोग किए जाने वाले असतत प्रतिक्रिया चर के विपरीत है। निरंतर आउटपुट चर के मामले को संबंधित समस्याओं से अलग करने के लिए मीट्रिक प्रतिगमन भी कहा जाता है।

कहानी

प्रतिगमन का सबसे प्रारंभिक रूप कम से कम वर्गों की प्रसिद्ध विधि है। इसे 1805 में लीजेंड्रे और 1809 में गॉस द्वारा प्रकाशित किया गया था। लीजेंड्रे और गॉस ने खगोलीय अवलोकनों से सूर्य के चारों ओर पिंडों की कक्षाओं (मुख्य रूप से धूमकेतु, लेकिन बाद में नए खोजे गए छोटे ग्रहों) के निर्धारण की समस्या के लिए विधि लागू की। गॉस ने 1821 में गॉस-मार्कोव प्रमेय के एक संस्करण सहित कम से कम वर्गों के सिद्धांत का एक और विकास प्रकाशित किया।

"प्रतिगमन" शब्द 19वीं शताब्दी में फ्रांसिस गैल्टन द्वारा एक जैविक घटना का वर्णन करने के लिए गढ़ा गया था। लब्बोलुआब यह था कि पूर्वजों की वृद्धि से वंशजों की वृद्धि, एक नियम के रूप में, सामान्य औसत तक कम हो जाती है। गैल्टन के लिए, प्रतिगमन का केवल यही जैविक अर्थ था, लेकिन बाद में उनके काम को उदनी योले और कार्ल पियर्सन ने लिया और एक अधिक सामान्य सांख्यिकीय संदर्भ में ले लिया। यूल और पियर्सन के काम में, प्रतिक्रिया और व्याख्यात्मक चर का संयुक्त वितरण गॉसियन माना जाता है। इस धारणा को फिशर ने 1922 और 1925 के पत्रों में खारिज कर दिया था। फिशर ने सुझाव दिया कि प्रतिक्रिया चर का सशर्त वितरण गाऊसी है, लेकिन संयुक्त वितरण की आवश्यकता नहीं है। इस संबंध में, फिशर का सुझाव गॉस के 1821 सूत्रीकरण के करीब है। 1970 से पहले, प्रतिगमन विश्लेषण का परिणाम प्राप्त करने में कभी-कभी 24 घंटे तक लग जाते थे।

प्रतिगमन विश्लेषण विधियाँ सक्रिय अनुसंधान का एक क्षेत्र बनी हुई हैं। हाल के दशकों में, मजबूत प्रतिगमन के लिए नए तरीके विकसित किए गए हैं; सहसंबद्ध प्रतिक्रियाओं से जुड़े प्रतिगमन; प्रतिगमन विधियाँ जो विभिन्न प्रकार के लापता डेटा को समायोजित करती हैं; गैर पैरामीट्रिक प्रतिगमन; बायेसियन प्रतिगमन विधियां; प्रतिगमन जिसमें पूर्वसूचक चर त्रुटि के साथ मापा जाता है; अवलोकनों की तुलना में अधिक भविष्यवक्ताओं के साथ प्रतिगमन और प्रतिगमन के साथ कारण संबंधी निष्कर्ष।

प्रतिगमन मॉडल

प्रतिगमन विश्लेषण मॉडल में निम्नलिखित चर शामिल हैं:

  • अज्ञात पैरामीटर, जिसे बीटा के रूप में दर्शाया गया है, जो एक अदिश या सदिश हो सकता है।
  • स्वतंत्र चर, एक्स।
  • आश्रित चर, वाई।

विज्ञान के विभिन्न क्षेत्रों में जहां प्रतिगमन विश्लेषण लागू किया जाता है, निर्भर और स्वतंत्र चर के बजाय अलग-अलग शब्दों का उपयोग किया जाता है, लेकिन सभी मामलों में प्रतिगमन मॉडल Y को X और β के कार्य से संबंधित करता है।

सन्निकटन आमतौर पर E (Y | X) = F (X, β) के रूप में तैयार किया जाता है। प्रतिगमन विश्लेषण करने के लिए, फ़ंक्शन f का रूप निर्धारित किया जाना चाहिए। शायद ही कभी, यह वाई और एक्स के बीच संबंधों के बारे में ज्ञान पर आधारित है जो डेटा पर भरोसा नहीं करता है। यदि ऐसा ज्ञान उपलब्ध नहीं है, तो एक लचीला या सुविधाजनक रूप F चुना जाता है।

आश्रित चर वाई

आइए अब मान लें कि अज्ञात पैरामीटर β के वेक्टर की लंबाई k है। प्रतिगमन विश्लेषण करने के लिए, उपयोगकर्ता को आश्रित चर Y के बारे में जानकारी प्रदान करनी चाहिए:

  • यदि प्रपत्र (Y, X) के N डेटा बिंदु देखे जाते हैं, जहाँ N< k, большинство классических подходов к регрессионному анализу не могут быть выполнены, так как система уравнений, определяющих модель регрессии в качестве недоопределенной, не имеет достаточного количества данных, чтобы восстановить β.
  • यदि वास्तव में N = K देखा जाता है, और फ़ंक्शन F रैखिक है, तो समीकरण Y = F(X, β) को ठीक से हल किया जा सकता है, लगभग नहीं। यह N-अज्ञात (β के तत्व) के साथ N-समीकरणों के एक सेट को हल करने के लिए उबलता है जिसका एक अद्वितीय समाधान है जब तक कि X रैखिक रूप से स्वतंत्र है। यदि F अरैखिक है, तो समाधान मौजूद नहीं हो सकता है, या कई समाधान हो सकते हैं।
  • सबसे आम स्थिति वह है जहां डेटा में N > बिंदु होते हैं। इस मामले में, β के अद्वितीय मूल्य का अनुमान लगाने के लिए डेटा में पर्याप्त जानकारी है जो डेटा के लिए सबसे उपयुक्त है, और डेटा पर लागू होने पर प्रतिगमन मॉडल को β में ओवरराइड सिस्टम के रूप में देखा जा सकता है।

बाद के मामले में, प्रतिगमन विश्लेषण इसके लिए उपकरण प्रदान करता है:

  • अज्ञात पैरामीटर β के लिए एक समाधान खोजना, जो, उदाहरण के लिए, Y के मापा और अनुमानित मान के बीच की दूरी को कम करेगा।
  • कुछ सांख्यिकीय मान्यताओं के तहत, प्रतिगमन विश्लेषण अज्ञात मापदंडों β और आश्रित चर Y के अनुमानित मूल्यों के बारे में सांख्यिकीय जानकारी प्रदान करने के लिए अतिरिक्त जानकारी का उपयोग करता है।

स्वतंत्र माप की आवश्यक संख्या

एक प्रतिगमन मॉडल पर विचार करें जिसमें तीन अज्ञात पैरामीटर हैं: β 0, β 1 और β 2। मान लेते हैं कि प्रयोगकर्ता सदिश X के स्वतंत्र चर के समान मान में 10 माप करता है। इस मामले में, प्रतिगमन विश्लेषण मूल्यों का एक अनूठा सेट नहीं देता है। आप जो सबसे अच्छा कर सकते हैं, वह निर्भर चर Y के माध्य और मानक विचलन का अनुमान है। इसी तरह, X के दो अलग-अलग मानों को मापकर, आप दो अज्ञात के साथ प्रतिगमन के लिए पर्याप्त डेटा प्राप्त कर सकते हैं, लेकिन तीन या अधिक अज्ञात के लिए नहीं।

यदि प्रयोगकर्ता के माप स्वतंत्र वेक्टर चर एक्स के तीन अलग-अलग मूल्यों पर लिए गए थे, तो प्रतिगमन विश्लेषण β में तीन अज्ञात मापदंडों के लिए अनुमानों का एक अनूठा सेट प्रदान करेगा।

सामान्य रेखीय प्रतिगमन के मामले में, उपरोक्त कथन इस आवश्यकता के बराबर है कि मैट्रिक्स X T X व्युत्क्रमणीय है।

सांख्यिकीय अनुमान

जब माप N की संख्या अज्ञात पैरामीटर k और माप त्रुटियों ε i की संख्या से अधिक होती है, तो, एक नियम के रूप में, माप में निहित अतिरिक्त जानकारी वितरित की जाती है और अज्ञात पैरामीटर के संबंध में सांख्यिकीय भविष्यवाणियों के लिए उपयोग की जाती है। सूचना की इस अधिकता को प्रतिगमन की स्वतंत्रता की डिग्री कहा जाता है।

निहित मान्यताएं

प्रतिगमन विश्लेषण के लिए क्लासिक मान्यताओं में शामिल हैं:

  • नमूनाकरण अनुमान भविष्यवाणी का प्रतिनिधि है।
  • त्रुटि शून्य के औसत मान के साथ एक यादृच्छिक चर है, जो व्याख्यात्मक चर पर सशर्त है।
  • स्वतंत्र चरों को त्रुटियों के बिना मापा जाता है।
  • स्वतंत्र चर (भविष्यवक्ता) के रूप में, वे रैखिक रूप से स्वतंत्र हैं, अर्थात किसी भी भविष्यवक्ता को दूसरों के रैखिक संयोजन के रूप में व्यक्त करना संभव नहीं है।
  • त्रुटियां असंबंधित हैं, अर्थात्, विकर्णों की त्रुटि सहप्रसरण मैट्रिक्स और प्रत्येक गैर-शून्य तत्व त्रुटि का विचरण है।
  • त्रुटि विचरण प्रेक्षणों (समरूपता) में स्थिर है। यदि नहीं, तो भारित न्यूनतम वर्ग या अन्य विधियों का उपयोग किया जा सकता है।

कम से कम वर्गों के अनुमान के लिए इन पर्याप्त स्थितियों में आवश्यक गुण हैं, विशेष रूप से इन धारणाओं का मतलब है कि पैरामीटर अनुमान वस्तुनिष्ठ, सुसंगत और कुशल होंगे, खासकर जब रैखिक अनुमानों की कक्षा में ध्यान में रखा जाता है। यह ध्यान रखना महत्वपूर्ण है कि वास्तविक डेटा शायद ही कभी शर्तों को पूरा करता हो। अर्थात धारणा सही न होने पर भी विधि का प्रयोग किया जाता है। कभी-कभी धारणाओं से भिन्नता का उपयोग इस बात के माप के रूप में किया जा सकता है कि मॉडल कितना उपयोगी है। इनमें से कई धारणाओं को अधिक उन्नत तरीकों से शिथिल किया जा सकता है। सांख्यिकीय विश्लेषण रिपोर्ट में आमतौर पर मॉडल की उपयोगिता के लिए नमूना डेटा और कार्यप्रणाली के विरुद्ध परीक्षणों का विश्लेषण शामिल होता है।

इसके अलावा, कुछ मामलों में चर बिंदु स्थानों पर मापे गए मानों को संदर्भित करते हैं। सांख्यिकीय धारणाओं का उल्लंघन करने वाले चर में स्थानिक रुझान और स्थानिक स्वसंबंध हो सकते हैं। भौगोलिक भारित प्रतिगमन एकमात्र तरीका है जो ऐसे डेटा से संबंधित है।

रेखीय प्रतिगमन में, विशेषता यह है कि आश्रित चर, जो कि Y i है, मापदंडों का एक रैखिक संयोजन है। उदाहरण के लिए, सरल रेखीय प्रतिगमन में, एन-पॉइंट मॉडलिंग एक स्वतंत्र चर, x i और दो पैरामीटर, β 0 और β 1 का उपयोग करता है।

एकाधिक रैखिक प्रतिगमन में, कई स्वतंत्र चर या उनके कार्य होते हैं।

जब किसी आबादी से बेतरतीब ढंग से नमूना लिया जाता है, तो इसके पैरामीटर एक रेखीय प्रतिगमन मॉडल का नमूना प्राप्त करना संभव बनाते हैं।

इस पहलू में, सबसे कम वर्ग विधि सबसे लोकप्रिय है। यह पैरामीटर अनुमान प्रदान करता है जो अवशिष्टों के वर्गों के योग को कम करता है। इस प्रकार के न्यूनीकरण (जो रैखिक प्रतिगमन के लिए विशिष्ट है) इस फ़ंक्शन के सामान्य समीकरणों के एक सेट और पैरामीटर के साथ रैखिक समीकरणों के एक सेट की ओर जाता है, जो पैरामीटर अनुमान प्राप्त करने के लिए हल किए जाते हैं।

यह मानते हुए कि जनसंख्या त्रुटि आम तौर पर फैलती है, शोधकर्ता मानक त्रुटियों के इन अनुमानों का उपयोग विश्वास अंतराल बनाने और इसके मापदंडों के बारे में परिकल्पना परीक्षण करने के लिए कर सकता है।

अरेखीय प्रतिगमन विश्लेषण

एक उदाहरण जहां पैरामीटर के संबंध में फ़ंक्शन रैखिक नहीं है, यह इंगित करता है कि वर्गों का योग पुनरावृत्त प्रक्रिया के साथ कम किया जाना चाहिए। यह कई जटिलताओं का परिचय देता है जो रैखिक और गैर-रैखिक कम से कम वर्ग विधियों के बीच अंतर को परिभाषित करता है। नतीजतन, गैर-रैखिक विधि का उपयोग करते समय प्रतिगमन विश्लेषण के परिणाम कभी-कभी अप्रत्याशित होते हैं।

शक्ति और नमूना आकार की गणना

यहां, एक नियम के रूप में, मॉडल में स्वतंत्र चर की संख्या की तुलना में अवलोकनों की संख्या के संबंध में कोई सुसंगत तरीके नहीं हैं। पहला नियम डोबरा और हार्डिन द्वारा प्रस्तावित किया गया था और एन = टी ^ एन जैसा दिखता है, जहां एन नमूना आकार है, एन व्याख्यात्मक चर की संख्या है, और टी वांछित सटीकता प्राप्त करने के लिए आवश्यक अवलोकनों की संख्या है यदि मॉडल था केवल एक व्याख्यात्मक चर। उदाहरण के लिए, एक शोधकर्ता एक डेटासेट का उपयोग करके एक रेखीय प्रतिगमन मॉडल बनाता है जिसमें 1000 रोगी (N) होते हैं। यदि शोधकर्ता यह निर्णय लेता है कि रेखा (एम) को सटीक रूप से निर्धारित करने के लिए पांच अवलोकनों की आवश्यकता है, तो मॉडल द्वारा समर्थित व्याख्यात्मक चर की अधिकतम संख्या 4 है।

अन्य तरीके

हालांकि एक प्रतिगमन मॉडल के मापदंडों का अनुमान आमतौर पर कम से कम वर्ग विधि का उपयोग करके लगाया जाता है, फिर भी ऐसी अन्य विधियाँ हैं जिनका उपयोग बहुत कम बार किया जाता है। उदाहरण के लिए, ये निम्न विधियाँ हैं:

  • बायेसियन तरीके (उदाहरण के लिए, रैखिक प्रतिगमन की बायेसियन विधि)।
  • प्रतिशत प्रतिगमन उन स्थितियों के लिए उपयोग किया जाता है जहां प्रतिशत त्रुटियों को कम करना अधिक उपयुक्त माना जाता है।
  • सबसे छोटा निरपेक्ष विचलन, जो मात्रात्मक प्रतिगमन की ओर ले जाने वाले आउटलेयर की उपस्थिति में अधिक मजबूत होता है।
  • बड़ी संख्या में टिप्पणियों और गणनाओं की आवश्यकता वाले गैर पैरामीट्रिक प्रतिगमन।
  • दिए गए इनपुट स्थान में एक सार्थक दूरी मीट्रिक की खोज में सीखी गई सीखने की मीट्रिक की दूरी।

सॉफ़्टवेयर

सभी प्रमुख सांख्यिकीय सॉफ़्टवेयर पैकेज न्यूनतम वर्ग प्रतिगमन विश्लेषण का उपयोग करके किए जाते हैं। सरल रेखीय प्रतिगमन और एकाधिक प्रतिगमन विश्लेषण का उपयोग कुछ स्प्रेडशीट अनुप्रयोगों के साथ-साथ कुछ कैलकुलेटरों में भी किया जा सकता है। जबकि कई सांख्यिकीय सॉफ़्टवेयर पैकेज विभिन्न प्रकार के गैरपारंपरिक और मजबूत प्रतिगमन का प्रदर्शन कर सकते हैं, ये विधियाँ कम मानकीकृत हैं; अलग-अलग सॉफ्टवेयर पैकेज अलग-अलग तरीकों को लागू करते हैं। सर्वेक्षण विश्लेषण और न्यूरोइमेजिंग जैसे क्षेत्रों में उपयोग के लिए विशिष्ट प्रतिगमन सॉफ्टवेयर विकसित किया गया है।

कारक और परिणामी संकेतों के बीच एक सहसंबंध की उपस्थिति में, डॉक्टरों को अक्सर यह निर्धारित करना पड़ता है कि एक संकेत का मूल्य कितना बदल सकता है जब दूसरे को माप की एक इकाई द्वारा बदल दिया जाता है जिसे आम तौर पर स्वयं शोधकर्ता द्वारा स्वीकार या स्थापित किया जाता है।

उदाहरण के लिए, पहली कक्षा (लड़कियों या लड़कों) के स्कूली बच्चों के शरीर का वजन कैसे बदलेगा यदि उनकी ऊंचाई 1 सेमी बढ़ जाती है इस प्रयोजन के लिए, प्रतिगमन विश्लेषण पद्धति का उपयोग किया जाता है।

अक्सर, भौतिक विकास के लिए नियामक पैमानों और मानकों को विकसित करने के लिए प्रतिगमन विश्लेषण पद्धति का उपयोग किया जाता है।

  1. प्रतिगमन की परिभाषा. प्रतिगमन एक ऐसा कार्य है जो एक विशेषता के औसत मूल्य के आधार पर, किसी अन्य विशेषता के औसत मूल्य को निर्धारित करने की अनुमति देता है जो पहले एक से संबंधित है।

    इस प्रयोजन के लिए, प्रतिगमन गुणांक और कई अन्य मापदंडों का उपयोग किया जाता है। उदाहरण के लिए, आप शरद ऋतु-सर्दियों की अवधि में औसत मासिक हवा के तापमान के कुछ मूल्यों पर औसतन सर्दी की संख्या की गणना कर सकते हैं।

  2. प्रतिगमन गुणांक की परिभाषा. प्रतिगमन गुणांक वह निरपेक्ष मान है जिसके द्वारा माप की स्थापित इकाई द्वारा इससे जुड़ी एक अन्य विशेषता में परिवर्तन होने पर एक विशेषता का मान औसतन बदल जाता है।
  3. प्रतिगमन गुणांक सूत्र. आर y / x \u003d r xy x (σ y / σ x)
    जहाँ आर वाई / एक्स - प्रतिगमन गुणांक;
    r xy - विशेषताओं x और y के बीच सहसंबंध गुणांक;
    (σ y और σ x) - सुविधाओं x और y के मानक विचलन।

    हमारे उदाहरण में;
    σ x = 4.6 (शरद ऋतु-सर्दियों की अवधि में हवा के तापमान का मानक विचलन;
    σ y = 8.65 (संक्रामक जुकाम की संख्या का मानक विचलन)।
    इस प्रकार, R y/x प्रतिगमन गुणांक है।
    आर वाई / एक्स \u003d -0.96 एक्स (4.6 / 8.65) \u003d 1.8, यानी। औसत मासिक हवा के तापमान (x) में 1 डिग्री की कमी के साथ, शरद ऋतु-सर्दियों की अवधि में संक्रामक सर्दी (y) की औसत संख्या 1.8 मामलों में बदल जाएगी।

  4. प्रतिगमन समीकरण. वाई \u003d एम वाई + आर वाई / एक्स (एक्स - एम एक्स)
    जहां y विशेषता का औसत मूल्य है, जिसे किसी अन्य विशेषता (x) के औसत मूल्य में परिवर्तन होने पर निर्धारित किया जाना चाहिए;
    x - किसी अन्य विशेषता का ज्ञात औसत मान;
    आर वाई/एक्स - प्रतिगमन गुणांक;
    एम एक्स, एम वाई - एक्स और वाई सुविधाओं के ज्ञात औसत मूल्य।

    उदाहरण के लिए, औसत मासिक वायु तापमान (x) के किसी भी औसत मूल्य पर विशेष माप के बिना संक्रामक सर्दी (y) की औसत संख्या निर्धारित की जा सकती है। तो, यदि x \u003d - 9 °, R y / x \u003d 1.8 रोग, M x \u003d -7 °, M y \u003d 20 रोग, तो y \u003d 20 + 1.8 x (9-7) \u003d 20 + 3 .6 = 23.6 रोग।
    यह समीकरण दो विशेषताओं (x और y) के बीच सीधी रेखा संबंध के मामले में लागू होता है।

  5. प्रतिगमन समीकरण का उद्देश्य. प्रतिगमन समीकरण का उपयोग प्रतिगमन रेखा को प्लॉट करने के लिए किया जाता है। उत्तरार्द्ध, विशेष माप के बिना, एक विशेषता के किसी भी औसत मूल्य (y) को निर्धारित करने की अनुमति देता है, यदि किसी अन्य विशेषता का मान (x) बदल जाता है। इन आंकड़ों के आधार पर एक ग्राफ बनाया जाता है - प्रतिगमन लाइन, जिसका उपयोग सर्दी की संख्या के परिकलित मूल्यों के बीच की सीमा के भीतर औसत मासिक तापमान के किसी भी मूल्य पर सर्दी की औसत संख्या निर्धारित करने के लिए किया जा सकता है।
  6. प्रतिगमन सिग्मा (सूत्र).
    जहाँ σ Ru/x - प्रतिगमन का सिग्मा (मानक विचलन);
    σ y विशेषता y का मानक विचलन है;
    r xy - विशेषताओं x और y के बीच सहसंबंध गुणांक।

    इसलिए, यदि σ y शीतों की संख्या का मानक विचलन = 8.65 है; r xy - सर्दी की संख्या (y) और शरद ऋतु-सर्दियों की अवधि (x) में औसत मासिक हवा के तापमान के बीच सहसंबंध गुणांक - 0.96 है, फिर

  7. सिग्मा प्रतिगमन का उद्देश्य. परिणामी विशेषता (y) की विविधता के माप की एक विशेषता देता है।

    उदाहरण के लिए, यह शरद ऋतु-सर्दियों की अवधि में औसत मासिक हवा के तापमान के एक निश्चित मूल्य पर सर्दी की संख्या की विविधता को दर्शाता है। तो, हवा के तापमान x 1 \u003d -6 ° पर जुकाम की औसत संख्या 15.78 रोगों से लेकर 20.62 रोगों तक हो सकती है।
    x 2 = -9° पर, जुकाम की औसत संख्या 21.18 रोगों से लेकर 26.02 रोगों आदि तक हो सकती है।

    प्रतिगमन सिग्मा का उपयोग प्रतिगमन पैमाने के निर्माण में किया जाता है, जो प्रतिगमन रेखा पर प्लॉट किए गए औसत मूल्य से प्रभावी विशेषता के मूल्यों के विचलन को दर्शाता है।

  8. प्रतिगमन पैमाने की गणना और प्लॉट करने के लिए आवश्यक डेटा
    • प्रतिगमन गुणांक - ry/x;
    • प्रतिगमन समीकरण - y \u003d M y + R y / x (x-M x);
    • प्रतिगमन सिग्मा - σ Rx/y
  9. प्रतिगमन पैमाने की गणना और ग्राफिक प्रतिनिधित्व का क्रम.
    • सूत्र द्वारा प्रतिगमन गुणांक निर्धारित करें (पैराग्राफ 3 देखें)। उदाहरण के लिए, किसी को यह निर्धारित करना चाहिए कि औसत ऊंचाई 1 सेमी से बदलने पर शरीर के वजन में औसतन (लिंग के आधार पर एक निश्चित उम्र में) कितना बदलाव आएगा।
    • प्रतिगमन समीकरण के सूत्र के अनुसार (पैराग्राफ 4 देखें), निर्धारित करें कि औसत क्या होगा, उदाहरण के लिए, शरीर का वजन (y, y 2, y 3 ...) * एक निश्चित वृद्धि मूल्य (x, x 2, एक्स 3 ...) .
      ________________
      * "Y" के मान की गणना "x" के कम से कम तीन ज्ञात मानों के लिए की जानी चाहिए।

      इसी समय, एक निश्चित आयु और लिंग के लिए शरीर के वजन और ऊंचाई (एम एक्स, और एम वाई) के औसत मूल्यों को जाना जाता है

    • प्रतिगमन के सिग्मा की गणना करें, σ y और r xy के संगत मानों को जानें और उनके मानों को सूत्र में प्रतिस्थापित करें (पैराग्राफ 6 देखें)।
    • ज्ञात मूल्यों के आधार पर x 1, x 2, x 3 और उनके संबंधित औसत मान y 1, y 2 y 3, साथ ही सबसे छोटा (y - σ ru / x) और सबसे बड़ा (y + σ ru) / x) मान (y) एक प्रतिगमन पैमाने का निर्माण करते हैं।

      प्रतिगमन पैमाने के चित्रमय प्रतिनिधित्व के लिए, मान x, x 2, x 3 (y- अक्ष) को पहले ग्राफ़ पर अंकित किया जाता है, अर्थात। एक प्रतिगमन रेखा निर्मित होती है, उदाहरण के लिए, ऊंचाई (x) पर शरीर के वजन (y) की निर्भरता।

      फिर, संबंधित बिंदुओं पर y 1 , y 2 , y 3 प्रतिगमन सिग्मा के संख्यात्मक मान चिह्नित हैं, अर्थात। ग्राफ पर y 1 , y 2 , y 3 के सबसे छोटे और सबसे बड़े मान ज्ञात कीजिए।

  10. प्रतिगमन पैमाने का व्यावहारिक उपयोग. विशेष रूप से भौतिक विकास के लिए नियामक पैमाने और मानक विकसित किए जा रहे हैं। मानक पैमाने के अनुसार, बच्चों के विकास का व्यक्तिगत मूल्यांकन देना संभव है। साथ ही, शारीरिक विकास को सामंजस्यपूर्ण के रूप में मूल्यांकन किया जाता है, उदाहरण के लिए, एक निश्चित ऊंचाई पर, बच्चे के शरीर का वजन शरीर के वजन की औसत गणना इकाई के प्रतिगमन सिग्मा के भीतर होता है - (y) किसी दिए गए ऊंचाई (x) के लिए ( वाई ± 1 σ आरवाई / एक्स)।

    शारीरिक विकास को शरीर के वजन के मामले में असंगत माना जाता है यदि एक निश्चित ऊंचाई के लिए बच्चे के शरीर का वजन दूसरे प्रतिगमन सिग्मा के भीतर है: (y ± 2 σ Ry/x)

    यदि एक निश्चित ऊंचाई के लिए शरीर का वजन प्रतिगमन के तीसरे सिग्मा (y ± 3 σ Ry/x) के भीतर है, तो शरीर के अतिरिक्त और अपर्याप्त वजन दोनों के कारण शारीरिक विकास तेजी से असंगत होगा।

5 वर्षीय लड़कों के शारीरिक विकास के एक सांख्यिकीय अध्ययन के परिणामों के अनुसार, यह ज्ञात है कि उनकी औसत ऊंचाई (x) 109 सेमी है, और उनके शरीर का औसत वजन (y) 19 किलोग्राम है। ऊंचाई और शरीर के वजन के बीच सहसंबंध गुणांक +0.9 है, मानक विचलन तालिका में प्रस्तुत किए गए हैं।

आवश्यक:

  • प्रतिगमन गुणांक की गणना करें;
  • प्रतिगमन समीकरण का उपयोग करते हुए, निर्धारित करें कि x1 = 100 सेमी, x2 = 110 सेमी, x3 = 120 सेमी के बराबर ऊंचाई के साथ 5 वर्षीय लड़कों का अपेक्षित शरीर का वजन क्या होगा;
  • प्रतिगमन सिग्मा की गणना करें, एक प्रतिगमन पैमाने का निर्माण करें, इसके समाधान के परिणामों को रेखांकन प्रस्तुत करें;
  • उचित निष्कर्ष निकालें।

समस्या की स्थिति और उसके समाधान के परिणाम सारांश तालिका में प्रस्तुत किए गए हैं।

तालिका नंबर एक

समस्या की शर्तें समस्या समाधान परिणाम
प्रतिगमन समीकरण सिग्मा प्रतिगमन प्रतिगमन पैमाने (अपेक्षित शरीर का वजन (किलो में))
एम σ आर xy आर वाई / एक्स एक्स पर σआरएक्स/वाई वाई - σ आरयू/एच वाई + σ आरयू/एच
1 2 3 4 5 6 7 8 9 10
ऊंचाई (एक्स) 109 सेमी ± 4.4 सेमी +0,9 0,16 100 सेमी 17.56 किग्रा ± 0.35 किग्रा 17.21 किग्रा 17.91 किग्रा
शरीर का वजन (वाई) 19 किग्रा ± 0.8 किग्रा 110 सेमी 19.16 किग्रा 18.81 किग्रा 19.51 किग्रा
120 सेमी 20.76 किग्रा 20.41 किग्रा 21.11 किग्रा

समाधान.

निष्कर्ष।इस प्रकार, शरीर के वजन के परिकलित मूल्यों के भीतर प्रतिगमन पैमाने आपको इसे किसी अन्य विकास मूल्य के लिए निर्धारित करने या बच्चे के व्यक्तिगत विकास का आकलन करने की अनुमति देता है। ऐसा करने के लिए, प्रतिगमन रेखा के लंब को पुनर्स्थापित करें।

  1. व्लासोव वी.वी. महामारी विज्ञान। - एम .: जियोटार-मेड, 2004. - 464 पी।
  2. लिसित्सिन यू.पी. सार्वजनिक स्वास्थ्य और स्वास्थ्य देखभाल। हाई स्कूल के लिए पाठ्यपुस्तक। - एम .: जियोटार-मेड, 2007. - 512 पी।
  3. मेडिक वी.ए., यूरीव वी.के. सार्वजनिक स्वास्थ्य और स्वास्थ्य देखभाल पर व्याख्यान का एक कोर्स: भाग 1। सार्वजनिक स्वास्थ्य। - एम .: मेडिसिन, 2003. - 368 पी।
  4. मिनियाव वी.ए., विष्णकोव एन.आई. और अन्य सामाजिक चिकित्सा और स्वास्थ्य सेवा संगठन (2 खंडों में मार्गदर्शिका)। - सेंट पीटर्सबर्ग, 1998. -528 पी।
  5. कुचेरेंको वी.जेड., अगरकोव एन.एम. और अन्य सामाजिक स्वच्छता और स्वास्थ्य देखभाल संगठन (ट्यूटोरियल) - मास्को, 2000. - 432 पी।
  6. एस ग्लैंट्ज़। औषधीय-जैविक सांख्यिकी। अंग्रेजी से प्रति। - एम।, प्रैक्टिस, 1998. - 459 पी।

सहसंबंध विश्लेषण के बाद चर के बीच सांख्यिकीय संबंधों की उपस्थिति का पता चला है और उनकी निकटता की डिग्री का आकलन किया गया है, वे आमतौर पर प्रतिगमन विश्लेषण का उपयोग करके एक विशिष्ट प्रकार की निर्भरता के गणितीय विवरण के लिए आगे बढ़ते हैं। इस प्रयोजन के लिए, कार्यों की एक श्रेणी का चयन किया जाता है जो प्रभावी संकेतक y और तर्कों x 1, x 2, ..., x को सबसे अधिक जानकारीपूर्ण तर्कों से संबंधित करता है, लिंक के मापदंडों के अज्ञात मूल्यों का अनुमान चुना जाता है समीकरण की गणना की जाती है और परिणामी समीकरण के गुणों का विश्लेषण किया जाता है।

फ़ंक्शन f (x 1, x 2, ..., x k) तर्कों के दिए गए मानों पर प्रभावी विशेषता y के औसत मूल्य की निर्भरता का वर्णन करते हुए प्रतिगमन फ़ंक्शन (समीकरण) कहलाता है। शब्द "प्रतिगमन" (अव्य। - प्रतिगमन - पीछे हटना, किसी चीज़ पर लौटना) अंग्रेजी मनोवैज्ञानिक और मानवविज्ञानी एफ। गैल्टन द्वारा पेश किया गया था और विशेष रूप से पहले ठोस उदाहरणों में से एक की बारीकियों से जुड़ा है जिसमें इस अवधारणा का उपयोग किया गया था। इसलिए, विकास की आनुवंशिकता के विश्लेषण के संबंध में सांख्यिकीय डेटा को संसाधित करते हुए, एफ। गैल्टन ने पाया कि यदि पिता x इंच से सभी पिताओं की औसत ऊंचाई से विचलित होते हैं, तो उनके बेटे x से कम सभी बेटों की औसत ऊंचाई से विचलित हो जाते हैं। इंच। प्रकट प्रवृत्ति को "औसत अवस्था में प्रतिगमन" कहा जाता था। तब से, सांख्यिकीय साहित्य में "रिग्रेशन" शब्द का व्यापक रूप से उपयोग किया गया है, हालांकि कई मामलों में यह सांख्यिकीय निर्भरता की अवधारणा को सटीक रूप से वर्णित नहीं करता है।

प्रतिगमन समीकरण के सटीक विवरण के लिए, प्रभावी संकेतक y के वितरण के नियम को जानना आवश्यक है। सांख्यिकीय अभ्यास में, आमतौर पर अज्ञात सच्चे प्रतिगमन समारोह के लिए उपयुक्त सन्निकटन की खोज के लिए खुद को सीमित करना आवश्यक होता है, क्योंकि शोधकर्ता को दिए गए मानों के लिए विश्लेषण किए गए परिणाम संकेतक y के संभाव्यता वितरण के सशर्त कानून का सटीक ज्ञान नहीं है। तर्क x का।

सही f(x) = M(y1x), मॉडल प्रतिगमन के बीच संबंध पर विचार करें? और प्रतिगमन का y स्कोर। प्रभावी संकेतक y को तर्क x से अनुपात से संबंधित होने दें:

जहाँ - e एक यादृच्छिक चर है जिसमें एक सामान्य वितरण कानून है, जिसमें Me \u003d 0 और D e \u003d y 2 है। इस मामले में सही समाश्रयण फलन है: f(x) = M(y/x) = 2x 1.5।

मान लीजिए कि हम सही समाश्रयण समीकरण के सटीक रूप को नहीं जानते हैं, लेकिन हमारे पास yi = 2x1.5 + e के अनुपात से संबंधित द्वि-आयामी यादृच्छिक चर पर नौ अवलोकन हैं, और चित्र 3 में दिखाया गया है। 1

चित्र 1 - सत्य f (x) और सैद्धांतिक की पारस्परिक व्यवस्था? प्रतिगमन मॉडल

अंजीर में बिंदुओं का स्थान। 1 आपको फॉर्म की रैखिक निर्भरताओं की कक्षा में खुद को सीमित करने की अनुमति देता है? = 0 + 1 x पर। कम से कम वर्ग विधि का उपयोग करके, हम प्रतिगमन समीकरण y = b 0 + b 1 x का अनुमान लगाते हैं। तुलना के लिए, चित्र में। 1 वास्तविक प्रतिगमन फ़ंक्शन y \u003d 2x 1.5, सैद्धांतिक सन्निकटन प्रतिगमन फ़ंक्शन के ग्राफ़ दिखाता है? = 0 + 1 x पर।

चूंकि हमने प्रतिगमन समारोह के वर्ग को चुनने में गलती की है, और यह सांख्यिकीय अनुसंधान के अभ्यास में काफी आम है, हमारे सांख्यिकीय निष्कर्ष और अनुमान गलत साबित होंगे। और इससे कोई फर्क नहीं पड़ता कि हम अवलोकनों की मात्रा में कितना वृद्धि करते हैं, y का हमारा नमूना अनुमान सही प्रतिगमन फ़ंक्शन f(x) के करीब नहीं होगा। यदि हमने प्रतिगमन कार्यों के वर्ग को सही ढंग से चुना है, तो f (x) का उपयोग करते हुए विवरण में अशुद्धि? केवल सीमित नमूना आकार द्वारा समझाया जा सकता है।

प्रारंभिक सांख्यिकीय डेटा से प्रभावी संकेतक y(x) और अज्ञात प्रतिगमन फ़ंक्शन f(x) = M(y/x) के सशर्त मूल्य को सर्वोत्तम रूप से पुनर्स्थापित करने के लिए, निम्नलिखित पर्याप्तता मानदंड (हानि फ़ंक्शन) का सबसे अधिक उपयोग किया जाता है .

कम से कम वर्ग विधि। इसके अनुसार, मॉडल मानों से प्रभावी संकेतक y, (i = 1,2,..., n) के देखे गए मानों का वर्ग विचलन न्यूनतम किया जाता है। = f(x i), जहां x i i-वें अवलोकन में तर्कों के सदिश का मान है:

कम से कम मॉड्यूल की विधि। इसके अनुसार, मॉड्यूलर मूल्यों से प्रभावी संकेतक के देखे गए मूल्यों के पूर्ण विचलन का योग कम से कम है। और हमें मिलता है = f(x i), मतलब पूर्ण औसत प्रतिगमन? |वाई आई - एफ(एच आई)| > मि.

प्रतिगमन विश्लेषण चर x j = (j = 1,2, ..., k) पर एक यादृच्छिक चर y की निर्भरता के सांख्यिकीय विश्लेषण की एक विधि है, जिसे प्रतिगमन विश्लेषण में गैर-यादृच्छिक चर के रूप में माना जाता है, भले ही सही वितरण कानून की परवाह किए बिना एक्स जे।

आमतौर पर यह माना जाता है कि यादृच्छिक चर y में एक सशर्त गणितीय अपेक्षा y के साथ एक सामान्य वितरण कानून है, जो कि तर्कों x/ (/ = 1, 2, ..., k) का एक कार्य है और एक स्थिर, स्वतंत्र है। तर्क, विचरण y 2 ।

सामान्य तौर पर, प्रतिगमन विश्लेषण के रैखिक मॉडल का रूप होता है:

वाई = वाई जे = 0वी जेसी जे(एक्स 1 , एक्स 2 . . .. ,एक्स )+ई

जहाँ c j इसके चरों का कुछ फलन है - x 1 , x 2 । . .. ,x k , E शून्य गणितीय अपेक्षा और प्रसरण y 2 के साथ एक यादृच्छिक चर है।

प्रतिगमन विश्लेषण में, अध्ययन के तहत घटना की भौतिक प्रकृति और अवलोकन के परिणामों के आधार पर प्रतिगमन समीकरण का प्रकार चुना जाता है।

समाश्रयण समीकरण के अज्ञात प्राचलों के अनुमान सामान्यतः न्यूनतम वर्ग विधि द्वारा प्राप्त किए जाते हैं। नीचे हम इस समस्या पर अधिक विस्तार से ध्यान केन्द्रित करेंगे।

द्वि-आयामी रैखिक प्रतिगमन समीकरण। अध्ययन के तहत घटना के विश्लेषण के आधार पर, यह माना जाता है कि "औसत" y में x का एक रैखिक कार्य है, अर्थात, एक प्रतिगमन समीकरण है

y \u003d एम (y / x) \u003d 0 + पर 1 x)

जहाँ M(y1x) किसी दिए गए x के लिए यादृच्छिक चर y की सशर्त गणितीय अपेक्षा है; 0 और 1 पर - सामान्य जनसंख्या के अज्ञात पैरामीटर, जिनका अनुमान नमूना टिप्पणियों के परिणामों से लगाया जाना चाहिए।

मान लीजिए कि 0 और 1 पर प्राचलों का अनुमान लगाने के लिए, आकार n का एक नमूना द्वि-आयामी सामान्य जनसंख्या (x, y) से लिया जाता है, जहाँ (x, y,) i-वें अवलोकन का परिणाम है (i) = 1, 2,..., एन) . इस मामले में, प्रतिगमन विश्लेषण मॉडल का रूप है:

y j = at 0 + at 1 x+e j ।

जहाँ e j.- शून्य गणितीय अपेक्षा और विचरण y 2 के साथ स्वतंत्र सामान्य रूप से वितरित यादृच्छिक चर, यानी M e j। = 0;

डी ई जे। = वाई 2 सबके लिए मैं = 1, 2,..., एन।

कम से कम वर्ग विधि के अनुसार, 0 और 1 पर अज्ञात मापदंडों के अनुमान के रूप में, किसी को नमूना विशेषताओं b 0 और b 1 के ऐसे मान लेने चाहिए जो परिणामी मूल्यों के वर्ग विचलन के योग को कम करते हैं सशर्त गणितीय अपेक्षा से विशेषता y i? मैं

हम औसत आकार और आर्थिक गतिविधि के संकेतकों के साथ सत्रह विशिष्ट उद्यमों के उदाहरण का उपयोग करके किसी उद्यम के लाभ पर विपणन विशेषताओं के प्रभाव को निर्धारित करने की पद्धति पर विचार करेंगे।

समस्या को हल करते समय, निम्नलिखित विशेषताओं को ध्यान में रखा गया, जिन्हें प्रश्नावली सर्वेक्षण के परिणामस्वरूप सबसे महत्वपूर्ण (महत्वपूर्ण) के रूप में पहचाना गया:

* उद्यम की अभिनव गतिविधि;

* उत्पादों की श्रेणी की योजना बनाना;

* मूल्य निर्धारण नीति का गठन;

* जनसंपर्क;

* विपणन प्रणाली;

* कर्मचारी प्रोत्साहन प्रणाली।

कारकों द्वारा तुलना की प्रणाली के आधार पर, वर्ग आसन्न मैट्रिसेस का निर्माण किया गया था, जिसमें प्रत्येक कारक के सापेक्ष प्राथमिकताओं के मूल्यों की गणना की गई थी: उद्यम की नवीन गतिविधि, उत्पाद रेंज की योजना, मूल्य निर्धारण नीति, विज्ञापन, जनसंपर्क, बिक्री प्रणाली, कर्मचारी प्रोत्साहन प्रणाली।

कंपनी के विशेषज्ञों के एक सर्वेक्षण के परिणामस्वरूप "जनता के साथ संबंध" कारक के लिए प्राथमिकताओं का अनुमान प्राप्त किया गया था। निम्नलिखित पदनाम स्वीकार किए जाते हैं: > (बेहतर), > (बेहतर या समान), = (बराबर),< (хуже или одинаково), <

अगला, उद्यम के विपणन स्तर के व्यापक मूल्यांकन की समस्या हल हो गई। संकेतक की गणना करते समय, विशेष सुविधाओं के महत्व (वजन) को निर्धारित किया गया था और विशेष संकेतकों के रैखिक संकल्प की समस्या हल हो गई थी। डाटा प्रोसेसिंग विशेष रूप से विकसित कार्यक्रमों के अनुसार किया गया था।

अगला, उद्यम के विपणन के स्तर के एक व्यापक मूल्यांकन की गणना की जाती है - विपणन गुणांक, जिसे तालिका 1 में दर्ज किया गया है। इसके अलावा, उपरोक्त तालिका में उद्यम को समग्र रूप से दर्शाने वाले संकेतक शामिल हैं। तालिका में डेटा का उपयोग प्रतिगमन विश्लेषण के लिए किया जाएगा। परिणाम लाभ है। विपणन गुणांक के साथ, निम्नलिखित संकेतक कारक संकेतों के रूप में उपयोग किए गए थे: सकल उत्पादन की मात्रा, अचल संपत्तियों की लागत, कर्मचारियों की संख्या, विशेषज्ञता का गुणांक।

तालिका 1 - प्रतिगमन विश्लेषण के लिए प्रारंभिक डेटा


तालिका में डेटा के आधार पर और सहसंबंध गुणांक के सबसे महत्वपूर्ण मूल्यों वाले कारकों के आधार पर, कारकों पर लाभ की निर्भरता के प्रतिगमन कार्यों का निर्माण किया गया था।

हमारे मामले में प्रतिगमन समीकरण रूप लेगा:

प्रतिगमन समीकरण के गुणांक लाभ की मात्रा पर ऊपर चर्चा किए गए कारकों के मात्रात्मक प्रभाव के बारे में बोलते हैं। वे दिखाते हैं कि जब कारक चिन्ह एक इकाई से बदलता है तो कितने हजार रूबल का मूल्य बदल जाता है। जैसा कि समीकरण से होता है, विपणन मिश्रण अनुपात में एक इकाई की वृद्धि से लाभ में 1547.7 हजार रूबल की वृद्धि होती है। इससे पता चलता है कि विपणन गतिविधियों में सुधार के लिए उद्यमों के आर्थिक प्रदर्शन में सुधार की बहुत बड़ी संभावना है।

विपणन प्रभावशीलता के अध्ययन में, सबसे दिलचस्प और सबसे महत्वपूर्ण कारक विशेषता X5 कारक है - विपणन गुणांक। आँकड़ों के सिद्धांत के अनुसार, मौजूदा एकाधिक प्रतिगमन समीकरण का लाभ विपणन कारक सहित प्रत्येक कारक के पृथक प्रभाव का मूल्यांकन करने की क्षमता है।

किए गए प्रतिगमन विश्लेषण के परिणाम भी समीकरण के मापदंडों की गणना के लिए अधिक व्यापक रूप से उपयोग किए जाते हैं। अपेक्षाकृत बेहतर या अपेक्षाकृत बदतर के रूप में वर्गीकृत (केएफ) उद्यमों का मानदंड परिणाम के सापेक्ष संकेतक पर आधारित है:

जहां Y facti i-वें उद्यम का वास्तविक मूल्य है, हजार रूबल;

Y गणना - प्रतिगमन समीकरण के अनुसार गणना द्वारा प्राप्त i-वें उद्यम के लाभ का मूल्य

समस्या के समाधान के संदर्भ में, मूल्य को "दक्षता कारक" कहा जाता है। उद्यम की गतिविधि को उन मामलों में प्रभावी माना जा सकता है जहां गुणांक का मूल्य एक से अधिक है। इसका अर्थ है कि वास्तविक लाभ नमूने के औसत लाभ से अधिक है।

वास्तविक और परिकलित लाभ मान तालिका में प्रस्तुत किए गए हैं। 2.

तालिका 2 - प्रतिगमन मॉडल में प्रभावी विशेषता का विश्लेषण

तालिका के विश्लेषण से पता चलता है कि हमारे मामले में, समीक्षाधीन अवधि के लिए उद्यम 3, 5, 7, 9, 12, 14, 15, 17 की गतिविधियों को सफल माना जा सकता है।

प्रतिगमन विश्लेषण का मुख्य लक्ष्यरिश्ते के विश्लेषणात्मक रूप को निर्धारित करने में शामिल है, जिसमें परिणामी विशेषता में परिवर्तन एक या अधिक कारक संकेतों के प्रभाव के कारण होता है, और परिणामी विशेषता को प्रभावित करने वाले अन्य सभी कारकों के सेट को निरंतर और औसत मान के रूप में लिया जाता है .
प्रतिगमन विश्लेषण के कार्य:
a) निर्भरता के रूप की स्थापना। घटना के बीच संबंध की प्रकृति और रूप के संबंध में, सकारात्मक रैखिक और गैर-रैखिक और नकारात्मक रैखिक और गैर-रैखिक प्रतिगमन हैं।
बी) एक या दूसरे प्रकार के गणितीय समीकरण के रूप में प्रतिगमन समारोह की परिभाषा और आश्रित चर पर व्याख्यात्मक चर के प्रभाव की स्थापना।
c) आश्रित चर के अज्ञात मूल्यों का अनुमान। प्रतिगमन फ़ंक्शन का उपयोग करके, आप व्याख्यात्मक चर के दिए गए मानों के अंतराल के भीतर आश्रित चर के मूल्यों को पुन: उत्पन्न कर सकते हैं (यानी, इंटरपोलेशन समस्या को हल करें) या निर्दिष्ट अंतराल के बाहर प्रक्रिया के पाठ्यक्रम का मूल्यांकन करें (यानी, एक्सट्रपलेशन समस्या को हल करें)। परिणाम निर्भर चर के मूल्य का अनुमान है।

जोड़ी प्रतिगमन - दो चर y और x के संबंध का समीकरण: y=f(x), जहां y निर्भर चर (परिणाम चिह्न) है; एक्स - स्वतंत्र, व्याख्यात्मक चर (फीचर-फैक्टर)।

रैखिक और गैर-रैखिक प्रतिगमन हैं।
रैखिक प्रतिगमन: y = a + bx + ε
गैर-रैखिक प्रतिगमन को दो वर्गों में विभाजित किया गया है: प्रतिगमन जो विश्लेषण में शामिल व्याख्यात्मक चर के संबंध में गैर-रैखिक हैं, लेकिन अनुमानित मापदंडों के संबंध में रैखिक हैं, और प्रतिगमन जो अनुमानित मापदंडों के संबंध में गैर-रैखिक हैं।
प्रतिगमन जो व्याख्यात्मक चर में गैर-रैखिक हैं:

प्रतिगमन जो अनुमानित मापदंडों में गैर-रैखिक हैं:

  • घात y=a x b ε
  • चरघातांकी y=a b x ε
  • चरघातांकी y=e a+b x ε
प्रतिगमन समीकरण का निर्माण इसके मापदंडों का अनुमान लगाने के लिए कम किया गया है। प्रतिगमन के मापदंडों का अनुमान लगाने के लिए जो मापदंडों में रैखिक हैं, कम से कम वर्गों (एलएसएम) की विधि का उपयोग किया जाता है। एलएसएम पैरामीटर के ऐसे अनुमानों को प्राप्त करना संभव बनाता है जिसके तहत सैद्धांतिक मूल्यों y x से प्रभावी विशेषता y के वास्तविक मूल्यों के चुकता विचलन का योग न्यूनतम है, अर्थात।
.
रेखीय और अरैखिक समीकरणों के लिए रेखीय के लिए कम करने योग्य, निम्नलिखित प्रणाली a और b के लिए हल की जाती है:

आप तैयार किए गए फ़ार्मुलों का उपयोग कर सकते हैं जो इस प्रणाली से अनुसरण करते हैं:

अध्ययन की गई घटनाओं के बीच संबंध की निकटता का अनुमान रैखिक जोड़ी सहसंबंध गुणांक r xy द्वारा रैखिक प्रतिगमन (-1≤r xy ≤1) के लिए लगाया जाता है:

और सहसंबंध सूचकांक p xy - अरेखीय प्रतीपगमन के लिए (0≤p xy ≤1):

निर्मित मॉडल की गुणवत्ता का आकलन निर्धारण के गुणांक (सूचकांक) के साथ-साथ औसत सन्निकटन त्रुटि द्वारा दिया जाएगा।
औसत सन्निकटन त्रुटि वास्तविक लोगों से परिकलित मानों का औसत विचलन है:
.
मूल्यों की अनुमेय सीमा ए - 8-10% से अधिक नहीं।
लोच E का औसत गुणांक दिखाता है कि औसतन कितने प्रतिशत, परिणाम y अपने औसत मूल्य से औसतन बदल जाएगा जब कारक x अपने औसत मूल्य से 1% बदलता है:
.

विचरण के विश्लेषण का कार्य निर्भर चर के विचरण का विश्लेषण करना है:
∑(y-y )²=∑(y x -y )²+∑(y-y x)²
जहां ∑(y-y)² वर्ग विचलनों का कुल योग है;
∑(y x -y)² - प्रतीपगमन के कारण विचलनों के वर्ग का योग ("व्याख्या" या "तथ्यात्मक");
∑(y-y x)² - विचलनों के वर्ग का अवशिष्ट योग।
प्रभावी विशेषता y के कुल विचरण में प्रतिगमन द्वारा समझाया गया विचरण का हिस्सा निर्धारण R2 के गुणांक (सूचकांक) द्वारा विशेषता है:

निर्धारण का गुणांक गुणांक या सहसंबंध सूचकांक का वर्ग है।

एफ-परीक्षण - प्रतिगमन समीकरण की गुणवत्ता का मूल्यांकन - परिकल्पना के परीक्षण में शामिल है लेकिन प्रतिगमन समीकरण के सांख्यिकीय महत्व और कनेक्शन की निकटता के संकेतक के बारे में। इसके लिए, फिशर एफ-मानदंड के मूल्यों के वास्तविक एफ तथ्य और महत्वपूर्ण (सारणीबद्ध) एफ तालिका की तुलना की जाती है। एफ तथ्य स्वतंत्रता की एक डिग्री के लिए गणना किए गए फैक्टोरियल और अवशिष्ट भिन्नताओं के मूल्यों के अनुपात से निर्धारित होता है:
,
जहाँ n जनसंख्या इकाइयों की संख्या है; m चर x के लिए पैरामीटर्स की संख्या है।
एफ तालिका स्वतंत्रता और महत्व स्तर ए की दी गई डिग्री के लिए यादृच्छिक कारकों के प्रभाव में मानदंड का अधिकतम संभव मूल्य है। महत्व स्तर ए - सही परिकल्पना को अस्वीकार करने की संभावना, बशर्ते कि यह सच हो। आमतौर पर a को 0.05 या 0.01 के बराबर लिया जाता है।
अगर एफ टेबल< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >F एक तथ्य है, तो परिकल्पना H के बारे में अस्वीकार नहीं किया जाता है और सांख्यिकीय महत्वहीनता, प्रतिगमन समीकरण की अविश्वसनीयता को मान्यता दी जाती है।
प्रतिगमन और सहसंबंध गुणांक के सांख्यिकीय महत्व का आकलन करने के लिए, प्रत्येक संकेतक के लिए छात्र के टी-परीक्षण और विश्वास अंतराल की गणना की जाती है। संकेतकों की यादृच्छिक प्रकृति के बारे में एक परिकल्पना एच को आगे रखा गया है, अर्थात शून्य से उनके महत्वहीन अंतर के बारे में। छात्र के टी-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन यादृच्छिक त्रुटि के परिमाण के साथ उनके मूल्यों की तुलना करके किया जाता है:
; ; .
रेखीय प्रतिगमन मापदंडों और सहसंबंध गुणांक की यादृच्छिक त्रुटियां सूत्रों द्वारा निर्धारित की जाती हैं:



टी-सांख्यिकी के वास्तविक और महत्वपूर्ण (सारणीबद्ध) मूल्यों की तुलना - टी टेबल और टी तथ्य - हम परिकल्पना एच ओ को स्वीकार या अस्वीकार करते हैं।
फिशर के एफ-परीक्षण और छात्र के टी-सांख्यिकी के बीच संबंध समानता द्वारा व्यक्त किया गया है

यदि टी टेबल< t факт то H o отклоняется, т.е. a , b и r xy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >तथ्य यह है कि परिकल्पना H के बारे में अस्वीकार नहीं किया गया है और a, b या r xy के गठन की यादृच्छिक प्रकृति को मान्यता दी गई है।
विश्वास अंतराल की गणना करने के लिए, हम प्रत्येक सूचक के लिए सीमांत त्रुटि डी निर्धारित करते हैं:
Δ a =t टेबल m a , Δ b =t टेबल m b ।
कॉन्फिडेंस इंटरवल की गणना के सूत्र इस प्रकार हैं:
γ ए \u003d एΔ ए; γ ए \u003d ए-Δ ए; γ ए = ए + Δए
γ बी = बीΔ बी; γ बी = बी-Δ बी; γb = b + Δb
यदि शून्य विश्वास अंतराल की सीमाओं के भीतर आता है, अर्थात यदि निचली सीमा ऋणात्मक है और ऊपरी सीमा धनात्मक है, तो अनुमानित पैरामीटर शून्य माना जाता है, क्योंकि यह एक साथ सकारात्मक और नकारात्मक दोनों मान नहीं ले सकता है।
पूर्वानुमान मूल्य y p को प्रतिगमन समीकरण y x =a+b·x में संबंधित (पूर्वानुमान) मान x p को प्रतिस्थापित करके निर्धारित किया जाता है। पूर्वानुमान m y x की औसत मानक त्रुटि की गणना की जाती है:
,
कहाँ
और पूर्वानुमान का विश्वास अंतराल बनाया गया है:
γ y x =y p Δ y p ; γ y x मिनट=y p -Δ y p ; γ y x max=y p +Δ y p
जहाँ Δ y x =t तालिका ·m y x .

समाधान उदाहरण

टास्क नंबर 1। यूराल क्षेत्र के सात क्षेत्रों के लिए 199X के लिए, दो संकेतों के मान ज्ञात हैं।
तालिका नंबर एक।

आवश्यक: 1. x पर y की निर्भरता को चिह्नित करने के लिए, निम्नलिखित कार्यों के मापदंडों की गणना करें:
ए) रैखिक;
बी) शक्ति कानून (पहले दोनों भागों के लघुगणक को लेकर चर के रैखिककरण की प्रक्रिया को निष्पादित करना आवश्यक है);
ग) प्रदर्शनकारी;
डी) समबाहु अतिपरवलय (आपको यह भी पता लगाने की आवश्यकता है कि इस मॉडल को पूर्व-रैखिक कैसे बनाया जाए)।
2. औसत सन्निकटन त्रुटि A और फिशर के F-परीक्षण के माध्यम से प्रत्येक मॉडल का मूल्यांकन करें।

समाधान (विकल्प #1)

रैखिक प्रतिगमन y=a+b·x के पैरामीटर a और b की गणना करने के लिए (कैलकुलेटर का उपयोग करके गणना की जा सकती है)।
के संबंध में सामान्य समीकरणों की प्रणाली को हल करें और बी:
प्रारंभिक डेटा के आधार पर, हम ∑y, ∑x, ∑y x, ∑x², ∑y² की गणना करते हैं:
वाई एक्स वाईएक्स x2 y2 वाई एक्सवाई-वाई एक्सए आई
एल68,8 45,1 3102,88 2034,01 4733,44 61,3 7,5 10,9
2 61,2 59,0 3610,80 3481,00 3745,44 56,5 4,7 7,7
3 59,9 57,2 3426,28 3271,84 3588,01 57,1 2,8 4,7
4 56,7 61,8 3504,06 3819,24 3214,89 55,5 1,2 2,1
5 55,0 58,8 3234,00 3457,44 3025,00 56,5 -1,5 2,7
6 54,3 47,2 2562,96 2227,84 2948,49 60,5 -6,2 11,4
7 49,3 55,2 2721,36 3047,04 2430,49 57,8 -8,5 17,2
कुल405,2 384,3 22162,34 21338,41 23685,76 405,2 0,0 56,7
बुध कीमत (कुल/एन)57,89
वाई
54,90
एक्स
3166,05
एक्स वाई
3048,34
3383,68
वाई²
एक्सएक्स8,1
एस 5,74 5,86 एक्सएक्सएक्सएक्सएक्सएक्स
एस 232,92 34,34 एक्सएक्सएक्सएक्सएक्सएक्स


ए=वाई -बी एक्स = 57.89+0.35 54.9 ≈ 76.88

प्रतिगमन समीकरण: वाई = 76,88 - 0,35एक्स।औसत दैनिक मजदूरी में 1 रगड़ की वृद्धि के साथ। खाद्य उत्पादों की खरीद पर खर्च का हिस्सा औसतन 0.35% अंक कम हो जाता है।
जोड़ी सहसंबंध के रैखिक गुणांक की गणना करें:

संचार मध्यम, उल्टा है।
आइए दृढ़ संकल्प का गुणांक निर्धारित करें: r² xy =(-0.35)=0.127
परिणाम में 12.7% भिन्नता को x कारक में भिन्नता द्वारा समझाया गया है। प्रतिगमन समीकरण में वास्तविक मूल्यों को प्रतिस्थापित करना एक्स, हम y x के सैद्धांतिक (परिकलित) मान निर्धारित करते हैं। आइए हम औसत सन्निकटन त्रुटि A का मान ज्ञात करें:

औसतन, परिकलित मान वास्तविक से 8.1% तक विचलित होते हैं।
आइए एफ-मानदंड की गणना करें:

प्राप्त मूल्य प्रकट निर्भरता की यादृच्छिक प्रकृति और समीकरण के मापदंडों के सांख्यिकीय महत्व और कनेक्शन की जकड़न के संकेतक के बारे में परिकल्पना एच 0 को स्वीकार करने की आवश्यकता को इंगित करता है।
1बी।पावर मॉडल y=a x b का निर्माण चरों के रैखिककरण की प्रक्रिया से पहले होता है। उदाहरण में, समीकरण के दोनों पक्षों का लघुगणक लेकर रैखिककरण किया जाता है:
एलजी वाई = एलजी ए + बी एलजी एक्स
वाई = सी + बी वाई
जहां वाई = एलजी (वाई), एक्स = एलजी (एक्स), सी = एलजी (ए)।

गणना के लिए, हम तालिका में डेटा का उपयोग करते हैं। 1.3।
तालिका 1.3

वाईएक्स YX वाई2 x2 वाई एक्सवाई-वाई एक्स(वाई-वाईएक्स)²ए आई
1 1,8376 1,6542 3,0398 3,3768 2,7364 61,0 7,8 60,8 11,3
2 1,7868 1,7709 3,1642 3,1927 3,1361 56,3 4,9 24,0 8,0
3 1,7774 1,7574 3,1236 3,1592 3,0885 56,8 3,1 9,6 5,2
4 1,7536 1,7910 3,1407 3,0751 3,2077 55,5 1,2 1,4 2,1
5 1,7404 1,7694 3,0795 3,0290 3,1308 56,3 -1,3 1,7 2,4
6 1,7348 1,6739 2,9039 3,0095 2,8019 60,2 -5,9 34,8 10,9
7 1,6928 1,7419 2,9487 2,8656 3,0342 57,4 -8,1 65,6 16,4
कुल12,3234 12,1587 21,4003 21,7078 21,1355 403,5 1,7 197,9 56,3
औसत मूल्य1,7605 1,7370 3,0572 3,1011 3,0194 एक्सएक्स28,27 8,0
σ 0,0425 0,0484 एक्सएक्सएक्सएक्सएक्सएक्सएक्स
σ20,0018 0,0023 एक्सएक्सएक्सएक्सएक्सएक्सएक्स

सी और बी की गणना करें:

सी = वाई -बी एक्स = 1.7605 + 0.298 1.7370 = 2.278126
हमें एक रेखीय समीकरण मिलता है: Y=2.278-0.298 X
इसे प्रबल करने के बाद, हमें मिलता है: y=10 2.278 x -0.298
इस समीकरण में वास्तविक मूल्यों को प्रतिस्थापित करना एक्स,हम परिणाम के सैद्धांतिक मूल्य प्राप्त करते हैं। उनके आधार पर, हम संकेतकों की गणना करते हैं: कनेक्शन की जकड़न - सहसंबंध सूचकांक p xy और औसत सन्निकटन त्रुटि A ।

पावर मॉडल की विशेषताओं से संकेत मिलता है कि यह रैखिक कार्य से कुछ हद तक संबंध का वर्णन करता है।

1 सी. घातीय वक्र y \u003d a b x के समीकरण का निर्माण समीकरण के दोनों भागों का लघुगणक लेते समय चर को रैखिक करने की प्रक्रिया से पहले होता है:
एलजी वाई = एलजी ए + एक्स एलजी बी
वाई = सी + बी एक्स
गणना के लिए, हम तालिका डेटा का उपयोग करते हैं।

वाईएक्स वाईएक्स वाई2 x2वाई एक्सवाई-वाई एक्स(वाई-वाईएक्स)²ए आई
1 1,8376 45,1 82,8758 3,3768 2034,01 60,7 8,1 65,61 11,8
2 1,7868 59,0 105,4212 3,1927 3481,00 56,4 4,8 23,04 7,8
3 1,7774 57,2 101,6673 3,1592 3271,84 56,9 3,0 9,00 5,0
4 1,7536 61,8 108,3725 3,0751 3819,24 55,5 1,2 1,44 2,1
5 1,7404 58,8 102,3355 3,0290 3457,44 56,4 -1,4 1,96 2,5
6 1,7348 47,2 81,8826 3,0095 2227,84 60,0 -5,7 32,49 10,5
7 1,6928 55,2 93,4426 2,8656 3047,04 57,5 -8,2 67,24 16,6
कुल12,3234 384,3 675,9974 21,7078 21338,41 403,4 -1,8 200,78 56,3
बुध जेएन।1,7605 54,9 96,5711 3,1011 3048,34 एक्सएक्स28,68 8,0
σ 0,0425 5,86 एक्सएक्सएक्सएक्सएक्सएक्सएक्स
σ20,0018 34,339 एक्सएक्सएक्सएक्सएक्सएक्सएक्स

प्रतिगमन पैरामीटर ए और के मान मेंकुल राषि का जोड़:

ए = वाई -बी एक्स = 1.7605 + 0.0023 54.9 = 1.887
एक रेखीय समीकरण प्राप्त होता है: Y=1.887-0.0023x। हम परिणामी समीकरण को प्रबल करते हैं और इसे सामान्य रूप में लिखते हैं:
y x =10 1.887 10 -0.0023x = 77.1 0.9947 x
हम सहसंबंध सूचकांक p xy के माध्यम से संबंधों की मजबूती का अनुमान लगाते हैं:

3588,01 56,9 3,0 9,00 5,0 4 56,7 0,0162 0,9175 0,000262 3214,89 55,5 1,2 1,44 2,1 5 55 0,0170 0,9354 0,000289 3025,00 56,4 -1,4 1,96 2,5 6 54,3 0,0212 1,1504 0,000449 2948,49 60,8 -6,5 42,25 12,0 7 49,3 0,0181 0,8931 0,000328 2430,49 57,5 -8,2 67,24 16,6 कुल405,2 0,1291 7,5064 0,002413 23685,76 405,2 0,0 194,90 56,5 औसत मूल्य57,9 0,0184 1,0723 0,000345 3383,68 एक्सएक्स27,84 8,1 σ 5,74 0,002145 एक्सएक्सएक्सएक्सएक्सएक्सएक्स σ232,9476 0,000005 एक्सएक्स