सुधारात्मक विश्लेषण में नकारात्मक निर्भरता। कोर्सवर्क: सहसंबंध विश्लेषण

प्रकृति या सामाजिक विकास के किसी भी नियम को संबंधों के एक सेट के विवरण द्वारा दर्शाया जा सकता है। यदि ये निर्भरताएँ स्टोकेस्टिक हैं, और विश्लेषण सामान्य आबादी के एक नमूने पर किया जाता है, तो अनुसंधान का यह क्षेत्र निर्भरता के सांख्यिकीय अध्ययन के कार्यों को संदर्भित करता है, जिसमें सहसंबंध, प्रतिगमन, विचरण, सहप्रसरण विश्लेषण और विश्लेषण शामिल हैं। आकस्मिकता टेबल्स।

    क्या अध्ययन किए गए चरों के बीच कोई संबंध है?

    कनेक्शन की निकटता को कैसे मापें?

एक सांख्यिकीय अध्ययन में मापदंडों के बीच संबंध की सामान्य योजना को अंजीर में दिखाया गया है। एक।

चित्रा एस अध्ययन के तहत वास्तविक वस्तु का एक मॉडल है। व्याख्यात्मक (स्वतंत्र, भाज्य) चर वस्तु के कामकाज के लिए शर्तों का वर्णन करते हैं। यादृच्छिक कारक ऐसे कारक हैं जिनके प्रभाव को ध्यान में रखना मुश्किल है या जिनका प्रभाव वर्तमान में उपेक्षित है। परिणामी (आश्रित, समझाया गया) चर वस्तु के कामकाज के परिणाम की विशेषता है।

विश्लेषण किए गए चर की प्रकृति को ध्यान में रखते हुए संबंधों के विश्लेषण की विधि का चुनाव किया जाता है।

सहसंबंध विश्लेषण - सांख्यिकीय डेटा को संसाधित करने की एक विधि, जिसमें चर के बीच संबंधों का अध्ययन करना शामिल है।

सहसंबंध विश्लेषण का लक्ष्य दूसरे चर की सहायता से एक चर के बारे में कुछ जानकारी प्रदान करना है। ऐसे मामलों में जहां लक्ष्य को प्राप्त करना संभव है, चर को सहसंबद्ध कहा जाता है। सहसंबंध केवल मात्राओं की रैखिक निर्भरता को दर्शाता है, लेकिन उनकी कार्यात्मक कनेक्टिविटी को नहीं दर्शाता है। उदाहरण के लिए, यदि हम मान A = sin(x) और B = cos(x) के बीच सहसंबंध गुणांक की गणना करते हैं, तो यह शून्य के करीब होगा, अर्थात। मात्राओं के बीच कोई संबंध नहीं है।

सहसंबंध का अध्ययन करते समय, चित्रमय और विश्लेषणात्मक दृष्टिकोण का उपयोग किया जाता है।

ग्राफिकल विश्लेषण एक सहसंबंध क्षेत्र के निर्माण के साथ शुरू होता है। सहसंबंध क्षेत्र (या स्कैटरप्लॉट) दो विशेषताओं के माप परिणामों के बीच एक चित्रमय संबंध है। इसे बनाने के लिए, प्रारंभिक डेटा को एक ग्राफ़ पर प्लॉट किया जाता है, एक आयताकार समन्वय प्रणाली में निर्देशांक xi और yi के साथ एक बिंदु के रूप में मूल्यों की प्रत्येक जोड़ी (xi, yi) को प्रदर्शित करता है।

सहसंबंध क्षेत्र का दृश्य विश्लेषण हमें दो अध्ययन किए गए संकेतकों के बीच संबंध के रूप और दिशा के बारे में एक धारणा बनाने की अनुमति देता है। संबंध के रूप के अनुसार, सहसंबंध निर्भरता को आमतौर पर रैखिक (चित्र 1 देखें) और गैर-रेखीय (चित्र 2 देखें) में विभाजित किया जाता है। एक रैखिक निर्भरता के साथ, सहसंबंध क्षेत्र का लिफाफा एक दीर्घवृत्त के करीब होता है। दो यादृच्छिक चर का रैखिक संबंध यह है कि जब एक यादृच्छिक चर बढ़ता है, तो दूसरा यादृच्छिक चर एक रैखिक नियम के अनुसार बढ़ता (या घटता) होता है।

रिश्ते की दिशा सकारात्मक होती है यदि एक विशेषता के मूल्य में वृद्धि से दूसरे के मूल्य में वृद्धि होती है (चित्र 3 देखें) और नकारात्मक अगर एक विशेषता के मूल्य में वृद्धि से मूल्य में कमी आती है दूसरे का (चित्र 4 देखें)।

ऐसी निर्भरताएँ जिनमें केवल सकारात्मक या केवल नकारात्मक दिशाएँ होती हैं, मोनोटोनिक कहलाती हैं।

सहसंबंध विश्लेषण- सहसंबंध के गणितीय सिद्धांत के आधार पर यादृच्छिक घटनाओं और घटनाओं के बीच संबंध का आकलन करने के तरीकों का एक सेट। इस मामले में, सबसे सरल विशेषताओं का उपयोग किया जाता है जिनके लिए न्यूनतम गणना की आवश्यकता होती है। शब्द "सहसंबंध" को आमतौर पर "रिश्ते" और "अन्योन्याश्रितता" की अवधारणाओं से पहचाना जाता है। हालांकि, वे पर्याप्त नहीं हैं। सहसंबंध केवल संकेतों के बीच संचार के प्रकारों में से एक है, जो औसतन प्रकट होता है और रैखिक होता है। यदि दो मात्राओं के बीच एक स्पष्ट संबंध है, तो ऐसे संबंध को कार्यात्मक कहा जाता है, और मात्राओं में से एक (कारण) अन्य मात्रा (परिणाम) के मूल्य को विशिष्ट रूप से निर्धारित कर सकती है। फंकट्स, निर्भरता एक यादृच्छिक (संभाव्य, स्टोकेस्टिक) निर्भरता की एक विशेष अभिव्यक्ति है, जब कनेक्शन दो मात्राओं के प्रत्येक मूल्य के लिए प्रकट नहीं होता है, लेकिन केवल औसत पर।

के.ए. दो सबसे महत्वपूर्ण मात्रात्मक विशेषताओं की पहचान करने के लिए दो या दो से अधिक यादृच्छिक चर के अध्ययन में उपयोग किया जाता है: इन मात्राओं के बीच संबंधों का गणितीय समीकरण और उनके बीच संबंधों की निकटता का आकलन। इन विशेषताओं को निर्धारित करने के लिए प्रारंभिक डेटा अवलोकन (माप, प्रयोग) के समकालिक परिणाम हैं, अर्थात, एक साथ अनुभव से प्राप्त, संकेतों पर सांख्यिकीय डेटा, जिसके बीच संबंध का अध्ययन किया जा रहा है। प्रारंभिक डेटा को तालिकाओं के रूप में अवलोकन के परिणामों के रिकॉर्ड या चुंबकीय टेप, छिद्रित टेप या छिद्रित कार्ड पर उनके समकक्ष प्रतिनिधित्व के साथ दिया जा सकता है।

के.ए. निकटता की परिभाषा और विभिन्न संकेतों के बीच संचार के समीकरणों के लिए चिकित्सा और जीव विज्ञान में व्यापक आवेदन पाया गया, एनएपीआर, विश्लेषण के परिणाम एक कील, संकेत या विशेष निरीक्षण जो स्वस्थ या बीमार लोगों पर किए जाते हैं (देखें। एक के कार्यों का सहसंबंध जीव)। करने के लिए परिणाम. और. रोगों के वस्तुनिष्ठ पूर्वानुमान बनाने, रोगी की स्थिति का आकलन करने, रोग के पाठ्यक्रम (पूर्वानुमान देखें) के लिए उपयोग किया जाता है। एक प्राथमिकता, केवल सैद्धांतिक बायोल और शहद के परिणामों से। अध्ययन, यह भविष्यवाणी करना मुश्किल या असंभव है कि अध्ययन किए गए लक्षण कैसे संबंधित हैं। इस प्रश्न का उत्तर देने के लिए, एक अवलोकन या एक विशेष प्रयोग किया जाता है।

द्वि-आयामी सहसंबंध विश्लेषण का उपयोग किन्हीं दो संकेतों की अभिव्यक्ति पर प्रयोगात्मक डेटा के प्रसंस्करण में किया जाता है।

सहसंबंध तालिका। टिप्पणी। तालिका X और Y संकेतों के अंतराल को दर्शाती है, साथ ही उनकी घटना की आवृत्ति (तालिका के केंद्र में), बल्बोकोनजंक्टिवल क्षेत्र के माइक्रोवैस्कुलचर के मॉर्फोमेट्रिक विश्लेषण के परिणामों से गणना की जाती है, जहां Y का व्यास है शिरापरक, और एक्स धमनी का व्यास (एमएमसी में) है।

प्रयोग का प्रत्येक परिणाम एक यादृच्छिक चर है, और उद्देश्य पैटर्न केवल माप परिणामों के पूरे सेट में दिखाई देते हैं। इसलिए, प्रयोगात्मक डेटा के पूरे सेट को संसाधित करने के परिणामों के आधार पर निष्कर्ष निकाले जाते हैं, न कि व्यक्तिगत मूल्यों पर, जो यादृच्छिक होते हैं। एक यादृच्छिक घटना के प्रभाव को कम करने के लिए, प्रारंभिक डेटा को समूहों में जोड़ा जाता है, जो एक सहसंबंध तालिका (तालिका देखें) को संकलित करके प्राप्त किया जाता है। ऐसी तालिका में दो विशेषताओं - Y और X के मानों के अंतराल (या उनके मध्यबिंदु) होते हैं, साथ ही इन मानों के संगत अंतराल में X और Y मानों के घटित होने की आवृत्ति भी होती है। प्रयोग के परिणामों से परिकलित ये आवृत्तियाँ, किसी विशेष अंतराल के X और Y मानों के संयुक्त होने की प्रायिकता का व्यावहारिक अनुमान हैं। सहसंबंध तालिका का निर्माण प्रारंभिक जानकारी को संसाधित करने का पहला चरण है। सहसंबंध तालिकाओं का निर्माण और उनकी आगे की पूर्ण प्रसंस्करण सार्वभौमिक या विशेष कंप्यूटर (देखें। इलेक्ट्रॉनिक कंप्यूटर) पर जल्दी से की जाती है। सहसंबंध तालिका के समूहीकृत आंकड़ों के अनुसार, समीकरण की अनुभवजन्य विशेषताओं और कनेक्शन की जकड़न की गणना की जाती है। वाई और एक्स के बीच संबंध समीकरण निर्धारित करने के लिए, एक्स फीचर के प्रत्येक अंतराल में वाई फीचर के औसत मूल्यों की गणना की जाती है। प्रत्येक i-वें अंतराल के लिए Yxi का मान प्राप्त करें, जिसका कनेक्शन सभी i-अंतरालों के लिए एक अनुभवजन्य प्रतिगमन रेखा देता है जो विशेषता Y के संबंध के रूप को विशेषता X के साथ औसतन विशेषता देता है - फ़ंक्शन का ग्राफ Yx= एफ (एक्स)। यदि सुविधाओं Y और X के बीच एक स्पष्ट संबंध था, तो संबंध समीकरण व्यावहारिक और सैद्धांतिक समस्याओं को हल करने के लिए पर्याप्त होगा, क्योंकि इसका उपयोग हमेशा विशेषता Y के मूल्य को निर्धारित करने के लिए किया जा सकता है यदि मान X दिया गया हो। व्यवहार में, वाई और एक्स के बीच संबंध स्पष्ट नहीं है, यह कनेक्शन यादृच्छिक है और एक्स का एक मान वाई के कई मूल्यों से मेल खाता है। इसलिए, एक और विशेषता की आवश्यकता है जो वाई और एक्स के बीच संबंधों की ताकत, निकटता को मापता है। ऐसी विशेषताएं हैं फैलाव (सहसंबंध) अनुपात ух और सहसंबंध गुणांक ryx। इन मात्राओं में से पहली एक मनमानी फ़ंक्शन f में Y और X के बीच कनेक्शन की जकड़न की विशेषता है, और ryx का उपयोग केवल तभी किया जाता है जब f एक रैखिक कार्य हो।

yx और ryx के मान भी केवल सहसंबंध तालिका से निर्धारित होते हैं। गणना आमतौर पर निम्नलिखित क्रम में की जाती है: एक्स और वाई दोनों विशेषताओं के औसत मूल्य निर्धारित किए जाते हैं, उनके मानक विचलन σx और σy, और फिर सूत्र के अनुसार xy:

और सूत्र के अनुसार ryx:

जहाँ n प्रयोगों की कुल संख्या है, Xcpi i-वें अंतराल के X का औसत मान है, Ycpj j-वें अंतराल के Y का औसत मान है, k, l सुविधाओं X और Y के अंतरालों की संख्या है , क्रमशः, mi(x) Xcpi मानों की आवृत्ति (संख्या) है। yx और ryx के निर्धारण की सटीकता की मात्रात्मक विशेषताएं उनके मानक विचलन हैं, जो के बराबर हैं

गुणांक के मान शून्य और एक के बीच स्थित हैं (0=<ηyx=<1). Если ηyx= 0 (рис., а), то это свидетельствует о том, что признаки Y и X недисперсированы, т. е. регрессия Yx = f(x) не дает связи между признаками Y и X, а при ηyx = 1 существует однозначная связь между Y и X (рис., б, ж). Для ηyx<1 признак Y только частично определяется признаком X, и необходимо изучение дополнительных признаков для повышения достоверности определения Y (рис., г, д, е, и).

गुणांक r का मान -1 और +1 (-1= .) के बीच होता है

बहुभिन्नरूपी सहसंबंध विश्लेषण - उन मामलों में समीकरण का निर्धारण और कनेक्शन की जकड़न जहां अध्ययन की गई विशेषताओं की संख्या दो से अधिक है। इसलिए, यदि Y एक जटिल विशेषता है और इसका परिणाम X1, X2, ..., Xn सुविधाओं के एक सेट की उपस्थिति पर निर्भर करता है, तो, प्रयोगात्मक डेटा के अनुसार, निम्नलिखित निर्धारित किया जाना चाहिए:।, n, यानी। Yx1x2...xn = F(x1, x2...,xn) ; बी) वाई और सेट एक्स 1, एक्स 2, ..., एक्सएन के बीच कनेक्शन की मजबूती।

बहुआयामी K. पर पर्यवेक्षण के परिणामों का प्रारंभिक प्रसंस्करण और। क्या यह है कि प्रत्येक जोड़ी सुविधाओं के लिए, फैलाव संबंधों के मान yxi (i = 1,2,..., n) और xixj (i!=j) सहसंबंध गुणांक ryxi और rxixj निर्धारित किए जाते हैं, साथ ही युग्मित प्रतीपगमन Yxi = fi(xi) के रूप में। फिर इन आंकड़ों का उपयोग बहु समाश्रयण समीकरण Yx1x2...xn = F (x1,x2,...,xn), बहु प्रकीर्णन अनुपात ηyx1x2...xn, और बहु ​​सहसंबंध गुणांक Ryx1x2...xn को निर्धारित करने के लिए किया जाता है। . एकाधिक प्रतिगमन समीकरण X1, X2, ..., Xn के सेट द्वारा सुविधा Y के मूल्य को निर्धारित करना संभव बनाता है, अर्थात, यदि यह समीकरण उपलब्ध है, तो के मूल्यों की भविष्यवाणी करना संभव है वाई परिणामी सेट के विशिष्ट मूल्यों के परिणामों के आधार पर (उदाहरण के लिए, एक्स 1, एक्स 2 ... एक्सएन सुविधाओं द्वारा विश्लेषण के परिणाम)। मान ηyx1x2...xn का उपयोग Y और सुविधाओं के सेट X1, X2, ...Xn के बीच एक मनमानी फ़ंक्शन F, और Ryx1x2...xn के बीच कनेक्शन की मजबूती की विशेषता के रूप में किया जाता है - उस मामले के लिए जब फलन F रैखिक है। गुणांक yx1x2....xn और Ryx1x2...xn शून्य और एक के बीच मान लेते हैं। बहुआयामी के.ए. के लिए विचाराधीन समावेशन अतिरिक्त सुविधाएं yx1x2...xn, Ryx1x2...xn मानों को एकता के करीब लाना संभव बनाती हैं और इस प्रकार एकाधिक प्रतिगमन समीकरण का उपयोग करके Y सुविधा भविष्यवाणी की सटीकता में सुधार करती हैं।

एक उदाहरण के रूप में, युग्मित K. a के परिणामों पर विचार करें, साथ ही साथ कई प्रतिगमन समीकरण और संकेतों के बीच कई सहसंबंध गुणांक: Y - स्थिर स्यूडोपैरेसिस, X1 - दाईं ओर के अंगों में मोटर दोष का पार्श्वकरण, X2 - बाईं ओर के अंगों में समान, X3 - वानस्पतिक संकट। उनके लिए फैलाव अनुपात और जोड़ी सहसंबंध गुणांक के मान क्रमशः yx1 = 0.429, yx2 = 0.616, yx3 = -0.334, और ryx1 = 0.320, ryx2 = 0.586, ryx3 = -0.325 होंगे। एकाधिक रैखिक प्रतिगमन के समीकरण के अनुसार Yх1х2х3 = 0.638 x1 + 0.839 x2 - 0.195 x3। बहु सहसंबंध गुणांक Ryx1x2x3 =0.721 के रूप में व्यक्त किया जाएगा। उदाहरण से यह देखा जा सकता है कि, X1, X2 और X3 डेटा के अनुसार, अभ्यास के लिए पर्याप्त सटीकता के साथ स्थिर स्यूडोपेरेसिस की भविष्यवाणी की जा सकती है।

करने के तरीके और। गतिशील विशेषताओं को प्राप्त करना भी संभव बनाता है और। इस मामले में, अध्ययन किए गए संकेत (जैसे, ईसीजी, ईईजी, आदि) को वाई (टी) और एक्स (टी) के यादृच्छिक कार्यों के रूप में माना जाता है। इन कार्यों के अवलोकन के परिणामों के आधार पर, दो सबसे महत्वपूर्ण विशेषताएं भी निर्धारित की जाती हैं: ए) वाई (टी) और एक्स (टी) के बीच संचार ऑपरेटर (गणितीय समीकरण) का मूल्यांकन; बी) उनके बीच संबंध की निकटता का आकलन। यादृच्छिक कार्यों Y (t) और X (t) के फैलाव और सहसंबंध कार्यों को कनेक्शन की जकड़न की विशेषताओं के रूप में लिया जाता है। ये कार्य फैलाव संबंधों और सहसंबंध गुणांक का सामान्यीकरण हैं। इस प्रकार, प्रत्येक निश्चित मान t का सामान्यीकृत पारस्परिक फैलाव फ़ंक्शन yx(t) सुविधाओं Y(t) और X(t) के मानों के बीच फैलाव संबंध है। इसी तरह, सामान्यीकृत क्रॉस-सहसंबंध फ़ंक्शन Ryx(t), t के प्रत्येक निश्चित मान के लिए, Y(t) और X(t) सुविधाओं के बीच सहसंबंध गुणांक है। समय के विभिन्न बिंदुओं पर एक ही अध्ययन की गई मात्रा के लिए एक रैखिक संबंध (निर्भरता) की विशेषता को स्वसहसंबंध कहा जाता है।

के.ए. पहचान की समस्या को हल करने के तरीकों में से एक है, जिसका व्यापक रूप से गणितीय मॉडल प्राप्त करने और चिकित्सा बायोल, अनुसंधान और उपचार के स्वचालन में उपयोग किया जाता है।

ग्रंथ सूची:कम्प्यूटिंग सिस्टम और हृदय रोगों का स्वचालित निदान, एड। सी. कैसरेस और एल. ड्रेफस, ट्रांस। अंग्रेजी से, एम।, 1974; गुटमैन एस. आर. इलेक्ट्रोएन्सेफलोग्राम के दो मॉडलों पर एक सामान्य यादृच्छिक प्रक्रिया में परिवर्तित होने पर, में: Upravlenie मैं सूचित करता हूँ। वन्य जीवन में प्रक्रियाएं, एड। वी. वी. लरीना, पी. 205, एम।, 1971; Zaslavskaya R. M., Perepel-kin E. G. और Akhmetov K. Zh। दिन के दौरान एनजाइना पेक्टोरिस वाले रोगियों में हेमोकैग्यूलेशन और लिपिड चयापचय के संकेतकों के बीच संबंध, कार्डियोलॉजी, टी। 111, 1977; के आर ए एम ई आर जी। सांख्यिकी के गणितीय तरीके, ट्रांस। अंग्रेजी से, एम।, 1975; पास्टर्नक ई.बी. एट अल। वाद्य सहसंबंध विश्लेषण, कार्डियोलॉजी, टी। 17, ज़िया 7, पी का उपयोग करके अलिंद फिब्रिलेशन में एट्रिया की विद्युत गतिविधि का अध्ययन। 50, 1977; सिनित्सिन बी.एस. स्वचालित सहसंबंधक और उनका अनुप्रयोग, नोवोसिबिर्स्क, 1964, ग्रंथ सूची; आर-बी और एक्स वी। यू। जैविक और चिकित्सा अनुसंधान में सांख्यिकीय विश्लेषण, एम।, 1975, ग्रंथ सूची।

वी. एन. रीबमैन, एन.एस. रीबमैन।

मनोवैज्ञानिक अनुसंधान सामग्री के प्रसंस्करण में सांख्यिकीय विधियों का उपयोग प्रयोगात्मक डेटा से उपयोगी जानकारी निकालने का एक बड़ा अवसर प्रदान करता है। सबसे आम सांख्यिकीय विधियों में से एक सहसंबंध विश्लेषण है।

शब्द "सहसंबंध" का प्रयोग पहली बार फ्रांसीसी जीवाश्म विज्ञानी जे. कुवियर द्वारा किया गया था, जिन्होंने "जानवरों के अंगों और अंगों के सहसंबंध के कानून" को घटाया था (यह कानून आपको शरीर के पाए गए हिस्सों से पूरे जानवर की उपस्थिति को बहाल करने की अनुमति देता है। ) यह शब्द अंग्रेजी जीवविज्ञानी और सांख्यिकीविद् एफ। गैल्टन द्वारा आंकड़ों में पेश किया गया था (न कि केवल "कनेक्शन" - संबंध, और "जैसे कि एक कनेक्शन" - सहसंयोजन).

सहसंबंध विश्लेषण सहसंबंध गुणांक, द्वि-आयामी वर्णनात्मक सांख्यिकी, दो चर के संबंध (संयुक्त परिवर्तनशीलता) का एक मात्रात्मक माप का उपयोग करके चर के बीच संबंधों के बारे में परिकल्पना का परीक्षण है। इस प्रकार, यह यादृच्छिक चर या सुविधाओं के बीच सहसंबंधों का पता लगाने के तरीकों का एक समूह है।

दो यादृच्छिक चर के सहसंबंध विश्लेषण में शामिल हैं:

  • एक सहसंबंध क्षेत्र बनाना और एक सहसंबंध तालिका संकलित करना;
  • नमूना सहसंबंध गुणांक और सहसंबंध अनुपात की गणना;
  • संबंधों के महत्व की सांख्यिकीय परिकल्पना का परीक्षण।

सहसंबंध विश्लेषण का मुख्य उद्देश्य अध्ययन के तहत दो या दो से अधिक चर के बीच संबंध की पहचान करना है, जिसे अध्ययन के तहत दो विशेषताओं में एक संयुक्त समन्वित परिवर्तन के रूप में माना जाता है। इस परिवर्तनशीलता की तीन मुख्य विशेषताएं हैं: आकार, दिशा और ताकत।

सहसंबंध का रूप रैखिक या गैर-रैखिक हो सकता है। एक सहसंबंध की पहचान और व्याख्या करने के लिए एक रैखिक रूप अधिक सुविधाजनक है। एक रैखिक सहसंबंध के लिए, दो मुख्य दिशाओं को प्रतिष्ठित किया जा सकता है: सकारात्मक ("आगे कनेक्शन") और नकारात्मक ("प्रतिक्रिया")।

कनेक्शन की ताकत सीधे इंगित करती है कि अध्ययन किए गए चर की संयुक्त परिवर्तनशीलता कितनी स्पष्ट है। मनोविज्ञान में, घटना के कार्यात्मक अंतर्संबंध को केवल संबंधित विशेषताओं के संभाव्य संबंध के रूप में अनुभवजन्य रूप से प्रकट किया जा सकता है। संभाव्य संबंध की प्रकृति का एक दृश्य प्रतिनिधित्व एक स्कैटर आरेख द्वारा दिया जाता है - एक ग्राफ जिसका अक्ष दो चर के मूल्यों के अनुरूप होता है, और प्रत्येक विषय एक बिंदु होता है।

सहसंबंध गुणांक का उपयोग संभाव्य संबंध की संख्यात्मक विशेषता के रूप में किया जाता है, जिसके मान -1 से +1 तक की सीमा में भिन्न होते हैं। गणना के बाद, शोधकर्ता, एक नियम के रूप में, केवल सबसे मजबूत सहसंबंधों का चयन करता है, जिनकी आगे व्याख्या की जाती है (तालिका 1)।

"पर्याप्त रूप से मजबूत" सहसंबंधों का चयन करने के लिए मानदंड या तो सहसंबंध गुणांक का पूर्ण मूल्य (0.7 से 1 तक) या इस गुणांक के सापेक्ष मूल्य, सांख्यिकीय महत्व के स्तर (0.01 से 0.1) के आधार पर निर्धारित किया जा सकता है। नमूने का आकार। छोटे नमूनों में, आगे की व्याख्या के लिए, सांख्यिकीय महत्व के स्तर के आधार पर मजबूत सहसंबंधों का चयन करना अधिक सही है। बड़े नमूनों पर किए गए अध्ययनों के लिए, सहसंबंध गुणांक के निरपेक्ष मूल्यों का उपयोग करना बेहतर है।

इस प्रकार, सहसंबंध विश्लेषण का कार्य अलग-अलग विशेषताओं के बीच संबंध की दिशा (सकारात्मक या नकारात्मक) और रूप (रैखिक, गैर-रैखिक) स्थापित करने के लिए कम हो जाता है, इसकी मजबूती को मापता है, और अंत में, प्राप्त के महत्व स्तर की जांच करता है सहसंबंध गुणांक।

वर्तमान में, कई अलग-अलग सहसंबंध गुणांक विकसित किए गए हैं। सबसे ज्यादा इस्तेमाल किया जाता है आर-पियर्सन, आर-स्पीयरमैन और τ - केंडल। "सहसंबंध" मेनू में आधुनिक कंप्यूटर सांख्यिकीय कार्यक्रम बिल्कुल इन तीन गुणांकों की पेशकश करते हैं, और अन्य शोध समस्याओं को हल करने के लिए, समूहों की तुलना करने के तरीकों की पेशकश की जाती है।

सहसंबंध गुणांक की गणना के लिए विधि का चुनाव उस पैमाने के प्रकार पर निर्भर करता है जिससे चर संबंधित हैं (तालिका 2)।

अंतराल के साथ और नाममात्र पैमाने के साथ चर के लिए, पियर्सन सहसंबंध गुणांक (उत्पाद क्षणों का सहसंबंध) का उपयोग किया जाता है। यदि दो चरों में से कम से कम एक का क्रमिक पैमाना है या सामान्य रूप से वितरित नहीं है, तो स्पीयरमैन के रैंक सहसंबंध का उपयोग किया जाता है, या

टी-केंडल। यदि दो चरों में से एक द्विबीजपत्री है, तो बिंदु दो-श्रृंखला सहसंबंध का उपयोग किया जा सकता है (सांख्यिकीय कंप्यूटर प्रोग्राम SPSS में, यह संभावना उपलब्ध नहीं है; इसके बजाय, रैंक सहसंबंध की गणना का उपयोग किया जा सकता है)। इस घटना में कि दोनों चर द्विबीजपत्री हैं, एक चार-क्षेत्रीय सहसंबंध का उपयोग किया जाता है (इस प्रकार के सहसंबंध की गणना SPSS द्वारा दूरी माप और समानता उपायों की परिभाषा के आधार पर की जाती है)। दो गैर द्विबीजपत्री चरों के बीच सहसंबंध गुणांक की गणना तभी संभव है जब उनके बीच संबंध रैखिक (यूनिडायरेक्शनल) हो। यदि कनेक्शन, उदाहरण के लिए, यू-आकार (अस्पष्ट), सहसंबंध गुणांक कनेक्शन की ताकत के माप के रूप में उपयोग के लिए उपयुक्त नहीं है: इसका मान शून्य हो जाता है।

इस प्रकार, सहसंबंध गुणांक लागू करने की शर्तें इस प्रकार होंगी:

  • वस्तुओं के एक ही नमूने पर मात्रात्मक (रैंक, मीट्रिक) पैमाने में मापा गया चर;
  • चर के बीच संबंध एकरस है।

मुख्य सांख्यिकीय परिकल्पना, जिसे सहसंबंध विश्लेषण द्वारा परीक्षण किया जाता है, गैर-दिशात्मक है और इसमें यह दावा है कि सामान्य जनसंख्या में सहसंबंध शून्य के बराबर है एच 0: आर xy= 0. यदि इसे अस्वीकार कर दिया जाता है, तो वैकल्पिक परिकल्पना स्वीकार की जाती है एच 1: आर xy 0 एक सकारात्मक या नकारात्मक सहसंबंध की उपस्थिति के बारे में - गणना किए गए सहसंबंध गुणांक के संकेत पर निर्भर करता है।

परिकल्पना की स्वीकृति या अस्वीकृति के आधार पर सार्थक निष्कर्ष निकाले जाते हैं। यदि, सांख्यिकीय परीक्षण के परिणामों के अनुसार एच 0: आर xy= 0 स्तर a पर विचलन नहीं करता है, तो सार्थक निष्कर्ष इस प्रकार होगा: के बीच संबंध एक्सऔर यूपता नहीं चला। मैं मोटा एच 0 आर एक्सवाई= 0 स्तर a पर विचलन करता है, जिसका अर्थ है कि के बीच एक सकारात्मक (नकारात्मक) संबंध पाया गया है एक्सऔर यू. हालांकि, प्रकट सहसंबंधों की व्याख्या को सावधानी के साथ संपर्क किया जाना चाहिए। वैज्ञानिक दृष्टिकोण से, केवल दो चरों के बीच संबंध स्थापित करने का अर्थ कार्य-कारण संबंध का अस्तित्व नहीं है। इसके अलावा, एक सहसंबंध की उपस्थिति कारण और प्रभाव के बीच एक अनुक्रम संबंध स्थापित नहीं करती है। यह केवल इंगित करता है कि संयोग से अपेक्षा की जाने वाली अपेक्षा से दो चर एक-दूसरे से अधिक संबंधित हैं। फिर भी, सावधानी के साथ, कारण संबंधों के अध्ययन में सहसंबंध विधियों का उपयोग पूरी तरह से उचित है। स्पष्ट वाक्यांश जैसे "चर एक्स संकेतक में वृद्धि का कारण है" से बचा जाना चाहिए। यू". इस तरह के बयानों को मान्यताओं के रूप में तैयार किया जाना चाहिए, जिन्हें सैद्धांतिक रूप से प्रमाणित किया जाना चाहिए।

गणितीय आँकड़ों पर पाठ्यपुस्तकों में प्रत्येक सहसंबंध गुणांक के लिए गणितीय प्रक्रिया का विस्तृत विवरण दिया गया है; ; ; और अन्य। हम माप पैमाने के प्रकार के आधार पर इन गुणांकों के उपयोग की संभावना का वर्णन करने के लिए खुद को प्रतिबंधित करेंगे।

मीट्रिक चर का सहसंबंध

एक ही नमूने पर मापे गए दो मीट्रिक चर के संबंध का अध्ययन करने के लिए, हम उपयोग करते हैं सहसंबंध गुणांक आर-पियर्सन. गुणांक स्वयं सुविधाओं के बीच केवल एक रैखिक संबंध की उपस्थिति को दर्शाता है, जिसे आमतौर पर प्रतीकों द्वारा दर्शाया जाता है एक्सऔर यू. रैखिक सहसंबंध गुणांक एक पैरामीट्रिक विधि है और इसका सही अनुप्रयोग तभी संभव है जब माप के परिणाम अंतराल के पैमाने पर प्रस्तुत किए जाते हैं, और विश्लेषण किए गए चर में मूल्यों का वितरण सामान्य से कुछ हद तक भिन्न होता है। ऐसी कई स्थितियाँ हैं जिनमें इसका उपयोग उचित है। उदाहरण के लिए: एक छात्र की बुद्धि और उसके अकादमिक प्रदर्शन के बीच संबंध स्थापित करना; मनोदशा और समस्या की स्थिति से बाहर निकलने में सफलता के बीच; आय स्तर और स्वभाव, आदि के बीच।

पियर्सन गुणांक व्यापक रूप से मनोविज्ञान और शिक्षाशास्त्र में उपयोग किया जाता है। उदाहरण के लिए, I. Ya. Kaplunovich और P. D. Rabinovich, M. P. Nuzhdina के कार्यों में, पियर्सन रैखिक सहसंबंध गुणांक की गणना का उपयोग परिकल्पना की पुष्टि करने के लिए किया गया था।

डेटा को "मैन्युअल रूप से" संसाधित करते समय, सहसंबंध गुणांक की गणना करना आवश्यक है, और फिर निर्धारित करें पी- महत्व का स्तर (डेटा सत्यापन को सरल बनाने के लिए, महत्वपूर्ण मूल्यों की तालिका का उपयोग किया जाता है आरएक्सवाई, जो इस मानदंड का उपयोग करके संकलित किए गए हैं)। पियर्सन के रैखिक सहसंबंध गुणांक का मान +1 से अधिक और -1 से कम नहीं हो सकता। ये दो संख्याएँ +1 और -1 सहसंबंध गुणांक की सीमाएँ हैं। जब गणना का परिणाम +1 से अधिक या -1 से कम होता है, तो यह इंगित करता है कि एक गणना त्रुटि हुई है।

कंप्यूटर पर गणना करते समय, सांख्यिकीय कार्यक्रम (SPSS, Statistica) अधिक सटीक मान के साथ परिकलित सहसंबंध गुणांक के साथ होता है पी-स्तर।

स्वीकृति या अस्वीकृति पर सांख्यिकीय निर्णय के लिए एच0आमतौर पर सेट α = 0.05, और बड़ी मात्रा में प्रेक्षणों के लिए (100 या अधिक) α = 0.01. यदि एक पी α, एच 0को खारिज कर दिया जाता है और एक सार्थक निष्कर्ष निकाला जाता है कि अध्ययन किए गए चर (सकारात्मक या नकारात्मक, सहसंबंध के संकेत के आधार पर) के बीच सांख्यिकीय रूप से महत्वपूर्ण (महत्वपूर्ण) संबंध पाया गया है। कब पी > α, एच0अस्वीकार नहीं किया गया है, सार्थक निष्कर्ष इस कथन तक सीमित है कि संबंध (सांख्यिकीय रूप से महत्वपूर्ण) नहीं मिला था।

यदि कोई कनेक्शन नहीं मिलता है, लेकिन यह मानने का कारण है कि कनेक्शन वास्तव में मौजूद है, तो आपको कनेक्शन की अविश्वसनीयता के संभावित कारणों की जांच करनी चाहिए।

संचार गैर-रैखिकता- ऐसा करने के लिए, द्वि-आयामी स्कैटर प्लॉट का विश्लेषण करें। यदि संबंध गैर-रैखिक है, लेकिन एकरस है, तो सहसंबंधों को रैंक करें। यदि संबंध मोनोटोनिक नहीं है, तो नमूने को उन हिस्सों में विभाजित करें जिनमें संबंध मोनोटोनिक है, और नमूने के प्रत्येक भाग के लिए अलग-अलग सहसंबंधों की गणना करें, या नमूने को विपरीत समूहों में विभाजित करें और फिर उनकी अभिव्यक्ति के स्तर के अनुसार तुलना करें विशेषता।

एक या दोनों विशेषताओं के वितरण में आउटलेर्स की उपस्थिति और एक स्पष्ट विषमता।ऐसा करने के लिए, आपको दोनों विशेषताओं के आवृत्ति वितरण के हिस्टोग्राम को देखने की जरूरत है। यदि आउटलेयर या विषमताएं हैं, तो आउटलेर्स को बाहर करें या रैंक सहसंबंधों पर स्विच करें।

नमूना विविधता(2डी स्कैटरप्लॉट का विश्लेषण करें)। नमूने को उन भागों में विभाजित करने का प्रयास करें जिनमें संबंध की अलग-अलग दिशाएँ हो सकती हैं।

यदि संबंध सांख्यिकीय रूप से महत्वपूर्ण है, तो सार्थक निष्कर्ष निकालने से पहले, झूठे सहसंबंध की संभावना को बाहर करना आवश्यक है:

  • बाहरी लोगों के कारण कनेक्शन. यदि आउटलेयर हैं, तो सहसंबंधों को रैंक करें या आउटलेर्स को बाहर करें;
  • संबंध तीसरे चर के प्रभाव के कारण है. यदि एक समान घटना है, तो न केवल पूरे नमूने के लिए, बल्कि प्रत्येक समूह के लिए अलग-अलग सहसंबंध की गणना करना आवश्यक है। यदि "तीसरा" चर मीट्रिक है, तो आंशिक सहसंबंध की गणना करें।

आंशिक सहसंबंध गुणांक rxy-zगणना की जाती है यदि इस धारणा का परीक्षण करना आवश्यक है कि दो चर के बीच संबंध एक्सऔर यूतीसरे चर के प्रभाव पर निर्भर नहीं करता जेड. बहुत बार, दो चर एक दूसरे के साथ केवल इस तथ्य के कारण सहसंबद्ध होते हैं कि दोनों एक तीसरे चर के प्रभाव में संगीत कार्यक्रम में बदलते हैं। दूसरे शब्दों में, वास्तव में, संबंधित गुणों के बीच कोई संबंध नहीं है, लेकिन यह एक सामान्य कारण के प्रभाव में एक सांख्यिकीय संबंध में प्रकट होता है। उदाहरण के लिए, दो चरों में परिवर्तनशीलता का एक सामान्य कारण आयु हो सकता है जब विभिन्न आयु के समूह में विभिन्न मनोवैज्ञानिक विशेषताओं के संबंध का अध्ययन किया जाता है। कार्य-कारण के संदर्भ में आंशिक सहसंबंध की व्याख्या करते समय, किसी को सावधान रहना चाहिए, क्योंकि यदि जेडके साथ संबंध रखता है एक्सऔर साथ यू, और आंशिक सहसंबंध rxy-zशून्य के करीब, यह जरूरी नहीं है कि इसका पालन करें जेडका एक सामान्य कारण है एक्सऔर यू.

रैंक चर का सहसंबंध

यदि सहसंबंध गुणांक मात्रात्मक डेटा के लिए अस्वीकार्य है आर-पियर्सन, फिर प्रारंभिक रैंकिंग के बाद दो चर के संबंध के बारे में परिकल्पना का परीक्षण करने के लिए, सहसंबंधों को लागू किया जा सकता है आर-स्पीयरमैनया τ -केंडल. उदाहरण के लिए, I. A. Lavochkin द्वारा संगीत की दृष्टि से प्रतिभाशाली किशोरों की मनोभौतिक विशेषताओं के एक अध्ययन में, स्पीयरमैन मानदंड का उपयोग किया गया था।

दोनों गुणांक (स्पीयरमैन और केंडल) की सही गणना के लिए, माप के परिणामों को रैंक या अंतराल के पैमाने में प्रस्तुत किया जाना चाहिए। इन मानदंडों के बीच कोई मौलिक अंतर नहीं है, लेकिन आम तौर पर यह स्वीकार किया जाता है कि केंडल गुणांक अधिक "सार्थक" है, क्योंकि यह चर के बीच संबंधों का अधिक पूरी तरह से और विस्तार से विश्लेषण करता है, मूल्यों के जोड़े के बीच सभी संभावित पत्राचारों को छांटता है। स्पीयरमैन का गुणांक अधिक सटीक रूप से चर के बीच संबंध की मात्रात्मक डिग्री को ध्यान में रखता है।

स्पीयरमैन का रैंक सहसंबंध गुणांकशास्त्रीय पियरसन सहसंबंध गुणांक का एक गैर-पैरामीट्रिक एनालॉग है, लेकिन इसकी गणना तुलनात्मक चर (अंकगणित माध्य और भिन्नता) के वितरण-संबंधित संकेतकों को ध्यान में रखती है, लेकिन रैंक। उदाहरण के लिए, व्यक्तित्व लक्षणों के रैंकिंग आकलन के बीच संबंध को निर्धारित करना आवश्यक है जो किसी व्यक्ति के "मैं वास्तविक हूं" और "मैं आदर्श हूं" के विचार में शामिल हैं।

मनोवैज्ञानिक अनुसंधान में स्पीयरमैन गुणांक का व्यापक रूप से उपयोग किया जाता है। उदाहरण के लिए, यू। वी। बुशोव और एन। एन। नेस्मेलोवा के काम में: यह वह था जिसका उपयोग किसी व्यक्ति की व्यक्तिगत विशेषताओं पर ध्वनि संकेतों की अवधि के आकलन और पुनरुत्पादन की सटीकता की निर्भरता का अध्ययन करने के लिए किया गया था।

चूंकि यह गुणांक समान है आर-पियर्सन, फिर परिकल्पना का परीक्षण करने के लिए इसका उपयोग करना गुणांक का उपयोग करने के समान है आर-पियर्सन. अर्थात् परीक्षित सांख्यिकीय परिकल्पना, सांख्यिकीय निर्णय लेने की प्रक्रिया और सार्थक निष्कर्ष तैयार करना एक ही है। कंप्यूटर प्रोग्राम (SPSS, Statistica) में समान गुणांक के लिए महत्व स्तर आर-पियर्सन और आर-स्पीयरमैन हमेशा मेल खाता है।

अनुपात लाभ आर-स्पीयरमैन बनाम अनुपात आर-पियर्सन - संचार के प्रति अधिक संवेदनशीलता में। हम इसे निम्नलिखित मामलों में उपयोग करते हैं:

  • सामान्य रूप (तिरछापन, आउटलेयर) से कम से कम एक चर के वितरण में एक महत्वपूर्ण विचलन की उपस्थिति;
  • एक घुमावदार (मोनोटोनिक) कनेक्शन की उपस्थिति।

गुणांक लागू करने के लिए प्रतिबंध आर- स्पीयरमैन हैं:

  • प्रत्येक चर के लिए कम से कम 5 अवलोकन;
  • एक या दोनों चर में बड़ी संख्या में समान रैंक वाला गुणांक एक मोटे मूल्य देता है।

रैंक सहसंबंध गुणांक τ -केंडलदो नमूनों के मूल्यों के जोड़े के अनुपात की गणना के आधार पर एक स्वतंत्र मूल विधि है जिसमें समान या अलग रुझान (मूल्यों में वृद्धि या कमी) है। इस अनुपात को भी कहते हैं समरूपता कारक. इस प्रकार, इस पद्धति का मुख्य विचार यह है कि संबंधों की दिशा को जोड़े में विषयों की तुलना करके आंका जा सकता है: यदि विषयों की एक जोड़ी में परिवर्तन होता है एक्सदिशा में परिवर्तन के साथ मेल खाता है यू, यह एक सकारात्मक संबंध को इंगित करता है, यदि समान नहीं है - एक नकारात्मक संबंध, उदाहरण के लिए, व्यक्तिगत गुणों के अध्ययन में जो परिवार की भलाई के लिए निर्णायक महत्व के हैं। इस पद्धति में, एक चर को परिमाण के आरोही क्रम में एक मोनोटोनिक अनुक्रम (उदाहरण के लिए, पति का डेटा) के रूप में दर्शाया जाता है; एक अन्य चर (उदाहरण के लिए, पत्नी का डेटा) को संबंधित रैंकिंग स्थान सौंपा गया है। व्युत्क्रमों की संख्या (पहली पंक्ति की तुलना में एकरसता का उल्लंघन) का उपयोग सहसंबंध गुणांक के सूत्र में किया जाता है।

गिनती करते समय τ- केंडल "मैन्युअल रूप से" डेटा को पहले चर द्वारा आदेश दिया जाता है एक्स. फिर, प्रत्येक विषय के लिए, यह गणना की जाती है कि उसकी रैंक कितनी बार है यूनीचे दिए गए विषयों के रैंक से कम हो जाता है। परिणाम मैच कॉलम में दर्ज किया गया है। "संयोग" कॉलम में सभी मानों का योग है पी- मैचों की कुल संख्या, केंडल गुणांक की गणना के लिए सूत्र में प्रतिस्थापित की जाती है, जो कम्प्यूटेशनल रूप से सरल है, लेकिन इसके विपरीत, नमूने में वृद्धि के साथ आर- स्पीयरमैन, गणना की मात्रा आनुपातिक रूप से नहीं, बल्कि घातीय रूप से बढ़ती है। तो, उदाहरण के लिए, जब एन= 12 विषयों के 66 युग्मों को छाँटना आवश्यक है, और कब एन= 489 - पहले से ही 1128 जोड़े, यानी गणना की मात्रा 17 गुना से अधिक बढ़ जाती है। एक सांख्यिकीय कार्यक्रम (एसपीएसएस, स्टेटिस्टिका) में कंप्यूटर पर गणना करते समय, केंडल गुणांक की गणना गुणांक के समान ही की जाती है आर-स्पीयरमैन और आर-पियर्सन. परिकलित सहसंबंध गुणांक τ -केंडल को अधिक सटीक मूल्य की विशेषता है पी-स्तर।

मूल डेटा में आउटलेयर होने पर केंडल गुणांक लागू करना पसंद किया जाता है।

रैंक सहसंबंध गुणांक की एक विशेषता यह है कि अधिकतम रैंक सहसंबंध (+1, -1) मूल चर के बीच सख्त प्रत्यक्ष या व्युत्क्रमानुपाती संबंधों के अनुरूप नहीं हैं। एक्सऔर यू: उनके बीच केवल एक नीरस कार्यात्मक संबंध पर्याप्त है। यदि एक चर का बड़ा मान हमेशा दूसरे चर (+1) के बड़े मान से मेल खाता है, या एक चर का बड़ा मान हमेशा दूसरे चर के छोटे मान से मेल खाता है और इसके विपरीत (-1) )

परीक्षण की जाने वाली सांख्यिकीय परिकल्पना, सांख्यिकीय निर्णय लेने की प्रक्रिया और एक सार्थक निष्कर्ष तैयार करना मामले के समान ही है आर-स्पीयरमैन या आर-पियर्सन.

यदि सांख्यिकीय रूप से महत्वपूर्ण संबंध नहीं पाया जाता है, लेकिन यह मानने का कारण है कि वास्तव में एक संबंध है, तो आपको पहले गुणांक से जाना चाहिए

आर-स्पीयरमैन टू रेश्यो τ -केंडल (या इसके विपरीत), और फिर कनेक्शन की अविश्वसनीयता के संभावित कारणों की जांच करें:

  • संचार गैर-रैखिकता: ऐसा करने के लिए, 2D स्कैटर प्लॉट देखें। यदि संबंध नीरस नहीं है, तो नमूने को उन भागों में विभाजित करें जिनमें संबंध नीरस है, या नमूने को विपरीत समूहों में विभाजित करें और फिर विशेषता की अभिव्यक्ति के स्तर के अनुसार उनकी तुलना करें;
  • नमूना विविधता: द्वि-आयामी स्कैटर प्लॉट को देखें, नमूने को उन हिस्सों में विभाजित करने का प्रयास करें जिनमें संबंध की अलग-अलग दिशाएँ हो सकती हैं।

यदि कनेक्शन सांख्यिकीय रूप से महत्वपूर्ण है, तो एक सार्थक निष्कर्ष निकालने से पहले, एक झूठे सहसंबंध की संभावना को बाहर करना आवश्यक है (मीट्रिक सहसंबंध गुणांक के साथ सादृश्य द्वारा)।

द्विबीजपत्री चरों का सहसम्बन्ध

द्विबीजपत्री पैमाने पर मापे गए दो चरों की तुलना करते समय, सहसंबंध का माप तथाकथित गुणांक j होता है, जो द्विबीजपत्री डेटा के लिए सहसंबंध गुणांक होता है।

मूल्य गुणांक+1 और -1 के बीच स्थित है। यह सकारात्मक और नकारात्मक दोनों हो सकता है, जो दो द्विभाजित रूप से मापी गई विशेषताओं के बीच संबंध की दिशा को दर्शाता है। हालाँकि, की व्याख्या विशिष्ट समस्याएँ खड़ी कर सकती है। गुणांक की गणना के लिए योजना में शामिल द्विबीजपत्री डेटा द्वि-आयामी सामान्य सतह की तरह नहीं दिखता है, इसलिए, यह मान लेना गलत है कि व्याख्या किए गए मान आरएक्सवाई\u003d 0.60 और φ \u003d 0.60 समान हैं। गुणांक की गणना कोडिंग विधि द्वारा की जा सकती है, साथ ही तथाकथित चार-फ़ील्ड तालिका या आकस्मिक तालिका का उपयोग करके की जा सकती है।

सहसंबंध गुणांक लागू करने के लिए, निम्नलिखित शर्तों को पूरा करना होगा:

  • तुलना किए जा रहे लक्षणों को द्विबीजपत्री पैमाने पर मापा जाना चाहिए;
  • एक्सऔर यूएक ही होना चाहिए।

दूरी माप और समानता उपायों की परिभाषा के आधार पर इस प्रकार के सहसंबंध की गणना SPSS कंप्यूटर प्रोग्राम में की जाती है। कुछ सांख्यिकीय प्रक्रियाएं, जैसे कि कारक विश्लेषण, क्लस्टर विश्लेषण, बहुभिन्नरूपी स्केलिंग, इन उपायों के आवेदन पर आधारित हैं, और कभी-कभी वे स्वयं समानता उपायों की गणना के लिए अतिरिक्त संभावनाएं प्रदान करते हैं।

जब एक चर को द्विबीजपत्री पैमाने पर मापा जाता है (चर) एक्स), और दूसरा अंतराल या अनुपात के पैमाने में (चर) यू), प्रयोग किया जाता है द्वि-क्रमिक सहसंबंध गुणांक, उदाहरण के लिए, ऊंचाई और वजन पर बच्चे के लिंग के प्रभाव के बारे में परिकल्पना का परीक्षण करते समय। यह गुणांक -1 से +1 तक की सीमा में भिन्न होता है, लेकिन परिणामों की व्याख्या के लिए इसका संकेत मायने नहीं रखता। इसके उपयोग के लिए, निम्नलिखित शर्तों को पूरा करना होगा:

  • तुलनात्मक संकेतों को विभिन्न पैमानों में मापा जाना चाहिए: एक एक्स- द्विबीजपत्री पैमाने पर; एक और यू- अंतराल या अनुपात के पैमाने में;
  • चर यूएक सामान्य वितरण कानून है;
  • तुलना किए गए चर में अलग-अलग सुविधाओं की संख्या एक्सऔर यूएक ही होना चाहिए।

यदि चर एक्सएक द्विबीजपत्री पैमाने पर मापा जाता है, और चर यूरैंक स्केल में (चर) यू), इस्तेमाल किया जा सकता है रैंक-द्विभाजक सहसंबंध गुणांक, जो केंडल के से निकटता से संबंधित है और इसकी परिभाषा में संयोग और व्युत्क्रम की अवधारणाओं का उपयोग करता है। परिणामों की व्याख्या समान है।

SPSS और Statistica कंप्यूटर प्रोग्राम का उपयोग करके सहसंबंध विश्लेषण करना एक सरल और सुविधाजनक संचालन है। ऐसा करने के लिए, Bivariate Correlations डायलॉग बॉक्स को कॉल करने के बाद (Analyze>Correlate> Bivariate…), आपको अध्ययन के तहत वेरिएबल्स को Variables फ़ील्ड में ले जाना होगा और उस विधि का चयन करना होगा जिसके द्वारा वेरिएबल्स के बीच सहसंबंध का पता लगाया जाएगा। परिणाम आउटपुट फ़ाइल में प्रत्येक परिकलित मानदंड के लिए एक वर्ग तालिका (सहसंबंध) होती है। तालिका के प्रत्येक सेल में शामिल हैं: सहसंबंध गुणांक (सहसंबंध गुणांक) का बहुत मूल्य, गणना किए गए गुणांक का सांख्यिकीय महत्व सिग, विषयों की संख्या।

परिणामी सहसंबंध तालिका के शीर्षक और पार्श्व स्तंभों में चरों के नाम होते हैं। तालिका के विकर्ण (ऊपरी बाएँ - निचले दाएँ कोने) में इकाइयाँ होती हैं, क्योंकि किसी भी चर का स्वयं के साथ संबंध अधिकतम होता है। तालिका इस विकर्ण के बारे में सममित है। यदि कार्यक्रम में चेकबॉक्स "महत्वपूर्ण सहसंबंधों को चिह्नित करें" की जाँच की जाती है, तो सांख्यिकीय रूप से महत्वपूर्ण गुणांक को अंतिम सहसंबंध तालिका में चिह्नित किया जाएगा: 0.05 और उससे कम के स्तर पर - एक तारांकन (*) के साथ, और 0.01 के स्तर पर - के साथ दो तारांकन (**)।

तो, संक्षेप में: सहसंबंध विश्लेषण का मुख्य उद्देश्य चर के बीच संबंध की पहचान करना है। कनेक्शन का माप सहसंबंध गुणांक है, जिसका चुनाव सीधे उस पैमाने के प्रकार पर निर्भर करता है जिसमें चर को मापा जाता है, तुलना किए गए चर में अलग-अलग विशेषताओं की संख्या और चर के वितरण पर निर्भर करता है। दो चरों के बीच सहसंबंध की उपस्थिति का अर्थ यह नहीं है कि उनके बीच एक कारण संबंध है। हालांकि सहसंबंध सीधे तौर पर कार्य-कारण का संकेत नहीं देता है, यह कारणों का एक सुराग हो सकता है। इसके आधार पर परिकल्पनाएँ बनाई जा सकती हैं। कुछ मामलों में, सहसंबंध की कमी का कार्य-कारण की परिकल्पना पर गहरा प्रभाव पड़ता है। दो चरों का शून्य सहसंबंध यह संकेत दे सकता है कि एक चर का दूसरे पर कोई प्रभाव नहीं है।

पाठ्यक्रम कार्य

विषय: सहसंबंध विश्लेषण

परिचय

1. सहसंबंध विश्लेषण

1.1 सहसंबंध की अवधारणा

1.2 सहसंबंधों का सामान्य वर्गीकरण

1.3 सहसंबंध क्षेत्र और उनके निर्माण का उद्देश्य

1.4 सहसंबंध विश्लेषण के चरण

1.5 सहसंबंध गुणांक

1.6 सामान्यीकृत ब्रावाइस-पियर्सन सहसंबंध गुणांक

1.7 स्पीयरमैन का रैंक सहसंबंध गुणांक

1.8 सहसंबंध गुणांक के मूल गुण

1.9 सहसंबंध गुणांकों के महत्व की जाँच करना

1.10 जोड़ी सहसंबंध गुणांक के महत्वपूर्ण मूल्य

2. एक बहुभिन्नरूपी प्रयोग की योजना बनाना

2.1 समस्या की स्थिति

2.2 योजना के केंद्र का निर्धारण (मुख्य स्तर) और कारकों की भिन्नता का स्तर

2.3 एक नियोजन मैट्रिक्स का निर्माण

2.4 विभिन्न श्रृंखलाओं में फैलाव की एकरूपता और माप की समान सटीकता की जाँच करना

2.5 प्रतिगमन समीकरण के गुणांक

2.6 पुनरुत्पादकता फैलाव

2.7 समाश्रयण समीकरण के गुणांकों के महत्व की जाँच करना

2.8 प्रतीपगमन समीकरण की पर्याप्तता की जाँच करना

निष्कर्ष

ग्रन्थसूची

परिचय

प्रयोग नियोजन एक गणितीय और सांख्यिकीय अनुशासन है जो प्रयोगात्मक अनुसंधान के तर्कसंगत संगठन के तरीकों का अध्ययन करता है - अध्ययन किए गए कारकों की इष्टतम पसंद से और परिणामों के विश्लेषण के तरीकों के अनुसार प्रयोग की वास्तविक योजना का निर्धारण। प्रयोग योजना की शुरुआत अंग्रेजी सांख्यिकीविद् आर। फिशर (1935) के कार्यों द्वारा की गई थी, जिन्होंने इस बात पर जोर दिया कि तर्कसंगत प्रयोग योजना माप परिणामों के इष्टतम प्रसंस्करण की तुलना में अनुमानों की सटीकता में कम महत्वपूर्ण लाभ नहीं देती है। 20वीं शताब्दी के 60 के दशक में, प्रयोग योजना का एक आधुनिक सिद्धांत उभरा। इसकी विधियाँ कार्यों और गणितीय प्रोग्रामिंग के सन्निकटन के सिद्धांत से निकटता से संबंधित हैं। इष्टतम योजनाओं का निर्माण किया जाता है और मॉडलों की एक विस्तृत श्रेणी के लिए उनकी संपत्तियों की जांच की जाती है।

प्रयोग योजना एक प्रयोग योजना का विकल्प है जो निर्दिष्ट आवश्यकताओं को पूरा करती है, एक प्रयोग रणनीति विकसित करने के उद्देश्य से क्रियाओं का एक समूह (एक प्राथमिक जानकारी प्राप्त करने से लेकर एक व्यावहारिक गणितीय मॉडल प्राप्त करने या इष्टतम स्थितियों का निर्धारण करने तक)। यह अध्ययन के तहत घटना के तंत्र के अधूरे ज्ञान की स्थितियों में लागू किए गए प्रयोग का एक उद्देश्यपूर्ण नियंत्रण है।

माप की प्रक्रिया में, बाद में डेटा प्रोसेसिंग, साथ ही गणितीय मॉडल के रूप में परिणामों की औपचारिकता, त्रुटियां होती हैं और मूल डेटा में निहित जानकारी का हिस्सा खो जाता है। प्रयोग नियोजन विधियों का उपयोग गणितीय मॉडल की त्रुटि को निर्धारित करना और इसकी पर्याप्तता का न्याय करना संभव बनाता है। यदि मॉडल की सटीकता अपर्याप्त है, तो प्रयोग नियोजन विधियों का उपयोग गणितीय मॉडल को पिछली जानकारी खोए बिना और न्यूनतम लागत पर अतिरिक्त प्रयोगों के साथ आधुनिक बनाना संभव बनाता है।

प्रयोग नियोजन का उद्देश्य प्रयोगों के संचालन के लिए ऐसी शर्तों और नियमों को खोजना है जिसके तहत वस्तु के बारे में कम से कम श्रम लागत के साथ विश्वसनीय और विश्वसनीय जानकारी प्राप्त करना संभव है, साथ ही इस जानकारी को एक मात्रात्मक और सुविधाजनक रूप में मात्रात्मक के साथ प्रस्तुत करना है। सटीकता का आकलन।

अध्ययन के विभिन्न चरणों में उपयोग की जाने वाली मुख्य नियोजन विधियों में से निम्नलिखित का उपयोग किया जाता है:

एक स्क्रीनिंग प्रयोग की योजना बनाना, जिसका मुख्य अर्थ कारकों की समग्रता से महत्वपूर्ण कारकों के समूह का चयन है जो आगे विस्तृत अध्ययन के अधीन हैं;

विचरण के विश्लेषण के लिए एक प्रयोग की रूपरेखा तैयार करना, अर्थात गुणात्मक कारकों वाली वस्तुओं के लिए योजनाएँ तैयार करना;

एक प्रतिगमन प्रयोग की योजना बनाना जो आपको प्रतिगमन मॉडल (बहुपद और अन्य) प्राप्त करने की अनुमति देता है;

एक चरम प्रयोग की योजना बनाना, जिसमें मुख्य कार्य अध्ययन की वस्तु का प्रयोगात्मक अनुकूलन है;

गतिशील प्रक्रियाओं आदि के अध्ययन में योजना बनाना।

अनुशासन का अध्ययन करने का उद्देश्य नियोजन सिद्धांत और आधुनिक सूचना प्रौद्योगिकी के तरीकों का उपयोग करके विशेषज्ञता में उत्पादन और तकनीकी गतिविधियों के लिए छात्रों को तैयार करना है।

अनुशासन के उद्देश्य: वैज्ञानिक और औद्योगिक प्रयोगों की योजना, आयोजन और अनुकूलन के आधुनिक तरीकों का अध्ययन, प्रयोग करना और परिणामों को संसाधित करना।

1. सहसंबंध विश्लेषण

1.1 सहसंबंध की अवधारणा

शोधकर्ता अक्सर इस बात में रुचि रखता है कि एक या अधिक अध्ययन किए गए नमूनों में दो या दो से अधिक चर एक दूसरे से कैसे संबंधित हैं। उदाहरण के लिए, क्या ऊंचाई किसी व्यक्ति के वजन को प्रभावित कर सकती है, या दबाव उत्पाद की गुणवत्ता को प्रभावित कर सकता है?

चरों के बीच इस प्रकार के संबंध को सहसम्बन्ध या सहसम्बन्ध कहते हैं। एक सहसंबंध दो विशेषताओं में एक सुसंगत परिवर्तन है, जो इस तथ्य को दर्शाता है कि एक विशेषता की परिवर्तनशीलता दूसरे की परिवर्तनशीलता के अनुरूप है।

उदाहरण के लिए, यह ज्ञात है कि औसतन लोगों की ऊंचाई और उनके वजन के बीच एक सकारात्मक संबंध होता है, और ऐसा होता है कि ऊंचाई जितनी अधिक होगी, व्यक्ति का वजन उतना ही अधिक होगा। हालांकि, इस नियम के अपवाद हैं जब अपेक्षाकृत कम वजन वाले लोग अधिक वजन वाले होते हैं, और इसके विपरीत, उच्च विकास वाले अस्थि-पंजर हल्के होते हैं। इस तरह के बहिष्करण का कारण यह है कि प्रत्येक जैविक, शारीरिक या मनोवैज्ञानिक लक्षण कई कारकों के प्रभाव से निर्धारित होता है: पर्यावरण, आनुवंशिक, सामाजिक, पारिस्थितिक, आदि।

सहसंबंध संभाव्य परिवर्तन हैं जिनका अध्ययन केवल गणितीय आँकड़ों के तरीकों द्वारा प्रतिनिधि नमूनों पर किया जा सकता है। दोनों शब्द - सहसंबंध और सहसंबंध निर्भरता - अक्सर एक दूसरे के स्थान पर उपयोग किए जाते हैं। निर्भरता का अर्थ है प्रभाव, संबंध - कोई भी समन्वित परिवर्तन जिसे सैकड़ों कारणों से समझाया जा सकता है। सहसंबंधों को एक कारण संबंध के प्रमाण के रूप में नहीं माना जा सकता है, वे केवल यह संकेत देते हैं कि एक विशेषता में परिवर्तन, एक नियम के रूप में, दूसरे में कुछ परिवर्तनों के साथ होते हैं।

सहसंबंध निर्भरता - ये वे परिवर्तन हैं जो एक विशेषता के मान किसी अन्य विशेषता के विभिन्न मानों के घटित होने की प्रायिकता के लिए करते हैं।

सहसंबंध विश्लेषण का कार्य अलग-अलग विशेषताओं के बीच संबंध की दिशा (सकारात्मक या नकारात्मक) और रूप (रैखिक, गैर-रैखिक) स्थापित करने के लिए कम हो जाता है, इसकी जकड़न को मापता है, और अंत में, प्राप्त सहसंबंध के महत्व के स्तर की जांच करता है। गुणांक।

सहसंबंध रूप, दिशा और डिग्री (ताकत) में भिन्न होते हैं .

सहसंबंध का आकार सीधा या वक्रीय हो सकता है। उदाहरण के लिए, सिम्युलेटर पर प्रशिक्षण सत्रों की संख्या और नियंत्रण सत्र में सही ढंग से हल की गई समस्याओं की संख्या के बीच संबंध सीधा हो सकता है। उदाहरण के लिए, वक्रीय हो सकता है, प्रेरणा के स्तर और कार्य की प्रभावशीलता के बीच संबंध (चित्र 1)। प्रेरणा में वृद्धि के साथ, कार्य की दक्षता पहले बढ़ती है, फिर प्रेरणा का इष्टतम स्तर प्राप्त होता है, जो कार्य की अधिकतम दक्षता से मेल खाता है; प्रेरणा में और वृद्धि दक्षता में कमी के साथ होती है।

चित्र 1 - समस्या समाधान की प्रभावशीलता और प्रेरक प्रवृत्ति की ताकत के बीच संबंध

दिशा में, सहसंबंध सकारात्मक ("प्रत्यक्ष") और नकारात्मक ("रिवर्स") हो सकता है। एक सकारात्मक सीधी रेखा के सहसंबंध के साथ, एक विशेषता के उच्च मूल्य दूसरे के उच्च मूल्यों के अनुरूप होते हैं, और एक विशेषता के निम्न मान दूसरे के निम्न मूल्यों के अनुरूप होते हैं (चित्र 2)। एक नकारात्मक सहसंबंध के साथ, अनुपात उलट जाते हैं (चित्र 3)। एक सकारात्मक सहसंबंध के साथ, सहसंबंध गुणांक का एक सकारात्मक संकेत होता है, एक नकारात्मक सहसंबंध के साथ - एक नकारात्मक संकेत।

चित्र 2 - प्रत्यक्ष सहसंबंध

चित्र 3 - व्युत्क्रम सहसंबंध


चित्र 4 - कोई सहसंबंध नहीं

सहसंबंध की डिग्री, ताकत या जकड़न सहसंबंध गुणांक के मूल्य से निर्धारित होती है। कनेक्शन की ताकत इसकी दिशा पर निर्भर नहीं करती है और सहसंबंध गुणांक के निरपेक्ष मूल्य से निर्धारित होती है।

1.2 सहसंबंधों का सामान्य वर्गीकरण

सहसंबंध गुणांक के आधार पर, निम्नलिखित सहसंबंध प्रतिष्ठित हैं:

सहसंबंध गुणांक r>0.70 के साथ मजबूत या निकट;

मध्यम (0.50 . पर)

मध्यम (0.30 . पर)

कमजोर (0.20 . पर)

बहुत कमजोर (r . पर)<0,19).

1.3 सहसंबंध क्षेत्र और उनके निर्माण का उद्देश्य

सहसंबंध का अध्ययन प्रयोगात्मक डेटा के आधार पर किया जाता है, जो दो विशेषताओं के मापा मान (x i, y i) हैं। यदि थोड़ा प्रयोगात्मक डेटा है, तो द्वि-आयामी अनुभवजन्य वितरण को x i और y i मानों की दोहरी श्रृंखला के रूप में दर्शाया जाता है। इस मामले में, सुविधाओं के बीच संबंध को विभिन्न तरीकों से वर्णित किया जा सकता है। एक तर्क और एक फ़ंक्शन के बीच पत्राचार एक तालिका, सूत्र, ग्राफ आदि द्वारा दिया जा सकता है।

सहसंबंध विश्लेषण, अन्य सांख्यिकीय विधियों की तरह, संभाव्य मॉडल के उपयोग पर आधारित है जो एक निश्चित सामान्य आबादी में अध्ययन की गई विशेषताओं के व्यवहार का वर्णन करता है, जिससे प्रयोगात्मक मान x i और y i प्राप्त होते हैं। जब मात्रात्मक विशेषताओं के बीच सहसंबंध, जिसके मूल्यों को मीट्रिक तराजू (मीटर, सेकंड, किलोग्राम, आदि) की इकाइयों में सटीक रूप से मापा जा सकता है, की जांच की जाती है, तो सामान्य रूप से वितरित सामान्य आबादी के द्वि-आयामी मॉडल का मॉडल बहुत बार होता है। मुह बोली बहन। ऐसा मॉडल एक आयताकार समन्वय प्रणाली में बिंदुओं के स्थान के रूप में रेखीय रूप से चर x i और y i के बीच संबंध को प्रदर्शित करता है। इस ग्राफिकल निर्भरता को स्कैटरप्लॉट या सहसंबंध क्षेत्र भी कहा जाता है।
द्वि-आयामी सामान्य वितरण (सहसंबंध क्षेत्र) का यह मॉडल आपको सहसंबंध गुणांक की एक दृश्य चित्रमय व्याख्या देने की अनुमति देता है, क्योंकि कुल में वितरण पांच मापदंडों पर निर्भर करता है: μ x , μ y - औसत मान (गणितीय अपेक्षाएं); x ,σ y यादृच्छिक चर X और Y के मानक विचलन हैं और p सहसंबंध गुणांक है, जो यादृच्छिक चर X और Y के बीच संबंध का एक माप है।
यदि p \u003d 0, तो मान, x i , y i , एक द्वि-आयामी सामान्य सेट से प्राप्त, x में ग्राफ़ पर स्थित होते हैं, y एक वृत्त (चित्र 5, a) से घिरे क्षेत्र के भीतर निर्देशांक होता है। इस मामले में, यादृच्छिक चर X और Y के बीच कोई संबंध नहीं है और उन्हें असंबद्ध कहा जाता है। द्वि-आयामी सामान्य वितरण के लिए, असंबद्धता का अर्थ एक ही समय में यादृच्छिक चर X और Y की स्वतंत्रता है।

मनोवैज्ञानिक अनुसंधान में संबंध की अवधारणा काफी सामान्य है। एक मनोवैज्ञानिक को इसके साथ काम करना पड़ता है जब किसी निष्कर्ष को निकालने के लिए संकेतों या घटनाओं के दो या दो से अधिक संकेतकों के माप की तुलना करना आवश्यक हो जाता है।

अध्ययन की गई घटनाओं के बीच संबंध की प्रकृति स्पष्ट हो सकती है, अर्थात। जैसे कि एक विशेषता का एक निश्चित मूल्य दूसरे के स्पष्ट और निश्चित मूल्य से मेल खाता है। इसलिए, उदाहरण के लिए, मानसिक कार्यों के परीक्षणों के पैटर्न की खोज के लिए उप-परीक्षण में, "कच्चे" अंकों की संख्या सूत्र द्वारा निर्धारित की जाती है:
शी \u003d एसटीजेड - सोज / एसटीजेड + एसपीजेड * एसबीसी,
जहां शी वेरिएंट का मान है, Sтз सबटेस्ट में एक प्राथमिक निर्दिष्ट पैटर्न (पत्राचार) की संख्या है, सोज़ विषयों के लिए गलत तरीके से संकेतित मैचों की संख्या है, सोज़ विषयों के लिए अनिर्दिष्ट (अनुपलब्ध) मैचों की संख्या है , एसबीसी परीक्षण में विषयों द्वारा देखे गए सभी शब्दों की संख्या है।

इस तरह के संबंध को कार्यात्मक कहा जाता है: यहां एक संकेतक दूसरे का कार्य है, जो पहले के संबंध में एक तर्क है।

हालांकि, एक स्पष्ट संबंध हमेशा नहीं पाया जाता है। अधिक बार किसी को ऐसी स्थिति से निपटना पड़ता है जिसमें एक विशेषता का एक मूल्य दूसरे के कई मूल्यों के अनुरूप हो सकता है। ये मान कम या ज्यादा परिभाषित सीमाओं के भीतर भिन्न होते हैं। इस प्रकार के सम्बन्ध को सहसम्बन्ध या सहसम्बन्ध कहते हैं।

कई प्रकार के सहसंबंध अभिव्यक्तियों का उपयोग किया जाता है। इसलिए, उन विशेषताओं के बीच संबंध को व्यक्त करने के लिए जिनके मूल्यों की भिन्नता की मात्रात्मक प्रकृति है, केंद्रीय प्रवृत्ति के उपायों का उपयोग किया जाता है: सारणीकरण के बाद जोड़ी सहसंबंध गुणांक की गणना, बहु और आंशिक सहसंबंध का गुणांक, का गुणांक एकाधिक निर्धारण, सहसंबंध अनुपात।

यदि सुविधाओं के बीच संबंध का अध्ययन करना आवश्यक है, जिनमें से भिन्नता गुणात्मक प्रकृति की है (व्यक्तित्व अनुसंधान के प्रक्षेपी तरीकों के परिणाम, सिमेंटिक डिफरेंशियल पद्धति का उपयोग करके अध्ययन, ओपन स्केल का उपयोग करके अध्ययन, आदि), तो गुणात्मक का उपयोग करें वैकल्पिक सहसंबंध गुणांक (टेट्राकोरिक संकेतक), पियर्सन की कसौटी x2, पियर्सन और चुप्रोव की आकस्मिकता (आकस्मिकता) के संकेतक।

गुणात्मक-मात्रात्मक सहसंबंध निर्धारित करने के लिए, अर्थात। ऐसा सहसंबंध, जब एक चिन्ह में गुणात्मक भिन्नता होती है, और दूसरी - मात्रात्मक। विशेष विधियों का उपयोग किया जाता है।

सहसंबंध गुणांक (शब्द पहली बार 1888 में एफ। गैल्टन द्वारा पेश किया गया था) दो तुलनात्मक नमूने विकल्पों के बीच संबंधों की ताकत का एक संकेतक है। सहसंबंध गुणांक की गणना के लिए जिस भी सूत्र का उपयोग किया जाता है, उसका मान -1 से +1 तक होता है। पूर्ण सकारात्मक सहसंबंध के मामले में, यह गुणांक प्लस 1 के बराबर है, और पूर्ण नकारात्मक सहसंबंध के मामले में, यह शून्य से 1 है। यह आमतौर पर मूल्यों के चौराहे के बिंदुओं से गुजरने वाली एक सीधी रेखा है। डेटा की प्रत्येक जोड़ी।

यदि भिन्न मान एक सीधी रेखा पर पंक्तिबद्ध नहीं होते हैं, लेकिन एक "बादल" बनाते हैं, तो सहसंबंध गुणांक का निरपेक्ष मान एक से कम हो जाता है और "क्लाउड" के गोल होने पर शून्य के करीब पहुंच जाता है। यदि सहसंबंध गुणांक 0 है, तो दोनों विकल्प एक दूसरे से पूरी तरह स्वतंत्र हैं।

सहसंबंध गुणांक के किसी भी गणना (अनुभवजन्य) मूल्य को सहसंबंध गुणांक के महत्वपूर्ण मूल्यों की उपयुक्त तालिकाओं के विरुद्ध वैधता (सांख्यिकीय महत्व) के लिए जांचा जाना चाहिए। यदि अनुभवजन्य मान 5 प्रतिशत स्तर (पी = 0.05) के लिए सारणीबद्ध मूल्य से कम या उसके बराबर है, तो सहसंबंध महत्वपूर्ण नहीं है। यदि सहसंबंध गुणांक का परिकलित मान P = 0.01 के सारणीबद्ध मान से अधिक है, तो सहसंबंध सांख्यिकीय रूप से महत्वपूर्ण (महत्वपूर्ण) है।

उस स्थिति में जब गुणांक का मान 0.05> P> 0.01 के बीच होता है, व्यवहार में कोई P = 0.05 के लिए सहसंबंध के महत्व की बात करता है।

ब्रावाइस-पियर्सन सहसंबंध गुणांक (आर) 1896 में प्रस्तावित एक पैरामीट्रिक संकेतक है, जिसकी गणना के लिए संस्करण के अंकगणितीय माध्य और माध्य वर्ग मानों की तुलना की जाती है। इस गुणांक की गणना करने के लिए, निम्न सूत्र का उपयोग किया जाता है (यह विभिन्न लेखकों के लिए अलग दिख सकता है):
r= (ई Xi Xi1) - NXap X1ap / N-1 Qx Qx1,

जहाँ E Xi Xi1 - जोड़ीदार तुलनीय विकल्पों के मूल्यों के उत्पादों का योग, n तुलना जोड़े की संख्या है, NXap, X1ap - अंकगणितीय माध्य विकल्प Xi, Xi; क्रमशः, Qx, Qx, - वितरण x और x के मानक विचलन।

स्पीयरमैन रैंक सहसंबंध गुणांक रुपये (रैंक सहसंबंध गुणांक, स्पीयरमैन गुणांक) सहसंबंध गुणांक का सबसे सरल रूप है और किसी दिए गए संस्करण के रैंकों (स्थानों) के बीच के संबंध को अलग-अलग आधारों पर मापता है, इसके स्वयं के मूल्य को ध्यान में रखे बिना। यहां संबंध मात्रात्मक से अधिक गुणात्मक है।

आमतौर पर इस गैर-पैरामीट्रिक परीक्षण का उपयोग उन मामलों में किया जाता है जहां यह निष्कर्ष निकालना आवश्यक होता है कि डेटा के बीच अंतराल के बारे में इतना अधिक नहीं है जितना कि उनके रैंक के बारे में है, और यह भी कि जब वितरण वक्र अत्यंत विषम होते हैं और इस तरह के पैरामीट्रिक परीक्षणों के उपयोग की अनुमति नहीं देते हैं। ब्रावाइस-पियर्सन सहसंबंध गुणांक (इनमें कुछ मामलों में, मात्रात्मक डेटा को क्रमिक डेटा में परिवर्तित करना आवश्यक हो सकता है)। यदि गुणांक रु +1 के करीब है, तो इसका मतलब है कि कुछ विशेषताओं के अनुसार रैंक किए गए नमूने की दो पंक्तियाँ व्यावहारिक रूप से मेल खाती हैं, और यदि यह गुणांक -1 के करीब है, तो हम पूर्ण व्युत्क्रम संबंध के बारे में बात कर सकते हैं।

ब्रवाइस-पियर्सन सहसंबंध गुणांक की गणना की तरह, रुपये गुणांक की गणना को सारणीबद्ध रूप में प्रस्तुत करना अधिक सुविधाजनक है।

प्रतिगमन एक प्रकार के मूल्यों के बीच संबंध की एक स्टोकेस्टिक (संभाव्य) प्रकृति के मामले में एक कार्यात्मक संबंध की अवधारणा को सामान्य करता है। प्रतिगमन समस्याओं की श्रेणी को हल करने का उद्देश्य इनपुट वेरिएंट के मूल्यों से निरंतर आउटपुट विचरण के मूल्य का अनुमान लगाना है।