सांख्यिकी के पैरामीट्रिक और गैर-पैरामीट्रिक तरीके। सांख्यिकीय डेटा विश्लेषण के लिए पैरामीट्रिक और गैर-पैरामीट्रिक प्रक्रियाएं

ऊपर चर्चा की गई सांख्यिकीय परिकल्पनाओं के मूल्यांकन की सामान्य रणनीति मुख्य रूप से गणितीय आँकड़ों के तथाकथित पैरामीट्रिक विधियों के उपयोग को निर्धारित करती है।

पैरामीट्रिक तरीकेकुछ पर आधारित हैं, एक नियम के रूप में, एक यादृच्छिक चर के वितरण की प्रकृति के बारे में काफी संभावित धारणाएं। आमतौर पर, प्रायोगिक डेटा के विश्लेषण में उपयोग की जाने वाली पैरामीट्रिक विधियाँ इस धारणा पर आधारित होती हैं कि इन डेटा का वितरण सामान्य है। इस धारणा का एक परिणाम अध्ययन के तहत वितरण मापदंडों का अनुमान लगाने की आवश्यकता है। इस प्रकार, निम्नलिखित के मामले में टी -छात्र का परीक्षण ऐसे अनुमानित पैरामीटर गणितीय अपेक्षा और विचरण हैं। कुछ मामलों में, विभिन्न नमूनों में एक यादृच्छिक चर के वितरण की विशेषता वाले पैरामीटर एक दूसरे के साथ कैसे संबंध रखते हैं, इसके बारे में अतिरिक्त धारणाएं बनाई जाती हैं। इस प्रकार, छात्र के परीक्षण में, जिसका उपयोग अक्सर दो डेटा श्रृंखलाओं के औसत मूल्यों (अपेक्षा) की उनकी समरूपता या विषमता के लिए तुलना करने के लिए किया जाता है, यादृच्छिक चर के वितरण के भिन्नताओं की समरूपता के बारे में एक अतिरिक्त धारणा बनाई जाती है। दो सामान्य आबादी जिनसे ये डेटा निकाला गया था।

पैरामीट्रिक डेटा विश्लेषण विधियों का लाभ यह है कि उनके पास काफी उच्च शक्ति है। नीचे परीक्षण शक्ति दूसरी तरह की त्रुटियों, या β-त्रुटियों से बचने की इसकी क्षमता को ध्यान में रखें। β-त्रुटि जितनी छोटी होगी, परीक्षण की शक्ति उतनी ही अधिक होगी। दूसरे शब्दों में, परीक्षण शक्ति = 1 - β।

पैरामीट्रिक परीक्षणों, या मानदंड की उच्च शक्ति, इस तथ्य के कारण है कि इन विधियों के लिए उपलब्ध डेटा का वर्णन करना आवश्यक है मीट्रिक पैमाना. जैसा कि आप जानते हैं, मीट्रिक पैमानों में अंतराल पैमाना और अनुपात पैमाना शामिल होता है, जिसे कभी-कभी निरपेक्ष पैमाना भी कहा जाता है। अंतराल स्केल शोधकर्ता को न केवल नमूने के तत्वों की समानता या असमानता के संबंधों का पता लगाने की अनुमति देता है (जैसा कि यह करने की अनुमति देता है नाम पैमाना ) और न केवल संबंधों को व्यवस्थित करें (जैसा कि यह करने की अनुमति देता है आदेश पैमाने ), लेकिन अंतरालों की तुल्यता का मूल्यांकन भी करते हैं। निरपेक्ष पैमाने इसके अलावा, यह आपको माप के दौरान प्राप्त सेट के तत्वों के बीच संबंधों की समानता का मूल्यांकन करने की अनुमति देता है। यही कारण है कि मीट्रिक पैमानों को मजबूत माप पैमानों के रूप में संदर्भित किया जाता है। इस शक्ति के कारण, पैरामीट्रिक विधियां एक यादृच्छिक चर के वितरण में अंतर की अधिक सटीक अभिव्यक्ति की अनुमति देती हैं, इस शर्त के तहत कि बुलेट या वैकल्पिक परिकल्पना सत्य है।

यह भी ध्यान दिया जाना चाहिए कि, सामान्य तौर पर, गणितीय सांख्यिकी के सिद्धांत में सांख्यिकी के पैरामीट्रिक तरीके अधिक विकसित होते हैं और इसलिए इसका अधिक व्यापक रूप से उपयोग किया जाता है। इनमें से किसी भी विधि का उपयोग करके लगभग किसी भी प्रयोगात्मक परिणाम का मूल्यांकन किया जा सकता है। यह ऐसी विधियां हैं जिन्हें मुख्य रूप से पाठ्यपुस्तकों और सांख्यिकीय डेटा विश्लेषण पर मैनुअल में माना जाता है।

इसी समय, सांख्यिकी में पैरामीट्रिक विश्लेषण विधियों के उपयोग से जुड़ी कठिनाइयाँ यह हैं कि कुछ मामलों में अध्ययन के तहत यादृच्छिक चर के वितरण की प्रकृति के बारे में एक प्राथमिक धारणा गलत हो सकती है। और ये मामले कुछ स्थितियों में मनोवैज्ञानिक अनुसंधान के लिए बहुत विशिष्ट हैं।

इसलिए, यदि हम दो नमूनों की तुलना करते हैं टी -छात्र का परीक्षण, आप पा सकते हैं कि हमारे डेटा का वितरण सामान्य से भिन्न है, और दो नमूनों में भिन्नताएं काफी भिन्न हैं। इस मामले में, एक पैरामीट्रिक छात्र परीक्षण का उपयोग, कुछ हद तक, उन निष्कर्षों को विकृत कर सकता है जो शोधकर्ता निकालना चाहता है। यह खतरा तब और बढ़ जाता है जब परिकलित आँकड़ों के मान उन मात्राओं के सीमा मूल्यों के करीब हो जाते हैं जिनका उपयोग परिकल्पनाओं को स्वीकार या अस्वीकार करने के लिए किया जाता है। ज्यादातर मामलों में, हालांकि, उदाहरण के लिए, उपयोग करने के मामले में टी -टेस्ट, सैद्धांतिक रूप से दी गई मान्यताओं से कुछ विचलन विश्वसनीय सांख्यिकीय अनुमान के लिए महत्वपूर्ण नहीं हैं। अन्य मामलों में, ऐसे विचलन ऐसे निष्कर्ष के लिए एक गंभीर खतरा पैदा कर सकते हैं। फिर शोधकर्ता विशेष प्रक्रियाएं विकसित कर सकते हैं जो सांख्यिकीय परिकल्पनाओं की सच्चाई के बारे में निर्णय लेने की प्रक्रिया को समायोजित कर सकती हैं। इन प्रक्रियाओं का उद्देश्य उपयोग किए गए आँकड़ों के पैरामीट्रिक मॉडल की अत्यधिक कठोर आवश्यकताओं को दरकिनार करना या शिथिल करना है।

शोधकर्ता की ऐसी कार्रवाइयों के विकल्पों में से एक, जब उसे पता चलता है कि उसे प्राप्त डेटा उसके मापदंडों में भिन्न है, जो इस्तेमाल किए गए पैरामीट्रिक परीक्षण के संरचनात्मक मॉडल में निर्दिष्ट है, तो इन आंकड़ों को वांछित रूप में बदलने का प्रयास किया जा सकता है। उदाहरण के लिए, जैसा कि चैप में बताया गया है। 1, प्रतिक्रिया समय को मापते समय, इसके वितरण की विषमता के उच्च मूल्य से बचना संभव है यदि प्राप्त मूल्यों के लघुगणक विश्लेषण के लिए उपयोग किए जाते हैं, न कि प्रतिक्रिया समय के मान स्वयं।

एक अन्य विकल्प सामान्य जनसंख्या में एक यादृच्छिक चर के वितरण की प्रकृति के बारे में किसी भी पूर्व धारणा का उपयोग करने से इनकार करना है। और इसका मतलब गैर-पैरामीट्रिक के पक्ष में गणितीय आँकड़ों के पैरामीट्रिक तरीकों की अस्वीकृति है।

गैर-पैरामीट्रिकगणितीय आँकड़ों के तरीके कहलाते हैं, जिसमें अध्ययन के तहत डेटा के वितरण की प्रकृति के बारे में कोई पूर्व धारणा नहीं बनाई जाती है और विश्लेषण किए गए मूल्यों के वितरण मापदंडों के अनुपात के बारे में कोई धारणा नहीं बनाई जाती है। यह इन विधियों का मुख्य लाभ है।

गैर-पैरामीट्रिक आँकड़ों का लाभ पूरी तरह से तब प्रकट होता है जब प्रयोग में प्राप्त परिणामों को कमजोर रूप में प्रस्तुत किया जाता है। गैर-मीट्रिक स्केल, रैंकिंग परिणामों का प्रतिनिधित्व। इस तरह के पैमाने को कहा जाता है आदेश पैमाने। बेशक, कुछ मामलों में, शोधकर्ता डेटा सामान्यीकरण प्रक्रियाओं का उपयोग करके इन डेटा को एक मजबूत अंतराल पैमाने में परिवर्तित कर सकता है, लेकिन, एक नियम के रूप में, इस स्थिति में सबसे अच्छा विकल्प विशेष रूप से सांख्यिकीय विश्लेषण के लिए डिज़ाइन किए गए गैर-पैरामीट्रिक परीक्षणों का उपयोग करना है।

एक नियम के रूप में, गैर-पैरामीट्रिक आँकड़ों के परीक्षणों में दो या दो से अधिक नमूनों में रैंक योग के उपलब्ध अनुपात का अनुमान लगाना शामिल है, और इसके आधार पर, इन नमूनों के अनुपात के बारे में एक निष्कर्ष तैयार किया जाता है। ऐसे परीक्षणों के उदाहरण हैं साइन टेस्ट, विलकॉक्सन ने रैंक टेस्ट पर हस्ताक्षर किए, साथ ही मान यू-टेस्ट व्हिटनी, जो पैरामीट्रिक के एनालॉग के रूप में उपयोग किया जाता है टी -छात्र की परीक्षा।

साथ ही, यदि माप के परिणामों को मजबूत पैमाने पर प्रस्तुत किया जाता है, तो गैर-पैरामीट्रिक आंकड़ों के उपयोग का अर्थ है डेटा में निहित कुछ जानकारी की अस्वीकृति। इसका परिणाम इन विधियों में निहित दूसरी तरह की त्रुटि में वृद्धि का खतरा है।

इस प्रकार, गैर-पैरामीट्रिक आँकड़ों के तरीके पैरामीट्रिक आँकड़ों के तरीकों की तुलना में अधिक रूढ़िवादी हैं। उनका उपयोग दूसरी तरह की त्रुटि के साथ काफी हद तक खतरा है, अर्थात। ऐसी स्थिति जहां शोधकर्ता, उदाहरण के लिए, दो नमूनों के बीच अंतर का पता नहीं लगा सकता है, जब वास्तव में ऐसे अंतर होते हैं। दूसरे शब्दों में, ऐसी विधियाँ पैरामीट्रिक विधियों की तुलना में कम शक्तिशाली होती हैं। इसलिए, साधारण रैंकिंग के अलावा प्रयोगात्मक डेटा के विश्लेषण में पैरामीट्रिक आंकड़ों के उपयोग को आम तौर पर प्राथमिकता दी जाती है।

सिस्टम मॉडल बनाने के मुद्दों को हल करते समय, सिस्टम बनाने वाले तत्वों के मापदंडों के बारे में प्रारंभिक जानकारी उत्पन्न करने का कार्य विशेष प्रासंगिकता का होता है। प्रारंभिक जानकारी की सटीकता और विश्वसनीयता सिस्टम की विश्लेषण की गई विशेषताओं के अनुमानों की सटीकता, कार्यप्रणाली के अनुकूलन के लिए गणना की सटीकता और उनके रखरखाव के नियमों को निर्धारित करती है, भविष्य में सिस्टम के व्यवहार की भविष्यवाणी करने से संबंधित समस्याओं को हल करती है। , और अन्य मुद्दे। तत्वों के मापदंडों के बारे में प्रारंभिक जानकारी बनाते समय, एक नियम के रूप में, सिस्टम की परीक्षा के दौरान प्राप्त जानकारी और इसके संचालन के अनुभव के अध्ययन को आधार के रूप में लिया जाता है। दूसरे शब्दों में, इसके संचालन की प्रक्रिया में सिस्टम के घटकों के व्यवहार के बारे में जानकारी को आधार के रूप में लिया जाता है।

तत्वों, विधानसभाओं, घटकों के प्रारंभिक संकेतकों का विश्लेषण, जो संचालन, परीक्षण, डिजाइन विकास के चरणों में किया जाता है, निम्नलिखित मुद्दों को हल करने के लिए किया जाता है:

    उनके वास्तविक संचालन की स्थितियों में घटकों की अध्ययन की गई विशेषताओं के वास्तविक मूल्यों का निर्धारण;

    तत्वों की अध्ययन की गई विशेषताओं और उनकी परिचालन स्थितियों के बीच संबंधों की पहचान करना, बाहरी प्रभावों के अध्ययन किए गए संकेतकों पर प्रभाव का विश्लेषण करना;

    नव निर्मित उपकरणों के व्यवहार की भविष्यवाणी करना।

अतः इन समस्याओं के समाधान के लिए सर्वप्रथम

इसके संचालन की वास्तविक परिस्थितियों में उपकरणों के व्यवहार पर नियंत्रण को व्यवस्थित करना आवश्यक है। भविष्य में, वस्तुओं के संचालन के दौरान प्राप्त जानकारी का उपयोग सिस्टम के मॉडल बनाने के लिए किया जाता है जिसके लिए विश्लेषण किया जाता है।

प्रायोगिक अध्ययन करते समय, वस्तुओं के अवलोकन के परिणामस्वरूप प्राप्त जानकारी द्वारा एक महत्वपूर्ण भूमिका निभाई जाती है जिसका व्यवहार एक संभाव्य प्रकृति का होता है। ऐसी प्रणालियों का अध्ययन आउटपुट मापदंडों के कार्यान्वयन के परिणामों के अनुसार किया जाता है, जो यादृच्छिक चर हैं। एक आयामी यादृच्छिक चर के व्यवहार का वर्णन करने वाली सबसे सामान्य विशेषता इसका वितरण घनत्व है / (0- एक यादृच्छिक चर के वितरण घनत्व को जानने के बाद, कोई विशिष्ट रूप से ऐसी विशेषताओं को निर्धारित कर सकता है जैसे किसी घटना की प्राप्ति की संभावना, की तीव्रता घटना की घटना, घटनाओं की प्राप्ति के बीच का औसत समय, आदि। हम सूत्र प्रस्तुत करते हैं, जिससे संबंधित संकेतकों का मूल्यांकन करने की अनुमति मिलती है।

समय के साथ किसी घटना के घटित होने की प्रायिकता टी सूत्र द्वारा निर्धारित किया जाता है

क्यू (टी) = एफ (टी) = \ एफ (टी) डीटी।

व्यवहार में, वितरण फ़ंक्शन के माध्यम से परिभाषित मात्रा का उपयोग अक्सर निम्नानुसार किया जाता है:

उदाहरण के लिए, विश्वसनीयता सिद्धांत में, विफलता-मुक्त संचालन की संभावना को इस तरह परिभाषित किया गया है।

घटना की प्राप्ति के बीच का औसत समय संबंध से निर्धारित होता है

टी ए =]टीएफ (एफ) डीटी =] पी (टी) डीटी।

किसी घटना के घटित होने की तीव्रता को सूत्र द्वारा निर्धारित किया जा सकता है

"_/(एफ)_सीएलएफजेटी) मैं _ डी पी(टी) 1 पी (टी) डीटी पी (टी) डीटी पिट)"

इस प्रकार, एक यादृच्छिक चर के घनत्व या वितरण कार्य को जानने के बाद, हम एक जटिल प्रणाली की विशेषताओं को निर्धारित करने के लिए आगे बढ़ सकते हैं। व्यवहार में, वितरण फ़ंक्शन अक्सर अज्ञात होता है। यादृच्छिक चर के कार्यान्वयन के सांख्यिकीय आंकड़ों के अनुसार इसे बहाल करना होगा। चूंकि प्रेक्षणों के परिणामों के आंकड़े हमेशा सीमित रूप में मौजूद होते हैं, वितरण फ़ंक्शन की बहाली एक निश्चित डिग्री की विश्वसनीयता के साथ संभव है। इसलिए, यदि वितरण फ़ंक्शन का अनुमान एक निश्चित त्रुटि के साथ लगाया जाता है,

उर्या

एफ (एक्स - टी ) 2 ^ 2ए 2

" (एक्स-टी ) 2 ^ 2 2

आइए आंशिक डेरिवेटिव की गणना करें:

डीपीएन(टी, एम,हे) _ 1

डीएम

डी पी एन (टी, टी, हे) _ डी 2

आर आर \टी

2 के विषय में 2

\ /-जे

तो सिस्टम की विशेषताओं की गणना भी एक त्रुटि के साथ की जाएगी।

जटिल प्रणालियों के संकेतकों के आकलन की सटीकता को फैलाव के परिमाण की विशेषता है। मान लीजिए कि कुछ संकेतकों का अनुमान लगाना आवश्यक है आर (टी)। आइए हम दिखाते हैं कि इसके अनुमान में विचरण कैसे निर्धारित किया जाता है। हम मान लेंगे कि संकेतक आर (टी ) वितरण समारोह के माध्यम से निर्धारित किया जाता है। मान लें कि वितरण फलन वायु के दो मापदंडों पर निर्भर करता है। दो-पैरामीटर फ़ंक्शंस के उदाहरण सामान्य वितरण, छोटा सामान्य, लॉग-सामान्य, गामा वितरण, वीबुल वितरण, और कई अन्य हैं। तो चलो एफ (टी) = एफ (टी, ए, आर)। तदनुसार, एक जटिल प्रणाली के अनुमानित संकेतक को एक कार्यात्मक के रूप में दर्शाया जा सकता है एफ (टी) = एफ (टी, ए, आर):

के (आर) = के = के (एफ, ए, पी)।

आइए अनुमान को विघटित करें आर ( टी) टेलर श्रृंखला में बिंदु ए, पी पर और हम खुद को तीन शब्दों तक सीमित रखते हैं:

i(0 = K(0+^®(a-a)+^®(p-p).

इस व्यंजक के दोनों भागों में, हम प्रसरण की गणना करने की संक्रिया लागू करते हैं

(टी-एम) 2

-टी ऍक्स्प

सामान्य वितरण

सामान्य वितरण कानून के घनत्व का रूप है

पीएन(टी, एम, के विषय में)= 1 -7=- जम्मू क्स्प

एफएन(टी, तब)= -y=- जे क्स्प

(टी-एम)

2o 2

घटना की प्राप्ति के बीच का औसत समय फॉर्म द्वारा निर्धारित किया जाता है

(टी- एम) 2 2 2

जहां cov(a, P) वायु मापदंडों के बीच सहप्रसरण है। इस प्रकार, एक निश्चित संकेतक के विचरण का अनुमान लगाने के लिए, वितरण कानून के मापदंडों और वितरण कानून के मापदंडों के आकलन में भिन्नता के संबंध में इस संकेतक के आंशिक डेरिवेटिव को निर्धारित करना आवश्यक है।

विशिष्ट वितरण कानूनों के लिए ऊपर पेश किए गए संकेतकों के लिए आंशिक डेरिवेटिव का निर्धारण करने के मुद्दों पर विचार करें। वितरण कानूनों के मापदंडों के अनुमानों के अंतर का निर्धारण नीचे वर्णित किया जाएगा।

एक उदाहरण के रूप में, आइए सामान्य कानून के लिए वितरण कानून के मापदंडों के संबंध में अनुमानित संकेतक के आंशिक डेरिवेटिव की परिभाषा पर विचार करें।

Ґ ( टी-एम) 2 ^

2 2 . से

तदनुसार, आंशिक डेरिवेटिव को परिभाषित किया गया है:

डीटीएन(एम,) 1 7

-- - = - च = ~ ऍक्स्प

डी एम V2nab

डीटीएन(एम, हे) मैं

मैंटी= एफ

एफ 2 ~\ एम

2 0

\ /

और, अंत में, घटना की तीव्रता के लिए, हमारे पास है

एक्स (टी, टी, ओ) = -

एक-पूंछ वाला कटा हुआ सामान्य वितरण

बिंदु 0 पर बाईं ओर एक तरफा कटाव के साथ काटे गए सामान्य कानून के वितरण घनत्व का रूप है

/ (टी-एम ) 2 ^ 2 2

\ 2पर

(एक्स - टी) 2 2ए 2

\І2po(

आंशिक व्युत्पन्न के लिए व्यंजक का रूप है

डीएक्स एन (टी, एम, ए ) _ एफ एन (टी, एम, ए )" एम (एल -एफ एन (टी, एम, ओ))-एफ एन (टी, मी, ओ )[ एल-एफ एन (टी, मी, ओ )]" एम एम

2

डीएम

साथ = -

(*-यू 2 2 Kommersant

के विषय मेंyj2nb

, ., टी-एम मैं ( टी-एम ) 2

एफ एच (एफडब्ल्यू हे आरए =इर=-टी पूर्व पीवी

Ґ , एच2 4 वी

( टी-एम) 2

( 2एम टी

2 2

\

2s 7

\ /जे

"ए2

दास 2

2

[( टी-एम ) 2 - 2 ] 2l / 2lst 3

(टी-एम)

डीएक्स

पी(SCH,बी) = \-{

(टी -एम) 2ए 2

एम2ओ 2

\ =

(टी-एम)ऍक्स्प

एम ऍक्स्प

2 2 पर 3

आइए हम संकेतन का परिचय दें:

आर = जे क्स्प

जे

इस प्रकार, सामान्य कानून के लिए वितरण कानून के मापदंडों के लिए संबंधित व्युत्पन्न संकेतक निर्धारित करने के लिए सूत्र प्रस्तुत किए जाते हैं। सामान्य वितरण का एक सामान्यीकरण छोटा सामान्य वितरण है। आइए हम जटिल प्रणालियों के संकेतकों के आकलन की समस्याओं में एकतरफा काटे गए सामान्य वितरण के उपयोग पर विचार करें। सिस्टम विश्लेषण की कई समस्याओं में, यादृच्छिक मापदंडों को सकारात्मक रूप से परिभाषित किया गया है। एक उदाहरण विश्वसनीयता सिद्धांत की समस्याएं हैं, जिसमें यादृच्छिक मापदंडों में 0 से परिभाषा का एक डोमेन होता है, उदाहरण के लिए, ऑपरेटिंग समय विफलता के लिए एक सकारात्मक निश्चित मूल्य है। इस मामले में, इन यादृच्छिक चरों का वर्णन करने के लिए सामान्य वितरण कानून लागू करना अवैध है। ऐसी स्थितियों में, बाएं-छंटे सामान्य वितरण का उपयोग किया जाता है। आइए विश्वसनीयता संकेतकों के आकलन के संबंध में इस मामले पर विचार करें।

(एक्स-सी) 2 2 बी

( एक्स - तुम तुम

डीएक्स; क्यू= जेऍक्स्प

संबंधित डेरिवेटिव का रूप है

Ґ 2\ एचएलई

2 Kommersant

आर,"एच

डीबी(क्यू-आरएफ

जहां संबंधित घटकों को सूत्रों द्वारा निर्धारित किया जाता है

घटना की प्राप्ति के बीच का औसत समय सूत्र द्वारा निर्धारित किया जाता है

2 बी 2

/ . .і \ (*-यू

एस / एच' ^

एल/टीएस एल/टीएस एफजी जी-एम-

(क्यू डब्ल्यू बी =^ .क्स्प

मैं ^ एलबीमैं-जेमैंबी जेबी

आइए अंश के माध्यम से निरूपित करें एल

संबंधित डेरिवेटिव की गणना सूत्रों द्वारा की जाती है

लॉग-सामान्य वितरण

लघुगणकीय रूप से सामान्य वितरण यादृच्छिक चर का पालन करता है टी, जिसका लघुगणक सामान्य कानून के अनुसार वितरित किया जाता है। लॉग-सामान्य कानून के वितरण घनत्व का रूप है

केएमवाई) _ मैं; क्यू-%मैं Jf_urz _______

"-!लि एस)

/ 2 एन। वें! 2fc

शामकेक्यू उल।

-^ , ए, -एक्स आर

वितरण फ़ंक्शन का रूप है

2 बी 2

अंत में, घटनाओं के घटित होने की तीव्रता बराबर होती है

(*-10 2 पर

2 बी

कहाँ पेपर= Kommersant 1 .

आइए विश्वसनीयता संकेतक निर्धारित करने के लिए सूत्र लिखें

(एक्स -एम-) 2 2 Kommersant

(एक्स -\मैं .? 2 Kommersant

डीएक्स-जेऍक्स्पके विषय में

मैं (*, मैं, डी) \u003d मैं - Jexp

हम संकेतन का परिचय देते हैं

संबंधित डेरिवेटिव का रूप है

(*-यू

एम= क्स्प

2 \

( (मैंएनएफ-एच) 2 पर

आरएलएन(; , रा) _ 1 एन - जेमैंनायब

पी Jt,\i,B) 1 पीजी-एन

आइए हम मापदंडों के संबंध में तीव्रता के व्युत्पन्न का निर्धारण करें

डीकेवाईएम(टी, №) _ एम ^ जेक्यू-आर)- (क्यू-आरवाई 11 एम चुनाव आयोग(क्यू-आर) 2 :

उहमें


( (श्री)एम 2 बी

विफलता का औसत समय निर्धारित करने के लिए, सूत्र का उपयोग करें

(श्रीमती। 2

एम 11 =-एम ^ .क्स्प

; (बी-एल)"= क्स्प

और अंतिम अभिव्यक्ति

डेरिवेटिव बराबर हैं

डीटीलासी, आर, पर) 1 (में ,

आइए हम नो-विफलता संक्रिया की प्रायिकता के लिए व्यंजक लिखें

विफलता दर निर्धारित करने के लिए अभिव्यक्ति का रूप है \जेटी,\मैं, बी) = -

पी बी (टी, ए, बी) = expक्स्प\

जे

आइए हम वितरण मापदंडों के संबंध में इस अभिव्यक्ति के डेरिवेटिव की गणना करें:

<У2дВ I 2 पर

पी^(टी, ए, बी) _ बी हां ए

डीपीबी(टी,, बी) _

आंशिक व्युत्पन्न व्यंजकों से निर्धारित होते हैं

सीएल ^ वी) _

^ 2

ली टीजेबीडब्ल्यू में क्स्प|

(एलएनएफ- |X) 2 2 पर

जहां (/ एलएन (0)

7 बी (ए ^) = जे पूर्व पी

(इन्फ-(X .)) 2 2 पर

टी बी (ए, बी)_~ आर बी(टी

* (टी"में

\डीएफ, ई7वी(ए ^ ई बी

डीके »एसएचवी) (0 ) " वां (मैं - (0 )- / एल. (मैं- एफ एन जे टी))"

ईवी 2

* पी

विफलता दर है

(^ बी-" , ए

मापदंडों के संबंध में डेरिवेटिव का रूप है

यह,ए,बी)

(1 - एफ) = - मैं n vii क्स्प

_ (मैंएनएफ- (एक्स) 2 पर

^ए,बी) बी 2

एक्समेंआईए, बी)_Ґ" बी

हाँ~ए 2

डीबीबी

,

वीबुल वितरण

वेइबुल वितरण घनत्व का रूप है

एफ बी (टी, ए, बी) = -(-

गामा वितरण

गामा वितरण का घनत्व इस प्रकार लिखा जाता है

एफ बी (टी, ए, बी) = 1-एक्सप

तदनुसार, वितरण फ़ंक्शन का रूप है

एक्स, ए *

एफआर(टी,एक्स, ए) = एफएक्स~ " एक्सएन(-Xx) डीएक्स.

विफलता-मुक्त संचालन की संभावना की गणना सूत्र द्वारा की जाती है

पी वी (टी , एक्स , ए) = मैं fexp (-Xx) dx.

मापदंडों के संबंध में डेरिवेटिव हैं

і і OcX a4 Jx a4 क्स्प (-Xx) Jx-X और J एक्स ऍक्स्प ( -एक्सएक्स)डीएक्स

एक्सजी(जी, ए, एक्स) _ (एफ आर ( 'एक्सए)) - / आर(एफ,एक्स,); ईए 2

जे क्स्प (-एक्सएक्स) (ए - एक्सएक्स)डीएक्स \

[!-, एफ आर (जेडएए)];=-

डॉ जी (टी, एक्स , ए) _ एक्स 1

पा) मैं

डॉ ^हाँ ए) = ~ जी^ए) मैं * ~" पूर्व P(-^t r (a)(ta ^ - 111 0 - "(а)]Жс, जहां (а) = J एक्स टी ~ " ऍक्स्प (- एक्सटी) डीटी \u003d जे जेड ए " 1 एक्सप (-आर)<&; Г(а) = J г“"’ exp(-z) In जेड 4 जेड

विफलता का औसत समय सूत्र द्वारा निर्धारित किया जाता है

जी आर (ओ, एक्स) \u003d जे ^ - एक्सपी(-एक्सटी)डीमैं =~.

ओजी (ए) एक्स

संबंधित डेरिवेटिव हैं

डीटी जी (ओह ) डीजी जी ( ,एक्स) _ 1 ईएच।एक्स 2 हां~एक्स"

विफलता दर दर्ज की गई है

एक्स टी -" एक्सपी (- xt )

एक्सआर(टी,,एक्स) =

(एफ आर (टी , एक्स ,ए )) = ^-y-^-[(X a InXf a "exp .) (- एक्सटी)+एक्स टी 1 इन्फेक्स (-एक्सटी))-

एक्स 1 वी ए " 1 एक्सप (-एक्सएफ) आर„ (ए)];

जी ए ((एक्स) एक्स ए जेजेआर ए "1 एक्सप (-एक्सएक्स) जेएक्स-

टी टूएक्स Xj X में '1 exp (-एक्सएक्स)डीएक्स +एक्स ए जेएक्स ए 1 इंजफेक्स (-एक्सएक्स)डीएक्स

इस प्रकार, ऐसे भाव प्राप्त होते हैं जो जटिल प्रणालियों के संकेतकों को निर्धारित करने में सटीकता का आकलन करने की समस्याओं को हल करने की अनुमति देते हैं। सिस्टम विश्लेषण में अक्सर उपयोग किए जाने वाले वितरण कानूनों पर विचार किया जाता है। सिस्टम के मुख्य संकेतकों को निर्धारित करने के लिए सूत्र प्राप्त किए जाते हैं और संकेतकों के पहले आंशिक डेरिवेटिव की गणना संबंधित वितरण कानूनों के मापदंडों के संबंध में की जाती है। अगला मुद्दा जिसे संबोधित करने की आवश्यकता है, वह है चुने हुए वितरण कानून के मापदंडों के आकलन का मुद्दा। आइए देखें कि यह समस्या कैसे हल होती है।

पैरामीटर के संबंध में डेरिवेटिव्स को परिभाषित किया गया है:

डी एक्स आर ( टी, ए , एक्स) _ (एफआर(टीएक्स ए) ) \ -/ आर(टी, एक्स, ए) 2

कहाँ पे ^ जी" 1 "पीडब्ल्यू-एक्स-आर-एक्सपी (-एक्सआर)

सांख्यिकीय पैमाने

अनुसंधान डेटा का सांख्यिकीय प्रसंस्करण

प्रयोग में प्राप्त मात्रात्मक डेटा से यथासंभव उपयोगी जानकारी निकालने के लिए सांख्यिकीय डेटा का उपयोग मनोवैज्ञानिक अनुसंधान सामग्री के प्रसंस्करण में किया जाता है।

कुछ सांख्यिकीय विधियों का उपयोग निर्धारित किया जाता है कि प्राप्त सामग्री किस सांख्यिकीय पैमाने से संबंधित है।

नाम पैमाना।इस पैमाने में ऐसी सामग्री शामिल है जिसमें अध्ययन की गई वस्तुएं उनकी गुणवत्ता में एक दूसरे से भिन्न होती हैं, और क्रम महत्वपूर्ण नहीं है। उदाहरण के लिए, सम्मेलन प्रतिभागियों का वितरण। ऐसी सामग्रियों के सांख्यिकीय प्रसंस्करण में, प्रत्येक वस्तु का प्रतिनिधित्व करने वाली इकाइयों की संख्या को ध्यान में रखना चाहिए।

आदेश पैमाने।वस्तुओं का क्रम फोकस है। आँकड़ों में इस पैमाने में ऐसी शोध सामग्री शामिल होती है जिसमें एक या कई वर्गों से संबंधित वस्तुएं विचार के अधीन होती हैं, लेकिन एक दूसरे के साथ तुलना करते समय भिन्न होती हैं: अधिक - कम, उच्च - निम्न, आदि।

ऑर्डर स्केल की विशिष्ट विशेषताओं को दिखाने का सबसे आसान तरीका किसी भी खेल प्रतियोगिता के परिणामों को देखना है। वे क्रमिक रूप से उन प्रतिभागियों की सूची बनाते हैं जिन्होंने क्रमशः पहला, दूसरा, तीसरा और अन्य स्थान प्राप्त किया।

स्थान के क्रम में, और एथलीटों की वास्तविक उपलब्धियों के बारे में जानकारी पृष्ठभूमि में फीकी पड़ जाती है, या अनुपस्थित होती है।

अंतराल स्केल।इसमें ऐसी सामग्री शामिल है जिसमें अध्ययन के तहत वस्तु का मात्रात्मक मूल्यांकन निश्चित इकाइयों में दिया जाता है। अंतराल के पैमाने के अनुरूप सामग्री में माप की एक इकाई होनी चाहिए जो सभी दोहराए गए मापों के लिए समान हो।

रिश्ते का पैमाना।इस पैमाने में ऐसी सामग्रियां शामिल हैं जो न केवल निश्चित इकाइयों की संख्या को ध्यान में रखती हैं , अंतराल के पैमाने के रूप में, लेकिन आपस में प्राप्त कुल परिणामों के अनुपात भी। ऐसे रिश्तों के साथ काम करने के लिए, आपके पास कुछ निरपेक्ष बिंदु होना चाहिए, जिससे उलटी गिनती की जाती है।

यदि शोधकर्ता के लिए उपलब्ध डेटा, करीब से जांच करने पर, केवल गाऊसी सामान्य वितरण वक्र से थोड़ा अलग होता है, तो यह शोधकर्ता को सांख्यिकीय प्रसंस्करण में पैरामीट्रिक विधियों का उपयोग करने का अधिकार देता है, जिसके प्रारंभिक प्रावधान गाऊसी सामान्य वितरण वक्र पर आधारित होते हैं। . सामान्य वितरण को पैरामीट्रिक कहा जाता है क्योंकि गॉसियन वक्र का निर्माण और विश्लेषण करने के लिए, केवल दो पैरामीटर होना पर्याप्त है: अंकगणितीय माध्य, जिसका मान वक्र के केंद्र में बहाल लंबवत की ऊंचाई के अनुरूप होना चाहिए, और तथाकथित मूल माध्य वर्ग, या मानक विचलन, एक मान जो इस वक्र के उतार-चढ़ाव की सीमा को दर्शाता है।

यदि पैरामीट्रिक विधियों को लागू करना असंभव है, तो गैर-पैरामीट्रिक विधियों की ओर मुड़ना आवश्यक है।

सामान्यता की धारणा के आधार पर सांख्यिकीय परीक्षणों के आवेदन को सीमित करने वाले कारकों में से एक नमूना आकार है। जब तक नमूना काफी बड़ा है (उदाहरण के लिए, 100 या अधिक अवलोकन), नमूना वितरण को सामान्य माना जा सकता है, भले ही यह निश्चित न हो कि जनसंख्या में चर का वितरण सामान्य है। हालांकि, यदि नमूना छोटा है, तो पैरामीट्रिक परीक्षणों का उपयोग केवल तभी किया जाना चाहिए जब यह विश्वास हो कि चर वास्तव में सामान्य रूप से वितरित किया गया है। हालांकि, ऐसे चरों के लिए भी, एक छोटे नमूने पर इस धारणा का परीक्षण करने का कोई तरीका नहीं है (सामान्यता के लिए सांख्यिकीय परीक्षण प्रभावी रूप से कम से कम 51 टिप्पणियों वाले नमूने पर काम करना शुरू करते हैं)।

गैर-पैरामीट्रिक विधियां सबसे उपयुक्त होती हैं जब नमूना आकार छोटा होता है और डेटा क्रमिक या नाममात्र पैमाने पर होता है। यदि बहुत अधिक अनुभवजन्य डेटा है (उदाहरण के लिए, n>100), तो अक्सर इसका कोई मतलब नहीं होता है और यहां तक ​​कि गैर-पैरामीट्रिक आंकड़ों का उपयोग करना गलत भी लगता है। यदि नमूना आकार बहुत छोटा है (उदाहरण के लिए, n=10 या उससे कम), तो उन गैर-पैरामीट्रिक परीक्षणों के लिए पी-महत्व स्तर जो सामान्य सन्निकटन का उपयोग करते हैं, केवल मोटे अनुमान के रूप में माना जा सकता है।



सामान्यता की धारणा पर आधारित मानदंड का अनुप्रयोग भी इस तथ्य से सीमित है कि अध्ययन के तहत विशेषताएँ एक निश्चित माप पैमाने से संबंधित हैं। सांख्यिकीय विधियां जैसे, उदाहरण के लिए, छात्र का टी-परीक्षण (आश्रित और स्वतंत्र नमूनों के लिए), पियर्सन का रैखिक सहसंबंध, साथ ही प्रतिगमन, क्लस्टर और कारक विश्लेषण यह मानते हैं कि स्रोत डेटा निरंतर है (अध्ययन के तहत चर के मान अंतराल या अनुपात पैमाने से संबंधित हैं)। हालांकि, ऐसे मामले हैं जहां डेटा को सटीक रूप से मापने के बजाय बस रैंक किया जाता है (एक क्रमिक पैमाने पर मापा जाता है)। तब इस तरह के सांख्यिकीय मानदंडों का उपयोग करना उचित लगता है, उदाहरण के लिए, विलकॉक्सन टी-टेस्ट, संकेतों का जी-परीक्षण, मान-व्हिटनी यू-टेस्ट, वाल्ड-वोल्फोविट्ज़ जेड-टेस्ट, स्पीयरमैन का रैंक सहसंबंध, आदि। उनकी अपनी सांख्यिकीय विधियां नाममात्र डेटा पर काम करेगा, उदाहरण के लिए, गुणात्मक विशेषताओं का सहसंबंध, ची-स्क्वायर टेस्ट, कोचरन का क्यू-टेस्ट, आदि। एक विशेष मानदंड का चुनाव एक परिकल्पना से जुड़ा होता है जिसे शोधकर्ता वैज्ञानिक अनुसंधान के दौरान आगे रखता है। , और फिर इसे अनुभवजन्य स्तर पर सिद्ध करने का प्रयास करता है।

इसलिए, प्रत्येक पैरामीट्रिक मानदंड के लिए, कम से कम एक गैर-पैरामीट्रिक विकल्प होता है। सामान्य तौर पर, ये प्रक्रियाएं निम्नलिखित श्रेणियों में से एक में आती हैं: (1) चर के बीच निर्भरता की डिग्री का आकलन करना; (2) स्वतंत्र नमूनों के लिए अंतर के मानदंड; (3) आश्रित नमूनों के लिए अंतर के मानदंड।

निर्भरता (रिश्ते) का आकलन करने के लिए,या कनेक्शन की मजबूती (घनत्व, ताकत) की डिग्री, पियर्सन सहसंबंध गुणांक (आर) की गणना करें। कड़ाई से बोलते हुए, इसके उपयोग की सीमाएं भी जुड़ी हुई हैं, उदाहरण के लिए, उस पैमाने के प्रकार के साथ जिसमें डेटा मापा जाता है और निर्भरता की गैर-रैखिकता। इसलिए, गैर-पैरामीट्रिक या तथाकथित रैंक सहसंबंध गुणांक (उदाहरण के लिए, स्पीयरमैन के रैंक सहसंबंध गुणांक (ρ), केंडल के ताऊ आँकड़े (τ), गामा (गामा)), जो क्रमिक (रैंकिंग) डेटा के लिए उपयोग किए जाते हैं, एक विकल्प के रूप में उपयोग किए जाते हैं। यदि दो से अधिक चर हैं, तो Kendall Coeff. of Concordance का उपयोग किया जाता है। इसका उपयोग, उदाहरण के लिए, स्वतंत्र विशेषज्ञों की राय की निरंतरता का आकलन करने के लिए किया जाता है (उदाहरण के लिए, एक ही विषय को दिए गए अंक, प्रतियोगिता में भाग लेने वाले)।

यदि डेटा को नाममात्र के पैमाने पर मापा जाता है, तो उन्हें आकस्मिक तालिकाओं में प्रस्तुत करना स्वाभाविक है जो सटीकता के लिए विभिन्न विविधताओं और सुधारों के साथ पियर्सन के ची-स्क्वेर्ड परीक्षण का उपयोग करते हैं।

स्वतंत्र समूहों के बीच अंतर. यदि दो नमूने हैं (उदाहरण के लिए, लड़के और लड़कियां) जिनकी तुलना किसी औसत मूल्य के संबंध में करने की आवश्यकता है, उदाहरण के लिए, रचनात्मक सोच, तो आप स्वतंत्र नमूनों के लिए टी-परीक्षण (स्वतंत्र नमूनों के लिए टी-परीक्षण) का उपयोग कर सकते हैं। . इस परीक्षण के गैर-पैरामीट्रिक विकल्प हैं वाल्ड-वोल्फोविट्ज़ रन टेस्ट, मान-व्हिटनी यू टेस्ट, और कोलमोगोरोव-स्मिरनोव दो-नमूना परीक्षण। यह याद रखना चाहिए कि दो-नमूना कोलमोगोरोव-स्मिरनोव परीक्षण न केवल दो वितरणों की स्थिति में अंतर के प्रति संवेदनशील है, बल्कि वितरण के आकार के लिए भी संवेदनशील है। वास्तव में, यह समरूपता परिकल्पना से किसी भी विचलन के प्रति संवेदनशील है, लेकिन यह इंगित नहीं करता है कि शोधकर्ता किस विचलन से निपट रहा है।

आश्रित समूहों के बीच अंतर. यदि एक ही नमूने से संबंधित दो चर की तुलना करना आवश्यक है, उदाहरण के लिए, सुधार कार्य से पहले और बाद में एक ही विषय की आक्रामकता के संकेतक, तो आमतौर पर आश्रित नमूनों के लिए टी-परीक्षण का उपयोग किया जाता है। वैकल्पिक गैर-पैरामीट्रिक परीक्षण साइन टेस्ट और विलकॉक्सन मिलान जोड़ी परीक्षण हैं। विलकॉक्सन परीक्षण से पता चलता है कि तुलनात्मक टिप्पणियों के बीच अंतर को रैंक करना संभव है। यदि ऐसा नहीं किया जा सकता है, तो संकेत मानदंड का उपयोग किया जाता है, जो केवल तुलनात्मक मूल्यों के बीच अंतर के संकेतों को ध्यान में रखता है।

यदि विचाराधीन चर श्रेणीबद्ध (नाममात्र) हैं, तो मैकनेमर ची-स्क्वायर उपयुक्त है। यदि दो श्रेणीबद्ध चर हैं, तो मानक सांख्यिकी और आकस्मिक तालिकाओं के लिए उपयुक्त मानदंड का उपयोग निर्भरता की डिग्री का आकलन करने के लिए किया जाता है: ची-स्क्वायर, फी-स्क्वायर, फिशर सटीक परीक्षण।

नीचे दी गई तालिका निम्नलिखित श्रेणियों को ध्यान में रखते हुए पैरामीट्रिक परीक्षण और उनके गैर-पैरामीट्रिक विकल्प प्रस्तुत करती है: 1) चर के बीच निर्भरता की डिग्री का आकलन; 2) अंतर के लिए मानदंड।

तालिका 4.1 - पैरामीट्रिक और गैर-पैरामीट्रिक मानदंड

पैरामीट्रिक मानदंड गैर-पैरामीट्रिक परीक्षण
निर्भरता मूल्यांकन (रिश्ते)
पियर्सन सहसंबंध गुणांक (आर) रैंक सहसंबंध गुणांक (स्पीयरमैन का रैंक सहसंबंध गुणांक ), केंडल के ताऊ सांख्यिकी (τ), गामा (गामा)); पियर्सन का ची-स्क्वायर (नाममात्र डेटा के लिए)
स्वतंत्र समूहों के बीच अंतर
स्वतंत्र नमूनों के लिए छात्र का टी-टेस्ट (स्वतंत्र नमूनों के लिए टी-टेस्ट) वाल्ड-वोल्फोवित्ज़ टेस्ट जेड-टेस्ट, मान-व्हिटनी यू टेस्ट, कोलमोगोरोव-स्मिरनोव दो-नमूना परीक्षण चलाता है
आश्रित समूहों के बीच अंतर
आश्रित नमूनों के लिए छात्र का टी-टेस्ट (आश्रित नमूनों के लिए टी-टेस्ट) संकेतों का जी-परीक्षण (साइन टेस्ट), विलकॉक्सन युग्मित तुलनाओं का टी-परीक्षण (विलकॉक्सन मिलान जोड़ी परीक्षण); मैकनेमर ची-स्क्वायर, ची-स्क्वायर, फी-स्क्वायर, फिशर सटीक (नाममात्र डेटा के लिए)

यदि एक ही नमूने से दो से अधिक चरों पर विचार किया जाता है (उदाहरण के लिए, पूर्व-समायोजन, पोस्ट-समायोजन -1, और पोस्ट-समायोजन -2), तो आमतौर पर विचरण के दोहराए गए उपायों के विश्लेषण का उपयोग किया जाता है, जिसे एक के रूप में माना जा सकता है निर्भर नमूनों के लिए टी-परीक्षण का सामान्यीकरण विश्लेषण की संवेदनशीलता को बढ़ाने के लिए। विचरण के विश्लेषण के लिए अंग्रेजी संक्षिप्त नाम एनोवा (विविधता का विश्लेषण) है। विचरण का विश्लेषण आपको न केवल आश्रित चर के आधार स्तर को नियंत्रित करने की अनुमति देता है, बल्कि अन्य कारकों को भी नियंत्रित करता है, साथ ही प्रयोग योजना में एक से अधिक आश्रित चर शामिल करता है। वैकल्पिक गैर-पैरामीट्रिक विधियों में विचरण और माध्य परीक्षण (क्रुस्कल-वालिस एनोवा, माध्य परीक्षण), फ्रीडमैन का विचरण का रैंक विश्लेषण (रैंक द्वारा फ्राइडमैन एनोवा) का क्रुस्कल-वालिस विश्लेषण है।

गैर-पैरामीट्रिक मानदंड पर प्रश्न।

सांख्यिकीय मानदंड - एक निर्णय नियम जो उच्च संभावना के साथ एक सत्य की स्वीकृति और एक झूठी परिकल्पना की अस्वीकृति सुनिश्चित करता है। साथ ही, एक सांख्यिकीय मानदंड एक निश्चित संख्या और इस संख्या की गणना करने की एक विधि है।

नमूना सामान्य होने पर पैरामीट्रिक मानदंड का उपयोग किया जाता है, जबकि इन मानदंडों में गणना में सुविधा के संभाव्यता वितरण की विशेषताएं शामिल होती हैं, अर्थात साधन और विचरण। यह मानता है कि डेटा निरंतर है। पैरामीट्रिक परीक्षणों में शामिल हैं: छात्र का टी-टेस्ट, ची-स्क्वायर टेस्ट। अंतराल अनुपात के तराजू के लिए उपयुक्त।

गैर-पैरामीट्रिक परीक्षणों का उपयोग तब किया जाता है जब सामान्य वितरण के बारे में बात करना असंभव होता है, परीक्षण रैंक या आवृत्तियों के साथ संचालन पर आधारित होते हैं। गैर-पैरामीट्रिक में साइन टेस्ट, विलकॉक्सन टेस्ट, मान-व्हिटनी टेस्ट और जोंखेर शामिल हैं। अंतराल तराजू से कमजोर तराजू के लिए उपयुक्त।

मानदंड चुनने से पहले, हमें सामान्यता के लिए नमूने की जांच करनी चाहिए।

मुझे नहीं पता कि औसत और तितर बितर उपायों के संदर्भ में क्या लिखना है, क्योंकि स्पष्ट रूप से फैलाव और ब्ला ब्ला अन्य चीजों की सभी समान अवधारणाएं हैं *_*

2. सांख्यिकीय परिकल्पनाओं के परीक्षण के तरीके: टी-टेस्ट, विलकॉक्सन टेस्ट, मान-व्हिटनी टेस्ट, क्रुस्कल-वालेस टेस्ट (आवेदन की शर्तें, परिकल्पनाओं का निर्माण, आंकड़ों का वितरण, गणना का विचार)

टी-टेस्ट (छात्र) - नमूना सामान्य होने पर उपयोग किया जाता है। परिकल्पनाएँ निम्नानुसार तैयार की जाती हैं:

1. एच0 तैयार किया गया है

2. H1 तैयार किया गया है, वैकल्पिक H0 (आमतौर पर यह सुविधाओं की बातचीत को इंगित करता है)।

3. दो परिकल्पनाओं के बीच चयन करने के लिए एक आँकड़ा चुना जाता है

4. प्रत्येक महत्व स्तर α के लिए, एक महत्वपूर्ण क्षेत्र स्थापित किया जाता है, जहां a) इस क्षेत्र में पड़ने वाला परिणाम H0 के बजाय H1 को इंगित करता है b) इस क्षेत्र में H0 true के साथ परिणाम गिरने की संभावना α के बराबर है।

पहली तरह की α=0.05 की स्वीकार्य त्रुटि की संभावना, यदि हमारे नमूने में मानदंड का मान t 0.05 से अधिक है, तो हम परिकल्पना H0 को स्वीकार करते हैं, परिकल्पना H1 को अस्वीकार करते हैं।

एक नमूने के लिए

स्वतंत्र नमूनों के लिए।

विलकॉक्सन हस्ताक्षरित रैंक परीक्षण नमूने में संख्याओं के मूल्यों पर नहीं, बल्कि केवल उनके संकेतों पर विचार करता है। मानदंड नमूना सदस्यों के पूर्ण मूल्यों को ध्यान में रखता है। इसका उपयोग तब किया जाता है जब नमूना सामान्य नहीं हो सकता है और जब यह तय करने की आवश्यकता होती है कि नमूने का गैर-शून्य माध्य है या नहीं। आवेदन की आवश्यकता है:

1) महत्व स्तर α निर्धारित करें और संबंधित निम्न विलकॉक्सन मात्रा ज्ञात करें।


2) नमूने के सभी सदस्यों को निरपेक्ष मूल्य के आरोही क्रम में व्यवस्थित करें, उनके नीचे रैंक पर हस्ताक्षर करें।

3) विलकॉक्सन आंकड़े की गणना करें, जिसके लिए हम नमूने के नकारात्मक सदस्यों को सौंपे गए रैंकों के योग की गणना करते हैं।

4) प्राप्त आँकड़ों की तुलना पहले पाई गई मात्रा से करें। यदि रैंकों का यह योग निम्न मात्रा से कम है, तो हम H0 परिकल्पना को अस्वीकार करते हैं और H1 परिकल्पना को स्वीकार करते हैं। इसी तरह, यदि सभी सकारात्मक नमूना सदस्यों के रैंकों का योग ऊपरी मात्रा से अधिक है, तो हम H1 को स्वीकार करते हैं और H0 को अस्वीकार करते हैं।

मान-व्हिटनी परीक्षण (यू) स्वतंत्र नमूनों के लिए एक परीक्षण है, जो छात्र के टी-टेस्ट का एक एनालॉग है। इसका अनुभवजन्य मूल्य दर्शाता है कि विशेषता मूल्यों की दो पंक्तियाँ कैसे मेल खाती हैं। इसका उपयोग तब किया जाता है जब नमूना सामान्य नहीं हो सकता है, केवल वितरण की समानता की आवश्यकता को संरक्षित किया जाता है, लेकिन उनका सामान्य होना आवश्यक नहीं है + जब समस्या को हल करने की आवश्यकता होती है, तो क्या यह दावा करना संभव है। प्रयोगात्मक नमूने का माध्य मान नियंत्रण समूह के माध्य मान से काफी अधिक है।

1) हम दोनों नमूनों के सदस्यों को आरोही क्रम में लिखते हैं, विभिन्न नमूनों के सदस्यों को अलग-अलग तरीकों से उजागर करते हैं।

2) पहले (नियंत्रण) नमूने की प्रत्येक संख्या के लिए, हम गणना करते हैं कि दूसरे (प्रयोगात्मक) नमूने की कितनी संख्याएं इसके बाईं ओर स्थित हैं। यदि पहले नमूने की संख्या दूसरे की संख्या के बराबर है, तो 0.5 जोड़ें। हम लगातार परिणाम प्राप्त करते हैं और उन्हें जोड़ते हैं।

3) हम मान-व्हिटनी के अनुसार निम्न परिमाण के लिए चुने गए महत्व के स्तर को देखते हैं। यदि हमारे द्वारा प्राप्त योग निम्न मात्रा से कम है, तो हम परिकल्पना H0 को अस्वीकार करते हैं, हम परिकल्पना H1 को स्वीकार करते हैं।

मान-व्हिटनी वितरण सममित है (यानी, आप पीछे की ओर गिन सकते हैं और ऊपरी मात्रा का उपयोग कर सकते हैं)।

क्रुस्कल-वालेस परीक्षण स्वतंत्र नमूनों के लिए विचरण के एकतरफा विश्लेषण का एक गैर-पैरामीट्रिक एनालॉग है। मान-व्हिटनी परीक्षण के समान। परिवर्तित विशेषता के मूल्यों की कई श्रृंखलाओं के संयोग की डिग्री का आकलन करता है। मुख्य विचार तुलना किए गए नमूनों के सभी मूल्यों को रैंक किए गए मानों के एक सामान्य अनुक्रम के रूप में प्रस्तुत करना है, इसके बाद प्रत्येक नमूने के लिए औसत रैंक की गणना करना है।

रैंकिंग के बाद गणना।

एन सभी नमूनों की कुल संख्या है।

k तुलना किए गए नमूनों की संख्या है।

आर मैं एक विशिष्ट नमूने के लिए रैंकों का योग है।

एन मैं - नमूना आकार मैं।

नमूने जितने अधिक भिन्न होंगे, H का अभिकलनात्मक मान उतना ही अधिक होगा, p-महत्व का स्तर उतना ही कम होगा। जब एक शून्य सांख्यिकीय परिकल्पना को खारिज कर दिया जाता है, तो इस विशेषता में सांख्यिकीय रूप से महत्वपूर्ण अंतर के बारे में एक वैकल्पिक विकल्प को मतभेदों की दिशा निर्दिष्ट किए बिना स्वीकार किया जाता है। (दिशा के लिए, मान-व्हिटनी परीक्षण की आवश्यकता है, क्योंकि यह दो नमूनों के लिए है, और यह एक दो से अधिक के लिए है)।