नमूना प्रतिनिधि है। प्रतिनिधित्व - यह क्या है? व्यवस्थित यादृच्छिक नमूनाकरण

वास्तव में, हम एक नहीं, बल्कि तीन प्रश्नों से शुरू करेंगे: एक नमूना क्या है? यह कब प्रतिनिधि है? वह क्या दर्शाती है?

सकल- यह लोगों, संगठनों, हमारे लिए रुचि की घटनाओं का कोई समूह है, जिसके बारे में हम निष्कर्ष निकालना चाहते हैं, और हो रहा है,या वस्तु, - ऐसे संग्रह का कोई तत्व।

नमूना- विश्लेषण के लिए चयनित मामलों (वस्तुओं) के सेट का कोई उपसमूह।

यदि हम राज्य के विधायकों की निर्णय लेने की गतिविधि का अध्ययन करना चाहते हैं, तो हम वर्जीनिया, उत्तरी कैरोलिना और दक्षिण कैरोलिना राज्यों की विधानसभाओं में ऐसी गतिविधियों की जांच कर सकते हैं, न कि सभी पचास राज्यों में, और इसके आधार पर, वितरित करनाजनसंख्या का डेटा प्राप्त किया जिसमें से इन तीन राज्यों का चयन किया गया था। यदि हम पेंसिल्वेनिया की मतदाता वरीयता प्रणाली की जांच करना चाहते हैं, तो हम 50 अमेरिकी कार्यकर्ताओं का साक्षात्कार करके ऐसा कर सकते हैं। पिट्सबर्ग में एस. स्टील और राज्य के सभी मतदाताओं को चुनाव के परिणाम वितरित करें।

उसी प्रकारयदि हम कॉलेज के छात्रों की बुद्धिमत्ता को मापना चाहते हैं, तो हम किसी दिए गए फुटबॉल सीज़न में ओहियो स्टेट में पंजीकृत सभी रक्षात्मक खिलाड़ियों का परीक्षण कर सकते हैं और फिर परिणाम को उस आबादी तक बढ़ा सकते हैं, जिसका वे हिस्सा हैं। प्रत्येक उदाहरण में, हम निम्नानुसार आगे बढ़ते हैं: हम जनसंख्या के भीतर एक उपसमूह स्थापित करते हैं, इस उपसमूह या नमूने का कुछ विस्तार से अध्ययन करते हैं, और अपने परिणामों को संपूर्ण जनसंख्या तक विस्तारित करते हैं। ये नमूने लेने के मुख्य चरण हैं।

हालांकि प्रतीतयह बिल्कुल स्पष्ट है कि इनमें से प्रत्येक नमूने में एक महत्वपूर्ण खामी है। उदाहरण के लिए, हालांकि वर्जीनिया, उत्तरी कैरोलिना और दक्षिण कैरोलिना की विधायिकाएं राज्य विधानसभाओं के समूह का हिस्सा हैं, वे ऐतिहासिक, भौगोलिक और राजनीतिक कारणों से बहुत समान तरीकों से संचालित होने की संभावना रखते हैं और ऐसे विशिष्ट विधायिकाओं से बहुत अलग हैं। न्यूयॉर्क, नेब्रास्का और अलास्का जैसे राज्य। जबकि पिट्सबर्ग में पचास स्टीलवर्कर्स वास्तव में पेनसिल्वेनिया में मतदाता हो सकते हैं, वे अपनी सामाजिक आर्थिक स्थिति, शिक्षा और जीवन के अनुभव के आधार पर, कई अन्य लोगों के विचारों से अलग हो सकते हैं, जो उसी तरह मतदाता हैं।

इसी तरह, हालांकि ओहियो स्टेट फुटबॉलर कॉलेज के छात्र हैं, वे कई कारणों से अन्य छात्रों से अलग हो सकते हैं। दूसरे शब्दों में, हालांकि इनमें से प्रत्येक उपसमूह वास्तव में एक नमूना है, उनमें से प्रत्येक के सदस्य उस आबादी के अधिकांश अन्य सदस्यों से व्यवस्थित रूप से भिन्न होते हैं जिनसे उन्हें चुना जाता है। एक अलग समूह के रूप में, उनमें से कोई भी सामान्य आबादी में राय, व्यवहार संबंधी उद्देश्यों और विशेषताओं की विशेषताओं के वितरण के संदर्भ में विशिष्ट नहीं है, जिसके साथ यह जुड़ा हुआ है। तदनुसार, राजनीतिक वैज्ञानिक कहेंगे कि इनमें से कोई भी नमूना प्रतिनिधि नहीं है।


प्रतिनिधि नमूना- यह एक ऐसा नमूना है जिसमें सामान्य जनसंख्या की सभी मुख्य विशेषताएं, जिनसे दिया गया नमूना लिया जाता है, लगभग उसी अनुपात में या उसी आवृत्ति के साथ प्रस्तुत की जाती हैं जिसके साथ यह विशेषता इस सामान्य आबादी में दिखाई देती है। इस प्रकार, यदि सभी राज्य विधानसभाओं में से 50% हर दो साल में केवल एक बार मिलते हैं, तो राज्य विधानसभाओं के लगभग आधे प्रतिनिधि नमूने इस प्रकार के होने चाहिए। यदि पेन्सिलवेनिया के 30% मतदाता ब्लू-कॉलर हैं, तो उन मतदाताओं के प्रतिनिधि नमूने का लगभग 30% (ऊपर के उदाहरण के अनुसार 100% के बजाय) ब्लू-कॉलर होना चाहिए।

और अगर कॉलेज के सभी छात्रों में से 2% एथलीट हैं, तो कॉलेज के छात्रों के प्रतिनिधि नमूने के समान अनुपात में एथलीट होने चाहिए। दूसरे शब्दों में, एक प्रतिनिधि नमूना एक सूक्ष्म जगत है, जनसंख्या का एक छोटा लेकिन सटीक मॉडल जिसका प्रतिनिधित्व करने का इरादा है। इस हद तक कि नमूना प्रतिनिधि है, इस नमूने के अध्ययन पर आधारित निष्कर्ष मूल आबादी पर सुरक्षित रूप से लागू माने जा सकते हैं। परिणामों के इस वितरण को हम सामान्यीकरण कहते हैं।

शायद एक ग्राफिक चित्रण इसे स्पष्ट करने में मदद करेगा। मान लीजिए हम अमेरिकी वयस्कों के बीच राजनीतिक समूह सदस्यता के पैटर्न का अध्ययन करना चाहते हैं। चित्र 5.1 तीन वृत्तों को छह समान त्रिज्यखंडों में विभाजित दर्शाता है। चित्र 5.1a विचाराधीन संपूर्ण जनसंख्या का प्रतिनिधित्व करता है। जनसंख्या के सदस्यों को राजनीतिक समूहों (जैसे पार्टियों और हित समूहों) के अनुसार वर्गीकृत किया जाता है जिससे वे संबंधित होते हैं।

इस उदाहरण मेंप्रत्येक वयस्क कम से कम एक और छह से अधिक राजनीतिक समूहों से संबंधित नहीं है; और सदस्यता के ये छह स्तर समुच्चय में समान रूप से समान हैं (इसलिए समान क्षेत्र)। मान लीजिए हम किसी समूह में शामिल होने के लिए लोगों के इरादों, समूह की पसंद और भागीदारी पैटर्न की जांच करना चाहते हैं, लेकिन संसाधनों की कमी के कारण, हम आबादी के हर छह सदस्यों में से केवल एक की जांच कर पाते हैं। विश्लेषण के लिए किसे चुना जाना चाहिए?

चावल। 5.1. सामान्य जनसंख्या से नमूने का निर्माण

किसी दिए गए आकार के संभावित नमूनों में से एक को अंजीर में छायांकित क्षेत्र द्वारा चित्रित किया गया है। 5.1 बी, हालांकि, यह स्पष्ट रूप से जनसंख्या की संरचना को नहीं दर्शाता है।

यदि हम इस नमूने के आधार पर सामान्यीकरण करते हैं, तो हम निष्कर्ष निकालेंगे:

1) कि सभी वयस्क अमेरिकी पांच राजनीतिक समूहों से संबंधित हैं और

2) कि अमेरिकियों का पूरा समूह व्यवहार उन लोगों के व्यवहार से मेल खाता है जो ठीक पांच समूहों से संबंधित हैं।

हालाँकि, हम जानते हैं कि पहला निष्कर्ष सत्य नहीं है, और इससे हमें दूसरे की वैधता पर संदेह हो सकता है।

इस प्रकार, चित्र 5.1b में दिखाया गया नमूना प्रतिनिधि नहीं है क्योंकि यह किसी दी गई जनसंख्या संपत्ति (जिसे अक्सर एक पैरामीटर कहा जाता है) के वास्तविक वितरण के अनुसार वितरण को नहीं दर्शाता है। ऐसा नमूना कहा जाता है की ओर स्थानांतरितपांच समूहों के सदस्य या से दूर स्थानांतरित कर दियाअन्य सभी समूह सदस्यता मॉडल। इस तरह के पक्षपाती नमूने के आधार पर, हम आमतौर पर जनसंख्या के बारे में गलत निष्कर्ष पर आते हैं।

यह सबसे स्पष्ट रूप से 1930 के दशक में लिटरेरी डाइजेस्ट पत्रिका पर आई तबाही के उदाहरण से प्रदर्शित किया जा सकता है, जिसने चुनावों के परिणामों पर एक जनमत सर्वेक्षण का आयोजन किया था। " लिटरेरी डाइजेस्ट"एक पत्रिका थी जो समाचार पत्रों और जनमत को दर्शाने वाली अन्य सामग्रियों से संपादकीय पुनर्मुद्रित करती थी; यह पत्रिका सदी की शुरुआत में बहुत लोकप्रिय थी।

1920 से. पत्रिका ने एक व्यापक राष्ट्रव्यापी सर्वेक्षण किया जिसमें दस लाख से अधिक लोगों को मतपत्र भेजकर उनसे आगामी राष्ट्रपति चुनाव के लिए अपने पसंदीदा उम्मीदवार को चिह्नित करने के लिए कहा गया। कई वर्षों तक, पत्रिका के चुनावों के परिणाम इतने सटीक थे कि सितंबर के मतदान ने नवंबर के चुनाव को अप्रासंगिक बना दिया।

और इतने बड़े नमूने में गलती कैसे हो सकती है? हालाँकि, 1936 में, ठीक ऐसा ही हुआ था: भारी बहुमत (60:40) के साथ, जीत की भविष्यवाणी रिपब्लिकन उम्मीदवार अल्फ लैंडन ने की थी। चुनाव में विकलांग व्यक्ति से लैंडन हारे - फ्रेंकलिन डी. रूजवेल्ट- व्यावहारिक रूप से उसी परिणाम के साथ जिसके साथ उसे जीतना चाहिए था। लिटरेरी डाइजेस्ट की विश्वसनीयता इतनी गंभीर रूप से कम हो गई थी कि पत्रिका जल्द ही प्रिंट से बाहर हो गई। क्या हुआ? यह बहुत आसान है: डाइजेस्ट पोल ने पक्षपाती नमूने का इस्तेमाल किया। पोस्टकार्ड उन लोगों को भेजे गए जिनके नाम दो स्रोतों से निकाले गए थे: टेलीफोन निर्देशिका और कार पंजीकरण सूची।

हालांकि चयन का यह तरीका पहले अन्य तरीकों से बहुत अलग नहीं था, यह अब काफी अलग था, 1936 की महामंदी के दौरान, जब रूजवेल्ट के सबसे संभावित मुख्य आधार, कम संपन्न मतदाता, टेलीफोन का खर्च नहीं उठा सकते थे, कार की तो बात ही छोड़िए। इस प्रकार, वास्तव में, डाइजेस्ट पोल में इस्तेमाल किया गया नमूना उन लोगों के प्रति पक्षपाती था, जिनके रिपब्लिकन के लिए चलने की सबसे अधिक संभावना थी, और यह अभी भी आश्चर्यजनक है कि रूजवेल्ट का इतना अच्छा परिणाम था।

इस समस्या को हल कैसे करें? अपने उदाहरण पर लौटते हुए, आइए अंजीर में दिए गए नमूने की तुलना करें। अंजीर में चयन के साथ 5.1b। 5.1सी बाद के मामले में, जनसंख्या का छठा हिस्सा भी विश्लेषण के लिए चुना गया था, लेकिन प्रत्येक मुख्य प्रकार की आबादी को नमूने में उस अनुपात में दर्शाया जाता है जिसमें वह पूरी आबादी में प्रतिनिधित्व करता है। इस तरह के एक नमूने से पता चलता है कि हर छह अमेरिकी वयस्कों में से एक एक राजनीतिक समूह से संबंधित है, छह से दो में से एक, और इसी तरह। इस तरह का एक नमूना इसके सदस्यों के बीच अन्य मतभेदों को भी प्रकट करेगा जो विभिन्न समूहों में भागीदारी से संबंधित हो सकते हैं। इस प्रकार, चित्र 5.1c में प्रस्तुत नमूना विचाराधीन जनसंख्या के लिए एक प्रतिनिधि नमूना है।

बेशक, यह उदाहरण हैकम से कम दो अत्यंत महत्वपूर्ण दृष्टिकोणों से सरलीकृत। सबसे पहले, राजनीतिक वैज्ञानिकों के लिए रुचि की अधिकांश आबादी उदाहरण में एक से अधिक विविध हैं। लोग, दस्तावेज़, सरकारें, संगठन, निर्णय आदि। एक दूसरे से एक में नहीं, बल्कि बहुत बड़ी संख्या में विशेषताओं में भिन्न होते हैं। इसलिए, एक प्रतिनिधि नमूना ऐसा होना चाहिए कि प्रत्येकमूल रूप से, जनसंख्या में इसके हिस्से के अनुपात में एक अलग क्षेत्र का प्रतिनिधित्व किया गया था।

दूसरे, वह स्थिति जहां चर, या विशेषताओं का वास्तविक वितरण, जिसे हम मापना चाहते हैं, पहले से ज्ञात नहीं है, इसके विपरीत की तुलना में बहुत अधिक सामान्य है - शायद इसे पिछली जनसंख्या जनगणना में नहीं मापा गया था। इस प्रकार, एक प्रतिनिधि नमूना तैयार किया जाना चाहिए ताकि यह मौजूदा वितरण को सटीक रूप से प्रतिबिंबित कर सके, भले ही हम सीधे इसकी वैधता का आकलन न कर सकें। नमूनाकरण प्रक्रिया में एक आंतरिक तर्क होना चाहिए जो हमें यह समझाने में सक्षम हो कि, यदि हम जनगणना के साथ नमूने की तुलना करने में सक्षम थे, तो यह वास्तव में प्रतिनिधि होगा।

अवसर प्रदान करने के लिएकिसी दी गई आबादी के जटिल संगठन का सटीक प्रतिबिंब और कुछ हद तक विश्वास है कि प्रस्तावित प्रक्रियाएं ऐसा करने में सक्षम हैं, शोधकर्ता सांख्यिकीय तरीकों की ओर मुड़ते हैं। ऐसा करते हुए, वे दो दिशाओं में कार्य करते हैं। सबसे पहले, कुछ नियमों (आंतरिक तर्क) का उपयोग करते हुए, शोधकर्ता यह तय करते हैं कि किस विशेष वस्तु का अध्ययन करना है, किसी विशेष नमूने में वास्तव में क्या शामिल करना है। दूसरा, बहुत अलग नियमों का उपयोग करते हुए, वे तय करते हैं कि कितनी वस्तुओं का चयन करना है। हम इन असंख्य नियमों का विस्तार से अध्ययन नहीं करेंगे, हम केवल राजनीति विज्ञान अनुसंधान में उनकी भूमिका पर विचार करेंगे। आइए उन वस्तुओं के चयन की रणनीतियों से शुरू करें जो एक प्रतिनिधि नमूना बनाती हैं।

एक प्रतिदर्श समष्टि का अध्ययन करने का अंतिम लक्ष्य हमेशा जनसंख्या के बारे में जानकारी प्राप्त करना होता है। ऐसा करने के लिए, एक नमूना अध्ययन को कुछ शर्तों को पूरा करना होगा। मुख्य स्थितियों में से एक नमूने का प्रतिनिधित्व (प्रतिनिधित्व). जैसा कि पहले चर्चा की गई है, गुणात्मक और मात्रात्मक प्रतिनिधित्व के बीच अंतर किया जाता है।

यादृच्छिकता, जो सांख्यिकीय अध्ययनों की गुणात्मक (संरचनात्मक) प्रतिनिधित्व की गारंटी देती है, नमूना समूहों (सेट) के गठन के लिए कई शर्तों को पूरा करके प्राप्त की जाती है:

1. जनसंख्या के प्रत्येक सदस्य के नमूने में शामिल होने की समान संभावना होनी चाहिए।

2. अध्ययन के तहत विशेषता की परवाह किए बिना सामान्य आबादी से अवलोकन की इकाइयों का चयन किया जाना चाहिए। यदि चयन उद्देश्यपूर्ण ढंग से किया जाता है, तो अध्ययन के तहत विशेषता के वितरण की स्वतंत्रता के लिए शर्तों का पालन करना भी आवश्यक है।

3. चयन सजातीय समूहों से किया जाना चाहिए।

चयन के विशेष तरीकों द्वारा नमूने और सामान्य आबादी की अधिकतम निकटता की गारंटी देने वाली शर्तों का अनुपालन सुनिश्चित किया जाता है। गठन की विधि के आधार पर, निम्नलिखित नमूने प्रतिष्ठित हैं:

1. नमूने जिन्हें सामान्य जनसंख्या के भागों में विभाजित करने की आवश्यकता नहीं होती है (वास्तव में, यादृच्छिक दोहराया या गैर-दोहराया नमूना)।

2. नमूने जिन्हें सामान्य जनसंख्या को भागों में विभाजित करने की आवश्यकता होती है (यांत्रिक, विशिष्ट या टाइपोलॉजिकल नमूने, समूह, युग्मित-संयुग्म नमूने)।

दरअसल, एक यादृच्छिक नमूना यादृच्छिक चयन द्वारा बनाया जाता है - यादृच्छिक रूप से। यादृच्छिक चयन मिश्रण पर आधारित है। उदाहरण के लिए: सभी गेंदों को मिलाकर एक खेल लोट्टो में एक गेंद का चयन करना, जीतने वाली लॉटरी संख्या चुनना, अनुसंधान के लिए बेतरतीब ढंग से रोगी कार्ड चुनना आदि। कभी-कभी यादृच्छिक संख्याओं का उपयोग किया जाता है, यादृच्छिक संख्याओं की तालिकाओं से प्राप्त किया जाता है या यादृच्छिक संख्या जनरेटर का उपयोग किया जाता है। इन संख्याओं के अनुसार, सामान्य जनसंख्या के पूर्व-क्रमांकित सरणी से, यादृच्छिक संख्याओं के संगत संख्याओं वाली प्रेक्षण इकाइयों का चयन किया जाता है जो गिर गई हैं।

एक यादृच्छिक नमूना संकलित करते समय, वस्तु के चयन के बाद और इसके बारे में सभी आवश्यक डेटा पंजीकृत होने के बाद, आप दो काम कर सकते हैं: वस्तु को वापस किया जा सकता है, या सामान्य आबादी को वापस नहीं किया जा सकता है। इसके बारे में नमूना दोहराया जाता है(वस्तु जनसंख्या को लौटा दी जाती है) या पुनरावृत्ति रहित(वस्तु जनसंख्या को वापस नहीं की जाती है)। चूंकि अधिकांश सांख्यिकीय अध्ययनों में दोहराए गए और गैर-दोहराए गए नमूनों के बीच व्यावहारिक रूप से कोई अंतर नहीं है, यह शर्त एक प्राथमिकता है कि नमूना दोहराया जाता है।

आवश्यक नमूना आकार का अनुमान लगाना

नमूना सामान्य जनसंख्या का मात्रात्मक रूप से प्रतिनिधि होने के लिए, पहले नमूने में शामिल किए जाने वाले डेटा की मात्रा का अनुमान लगाना आवश्यक है।

सामान्य जनसंख्या के अज्ञात आकार के साथपुन: नमूनाकरण की मात्रा जो प्रतिनिधि परिणामों की गारंटी देती है यदि परिणाम संकेतक में परिलक्षित होता है सापेक्ष मूल्य (शेयर), सूत्र द्वारा निर्धारित:

जहां पी अध्ययन के तहत विशेषता के संकेतक का मूल्य है,% में; क्यू = (100- पी) ;

t एक आत्मविश्वास गुणांक है जो दर्शाता है कि क्या संभावना है कि संकेतक का आकार सीमांत त्रुटि की सीमा से आगे नहीं जाएगा (आमतौर पर t = 2 लिया जाता है, जो त्रुटि-मुक्त पूर्वानुमान की 95% संभावना प्रदान करता है);

- संकेतक की सीमांत त्रुटि।

उदाहरण के लिए: औद्योगिक उद्यमों में श्रमिकों के स्वास्थ्य को दर्शाने वाले संकेतकों में से एक उन श्रमिकों का प्रतिशत है जो वर्ष के दौरान बीमार नहीं थे। मान लीजिए कि जिस औद्योगिक क्षेत्र से सर्वेक्षण किया गया उद्यम संबंधित है, उसके लिए यह संकेतक 25% है। सीमांत त्रुटि जिसे अनुमति दी जा सकती है ताकि संकेतक मूल्यों का प्रसार उचित सीमा से अधिक न हो, 5% है। इस मामले में, संकेतक 25% ± 5% का मान ले सकता है, अर्थात। 20% से 30% तक। t = 2 मानते हुए, हम प्राप्त करते हैं

उस मामले में, यदि संकेतक औसत मूल्य है, तो प्रेक्षणों की संख्या सूत्र द्वारा निर्धारित की जा सकती है:

जहां मानक विचलन है, जिसे पिछले अध्ययनों से या परीक्षण (पायलट) अध्ययनों के आधार पर प्राप्त किया जा सकता है।

दोहराव वाले चयन के साथऔर एक ज्ञात सामान्य आबादी की स्थिति के तहतउपयोग करने के मामले में आवश्यक यादृच्छिक नमूना आकार निर्धारित करने के लिए सापेक्ष मूल्य (शेयर)सूत्र लागू होता है:

औसत मूल्यों के लिएसूत्र का उपयोग किया जाता है:

जहाँ N सामान्य जनसंख्या का आकार है।

उपरोक्त उदाहरण की शर्तों के आधार पर और सामान्य जनसंख्या के आकार को मानते हुए एन=500 कार्यकर्ता, हमें मिलता है:

यह देखना आसान है कि गैर-दोहराव वाले नमूने के लिए आवश्यक नमूना आकार दोहराए गए नमूने (क्रमशः 188 और 300 श्रमिकों) की तुलना में कम है।

सामान्य तौर पर, प्रतिनिधि डेटा प्राप्त करने के लिए आवश्यक टिप्पणियों की संख्या अनुमत त्रुटि के वर्ग के साथ व्युत्क्रमानुपाती होती है।

यांत्रिक नमूनाकरण- नमूनाकरण, जब सर्वेक्षण की गई आबादी से यांत्रिक रूप से अवलोकन की इकाइयों का चयन किया जाता है। उदाहरण के लिए: उद्यम के कार्मिक विभाग के कार्ड के अनुसार या चिकित्सा इकाई के पॉलीक्लिनिक के आउट पेशेंट कार्ड के अनुसार हर पांचवें या हर दसवें कर्मचारी का चयन।

ठेठ, टाइपोलॉजिकलया ज़ोनडनमूनाकरण में सामान्य जनसंख्या का कई गुणात्मक रूप से सजातीय समूहों में टूटना शामिल है। उदाहरण के लिए: प्रत्येक पाठ्यक्रम में गहन परीक्षा के लिए विश्वविद्यालय के छात्रों की घटनाओं का अध्ययन करते समय, उनकी रचना में विशिष्ट छात्र समूहों का चयन किया जाता है। अक्सर इस चयन पद्धति को अन्य विधियों के साथ जोड़ा जाता है। उदाहरण के लिए: शहर के क्षेत्र को प्रदूषण की डिग्री के आधार पर विशिष्ट क्षेत्रों में विभाजित किया गया है, इन क्षेत्रों में यादृच्छिक चयन द्वारा अवलोकन समूह बनाए जाते हैं।

समूह चयनलक्षित चयन को संदर्भित करता है। इस पद्धति के साथ, व्यक्तियों को सामान्य आबादी से चुना जाता है (उपसमूहों में वितरण गैर-यादृच्छिक है), किसी भी संकेत के प्रकट होने के क्षण से एकजुट या अध्ययन में महत्वपूर्ण भूमिका निभाने वाले अध्ययन प्रभाव (जन्म का वर्ष, शुरुआत) रोग, दवा लेना, आदि)।

मामला नियंत्रण अध्ययन(एससी) एक प्रकार का महामारी विज्ञान अध्ययन है जिसमें एक जोखिम कारक के वितरण की तुलना एक बीमारी वाले रोगियों के समूह और एक नियंत्रण समूह के बीच की जाती है। अध्ययन (एससी) पूर्वव्यापी को संदर्भित करता है, क्योंकि शोधकर्ता, रोगियों को समूहों में विभाजित करता है, इस आधार पर कि उन्हें कोई बीमारी है या नहीं, उनसे अतीत की जानकारी का पता लगाता है।

जनसंख्या की सामान्य रुग्णता का अध्ययन करते समय हमें सैनिटरी सांख्यिकी में नमूना पद्धति के उपयोग पर अलग से ध्यान देना चाहिए। नमूनाकरण विधि के सैद्धांतिक परिसर का परीक्षण विशेष अध्ययन के दौरान किया गया है। तो, वी.एस. ब्यखोवस्की एट अल। 1928 में उन्होंने एक सतत विधि द्वारा और प्रत्येक पांचवें कार्ड के यांत्रिक चयन की विधि द्वारा रोगों पर डेटा के साथ 132.8 हजार कार्डों का समानांतर प्रसंस्करण किया। इस प्रसंस्करण के परिणामों के विश्लेषण ने रुग्णता के चयनात्मक अध्ययन से डेटा की उच्च प्रतिनिधित्वशीलता दिखाई। हालांकि, आज तक, व्यापक अभ्यास में चयनात्मक स्वच्छता-सांख्यिकीय अध्ययन करने के लिए कोई एकीकृत पद्धतिगत दृष्टिकोण नहीं हैं।

नमूना प्रतिनिधित्व

मापदण्ड नाम अर्थ
लेख विषय: नमूना प्रतिनिधित्व
रूब्रिक (विषयगत श्रेणी) मनोविज्ञान

नमूना आवश्यकताएँ

अध्ययन के लक्ष्यों और उद्देश्यों के आधार पर, सबसे पहले, नमूने के लिए कई अनिवार्य आवश्यकताओं को लागू किया जाता है। किसी प्रयोग की योजना बनाने में नमूने के आकार और उसकी कई विशेषताओं को ध्यान में रखना शामिल होना चाहिए। इस प्रकार, मनोवैज्ञानिक अनुसंधान में, आवश्यकता एकरूपतानमूने। इसका मतलब है कि एक मनोवैज्ञानिक, अध्ययन कर रहा है, उदाहरण के लिए, किशोर, एक ही नमूने में वयस्कों को शामिल नहीं कर सकते हैं। इसके विपरीत, उम्र में कटौती की विधि द्वारा किया गया एक अध्ययन, सिद्धांत रूप में, विभिन्न उम्र के विषयों की उपस्थिति मानता है। उसी समय, इस मामले में, नमूने की एकरूपता देखी जानी चाहिए, लेकिन अन्य मानदंडों के अनुसार, मुख्य रूप से उम्र और लिंग। सजातीय नमूने के गठन का आधार अध्ययन के उद्देश्यों के आधार पर विभिन्न विशेषताओं, जैसे बुद्धि का स्तर, राष्ट्रीयता, कुछ बीमारियों की अनुपस्थिति आदि हो सकता है।

सामान्य आंकड़ों में, एक अवधारणा है दोहराया गयाऔर पुनरावृत्ति रहितचयन, या, दूसरे शब्दों में, वापसी के साथ और वापसी के बिना चयन। एक उदाहरण के रूप में, एक नियम के रूप में, एक कंटेनर से ली गई गेंद का विकल्प दिया जाता है। वापसी के साथ ड्रा के मामले में, प्रत्येक चयनित गेंद को फिर से कंटेनर में वापस कर दिया जाता है और इसलिए, इसे फिर से चुना जाना चाहिए। एक गैर-दोहराव चयन के साथ, एक बार चयनित गेंद को अलग रखा जाता है और अब चयन में भाग नहीं ले सकता है। मनोवैज्ञानिक अनुसंधान में, चयनात्मक अनुसंधान के आयोजन के इस तरह के तरीकों के अनुरूप मिल सकते हैं, क्योंकि एक मनोवैज्ञानिक को अक्सर एक ही पद्धति का उपयोग करके एक ही विषय का कई बार परीक्षण करना पड़ता है। उसी समय, कड़ाई से बोलते हुए, इस मामले में परीक्षण प्रक्रिया को दोहराया जाता है। बार-बार अध्ययन के मामले में रचना की पूरी पहचान वाले विषयों के नमूने में सभी लोगों में निहित कार्यात्मक और आयु परिवर्तनशीलता के कारण हमेशा कुछ अंतर होंगे। प्रक्रिया की प्रकृति से ऐसा चयन दोहराया जाता है, हालांकि यहां शब्द का अर्थ गेंदों के मामले में स्पष्ट रूप से अलग है।

इस बात पर जोर देना महत्वपूर्ण है कि किसी भी नमूने के लिए सभी आवश्यकताएं इस तथ्य पर उबलती हैं कि इसके आधार पर मनोवैज्ञानिक को सामान्य जनसंख्या की विशेषताओं के बारे में सबसे पूर्ण, अविरल जानकारी प्राप्त करनी चाहिए, जिससे यह नमूना लिया गया है। दूसरे शब्दों में, नमूने को अध्ययन की जा रही सामान्य जनसंख्या की विशेषताओं को यथासंभव पूर्ण रूप से प्रतिबिंबित करना चाहिए।

प्रयोगात्मक नमूने की संरचना को सामान्य जनसंख्या का प्रतिनिधित्व (अनुकरण) करना चाहिए, क्योंकि प्रयोग में प्राप्त निष्कर्ष भविष्य में पूरी सामान्य आबादी को स्थानांतरित किए जाने वाले हैं। इस कारण से, नमूने में एक विशेष गुण होना चाहिए - प्रतिनिधित्व, इस पर प्राप्त निष्कर्षों को संपूर्ण सामान्य आबादी तक विस्तारित करना संभव बनाता है।

नमूने की प्रतिनिधित्वशीलता बहुत महत्वपूर्ण है, हालांकि, वस्तुनिष्ठ कारणों से, इसे बनाए रखना बेहद मुश्किल है। इस प्रकार, यह एक सर्वविदित तथ्य है कि XX सदी के 60 के दशक में संयुक्त राज्य अमेरिका में मानव व्यवहार के सभी मनोवैज्ञानिक अध्ययनों का 70% से 90% कॉलेज के छात्रों के साथ किया गया था, उनमें से अधिकांश मनोविज्ञान के छात्र थे। जानवरों पर किए गए प्रयोगशाला अध्ययनों में, अध्ययन की सबसे आम वस्तु चूहे हैं। इस कारण से, यह कोई संयोग नहीं है कि मनोविज्ञान को "सोफोमोर्स और सफेद चूहों का विज्ञान" कहा जाता था। कॉलेज मनोविज्ञान के छात्र अमेरिका की कुल आबादी का केवल 3% हैं। जाहिर है, छात्रों का नमूना एक ऐसे मॉडल के रूप में प्रतिनिधि नहीं है जो देश की पूरी आबादी का प्रतिनिधित्व करने का दावा करता है।

प्रतिनिधिनमूना, या, जैसा कि वे कहते हैं, प्रतिनिधिएक नमूना एक ऐसा नमूना है जिसमें सामान्य आबादी की सभी मुख्य विशेषताओं को लगभग उसी अनुपात में और उसी आवृत्ति के साथ दर्शाया जाता है जिसके साथ यह विशेषता इस सामान्य आबादी में दिखाई देती है। दूसरे शब्दों में, एक प्रतिनिधि नमूना उस आबादी का एक छोटा लेकिन सटीक मॉडल है जिसका प्रतिनिधित्व करने का इरादा है। इस हद तक कि नमूना प्रतिनिधि है, इस नमूने के अध्ययन के आधार पर निष्कर्ष पूरी आबादी पर लागू होने वाले उच्च स्तर की निश्चितता के साथ माना जा सकता है। परिणामों के इस प्रसार को कहा जाता है सामान्यीकरण।

आदर्श रूप से, एक प्रतिनिधि नमूना ऐसा होना चाहिए कि मनोवैज्ञानिक, लक्षण, व्यक्तित्व लक्षण, आदि द्वारा अध्ययन की जाने वाली प्रत्येक बुनियादी विशेषताओं का अध्ययन किया जा सके। इसमें सामान्य जनसंख्या में समान विशेषताओं के अनुपात में प्रतिनिधित्व किया जाएगा। इन आवश्यकताओं के अनुसार, नमूनाकरण प्रक्रिया में एक आंतरिक तर्क होना चाहिए जो शोधकर्ता को यह विश्वास दिला सके कि, सामान्य आबादी के साथ तुलना करने पर, यह वास्तव में प्रतिनिधि, प्रतिनिधि बन जाएगा।

अपनी विशिष्ट गतिविधि में, मनोवैज्ञानिक निम्नानुसार कार्य करता है: वह सामान्य आबादी के भीतर एक उपसमूह (नमूना) स्थापित करता है, इस नमूने का विस्तार से अध्ययन करता है (इसके साथ प्रयोगात्मक कार्य करता है), और फिर, यदि सांख्यिकीय विश्लेषण के परिणाम अनुमति देते हैं, तो विस्तार करता है पूरी आबादी के लिए निष्कर्ष। ये एक नमूने के साथ मनोवैज्ञानिक के काम के मुख्य चरण हैं।

नौसिखिए मनोवैज्ञानिक को बार-बार दोहराई जाने वाली गलती को ध्यान में रखना चाहिए: हर बार जब वह किसी भी तरीके से और किसी भी स्रोत से कोई डेटा एकत्र करता है, तो वह हमेशा अपने निष्कर्षों को पूरी आबादी तक पहुंचाने के लिए ललचाता है। ऐसी गलती से बचने के लिए, न केवल सामान्य ज्ञान होना चाहिए, बल्कि, सबसे बढ़कर, गणितीय सांख्यिकी की बुनियादी अवधारणाओं की अच्छी पकड़ होनी चाहिए।

नमूना प्रतिनिधित्व - अवधारणा और प्रकार। "नमूना का प्रतिनिधित्व" 2017, 2018 श्रेणी का वर्गीकरण और विशेषताएं।

प्रतिनिधित्व की अवधारणा अक्सर सांख्यिकीय रिपोर्टिंग और भाषणों और रिपोर्टों की तैयारी में पाई जाती है। शायद, इसके बिना, समीक्षा के लिए किसी भी प्रकार की जानकारी की प्रस्तुति की कल्पना करना मुश्किल है।

प्रतिनिधित्व - यह क्या है?

प्रतिनिधित्व दर्शाता है कि कैसे चयनित ऑब्जेक्ट या भाग उस डेटा सेट की सामग्री और अर्थ से मेल खाते हैं जिससे उन्हें चुना गया था।

अन्य परिभाषाएं

प्रतिनिधित्व की अवधारणा को विभिन्न संदर्भों में विकसित किया जा सकता है। लेकिन इसके अर्थ में, प्रतिनिधित्व सामान्य आबादी से चयनित इकाइयों की विशेषताओं और गुणों का पत्राचार है, जो संपूर्ण रूप से संपूर्ण सामान्य डेटाबेस की विशेषताओं को सटीक रूप से दर्शाता है।

साथ ही, सूचना की प्रतिनिधित्वशीलता को जनसंख्या के मापदंडों और गुणों का प्रतिनिधित्व करने के लिए नमूना डेटा की क्षमता के रूप में परिभाषित किया गया है जो चल रहे अध्ययन के दृष्टिकोण से महत्वपूर्ण हैं।

प्रतिनिधि नमूना

नमूनाकरण का सिद्धांत कुल डेटा सेट के गुणों को सबसे महत्वपूर्ण और सटीक रूप से प्रतिबिंबित करना है। ऐसा करने के लिए, विभिन्न तरीकों का उपयोग किया जाता है जो सटीक परिणाम प्राप्त करने की अनुमति देते हैं और केवल चुनिंदा सामग्रियों का उपयोग करने का एक सामान्य विचार है जो सभी डेटा की गुणवत्ता का वर्णन करते हैं।

इस प्रकार, संपूर्ण सामग्री का अध्ययन करना आवश्यक नहीं है, लेकिन यह नमूना प्रतिनिधित्व पर विचार करने के लिए पर्याप्त है। यह क्या है? यह जानकारी के कुल द्रव्यमान का अंदाजा लगाने के लिए व्यक्तिगत डेटा का चयन है।

विधि के आधार पर, उन्हें संभाव्य और असंभव के रूप में प्रतिष्ठित किया जाता है। एक संभाव्य एक नमूना है जो सबसे महत्वपूर्ण और दिलचस्प डेटा की गणना करके बनाया गया है, जो सामान्य आबादी के आगे के प्रतिनिधि हैं। यह एक जानबूझकर पसंद या एक यादृच्छिक चयन है, फिर भी, इसकी सामग्री द्वारा उचित है।

अतुल्य - यह एक साधारण लॉटरी के सिद्धांत के अनुसार संकलित यादृच्छिक नमूने की किस्मों में से एक है। इस मामले में, ऐसा नमूना बनाने वाले की राय को ध्यान में नहीं रखा जाता है। केवल एक ब्लाइंड लॉट का उपयोग किया जाता है।

सम्भाव्यता नमूनाचयन

संभाव्यता नमूनों को भी कई प्रकारों में विभाजित किया जा सकता है:

  • सबसे सरल और सबसे समझने योग्य सिद्धांतों में से एक गैर-प्रतिनिधि नमूनाकरण है। उदाहरण के लिए, इस पद्धति का उपयोग अक्सर सामाजिक सर्वेक्षणों में किया जाता है। साथ ही, सर्वेक्षण में भाग लेने वालों को भीड़ से किसी विशिष्ट आधार पर नहीं चुना जाता है, और इसमें भाग लेने वाले पहले 50 लोगों से जानकारी प्राप्त की जाती है।
  • जानबूझकर नमूने इस मायने में भिन्न हैं कि चयन में उनकी कई आवश्यकताएं और शर्तें हैं, लेकिन फिर भी वे यादृच्छिक संयोग पर भरोसा करते हैं, अपने लक्ष्य के रूप में अच्छे आंकड़ों का पीछा नहीं करते हैं।
  • कोटा-आधारित नमूनाकरण गैर-संभाव्य नमूने का एक और रूपांतर है जिसका उपयोग अक्सर बड़े डेटासेट की जांच के लिए किया जाता है। यह बहुत सारे नियमों और शर्तों का उपयोग करता है। वस्तुओं का चयन किया जाता है जो उनके अनुरूप होनी चाहिए। यही है, एक सामाजिक सर्वेक्षण के उदाहरण का उपयोग करते हुए, यह माना जा सकता है कि 100 लोगों का साक्षात्कार लिया जाएगा, लेकिन एक सांख्यिकीय रिपोर्ट संकलित करते समय स्थापित आवश्यकताओं को पूरा करने वाले कुछ निश्चित लोगों की राय को ही ध्यान में रखा जाएगा।

संभाव्यता नमूने

संभाव्य नमूनों के लिए, कई मापदंडों की गणना की जाती है जो नमूने में वस्तुओं के अनुरूप होंगे, और उनमें से, अलग-अलग तरीकों से, ठीक उन तथ्यों और डेटा को चुना जा सकता है जिन्हें नमूना डेटा के प्रतिनिधित्व के रूप में प्रस्तुत किया जाएगा। आवश्यक डेटा की गणना के ऐसे तरीके हो सकते हैं:

  • एक साधारण यादृच्छिक नमूना। यह इस तथ्य में शामिल है कि चयनित खंड के बीच, एक पूरी तरह से यादृच्छिक लॉटरी विधि आवश्यक मात्रा में डेटा का चयन करती है, जो एक प्रतिनिधि नमूना होगा।
  • व्यवस्थित और यादृच्छिक नमूनाकरण यादृच्छिक रूप से चयनित खंड के आधार पर आवश्यक डेटा की गणना के लिए एक प्रणाली तैयार करना संभव बनाता है। इस प्रकार, यदि पहली यादृच्छिक संख्या जो कुल जनसंख्या में से चयनित डेटा की अनुक्रम संख्या को इंगित करती है, 5 है, तो बाद में चयनित डेटा हो सकता है, उदाहरण के लिए, 15, 25, 35, और इसी तरह। यह उदाहरण स्पष्ट रूप से बताता है कि एक यादृच्छिक विकल्प भी आवश्यक इनपुट डेटा की व्यवस्थित गणना पर आधारित हो सकता है।

उपभोक्ताओं का नमूना

जानबूझकर नमूनाकरण एक ऐसी विधि है जिसमें प्रत्येक व्यक्तिगत खंड पर विचार किया जाता है, और इसके मूल्यांकन के आधार पर, एक जनसंख्या संकलित की जाती है जो समग्र डेटाबेस की विशेषताओं और गुणों को दर्शाती है। इस तरह, अधिक डेटा एकत्र किया जाता है जो एक प्रतिनिधि नमूने की आवश्यकताओं को पूरा करता है। कुल जनसंख्या का प्रतिनिधित्व करने वाले चयनित डेटा की गुणवत्ता खोए बिना, कई विकल्पों का चयन करना आसान है, जिन्हें कुल संख्या में शामिल नहीं किया जाएगा। इस प्रकार, अध्ययन के परिणामों की प्रतिनिधित्वशीलता निर्धारित की जाती है।

नमूने का आकार

संबोधित किया जाने वाला अंतिम मुद्दा जनसंख्या के प्रतिनिधि प्रतिनिधित्व के लिए नमूना आकार नहीं है। नमूना आकार हमेशा सामान्य आबादी में स्रोतों की संख्या पर निर्भर नहीं करता है। हालांकि, नमूना आबादी का प्रतिनिधित्व सीधे इस बात पर निर्भर करता है कि परिणाम को कितने खंडों में विभाजित किया जाना चाहिए। इस तरह के जितने अधिक खंड होंगे, परिणामी नमूने में उतना ही अधिक डेटा प्राप्त होगा। यदि परिणामों के लिए एक सामान्य संकेतन की आवश्यकता होती है और विशिष्टताओं की आवश्यकता नहीं होती है, तो, तदनुसार, नमूना छोटा हो जाता है, क्योंकि, विवरण में जाने के बिना, जानकारी को अधिक सतही रूप से प्रस्तुत किया जाता है, जिसका अर्थ है कि इसका पठन सामान्य होगा।

प्रतिनिधित्व त्रुटि की अवधारणा

प्रतिनिधित्व त्रुटि जनसंख्या की विशेषताओं और नमूना डेटा के बीच एक विशिष्ट विसंगति है। किसी भी नमूना अध्ययन का संचालन करते समय, पूरी तरह से सटीक डेटा प्राप्त करना असंभव है, जैसा कि सामान्य आबादी के पूर्ण अध्ययन और जानकारी और मापदंडों के केवल एक हिस्से के साथ प्रदान किया गया एक नमूना है, जबकि पूरी आबादी का अध्ययन करते समय अधिक विस्तृत अध्ययन संभव है। इस प्रकार, कुछ त्रुटियां और त्रुटियां अपरिहार्य हैं।

त्रुटियों के प्रकार

प्रतिनिधि नमूना संकलित करते समय कुछ त्रुटियां होती हैं:

  • व्यवस्थित।
  • अनियमित।
  • जानबूझकर किया गया।
  • अनजाने में।
  • मानक।
  • सीमा।

यादृच्छिक त्रुटियों के प्रकट होने का कारण सामान्य जनसंख्या के अध्ययन की असंतत प्रकृति हो सकती है। आमतौर पर, प्रतिनिधित्व की यादृच्छिक त्रुटि नगण्य आकार और प्रकृति की होती है।

इस बीच, व्यवस्थित त्रुटियां तब उत्पन्न होती हैं जब कुल जनसंख्या से डेटा के चयन के नियमों का उल्लंघन किया जाता है।

माध्य त्रुटि नमूना माध्य और अंतर्निहित जनसंख्या के बीच का अंतर है। यह नमूने में इकाइयों की संख्या पर निर्भर नहीं करता है। यह व्युत्क्रमानुपाती है। फिर वॉल्यूम जितना बड़ा होगा, औसत त्रुटि का मान उतना ही छोटा होगा।

सीमांत त्रुटि बनाए गए नमूने के औसत मूल्यों और कुल जनसंख्या के बीच सबसे बड़ा संभावित अंतर है। इस तरह की त्रुटि को उनकी घटना की दी गई शर्तों के तहत अधिकतम संभावित त्रुटियों के रूप में वर्णित किया गया है।

प्रतिनिधित्व की जानबूझकर और अनजाने में त्रुटियां

डेटा ऑफ़सेट त्रुटियां जानबूझकर या अनजाने में हो सकती हैं।

फिर जानबूझकर त्रुटियों के प्रकट होने का कारण रुझानों को निर्धारित करने की विधि द्वारा डेटा के चयन का दृष्टिकोण है। एक प्रतिनिधि नमूना बनाने, नमूना अवलोकन तैयार करने के चरण में भी अनजाने में त्रुटियां होती हैं। ऐसी त्रुटियों से बचने के लिए, नमूना इकाइयों को सूचीबद्ध करने के लिए एक अच्छा नमूना फ्रेम बनाना आवश्यक है। इसे अध्ययन के सभी पहलुओं को शामिल करते हुए, नमूने के उद्देश्यों का पूरी तरह से पालन करना चाहिए, विश्वसनीय होना चाहिए।

वैधता, विश्वसनीयता, प्रतिनिधित्व। त्रुटि गणना

अंकगणित माध्य (एम) के प्रतिनिधित्व (मिमी) की त्रुटि की गणना।

मानक विचलन: नमूना आकार (>30)।

प्रतिनिधि त्रुटि (श्री) और (आर): नमूना आकार (एन> 30)।

ऐसी स्थिति में जब आपको किसी ऐसी जनसंख्या का अध्ययन करना हो जहाँ नमूनों की संख्या कम हो और 30 इकाई से कम हो, तो प्रेक्षणों की संख्या एक इकाई से कम हो जाएगी।

त्रुटि का परिमाण सीधे नमूना आकार के समानुपाती होता है। सूचना का प्रतिनिधित्व और सटीक पूर्वानुमान लगाने की संभावना की डिग्री की गणना एक निश्चित मात्रा में सीमांत त्रुटि को दर्शाती है।

प्रतिनिधि प्रणाली

सूचना की प्रस्तुति के मूल्यांकन की प्रक्रिया में न केवल एक प्रतिनिधि नमूना का उपयोग किया जाता है, बल्कि जानकारी प्राप्त करने वाला व्यक्ति स्वयं प्रतिनिधि प्रणालियों का उपयोग करता है। इस प्रकार, मस्तिष्क प्रस्तुत डेटा का गुणात्मक और त्वरित मूल्यांकन करने और मुद्दे के सार को समझने के लिए सूचना के पूरे प्रवाह से एक प्रतिनिधि नमूना बनाकर कुछ प्रक्रिया करता है। प्रश्न का उत्तर दें: "प्रतिनिधित्व - यह क्या है?" - मानव चेतना के पैमाने पर काफी सरल है। ऐसा करने के लिए, मस्तिष्क सभी विषयों का उपयोग करता है, इस पर निर्भर करता है कि किस तरह की जानकारी को सामान्य प्रवाह से अलग करने की आवश्यकता है। इस प्रकार, वे भेद करते हैं:

  • दृश्य प्रतिनिधित्व प्रणाली, जहां आंख की दृश्य धारणा के अंग शामिल होते हैं। जो लोग अक्सर ऐसी प्रणाली का उपयोग करते हैं उन्हें दृश्य कहा जाता है। इस सिस्टम की मदद से व्यक्ति इमेज के रूप में आने वाली सूचनाओं को प्रोसेस करता है।
  • श्रवण प्रतिनिधित्व प्रणाली। उपयोग किया जाने वाला मुख्य अंग श्रवण है। ध्वनि फ़ाइलों या भाषण के रूप में आपूर्ति की गई जानकारी को इस विशेष प्रणाली द्वारा संसाधित किया जाता है। जो लोग कान से जानकारी को बेहतर तरीके से समझते हैं उन्हें श्रवण कहा जाता है।
  • काइनेस्टेटिक प्रतिनिधित्व प्रणाली घ्राण और स्पर्श चैनलों की मदद से सूचना के प्रवाह का प्रसंस्करण है।
  • डिजिटल प्रतिनिधित्व प्रणाली का उपयोग दूसरों के साथ मिलकर बाहर से जानकारी प्राप्त करने के साधन के रूप में किया जाता है। प्राप्त आंकड़ों की धारणा और समझ।

तो, प्रतिनिधित्व - यह क्या है? सूचना प्रसंस्करण में एक भीड़ या एक अभिन्न प्रक्रिया से एक साधारण चयन? हम निश्चित रूप से कह सकते हैं कि प्रतिनिधित्वशीलता बड़े पैमाने पर डेटा प्रवाह की हमारी धारणा को निर्धारित करती है, जिससे सबसे महत्वपूर्ण और महत्वपूर्ण को अलग करने में मदद मिलती है।

जनसंख्या- इकाइयों का एक समूह जिसमें बड़े पैमाने पर चरित्र, विशिष्टता, गुणात्मक एकरूपता और भिन्नता की उपस्थिति होती है।

सांख्यिकीय आबादी में भौतिक रूप से मौजूदा वस्तुएं (कर्मचारी, उद्यम, देश, क्षेत्र) शामिल हैं, एक वस्तु है।

जनसंख्या इकाई- सांख्यिकीय जनसंख्या की प्रत्येक विशिष्ट इकाई।

एक और एक ही सांख्यिकीय आबादी एक विशेषता में सजातीय और दूसरे में विषम हो सकती है।

गुणात्मक एकरूपता- किसी भी विशेषता के लिए जनसंख्या की सभी इकाइयों की समानता और बाकी सभी के लिए असमानता।

एक सांख्यिकीय जनसंख्या में, जनसंख्या की एक इकाई और दूसरी के बीच का अंतर अक्सर मात्रात्मक प्रकृति का होता है। जनसंख्या की विभिन्न इकाइयों की विशेषता के मूल्यों में मात्रात्मक परिवर्तन को भिन्नता कहा जाता है।

फ़ीचर भिन्नता- जनसंख्या की एक इकाई से दूसरी इकाई में संक्रमण के दौरान एक संकेत (मात्रात्मक संकेत के लिए) का मात्रात्मक परिवर्तन।

संकेत- यह इकाइयों, वस्तुओं और घटनाओं की एक संपत्ति, विशेषता या अन्य विशेषता है जिसे देखा या मापा जा सकता है। संकेतों को मात्रात्मक और गुणात्मक में विभाजित किया गया है। जनसंख्या की अलग-अलग इकाइयों में एक विशेषता के मूल्य की विविधता और परिवर्तनशीलता को कहा जाता है उतार-चढ़ाव.

गुणकारी (गुणात्मक) विशेषताएं मात्रात्मक नहीं हैं (सेक्स द्वारा जनसंख्या की संरचना)। मात्रात्मक विशेषताओं में एक संख्यात्मक अभिव्यक्ति होती है (आयु के अनुसार जनसंख्या की संरचना)।

सूचक- यह समय और स्थान की विशिष्ट परिस्थितियों में उद्देश्य के लिए इकाइयों या समुच्चय की किसी भी संपत्ति की मात्रात्मक और गुणात्मक विशेषता है।

उपलब्धिःसंकेतकों का एक समूह है जो अध्ययन के तहत घटना को व्यापक रूप से दर्शाता है।

उदाहरण के लिए, वेतन पर विचार करें:
  • साइन - मजदूरी
  • सांख्यिकीय जनसंख्या - सभी कर्मचारी
  • जनसंख्या की इकाई प्रत्येक कार्यकर्ता है
  • गुणात्मक एकरूपता - अर्जित वेतन
  • फ़ीचर भिन्नता - संख्याओं की एक श्रृंखला

सामान्य जनसंख्या और उसका नमूना

आधार एक या अधिक सुविधाओं को मापने के परिणामस्वरूप प्राप्त आंकड़ों का एक समूह है। वस्तुओं का वास्तव में देखा गया सेट, एक यादृच्छिक चर के अवलोकनों की एक श्रृंखला द्वारा सांख्यिकीय रूप से दर्शाया गया है, है नमूना, और काल्पनिक रूप से विद्यमान (विचारित) - सामान्य जनसंख्या. सामान्य जनसंख्या परिमित हो सकती है (अवलोकनों की संख्या एन = कॉन्स्ट) या अनंत ( एन =), और सामान्य आबादी का एक नमूना हमेशा सीमित संख्या में टिप्पणियों का परिणाम होता है। एक नमूना बनाने वाले प्रेक्षणों की संख्या कहलाती है नमूने का आकार. यदि नमूना आकार काफी बड़ा है n→∞) नमूना माना जाता है विशाल, अन्यथा इसे नमूना कहा जाता है सीमित मात्रा. नमूना माना जाता है छोटा, यदि, एक-आयामी यादृच्छिक चर को मापते समय, नमूना आकार 30 से अधिक नहीं होता है ( एन<= 30 ), और एक साथ मापते समय कई ( ) एक बहुआयामी अंतरिक्ष संबंध में विशेषताएं एनको से कम 10 (एन/के< 10) . नमूना प्रपत्र विविधता श्रृंखलाअगर इसके सदस्य हैं आदेश आँकड़े, यानी, यादृच्छिक चर के नमूना मान एक्सआरोही क्रम (रैंकिंग) में क्रमबद्ध हैं, विशेषता के मूल्यों को कहा जाता है विकल्प.

उदाहरण. लगभग एक ही बेतरतीब ढंग से चयनित वस्तुओं का सेट - मास्को के एक प्रशासनिक जिले के वाणिज्यिक बैंक, इस जिले के सभी वाणिज्यिक बैंकों की सामान्य आबादी से एक नमूने के रूप में माना जा सकता है, और मास्को में सभी वाणिज्यिक बैंकों की सामान्य आबादी के नमूने के रूप में माना जा सकता है। , साथ ही देश और आदि में वाणिज्यिक बैंकों का एक नमूना।

बुनियादी नमूनाकरण विधियां

सांख्यिकीय निष्कर्षों की विश्वसनीयता और परिणामों की सार्थक व्याख्या इस पर निर्भर करती है: प्रातिनिधिकतानमूने, यानी सामान्य जनसंख्या के गुणों के प्रतिनिधित्व की पूर्णता और पर्याप्तता, जिसके संबंध में इस नमूने को प्रतिनिधि माना जा सकता है। जनसंख्या के सांख्यिकीय गुणों का अध्ययन दो प्रकार से आयोजित किया जा सकता है: निरंतरऔर असंतत। निरंतर अवलोकनसभी की परीक्षा शामिल है इकाइयोंअध्ययन समुच्चय, ए गैर-निरंतर (चयनात्मक) अवलोकन- इसके केवल हिस्से।

नमूनाकरण को व्यवस्थित करने के पांच मुख्य तरीके हैं:

1. सरल यादृच्छिक चयन, जिसमें वस्तुओं को वस्तुओं की सामान्य आबादी (उदाहरण के लिए, एक तालिका या एक यादृच्छिक संख्या जनरेटर का उपयोग करके) से यादृच्छिक रूप से चुना जाता है, और प्रत्येक संभावित नमूने की समान संभावना होती है। ऐसे नमूने कहलाते हैं वास्तव में यादृच्छिक;

2. एक नियमित प्रक्रिया के माध्यम से सरल चयनएक यांत्रिक घटक का उपयोग करके किया जाता है (उदाहरण के लिए, तिथियां, सप्ताह के दिन, अपार्टमेंट नंबर, वर्णमाला के अक्षर, आदि) और इस तरह से प्राप्त नमूनों को कहा जाता है यांत्रिक;

3. विभक्त हो गयाचयन में यह तथ्य शामिल है कि आयतन की सामान्य जनसंख्या को आयतन के उपसमुच्चय या परतों (स्तर) में विभाजित किया जाता है ताकि . सांख्यिकीय विशेषताओं के संदर्भ में स्ट्रेट सजातीय वस्तुएं हैं (उदाहरण के लिए, जनसंख्या को आयु समूह या सामाजिक वर्ग द्वारा स्तर में विभाजित किया जाता है; उद्योग द्वारा उद्यम)। इस मामले में, नमूनों को कहा जाता है विभक्त हो गया(अन्यथा, स्तरीकृत, विशिष्ट, ज़ोनड);

4. तरीके धारावाहिकचयन बनाने के लिए उपयोग किया जाता है धारावाहिकया नेस्टेड नमूने. वे सुविधाजनक हैं यदि एक बार में "ब्लॉक" या वस्तुओं की एक श्रृंखला की जांच करना आवश्यक है (उदाहरण के लिए, माल की एक खेप, एक निश्चित श्रृंखला के उत्पाद, या देश के क्षेत्रीय-प्रशासनिक विभाजन में आबादी)। श्रृंखला का चयन यादृच्छिक या यांत्रिक तरीके से किया जा सकता है। उसी समय, माल के एक निश्चित बैच, या एक संपूर्ण क्षेत्रीय इकाई (एक आवासीय भवन या एक चौथाई) का निरंतर सर्वेक्षण किया जाता है;

5. संयुक्त(चरणबद्ध) चयन एक साथ कई चयन विधियों को जोड़ सकता है (उदाहरण के लिए, स्तरीकृत और यादृच्छिक या यादृच्छिक और यांत्रिक); ऐसा नमूना कहा जाता है संयुक्त.

चयन प्रकार

द्वारा मनव्यक्तिगत, समूह और संयुक्त चयन हैं। पर व्यक्तिगत चयनसामान्य जनसंख्या की अलग-अलग इकाइयों को नमूना सेट में चुना जाता है, जिसमें समूह चयनइकाइयों के गुणात्मक रूप से सजातीय समूह (श्रृंखला) हैं, और संयुक्त चयनपहले और दूसरे प्रकार का संयोजन शामिल है।

द्वारा तरीकाचयन भेद दोहराया और गैर-दोहरावनमूना।

बेजोड़चयन कहा जाता है, जिसमें नमूने में गिरने वाली इकाई मूल आबादी में वापस नहीं आती है और आगे के चयन में भाग नहीं लेती है; जबकि सामान्य जनसंख्या की इकाइयों की संख्या एनचयन प्रक्रिया के दौरान कम पर दोहराया गयाचयन पकड़े गएनमूने में, पंजीकरण के बाद इकाई सामान्य आबादी को वापस कर दी जाती है और इस प्रकार आगे की चयन प्रक्रिया में उपयोग किए जाने के लिए अन्य इकाइयों के साथ समान अवसर बरकरार रखती है; जबकि सामान्य जनसंख्या की इकाइयों की संख्या एनअपरिवर्तित रहता है (सामाजिक-आर्थिक अध्ययन में इस पद्धति का उपयोग शायद ही कभी किया जाता है)। हालांकि, एक बड़े . के साथ एन (एन → )के लिए सूत्र न दोहराया गयाचयन उनके लिए करीब हैं दोहराया गयाचयन और बाद वाले लगभग अधिक बार उपयोग किए जाते हैं ( एन = कॉन्स्ट).

सामान्य और नमूना जनसंख्या के मापदंडों की मुख्य विशेषताएं

अध्ययन के सांख्यिकीय निष्कर्षों का आधार एक यादृच्छिक चर का वितरण है, जबकि देखे गए मान (एक्स 1, एक्स 2, ..., एक्स एन)यादृच्छिक चर की प्राप्ति कहलाती है एक्स(एन नमूना आकार है)। सामान्य जनसंख्या में एक यादृच्छिक चर का वितरण सैद्धांतिक, प्रकृति में आदर्श है, और इसका नमूना एनालॉग है प्रयोगसिद्धवितरण। कुछ सैद्धांतिक वितरण विश्लेषणात्मक रूप से दिए गए हैं, अर्थात। उन्हें विकल्पयादृच्छिक चर के संभावित मानों के स्थान में प्रत्येक बिंदु पर वितरण फ़ंक्शन का मान निर्धारित करें। एक नमूने के लिए, वितरण फ़ंक्शन को निर्धारित करना कठिन और कभी-कभी असंभव होता है, इसलिए विकल्पअनुभवजन्य डेटा से अनुमान लगाया जाता है, और फिर उन्हें सैद्धांतिक वितरण का वर्णन करने वाले एक विश्लेषणात्मक अभिव्यक्ति में प्रतिस्थापित किया जाता है। इस मामले में, धारणा (या परिकल्पना) वितरण के प्रकार के बारे में सांख्यिकीय रूप से सही और गलत दोनों हो सकते हैं। लेकिन किसी भी मामले में, नमूने से खंगाला गया अनुभवजन्य वितरण केवल वास्तविक रूप से ही सही है। सबसे महत्वपूर्ण वितरण पैरामीटर हैं अपेक्षित मूल्यऔर फैलाव।

उनके स्वभाव से, वितरण हैं निरंतरऔर अलग. सबसे अच्छा ज्ञात निरंतर वितरण है सामान्य. मापदंडों के चयनात्मक एनालॉग और इसके लिए हैं: माध्य मान और अनुभवजन्य विचरण। सामाजिक-आर्थिक अध्ययनों में असतत में, सबसे अधिक इस्तेमाल किया जाने वाला वैकल्पिक (द्विभाजित)वितरण। इस वितरण का अपेक्षा पैरामीटर सापेक्ष मूल्य (या .) को व्यक्त करता है साझा करना) जनसंख्या की इकाइयाँ जिनमें अध्ययन के तहत विशेषता है (यह पत्र द्वारा इंगित किया गया है); जिस जनसंख्या में यह विशेषता नहीं है उसका अनुपात पत्र द्वारा निरूपित किया जाता है क्यू (क्यू = 1 - पी). वैकल्पिक वितरण के विचरण में एक अनुभवजन्य एनालॉग भी होता है।

वितरण के प्रकार और जनसंख्या इकाइयों के चयन की विधि के आधार पर, वितरण मापदंडों की विशेषताओं की गणना अलग तरह से की जाती है। सैद्धांतिक और अनुभवजन्य वितरण के लिए मुख्य तालिका में दिए गए हैं। 9.1.

नमूना शेयर कश्मीर nनमूना जनसंख्या की इकाइयों की संख्या का सामान्य जनसंख्या की इकाइयों की संख्या से अनुपात है:

के एन = एन / एन.

नमूना शेयर डब्ल्यूउन इकाइयों का अनुपात है जिनका अध्ययन किया जा रहा है एक्सनमूना आकार के लिए एन:

डब्ल्यू = एन एन / एन.

उदाहरण। 5% नमूने के साथ 1000 इकाइयों वाले माल के एक बैच में नमूना अंश k nनिरपेक्ष मूल्य में 50 इकाइयाँ हैं। (एन = एन * 0.05); यदि इस नमूने में 2 दोषपूर्ण उत्पाद पाए जाते हैं, तो नमूना अंश डब्ल्यू 0.04 (w = 2/50 = 0.04 या 4%) होगा।

चूँकि प्रतिदर्श जनसंख्या सामान्य जनसंख्या से भिन्न होती है, इसलिए नमूना त्रुटि.

तालिका 9.1 सामान्य और नमूना आबादी के मुख्य पैरामीटर

नमूनाकरण त्रुटियां

किसी भी (ठोस और चयनात्मक) त्रुटियों के साथ दो प्रकार की त्रुटियां हो सकती हैं: पंजीकरण और प्रतिनिधित्व। गलतियां पंजीकरणहो सकता है अनियमितऔर व्यवस्थितचरित्र। अनियमितत्रुटियां कई अलग-अलग अनियंत्रित कारणों से बनी होती हैं, प्रकृति में अनजाने में होती हैं, और आमतौर पर संयोजन में एक दूसरे को संतुलित करती हैं (उदाहरण के लिए, कमरे में तापमान में उतार-चढ़ाव के कारण उपकरण रीडिंग में परिवर्तन)।

व्यवस्थितत्रुटियां पक्षपाती हैं, क्योंकि वे नमूने में वस्तुओं के चयन के नियमों का उल्लंघन करते हैं (उदाहरण के लिए, माप उपकरण की सेटिंग बदलते समय माप में विचलन)।

उदाहरण।शहर में जनसंख्या की सामाजिक स्थिति का आकलन करने के लिए 25% परिवारों की जांच करने की योजना है। यदि, हालांकि, प्रत्येक चौथे अपार्टमेंट का चयन इसकी संख्या पर आधारित है, तो केवल एक प्रकार के सभी अपार्टमेंट (उदाहरण के लिए, एक कमरे के अपार्टमेंट) के चयन का खतरा है, जो एक व्यवस्थित त्रुटि पेश करेगा और परिणामों को विकृत करेगा; बहुत से अपार्टमेंट नंबर का चुनाव अधिक बेहतर है, क्योंकि त्रुटि यादृच्छिक होगी।

प्रतिनिधित्व त्रुटियाँकेवल चयनात्मक अवलोकन में निहित, उन्हें टाला नहीं जा सकता है और वे इस तथ्य के परिणामस्वरूप उत्पन्न होते हैं कि नमूना पूरी तरह से सामान्य को पुन: पेश नहीं करता है। नमूने से प्राप्त संकेतकों के मान सामान्य जनसंख्या (या निरंतर अवलोकन के दौरान प्राप्त) में समान मूल्यों के संकेतकों से भिन्न होते हैं।

नमूनाकरण त्रुटिसामान्य जनसंख्या में पैरामीटर के मूल्य और उसके नमूना मूल्य के बीच का अंतर है। एक मात्रात्मक विशेषता के औसत मूल्य के लिए, यह बराबर है: , और शेयर के लिए (वैकल्पिक विशेषता) -।

नमूनाकरण त्रुटियां केवल नमूना टिप्पणियों में निहित हैं। ये त्रुटियाँ जितनी बड़ी होती हैं, उतना ही अधिक अनुभवजन्य वितरण सैद्धांतिक से भिन्न होता है। अनुभवजन्य वितरण के पैरामीटर और यादृच्छिक चर हैं, इसलिए, नमूना त्रुटियां भी यादृच्छिक चर हैं, वे विभिन्न नमूनों के लिए अलग-अलग मान ले सकते हैं, और इसलिए यह गणना करने के लिए प्रथागत है औसत त्रुटि.

औसत नमूना त्रुटिगणितीय अपेक्षा से नमूना माध्य के मानक विचलन को व्यक्त करने वाला मान है। यह मान, यादृच्छिक चयन के सिद्धांत के अधीन, मुख्य रूप से नमूना आकार और विशेषता की भिन्नता की डिग्री पर निर्भर करता है: विशेषता की भिन्नता जितनी अधिक और छोटी होती है (इसलिए, का मूल्य), का मूल्य उतना ही छोटा होता है औसत नमूना त्रुटि। सामान्य और नमूना आबादी के भिन्नताओं के बीच का अनुपात सूत्र द्वारा व्यक्त किया जाता है:

वे। पर्याप्त रूप से बड़े के लिए, हम मान सकते हैं कि . औसत नमूना त्रुटि सामान्य जनसंख्या के पैरामीटर से नमूना आबादी के पैरामीटर के संभावित विचलन को दर्शाती है। तालिका में। 9.2 प्रेक्षण को व्यवस्थित करने के विभिन्न तरीकों के लिए औसत नमूना त्रुटि की गणना के लिए व्यंजक दिखाता है।

तालिका 9.2 विभिन्न नमूना प्रकारों के लिए नमूना माध्य और अनुपात की औसत त्रुटि (एम)

एक सतत सुविधा के लिए इंट्राग्रुप नमूना भिन्नता का औसत कहां है;

शेयर के अंतर-समूह फैलाव का औसत;

— चयनित श्रृंखला की संख्या, — श्रृंखला की कुल संख्या;

,

श्रृंखला का औसत कहाँ है;

- एक सतत सुविधा के लिए पूरे नमूने पर सामान्य औसत;

,

वें श्रृंखला में विशेषता का अनुपात कहां है;

- पूरे नमूने पर विशेषता का कुल हिस्सा।

हालांकि, औसत त्रुटि के परिमाण को केवल एक निश्चित संभावना Р (Р 1) के साथ ही आंका जा सकता है। ल्यपुनोव ए.एम. यह साबित कर दिया कि नमूना का वितरण मतलब है, और इसलिए सामान्य औसत से उनका विचलन, पर्याप्त बड़ी संख्या के साथ, सामान्य वितरण कानून का लगभग पालन करता है, बशर्ते कि सामान्य आबादी का एक सीमित माध्य और सीमित भिन्नता हो।

गणितीय रूप से, माध्य के लिए यह कथन इस प्रकार व्यक्त किया जाता है:

और भिन्न के लिए, व्यंजक (1) का रूप लेगा:

कहाँ पे - वहाँ है सीमांत नमूना त्रुटि, जो औसत नमूनाकरण त्रुटि का गुणज है , और बहुलता कारक छात्र की कसौटी ("आत्मविश्वास कारक") है, जिसे डब्ल्यू.एस. द्वारा प्रस्तावित किया गया है। गॉसेट (छद्म नाम "छात्र"); विभिन्न नमूना आकारों के मान एक विशेष तालिका में संग्रहीत किए जाते हैं।

t के कुछ मानों के लिए फंक्शन Ф(t) के मान हैं:

इसलिए, व्यंजक (3) को इस प्रकार पढ़ा जा सकता है: प्रायिकता के साथ पी = 0.683 (68.3%)यह तर्क दिया जा सकता है कि नमूना और सामान्य माध्य के बीच का अंतर माध्य त्रुटि के एक मान से अधिक नहीं होगा एम (टी = 1), संभावना के साथ पी = 0.954 (95.4%)— कि यह दो माध्य त्रुटियों के मान से अधिक न हो एम (टी = 2),संभावना के साथ पी = 0.997 (99.7%)- तीन मानों से अधिक नहीं होगा एम (टी = 3)।इस प्रकार, इस अंतर के माध्य त्रुटि के मान से तीन गुना अधिक होने की प्रायिकता निर्धारित करती है त्रुटि स्तरऔर से अधिक नहीं है 0,3% .

तालिका में। सीमांत नमूनाकरण त्रुटि की गणना के लिए 9.3 सूत्र दिए गए हैं।

तालिका 9.3 विभिन्न प्रकार के नमूने के लिए औसत और अनुपात (पी) के लिए सीमांत नमूनाकरण त्रुटि (डी)

जनसंख्या के लिए नमूना परिणाम का विस्तार

नमूना अवलोकन का अंतिम लक्ष्य सामान्य जनसंख्या को चिह्नित करना है। छोटे नमूना आकारों के लिए, मापदंडों ( और ) के अनुभवजन्य अनुमान उनके वास्तविक मूल्यों ( और ) से महत्वपूर्ण रूप से विचलित हो सकते हैं। इसलिए, उन सीमाओं को स्थापित करना आवश्यक हो जाता है जिनके भीतर पैरामीटर (और) के नमूना मूल्यों के लिए सही मान (और) निहित हैं।

विश्वास अंतरालसामान्य जनसंख्या के कुछ पैरामीटर θ को इस पैरामीटर के मानों की एक यादृच्छिक श्रेणी कहा जाता है, जिसकी संभावना 1 के करीब होती है ( विश्वसनीयता) में इस पैरामीटर का सही मान होता है।

सीमांत त्रुटिनमूने Δ आपको सामान्य जनसंख्या की विशेषताओं के सीमा मूल्यों को निर्धारित करने की अनुमति देता है और उनके विश्वास अंतराल, जो इसके बराबर हैं:

जमीनी स्तर विश्वास अंतरालघटाकर प्राप्त किया गया सीमांत त्रुटिनमूना माध्य (शेयर) से, और शीर्ष एक को जोड़कर।

विश्वास अंतरालमाध्य के लिए, यह सीमांत नमूना त्रुटि का उपयोग करता है और किसी दिए गए आत्मविश्वास के स्तर को सूत्र द्वारा निर्धारित किया जाता है:

इसका मतलब है कि दी गई संभावना के साथ आर, जिसे आत्मविश्वास का स्तर कहा जाता है और विशिष्ट रूप से मूल्य द्वारा निर्धारित किया जाता है टी, यह तर्क दिया जा सकता है कि माध्य का सही मूल्य से सीमा में निहित है , और शेयर का सही मूल्य की सीमा में है

तीन मानक आत्मविश्वास स्तरों के लिए विश्वास अंतराल की गणना करते समय पी=95%, पी=99% और पी=99.9%मूल्य द्वारा चुना जाता है। स्वतंत्रता की डिग्री की संख्या के आधार पर आवेदन। यदि नमूना आकार काफी बड़ा है, तो इन संभावनाओं के अनुरूप मान टीबराबर हैं: 1,96, 2,58 और 3,29 . इस प्रकार, सीमांत नमूनाकरण त्रुटि हमें सामान्य जनसंख्या की विशेषताओं और उनके आत्मविश्वास अंतराल के सीमांत मूल्यों को निर्धारित करने की अनुमति देती है:

सामाजिक-आर्थिक अध्ययनों में सामान्य आबादी के लिए चयनात्मक अवलोकन के परिणामों के वितरण की अपनी विशेषताएं हैं, क्योंकि इसके लिए इसके सभी प्रकारों और समूहों के प्रतिनिधित्व की पूर्णता की आवश्यकता होती है। इस तरह के वितरण की संभावना का आधार गणना है रिश्तेदारों की गलती:

कहाँ पे Δ % - सापेक्ष सीमांत नमूना त्रुटि; ,।

नमूना अवलोकन को जनसंख्या तक विस्तारित करने की दो मुख्य विधियाँ हैं: प्रत्यक्ष रूपांतरण और गुणांक की विधि.

सार प्रत्यक्ष रूपांतरणजनसंख्या के आकार से नमूना माध्य !!\overline(x) गुणा करना है।

उदाहरण. बता दें कि शहर में बच्चों की औसत संख्या का अनुमान एक नमूना विधि और एक व्यक्ति की राशि से लगाया जाता है। यदि शहर में 1000 युवा परिवार हैं, तो नगरपालिका नर्सरी में आवश्यक स्थानों की संख्या इस औसत को सामान्य जनसंख्या N = 1000 के आकार से गुणा करके प्राप्त की जाती है, अर्थात। 1200 सीट होगी।

गुणांक की विधिउस मामले में उपयोग करने की सलाह दी जाती है जब निरंतर अवलोकन के डेटा को स्पष्ट करने के लिए चयनात्मक अवलोकन किया जाता है।

ऐसा करने में, सूत्र का उपयोग किया जाता है:

जहां सभी चर जनसंख्या का आकार हैं:

आवश्यक नमूना आकार

तालिका 9.4 विभिन्न प्रकार के नमूना संगठन के लिए आवश्यक नमूना आकार (एन)

स्वीकार्य नमूना त्रुटि के पूर्व निर्धारित मूल्य के साथ एक नमूना सर्वेक्षण की योजना बनाते समय, आवश्यक का सही अनुमान लगाना आवश्यक है नमूने का आकार. यह राशि एक स्वीकार्य त्रुटि स्तर की गारंटी के आधार पर चयनात्मक अवलोकन के दौरान स्वीकार्य त्रुटि के आधार पर निर्धारित की जा सकती है (जिस तरह से अवलोकन आयोजित किया जाता है उसे ध्यान में रखते हुए)। आवश्यक नमूना आकार n निर्धारित करने के लिए सूत्र सीमांत नमूनाकरण त्रुटि के सूत्रों से सीधे आसानी से प्राप्त किए जा सकते हैं। तो, सीमांत त्रुटि के लिए अभिव्यक्ति से:

नमूना आकार सीधे निर्धारित होता है एन:

यह सूत्र दर्शाता है कि घटती सीमांत नमूना त्रुटि के साथ Δ आवश्यक नमूना आकार को महत्वपूर्ण रूप से बढ़ाता है, जो विचरण और छात्र के टी-टेस्ट के वर्ग के समानुपाती होता है।

अवलोकन को व्यवस्थित करने की एक विशिष्ट विधि के लिए, आवश्यक नमूना आकार की गणना तालिका में दिए गए सूत्रों के अनुसार की जाती है। 9.4.

व्यावहारिक गणना उदाहरण

उदाहरण 1. एक सतत मात्रात्मक विशेषता के लिए औसत मूल्य और विश्वास अंतराल की गणना।

बैंक में लेनदारों के साथ निपटान की गति का आकलन करने के लिए, 10 भुगतान दस्तावेजों का एक यादृच्छिक नमूना किया गया था। उनके मूल्य समान निकले (दिनों में): 10; 3; पंद्रह; पंद्रह; 22; 7; आठ; एक; उन्नीस; 20.

प्रायिकता के साथ आवश्यक पी = 0.954सीमांत त्रुटि निर्धारित करें Δ औसत गणना समय का नमूना माध्य और विश्वास सीमा।

फेसला।औसत मूल्य की गणना तालिका से सूत्र द्वारा की जाती है। नमूना जनसंख्या के लिए 9.1

फैलाव की गणना तालिका से सूत्र के अनुसार की जाती है। 9.1.

दिन की माध्य वर्ग त्रुटि।

माध्य की त्रुटि की गणना सूत्र द्वारा की जाती है:

वे। माध्य मान है एक्स ± एम = 12.0 ± 2.3 दिन.

माध्य की विश्वसनीयता थी

सीमित त्रुटि की गणना तालिका के सूत्र द्वारा की जाती है। 9.3 पुनर्चयन के लिए, चूंकि जनसंख्या का आकार अज्ञात है, और इसके लिए पी = 0.954आत्मविश्वास का स्तर।

इस प्रकार, माध्य मान `x ± D = `x ± 2m = 12.0 ± 4.6 है, अर्थात। इसका वास्तविक मूल्य 7.4 से 16.6 दिनों के बीच होता है।

छात्र तालिका का उपयोग। आवेदन हमें यह निष्कर्ष निकालने की अनुमति देता है कि n = 10 - 1 = 9 डिग्री स्वतंत्रता के लिए प्राप्त मूल्य एक महत्व स्तर के साथ विश्वसनीय है जो £ 0.001 है, अर्थात। परिणामी माध्य मान 0 से काफी भिन्न होता है।

उदाहरण 2. प्रायिकता का अनुमान (सामान्य हिस्सा) r.

1000 परिवारों की सामाजिक स्थिति का सर्वेक्षण करने की यांत्रिक नमूना पद्धति से यह पता चला कि निम्न आय वाले परिवारों का अनुपात था डब्ल्यू = 0.3 (30%)(नमूना था 2% , अर्थात। एन/एन = 0.02) आत्मविश्वास के स्तर के साथ आवश्यक पी = 0.997एक संकेतक परिभाषित करें आरपूरे क्षेत्र में कम आय वाले परिवार।

फेसला।प्रस्तुत फ़ंक्शन मानों के अनुसार (टी)दिए गए आत्मविश्वास के स्तर के लिए खोजें पी = 0.997अर्थ टी = 3(सूत्र 3 देखें)। सीमांत शेयर त्रुटि वूतालिका से सूत्र द्वारा निर्धारित करें। 9.3 गैर-दोहराए जाने वाले नमूने के लिए (यांत्रिक नमूनाकरण हमेशा गैर-दोहराव होता है):

सापेक्ष नमूनाकरण त्रुटि को सीमित करना % होगा:

क्षेत्र में कम आय वाले परिवारों की संभावना (सामान्य हिस्सा) होगी p=w±Δw, और विश्वास सीमा p की गणना दोहरी असमानता के आधार पर की जाती है:

डब्ल्यू - w ≤ पी ≤ डब्ल्यू - w, अर्थात। p का ​​सही मान इसके भीतर है:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

इस प्रकार, 0.997 की संभावना के साथ, यह तर्क दिया जा सकता है कि क्षेत्र के सभी परिवारों में निम्न आय वाले परिवारों का अनुपात 28.6% से 31.4% के बीच है।

उदाहरण 3अंतराल श्रृंखला द्वारा निर्दिष्ट असतत विशेषता के लिए माध्य मान और विश्वास अंतराल की गणना।

तालिका में। 9.5 उद्यम द्वारा उनके कार्यान्वयन के समय के अनुसार आदेशों के उत्पादन के लिए आवेदनों का वितरण निर्धारित है।

तालिका 9.5 घटना के समय के अनुसार प्रेक्षणों का वितरण

फेसला। औसत ऑर्डर पूरा होने के समय की गणना सूत्र द्वारा की जाती है:

औसत समय होगा:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23.1 महीने

यदि हम तालिका के अंतिम स्तंभ से p i पर डेटा का उपयोग करते हैं तो हमें वही उत्तर मिलता है। 9.5 सूत्र का उपयोग करते हुए:

ध्यान दें कि पिछले ग्रेडेशन के लिए अंतराल का मध्य कृत्रिम रूप से पिछले ग्रेडेशन के अंतराल की चौड़ाई 60 - 36 = 24 महीने के बराबर जोड़कर पाया जाता है।

फैलाव की गणना सूत्र द्वारा की जाती है

कहाँ पे एक्स मैं- अंतराल श्रृंखला के मध्य।

इसलिए !!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) और मानक त्रुटि है।

माध्य की त्रुटि की गणना सूत्र द्वारा महीनों के लिए की जाती है, अर्थात। माध्य है !!\overline(x) ± m = 23.1 ± 13.4.

सीमित त्रुटि की गणना तालिका के सूत्र द्वारा की जाती है। 9.3 पुनर्चयन के लिए क्योंकि जनसंख्या का आकार अज्ञात है, 0.954 विश्वास स्तर के लिए:

तो माध्य है:

वे। इसका वास्तविक मूल्य 0 से 50 महीने की सीमा में है।

उदाहरण 4एक वाणिज्यिक बैंक में निगम के एन = 500 उद्यमों के लेनदारों के साथ बस्तियों की गति निर्धारित करने के लिए, यादृच्छिक गैर-दोहराव चयन की विधि का उपयोग करके एक चयनात्मक अध्ययन करना आवश्यक है। आवश्यक नमूना आकार n निर्धारित करें ताकि एक संभावना के साथ P = 0.954 नमूना माध्य की त्रुटि 3 दिनों से अधिक न हो, यदि परीक्षण अनुमानों से पता चलता है कि मानक विचलन s 10 दिन था।

फेसला. आवश्यक अध्ययनों की संख्या n निर्धारित करने के लिए, हम तालिका से गैर-दोहराव चयन के लिए सूत्र का उपयोग करते हैं। 9.4:

इसमें t का मान कॉन्फिडेंस लेवल P = 0.954 के लिए से निर्धारित किया जाता है। यह 2 के बराबर है। माध्य वर्ग मान s = 10, जनसंख्या आकार N = 500, और माध्य की सीमांत त्रुटि Δ x = 3. इन मानों को सूत्र में प्रतिस्थापित करने पर, हम प्राप्त करते हैं:

वे। आवश्यक पैरामीटर का अनुमान लगाने के लिए 41 उद्यमों का एक नमूना बनाने के लिए पर्याप्त है - लेनदारों के साथ बस्तियों की गति।