प्रतिनिधि नमूना। नमूना आवश्यकताएँ

एक प्रतिदर्श समष्टि का अध्ययन करने का अंतिम लक्ष्य हमेशा जनसंख्या के बारे में जानकारी प्राप्त करना होता है। ऐसा करने के लिए, एक नमूना अध्ययन को कुछ शर्तों को पूरा करना होगा। मुख्य स्थितियों में से एक नमूने का प्रतिनिधित्व (प्रतिनिधित्व). जैसा कि पहले चर्चा की गई है, गुणात्मक और मात्रात्मक प्रतिनिधित्व के बीच अंतर किया जाता है।

यादृच्छिकता, जो सांख्यिकीय अध्ययनों की गुणात्मक (संरचनात्मक) प्रतिनिधित्व की गारंटी देती है, नमूना समूहों (सेट) के गठन के लिए कई शर्तों को पूरा करके प्राप्त की जाती है:

1. जनसंख्या के प्रत्येक सदस्य के नमूने में शामिल होने की समान संभावना होनी चाहिए।

2. अध्ययन के तहत विशेषता की परवाह किए बिना सामान्य आबादी से अवलोकन की इकाइयों का चयन किया जाना चाहिए। यदि चयन उद्देश्यपूर्ण ढंग से किया जाता है, तो अध्ययन के तहत विशेषता के वितरण की स्वतंत्रता के लिए शर्तों का पालन करना भी आवश्यक है।

3. चयन सजातीय समूहों से किया जाना चाहिए।

चयन के विशेष तरीकों द्वारा नमूने और सामान्य आबादी की अधिकतम निकटता की गारंटी देने वाली शर्तों का अनुपालन सुनिश्चित किया जाता है। गठन की विधि के आधार पर, निम्नलिखित नमूने प्रतिष्ठित हैं:

1. नमूने जिन्हें सामान्य जनसंख्या के भागों में विभाजित करने की आवश्यकता नहीं होती है (वास्तव में, यादृच्छिक दोहराया या गैर-दोहराया नमूना)।

2. नमूने जिन्हें सामान्य जनसंख्या को भागों में विभाजित करने की आवश्यकता होती है (यांत्रिक, विशिष्ट या टाइपोलॉजिकल नमूने, कोहोर्ट, युग्मित संयुग्म नमूने)।

दरअसल, एक यादृच्छिक नमूना यादृच्छिक चयन द्वारा बनाया जाता है - यादृच्छिक रूप से। यादृच्छिक चयन मिश्रण पर आधारित है। उदाहरण के लिए: सभी गेंदों को मिलाकर एक खेल लोट्टो में एक गेंद का चयन करना, जीतने वाली लॉटरी संख्या चुनना, अनुसंधान के लिए बेतरतीब ढंग से रोगी कार्ड चुनना आदि। कभी-कभी यादृच्छिक संख्याओं का उपयोग किया जाता है, यादृच्छिक संख्याओं की तालिका से प्राप्त किया जाता है या यादृच्छिक संख्या जनरेटर का उपयोग किया जाता है। इन संख्याओं के अनुसार, सामान्य जनसंख्या के पूर्व-क्रमांकित सरणी से, यादृच्छिक संख्याओं के संगत संख्याओं वाली प्रेक्षण इकाइयों का चयन किया जाता है जो गिर गई हैं।

एक यादृच्छिक नमूना संकलित करते समय, वस्तु के चयन के बाद और इसके बारे में सभी आवश्यक डेटा पंजीकृत होने के बाद, आप दो काम कर सकते हैं: वस्तु को वापस किया जा सकता है, या सामान्य आबादी को वापस नहीं किया जा सकता है। इसके बारे में नमूना दोहराया जाता है(वस्तु जनसंख्या को लौटा दी जाती है) या पुनरावृत्ति रहित(वस्तु जनसंख्या को वापस नहीं की जाती है)। चूंकि अधिकांश सांख्यिकीय अध्ययनों में दोहराए गए और गैर-दोहराए गए नमूनों के बीच व्यावहारिक रूप से कोई अंतर नहीं है, यह शर्त एक प्राथमिकता है कि नमूना दोहराया जाता है।

आवश्यक नमूना आकार का अनुमान लगाना

नमूना सामान्य जनसंख्या का मात्रात्मक रूप से प्रतिनिधि होने के लिए, पहले नमूने में शामिल किए जाने वाले डेटा की मात्रा का अनुमान लगाना आवश्यक है।

सामान्य जनसंख्या के अज्ञात आकार के साथपुन: नमूनाकरण की मात्रा जो प्रतिनिधि परिणामों की गारंटी देती है यदि परिणाम संकेतक में परिलक्षित होता है सापेक्ष मूल्य (शेयर), सूत्र द्वारा निर्धारित:

जहां पी अध्ययन के तहत विशेषता के संकेतक का मूल्य है,% में; क्यू = (100- पी) ;

t एक आत्मविश्वास गुणांक है जो दर्शाता है कि क्या संभावना है कि संकेतक का आकार सीमांत त्रुटि की सीमा से आगे नहीं जाएगा (आमतौर पर t = 2 लिया जाता है, जो त्रुटि-मुक्त पूर्वानुमान की 95% संभावना प्रदान करता है);

- संकेतक की सीमांत त्रुटि।

उदाहरण के लिए: औद्योगिक उद्यमों में श्रमिकों के स्वास्थ्य को दर्शाने वाले संकेतकों में से एक उन श्रमिकों का प्रतिशत है जो वर्ष के दौरान बीमार नहीं थे। मान लीजिए कि जिस औद्योगिक क्षेत्र से सर्वेक्षण किया गया उद्यम संबंधित है, उसके लिए यह संकेतक 25% है। सीमांत त्रुटि जिसे अनुमति दी जा सकती है ताकि संकेतक मूल्यों का प्रसार उचित सीमा से अधिक न हो, 5% है। इस मामले में, संकेतक 25% ± 5% का मान ले सकता है, अर्थात। 20% से 30% तक। t = 2 मानते हुए, हम प्राप्त करते हैं

उस मामले में, यदि संकेतक औसत मूल्य है, तो प्रेक्षणों की संख्या सूत्र द्वारा निर्धारित की जा सकती है:

जहां मानक विचलन है, जिसे पिछले अध्ययनों से या परीक्षण (पायलट) अध्ययनों के आधार पर प्राप्त किया जा सकता है।

दोहराव वाले चयन के साथऔर एक ज्ञात सामान्य आबादी की स्थिति के तहतउपयोग करने के मामले में आवश्यक यादृच्छिक नमूना आकार निर्धारित करने के लिए सापेक्ष मूल्य (शेयर)सूत्र लागू होता है:

औसत मूल्यों के लिएसूत्र का उपयोग किया जाता है:

जहाँ N सामान्य जनसंख्या का आकार है।

उपरोक्त उदाहरण की शर्तों के आधार पर और सामान्य जनसंख्या के आकार को मानते हुए एन=500 कार्यकर्ता, हमें मिलता है:

यह देखना आसान है कि गैर-दोहराव वाले नमूने के लिए आवश्यक नमूना आकार दोहराए गए नमूने (क्रमशः 188 और 300 श्रमिकों) की तुलना में कम है।

सामान्य तौर पर, प्रतिनिधि डेटा प्राप्त करने के लिए आवश्यक टिप्पणियों की संख्या अनुमत त्रुटि के वर्ग के साथ व्युत्क्रमानुपाती होती है।

यांत्रिक नमूनाकरण- नमूनाकरण, जब सर्वेक्षण की गई आबादी से यांत्रिक रूप से अवलोकन की इकाइयों का चयन किया जाता है। उदाहरण के लिए: उद्यम के कार्मिक विभाग के कार्ड के अनुसार या चिकित्सा इकाई के पॉलीक्लिनिक के आउट पेशेंट कार्ड के अनुसार हर पांचवें या हर दसवें कर्मचारी का चयन।

ठेठ, टाइपोलॉजिकलया ज़ोनडनमूनाकरण में सामान्य जनसंख्या का कई गुणात्मक रूप से सजातीय समूहों में टूटना शामिल है। उदाहरण के लिए: प्रत्येक पाठ्यक्रम में गहन परीक्षा के लिए विश्वविद्यालय के छात्रों की घटनाओं का अध्ययन करते समय, उनकी रचना में विशिष्ट छात्र समूहों का चयन किया जाता है। अक्सर इस चयन पद्धति को अन्य विधियों के साथ जोड़ा जाता है। उदाहरण के लिए: शहर के क्षेत्र को प्रदूषण की डिग्री के आधार पर विशिष्ट क्षेत्रों में विभाजित किया गया है, इन क्षेत्रों में यादृच्छिक चयन द्वारा अवलोकन समूह बनाए जाते हैं।

समूह चयनलक्षित चयन को संदर्भित करता है। इस पद्धति के साथ, व्यक्तियों को सामान्य आबादी से चुना जाता है (उपसमूहों में वितरण गैर-यादृच्छिक है), किसी भी संकेत के प्रकट होने के क्षण से एकजुट या अध्ययन में महत्वपूर्ण भूमिका निभाने वाले अध्ययन प्रभाव (जन्म का वर्ष, शुरुआत) रोग, दवा लेना, आदि)।

मामला नियंत्रण अध्ययन(एससी) एक प्रकार का महामारी विज्ञान अध्ययन है जिसमें एक जोखिम कारक के वितरण की तुलना एक बीमारी वाले रोगियों के समूह और एक नियंत्रण समूह के बीच की जाती है। अध्ययन (एससी) पूर्वव्यापी को संदर्भित करता है, क्योंकि शोधकर्ता, रोगियों को समूहों में विभाजित करता है, इस आधार पर कि उन्हें कोई बीमारी है या नहीं, उनसे अतीत की जानकारी का पता लगाता है।

जनसंख्या की सामान्य रुग्णता का अध्ययन करते समय हमें सैनिटरी सांख्यिकी में नमूना पद्धति के उपयोग पर अलग से ध्यान देना चाहिए। नमूनाकरण विधि के सैद्धांतिक परिसर का परीक्षण विशेष अध्ययन के दौरान किया गया है। तो, वी.एस. ब्यखोवस्की एट अल। 1928 में उन्होंने एक सतत विधि द्वारा और प्रत्येक पांचवें कार्ड के यांत्रिक चयन की विधि द्वारा रोगों पर डेटा के साथ 132.8 हजार कार्डों का समानांतर प्रसंस्करण किया। इस प्रसंस्करण के परिणामों के विश्लेषण ने रुग्णता के चयनात्मक अध्ययन से डेटा की उच्च प्रतिनिधित्वशीलता दिखाई। हालांकि, आज तक, व्यापक अभ्यास में चयनात्मक स्वच्छता-सांख्यिकीय अध्ययन करने के लिए कोई एकीकृत पद्धतिगत दृष्टिकोण नहीं हैं।

जनसंख्या- इकाइयों का एक समूह जिसमें बड़े पैमाने पर चरित्र, विशिष्टता, गुणात्मक एकरूपता और भिन्नता की उपस्थिति होती है।

सांख्यिकीय आबादी में भौतिक रूप से मौजूदा वस्तुएं (कर्मचारी, उद्यम, देश, क्षेत्र) शामिल हैं, एक वस्तु है।

जनसंख्या इकाई- सांख्यिकीय जनसंख्या की प्रत्येक विशिष्ट इकाई।

एक और एक ही सांख्यिकीय आबादी एक विशेषता में सजातीय और दूसरे में विषम हो सकती है।

गुणात्मक एकरूपता- किसी भी विशेषता के लिए जनसंख्या की सभी इकाइयों की समानता और बाकी सभी के लिए असमानता।

एक सांख्यिकीय जनसंख्या में, जनसंख्या की एक इकाई और दूसरी के बीच का अंतर अक्सर मात्रात्मक प्रकृति का होता है। जनसंख्या की विभिन्न इकाइयों की विशेषता के मूल्यों में मात्रात्मक परिवर्तन को भिन्नता कहा जाता है।

फ़ीचर भिन्नता- जनसंख्या की एक इकाई से दूसरी इकाई में संक्रमण के दौरान एक संकेत (मात्रात्मक संकेत के लिए) का मात्रात्मक परिवर्तन।

संकेत- यह इकाइयों, वस्तुओं और घटनाओं की एक संपत्ति, विशेषता या अन्य विशेषता है जिसे देखा या मापा जा सकता है। संकेतों को मात्रात्मक और गुणात्मक में विभाजित किया गया है। जनसंख्या की अलग-अलग इकाइयों में एक विशेषता के मूल्य की विविधता और परिवर्तनशीलता को कहा जाता है उतार-चढ़ाव.

गुणकारी (गुणात्मक) विशेषताएं मात्रात्मक नहीं हैं (सेक्स द्वारा जनसंख्या की संरचना)। मात्रात्मक विशेषताओं में एक संख्यात्मक अभिव्यक्ति होती है (आयु के अनुसार जनसंख्या की संरचना)।

सूचक- यह समय और स्थान की विशिष्ट परिस्थितियों में उद्देश्य के लिए इकाइयों या समुच्चय की किसी भी संपत्ति की मात्रात्मक और गुणात्मक विशेषता है।

उपलब्धिःसंकेतकों का एक समूह है जो अध्ययन के तहत घटना को व्यापक रूप से दर्शाता है।

उदाहरण के लिए, वेतन पर विचार करें:
  • साइन - मजदूरी
  • सांख्यिकीय जनसंख्या - सभी कर्मचारी
  • जनसंख्या की इकाई प्रत्येक कार्यकर्ता है
  • गुणात्मक एकरूपता - अर्जित वेतन
  • फ़ीचर भिन्नता - संख्याओं की एक श्रृंखला

सामान्य जनसंख्या और उसका नमूना

आधार एक या अधिक सुविधाओं को मापने के परिणामस्वरूप प्राप्त आंकड़ों का एक समूह है। वस्तुओं का वास्तव में देखा गया सेट, एक यादृच्छिक चर के अवलोकनों की एक श्रृंखला द्वारा सांख्यिकीय रूप से दर्शाया गया है, है नमूना, और काल्पनिक रूप से विद्यमान (विचारित) - सामान्य जनसंख्या. सामान्य जनसंख्या परिमित हो सकती है (अवलोकनों की संख्या एन = कॉन्स्ट) या अनंत ( एन =), और सामान्य आबादी का एक नमूना हमेशा सीमित संख्या में टिप्पणियों का परिणाम होता है। एक नमूना बनाने वाले प्रेक्षणों की संख्या कहलाती है नमूने का आकार. यदि नमूना आकार काफी बड़ा है n→∞) नमूना माना जाता है विशाल, अन्यथा इसे नमूना कहा जाता है सीमित मात्रा. नमूना माना जाता है छोटा, यदि, एक-आयामी यादृच्छिक चर को मापते समय, नमूना आकार 30 से अधिक नहीं होता है ( एन<= 30 ), और एक साथ मापते समय कई ( ) एक बहुआयामी अंतरिक्ष संबंध में विशेषताएं एनको से कम 10 (एन/के< 10) . नमूना प्रपत्र विविधता श्रृंखलाअगर इसके सदस्य हैं आदेश आँकड़े, यानी, यादृच्छिक चर के नमूना मान एक्सआरोही क्रम (रैंकिंग) में क्रमबद्ध हैं, विशेषता के मूल्यों को कहा जाता है विकल्प.

उदाहरण. लगभग एक ही बेतरतीब ढंग से चयनित वस्तुओं का सेट - मास्को के एक प्रशासनिक जिले के वाणिज्यिक बैंक, इस जिले के सभी वाणिज्यिक बैंकों की सामान्य आबादी से एक नमूने के रूप में माना जा सकता है, और मास्को में सभी वाणिज्यिक बैंकों की सामान्य आबादी के नमूने के रूप में माना जा सकता है। , साथ ही देश और आदि में वाणिज्यिक बैंकों का एक नमूना।

बुनियादी नमूनाकरण विधियां

सांख्यिकीय निष्कर्षों की विश्वसनीयता और परिणामों की सार्थक व्याख्या इस पर निर्भर करती है: प्रातिनिधिकतानमूने, यानी सामान्य जनसंख्या के गुणों की प्रस्तुति की पूर्णता और पर्याप्तता, जिसके संबंध में इस नमूने को प्रतिनिधि माना जा सकता है। जनसंख्या के सांख्यिकीय गुणों का अध्ययन दो प्रकार से आयोजित किया जा सकता है: निरंतरऔर असंतत। निरंतर अवलोकनसभी की परीक्षा शामिल है इकाइयोंअध्ययन समुच्चय, ए गैर-निरंतर (चयनात्मक) अवलोकन- इसके केवल हिस्से।

नमूनाकरण को व्यवस्थित करने के पांच मुख्य तरीके हैं:

1. सरल यादृच्छिक चयन, जिसमें वस्तुओं को वस्तुओं की सामान्य आबादी से बेतरतीब ढंग से निकाला जाता है (उदाहरण के लिए, एक तालिका या एक यादृच्छिक संख्या जनरेटर का उपयोग करके), और प्रत्येक संभावित नमूने की समान संभावना होती है। ऐसे नमूने कहलाते हैं वास्तव में यादृच्छिक;

2. एक नियमित प्रक्रिया के माध्यम से सरल चयनएक यांत्रिक घटक का उपयोग करके किया जाता है (उदाहरण के लिए, तिथियां, सप्ताह के दिन, अपार्टमेंट नंबर, वर्णमाला के अक्षर, आदि) और इस तरह से प्राप्त नमूनों को कहा जाता है यांत्रिक;

3. विभक्त हो गयाचयन में यह तथ्य शामिल होता है कि आयतन की सामान्य जनसंख्या को आयतन के उपसमुच्चय या परतों (स्तर) में विभाजित किया जाता है ताकि . सांख्यिकीय विशेषताओं के संदर्भ में स्ट्रेट सजातीय वस्तुएं हैं (उदाहरण के लिए, जनसंख्या को आयु समूह या सामाजिक वर्ग द्वारा स्तर में विभाजित किया जाता है; उद्योग द्वारा उद्यम)। इस मामले में, नमूनों को कहा जाता है विभक्त हो गया(अन्यथा, स्तरीकृत, विशिष्ट, ज़ोनड);

4. तरीके धारावाहिकचयन बनाने के लिए उपयोग किया जाता है धारावाहिकया नेस्टेड नमूने. वे सुविधाजनक हैं यदि एक बार में "ब्लॉक" या वस्तुओं की एक श्रृंखला की जांच करना आवश्यक है (उदाहरण के लिए, माल की एक खेप, एक निश्चित श्रृंखला के उत्पाद, या देश के क्षेत्रीय-प्रशासनिक विभाजन में जनसंख्या)। श्रृंखला का चयन यादृच्छिक या यांत्रिक तरीके से किया जा सकता है। उसी समय, माल के एक निश्चित बैच, या एक संपूर्ण क्षेत्रीय इकाई (एक आवासीय भवन या एक चौथाई) का निरंतर सर्वेक्षण किया जाता है;

5. संयुक्त(चरणबद्ध) चयन एक साथ कई चयन विधियों को जोड़ सकता है (उदाहरण के लिए, स्तरीकृत और यादृच्छिक या यादृच्छिक और यांत्रिक); ऐसा नमूना कहा जाता है संयुक्त.

चयन प्रकार

द्वारा मनव्यक्तिगत, समूह और संयुक्त चयन हैं। पर व्यक्तिगत चयनसामान्य जनसंख्या की अलग-अलग इकाइयों को नमूना सेट में चुना जाता है, जिसमें समूह चयनइकाइयों के गुणात्मक रूप से सजातीय समूह (श्रृंखला) हैं, और संयुक्त चयनपहले और दूसरे प्रकार का संयोजन शामिल है।

द्वारा तरीकाचयन भेद दोहराया और गैर-दोहरावनमूना।

बेजोड़चयन कहा जाता है, जिसमें नमूने में गिरने वाली इकाई मूल आबादी में वापस नहीं आती है और आगे के चयन में भाग नहीं लेती है; जबकि सामान्य जनसंख्या की इकाइयों की संख्या एनचयन प्रक्रिया के दौरान कम पर दोहराया गयाचयन पकड़े गएनमूने में, पंजीकरण के बाद इकाई सामान्य आबादी को वापस कर दी जाती है और इस प्रकार आगे की चयन प्रक्रिया में उपयोग किए जाने के लिए अन्य इकाइयों के साथ समान अवसर बरकरार रखती है; जबकि सामान्य जनसंख्या की इकाइयों की संख्या एनअपरिवर्तित रहता है (सामाजिक-आर्थिक अध्ययन में इस पद्धति का उपयोग शायद ही कभी किया जाता है)। हालांकि, एक बड़े . के साथ एन (एन → )के लिए सूत्र न दोहराया गयाचयन उनके लिए करीब हैं दोहराया गयाचयन और बाद वाले लगभग अधिक बार उपयोग किए जाते हैं ( एन = कॉन्स्ट).

सामान्य और नमूना जनसंख्या के मापदंडों की मुख्य विशेषताएं

अध्ययन के सांख्यिकीय निष्कर्षों का आधार एक यादृच्छिक चर का वितरण है, जबकि देखे गए मान (एक्स 1, एक्स 2, ..., एक्स एन)यादृच्छिक चर की प्राप्ति कहलाती है एक्स(एन नमूना आकार है)। सामान्य जनसंख्या में एक यादृच्छिक चर का वितरण सैद्धांतिक, प्रकृति में आदर्श है, और इसका नमूना एनालॉग है प्रयोगसिद्धवितरण। कुछ सैद्धांतिक वितरण विश्लेषणात्मक रूप से दिए गए हैं, अर्थात। उन्हें विकल्पयादृच्छिक चर के संभावित मानों के स्थान में प्रत्येक बिंदु पर वितरण फ़ंक्शन का मान निर्धारित करें। एक नमूने के लिए, वितरण फ़ंक्शन को निर्धारित करना मुश्किल और कभी-कभी असंभव होता है, इसलिए विकल्पअनुभवजन्य डेटा से अनुमान लगाया जाता है, और फिर उन्हें सैद्धांतिक वितरण का वर्णन करने वाले एक विश्लेषणात्मक अभिव्यक्ति में प्रतिस्थापित किया जाता है। इस मामले में, धारणा (या परिकल्पना) वितरण के प्रकार के बारे में सांख्यिकीय रूप से सही और गलत दोनों हो सकते हैं। लेकिन किसी भी मामले में, नमूने से खंगाला गया अनुभवजन्य वितरण केवल वास्तविक रूप से ही सही है। सबसे महत्वपूर्ण वितरण पैरामीटर हैं अपेक्षित मूल्यऔर फैलाव।

उनके स्वभाव से, वितरण हैं निरंतरऔर अलग. सबसे अच्छा ज्ञात निरंतर वितरण है सामान्य. मापदंडों के चयनात्मक एनालॉग और इसके लिए हैं: माध्य मान और अनुभवजन्य विचरण। सामाजिक-आर्थिक अध्ययनों में असतत में, सबसे अधिक इस्तेमाल किया जाता है वैकल्पिक (द्विभाजित)वितरण। इस वितरण का अपेक्षा पैरामीटर सापेक्ष मूल्य (या .) को व्यक्त करता है साझा करना) जनसंख्या की इकाइयाँ जिनमें अध्ययन के तहत विशेषता है (यह पत्र द्वारा इंगित किया गया है); जिस जनसंख्या में यह विशेषता नहीं है उसका अनुपात पत्र द्वारा निरूपित किया जाता है क्यू (क्यू = 1 - पी). वैकल्पिक वितरण के विचरण में एक अनुभवजन्य एनालॉग भी होता है।

वितरण के प्रकार और जनसंख्या इकाइयों के चयन की विधि के आधार पर, वितरण मापदंडों की विशेषताओं की गणना अलग तरह से की जाती है। सैद्धांतिक और अनुभवजन्य वितरण के लिए मुख्य तालिका में दिए गए हैं। 9.1.

नमूना शेयर कश्मीर nनमूना जनसंख्या की इकाइयों की संख्या का सामान्य जनसंख्या की इकाइयों की संख्या से अनुपात है:

के एन = एन / एन.

नमूना शेयर डब्ल्यूउन इकाइयों का अनुपात है जिनका अध्ययन किया जा रहा है एक्सनमूना आकार के लिए एन:

डब्ल्यू = एन एन / एन.

उदाहरण। 5% नमूने के साथ 1000 इकाइयों वाले माल के एक बैच में नमूना अंश k nनिरपेक्ष मूल्य में 50 इकाइयाँ हैं। (एन = एन * 0.05); यदि इस नमूने में 2 दोषपूर्ण उत्पाद पाए जाते हैं, तो नमूना अंश डब्ल्यू 0.04 (w = 2/50 = 0.04 या 4%) होगा।

चूँकि प्रतिदर्श जनसंख्या सामान्य जनसंख्या से भिन्न होती है, इसलिए नमूना त्रुटि.

तालिका 9.1 सामान्य और नमूना आबादी के मुख्य पैरामीटर

नमूनाकरण त्रुटियां

किसी भी (ठोस और चयनात्मक) त्रुटियों के साथ दो प्रकार की त्रुटियां हो सकती हैं: पंजीकरण और प्रतिनिधित्व। गलतियां पंजीकरणहो सकता है अनियमितऔर व्यवस्थितचरित्र। अनियमितत्रुटियां कई अलग-अलग अनियंत्रित कारणों से बनी होती हैं, प्रकृति में अनजाने में होती हैं, और आमतौर पर संयोजन में एक दूसरे को संतुलित करती हैं (उदाहरण के लिए, कमरे में तापमान में उतार-चढ़ाव के कारण उपकरण रीडिंग में परिवर्तन)।

व्यवस्थितत्रुटियां पक्षपाती हैं, क्योंकि वे नमूने में वस्तुओं के चयन के नियमों का उल्लंघन करते हैं (उदाहरण के लिए, माप उपकरण की सेटिंग बदलते समय माप में विचलन)।

उदाहरण।शहर में जनसंख्या की सामाजिक स्थिति का आकलन करने के लिए 25% परिवारों की जांच करने की योजना है। यदि, हालांकि, प्रत्येक चौथे अपार्टमेंट का चयन इसकी संख्या पर आधारित है, तो केवल एक प्रकार के सभी अपार्टमेंट (उदाहरण के लिए, एक कमरे के अपार्टमेंट) के चयन का खतरा है, जो एक व्यवस्थित त्रुटि पेश करेगा और परिणामों को विकृत करेगा; बहुत से अपार्टमेंट नंबर का चुनाव अधिक बेहतर है, क्योंकि त्रुटि यादृच्छिक होगी।

प्रतिनिधित्व त्रुटियाँकेवल चयनात्मक अवलोकन में निहित, उन्हें टाला नहीं जा सकता है और वे इस तथ्य के परिणामस्वरूप उत्पन्न होते हैं कि नमूना पूरी तरह से सामान्य को पुन: पेश नहीं करता है। नमूने से प्राप्त संकेतकों के मान सामान्य जनसंख्या (या निरंतर अवलोकन के दौरान प्राप्त) में समान मूल्यों के संकेतकों से भिन्न होते हैं।

नमूनाकरण त्रुटिसामान्य जनसंख्या में पैरामीटर के मूल्य और उसके नमूना मूल्य के बीच का अंतर है। एक मात्रात्मक विशेषता के औसत मूल्य के लिए, यह बराबर है: , और शेयर के लिए (वैकल्पिक विशेषता) -।

नमूनाकरण त्रुटियां केवल नमूना टिप्पणियों में निहित हैं। ये त्रुटियाँ जितनी बड़ी होती हैं, उतना ही अधिक अनुभवजन्य वितरण सैद्धांतिक से भिन्न होता है। अनुभवजन्य वितरण के पैरामीटर और यादृच्छिक चर हैं, इसलिए, नमूना त्रुटियां भी यादृच्छिक चर हैं, वे विभिन्न नमूनों के लिए अलग-अलग मान ले सकते हैं, और इसलिए यह गणना करने के लिए प्रथागत है औसत त्रुटि.

औसत नमूना त्रुटिगणितीय अपेक्षा से नमूना माध्य के मानक विचलन को व्यक्त करने वाला मान है। यह मान, यादृच्छिक चयन के सिद्धांत के अधीन, मुख्य रूप से नमूना आकार और विशेषता की भिन्नता की डिग्री पर निर्भर करता है: विशेषता की भिन्नता जितनी बड़ी और छोटी होती है (इसलिए, का मूल्य), का मूल्य उतना ही छोटा होता है औसत नमूना त्रुटि। सामान्य और नमूना आबादी के भिन्नताओं के बीच का अनुपात सूत्र द्वारा व्यक्त किया जाता है:

वे। पर्याप्त रूप से बड़े के लिए, हम मान सकते हैं कि . औसत नमूना त्रुटि सामान्य जनसंख्या के पैरामीटर से नमूना आबादी के पैरामीटर के संभावित विचलन को दर्शाती है। तालिका में। 9.2 प्रेक्षण को व्यवस्थित करने के विभिन्न तरीकों के लिए औसत नमूना त्रुटि की गणना के लिए व्यंजक दिखाता है।

तालिका 9.2 विभिन्न नमूना प्रकारों के लिए नमूना माध्य और अनुपात की औसत त्रुटि (एम)

एक सतत सुविधा के लिए इंट्राग्रुप नमूना भिन्नता का औसत कहां है;

शेयर के अंतर-समूह फैलाव का औसत;

— चयनित श्रृंखला की संख्या, — श्रृंखला की कुल संख्या;

,

श्रृंखला का औसत कहाँ है;

- एक सतत सुविधा के लिए पूरे नमूने पर सामान्य औसत;

,

वें श्रृंखला में विशेषता का अनुपात कहां है;

- पूरे नमूने पर विशेषता का कुल हिस्सा।

हालांकि, औसत त्रुटि के परिमाण को केवल एक निश्चित संभावना Р (Р 1) के साथ ही आंका जा सकता है। ल्यपुनोव ए.एम. यह साबित कर दिया कि नमूना का वितरण मतलब है, और इसलिए सामान्य औसत से उनका विचलन, पर्याप्त बड़ी संख्या के साथ, सामान्य वितरण कानून का लगभग पालन करता है, बशर्ते कि सामान्य आबादी का एक सीमित माध्य और सीमित भिन्नता हो।

गणितीय रूप से, माध्य के लिए यह कथन इस प्रकार व्यक्त किया जाता है:

और भिन्न के लिए, व्यंजक (1) का रूप लेगा:

कहाँ पे - वहाँ है सीमांत नमूना त्रुटि, जो औसत नमूनाकरण त्रुटि का गुणज है , और बहुलता कारक छात्र की कसौटी ("आत्मविश्वास कारक") है, जिसे डब्ल्यू.एस. द्वारा प्रस्तावित किया गया है। गॉसेट (छद्म नाम "छात्र"); विभिन्न नमूना आकारों के मान एक विशेष तालिका में संग्रहीत किए जाते हैं।

t के कुछ मानों के लिए फंक्शन Ф(t) के मान हैं:

इसलिए, व्यंजक (3) को इस प्रकार पढ़ा जा सकता है: प्रायिकता के साथ पी = 0.683 (68.3%)यह तर्क दिया जा सकता है कि नमूना और सामान्य माध्य के बीच का अंतर माध्य त्रुटि के एक मान से अधिक नहीं होगा एम (टी = 1), संभावना के साथ पी = 0.954 (95.4%)— कि यह दो माध्य त्रुटियों के मान से अधिक न हो एम (टी = 2),संभावना के साथ पी = 0.997 (99.7%)- तीन मानों से अधिक नहीं होगा एम (टी = 3)।इस प्रकार, इस अंतर के माध्य त्रुटि के मान से तीन गुना अधिक होने की प्रायिकता निर्धारित करती है त्रुटि स्तरऔर से अधिक नहीं है 0,3% .

तालिका में। सीमांत नमूनाकरण त्रुटि की गणना के लिए 9.3 सूत्र दिए गए हैं।

तालिका 9.3 विभिन्न प्रकार के नमूने के लिए औसत और अनुपात (पी) के लिए सीमांत नमूनाकरण त्रुटि (डी)

जनसंख्या के लिए नमूना परिणाम का विस्तार

नमूना अवलोकन का अंतिम लक्ष्य सामान्य जनसंख्या को चिह्नित करना है। छोटे नमूना आकारों के लिए, मापदंडों ( और ) के अनुभवजन्य अनुमान उनके वास्तविक मूल्यों ( और ) से महत्वपूर्ण रूप से विचलित हो सकते हैं। इसलिए, उन सीमाओं को स्थापित करना आवश्यक हो जाता है जिनके भीतर पैरामीटर (और) के नमूना मूल्यों के लिए सही मान (और) निहित हैं।

विश्वास अंतरालसामान्य जनसंख्या के कुछ पैरामीटर θ को इस पैरामीटर के मानों की एक यादृच्छिक श्रेणी कहा जाता है, जिसकी संभावना 1 के करीब होती है ( विश्वसनीयता) में इस पैरामीटर का सही मान होता है।

सीमांत त्रुटिनमूने Δ आपको सामान्य जनसंख्या की विशेषताओं के सीमा मूल्यों को निर्धारित करने की अनुमति देता है और उनके विश्वास अंतराल, जो इसके बराबर हैं:

जमीनी स्तर विश्वास अंतरालघटाकर प्राप्त किया गया सीमांत त्रुटिनमूना माध्य (शेयर) से, और शीर्ष एक को जोड़कर।

विश्वास अंतरालमाध्य के लिए, यह सीमांत नमूना त्रुटि का उपयोग करता है और किसी दिए गए आत्मविश्वास के स्तर को सूत्र द्वारा निर्धारित किया जाता है:

इसका मतलब है कि दी गई संभावना के साथ आर, जिसे आत्मविश्वास का स्तर कहा जाता है और विशिष्ट रूप से मूल्य द्वारा निर्धारित किया जाता है टी, यह तर्क दिया जा सकता है कि माध्य का सही मूल्य से सीमा में निहित है , और शेयर का सही मूल्य की सीमा में है

तीन मानक आत्मविश्वास स्तरों के लिए विश्वास अंतराल की गणना करते समय पी=95%, पी=99% और पी=99.9%मूल्य द्वारा चुना जाता है। स्वतंत्रता की डिग्री की संख्या के आधार पर आवेदन। यदि नमूना आकार काफी बड़ा है, तो इन संभावनाओं के अनुरूप मान टीबराबर हैं: 1,96, 2,58 और 3,29 . इस प्रकार, सीमांत नमूनाकरण त्रुटि हमें सामान्य जनसंख्या की विशेषताओं और उनके आत्मविश्वास अंतराल के सीमांत मूल्यों को निर्धारित करने की अनुमति देती है:

सामाजिक-आर्थिक अध्ययनों में सामान्य आबादी के लिए चयनात्मक अवलोकन के परिणामों के वितरण की अपनी विशेषताएं हैं, क्योंकि इसके लिए इसके सभी प्रकारों और समूहों के प्रतिनिधित्व की पूर्णता की आवश्यकता होती है। इस तरह के वितरण की संभावना का आधार गणना है रिश्तेदारों की गलती:

कहाँ पे Δ % - सापेक्ष सीमांत नमूना त्रुटि; ,।

नमूना अवलोकन को जनसंख्या तक विस्तारित करने की दो मुख्य विधियाँ हैं: प्रत्यक्ष रूपांतरण और गुणांक की विधि.

सार प्रत्यक्ष रूपांतरणजनसंख्या के आकार से नमूना माध्य !!\overline(x) गुणा करना है।

उदाहरण. बता दें कि शहर में बच्चों की औसत संख्या का अनुमान एक नमूना विधि और एक व्यक्ति की राशि से लगाया जाता है। यदि शहर में 1000 युवा परिवार हैं, तो नगरपालिका नर्सरी में आवश्यक स्थानों की संख्या इस औसत को सामान्य जनसंख्या N = 1000 के आकार से गुणा करके प्राप्त की जाती है, अर्थात। 1200 सीट होगी।

गुणांक की विधिउस मामले में उपयोग करने की सलाह दी जाती है जब निरंतर अवलोकन के डेटा को स्पष्ट करने के लिए चयनात्मक अवलोकन किया जाता है।

ऐसा करने में, सूत्र का उपयोग किया जाता है:

जहां सभी चर जनसंख्या के आकार के हैं:

आवश्यक नमूना आकार

तालिका 9.4 विभिन्न प्रकार के नमूना संगठन के लिए आवश्यक नमूना आकार (एन)

स्वीकार्य नमूना त्रुटि के पूर्व निर्धारित मूल्य के साथ एक नमूना सर्वेक्षण की योजना बनाते समय, आवश्यक का सही अनुमान लगाना आवश्यक है नमूने का आकार. यह राशि एक स्वीकार्य त्रुटि स्तर की गारंटी देने वाली दी गई संभावना के आधार पर चयनात्मक अवलोकन के दौरान स्वीकार्य त्रुटि के आधार पर निर्धारित की जा सकती है (अवलोकन के आयोजन के तरीके को ध्यान में रखते हुए)। आवश्यक नमूना आकार n निर्धारित करने के लिए सूत्र सीमांत नमूनाकरण त्रुटि के सूत्रों से सीधे आसानी से प्राप्त किए जा सकते हैं। तो, सीमांत त्रुटि के लिए अभिव्यक्ति से:

नमूना आकार सीधे निर्धारित होता है एन:

यह सूत्र दर्शाता है कि घटती सीमांत नमूना त्रुटि के साथ Δ आवश्यक नमूना आकार को महत्वपूर्ण रूप से बढ़ाता है, जो विचरण और छात्र के टी-टेस्ट के वर्ग के समानुपाती होता है।

अवलोकन को व्यवस्थित करने की एक विशिष्ट विधि के लिए, आवश्यक नमूना आकार की गणना तालिका में दिए गए सूत्रों के अनुसार की जाती है। 9.4.

व्यावहारिक गणना उदाहरण

उदाहरण 1. निरंतर मात्रात्मक विशेषता के लिए औसत मूल्य और आत्मविश्वास अंतराल की गणना।

बैंक में लेनदारों के साथ निपटान की गति का आकलन करने के लिए, 10 भुगतान दस्तावेजों का एक यादृच्छिक नमूना किया गया था। उनके मान समान निकले (दिनों में): 10; 3; पंद्रह; पंद्रह; 22; 7; आठ; एक; उन्नीस; 20.

प्रायिकता के साथ आवश्यक पी = 0.954सीमांत त्रुटि निर्धारित करें Δ औसत गणना समय का नमूना माध्य और विश्वास सीमा।

फेसला।औसत मूल्य की गणना तालिका से सूत्र द्वारा की जाती है। नमूना जनसंख्या के लिए 9.1

फैलाव की गणना तालिका से सूत्र के अनुसार की जाती है। 9.1.

दिन की माध्य वर्ग त्रुटि।

माध्य की त्रुटि की गणना सूत्र द्वारा की जाती है:

वे। माध्य मान है एक्स ± एम = 12.0 ± 2.3 दिन.

माध्य की विश्वसनीयता थी

सीमित त्रुटि की गणना तालिका के सूत्र द्वारा की जाती है। 9.3 पुनर्चयन के लिए, चूंकि जनसंख्या का आकार अज्ञात है, और इसके लिए पी = 0.954आत्मविश्वास का स्तर।

इस प्रकार, माध्य मान `x ± D = `x ± 2m = 12.0 ± 4.6 है, अर्थात। इसका वास्तविक मूल्य 7.4 से 16.6 दिनों के बीच होता है।

छात्र तालिका का उपयोग। आवेदन हमें यह निष्कर्ष निकालने की अनुमति देता है कि n = 10 - 1 = 9 डिग्री स्वतंत्रता के लिए प्राप्त मूल्य एक महत्व स्तर £ 0.001 के साथ विश्वसनीय है, अर्थात। परिणामी माध्य मान 0 से काफी भिन्न होता है।

उदाहरण 2. प्रायिकता का अनुमान (सामान्य हिस्सा) r.

1000 परिवारों की सामाजिक स्थिति का सर्वेक्षण करने की यांत्रिक नमूना पद्धति से यह पता चला कि निम्न आय वाले परिवारों का अनुपात था डब्ल्यू = 0.3 (30%)(नमूना था 2% , अर्थात। एन/एन = 0.02) आत्मविश्वास के स्तर के साथ आवश्यक पी = 0.997एक संकेतक परिभाषित करें आरपूरे क्षेत्र में कम आय वाले परिवार।

फेसला।प्रस्तुत फ़ंक्शन मानों के अनुसार (टी)किसी दिए गए आत्मविश्वास के स्तर के लिए खोजें पी = 0.997अर्थ टी = 3(सूत्र 3 देखें)। सीमांत शेयर त्रुटि वूतालिका से सूत्र द्वारा निर्धारित करें। 9.3 गैर-दोहराए जाने वाले नमूने के लिए (यांत्रिक नमूनाकरण हमेशा गैर-दोहराव होता है):

सापेक्ष नमूनाकरण त्रुटि को सीमित करना % होगा:

क्षेत्र में निम्न-आय वाले परिवारों की संभावना (सामान्य हिस्सा) होगी p=w±Δw, और विश्वास सीमा p की गणना दोहरी असमानता के आधार पर की जाती है:

डब्ल्यू - w ≤ पी ≤ डब्ल्यू - w, अर्थात। p का ​​सही मान इसके भीतर है:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

इस प्रकार, 0.997 की संभावना के साथ, यह तर्क दिया जा सकता है कि क्षेत्र के सभी परिवारों में निम्न-आय वाले परिवारों का अनुपात 28.6% से 31.4% तक है।

उदाहरण 3अंतराल श्रृंखला द्वारा निर्दिष्ट असतत विशेषता के लिए माध्य मान और विश्वास अंतराल की गणना।

तालिका में। 9.5 उद्यम द्वारा उनके कार्यान्वयन के समय के अनुसार आदेशों के उत्पादन के लिए आवेदनों का वितरण निर्धारित है।

तालिका 9.5 घटना के समय के अनुसार प्रेक्षणों का वितरण

फेसला। औसत ऑर्डर पूरा होने के समय की गणना सूत्र द्वारा की जाती है:

औसत समय होगा:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23.1 महीने

यदि हम तालिका के अंतिम स्तंभ से p i पर डेटा का उपयोग करते हैं तो हमें वही उत्तर मिलता है। 9.5 सूत्र का उपयोग करते हुए:

ध्यान दें कि पिछले ग्रेडेशन के लिए अंतराल का मध्य कृत्रिम रूप से पिछले ग्रेडेशन के अंतराल की चौड़ाई 60 - 36 = 24 महीने के बराबर जोड़कर पाया जाता है।

फैलाव की गणना सूत्र द्वारा की जाती है

कहाँ पे एक्स मैं- अंतराल श्रृंखला के मध्य।

इसलिए !!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) और मानक त्रुटि है।

माध्य की त्रुटि की गणना सूत्र द्वारा महीनों के लिए की जाती है, अर्थात। माध्य है !!\overline(x) ± m = 23.1 ± 13.4.

सीमित त्रुटि की गणना तालिका के सूत्र द्वारा की जाती है। 9.3 पुनर्चयन के लिए क्योंकि जनसंख्या का आकार अज्ञात है, 0.954 विश्वास स्तर के लिए:

तो माध्य है:

वे। इसका वास्तविक मूल्य 0 से 50 महीने की सीमा में है।

उदाहरण 4एक वाणिज्यिक बैंक में निगम के एन = 500 उद्यमों के लेनदारों के साथ बस्तियों की गति निर्धारित करने के लिए, यादृच्छिक गैर-दोहराव चयन की विधि का उपयोग करके एक चयनात्मक अध्ययन करना आवश्यक है। आवश्यक नमूना आकार n निर्धारित करें ताकि एक प्रायिकता P = 0.954 के साथ नमूना माध्य की त्रुटि 3 दिनों से अधिक न हो, यदि परीक्षण अनुमानों से पता चलता है कि मानक विचलन s 10 दिन था।

फेसला. आवश्यक अध्ययनों की संख्या n निर्धारित करने के लिए, हम तालिका से गैर-दोहराव चयन के लिए सूत्र का उपयोग करते हैं। 9.4:

इसमें t का मान कॉन्फिडेंस लेवल = 0.954 के लिए से निर्धारित किया जाता है। यह 2 के बराबर है। माध्य वर्ग मान s = 10, जनसंख्या आकार N = 500, और माध्य की सीमांत त्रुटि Δ x = 3. इन मानों को सूत्र में प्रतिस्थापित करने पर, हम प्राप्त करते हैं:

वे। आवश्यक पैरामीटर का अनुमान लगाने के लिए 41 उद्यमों का एक नमूना बनाने के लिए पर्याप्त है - लेनदारों के साथ बस्तियों की गति।

एक नमूना खोजपूर्ण विश्लेषण के लिए एक सामान्य आबादी से कुछ प्रक्रियाओं का उपयोग करके लिए गए डेटा का एक सेट है। प्रतिनिधित्व अपने हिस्से में संपूर्ण के प्रतिनिधित्व को पुन: प्रस्तुत करने की संपत्ति है। दूसरे शब्दों में, यह एक भाग के विचार को संपूर्ण तक विस्तारित करने की संभावना है, जिसमें यह भाग शामिल है।

नमूने की प्रतिनिधित्वशीलता एक संकेतक है कि नमूना पूरी तरह से और विश्वसनीय रूप से उस आबादी की विशेषताओं को प्रतिबिंबित करना चाहिए जिसका वह हिस्सा है। इसे सामान्य जनसंख्या की विशेषताओं का पूरी तरह से प्रतिनिधित्व करने के लिए नमूने की संपत्ति के रूप में भी परिभाषित किया जा सकता है जो अध्ययन के उद्देश्य के दृष्टिकोण से महत्वपूर्ण हैं।

आइए मान लें कि सामान्य जनसंख्या स्कूल के सभी छात्र हैं (30 कक्षाओं के 900 लोग, प्रत्येक कक्षा में 30 लोग)। अध्ययन का उद्देश्य स्कूली बच्चों का धूम्रपान के प्रति दृष्टिकोण है। 90 छात्रों का एक नमूना केवल पूरी आबादी का प्रतिनिधित्व करेगा जो उन्हीं 90 छात्रों के नमूने से बहुत खराब है, जिसमें प्रत्येक कक्षा के 3 छात्र शामिल होंगे। इसका मुख्य कारण उम्र के हिसाब से असमान वितरण है। इस प्रकार, पहले मामले में, नमूने की प्रतिनिधित्वशीलता कम होगी। दूसरे मामले में - उच्च।

समाजशास्त्र में, वे कहते हैं कि नमूने की एक प्रतिनिधिता और इसकी अप्रतिनिधित्व है।

एक गैर-प्रतिनिधि नमूने का एक उदाहरण एक क्लासिक मामला है जो 1936 में संयुक्त राज्य अमेरिका में राष्ट्रपति चुनाव के दौरान हुआ था।

लिटरेरी डाइजेस्ट, जो अब तक पिछले चुनावों के परिणामों की भविष्यवाणी करने में बहुत सफल रहा था, इस बार गलत था, भले ही इसने ग्राहकों के साथ-साथ उत्तरदाताओं को कई मिलियन लिखित प्रश्न भेजे, जिन्हें उन्होंने फोन बुक और कार पंजीकरण सूची से चुना था। भरे गए मतपत्रों में से 1/4 में, मतों का वितरण इस प्रकार किया गया: 57% ने रिपब्लिकन उम्मीदवार को प्राथमिकता दी, जिसका नाम अल्फ लैंडन था, और 41% ने मौजूदा डेमोक्रेट फ्रैंकलिन रूजवेल्ट को प्राथमिकता दी।

वास्तव में, एफ. रूजवेल्ट ने लगभग 60% मतों के साथ चुनाव जीता। "लिटरेरी डाइजेस्ट" त्रुटि इस प्रकार थी। वे नमूने की प्रतिनिधित्वशीलता बढ़ाना चाहते थे . और चूंकि वे जानते थे कि उनके अधिकांश ग्राहकों ने खुद को रिपब्लिकन के रूप में पहचाना है, उन्होंने फोन बुक और कार पंजीकरण सूचियों से उनके द्वारा चुने गए उत्तरदाताओं के साथ नमूने का विस्तार करने का फैसला किया। लेकिन उन्होंने मौजूदा वास्तविकताओं को ध्यान में नहीं रखा और वास्तव में रिपब्लिकन के और भी अधिक समर्थकों को चुना, क्योंकि उस समय मध्यम और उच्च वर्ग के पास कार और फोन हो सकते थे। और वे ज्यादातर रिपब्लिकन थे, डेमोक्रेट नहीं।

नमूने के विभिन्न प्रकार हैं: सरल यादृच्छिक, धारावाहिक, विशिष्ट, यांत्रिक और संयुक्त।

सरल यादृच्छिक प्रतिचयन में बिना किसी प्रणाली के अध्ययन की गई इकाइयों की पूरी आबादी से यादृच्छिक रूप से चयन करना शामिल है।

यांत्रिक नमूने का उपयोग तब किया जाता है जब सामान्य आबादी में आदेश होता है, उदाहरण के लिए, श्रमिकों की इकाइयों, चुनावी सूचियों, उत्तरदाताओं के टेलीफोन नंबर, अपार्टमेंट और घरों की संख्या आदि का एक निश्चित क्रम होता है)।

विशिष्ट चयन का उपयोग तब किया जाता है जब संपूर्ण जनसंख्या को प्रकारों के अनुसार समूहों में विभाजित किया जा सकता है। आबादी के साथ काम करते समय, ये हो सकते हैं, उदाहरण के लिए, शैक्षिक, आयु, सामाजिक समूह; उद्यमों का अध्ययन करते समय, वे एक उद्योग या एक अलग संगठन आदि हो सकते हैं।

सीरियल चयन तब उपयोगी होता है जब इकाइयों को छोटी श्रृंखला या समूहों में बांटा जाता है। ऐसी श्रृंखला तैयार उत्पादों, स्कूल कक्षाओं और अन्य समूहों के बैच हो सकती है।

संयुक्त न्यादर्शन में पिछले सभी प्रकार के न्यादर्शनों का एक या दूसरे संयोजन में उपयोग शामिल है।

नमूने के दो मुख्य प्रकार हैं: प्रतिनिधि और गैर-प्रतिनिधि।इसका क्या अर्थ है और उनके बीच अंतर करना क्यों महत्वपूर्ण है?

एक प्रतिनिधि नमूना(अंग्रेजी से, प्रतिनिधित्व - प्रतिनिधित्व करने के लिए) ऐसा है कि यह हमें उच्च-गुणवत्ता और दोनों को वितरित करने का अवसर देता है मात्रात्मकएक निश्चित बड़ी आबादी पर उसके शोध के परिणाम। जनमत सर्वेक्षणों के संदर्भ में, एक प्रतिनिधि नमूना वह है जो हमें विस्तार करने की अनुमति देता है मात्रात्मकसाक्षात्कार के परिणाम न केवल अध्ययन के प्रतिभागियों पर, बल्कि कई अन्य लोगों पर भी।

उदाहरण के लिए, एक सर्वेक्षण के आधार पर, हमने पाया कि हमारे नमूने में शामिल होने वाले उत्तरदाताओं में से 18%, यूक्रेन की वयस्क आबादी के प्रतिनिधि, की राय X है। इसलिए, हम कह सकते हैं कि यूक्रेन की लगभग 18% वयस्क आबादी की राय X है। यदि नमूना प्रतिनिधि नहीं था, तो हम केवल मान लेना:"यूक्रेन की वयस्क आबादी के अल्पसंख्यक की राय एक्स है", "एक तिहाई से भी कम की राय एक्स है", "एक चौथाई से भी कम की राय एक्स है"। लेकिन ये धारणाएँ हो सकती हैं जाँच करनाकेवल धन्यवाद प्रतिनिधिसर्वे। अतः लोगों के विचारों पर शोध करने के सन्दर्भ में एक अप्रतिनिधि नमूना भी एक नमूना है मात्रात्मकअध्ययन के परिणाम जो नहींअध्ययन में भाग लेने वालों की तुलना में अन्य लोगों के लिए बढ़ाया जा सकता है। या अधिक सामान्य: अप्रतिनिधि नमूनाकरण -यह वह है जो एक निश्चित बड़ी आबादी के लिए उसके शोध के मात्रात्मक परिणामों का विस्तार करना असंभव बनाता है।

आइए कल्पना करें कि एक गर्म गर्मी के दिन हम बाहर जाते हैं और अपने घर या कार्यालय में 10 राहगीरों से पूछते हैं कि क्या उन्हें मौसम पसंद है जैसा अभी है। 7 वे कहें जो उन्हें पसंद हैं; 1 उत्तर देने में हिचकिचाता है, 2 इंगित करता है कि उन्हें ऐसा मौसम पसंद नहीं है और वे कम तापमान पर अधिक सहज महसूस करते हैं। इस सर्वेक्षण के आधार पर हम नहींहम कह सकते हैं कि 70% लोग मौसम को पसंद करते हैं जैसा कि अभी है। और भी नहींहम कर सकते हैं होनायह सुनिश्चित करें कि अधिकांशलोगों को अभी जैसा मौसम है, वैसा ही मौसम भी पसंद आ रहा है। हम व्यक्त कर सकते हैं कल्पना,कि ज्यादातर लोग इसे पसंद करते हैं, लेकिन हम निश्चित रूप से नहीं जान सकते। वह था अप्रतिनिधिकनमूना।

नमूने के बारे में एक गलत धारणा यह है कि कोई भी बड़ा नमूना प्रतिनिधि होता है; हम जितना अधिक मतदान करते हैं, वह उतना ही अधिक प्रतिनिधि होता है। यह सच नहीं है। यदि हम 100 या 1000 लोगों का साक्षात्कार लेने तक अपना सड़क मौसम सर्वेक्षण जारी रखते हैं, तब भी हम उन लोगों के बारे में निश्चित रूप से कुछ नहीं कह सकते जिन्हें नहीं पूछा गया था। ऐसा क्यों है? क्या 100 नहीं, अकेले 1000 लोग दूसरों की प्राथमिकताओं के बारे में निश्चित निष्कर्ष निकालने के लिए पर्याप्त नहीं हैं?

तथ्य यह है कि प्रतिनिधित्व सुनिश्चित करने के लिए, न केवल उत्तरदाताओं की संख्या, बल्कि यह भी महत्वपूर्ण है कि कैसेऔर "x था चुन लिया।उपरोक्त उदाहरण में, हमने नहीं सोचा कौन, कहाँ और कैसेचुना गया, लेकिन बस राहगीरों के साथ संवाद करना शुरू कर दिया। आइए चारों ओर देखें। शायद हम स्कूल के दिन विश्वविद्यालय के पास हैं? फिर, राहगीरों के बीच, ज्यादातर युवा लोग होते हैं, जो कुल मिलाकर, वृद्ध लोगों की तुलना में अधिक आसानी से गर्मी सहन करते हैं, और इसलिए मौसम से संतुष्ट लोगों का प्रतिशत कृत्रिम रूप से अधिक हो सकता है। या शायद हम एक ऐसे स्थान पर पहुँच गए हैं जहाँ राहगीरों में वृद्ध लोग अधिक हैं, जिन्हें शायद गर्मी के दिनों की ठिठुरन सहना मुश्किल लगता है? तब बस्ती के सभी निवासियों की तुलना में मौसम से संतुष्ट लोगों के प्रतिशत को कम करके आंका जा सकता है।

प्रतिनिधि नमूना

प्रतिनिधि नमूना

एक प्रतिनिधि नमूना एक नमूना है जिसमें सामान्य जनसंख्या के समान सापेक्ष विशेषताओं का वितरण होता है।

अंग्रेजी में:प्रतिनिधि नमूना

यह सभी देखें:नमूना आबादी

फिनम वित्तीय शब्दकोश.


देखें कि "प्रतिनिधि नमूना" अन्य शब्दकोशों में क्या है:

    प्रतिनिधि नमूना- प्रतिभागियों का एक समूह जो अध्ययन के तहत आबादी की संरचना का कम या ज्यादा सटीक रूप से प्रतिनिधित्व करता है। नमूना उम्र और लिंग विशेषताओं के साथ-साथ प्रयोग के परिणाम को प्रभावित करने वाली किसी भी अन्य विशेषताओं द्वारा वितरण को प्रतिबिंबित कर सकता है ... ...

    प्रतिनिधि नमूना- — [टीकाकरण और टीकाकरण पर बुनियादी शब्दों की अंग्रेजी-रूसी शब्दावली। विश्व स्वास्थ्य संगठन, 2009] विषय वैक्सीनोलॉजी, प्रतिरक्षण EN प्रतिनिधि नमूनाकरण ... तकनीकी अनुवादक की हैंडबुक

    प्रतिनिधि नमूना- (प्रतिनिधि नमूना) एक नमूना जो (या माना जाता है) माता-पिता की आबादी का सही प्रतिबिंब है, यानी, इसकी एक ही विशेषता प्रोफ़ाइल है, उदाहरण के लिए, आयु संरचना, वर्ग संरचना, शिक्षा स्तर। प्रतिनिधि ... ... बड़ा व्याख्यात्मक समाजशास्त्रीय शब्दकोश

    प्रतिनिधि नमूना- नमूना प्रतिनिधि देखें... मनोविज्ञान का व्याख्यात्मक शब्दकोश

    प्रतिनिधि नमूना- ऐसा नमूना जिसमें सामान्य जनसंख्या की सभी मुख्य विशेषताएं, जिनसे दिया गया नमूना लिया जाता है, लगभग उसी अनुपात में या उसी आवृत्ति के साथ प्रस्तुत की जाती हैं जिसके साथ यह विशेषता इस सामान्य आबादी में दिखाई देती है ... मनोविज्ञान और शिक्षाशास्त्र का विश्वकोश शब्दकोश

    प्रतिनिधि नमूना- यह एक ऐसा नमूना है जिसमें सामान्य जनसंख्या की सभी मुख्य विशेषताएं, जिनसे यह नमूना निकाला जाता है, लगभग उसी अनुपात में या उसी आवृत्ति के साथ प्रस्तुत की जाती हैं जिसके साथ यह विशेषता इस सामान्य में दिखाई देती है ... ... समाजशास्त्रीय शब्दकोश

    प्रतिनिधि नमूना- (प्रतिनिधि नमूना)। एक नमूना जो पूरी आबादी की स्थिति और गुणों को सटीक रूप से दर्शाता है ... विकास का मनोविज्ञान। पुस्तक द्वारा शब्दकोश

    प्रतिनिधि नमूना- (प्रतिनिधि नमूना) नियमों के अनुसार बनाया गया एक नमूना, अर्थात्, इसमें शामिल विषयों की संरचना और व्यक्तिगत विशेषताओं दोनों के संदर्भ में सामान्य आबादी की बारीकियों को दर्शाता है। व्यावहारिक मनोवैज्ञानिक का शब्दकोश। मस्तूल, ... ... महान मनोवैज्ञानिक विश्वकोश

    अंग्रेज़ी नमूना, प्रतिनिधि; जर्मन स्टिचप्रोब, रिप्रेजेंटेटिव। एक नमूना जिसमें अनिवार्य रूप से जनसंख्या के रूप में सापेक्ष विशेषताओं का समान वितरण होता है। एंटीनाज़ी। समाजशास्त्र का विश्वकोश, 2009 ... समाजशास्त्र का विश्वकोश

    प्रतिनिधि नमूना एक नमूना जिसमें सापेक्ष विशेषताओं का समान वितरण होता है जैसे जनसंख्या व्यावसायिक शब्दों की शब्दावली। अकादमिक.रू. 2001 ... व्यापार शर्तों की शब्दावली