चयनात्मक अवलोकन: अवधारणा, प्रकार, नमूना त्रुटियां, परिणामों का मूल्यांकन। समस्या समाधान के उदाहरण

चयनात्मक अवलोकन के दौरान यह सुनिश्चित किया जाना चाहिए दुर्घटनाइकाई चयन. प्रत्येक इकाई को अन्य के साथ चयनित होने का समान अवसर मिलना चाहिए। यादृच्छिक नमूनाकरण इसी पर आधारित है।

को उचित यादृच्छिक नमूना संपूर्ण सामान्य जनसंख्या से इकाइयों के चयन को संदर्भित करता है (इसे किसी भी समूह में प्रारंभिक रूप से विभाजित किए बिना) लॉट (मुख्य रूप से) या किसी अन्य समान विधि को निकालकर, उदाहरण के लिए, यादृच्छिक संख्याओं की तालिका का उपयोग करके। यादृच्छिक चयनयह चयन यादृच्छिक नहीं है. यादृच्छिकता का सिद्धांत बताता है कि नमूने में किसी वस्तु का समावेश या बहिष्करण संयोग के अलावा किसी अन्य कारक से प्रभावित नहीं हो सकता है। एक उदाहरण वास्तव में यादृच्छिकचयन जीत के संचलन के रूप में कार्य कर सकता है: जारी किए गए टिकटों की कुल संख्या से, जीत के लिए जिम्मेदार संख्याओं का एक निश्चित हिस्सा यादृच्छिक रूप से चुना जाता है। इसके अलावा, सभी नंबरों को नमूने में शामिल होने का समान अवसर प्रदान किया जाता है। इस मामले में, नमूना सेट में चयनित इकाइयों की संख्या आमतौर पर नमूने के स्वीकृत अनुपात के आधार पर निर्धारित की जाती है।

नमूना साझा करें नमूना जनसंख्या की इकाइयों की संख्या और सामान्य जनसंख्या की इकाइयों की संख्या का अनुपात है:

तो, 1000 इकाइयों में भागों के एक बैच से 5% नमूने के साथ। नमूने का आकार पी 50 इकाइयाँ हैं, और 10% नमूने के साथ - 100 इकाइयाँ। वगैरह। नमूने के सही वैज्ञानिक संगठन के साथ, प्रतिनिधित्व संबंधी त्रुटियों को न्यूनतम मूल्यों तक कम किया जा सकता है, परिणामस्वरूप, चयनात्मक अवलोकन पर्याप्त रूप से सटीक हो जाता है।

उचित यादृच्छिक चयन "अपने शुद्ध रूप में" चयनात्मक अवलोकन के अभ्यास में शायद ही कभी उपयोग किया जाता है, लेकिन यह अन्य सभी प्रकार के चयन के बीच शुरुआती बिंदु है, इसमें चयनात्मक अवलोकन के बुनियादी सिद्धांतों को शामिल और कार्यान्वित किया जाता है।

आइए हम नमूनाकरण विधि के सिद्धांत और एक साधारण यादृच्छिक नमूने के त्रुटि सूत्र के कुछ प्रश्नों पर विचार करें।

आँकड़ों में नमूनाकरण पद्धति को लागू करते समय, आमतौर पर दो मुख्य प्रकार के सामान्यीकरण संकेतकों का उपयोग किया जाता है: एक मात्रात्मक विशेषता का औसत मूल्यऔर वैकल्पिक सुविधा का सापेक्ष मूल्य(सांख्यिकीय जनसंख्या में इकाइयों का अनुपात या अनुपात, जो केवल अध्ययन किए जा रहे गुण की उपस्थिति से इस जनसंख्या की अन्य सभी इकाइयों से भिन्न होता है)।

नमूना साझा करें (डब्ल्यू),या आवृत्ति, उन इकाइयों की संख्या के अनुपात से निर्धारित होती है जिनमें अध्ययन के तहत विशेषता होती है टी,नमूना इकाइयों की कुल संख्या के लिए पी:

उदाहरण के लिए, यदि 100 नमूना विवरणों में से ( एन=100), 95 भाग मानक निकले (टी=95), फिर नमूना अंश

डब्ल्यू=95/100=0,95 .

नमूना संकेतकों की विश्वसनीयता को चिह्नित करने के लिए, वहाँ हैं मध्यऔर सीमांत नमूनाकरण त्रुटि.

नमूनाकरण त्रुटि ? या, दूसरे शब्दों में, प्रतिनिधित्व त्रुटि संबंधित नमूने और सामान्य विशेषताओं के बीच का अंतर है:

*

*

नमूनाकरण त्रुटि केवल चयनात्मक अवलोकनों की विशेषता है। इस त्रुटि का मान जितना अधिक होगा, नमूना संकेतक संबंधित सामान्य संकेतकों से उतना ही अधिक भिन्न होंगे।

नमूना माध्य और नमूना शेयर स्वाभाविक रूप से हैं यादृच्छिक चर,जो नमूने में जनसंख्या की कौन सी इकाइयों को शामिल किया गया था, इसके आधार पर अलग-अलग मान ले सकते हैं। इसलिए, नमूनाकरण त्रुटियां भी यादृच्छिक चर हैं और विभिन्न मान ले सकती हैं। इसलिए, संभावित त्रुटियों का औसत निर्धारित करें - औसत नमूना त्रुटि।

यह किस पर निर्भर करता है मतलब नमूनाकरण त्रुटि?यादृच्छिक चयन के सिद्धांत के अधीन, औसत नमूनाकरण त्रुटि प्राथमिक रूप से निर्धारित की जाती है नमूने का आकार:जनसंख्या जितनी बड़ी होगी, बाकी सब समान, औसत नमूनाकरण त्रुटि उतनी ही कम होगी। सामान्य जनसंख्या की इकाइयों की बढ़ती संख्या के साथ एक नमूना सर्वेक्षण को कवर करते हुए, हम अधिक से अधिक सटीक रूप से संपूर्ण जनसंख्या का वर्णन करते हैं।

माध्य नमूनाकरण त्रुटि भी इस पर निर्भर करती है भिन्नता की डिग्रीविशेषता का अध्ययन किया. भिन्नता की डिग्री, जैसा कि आप जानते हैं, फैलाव की विशेषता है? 2 या w(1-w)-- एक वैकल्पिक सुविधा के लिए. फ़ीचर की विविधता जितनी छोटी होगी, और इसलिए भिन्नता, औसत नमूनाकरण त्रुटि उतनी ही कम होगी, और इसके विपरीत। शून्य फैलाव (विशेषता भिन्न नहीं होती) के साथ, औसत नमूनाकरण त्रुटि शून्य है, यानी, सामान्य आबादी की कोई भी इकाई इस विशेषता के अनुसार पूरी आबादी को सटीक रूप से चिह्नित करेगी।

इसकी मात्रा पर औसत नमूना त्रुटि की निर्भरता और विशेषता की भिन्नता की डिग्री उन सूत्रों में परिलक्षित होती है जिनका उपयोग नमूना अवलोकन की शर्तों के तहत औसत नमूना त्रुटि की गणना करने के लिए किया जा सकता है, जब सामान्य विशेषताएं ( एक्स, पी)अज्ञात हैं, और इसलिए, सीधे सूत्रों (प्रपत्र 1), (प्रपत्र 2) से वास्तविक नमूनाकरण त्रुटि का पता लगाना संभव नहीं है।

डब्ल्यू यादृच्छिक चयन के साथ औसत त्रुटियाँसैद्धांतिक रूप से निम्नलिखित सूत्रों द्वारा गणना की गई:

* औसत मात्रात्मक विशेषता के लिए

* शेयर के लिए (वैकल्पिक विशेषता)

चूँकि व्यावहारिक रूप से सामान्य जनसंख्या में विशेषता का विचरण होता है? 2 वास्तव में ज्ञात नहीं है, व्यवहार में वे बड़ी संख्या के कानून के आधार पर नमूना आबादी के लिए गणना किए गए विचरण एस 2 के मूल्य का उपयोग करते हैं, जिसके अनुसार पर्याप्त बड़े नमूना आकार के साथ नमूना आबादी की विशेषताओं को सटीक रूप से पुन: पेश करती है। सामान्य जनसंख्या।

इस प्रकार, गणना सूत्र मध्य नमूनाकरण त्रुटियाँ यादृच्छिक पुनः नमूनाकरण इस प्रकार होगा:

* औसत मात्रात्मक विशेषता के लिए

* शेयर के लिए (वैकल्पिक विशेषता)

हालाँकि, नमूना जनसंख्या का विचरण सामान्य जनसंख्या के विचरण के बराबर नहीं है, और इसलिए, सूत्रों (प्रपत्र 5) और (प्रपत्र 6) द्वारा गणना की गई औसत नमूना त्रुटियाँ अनुमानित होंगी। लेकिन संभाव्यता के सिद्धांत में यह सिद्ध है कि सामान्य विचरण को निम्नलिखित संबंध द्वारा ऐच्छिक के माध्यम से व्यक्त किया जाता है:

क्योंकि पी/(एन-1) पर्याप्त रूप से बड़े के लिए पी --एकता के करीब मूल्य, यह माना जा सकता है कि, और इसलिए, औसत नमूना त्रुटियों की व्यावहारिक गणना में, सूत्र (प्रपत्र 5) और (प्रपत्र 6) का उपयोग किया जा सकता है। और केवल छोटे नमूने के मामलों में (जब नमूना आकार 30 से अधिक न हो) गुणांक को ध्यान में रखना आवश्यक है पी/(एन-1) और गणना करें छोटे नमूने का मतलब त्रुटिसूत्र के अनुसार:

डब्ल्यू एक्स यादृच्छिक गैर-दोहरावीय चयन के साथ औसत नमूनाकरण त्रुटियों की गणना के लिए उपरोक्त सूत्रों में, मूल अभिव्यक्ति को 1-(n/N) से गुणा करना आवश्यक है, क्योंकि गैर-दोहरावीय नमूने की प्रक्रिया में सामान्य जनसंख्या में इकाइयों की संख्या कम हो जाती है। इसलिए, गैर-दोहराव वाले चयन के लिए गणना सूत्र माध्य नमूनाकरण त्रुटि निम्नलिखित रूप लेगा:

* औसत मात्रात्मक विशेषता के लिए

* शेयर के लिए (वैकल्पिक विशेषता)

. (प्रपत्र 10)

क्योंकि पीहमेशा कम एन, फिर अतिरिक्त कारक 1-( एन/एन) हमेशा एक से कम रहेगा. इससे यह निष्कर्ष निकलता है कि गैर-दोहरावीय चयन के साथ औसत त्रुटि हमेशा बार-बार चयन की तुलना में कम होगी। साथ ही, नमूने के अपेक्षाकृत छोटे प्रतिशत के साथ, यह कारक एक के करीब है (उदाहरण के लिए, 5% नमूने के साथ यह 0.95 है; 2% नमूने के साथ यह 0.98 है, आदि)। इसलिए, कभी-कभी व्यवहार में, निर्दिष्ट गुणक के बिना औसत नमूना त्रुटि निर्धारित करने के लिए सूत्रों (फॉर्म 5) और (फॉर्म 6) का उपयोग किया जाता है, हालांकि नमूना एक गैर-दोहराए गए के रूप में व्यवस्थित किया जाता है। यह तब होता है जब सामान्य जनसंख्या N की इकाइयों की संख्या अज्ञात या असीमित होती है, या जब पीकी तुलना में बहुत कम एन, और संक्षेप में, एक के मूल्य के करीब एक अतिरिक्त कारक का परिचय, व्यावहारिक रूप से औसत नमूनाकरण त्रुटि के मूल्य को प्रभावित नहीं करेगा।

यांत्रिक नमूनाकरण इस तथ्य में शामिल है कि सामान्य से नमूने में इकाइयों का चयन, एक तटस्थ मानदंड द्वारा समान अंतराल (समूहों) में विभाजित किया जाता है, इस तरह से किया जाता है कि नमूने में ऐसे प्रत्येक समूह से केवल एक इकाई का चयन किया जाता है। व्यवस्थित त्रुटि से बचने के लिए प्रत्येक समूह के मध्य में स्थित इकाई का चयन करना चाहिए।

यांत्रिक चयन का आयोजन करते समय, जनसंख्या की इकाइयों को एक निश्चित क्रम में (आमतौर पर एक सूची में) पूर्व-व्यवस्थित किया जाता है (उदाहरण के लिए, वर्णानुक्रम में, स्थान के अनुसार, किसी भी संकेतक के मूल्यों के आरोही या अवरोही क्रम में जो संबद्ध नहीं है) अध्ययन के तहत संपत्ति के साथ, आदि) आदि), जिसके बाद एक निश्चित अंतराल पर, इकाइयों की एक निश्चित संख्या को यंत्रवत् चुना जाता है। इस मामले में, सामान्य जनसंख्या में अंतराल का आकार नमूना हिस्सेदारी के व्युत्क्रम के बराबर है। तो, 2% नमूने के साथ, प्रत्येक 50वीं इकाई (1:0.02) का चयन और जाँच की जाती है, 5% नमूने के साथ, प्रत्येक 20वीं इकाई (1:0.05), उदाहरण के लिए, मशीन से अवरोही विवरण।

पर्याप्त रूप से बड़ी आबादी के साथ, परिणामों की सटीकता के संदर्भ में यांत्रिक चयन उचित यादृच्छिक के करीब है। इसलिए, एक यांत्रिक नमूने की औसत त्रुटि निर्धारित करने के लिए, स्व-यादृच्छिक गैर-दोहरावदार नमूने के सूत्रों का उपयोग किया जाता है (फॉर्म 9), (फॉर्म 10)।

एक विषम जनसंख्या से इकाइयों का चयन करने के लिए, तथाकथित विशिष्ट नमूना , जिसका उपयोग उन मामलों में किया जाता है जहां सामान्य जनसंख्या की सभी इकाइयों को अध्ययन किए गए संकेतकों को प्रभावित करने वाली विशेषताओं के अनुसार कई गुणात्मक रूप से सजातीय, समान समूहों में विभाजित किया जा सकता है।

उद्यमों का सर्वेक्षण करते समय, ऐसे समूह, उदाहरण के लिए, उद्योग और उप-क्षेत्र, स्वामित्व के रूप हो सकते हैं। फिर, प्रत्येक विशिष्ट समूह से, नमूने में इकाइयों का एक व्यक्तिगत चयन यादृच्छिक या यांत्रिक नमूने द्वारा किया जाता है।

एक विशिष्ट नमूना आमतौर पर जटिल सांख्यिकीय आबादी के अध्ययन में उपयोग किया जाता है। उदाहरण के लिए, अर्थव्यवस्था के कुछ क्षेत्रों में श्रमिकों और कर्मचारियों के पारिवारिक बजट के एक नमूना सर्वेक्षण में, एक उद्यम में श्रमिकों की श्रम उत्पादकता, अलग-अलग कौशल समूहों द्वारा दर्शायी जाती है।

नमूना सेट में इकाइयों के चयन के अन्य तरीकों की तुलना में एक विशिष्ट नमूना अधिक सटीक परिणाम देता है। सामान्य जनसंख्या का टाइपीकरण ऐसे नमूने की प्रतिनिधित्वशीलता, उसमें प्रत्येक टाइपोलॉजिकल समूह का प्रतिनिधित्व सुनिश्चित करता है, जिससे औसत नमूना त्रुटि पर अंतरसमूह फैलाव के प्रभाव को बाहर करना संभव हो जाता है।

निर्धारण करते समय एक विशिष्ट नमूने की औसत त्रुटिभिन्नता के सूचक के रूप में है इंट्राग्रुप प्रसरणों का औसत.

माध्य नमूनाकरण त्रुटि सूत्रों द्वारा पाए जाते हैं:

* औसत मात्रात्मक विशेषता के लिए

(पुनः चयन); (प्रपत्र 11)

(अपरिवर्तनीय चयन); (प्रपत्र 12)

* शेयर के लिए (वैकल्पिक विशेषता)

(पुनः चयन); (प्रपत्र.13)

(गैर-दोहरावीय चयन), (प्रपत्र 14)

नमूना आबादी के लिए अंतर-समूह भिन्नताओं का औसत कहां है;

नमूना आबादी में हिस्सेदारी (वैकल्पिक विशेषता) के अंतर-समूह भिन्नताओं का औसत।

क्रमिक नमूनाकरण इसमें सामान्य आबादी से अलग-अलग इकाइयों का नहीं, बल्कि उनके समान समूहों (घोंसले, श्रृंखला) का यादृच्छिक चयन शामिल है ताकि बिना किसी अपवाद के सभी इकाइयों को ऐसे समूहों में अवलोकन के अधीन किया जा सके।

सीरियल सैंपलिंग का उपयोग इस तथ्य के कारण है कि उनके परिवहन, भंडारण और बिक्री के लिए कई सामान पैक, बक्से आदि में पैक किए जाते हैं। इसलिए, पैक किए गए सामानों की गुणवत्ता को नियंत्रित करते समय, सभी पैकेजों से आवश्यक मात्रा में सामान का चयन करने की तुलना में कई पैकेजों (श्रृंखला) की जांच करना अधिक तर्कसंगत है।

चूंकि समूहों (श्रृंखला) के भीतर बिना किसी अपवाद के सभी इकाइयों की जांच की जाती है, औसत नमूनाकरण त्रुटि (समान श्रृंखला का चयन करते समय) केवल अंतरसमूह (अंतरश्रृंखला) विचरण पर निर्भर करती है।

डब्ल्यू माध्य स्कोर के लिए माध्य नमूनाकरण त्रुटि क्रमिक चयन के दौरान, वे सूत्रों द्वारा पाए जाते हैं:

(पुनः चयन); (प्रपत्र.15)

(गैर-दोहरावीय चयन), (प्रपत्र 16)

कहाँ आर-चयनित श्रृंखला की संख्या; आर-एपिसोड की कुल संख्या.

धारावाहिक नमूने के अंतरसमूह विचरण की गणना निम्नानुसार की जाती है:

औसत कहां है मैं- वें श्रृंखला; - संपूर्ण नमूना जनसंख्या के लिए सामान्य औसत।

डब्ल्यू शेयर के लिए औसत नमूनाकरण त्रुटि (वैकल्पिक सुविधा) धारावाहिक चयन में:

(पुनः चयन); (प्रपत्र 17)

(गैर-दोहरावीय चयन)। (प्रपत्र 18)

अंतरसमूह(अंतर-श्रृंखला) धारावाहिक नमूना शेयर का विचरणसूत्र द्वारा निर्धारित:

, (प्रपत्र 19)

फीचर का हिस्सा कहां है मैंवें श्रृंखला; - पूरे नमूने में विशेषता का कुल हिस्सा।

सांख्यिकीय सर्वेक्षणों के अभ्यास में, पहले से मानी गई चयन विधियों के अतिरिक्त, उनके संयोजन का उपयोग किया जाता है (संयुक्त चयन).

नमूनाकरण त्रुटि की अवधारणा और गणना।

चयनात्मक अवलोकन का कार्य अवलोकन के अधीन उनमें से कुछ हिस्से के आधार पर संपूर्ण जनसंख्या के सारांश संकेतकों के बारे में सही विचार देना है। सामान्य जनसंख्या में अंश और माध्य से नमूना अंश और नमूना माध्य के संभावित विचलन को कहा जाता है नमूनाकरण त्रुटि या प्रतिनिधित्व संबंधी त्रुटि. इस त्रुटि का मान जितना अधिक होगा, नमूना अवलोकन के संकेतक सामान्य जनसंख्या से उतने ही अधिक भिन्न होंगे।

अलग होना:

नमूनाकरण त्रुटियाँ;

पंजीकरण त्रुटियाँ.

पंजीकरण त्रुटियाँतब घटित होता है जब अवलोकन की प्रक्रिया में कोई तथ्य गलत तरीके से स्थापित हो जाता है। वे सतत अवलोकन और चयनात्मक अवलोकन दोनों की विशेषता रखते हैं, लेकिन चयनात्मक अवलोकन में वे कम होते हैं।

त्रुटि की प्रकृति है:

कोमल - जानबूझकर, अर्थात्। जनसंख्या की सबसे अच्छी या सबसे खराब इकाइयों का चयन किया गया। इस मामले में, टिप्पणियाँ अपना अर्थ खो देती हैं;

यादृच्छिक - चयनात्मक अवलोकन का मुख्य संगठनात्मक सिद्धांत जानबूझकर चयन को रोकना है, अर्थात। यादृच्छिक चयन के सिद्धांत का कड़ाई से पालन सुनिश्चित करें।

यादृच्छिक चयन का सामान्य नियमहै: सामान्य जनसंख्या की व्यक्तिगत इकाइयों में नमूने में शामिल इकाइयों की संख्या में आने के लिए बिल्कुल समान स्थितियाँ और अवसर होने चाहिए। यह पर्यवेक्षक की इच्छा से नमूना परिणाम की स्वतंत्रता की विशेषता है। पर्यवेक्षक की इच्छा प्रवृतिपूर्ण त्रुटियाँ उत्पन्न करती है। यादृच्छिक चयन में नमूनाकरण त्रुटि यादृच्छिक है। यह नमूना विशेषताओं से सामान्य विशेषताओं के विचलन के आकार को दर्शाता है।

इस तथ्य के कारण कि अध्ययन की गई जनसंख्या में विशेषताएँ भिन्न-भिन्न हैं, नमूने में इकाइयों की संरचना संपूर्ण जनसंख्या की इकाइयों की संरचना से मेल नहीं खा सकती है। यह मतलब है कि आरऔर मेल नहीं खाते डब्ल्यूऔर । इन विशेषताओं के बीच संभावित विसंगति नमूनाकरण त्रुटि द्वारा निर्धारित की जाती है, जो सूत्र द्वारा निर्धारित की जाती है:

सामान्य भिन्नता कहां है.

नमूना भिन्नता कहां है.

इससे पता चलता है कि समय में सामान्य भिन्नता नमूना भिन्नता से कहां भिन्न होती है।

बार-बार और गैर-दोहराया जाने वाला चयन होता है। पुन: चयन का सार यह है कि नमूने में प्रत्येक इकाई, अवलोकन के बाद, सामान्य जनसंख्या में लौट आती है और उसकी फिर से जांच की जा सकती है। पुन: नमूनाकरण करते समय, औसत नमूनाकरण त्रुटि की गणना की जाती है:

वैकल्पिक विशेषता के हिस्से के संकेतक के लिए, नमूना विचरण सूत्र द्वारा निर्धारित किया जाता है:

व्यवहार में, पुन: चयन का उपयोग शायद ही कभी किया जाता है। गैर-दोहरावीय चयन के साथ, सामान्य जनसंख्या का आकार एननमूनाकरण के दौरान घट जाती है, मात्रात्मक विशेषता के लिए औसत नमूनाकरण त्रुटि का सूत्र है:



संभावित मूल्यों में से एक जिसमें अध्ययन किए गए गुण का हिस्सा बराबर हो सकता है:

वैकल्पिक सुविधा की नमूनाकरण त्रुटि कहां है.

उदाहरण.

पुन: चयन के बिना विधि के अनुसार तैयार उत्पादों के एक बैच के 10% उत्पादों के नमूना सर्वेक्षण के दौरान, नमूनों में नमी की मात्रा पर निम्नलिखित डेटा प्राप्त किया गया था।

औसत नमी%, विचरण, मानक विचलन, 0.954 की संभावना के साथ, संभावित सीमाएं निर्धारित करें जिसमें औसत अपेक्षित है। सभी तैयार उत्पादों की% नमी सामग्री, 0.987 की संभावना के साथ, मानक उत्पादों की विशिष्ट गुरुत्व की संभावित सीमा, बशर्ते कि 13 और 19% से अधिक नमी सामग्री वाले उत्पाद गैर-मानक बैच से संबंधित हों।

केवल एक निश्चित संभावना के साथ ही यह तर्क दिया जा सकता है कि नमूना शेयर का सामान्य हिस्सा और नमूना माध्य का सामान्य औसत विचलन करता है टीएक बार।

सांख्यिकी में इन विचलनों को कहा जाता है सीमांत नमूनाकरण त्रुटियाँ और चिन्हित किये गये हैं.

निर्णय की संभावना को बढ़ाया या घटाया जा सकता है टीएक बार। 0.683 की संभावना के साथ, 0.954 के साथ, 0.987 के साथ, तो नमूने के संकेतकों के अनुसार सामान्य जनसंख्या के संकेतक निर्धारित किए जाते हैं:

औसत नमूनाकरण त्रुटि नमूना अध्ययन में हमेशा मौजूद रहता है और इस तथ्य के कारण प्रकट होता है कि सांख्यिकीय आबादी की सभी इकाइयों का सर्वेक्षण नहीं किया जाता है, बल्कि इसका केवल एक हिस्सा ही सर्वेक्षण किया जाता है।

माध्य नमूनाकरण त्रुटि हो जाती है सीमांत त्रुटि Δ जब आत्मविश्वास कारक से गुणा किया जाता है टी , जो आवश्यक अवलोकन सटीकता के आधार पर पूर्व निर्धारित है। सीमांत त्रुटि आपको एक निश्चित डिग्री की संभावना के साथ सामान्य आबादी में पैरामीटर के "सही" आकार का न्याय करने की अनुमति देती है

विशिष्ट और क्रमिक चयन के लिए, कुल विचरण के बजाय नमूनाकरण त्रुटि की गणना करते समय 2 ) समूह के भीतर भिन्नता और समूह के बीच भिन्नता के माध्य का उपयोग करें
, कहाँ
- समूह I का निजी विचरण, वॉल्यूम I समूह

औसत निर्धारित करने में यादृच्छिक नमूने की सीमांत त्रुटि के सूत्र

पुनः चयन हेतु

शेयर निर्धारित करने में यादृच्छिक नमूने की सीमांत त्रुटि के लिए सूत्र

पुनः चयन हेतु

गैर-आवर्ती चयन के लिए

औसत मूल्य निर्धारित करने में यादृच्छिक नमूने के आकार के लिए सूत्र

अध्ययन किए गए लक्षण के हिस्से को निर्धारित करने में यादृच्छिक नमूनों की संख्या के लिए सूत्र

सामान्य और नमूना माध्य के बीच सीमांत अंतर सीमांत त्रुटि से मेल खाता है

संभाव्यता मान और क्रमशः टी वितरण तालिका में हैं:

  • विद्यार्थी (एक छोटे नमूने के मामले में)

यादृच्छिक नमूनाकरण सूत्र यांत्रिक नमूने के लिए भी उपयुक्त हैं।

यदि राउंडिंग आवश्यक है, तो यादृच्छिक नमूने के साथ - राउंडिंग अप, मैकेनिकल सैंपलिंग के साथ - राउंडिंग डाउन।

छोटा सा नमूना

यदि नमूना आकार 30 इकाइयों से अधिक नहीं है, तो औसत मूल्य निर्धारित करने में एक छोटे नमूने की औसत त्रुटि की गणना सूत्र द्वारा की जाती है:

एक छोटे नमूने की त्रुटि की गणना करने के लिए परिष्कृत विचरण सूत्र का उपयोग किया जाता है

नमूनाकरण कार्यों के प्रकार

    नमूनाकरण त्रुटि की परिभाषा,

    नमूना आकार का निर्धारण एन ,

    इस संभावना का निर्धारण कि नमूना माध्य (या शेयर) किसी दी गई राशि से अधिक सामान्य माध्य से विचलित नहीं होता है t=Δ/μ,

    नमूना अवलोकनों के संकेतकों में विसंगतियों की यादृच्छिकता का आकलन,

    सामान्य जनसंख्या में नमूना विशेषताओं का स्थानांतरण।

माध्य और समानुपात परिकल्पना परीक्षण

नमूना अवलोकनों के संकेतकों में विसंगतियों की यादृच्छिकता का अनुमान


नमूना डेटा को सामान्य जनसंख्या में स्थानांतरित करने की विधियाँ

    तौलने की विधि;

    पुनः तौलने की विधि;

    प्रतिस्थापन कक्षाओं में यादृच्छिक चयन द्वारा भरने की विधि।

सीमांत त्रुटि- इसके घटित होने की दी गई संभावना के लिए साधनों के बीच अधिकतम संभव विसंगति या अधिकतम त्रुटि।

1. बार-बार चयन के दौरान औसत के लिए सीमांत नमूनाकरण त्रुटि की गणना सूत्र द्वारा की जाती है:

जहां टी - सामान्यीकृत विचलन - "विश्वास कारक", जो संभावना पर निर्भर करता है जो सीमांत नमूनाकरण त्रुटि की गारंटी देता है;

म्यू एक्स माध्य नमूनाकरण त्रुटि है।

2. अनुपात के लिए सीमांत नमूनाकरण त्रुटिजब पुनः चयन सूत्र द्वारा निर्धारित किया जाता है:

3. गैर-दोहरावीय चयन के साथ माध्य के लिए सीमांत नमूनाकरण त्रुटि:

सापेक्ष त्रुटि सीमित करेंनमूनाकरण को नमूना आबादी की संबंधित विशेषता के लिए सीमांत नमूना त्रुटि के प्रतिशत अनुपात के रूप में परिभाषित किया गया है। इसे इस प्रकार परिभाषित किया गया है:

छोटा सा नमूना

छोटे नमूनों का सिद्धांत विकसित किया गया था अंग्रेजी सांख्यिकीविद् छात्र 20वीं सदी की शुरुआत में. 1908 में, उन्होंने एक विशेष वितरण की खोज की जो छोटे नमूनों के साथ भी, टी और आत्मविश्वास संभावना एफ(टी) को सहसंबंधित करना संभव बनाता है। 100 से अधिक n के लिए, वे 30 के लिए लाप्लास संभाव्यता अभिन्न अंग की तालिकाओं के समान परिणाम देते हैं< n < 100 различия получаются незначительные. Поэтому на практике к малым выборкам относятся выборки объемом менее 30 единиц.

जैसा कि ज्ञात है, आंकड़ों में वस्तु के कवरेज की पूर्णता के आधार पर, बड़े पैमाने पर घटनाओं को देखने के दो तरीके हैं: निरंतर और गैर-निरंतर। असंतत अवलोकन का एक रूप चयनात्मक अवलोकन है।

अंतर्गत चयनात्मक अवलोकन इसे एक गैर-निरंतर अवलोकन के रूप में समझा जाता है, जिसमें अध्ययन की गई आबादी की इकाइयां, यादृच्छिक रूप से चुनी जाती हैं, सांख्यिकीय परीक्षा (अवलोकन) के अधीन होती हैं।

चयनात्मक अवलोकन सांख्यिकीय अवलोकन के सभी नियमों और सिद्धांतों और इकाइयों के चयन पर वैज्ञानिक रूप से संगठित कार्य के अधीन, जांच किए गए भाग के लिए इकाइयों की पूरी आबादी को चिह्नित करने का कार्य निर्धारित करता है।

सांख्यिकी में सर्वेक्षण हेतु चयनित इकाइयों के समूह को सामान्यतः सांख्यिकी कहा जाता है नमूना जनसंख्या , और इकाइयों का वह समूह जिससे चयन किया जाता है, कहलाता है सामान्य जनसंख्या . सामान्य और नमूना जनसंख्या की मुख्य विशेषताएं तालिका 1 में प्रस्तुत की गई हैं।

तालिका नंबर एक - सामान्य एवं नमूना जनसंख्या की मुख्य विशेषताएँ
अनुक्रमणिकापदनाम या सूत्र
जनसंख्या नमूना जनसंख्या
इकाइयों की संख्या एन एन
उन इकाइयों की संख्या जिनमें कोई विशेषता है एम एम
इस सुविधा वाली इकाइयों का अनुपात पी = एम/एन ω = एम/एन
उन इकाइयों का अनुपात जिनमें यह विशेषता नहीं है क्यू = 1 - पी 1 - डब्ल्यू
औसत मूल्य संकेत
फैलाव संकेत
वैकल्पिक सुविधा का फैलाव (शेयर का फैलाव) पी क्यू ω (1 - ω)

चयनात्मक अवलोकन करते समय, व्यवस्थित और यादृच्छिक त्रुटियाँ होती हैं। नमूने में इकाइयों के चयन के नियमों के उल्लंघन के कारण व्यवस्थित त्रुटियाँ उत्पन्न होती हैं। चयन नियमों में परिवर्तन करके ऐसी त्रुटियों को समाप्त किया जा सकता है।

सर्वेक्षण की असंतत प्रकृति के कारण यादृच्छिक त्रुटियाँ उत्पन्न होती हैं। अन्यथा, उन्हें प्रतिनिधित्वात्मकता (प्रतिनिधित्व) त्रुटियाँ कहा जाता है। यादृच्छिक त्रुटियों को औसत और सीमांत नमूनाकरण त्रुटियों में विभाजित किया जाता है, जो सुविधा की गणना करते समय और शेयर की गणना करते समय निर्धारित की जाती हैं।

औसत और सीमा त्रुटियाँ निम्नलिखित संबंध से संबंधित हैं :Δ = tμ, जहां Δ सीमांत नमूना त्रुटि है, μ औसत नमूना त्रुटि है, टी संभाव्यता के स्तर के आधार पर निर्धारित आत्मविश्वास कारक है। तालिका 2 संभाव्यता सिद्धांत से लिए गए t के कुछ मान दिखाती है।

औसत नमूनाकरण त्रुटि के मान की गणना चयन विधि और नमूनाकरण प्रक्रिया के आधार पर अलग-अलग तरीके से की जाती है। नमूनाकरण त्रुटियों की गणना के लिए मुख्य सूत्र तालिका 3 में प्रस्तुत किए गए हैं।

टेबल तीन - दोहराए जाने वाले और गैर-दोहराए गए चयन में नमूनाकरण त्रुटियों की गणना के लिए बुनियादी सूत्र
अनुक्रमणिकापदनाम एवं सूत्र
जनसंख्या नमूना जनसंख्या
यादृच्छिक पुनः नमूनाकरण के लिए माध्य सुविधा त्रुटि
यादृच्छिक पुनः नमूनाकरण के लिए माध्य शेयर त्रुटि
यादृच्छिक पुनः चयन के मामले में किसी सुविधा की त्रुटि को सीमित करें
यादृच्छिक पुनर्चयन में सीमांत शेयर त्रुटि
यादृच्छिक गैर-दोहरावीय चयन के लिए किसी सुविधा की औसत त्रुटि
यादृच्छिक गैर-दोहरावीय चयन में माध्य शेयर त्रुटि
यादृच्छिक गैर-दोहरावीय चयन के साथ किसी सुविधा की त्रुटि को सीमित करें
यादृच्छिक गैर-दोहरावीय चयन के लिए सीमांत शेयर त्रुटि

औसत और सीमांत नमूनाकरण त्रुटियों की गणना आपको उन संभावित सीमाओं को निर्धारित करने की अनुमति देती है जिनमें सामान्य जनसंख्या की विशेषताएं होंगी .

उदाहरण के लिए, एक नमूना माध्य के लिए, ऐसी सीमाएँ निम्नलिखित संबंधों के आधार पर निर्धारित की जाती हैं:

सामान्य जनसंख्या में विशेषता के हिस्से की सीमाएँ पी।

"सांख्यिकी में नमूनाकरण अवलोकन" विषय पर समस्याओं को हल करने के उदाहरण

कार्य 1 . क्षेत्र में उद्यमों के 10% नमूना अवलोकन के आधार पर प्राप्त उत्पादों (कार्यों, सेवाओं) के उत्पादन की जानकारी है:

निर्धारित करें: 1) नमूने में शामिल उद्यमों के लिए: ए) प्रति उद्यम आउटपुट का औसत आकार; बी) उत्पादन की मात्रा का फैलाव; ग) 400 हजार रूबल से अधिक उत्पादन मात्रा वाले उद्यमों का हिस्सा; 2) पूरे क्षेत्र के लिए, 0.954 की संभावना के साथ, वह सीमा जिसके भीतर कोई उम्मीद कर सकता है: ए) प्रति उद्यम उत्पादन की औसत मात्रा; बी) 400 हजार रूबल से अधिक उत्पादन मात्रा वाले उद्यमों का हिस्सा; 3) क्षेत्र में उत्पादन की कुल मात्रा।

समाधान

समस्या को हल करने के लिए, हम प्रस्तावित तालिका का विस्तार करते हैं।

1) नमूने में शामिल उद्यमों के लिए, प्रति उद्यम आउटपुट का औसत आकार

110800/400 = 277 हजार रूबल

हम उत्पादन की मात्रा के फैलाव की गणना सरल तरीके से करते हैं σ 2 = 35640000/400 - 277 2 = 89100 - 76229 = 12371।

उन उद्यमों की संख्या जिनकी उत्पादन मात्रा 400 हजार रूबल से अधिक है। 36+12 = 48 के बराबर है, और उनका हिस्सा ω = 48:400 = 0.12 = 12% के बराबर है।

2) संभाव्यता के सिद्धांत से यह ज्ञात होता है कि संभाव्यता P=0.954 के साथ आत्मविश्वास कारक t=2 है। सीमांत नमूनाकरण त्रुटि

2√12371:400 = 11.12 हजार रूबल

आइए सामान्य औसत की सीमाएँ निर्धारित करें: 277-11.12 ≤Xav ≤ 277+11.12; 265.88 ≤Xav ≤ 288.12

उद्यमों के हिस्से की सीमांत नमूनाकरण त्रुटि

2√0,12*0,88/400 = 0,03

आइए सामान्य शेयर की सीमाओं को परिभाषित करें: 0.12-0.03≤ p ≤0.12+0.03; 0.09≤ पी≤0.15

3) चूंकि उद्यमों का माना गया समूह क्षेत्र में उद्यमों की कुल संख्या का 10% है, इसलिए पूरे क्षेत्र में 4,000 उद्यम हैं। फिर क्षेत्र में उत्पादन की कुल मात्रा 265.88×4000≤Q≤288.12×4000 के भीतर है; 1063520 ≤ क्यू ≤ 1152480

कार्य 2 . 400 व्यावसायिक संरचनाओं के कर अधिकारियों द्वारा नियंत्रण ऑडिट के परिणामों के अनुसार, उनमें से 140 अपने कर रिटर्न में कराधान के अधीन आय को पूरी तरह से इंगित नहीं करते हैं। सामान्य आबादी में (पूरे क्षेत्र के लिए) व्यावसायिक संरचनाओं का हिस्सा निर्धारित करें जो 0.954 की संभावना के साथ अपने कर राजस्व का हिस्सा छिपाते हैं।

समाधान

समस्या की स्थिति के अनुसार, नमूना जनसंख्या में इकाइयों की संख्या n=400 है, विचारित विशेषता वाली इकाइयों की संख्या m=140 है, संभावना P=0.954 है।

संभाव्यता के सिद्धांत से यह ज्ञात होता है कि संभाव्यता P=0.954 के साथ आत्मविश्वास कारक t=2 है।

संकेतित विशेषता वाली इकाइयों का अनुपात सूत्र द्वारा निर्धारित किया जाता है: p=w+∆p, जहां w = m/n=140/400=0.35=35%,
और फीचर ∆p की सीमा त्रुटि सूत्र से प्राप्त की जाती है: ∆p= t √w(1-w)/n = 2√0.35×0.65/400 ≈ 0.5 = 5%

तब p = 35±5%।

उत्तर : 0.954 की संभावना के साथ अपनी कर आय का हिस्सा छिपाने वाली व्यावसायिक संरचनाओं का हिस्सा 35±5% है।