नमूना हो सकता है। गैर-प्रतिनिधि नमूने का एक उदाहरण

घटना की संभावना का अंतराल अनुमान। यादृच्छिक चयन विधि के मामले में नमूनों की संख्या की गणना के लिए सूत्र।

हमारे लिए रुचि की घटनाओं की संभावनाओं को निर्धारित करने के लिए, हम नमूनाकरण विधि का उपयोग करते हैं: हम करते हैं एनस्वतंत्र प्रयोग, जिनमें से प्रत्येक घटना में ए हो सकता है (या नहीं हो सकता है) (प्रायिकता आरप्रत्येक प्रयोग में घटना ए की घटना स्थिर है)। फिर घटनाओं की घटनाओं की सापेक्ष आवृत्ति p* लेकिनकी एक श्रृंखला में एनपरीक्षण को संभाव्यता के लिए एक बिंदु अनुमान के रूप में लिया जाता है पीकिसी घटना का घटित होना लेकिनएक अलग परीक्षण में। इस स्थिति में, मान p* कहलाता है नमूना शेयर घटना घटना लेकिन, और आर - सामान्य हिस्सा .

केंद्रीय सीमा प्रमेय (मोइवर-लाप्लास प्रमेय) के परिणाम के आधार पर, एक बड़े नमूना आकार के साथ एक घटना की सापेक्ष आवृत्ति को सामान्य रूप से मापदंडों के साथ वितरित माना जा सकता है M(p*)=p तथा

इसलिए, n>30 के लिए, सामान्य अंश के लिए विश्वास अंतराल सूत्रों का उपयोग करके बनाया जा सकता है:


जहां u cr को लैपलेस फ़ंक्शन की तालिकाओं के अनुसार पाया जाता है, दी गई आत्मविश्वास संभावना को ध्यान में रखते हुए : 2Ф(u cr)=γ.

एक छोटे से नमूना आकार n≤30 के साथ, छात्र वितरण तालिका से सीमांत त्रुटि निर्धारित की जाती है:
जहाँ t cr =t(k; α) और स्वतंत्रता की डिग्री की संख्या k=n-1 प्रायिकता α=1-γ (दो तरफा क्षेत्र)।

सूत्र मान्य हैं यदि चयन को बार-बार यादृच्छिक रूप से किया गया था (सामान्य जनसंख्या अनंत है), अन्यथा गैर-दोहराए जाने वाले चयन (तालिका) के लिए सुधार करना आवश्यक है।

सामान्य अनुपात के लिए औसत नमूना त्रुटि

जनसंख्याअनंतअंतिम मात्रा एन
चयन प्रकारदोहराया गयान दोहराई
औसत नमूना त्रुटि

एक उचित यादृच्छिक चयन पद्धति के साथ नमूने के आकार की गणना के लिए सूत्र

चयन विधिनमूना आकार सूत्र
बीच के लिएशेयर के लिए
दोहराया गया
न दोहराई
इकाइयों का हिस्सा w = . शुद्धता = . प्रायिकता =

सामान्य हिस्सेदारी के बारे में समस्याएं

प्रश्न के लिए "क्या p 0 का दिया गया मान विश्वास अंतराल को कवर करता है?" - सांख्यिकीय परिकल्पना एच 0: पी = पी 0 का परीक्षण करके उत्तर दिया जा सकता है। यह माना जाता है कि प्रयोग बर्नौली परीक्षण योजना (स्वतंत्र, संभाव्यता) के अनुसार किए जाते हैं पीकिसी घटना का घटित होना लेकिनलगातार)। मात्रा के नमूने द्वारा एनघटना ए की घटना की सापेक्ष आवृत्ति पी * निर्धारित करें: जहां एम- घटना की घटनाओं की संख्या लेकिनकी एक श्रृंखला में एनपरीक्षण। परिकल्पना एच 0 का परीक्षण करने के लिए, आंकड़ों का उपयोग किया जाता है, पर्याप्त रूप से बड़े नमूना आकार के साथ, एक मानक सामान्य वितरण होता है (तालिका 1)।
तालिका 1 - सामान्य हिस्से के बारे में परिकल्पना

परिकल्पना

एच0:पी=पी0एच 0:पी 1 \u003d पी 2
मान्यताओंबर्नौली परीक्षण योजनाबर्नौली परीक्षण योजना
नमूना अनुमान
आंकड़े
सांख्यिकी वितरण मानक सामान्य एन(0,1)

उदाहरण 1। रैंडम री-सैंपलिंग का उपयोग करते हुए, कंपनी के प्रबंधन ने अपने 900 कर्मचारियों का एक यादृच्छिक सर्वेक्षण किया। उत्तरदाताओं में 270 महिलाएं थीं। एक कॉन्फिडेंस इंटरवल प्लॉट करें, जिसमें 0.95 की प्रायिकता हो, जो फर्म की पूरी टीम में महिलाओं के सही अनुपात को कवर करे।
फेसला। शर्त के अनुसार, महिलाओं का नमूना अनुपात (सभी उत्तरदाताओं के बीच महिलाओं की सापेक्ष आवृत्ति) है। चूंकि चयन दोहराया जाता है और नमूना आकार बड़ा होता है (एन = 900), सीमांत नमूना त्रुटि सूत्र द्वारा निर्धारित की जाती है

u cr का मान लैपलेस फलन की तालिका से संबंध 2Ф(u cr)=γ से ज्ञात किया जाता है, अर्थात्। लैपलेस फ़ंक्शन (परिशिष्ट 1) u cr = 1.96 पर 0.475 मान लेता है। इसलिए, सीमांत त्रुटि और वांछित विश्वास अंतराल
(पी - , पी + ε) = (0.3 - 0.18; 0.3 + 0.18) = (0.12; 0.48)
तो, 0.95 की संभावना के साथ, यह गारंटी दी जा सकती है कि फर्म की पूरी टीम में महिलाओं का अनुपात 0.12 से 0.48 के बीच है।

उदाहरण # 2। कार पार्क का मालिक उस दिन को "भाग्यशाली" मानता है जब कार पार्क 80% से अधिक भरा हो। वर्ष के दौरान, 40 कार पार्क निरीक्षण किए गए, जिनमें से 24 "सफल" रहे। 0.98 की प्रायिकता के साथ, वर्ष के दौरान "भाग्यशाली" दिनों के सही प्रतिशत का अनुमान लगाने के लिए विश्वास अंतराल ज्ञात कीजिए।
फेसला. "अच्छे" दिनों का नमूना अंश है
लैपलेस फलन की तालिका के अनुसार, हम दिए गए के लिए u cr का मान ज्ञात करते हैं
आत्मविश्वास का स्तर
(2.23) = 0.49, यू करोड़ = 2.33।
चयन को गैर-दोहराव मानते हुए (यानी, एक ही दिन में दो जांच नहीं की गई थी), हम सीमांत त्रुटि पाते हैं:
जहाँ n=40 , N = 365 (दिन)। यहां से
और सामान्य भिन्न के लिए विश्वास अंतराल: (p - , p + ) = (0.6 - 0.17; 0.6 + 0.17) = (0.43; 0.77)
0.98 की संभावना के साथ, यह उम्मीद की जा सकती है कि वर्ष के दौरान "अच्छे" दिनों का अनुपात 0.43 से 0.77 के बीच हो।

उदाहरण #3। बैच में 2500 वस्तुओं की जाँच के बाद, उन्होंने पाया कि 400 वस्तुएँ उच्चतम श्रेणी की थीं, लेकिन n-m नहीं थीं। 95% निश्चितता के साथ 0.01 की सटीकता के साथ प्रीमियम ग्रेड के हिस्से को निर्धारित करने के लिए आपको कितने उत्पादों की जांच करने की आवश्यकता है?
हम फिर से चयन के लिए नमूने के आकार को निर्धारित करने के लिए सूत्र के अनुसार समाधान की तलाश कर रहे हैं।

Ф(t) = γ/2 = 0.95/2 = 0.475 और लाप्लास तालिका के अनुसार यह मान t=1.96 से मेल खाता है
नमूना अंश w = 0.16; नमूना त्रुटि ε = 0.01

उदाहरण # 4। उत्पादों का एक बैच स्वीकार किया जाता है यदि उत्पाद के मानक को पूरा करने की संभावना कम से कम 0.97 है। परीक्षण किए गए लॉट के बेतरतीब ढंग से चुने गए 200 उत्पादों में से 193 उत्पाद मानक के अनुरूप पाए गए। क्या बैच को महत्व स्तर α=0.02 पर स्वीकार करना संभव है?
फेसला. हम मुख्य और वैकल्पिक परिकल्पना तैयार करते हैं।
एच 0: पी \u003d पी 0 \u003d 0.97 - अज्ञात सामान्य शेयर पीनिर्दिष्ट मान के बराबर पी 0 = 0.97। स्थिति के संबंध में - संभावना है कि परीक्षण किए गए लॉट से हिस्सा मानक के अनुसार होगा 0.97 है; वे। उत्पादों के बैच को स्वीकार किया जा सकता है।
एच1:पी<0,97 - вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0.97; т.е. партию изделий нельзя принять. При такой альтернативной гипотезе критическая область будет левосторонней.
मनाया गया आँकड़ा मूल्य (तालिका) दिए गए मानों के लिए गणना करें पी 0 = 0.97, एन = 200, एम = 193


महत्वपूर्ण मान समानता से लाप्लास फ़ंक्शन की तालिका से पाया जाता है


शर्त के अनुसार α=0.02, इसलिए F(Kcr)=0.48 और Kcr=2.05। महत्वपूर्ण क्षेत्र बाएं हाथ का है, अर्थात। अंतराल है (-∞;-K kp)= (-∞;-2.05)। देखा गया मान कोब्स = -0.415 महत्वपूर्ण क्षेत्र से संबंधित नहीं है, इसलिए, इस स्तर के महत्व पर, मुख्य परिकल्पना को अस्वीकार करने का कोई कारण नहीं है। उत्पादों का एक बैच स्वीकार किया जा सकता है।

उदाहरण संख्या 5. दो कारखाने एक ही प्रकार के पुर्जों का उत्पादन करते हैं। उनकी गुणवत्ता का आकलन करने के लिए इन कारखानों के उत्पादों से नमूने लिए गए और निम्नलिखित परिणाम प्राप्त हुए। पहली फैक्ट्री के 200 चयनित उत्पादों में से 20 खराब थे और दूसरी फैक्ट्री के 300 उत्पादों में से 15 खराब थे।
0.025 के महत्व स्तर पर, पता करें कि क्या इन कारखानों द्वारा निर्मित पुर्जों की गुणवत्ता में कोई महत्वपूर्ण अंतर है।

शर्त के अनुसार α=0.025, इसलिए F(Kcr)=0.4875 और Kcr=2.24। दो तरफा विकल्प के साथ, स्वीकार्य मूल्यों के क्षेत्र का रूप है (-2.24; 2.24)। प्रेक्षित मान कोब्स =2.15 इस अंतराल के भीतर आता है, अर्थात। महत्व के इस स्तर पर, मुख्य परिकल्पना को अस्वीकार करने का कोई कारण नहीं है। कारखाने समान गुणवत्ता के उत्पाद तैयार करते हैं।

योजना:

1. गणितीय सांख्यिकी की समस्याएं।

2. नमूना प्रकार।

3. चयन के तरीके।

4. नमूने का सांख्यिकीय वितरण।

5. अनुभवजन्य वितरण समारोह।

6. बहुभुज और हिस्टोग्राम।

7. विविधता श्रृंखला की संख्यात्मक विशेषताएं।

8. वितरण मापदंडों के सांख्यिकीय अनुमान।

9. वितरण मापदंडों के अंतराल अनुमान।

1. गणितीय आँकड़ों के कार्य और तरीके

गणित के आँकड़े वैज्ञानिक और व्यावहारिक उद्देश्यों के लिए सांख्यिकीय अवलोकन डेटा के परिणामों को एकत्र करने, विश्लेषण करने और संसाधित करने के तरीकों के लिए समर्पित गणित की एक शाखा है।

कुछ गुणात्मक या मात्रात्मक विशेषता के संबंध में सजातीय वस्तुओं के एक समूह का अध्ययन करने की आवश्यकता है जो इन वस्तुओं की विशेषता है। उदाहरण के लिए, यदि भागों का एक बैच है, तो भाग का मानक गुणात्मक संकेत के रूप में काम कर सकता है, और भाग का नियंत्रित आकार मात्रात्मक संकेत के रूप में काम कर सकता है।

कभी-कभी एक सतत अध्ययन किया जाता है, अर्थात्। वांछित विशेषता के संबंध में प्रत्येक वस्तु की जांच करें। व्यवहार में, एक व्यापक सर्वेक्षण का उपयोग शायद ही कभी किया जाता है। उदाहरण के लिए, यदि जनसंख्या में बहुत बड़ी संख्या में वस्तुएं हैं, तो निरंतर सर्वेक्षण करना शारीरिक रूप से असंभव है। यदि वस्तु का सर्वेक्षण उसके विनाश से जुड़ा है या बड़ी सामग्री लागत की आवश्यकता है, तो पूर्ण सर्वेक्षण करने का कोई मतलब नहीं है। ऐसे मामलों में, सीमित संख्या में वस्तुओं (नमूना सेट) को पूरी आबादी से यादृच्छिक रूप से चुना जाता है और उनके अध्ययन के अधीन किया जाता है।

गणितीय आँकड़ों का मुख्य कार्य लक्ष्य के आधार पर नमूना डेटा के आधार पर पूरी आबादी का अध्ययन करना है, अर्थात। जनसंख्या के संभाव्य गुणों का अध्ययन: वितरण का नियम, संख्यात्मक विशेषताएं, आदि। अनिश्चितता की स्थिति में प्रबंधकीय निर्णय लेने के लिए।

2. नमूना प्रकार

जनसंख्या वस्तुओं का समूह है जिससे नमूना बनाया जाता है।

नमूना जनसंख्या (नमूना) बेतरतीब ढंग से चयनित वस्तुओं का एक संग्रह है।

जनसंख्या का आकार इस संग्रह में वस्तुओं की संख्या है। सामान्य जनसंख्या का आयतन निरूपित किया जाता हैएन, चयनात्मक - एन।

उदाहरण:

यदि 1000 भागों में से 100 भागों का चयन परीक्षा के लिए किया जाता है, तो सामान्य जनसंख्या का आयतनएन = 1000, और नमूना आकारएन = 100।

नमूनाकरण दो तरीकों से किया जा सकता है: वस्तु का चयन करने और उस पर अवलोकन करने के बाद, इसे वापस किया जा सकता है या सामान्य आबादी को नहीं लौटाया जा सकता है। उस। नमूनों को दोहराया और गैर-दोहराया में विभाजित किया गया है।

दोहराया गयाबुलाया नमूना, जिस पर चयनित वस्तु (अगले एक को चुनने से पहले) सामान्य आबादी को वापस कर दी जाती है।

न दोहराईबुलाया नमूना, जिस पर चयनित वस्तु सामान्य जनसंख्या को वापस नहीं की जाती है।

व्यवहार में, गैर-दोहराव यादृच्छिक चयन आमतौर पर उपयोग किया जाता है।

सामान्य जनसंख्या में रुचि की विशेषता का न्याय करने में नमूने के डेटा को पर्याप्त रूप से आश्वस्त करने के लिए, यह आवश्यक है कि नमूने की वस्तुएं इसे सही ढंग से दर्शाती हैं। नमूना को जनसंख्या के अनुपात का सही ढंग से प्रतिनिधित्व करना चाहिए। नमूना होना चाहिए प्रतिनिधि (प्रतिनिधि)।

बड़ी संख्या के कानून के आधार पर, यह तर्क दिया जा सकता है कि यदि नमूना यादृच्छिक रूप से किया जाता है तो वह प्रतिनिधि होगा।

यदि सामान्य जनसंख्या का आकार काफी बड़ा है, और नमूना इस जनसंख्या का केवल एक छोटा सा हिस्सा है, तो दोहराए गए और गैर-दोहराए गए नमूनों के बीच का अंतर मिट जाता है; सीमित मामले में, जब एक अनंत सामान्य आबादी पर विचार किया जाता है, और नमूने का एक सीमित आकार होता है, तो यह अंतर गायब हो जाता है।

उदाहरण:

अमेरिकन जर्नल लिटरेरी रिव्यू में, सांख्यिकीय विधियों का उपयोग करते हुए, 1936 में आगामी अमेरिकी राष्ट्रपति चुनाव के परिणाम के बारे में पूर्वानुमानों का एक अध्ययन किया गया था। इस पद के लिए आवेदक एफ.डी. रूजवेल्ट और ए एम लैंडन। अध्ययन किए गए अमेरिकियों की सामान्य आबादी के लिए टेलीफोन ग्राहकों की संदर्भ पुस्तकों को एक स्रोत के रूप में लिया गया था। इनमें से 40 लाख पते बेतरतीब ढंग से चुने गए थे, जिन पर पत्रिका के संपादकों ने पोस्टकार्ड भेजकर उनसे राष्ट्रपति पद के उम्मीदवारों के प्रति अपना दृष्टिकोण व्यक्त करने के लिए कहा। सर्वेक्षण के परिणामों को संसाधित करने के बाद, पत्रिका ने एक समाजशास्त्रीय पूर्वानुमान प्रकाशित किया कि लैंडन आगामी चुनाव बड़े अंतर से जीतेंगे। और ... मैं गलत था: रूजवेल्ट जीता।
इस उदाहरण को गैर-प्रतिनिधि नमूने के उदाहरण के रूप में देखा जा सकता है। तथ्य यह है कि संयुक्त राज्य अमेरिका में बीसवीं शताब्दी के पूर्वार्ध में, केवल आबादी का धनी हिस्सा, जिसने लैंडन के विचारों का समर्थन किया था, के पास टेलीफोन थे।

3. चयन के तरीके

व्यवहार में, चयन के विभिन्न तरीकों का उपयोग किया जाता है, जिन्हें 2 प्रकारों में विभाजित किया जा सकता है:

1. चयन के लिए जनसंख्या को भागों में विभाजित करने की आवश्यकता नहीं होती है (a) सिंपल रैंडम नो रिपीट; बी) सरल यादृच्छिक दोहराव).

2. चयन, जिसमें सामान्य जनसंख्या को भागों में विभाजित किया जाता है। (ए) विशिष्ट चयन; बी) यांत्रिक चयन; में) धारावाहिक चयन).

सरल यादृच्छिक इसे बुलाओ चयन, जिसमें वस्तुओं को एक-एक करके पूरी सामान्य आबादी (यादृच्छिक रूप से) से निकाला जाता है।

ठेठबुलाया चयन, जिसमें वस्तुओं का चयन पूरी सामान्य आबादी से नहीं, बल्कि इसके प्रत्येक "विशिष्ट" भागों से किया जाता है। उदाहरण के लिए, यदि एक भाग कई मशीनों पर निर्मित होता है, तो चयन सभी मशीनों द्वारा उत्पादित भागों के पूरे सेट से नहीं, बल्कि प्रत्येक मशीन के उत्पादों से अलग-अलग किया जाता है। इस तरह के चयन का उपयोग तब किया जाता है जब सामान्य आबादी के विभिन्न "विशिष्ट" भागों में जांच की जा रही विशेषता में उल्लेखनीय रूप से उतार-चढ़ाव होता है।

यांत्रिकबुलाया चयन, जिसमें सामान्य जनसंख्या को "यांत्रिक रूप से" उतने ही समूहों में विभाजित किया जाता है, जितने नमूने में शामिल किए जाने वाली वस्तुएं हैं, और प्रत्येक समूह से एक वस्तु का चयन किया जाता है। उदाहरण के लिए, यदि आपको मशीन द्वारा बनाए गए 20% पुर्जों का चयन करना है, तो प्रत्येक 5वें भाग का चयन किया जाता है; यदि 5% भागों का चयन करना आवश्यक है - प्रत्येक 20 वें, आदि। कभी-कभी ऐसा चयन एक प्रतिनिधि नमूना सुनिश्चित नहीं कर सकता है (यदि प्रत्येक 20 वें मोड़ रोलर का चयन किया जाता है, और कटर को चयन के तुरंत बाद बदल दिया जाता है, तो सभी रोलर्स को कुंद कटर से बदल दिया जाएगा)।

धारावाहिकबुलाया चयन, जिसमें वस्तुओं का चयन सामान्य आबादी से एक बार में नहीं, बल्कि "श्रृंखला" में किया जाता है, जो निरंतर सर्वेक्षण के अधीन होते हैं। उदाहरण के लिए, यदि उत्पादों का निर्माण स्वचालित मशीनों के एक बड़े समूह द्वारा किया जाता है, तो केवल कुछ मशीनों के उत्पादों की निरंतर जांच की जाती है।

व्यवहार में, संयुक्त चयन का अक्सर उपयोग किया जाता है, जिसमें उपरोक्त विधियों को संयुक्त किया जाता है।

4. नमूने का सांख्यिकीय वितरण

मान लीजिए कि सामान्य जनसंख्या से एक नमूना लिया जाता है, और मान x 1-एक बार देखा गया, x 2 -n 2 बार, ... x k - n k बार। एन = n 1 +n 2 +...+n k नमूना आकार है। देखे गए मानबुलाया विकल्प, और अनुक्रम आरोही क्रम में लिखा गया एक प्रकार है - परिवर्तनशील श्रृंखला. अवलोकनों की संख्याबुलाया आवृत्तियों (पूर्ण आवृत्तियों), और नमूना आकार के साथ उनका संबंध- सापेक्ष आवृत्तियोंया सांख्यिकीय संभावनाएं।

यदि विकल्पों की संख्या बड़ी है या नमूना निरंतर सामान्य जनसंख्या से बना है, तो भिन्नता श्रृंखला व्यक्तिगत बिंदु मानों से नहीं, बल्कि सामान्य जनसंख्या के मूल्यों के अंतराल द्वारा संकलित की जाती है। ऐसी श्रृंखला कहलाती है मध्यान्तर।अंतराल की लंबाई बराबर होनी चाहिए।

नमूने का सांख्यिकीय वितरण विकल्पों की सूची और उनकी संगत आवृत्तियों या सापेक्ष आवृत्तियों को कहा जाता है।

सांख्यिकीय वितरण को अंतराल के अनुक्रम और उनकी संगत आवृत्तियों के रूप में भी निर्दिष्ट किया जा सकता है (मानों के इस अंतराल में आने वाली आवृत्तियों का योग)

आवृत्तियों की बिंदु भिन्नता श्रृंखला को एक तालिका द्वारा दर्शाया जा सकता है:

एक्स मैं
एक्स 1
x2

एक्स के
मैं
एन 1
एन 2

एनके

इसी तरह, आप सापेक्ष आवृत्तियों की एक बिंदु परिवर्तनशील श्रृंखला का प्रतिनिधित्व कर सकते हैं।

और:

उदाहरण:

कुछ पाठ X में अक्षरों की संख्या 1000 के बराबर निकली। पहला अक्षर "i", दूसरा - अक्षर "i", तीसरा - अक्षर "a", चौथा - "u" था। फिर "ओ", "ई", "वाई", "ई", "एस" अक्षर आए।

आइए उन स्थानों को लिखें जो वे क्रमशः वर्णमाला में रखते हैं, हमारे पास हैं: 33, 10, 1, 32, 16, 6, 21, 31, 29।

इन संख्याओं को आरोही क्रम में क्रमित करने के बाद, हमें भिन्नता श्रृंखला मिलती है: 1, 6, 10, 16, 21, 29, 31, 32, 33।

पाठ में अक्षरों की उपस्थिति की आवृत्तियाँ: "ए" - 75, "ई" -87, "आई" - 75, "ओ" - 110, "वाई" - 25, "एस" - 8, "ई" - 3, "यू "- 7," मैं "- 22।

हम आवृत्तियों की एक बिंदु परिवर्तनशील श्रृंखला बनाते हैं:

उदाहरण:

वॉल्यूम नमूनाकरण आवृत्ति वितरण निर्दिष्टएन = 20।

सापेक्ष आवृत्तियों की एक बिंदु भिन्नता श्रृंखला बनाएं।

एक्स मैं

2

6

12

मैं

3

10

7

फेसला:

सापेक्ष आवृत्तियों का पता लगाएं:


एक्स मैं

2

6

12

मैं

0,15

0,5

0,35

अंतराल वितरण का निर्माण करते समय, अंतराल की संख्या या प्रत्येक अंतराल के आकार को चुनने के नियम होते हैं। यहां मानदंड इष्टतम अनुपात है: अंतराल की संख्या में वृद्धि के साथ, प्रतिनिधित्व में सुधार होता है, लेकिन डेटा की मात्रा और उन्हें संसाधित करने का समय बढ़ जाता है। अंतर x अधिकतम - x मिनट सबसे बड़े और सबसे छोटे मानों के बीच के वेरियंट को कहा जाता है बड़े पैमाने परनमूने।

अंतरालों की संख्या गिनने के लिएक आमतौर पर स्टर्गेस के अनुभवजन्य सूत्र को लागू करते हैं (निकटतम सुविधाजनक पूर्णांक के लिए गोल करना):के = 1 + 3.322 लॉग एन।

तदनुसार, प्रत्येक अंतराल का मानएच सूत्र का उपयोग करके गणना की जा सकती है:

5. अनुभवजन्य वितरण समारोह

सामान्य आबादी से कुछ नमूने पर विचार करें। मान लीजिए कि मात्रात्मक विशेषता X की आवृत्तियों का सांख्यिकीय वितरण ज्ञात है। आइए हम संकेतन का परिचय दें: n xप्रेक्षणों की संख्या है जिसमें x से कम विशेषता मान देखा गया था;एन अवलोकनों की कुल संख्या (नमूना आकार) है। सापेक्ष घटना आवृत्ति X<х равна एन एक्स / एन। यदि x बदलता है, तो आपेक्षिक आवृत्ति भी बदल जाती है, अर्थात सापेक्ष आवृत्तिएन एक्स / एनx का एक फलन है। क्योंकि यह अनुभवजन्य रूप से पाया जाता है, इसे अनुभवजन्य कहा जाता है।

अनुभवजन्य वितरण समारोह (नमूना वितरण समारोह) फ़ंक्शन को कॉल करें, जो प्रत्येक x के लिए घटना X की सापेक्ष आवृत्ति निर्धारित करता है<х.


x से कम विकल्पों की संख्या कहाँ है,

एन - नमूना आकार।

नमूने के अनुभवजन्य वितरण फलन के विपरीत, जनसंख्या का वितरण फलन F(x) कहलाता है सैद्धांतिक वितरण समारोह.

अनुभवजन्य और सैद्धांतिक वितरण कार्यों के बीच का अंतर यह है कि सैद्धांतिक कार्य एफ (एक्स) एक घटना एक्स की संभावना निर्धारित करता है एफ * (एक्स)इस घटना की प्रायिकता F (x) की प्रायिकता की ओर प्रवृत्त होता है। यानी बड़ी संख्या के लिए एफ * (एक्स)और F(x) एक दूसरे से बहुत कम भिन्न हैं।

उस। सामान्य जनसंख्या के सैद्धांतिक (अभिन्न) वितरण फ़ंक्शन के अनुमानित प्रतिनिधित्व के लिए नमूने के अनुभवजन्य वितरण फ़ंक्शन का उपयोग करना उचित है।

एफ * (एक्स)सभी गुण हैएफ (एक्स)।

1. मूल्य एफ * (एक्स)अंतराल से संबंधित हैं।

2. F*(x) एक गैर-घटता फलन है।

3. यदि सबसे छोटा संस्करण है, तो F*(x) = 0, x . पर < x1; यदि x k सबसे बड़ा प्रकार है, तो F*(x) = 1, x > x k के लिए।

वे। एफ * (एक्स)एफ (एक्स) का अनुमान लगाने के लिए कार्य करता है।

यदि नमूना एक परिवर्तनशील श्रृंखला द्वारा दिया गया है, तो अनुभवजन्य कार्य का रूप है:

अनुभवजन्य फलन के ग्राफ को संचयी कहा जाता है।

उदाहरण:

दिए गए नमूना वितरण पर एक अनुभवजन्य कार्य प्लॉट करें।


फेसला:

नमूना आकार n = 12 + 18 +30 = 60। सबसे छोटा विकल्प 2 है, अर्थात। x . पर < 2. घटना X<6, (x 1 = 2) наблюдалось 12 раз, т.е. एफ*(एक्स)=12/60=0.2दो पर < एक्स < 6. घटना X<10, (x 1 =2, x 2 = 6) наблюдалось 12 + 18 = 30 раз, т.е.F*(x)=30/60=0,5 при 6 < एक्स < 10. क्योंकि x=10 सबसे बड़ा विकल्प है, तो एफ * (एक्स) = 1एक्स> 10 पर। वांछित अनुभवजन्य कार्य का रूप है:

संचयी:


क्यूम्युलेट ग्राफिक रूप से प्रस्तुत जानकारी को समझना संभव बनाता है, उदाहरण के लिए, सवालों के जवाब देने के लिए: "उन टिप्पणियों की संख्या निर्धारित करें जिनमें फीचर का मूल्य 6 से कम या 6 से कम नहीं था। एफ * (6) = 0.2 » तब प्रेक्षणों की संख्या जिनमें प्रेक्षित विशेषता का मान 6 से कम था, 0.2* हैएन \u003d 0.2 * 60 \u003d 12. प्रेक्षणों की संख्या जिसमें प्रेक्षित विशेषता का मान 6 से कम नहीं था (1-0.2) * n \u003d 0.8 * 60 \u003d 48।

यदि अंतराल भिन्नता श्रृंखला दी जाती है, तो अनुभवजन्य वितरण फ़ंक्शन को संकलित करने के लिए, अंतराल के मध्य बिंदु पाए जाते हैं और बिंदु भिन्नता श्रृंखला के समान अनुभवजन्य वितरण फ़ंक्शन प्राप्त किया जाता है।

6. बहुभुज और हिस्टोग्राम

स्पष्टता के लिए, सांख्यिकीय वितरण के विभिन्न ग्राफ बनाए गए हैं: बहुपद और हिस्टोग्राम

आवृत्ति बहुभुज-यह एक टूटी हुई रेखा है, जिसके खंड बिंदुओं को जोड़ते हैं ( x 1 ;n 1 ), ( x 2 ;n 2 ),…, ( x k ; n k ), जहां विकल्प हैं, उनकी संगत आवृत्तियां हैं।

सापेक्ष आवृत्तियों का बहुभुज -यह एक टूटी हुई रेखा है, जिसके खंड बिंदुओं ( x 1 ;w 1 ), (x 2 ;w 2 ),…, ( x k ;w k ) को जोड़ते हैं, जहां x i विकल्प हैं, w i उनके संगत आवृत्तियां हैं।

उदाहरण:

दिए गए नमूना वितरण पर आपेक्षिक बारंबारता बहुपद को आलेखित करें:

फेसला:

एक निरंतर विशेषता के मामले में, एक हिस्टोग्राम बनाने की सलाह दी जाती है, जिसके लिए अंतराल, जिसमें सुविधा के सभी देखे गए मान शामिल होते हैं, को लंबाई के कई आंशिक अंतरालों में विभाजित किया जाता है और प्रत्येक आंशिक अंतराल के लिए n i पाया जाता है। - i-वें अंतराल में आने वाली भिन्न आवृत्तियों का योग। (उदाहरण के लिए, किसी व्यक्ति की ऊंचाई या वजन को मापते समय, हम एक निरंतर संकेत के साथ काम कर रहे हैं)।

आवृत्ति हिस्टोग्राम-यह एक चरणबद्ध आकृति है, जिसमें आयताकार होते हैं, जिनमें से आधार लंबाई के आंशिक अंतराल होते हैं, और ऊंचाई अनुपात (आवृत्ति घनत्व) के बराबर होती है।

वर्ग i-th आंशिक आयत i-th अंतराल के प्रकार की आवृत्तियों के योग के बराबर है, अर्थात। आवृत्ति हिस्टोग्राम क्षेत्र सभी आवृत्तियों के योग के बराबर है, अर्थात। नमूने का आकार।

उदाहरण:

विद्युत नेटवर्क में वोल्टेज में परिवर्तन (वोल्ट में) के परिणाम दिए गए हैं। यदि वोल्टेज मान इस प्रकार हैं: 227, 215, 230, 232, 223, 220, 228, 222, 221, 226, 226, 215, 218, 220, 216, 220, 225, 212, 217, 220।

फेसला:

आइए विविधताओं की एक श्रृंखला बनाएं। हमारे पास n = 20, x मिनट = 212, x अधिकतम = 232 है।

आइए अंतरालों की संख्या की गणना करने के लिए स्टर्गेस सूत्र का उपयोग करें।

आवृत्तियों की अंतराल भिन्नता श्रृंखला का रूप है:


आवृत्ति घनत्व

212-21 6

0,75

21 6-22 0

0,75

220-224

1,75

224-228

228-232

0,75

आइए आवृत्तियों का एक हिस्टोग्राम बनाएं:

आइए पहले अंतराल के मध्य बिंदुओं को ढूंढकर आवृत्तियों के बहुभुज का निर्माण करें:


सापेक्ष आवृत्तियों का हिस्टोग्रामआयतों से युक्त एक चरणबद्ध आकृति को कॉल करें, जिसके आधार लंबाई h के आंशिक अंतराल हैं, और ऊँचाई w के अनुपात के बराबर हैं मैं/ एच (सापेक्ष आवृत्ति घनत्व)।

वर्ग i-वें आंशिक आयत, i-वें अंतराल में आने वाले वैरिएंट की सापेक्ष आवृत्ति के बराबर है। वे। सापेक्ष आवृत्तियों के हिस्टोग्राम का क्षेत्रफल सभी सापेक्ष आवृत्तियों के योग के बराबर होता है, अर्थात। इकाई।

7. विविधता श्रृंखला की संख्यात्मक विशेषताएं

सामान्य और नमूना आबादी की मुख्य विशेषताओं पर विचार करें।

सामान्य माध्यमिकसामान्य जनसंख्या की विशेषता के मूल्यों का अंकगणितीय माध्य कहलाता है।

विभिन्न मानों के लिए x 1 , x 2 , x 3 , …, x n । मात्रा N की सामान्य जनसंख्या का संकेत हमारे पास है:

यदि विशेषता मानों में संगत आवृत्तियाँ हैं N 1 +N 2 +…+N k =N , तो


नमूना माध्यनमूना जनसंख्या की विशेषता के मूल्यों का अंकगणितीय माध्य कहा जाता है।

यदि विशेषता मानों में संगत आवृत्तियाँ हैं n 1 +n 2 +…+n k = n, तो


उदाहरण:

नमूने के लिए नमूना माध्य की गणना करें: x 1 = 51.12; x 2 \u003d 51.07; x 3 \u003d 52.95; x 4 \u003d 52.93; x 5 \u003d 51.1; x 6 \u003d 52.98; एक्स 7 \u003d 52.29; एक्स 8 \u003d 51.23; एक्स 9 \u003d 51.07; x10 = 51.04।

फेसला:

सामान्य विचरणसामान्य औसत से सामान्य जनसंख्या की विशेषता X के मानों के वर्ग विचलन का अंकगणितीय माध्य कहलाता है।

विभिन्न मूल्यों के लिए x 1 , x 2 , x 3 , …, x N मात्रा की जनसंख्या के संकेत के लिए हमारे पास है:

यदि विशेषता मानों में संगत आवृत्तियाँ हैं N 1 +N 2 +…+N k =N , तो

सामान्य मानक विचलन (मानक)सामान्य प्रसरण का वर्गमूल कहा जाता है

नमूना विचरणमाध्य मान से फीचर के प्रेक्षित मानों के वर्ग विचलन का अंकगणितीय माध्य कहलाता है।

विभिन्न मूल्यों के लिए x 1 , x 2 , x 3 , ..., x n मात्रा n के नमूना जनसंख्या के संकेत के लिए हमारे पास है:


यदि विशेषता मानों में संगत आवृत्तियाँ हैं n 1 +n 2 +…+n k = n, तो


नमूना मानक विचलन (मानक)प्रतिदर्श प्रसरण का वर्गमूल कहलाता है।


उदाहरण:

नमूना सेट वितरण तालिका द्वारा दिया गया है। नमूना विचरण ज्ञात कीजिए।


फेसला:

प्रमेय: विचरण विशेषता मानों के वर्गों के माध्य और कुल माध्य के वर्ग के बीच के अंतर के बराबर है।

उदाहरण:

इस बंटन के लिए प्रसरण ज्ञात कीजिए।



फेसला:

8. वितरण मापदंडों के सांख्यिकीय अनुमान

मान लीजिए कि सामान्य जनसंख्या का अध्ययन कुछ प्रतिदर्शों द्वारा किया जाता है। इस मामले में, अज्ञात पैरामीटर क्यू का केवल अनुमानित मान प्राप्त करना संभव है, जो इसके अनुमान के रूप में कार्य करता है। यह स्पष्ट है कि अनुमान एक नमूने से दूसरे नमूने में भिन्न हो सकते हैं।

सांख्यिकीय मूल्यांकनक्यू*सैद्धांतिक वितरण के अज्ञात पैरामीटर को फ़ंक्शन f कहा जाता है, जो नमूने के देखे गए मूल्यों पर निर्भर करता है। एक नमूने से अज्ञात मापदंडों के सांख्यिकीय आकलन का कार्य सांख्यिकीय अवलोकनों के उपलब्ध आंकड़ों से ऐसे फ़ंक्शन का निर्माण करना है, जो शोधकर्ता को वास्तविक, अज्ञात, इन मापदंडों के मूल्यों का सबसे सटीक अनुमानित मूल्य देगा।

सांख्यिकीय अनुमानों को प्रदान किए जाने के तरीके (संख्या या अंतराल) के आधार पर, बिंदु और अंतराल में विभाजित किया जाता है।

एक बिंदु अनुमान को सांख्यिकीय अनुमान कहा जाता है।पैरामीटर Q *=f (x 1 , x 2 , ..., x n) के एक मान द्वारा निर्धारित सैद्धांतिक वितरण का पैरामीटर Q, जहांएक्स 1 , एक्स 2 , ..., xn- एक निश्चित नमूने की मात्रात्मक विशेषता X पर अनुभवजन्य टिप्पणियों के परिणाम।

विभिन्न नमूनों से प्राप्त इस तरह के पैरामीटर अनुमान अक्सर एक दूसरे से भिन्न होते हैं। निरपेक्ष अंतर /Q *-Q / कहलाता है नमूना त्रुटि (अनुमान)।

अनुमानित मापदंडों के बारे में विश्वसनीय परिणाम देने के लिए सांख्यिकीय अनुमानों के लिए, यह आवश्यक है कि वे निष्पक्ष, कुशल और सुसंगत हों।

बिंदु अनुमान, जिसकी गणितीय अपेक्षा अनुमानित पैरामीटर के बराबर (बराबर नहीं) है, कहलाती है अपरिवर्तित (स्थानांतरित). एम (क्यू *) = क्यू।

अंतर एम ( Q*)-Q को कहा जाता है पूर्वाग्रह या व्यवस्थित त्रुटि. निष्पक्ष अनुमानों के लिए, व्यवस्थित त्रुटि 0 है।

कुशल मूल्यांकनक्यू *, जो, किसी दिए गए नमूना आकार n के लिए, सबसे छोटा संभव विचरण है: Dमिनट (एन = स्थिरांक)। अन्य निष्पक्ष और सुसंगत अनुमानकों की तुलना में प्रभावी अनुमानक का प्रसार सबसे छोटा होता है।

धनवानऐसा सांख्यिकीय कहा जाता है मूल्यांकन क्यू *, जो n . के लिएअनुमानित पैरामीटर की संभावना में जाता हैक्यू , अर्थात। नमूना आकार में वृद्धि के साथएन अनुमान पैरामीटर के सही मूल्य की संभावना में जाता हैक्यू।

संगति की आवश्यकता बड़ी संख्या के नियम के अनुरूप है: अध्ययन के तहत वस्तु के बारे में जितनी अधिक प्रारंभिक जानकारी होगी, परिणाम उतना ही सटीक होगा। यदि नमूना आकार छोटा है, तो पैरामीटर के बिंदु अनुमान से गंभीर त्रुटियां हो सकती हैं।

कोई भी नमूना (मात्राएन)एक आदेशित सेट के रूप में सोचा जा सकता हैएक्स 1 , एक्स 2 , ..., xnस्वतंत्र समान रूप से वितरित यादृच्छिक चर।

विभिन्न मात्रा के नमूनों के लिए नमूना का मतलब हैएन एक ही आबादी से अलग होगा। अर्थात्, प्रतिदर्श माध्य को एक यादृच्छिक चर माना जा सकता है, जिसका अर्थ है कि हम प्रतिदर्श माध्य के वितरण और इसकी संख्यात्मक विशेषताओं के बारे में बात कर सकते हैं।

नमूना माध्य सांख्यिकीय अनुमानों पर लगाई गई सभी आवश्यकताओं को पूरा करता है, अर्थात। जनसंख्या माध्य का एक निष्पक्ष, कुशल और सुसंगत अनुमान देता है।

यह सिद्ध किया जा सकता है कि. इस प्रकार, नमूना विचरण सामान्य विचरण का एक पक्षपाती अनुमान है, जो इसे कम करके आंका गया मान देता है। यानी छोटे सैंपल साइज के साथ यह सिस्टेमैटिक एरर देगा। एक निष्पक्ष, सुसंगत अनुमान के लिए, यह मात्रा लेने के लिए पर्याप्त है, जिसे सही विचरण कहा जाता है। अर्थात।

व्यवहार में, सामान्य विचरण का अनुमान लगाने के लिए, सही विचरण का उपयोग तब किया जाता है जबएन < 30. अन्य मामलों में ( n>30) से विचलन शायद ही ध्यान देने योग्य। इसलिए, बड़े मूल्यों के लिएएन पूर्वाग्रह त्रुटि की उपेक्षा की जा सकती है।

कोई यह भी सिद्ध कर सकता है कि आपेक्षिक आवृत्तिn i / n एक निष्पक्ष और सुसंगत संभाव्यता अनुमान हैपी (एक्स = एक्स आई ) अनुभवजन्य वितरण समारोहएफ * (एक्स ) सैद्धांतिक वितरण समारोह का एक निष्पक्ष और सुसंगत अनुमान हैएफ(एक्स)=पी(एक्स< x ).

उदाहरण:

नमूना तालिका से माध्य और विचरण के निष्पक्ष अनुमान खोजें।

एक्स मैं
मैं

फेसला:

नमूना आकार n = 20।

गणितीय अपेक्षा का निष्पक्ष अनुमान नमूना माध्य है।


विचरण के निष्पक्ष अनुमान की गणना करने के लिए, हम पहले नमूना विचरण पाते हैं:

आइए अब निष्पक्ष अनुमान लगाएं:

9. वितरण मापदंडों के अंतराल अनुमान

एक अंतराल अनुमान एक सांख्यिकीय अनुमान है जो दो संख्यात्मक मानों द्वारा निर्धारित किया जाता है - अध्ययन के तहत अंतराल के अंत।

संख्या> 0 जिसके लिए | क्यू - क्यू*|< , अंतराल अनुमान की सटीकता की विशेषता है।

विश्वस्तबुलाया मध्यान्तर , जो दी गई संभावना के साथअज्ञात पैरामीटर मान को शामिल करता हैक्यू . सभी संभावित पैरामीटर मानों के सेट पर कॉन्फिडेंस इंटरवल को लागू करनाक्यू बुलाया महत्वपूर्ण क्षेत्र. यदि क्रिटिकल क्षेत्र कॉन्फिडेंस इंटरवल के केवल एक तरफ स्थित है, तो कॉन्फिडेंस इंटरवल कहलाता है एकतरफा: वामपंथी, यदि क्रांतिक क्षेत्र केवल बाईं ओर मौजूद है, और दांए हाथ से काम करने वालाजब तक कि दाईं ओर। अन्यथा, विश्वास अंतराल कहा जाता है द्विपक्षीय.

विश्वसनीयता, या आत्मविश्वास का स्तर, क्यू अनुमान (क्यू . का उपयोग करके) *) उस प्रायिकता को नाम दें जिससे निम्नलिखित असमानता पूरी होती है: |क्यू - क्यू*|< .

सबसे अधिक बार, आत्मविश्वास की संभावना पहले से निर्धारित होती है (0.95; 0.99; 0.999) और उस पर एक के करीब होने की आवश्यकता होती है।

संभावनाबुलाया त्रुटि की संभावना, या महत्व का स्तर।

चलो | क्यू - क्यू*|< , तब. इसका मतलब है कि संभावना के साथयह तर्क दिया जा सकता है कि पैरामीटर का सही मूल्यक्यू अंतराल के अंतर्गत आता है. विचलन जितना छोटा होगा, अनुमान जितना सटीक होगा।

कॉन्फिडेंस इंटरवल की सीमाओं (सिरों) को कहा जाता है आत्मविश्वास की सीमाएँ, या महत्वपूर्ण सीमाएँ।

विश्वास अंतराल की सीमाओं के मान पैरामीटर के वितरण कानून पर निर्भर करते हैंक्यू*।

विचलन मूल्यकॉन्फिडेंस इंटरवल की आधी चौड़ाई कहलाती है मूल्यांकन सटीकता।

विश्वास अंतराल के निर्माण के तरीके सबसे पहले अमेरिकी सांख्यिकीविद् वाई. न्यूमैन द्वारा विकसित किए गए थे। अनुमान सटीकता, आत्मविश्वास संभावना और नमूना आकार n आपस में जुड़ा हुआ। इसलिए, दो मात्राओं के विशिष्ट मूल्यों को जानकर, आप हमेशा तीसरे की गणना कर सकते हैं।

यदि मानक विचलन ज्ञात है, तो सामान्य वितरण की गणितीय अपेक्षा का अनुमान लगाने के लिए विश्वास अंतराल का पता लगाना।

सामान्य वितरण के नियम के अधीन, सामान्य जनसंख्या से एक नमूना बनाया जाए। सामान्य मानक विचलन ज्ञात होने दें, लेकिन सैद्धांतिक वितरण की गणितीय अपेक्षा अज्ञात हैए ().

निम्नलिखित सूत्र मान्य है:

वे। निर्दिष्ट विचलन मूल्य के अनुसारयह ज्ञात करना संभव है कि अज्ञात सामान्य माध्य किस प्रायिकता के साथ अंतराल से संबंधित है. और इसके विपरीत। यह सूत्र से देखा जा सकता है कि नमूना आकार में वृद्धि और आत्मविश्वास की संभावना के एक निश्चित मूल्य के साथ, मूल्य- घटता है, अर्थात्। अनुमान की सटीकता बढ़ जाती है। विश्वसनीयता में वृद्धि (आत्मविश्वास की संभावना) के साथ, मूल्य-बढ़ता है, अर्थात्। अनुमान की सटीकता कम हो जाती है।

उदाहरण:

परीक्षणों के परिणामस्वरूप, निम्नलिखित मान प्राप्त किए गए -25, 34, -20, 10, 21। यह ज्ञात है कि वे सामान्य वितरण कानून का पालन 2 के मानक विचलन के साथ करते हैं। गणितीय अपेक्षा ए. इसके लिए 90% कॉन्फिडेंस इंटरवल प्लॉट करें।

फेसला:

आइए जानें निष्पक्ष अनुमान

फिर


एक के लिए विश्वास अंतराल का रूप है: 4 - 1.47< ए< 4+ 1,47 или 2,53 < a < 5, 47

यदि मानक विचलन अज्ञात है, तो सामान्य वितरण की गणितीय अपेक्षा का अनुमान लगाने के लिए विश्वास अंतराल का पता लगाना।

बता दें कि सामान्य जनसंख्या सामान्य वितरण के कानून के अधीन है, जहां ए और. विश्वास अंतराल की सटीकता विश्वसनीयता के साथ कवरिंगइस मामले में पैरामीटर a का सही मान, सूत्र द्वारा परिकलित किया जाता है:

, जहां n नमूना आकार है, , - विद्यार्थी का गुणांक (यह दिए गए मानों से ज्ञात किया जाना चाहिएएन और तालिका से "छात्र वितरण के महत्वपूर्ण बिंदु")।

उदाहरण:

परीक्षणों के परिणामस्वरूप, निम्नलिखित मान प्राप्त किए गए -35, -32, -26, -35, -30, -17। यह ज्ञात है कि वे सामान्य वितरण के नियम का पालन करते हैं। 0.9 के विश्वास स्तर के साथ जनसंख्या माध्य a के लिए विश्वास अंतराल ज्ञात कीजिए।

फेसला:

आइए जानें निष्पक्ष अनुमान.

हमे पता करने दें.

फिर

विश्वास अंतराल रूप लेगा(-29.2 - 5.62; -29.2 + 5.62) या (-34.82; -23.58)।

एक सामान्य वितरण के विचरण और मानक विचलन के लिए विश्वास अंतराल ढूँढना

सामान्य नियम के अनुसार वितरित मूल्यों के कुछ सामान्य सेट से मात्रा का एक यादृच्छिक नमूना लेने देंएन < 30 जिसके लिए नमूना प्रसरणों की गणना की जाती है: पक्षपातीऔर सही एस 2. फिर दी गई विश्वसनीयता के साथ अंतराल अनुमानों को खोजने के लिएसामान्य फैलाव के लिएडीसामान्य मानक विचलननिम्नलिखित सूत्रों का उपयोग किया जाता है।


या,

मूल्यों- महत्वपूर्ण बिंदुओं के मूल्यों की तालिका का उपयोग करके खोजेंपियर्सन वितरण।

असमानता के सभी भागों को चुकता करके इन असमानताओं से भिन्नता के लिए विश्वास अंतराल पाया जाता है।

उदाहरण:

15 बोल्ट की गुणवत्ता की जांच की गई। यह मानते हुए कि उनके निर्माण में त्रुटि सामान्य वितरण कानून और नमूना मानक विचलन के अधीन है5 मिमी के बराबर, विश्वसनीयता के साथ निर्धारित करेंअज्ञात पैरामीटर के लिए विश्वास अंतराल

हम अंतराल की सीमाओं को दोहरी असमानता के रूप में निरूपित करते हैं:

विचरण के लिए दो-तरफा आत्मविश्वास अंतराल के सिरों को संबंधित तालिका का उपयोग करके दिए गए आत्मविश्वास और नमूना आकार के लिए अंकगणितीय संचालन किए बिना निर्धारित किया जा सकता है (स्वतंत्रता और विश्वसनीयता की डिग्री की संख्या के आधार पर भिन्नता के लिए आत्मविश्वास अंतराल की सीमाएं ) ऐसा करने के लिए, तालिका से प्राप्त अंतराल के सिरों को सही विचरण s 2 . से गुणा किया जाता है.

उदाहरण:

आइए पिछली समस्या को अलग तरीके से हल करें।

फेसला:

आइए सही विचरण का पता लगाएं:

तालिका के अनुसार "स्वतंत्रता और विश्वसनीयता की डिग्री की संख्या के आधार पर भिन्नता के लिए आत्मविश्वास अंतराल की सीमाएं", हम भिन्नता के लिए विश्वास अंतराल की सीमाएं पाते हैं=14 और: निचली सीमा 0.513 और ऊपरी सीमा 2.354।

प्राप्त सीमाओं को गुणा करेंs 2 और रूट निकालें (क्योंकि हमें विचरण के लिए नहीं, बल्कि मानक विचलन के लिए एक विश्वास अंतराल की आवश्यकता है)।

जैसा कि उदाहरणों से देखा जा सकता है, विश्वास अंतराल का मूल्य इसके निर्माण की विधि पर निर्भर करता है और निकट लेकिन अलग परिणाम देता है।

पर्याप्त रूप से बड़े आकार के नमूनों के लिए (एन>30) सामान्य मानक विचलन के लिए विश्वास अंतराल की सीमाएं सूत्र द्वारा निर्धारित की जा सकती हैं: - कुछ संख्या, जो सारणीबद्ध है और संबंधित संदर्भ तालिका में दी गई है।

अगर 1- क्यू<1, то формула имеет вид:

उदाहरण:

आइए पिछली समस्या को तीसरे तरीके से हल करें।

फेसला:

पहले पाया गयाएस= 5,17. क्यू(0.95; 15) = 0.46 - हम तालिका के अनुसार पाते हैं।

फिर:

अक्सर ऐसा होता है कि किसी विशेष सामाजिक घटना का विश्लेषण करना और उसके बारे में जानकारी प्राप्त करना आवश्यक होता है। ऐसे कार्य अक्सर सांख्यिकी और सांख्यिकीय अनुसंधान में उत्पन्न होते हैं। पूरी तरह से परिभाषित सामाजिक घटना का सत्यापन अक्सर असंभव होता है। उदाहरण के लिए, किसी भी मुद्दे पर किसी शहर की आबादी या सभी निवासियों की राय कैसे पता करें? बिल्कुल हर किसी से पूछना लगभग असंभव और बहुत श्रमसाध्य है। ऐसे मामलों में, हमें एक नमूने की आवश्यकता होती है। यह ठीक वही अवधारणा है जिस पर लगभग सभी शोध और विश्लेषण आधारित हैं।

नमूना क्या है

किसी विशेष सामाजिक घटना का विश्लेषण करते समय, उसके बारे में जानकारी प्राप्त करना आवश्यक है। यदि हम कोई अध्ययन करें तो हम देख सकते हैं कि अध्ययन की वस्तु की समग्रता की प्रत्येक इकाई अनुसंधान और विश्लेषण के अधीन नहीं होती है। इस समग्रता का केवल एक निश्चित भाग ही ध्यान में रखा जाता है। यह प्रक्रिया नमूना है: जब सेट से केवल कुछ इकाइयों की जांच की जाती है।

बेशक, बहुत कुछ नमूने के प्रकार पर निर्भर करता है। लेकिन बुनियादी नियम भी हैं। मुख्य कहता है कि जनसंख्या से चयन बिल्कुल यादृच्छिक होना चाहिए। उपयोग की जाने वाली जनसंख्या इकाइयों का चयन किसी मानदंड के कारण नहीं किया जाना चाहिए। मोटे तौर पर, यदि किसी निश्चित शहर की आबादी से जनसंख्या एकत्र करना और केवल पुरुषों का चयन करना आवश्यक है, तो अध्ययन में एक त्रुटि होगी, क्योंकि चयन यादृच्छिक रूप से नहीं किया गया था, बल्कि लिंग के अनुसार चुना गया था। लगभग सभी न्यादर्श विधियाँ इसी नियम पर आधारित हैं।

नमूना नियम

पूरी घटना के मुख्य गुणों को प्रतिबिंबित करने के लिए चयनित सेट के लिए, इसे विशिष्ट कानूनों के अनुसार बनाया जाना चाहिए, जहां निम्नलिखित श्रेणियों पर मुख्य ध्यान दिया जाना चाहिए:

  • नमूना (नमूना जनसंख्या);
  • सामान्य जनसंख्या;
  • प्रतिनिधित्व;
  • प्रतिनिधित्व त्रुटि;
  • जनसंख्या इकाई;
  • नमूनाकरण के तरीके।

चयनात्मक अवलोकन और नमूने की विशेषताएं इस प्रकार हैं:

  1. प्राप्त सभी परिणाम गणितीय नियमों और नियमों पर आधारित हैं, अर्थात अध्ययन के सही संचालन और सही गणना के साथ, परिणाम व्यक्तिपरक आधार पर विकृत नहीं होंगे।
  2. यह बहुत तेजी से और कम समय और संसाधनों के साथ परिणाम प्राप्त करना संभव बनाता है, घटनाओं की पूरी श्रृंखला का अध्ययन नहीं करता है, बल्कि उनमें से केवल एक हिस्सा है।
  3. इसका उपयोग विभिन्न वस्तुओं का अध्ययन करने के लिए किया जा सकता है: विशिष्ट मुद्दों से, उदाहरण के लिए, आयु, हमारे लिए रुचि के समूह का लिंग, जनमत के अध्ययन या जनसंख्या के भौतिक समर्थन के स्तर तक।

चयनात्मक अवलोकन

चयनात्मक - यह एक ऐसा सांख्यिकीय अवलोकन है जिसमें अध्ययन की गई पूरी आबादी पर शोध नहीं किया जाता है, बल्कि इसके कुछ हिस्से को एक निश्चित तरीके से चुना जाता है, और इस हिस्से के अध्ययन के परिणाम पूरी आबादी पर लागू होते हैं। इस भाग को सैम्पलिंग फ्रेम कहते हैं। अध्ययन की वस्तु की एक बड़ी श्रृंखला का अध्ययन करने का यही एकमात्र तरीका है।

लेकिन चयनात्मक अवलोकन का उपयोग केवल उन मामलों में किया जा सकता है जहां इकाइयों के केवल एक छोटे समूह का अध्ययन करना आवश्यक हो। उदाहरण के लिए, दुनिया में पुरुषों और महिलाओं के अनुपात का अध्ययन करते समय, चयनात्मक अवलोकन का उपयोग किया जाएगा। स्पष्ट कारणों से, हमारे ग्रह के प्रत्येक निवासी को ध्यान में रखना असंभव है।

लेकिन एक ही अध्ययन के साथ, लेकिन पृथ्वी के सभी निवासियों के नहीं, बल्कि एक विशेष स्कूल, एक निश्चित शहर, एक निश्चित देश में एक निश्चित 2 "ए" वर्ग के, चयनात्मक अवलोकन से दूर किया जा सकता है। आखिरकार, अध्ययन की वस्तु की पूरी श्रृंखला का विश्लेषण करना काफी संभव है। इस वर्ग के लड़के-लड़कियों की गिनती करना आवश्यक है - यही अनुपात होगा।

नमूना और जनसंख्या

यह वास्तव में उतना कठिन नहीं है जितना लगता है। अध्ययन की किसी भी वस्तु में दो प्रणालियाँ होती हैं: सामान्य और नमूना जनसंख्या। यह क्या है? सभी इकाइयां सामान्य से संबंधित हैं। और नमूने के लिए - कुल जनसंख्या की वे इकाइयाँ जिन्हें नमूने के लिए लिया गया था। यदि सब कुछ सही ढंग से किया जाता है, तो चयनित भाग संपूर्ण (सामान्य) आबादी का एक छोटा लेआउट होगा।

यदि हम सामान्य जनसंख्या के बारे में बात करते हैं, तो हम इसकी केवल दो किस्मों को अलग कर सकते हैं: निश्चित और अनिश्चित सामान्य जनसंख्या। इस पर निर्भर करता है कि किसी दिए गए सिस्टम की इकाइयों की कुल संख्या ज्ञात है या नहीं। यदि यह एक निश्चित जनसंख्या है, तो नमूना लेना आसान होगा क्योंकि यह ज्ञात है कि कुल इकाइयों की संख्या का कितना प्रतिशत नमूना लिया जाएगा।

शोध में यह क्षण अत्यंत आवश्यक है। उदाहरण के लिए, यदि किसी विशेष संयंत्र में निम्न-गुणवत्ता वाले कन्फेक्शनरी उत्पादों के प्रतिशत की जांच करना आवश्यक है। मान लें कि जनसंख्या को पहले ही परिभाषित किया जा चुका है। यह निश्चित रूप से ज्ञात है कि यह उद्यम प्रति वर्ष 1000 कन्फेक्शनरी उत्पादों का उत्पादन करता है। यदि हम इस हजार में से 100 यादृच्छिक कन्फेक्शनरी उत्पादों का नमूना बनाकर जांच के लिए भेजते हैं, तो त्रुटि न्यूनतम होगी। मोटे तौर पर, सभी उत्पादों का 10% अनुसंधान के अधीन था, और परिणामों के आधार पर, प्रतिनिधित्व त्रुटि को ध्यान में रखते हुए, हम सभी उत्पादों की खराब गुणवत्ता के बारे में बात कर सकते हैं।

और यदि आप एक अनिश्चित सामान्य आबादी से 100 कन्फेक्शनरी उत्पादों का एक नमूना बनाते हैं, जहां वास्तव में, कहते हैं, 1 मिलियन इकाइयाँ थीं, तो नमूना और अध्ययन का परिणाम स्वयं गंभीर रूप से असंभव और गलत होगा। अंतर महसूस करें? इसलिए, ज्यादातर मामलों में सामान्य आबादी की निश्चितता अत्यंत महत्वपूर्ण है और अध्ययन के परिणाम को बहुत प्रभावित करती है।

जनसंख्या प्रतिनिधित्व

तो, अब सबसे महत्वपूर्ण प्रश्नों में से एक - नमूना क्या होना चाहिए? यह अध्ययन का सबसे महत्वपूर्ण बिंदु है। इस स्तर पर, नमूने की गणना करना और उसमें कुल संख्या से इकाइयों का चयन करना आवश्यक है। जनसंख्या का चयन सही ढंग से किया गया था यदि सामान्य जनसंख्या की कुछ विशेषताएं और विशेषताएं नमूने में रहती हैं। इसे प्रतिनिधित्ववाद कहा जाता है।

दूसरे शब्दों में, यदि, चयन के बाद, एक हिस्सा समान प्रवृत्तियों और विशेषताओं को बरकरार रखता है जैसे कि जांच की गई पूरी मात्रा, तो ऐसी आबादी को प्रतिनिधि कहा जाता है। लेकिन प्रत्येक विशिष्ट नमूने को एक प्रतिनिधि आबादी से नहीं चुना जा सकता है। अनुसंधान की ऐसी वस्तुएँ भी हैं, जिनका नमूना केवल प्रतिनिधि नहीं हो सकता। यह वह जगह है जहाँ से प्रतिनिधित्व त्रुटि की अवधारणा आती है। लेकिन चलिए इसके बारे में थोड़ा और बात करते हैं।

नमूना कैसे बनाएं

इसलिए, प्रतिनिधित्व को अधिकतम करने के लिए, तीन बुनियादी नमूना नियम हैं:


प्रतिनिधित्व की त्रुटि (त्रुटि)

चयनित नमूने की गुणवत्ता की मुख्य विशेषता "प्रतिनिधित्व त्रुटि" की अवधारणा है। यह क्या है? चयनात्मक और निरंतर अवलोकन के संकेतकों के बीच ये कुछ विसंगतियां हैं। त्रुटि संकेतकों के अनुसार, प्रतिनिधित्व को विश्वसनीय, सामान्य और अनुमानित में विभाजित किया गया है। दूसरे शब्दों में, क्रमशः 3% तक, 3 से 10% तक और 10 से 20% तक के विचलन स्वीकार्य हैं। हालांकि आंकड़ों में यह वांछनीय है कि त्रुटि 5-6% से अधिक न हो। अन्यथा, नमूने के अपर्याप्त प्रतिनिधित्व के बारे में बात करने का कारण है। प्रतिनिधित्व त्रुटि की गणना करने के लिए और यह नमूना या जनसंख्या को कैसे प्रभावित करता है, कई कारकों को ध्यान में रखा जाता है:

  1. प्रायिकता जिसके साथ एक सटीक परिणाम प्राप्त किया जाना है।
  2. नमूना इकाइयों की संख्या। जैसा कि पहले उल्लेख किया गया है, नमूने में इकाइयों की संख्या जितनी कम होगी, प्रतिनिधित्व त्रुटि उतनी ही अधिक होगी, और इसके विपरीत।
  3. अध्ययन जनसंख्या की एकरूपता। जनसंख्या जितनी अधिक विषम होगी, प्रतिनिधित्व त्रुटि उतनी ही अधिक होगी। किसी जनसंख्या की प्रतिनिधि होने की क्षमता उसकी सभी घटक इकाइयों की एकरूपता पर निर्भर करती है।
  4. एक नमूना जनसंख्या में इकाइयों के चयन की एक विधि।

विशिष्ट अध्ययनों में, माध्य की प्रतिशत त्रुटि आमतौर पर शोधकर्ता द्वारा स्वयं अवलोकन कार्यक्रम के आधार पर और पिछले अध्ययनों के आंकड़ों के अनुसार निर्धारित की जाती है। एक नियम के रूप में, अधिकतम नमूना त्रुटि (प्रतिनिधित्व की त्रुटि) 3-5% के भीतर स्वीकार्य मानी जाती है।

अति हर बार अच्छी नहीं होती है

यह भी याद रखने योग्य है कि चयनात्मक अवलोकन के आयोजन में मुख्य बात इसकी मात्रा को स्वीकार्य न्यूनतम तक लाना है। उसी समय, किसी को नमूना त्रुटि सीमा को अत्यधिक कम करने का प्रयास नहीं करना चाहिए, क्योंकि इससे नमूना डेटा की मात्रा में अनुचित वृद्धि हो सकती है और परिणामस्वरूप, नमूने की लागत में वृद्धि हो सकती है।

साथ ही, प्रतिनिधित्व त्रुटि का आकार अत्यधिक नहीं बढ़ाया जाना चाहिए। आखिरकार, इस मामले में, हालांकि नमूना आकार में कमी होगी, इससे प्राप्त परिणामों की विश्वसनीयता में गिरावट आएगी।

आमतौर पर शोधकर्ता द्वारा कौन से प्रश्न पूछे जाते हैं?

कोई भी शोध, यदि किया जाता है, तो किसी उद्देश्य के लिए और कुछ परिणाम प्राप्त करने के लिए होता है। नमूना सर्वेक्षण करते समय, एक नियम के रूप में, प्रारंभिक प्रश्न हैं:


नमूने में अनुसंधान इकाइयों के चयन के तरीके

हर नमूना प्रतिनिधि नहीं है। कभी-कभी एक और एक ही चिन्ह को पूरे और उसके हिस्से में अलग-अलग तरीके से व्यक्त किया जाता है। प्रतिनिधित्व की आवश्यकताओं को प्राप्त करने के लिए, विभिन्न नमूनाकरण विधियों का उपयोग करने की सलाह दी जाती है। इसके अलावा, एक विधि या किसी अन्य का उपयोग विशिष्ट परिस्थितियों पर निर्भर करता है। इनमें से कुछ नमूनाकरण विधियों में शामिल हैं:

  • यादृच्छिक चयन;
  • यांत्रिक चयन;
  • विशिष्ट चयन;
  • सीरियल (नेस्टेड) ​​चयन।

यादृच्छिक चयन जनसंख्या इकाइयों के यादृच्छिक चयन के उद्देश्य से गतिविधियों की एक प्रणाली है, जब नमूने में शामिल होने की संभावना सामान्य जनसंख्या की सभी इकाइयों के लिए समान होती है। इस तकनीक को केवल एकरूपता और इसकी अंतर्निहित विशेषताओं की एक छोटी संख्या के मामले में लागू करने की सलाह दी जाती है। अन्यथा, कुछ विशिष्ट विशेषताएं नमूने में प्रतिबिंबित नहीं होने का जोखिम उठाती हैं। यादृच्छिक चयन की विशेषताएं नमूने के अन्य सभी तरीकों के अंतर्गत आती हैं।

इकाइयों के यांत्रिक चयन के साथ एक निश्चित अंतराल पर किया जाता है। यदि विशिष्ट अपराधों का एक नमूना बनाना आवश्यक है, तो उनकी कुल संख्या और उपलब्ध नमूना आकारों के आधार पर, दर्ज किए गए अपराधों के सभी सांख्यिकीय रिकॉर्ड से प्रत्येक 5 वें, 10 वें या 15 वें कार्ड को हटाना संभव है। इस पद्धति का नुकसान यह है कि चयन से पहले जनसंख्या की इकाइयों का पूरा लेखा-जोखा होना आवश्यक है, फिर एक रैंकिंग करना आवश्यक है, और उसके बाद ही एक निश्चित अंतराल के साथ नमूना लेना संभव है। इस पद्धति में बहुत समय लगता है, इसलिए इसका उपयोग अक्सर नहीं किया जाता है।

विशिष्ट (क्षेत्रीय) चयन एक प्रकार का नमूना है जिसमें सामान्य जनसंख्या को एक निश्चित विशेषता के अनुसार सजातीय समूहों में विभाजित किया जाता है। कभी-कभी शोधकर्ता "समूह": "जिलों" और "क्षेत्रों" के बजाय अन्य शब्दों का उपयोग करते हैं। फिर, प्रत्येक समूह से, कुल जनसंख्या में समूह के हिस्से के अनुपात में एक निश्चित संख्या में इकाइयाँ यादृच्छिक रूप से चुनी जाती हैं। एक विशिष्ट चयन अक्सर कई चरणों में किया जाता है।

सीरियल सैंपलिंग एक ऐसी विधि है जिसमें इकाइयों का चयन समूहों (श्रृंखला) में किया जाता है और चयनित समूह (श्रृंखला) की सभी इकाइयाँ परीक्षा के अधीन होती हैं। इस पद्धति का लाभ यह है कि कभी-कभी श्रृंखला की तुलना में अलग-अलग इकाइयों का चयन करना अधिक कठिन होता है, उदाहरण के लिए, एक व्यक्ति का अध्ययन करते समय जो एक वाक्य की सेवा कर रहा है। चयनित क्षेत्रों, क्षेत्रों के भीतर, बिना किसी अपवाद के सभी इकाइयों का अध्ययन लागू किया जाता है, उदाहरण के लिए, किसी विशेष संस्थान में वाक्यों की सेवा करने वाले सभी व्यक्तियों का अध्ययन।

पूरी आबादी के बारे में निष्कर्ष निकालने के लिए अध्ययन के लिए चुनी गई आबादी से वस्तुओं का एक हिस्सा। नमूने का अध्ययन करके प्राप्त निष्कर्ष को पूरी आबादी तक विस्तारित करने के लिए, नमूने में प्रतिनिधि होने का गुण होना चाहिए।

नमूना प्रतिनिधित्व

सामान्य जनसंख्या को सही ढंग से प्रतिबिंबित करने के लिए नमूने की संपत्ति। एक ही नमूना विभिन्न आबादी का प्रतिनिधि हो भी सकता है और नहीं भी।
उदाहरण:

पूरी तरह से मस्कोवाइट्स का एक नमूना, जिसके पास एक कार है, मास्को की पूरी आबादी का प्रतिनिधित्व नहीं करता है।

अधिकतम 100 कर्मचारियों वाले रूसी उद्यमों का नमूना रूस में सभी उद्यमों का प्रतिनिधित्व नहीं करता है।

बाजार में खरीदारी करने वाले Muscovites का नमूना सभी Muscovites के क्रय व्यवहार का प्रतिनिधित्व नहीं करता है।

साथ ही, ये नमूने (अन्य शर्तों के अधीन) पूरी तरह से मस्कोवाइट कार मालिकों, छोटे और मध्यम आकार के रूसी उद्यमों और बाजारों में खरीदारी करने वाले खरीदारों का प्रतिनिधित्व कर सकते हैं।

यह समझना महत्वपूर्ण है कि नमूना प्रतिनिधित्व और नमूना त्रुटि अलग-अलग घटनाएं हैं। त्रुटि के विपरीत प्रतिनिधित्व, नमूना आकार पर निर्भर नहीं करता है।

हम सर्वेक्षण किए गए मस्कोवाइट्स-कार मालिकों की संख्या में कितना भी वृद्धि करें, हम इस नमूने के साथ सभी मस्कोवाइट्स का प्रतिनिधित्व नहीं कर पाएंगे।

नमूनाकरण त्रुटि (विश्वास अंतराल)

सामान्य जनसंख्या के वास्तविक आंकड़ों से नमूना अवलोकन की सहायता से प्राप्त परिणामों का विचलन।

नमूना त्रुटि दो प्रकार की होती है: सांख्यिकीय और व्यवस्थित। सांख्यिकीय त्रुटि नमूना आकार पर निर्भर करती है। नमूना आकार जितना बड़ा होगा, उतना ही कम होगा।

उदाहरण:
400 इकाइयों के एक साधारण यादृच्छिक नमूने के लिए, अधिकतम सांख्यिकीय त्रुटि (95% आत्मविश्वास के साथ) 5% है, 600 इकाइयों के नमूने के लिए - 4%, 1100 इकाइयों के नमूने के लिए - 3%।

व्यवस्थित त्रुटि विभिन्न कारकों पर निर्भर करती है जो अध्ययन पर निरंतर प्रभाव डालते हैं और अध्ययन के परिणामों को एक निश्चित दिशा में पूर्वाग्रहित करते हैं।

उदाहरण:
- किसी भी संभाव्यता नमूने का उपयोग सक्रिय जीवन शैली का नेतृत्व करने वाले उच्च आय वाले लोगों के अनुपात को कम करके आंका जाता है। यह इस तथ्य के कारण होता है कि ऐसे लोगों को किसी विशेष स्थान (उदाहरण के लिए, घर पर) में ढूंढना अधिक कठिन होता है।

प्रश्नावली के सवालों के जवाब देने से इनकार करने वाले उत्तरदाताओं की समस्या (विभिन्न सर्वेक्षणों के लिए मॉस्को में "रिफ्यूसेनिक" का हिस्सा, 50% से 80% तक है)

कुछ मामलों में, जब सही वितरण ज्ञात होते हैं, तो कोटा शुरू करके या डेटा को फिर से भारित करके पूर्वाग्रह को समतल किया जा सकता है, लेकिन अधिकांश वास्तविक अध्ययनों में, इसका अनुमान लगाना भी काफी समस्याग्रस्त हो सकता है।

नमूना प्रकार

नमूने दो प्रकारों में विभाजित हैं:

संभाव्य

असंभवता

संभाव्यता नमूने

1.1 यादृच्छिक नमूनाकरण (सरल यादृच्छिक चयन)

ऐसा नमूना सामान्य जनसंख्या की एकरूपता, सभी तत्वों की उपलब्धता की समान संभावना, सभी तत्वों की पूरी सूची की उपस्थिति को मानता है। तत्वों का चयन करते समय, एक नियम के रूप में, यादृच्छिक संख्याओं की एक तालिका का उपयोग किया जाता है।
1.2 यांत्रिक (व्यवस्थित) नमूनाकरण

एक प्रकार का यादृच्छिक नमूना, कुछ विशेषता (वर्णमाला क्रम, फोन नंबर, जन्म तिथि, आदि) द्वारा क्रमबद्ध। पहले तत्व को यादृच्छिक रूप से चुना जाता है, फिर प्रत्येक 'k'th तत्व को 'n' की वृद्धि में चुना जाता है। सामान्य जनसंख्या का आकार, जबकि - N=n*k

1.3 स्तरीकृत (क्षेत्रीय)

इसका उपयोग सामान्य जनसंख्या की विषमता के मामले में किया जाता है। सामान्य जनसंख्या समूहों (स्तर) में विभाजित है। प्रत्येक स्तर में, चयन बेतरतीब ढंग से या यंत्रवत् किया जाता है।

1.4 सीरियल (नेस्टेड या क्लस्टर्ड) सैंपलिंग

सीरियल सैंपलिंग के साथ, चयन की इकाइयाँ स्वयं वस्तु नहीं होती हैं, बल्कि समूह (समूह या घोंसले) होते हैं। समूहों को यादृच्छिक रूप से चुना जाता है। समूहों के भीतर की वस्तुओं का हर जगह सर्वेक्षण किया जाता है।

अविश्वसनीय नमूने

इस तरह के नमूने में चयन संयोग के सिद्धांतों के अनुसार नहीं, बल्कि व्यक्तिपरक मानदंडों के अनुसार किया जाता है - पहुंच, विशिष्टता, समान प्रतिनिधित्व, आदि।

कोटा नमूना

प्रारंभ में, वस्तुओं के समूहों की एक निश्चित संख्या आवंटित की जाती है (उदाहरण के लिए, 20-30 वर्ष, 31-45 वर्ष और 46-60 वर्ष की आयु के पुरुष; 30 से 60 की आय वाले 30 हजार रूबल तक की आय वाले व्यक्ति) हजार रूबल और 60 हजार से अधिक रूबल की आय के साथ) प्रत्येक समूह के लिए सर्वेक्षण की जाने वाली वस्तुओं की संख्या निर्दिष्ट है। प्रत्येक समूह में आने वाली वस्तुओं की संख्या निर्धारित की जाती है, सबसे अधिक बार, या तो सामान्य आबादी में समूह के पहले ज्ञात हिस्से के अनुपात में, या प्रत्येक समूह के लिए समान। समूहों के भीतर, वस्तुओं को यादृच्छिक रूप से चुना जाता है। विपणन अनुसंधान में अक्सर कोटा नमूनों का उपयोग किया जाता है।

स्नोबॉल विधि

नमूना निम्नानुसार बनाया गया है। प्रत्येक उत्तरदाता, पहले से शुरू करते हुए, अपने दोस्तों, सहकर्मियों, परिचितों से संपर्क करने के लिए कहा जाता है जो चयन की शर्तों में फिट होंगे और अध्ययन में भाग ले सकते हैं। इस प्रकार, पहले चरण के अपवाद के साथ, नमूना स्वयं अध्ययन की वस्तुओं की भागीदारी के साथ बनता है। विधि का उपयोग अक्सर तब किया जाता है जब उत्तरदाताओं के कठिन-से-पहुंच समूहों को ढूंढना और उनका साक्षात्कार करना आवश्यक होता है (उदाहरण के लिए, उच्च आय वाले उत्तरदाता, एक ही पेशेवर समूह से संबंधित उत्तरदाता, उत्तरदाता जिनके कुछ समान शौक / जुनून हैं, आदि। )
2.3 स्वतःस्फूर्त नमूनाकरण

सर्वाधिक सुलभ उत्तरदाताओं का सर्वेक्षण किया जाता है। स्वतःस्फूर्त प्रतिचयन के विशिष्ट उदाहरण हैं समाचार पत्रों/पत्रिकाओं में सर्वेक्षण, उत्तरदाताओं को स्वतः पूर्णता के लिए दिए गए प्रश्नावली, अधिकांश इंटरनेट सर्वेक्षण। यादृच्छिक नमूनों का आकार और संरचना पहले से ज्ञात नहीं है, और केवल एक पैरामीटर द्वारा निर्धारित किया जाता है - उत्तरदाताओं की गतिविधि।
2.4 विशिष्ट मामलों का नमूना

सामान्य जनसंख्या की इकाइयाँ चुनी जाती हैं जिनमें विशेषता का औसत (विशिष्ट) मान होता है। यह एक विशेषता को चुनने और उसके विशिष्ट मूल्य को निर्धारित करने की समस्या को उठाता है।

अनुसंधान योजना का कार्यान्वयन

हमें याद है कि इस चरण में सूचना का संग्रह और उसका विश्लेषण शामिल है। एक विपणन अनुसंधान योजना को लागू करने की प्रक्रिया में आमतौर पर सबसे अधिक शोध की आवश्यकता होती है और यह सबसे बड़ी त्रुटि का स्रोत है।

सांख्यिकीय डेटा एकत्र करते समय, कई कमियां और समस्याएं उत्पन्न होती हैं:

सबसे पहले, कुछ उत्तरदाता सहमत स्थान पर नहीं हो सकते हैं और उन्हें फिर से संपर्क करना होगा या उन्हें बदलना होगा;

दूसरे, कुछ उत्तरदाता असहयोगी हो सकते हैं या पक्षपातपूर्ण, जानबूझकर गलत उत्तर दे सकते हैं।

आधुनिक कंप्यूटिंग और दूरसंचार प्रौद्योगिकियों के लिए धन्यवाद, डेटा संग्रह विधियों का विकास और सुधार हो रहा है।

कुछ फर्में एक ही केंद्र से सर्वेक्षण करती हैं। इस मामले में, पेशेवर साक्षात्कारकर्ता कार्यालयों में बैठते हैं और यादृच्छिक फोन नंबर डायल करते हैं। यदि वे कॉल करने वालों की प्रतिक्रिया सुनते हैं, तो साक्षात्कारकर्ता उस व्यक्ति से कुछ सवालों के जवाब देने के लिए कहता है जिसने फोन का जवाब दिया। बाद वाले को कंप्यूटर मॉनीटर स्क्रीन से पढ़ा जाता है और उत्तरदाताओं के उत्तर कीबोर्ड पर टाइप किए जाते हैं। यह विधि डेटा स्वरूपण और एन्कोडिंग की आवश्यकता को समाप्त करती है, त्रुटियों की संख्या को कम करती है।