मानक विश्वास अंतराल। विश्वास अंतराल

लक्ष्य- सांख्यिकीय मापदंडों के विश्वास अंतराल की गणना के लिए छात्रों को एल्गोरिदम सिखाने के लिए।

डेटा के सांख्यिकीय प्रसंस्करण के दौरान, परिकलित अंकगणितीय माध्य, भिन्नता का गुणांक, सहसंबंध गुणांक, अंतर मानदंड और अन्य बिंदु आँकड़ों को मात्रात्मक विश्वास सीमाएँ प्राप्त करनी चाहिए, जो विश्वास अंतराल के भीतर संकेतक के संभावित उतार-चढ़ाव को इंगित करती हैं।

उदाहरण 3.1 . बंदरों के रक्त सीरम में कैल्शियम का वितरण, जैसा कि पहले स्थापित किया गया था, निम्नलिखित चुनिंदा संकेतकों की विशेषता है: = 11.94 मिलीग्राम%; = 0.127 मिलीग्राम%; एन= 100. सामान्य औसत के लिए विश्वास अंतराल निर्धारित करना आवश्यक है ( ) आत्मविश्वास की संभावना के साथ पी = 0,95.

सामान्य औसत अंतराल में एक निश्चित संभावना के साथ है:

, कहाँ पे - नमूना अंकगणितीय माध्य; टी- छात्र की कसौटी; अंकगणित माध्य की त्रुटि है।

तालिका "छात्र के मानदंड के मूल्य" के अनुसार हम मूल्य पाते हैं 0.95 के आत्मविश्वास के स्तर और स्वतंत्रता की डिग्री की संख्या के साथ \u003d 100-1 \u003d 99. यह 1.982 के बराबर है। अंकगणित माध्य और सांख्यिकीय त्रुटि के मूल्यों के साथ, हम इसे सूत्र में प्रतिस्थापित करते हैं:

या 11.69
12,19

इस प्रकार, 95% की संभावना के साथ, यह तर्क दिया जा सकता है कि इस सामान्य वितरण का सामान्य औसत 11.69 और 12.19 मिलीग्राम% के बीच है।

उदाहरण 3.2 . सामान्य विचरण के लिए 95% विश्वास अंतराल की सीमाएं निर्धारित करें ( ) बंदरों के रक्त में कैल्शियम का वितरण, यदि यह ज्ञात हो कि
= 1.60, साथ एन = 100.

समस्या को हल करने के लिए, आप निम्न सूत्र का उपयोग कर सकते हैं:

कहाँ विचरण की सांख्यिकीय त्रुटि है।

सूत्र का उपयोग करके नमूना विचरण त्रुटि का पता लगाएं:
. यह 0.11 के बराबर है। अर्थ टी- 0.95 की आत्मविश्वास संभावना और स्वतंत्रता की डिग्री की संख्या के साथ मानदंड = 100–1 = 99 पिछले उदाहरण से जाना जाता है।

आइए सूत्र का उपयोग करें और प्राप्त करें:

या 1.38
1,82

सामान्य विचरण के लिए एक अधिक सटीक विश्वास अंतराल का निर्माण किया जा सकता है (ची-स्क्वायर) - पियर्सन का परीक्षण। इस मानदंड के लिए महत्वपूर्ण बिंदु एक विशेष तालिका में दिए गए हैं। मानदंड का उपयोग करते समय एक विश्वास अंतराल बनाने के लिए दो-तरफा महत्व स्तर का उपयोग किया जाता है। निचली सीमा के लिए, महत्व स्तर की गणना सूत्र द्वारा की जाती है
, ऊपरी के लिए
. उदाहरण के लिए, आत्मविश्वास के स्तर के लिए = 0,99= 0,010,= 0.990। तदनुसार, महत्वपूर्ण मूल्यों के वितरण की तालिका के अनुसार , गणना किए गए आत्मविश्वास के स्तर और स्वतंत्रता की डिग्री की संख्या के साथ = 100 – 1= 99, मान ज्ञात कीजिए
और
. हम पाते हैं
बराबर 135.80, और
70.06 के बराबर है।

सामान्य प्रसरण की विश्वास सीमा ज्ञात करने के लिए हम सूत्रों का उपयोग करते हैं: निचली सीमा के लिए
, ऊपरी सीमा के लिए
. पाए गए मानों के लिए कार्य डेटा को प्रतिस्थापित करें सूत्रों में:
= 1,17;
= 2.26. इस प्रकार, एक आत्मविश्वास के स्तर के साथ पी= 0.99 या 99% सामान्य विचरण 1.17 से 2.26 मिलीग्राम% समावेशी की सीमा में होगा।

उदाहरण 3.3 . लिफ्ट में पहुंचे लॉट से आए 1000 गेहूं के बीजों में से 120 बीज एर्गोट से संक्रमित पाए गए। गेहूं के दिए गए बैच में संक्रमित बीजों के कुल अनुपात की संभावित सीमाओं को निर्धारित करना आवश्यक है।

इसके सभी संभावित मूल्यों के लिए सामान्य हिस्सेदारी के लिए विश्वास सीमा सूत्र द्वारा निर्धारित की जानी चाहिए:

,

कहाँ एन टिप्पणियों की संख्या है; एमसमूहों में से एक की पूर्ण संख्या है; टीसामान्यीकृत विचलन है।

संक्रमित बीजों का नमूना अंश बराबर होता है
या 12%। आत्मविश्वास के स्तर के साथ आर= 95% सामान्यीकृत विचलन ( टी-छात्र की कसौटी =
)टी = 1,960.

हम उपलब्ध डेटा को सूत्र में प्रतिस्थापित करते हैं:

इसलिए, विश्वास अंतराल की सीमाएं हैं = 0.122–0.041 = 0.081, या 8.1%; = 0.122 + 0.041 = 0.163, या 16.3%।

इस प्रकार, 95% के आत्मविश्वास के स्तर के साथ, यह कहा जा सकता है कि संक्रमित बीजों का कुल अनुपात 8.1 से 16.3% के बीच है।

उदाहरण 3.4 . भिन्नता का गुणांक, जो बंदरों के रक्त सीरम में कैल्शियम (मिलीग्राम%) की भिन्नता को दर्शाता है, 10.6% के बराबर था। नमूने का आकार एन= 100. सामान्य पैरामीटर के लिए 95% विश्वास अंतराल की सीमाओं को निर्धारित करना आवश्यक है सीवी.

भिन्नता के सामान्य गुणांक के लिए विश्वास सीमा सीवी निम्नलिखित सूत्रों द्वारा निर्धारित किया जाता है:

और
, कहाँ पे सूत्र द्वारा परिकलित मध्यवर्ती मान
.

यह जानते हुए कि आत्मविश्वास के स्तर के साथ आर= 95% सामान्यीकृत विचलन (छात्र के लिए t-परीक्षण =
)टी = 1.960, मान की पूर्व-गणना करें को:

.

या 9.3%

या 12.3%

इस प्रकार, 95% की आत्मविश्वास संभावना के साथ भिन्नता का सामान्य गुणांक 9.3 से 12.3% की सीमा में है। दोहराए गए नमूनों के साथ, भिन्नता का गुणांक 12.3% से अधिक नहीं होगा और 100 में से 95 मामलों में 9.3% से कम नहीं होगा।

आत्म-नियंत्रण के लिए प्रश्न:

स्वतंत्र समाधान के लिए कार्य।

1. खोलमोगोरी क्रॉस की गायों के दुग्धपान के लिए दूध में वसा का औसत प्रतिशत इस प्रकार था: 3.4; 3.6; 3.2; 3.1; 2.9; 3.7; 3.2; 3.6; 4.0; 3.4; 4.1; 3.8; 3.4; 4.0; 3.3; 3.7; 3.5; 3.6; 3.4; 3.8. समग्र माध्य के लिए आत्मविश्वास अंतराल को 95% विश्वास स्तर (20 अंक) पर सेट करें।

2. संकर राई के 400 पौधों पर पहले फूल बुवाई के 70.5 दिनों के बाद औसतन दिखाई देते हैं। मानक विचलन 6.9 दिन था। महत्व के स्तर पर जनसंख्या माध्य और विचरण के लिए माध्य और विश्वास अंतराल की त्रुटि का निर्धारण करें वू= 0.05 और वू= 0.01 (25 अंक)।

3. उद्यान स्ट्रॉबेरी के 502 नमूनों की पत्तियों की लंबाई का अध्ययन करते समय, निम्नलिखित आंकड़े प्राप्त हुए: = 7.86 सेमी; = 1.32 सेमी, \u003d ± 0.06 सेमी। 0.01 के महत्व के स्तर के साथ जनसंख्या के अंकगणितीय माध्य के लिए आत्मविश्वास अंतराल निर्धारित करें; 0.02; 0.05. (25 अंक)।

4. 150 वयस्क पुरुषों की जांच करते समय, औसत ऊंचाई 167 सेमी थी, और σ \u003d 6 सेमी। 0.99 और 0.95 की आत्मविश्वास संभावना के साथ सामान्य औसत और सामान्य विचरण की सीमाएं क्या हैं? (25 अंक)।

5. बंदरों के रक्त सीरम में कैल्शियम का वितरण निम्नलिखित चुनिंदा संकेतकों की विशेषता है: = 11.94 मिलीग्राम%, σ = 1,27, एन = 100. इस वितरण के जनसंख्या माध्य के लिए 95% विश्वास अंतराल प्लॉट करें। भिन्नता के गुणांक (25 अंक) की गणना करें।

6. 37 और 180 दिनों की उम्र में एल्बिनो चूहों के रक्त प्लाज्मा में कुल नाइट्रोजन सामग्री का अध्ययन किया गया था। परिणाम प्लाज्मा के प्रति 100 सेमी 3 ग्राम में व्यक्त किए जाते हैं। 37 दिनों की उम्र में, 9 चूहों में: 0.98; 0.83; 0.99; 0.86; 0.90; 0.81; 0.94; 0.92; 0.87. 180 दिनों की उम्र में, 8 चूहों के पास: 1.20; 1.18; 1.33; 1.21; 1.20; 1.07; 1.13; 1.12. 0.95 (50 अंक) के आत्मविश्वास स्तर के साथ अंतर के लिए विश्वास अंतराल निर्धारित करें।

7. बंदरों के रक्त सीरम में कैल्शियम (मिलीग्राम%) के वितरण के सामान्य विचरण के लिए 95% विश्वास अंतराल की सीमाएं निर्धारित करें, यदि इस वितरण के लिए नमूना आकार n = 100, नमूना विचरण की सांख्यिकीय त्रुटि एस σ 2 = 1.60 (40 अंक)।

8. लंबाई (σ 2 = 40.87 मिमी 2) के साथ गेहूं के 40 स्पाइकलेट के वितरण के सामान्य भिन्नता के लिए 95% विश्वास अंतराल की सीमाएं निर्धारित करें। (25 अंक)।

9. धूम्रपान को ऑब्सट्रक्टिव पल्मोनरी डिजीज का मुख्य कारक माना जाता है। निष्क्रिय धूम्रपान को ऐसा कारक नहीं माना जाता है। वैज्ञानिकों ने निष्क्रिय धूम्रपान की सुरक्षा पर सवाल उठाया और धूम्रपान न करने वाले, निष्क्रिय और सक्रिय धूम्रपान करने वालों में वायुमार्ग की जांच की। श्वसन पथ की स्थिति को चिह्नित करने के लिए, हमने बाहरी श्वसन के कार्य के संकेतकों में से एक लिया - साँस छोड़ने के बीच का अधिकतम वॉल्यूमेट्रिक वेग। इस सूचक में कमी बिगड़ा हुआ वायुमार्ग धैर्य का संकेत है। सर्वेक्षण डेटा तालिका में दिखाया गया है।

जांच की संख्या

अधिकतम मध्य-श्वसन प्रवाह दर, एल / एस

मानक विचलन

धूम्रपान न करने वालों

धूम्रपान रहित क्षेत्र में काम करें

धुएँ से भरे कमरे में काम करें

धूम्रपान करने वालों के

कम संख्या में सिगरेट पीना

सिगरेट पीने वालों की औसत संख्या

बड़ी संख्या में सिगरेट पीना

तालिका से, प्रत्येक समूह के लिए सामान्य माध्य और सामान्य भिन्नता के लिए 95% विश्वास अंतराल खोजें। समूहों के बीच अंतर क्या हैं? परिणामों को ग्राफिक रूप से प्रस्तुत करें (25 अंक)।

10. 95% और 99% विश्वास अंतराल की सीमाएं निर्धारित करें, 64 फ़रोइंग में पिगलेट की संख्या के सामान्य विचरण के लिए, यदि नमूना विचरण की सांख्यिकीय त्रुटि एस σ 2 = 8.25 (30 अंक)।

11. यह ज्ञात है कि खरगोशों का औसत वजन 2.1 किलो है। सामान्य माध्य और विचरण के लिए 95% और 99% विश्वास अंतराल की सीमाएं निर्धारित करें जब एन= 30, = 0.56 किग्रा (25 अंक)।

12. 100 कानों में, कान के दाने की मात्रा को मापा गया ( एक्स), स्पाइक लंबाई ( यू) और कान में अनाज का द्रव्यमान ( जेड) सामान्य माध्य और विचरण के लिए विश्वास अंतराल खोजें पी 1 = 0,95, पी 2 = 0,99, पी 3 = 0.999 अगर = 19, = 6.766 सेमी, = 0.554 ग्राम; x 2 = 29.153, y 2 = 2.111, z 2 = 0.064. (25 अंक)।

13. सर्दियों के गेहूं के 100 कानों में बेतरतीब ढंग से चुने गए स्पाइकलेट्स की संख्या को गिना गया। नमूना सेट को निम्नलिखित संकेतकों की विशेषता थी: = 15 स्पाइकलेट और = 2.28 पीसी। उस सटीकता का निर्धारण करें जिसके साथ औसत परिणाम प्राप्त होता है ( ) और समग्र माध्य और विचरण के लिए आत्मविश्वास अंतराल को 95% और 99% महत्व स्तरों (30 अंक) पर प्लॉट करें।

14. जीवाश्म मोलस्क के गोले पर पसलियों की संख्या ऑर्थोम्बोनाइट्स सुलेख:

ह ज्ञात है कि एन = 19, σ = 4.25. महत्व के स्तर पर सामान्य माध्य और सामान्य विचरण के लिए विश्वास अंतराल की सीमाएं निर्धारित करें वू = 0.01 (25 अंक)।

15. एक व्यावसायिक डेयरी फार्म पर दूध की पैदावार निर्धारित करने के लिए प्रतिदिन 15 गायों की उत्पादकता निर्धारित की गई। वर्ष के आंकड़ों के अनुसार, प्रत्येक गाय ने प्रति दिन औसतन निम्नलिखित मात्रा में दूध दिया (एल): 22; उन्नीस; 25; 20; 27; 17; तीस; 21; अठारह; 24; 26; 23; 25; 20; 24. सामान्य विचरण और अंकगणित माध्य के लिए विश्वास अंतराल प्लॉट करें। क्या हम प्रति गाय औसत वार्षिक दूध उत्पादन 10,000 लीटर होने की उम्मीद कर सकते हैं? (50 अंक)।

16. खेत के लिए औसत गेहूं की उपज निर्धारित करने के लिए 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 और 2 हेक्टेयर के नमूना भूखंडों पर बुवाई की गई। भूखंडों से उपज (सी/हेक्टेयर) 39.4 थी; 38; 35.8; 40; 35; 42.7; 39.3; 41.6; 33; 42; 29 क्रमशः। सामान्य विचरण और अंकगणित माध्य के लिए विश्वास अंतराल प्लॉट करें। क्या यह उम्मीद करना संभव है कि कृषि क्षेत्र के लिए औसत उपज 42 सेंटीमीटर प्रति हेक्टेयर होगी? (50 अंक)।

आँकड़ों में, अनुमान दो प्रकार के होते हैं: बिंदु और अंतराल। बिंदु अनुमानएक एकल नमूना आँकड़ा है जिसका उपयोग जनसंख्या पैरामीटर का अनुमान लगाने के लिए किया जाता है। उदाहरण के लिए, नमूना माध्य जनसंख्या माध्य का एक बिंदु अनुमान है, और नमूना विचरण एस 2- जनसंख्या विचरण का बिंदु अनुमान 2. यह दिखाया गया कि नमूना माध्य जनसंख्या अपेक्षा का एक निष्पक्ष अनुमान है। नमूना माध्य को निष्पक्ष कहा जाता है क्योंकि सभी नमूने का मतलब (समान नमूना आकार के साथ) एन) सामान्य जनसंख्या की गणितीय अपेक्षा के बराबर है।

नमूना विचरण के क्रम में एस 2जनसंख्या भिन्नता का एक निष्पक्ष अनुमानक बन गया 2, नमूना विचरण के हर के बराबर सेट किया जाना चाहिए एन – 1 , लेकिन नहीं एन. दूसरे शब्दों में, जनसंख्या विचरण सभी संभावित नमूना प्रसरणों का औसत है।

जनसंख्या मापदंडों का आकलन करते समय, यह ध्यान में रखा जाना चाहिए कि नमूना आँकड़े जैसे , विशिष्ट नमूनों पर निर्भर करते हैं। इस तथ्य को ध्यान में रखते हुए, प्राप्त करने के लिए अंतराल अनुमानसामान्य जनसंख्या की गणितीय अपेक्षा नमूना साधनों के वितरण का विश्लेषण करती है (अधिक विवरण के लिए, देखें)। निर्मित अंतराल एक निश्चित आत्मविश्वास स्तर की विशेषता है, जो कि संभावना है कि सामान्य आबादी के सही पैरामीटर का सही अनुमान लगाया गया है। किसी विशेषता के अनुपात का अनुमान लगाने के लिए समान विश्वास अंतराल का उपयोग किया जा सकता है आरऔर सामान्य आबादी का मुख्य वितरित द्रव्यमान।

नोट या प्रारूप में डाउनलोड करें, प्रारूप में उदाहरण

एक ज्ञात मानक विचलन के साथ सामान्य जनसंख्या की गणितीय अपेक्षा के लिए एक विश्वास अंतराल का निर्माण

सामान्य जनसंख्या में एक विशेषता के अनुपात के लिए एक विश्वास अंतराल का निर्माण

इस खंड में, एक विश्वास अंतराल की अवधारणा को श्रेणीबद्ध डेटा तक बढ़ाया गया है। यह आपको सामान्य आबादी में विशेषता के हिस्से का अनुमान लगाने की अनुमति देता है आरएक नमूना शेयर के साथ आरएस= एक्स/एन. जैसा कि उल्लेख किया गया है, यदि मान एनआरऔर एन(1 - पी)संख्या 5 से अधिक, द्विपद वितरण को सामान्य द्वारा अनुमानित किया जा सकता है। इसलिए, सामान्य जनसंख्या में एक विशेषता के हिस्से का अनुमान लगाने के लिए आरएक अंतराल का निर्माण करना संभव है जिसका आत्मविश्वास स्तर बराबर है (1 - α)x100%.


कहाँ पे पीएस- सुविधा का नमूना हिस्सा, के बराबर एक्स/एन, अर्थात। नमूना आकार से विभाजित सफलताओं की संख्या, आर- सामान्य आबादी में विशेषता का हिस्सा, जेडमानकीकृत सामान्य वितरण का महत्वपूर्ण मूल्य है, एन- नमूने का आकार।

उदाहरण 3मान लें कि सूचना प्रणाली से एक नमूना निकाला गया है, जिसमें पिछले महीने के दौरान पूरे किए गए 100 चालान शामिल हैं। मान लें कि इनमें से 10 चालान गलत हैं। इस प्रकार, आर= 10/100 = 0.1. 95% आत्मविश्वास का स्तर महत्वपूर्ण मान Z = 1.96 से मेल खाता है।

इस प्रकार, 95% संभावना है कि 4.12% और 15.88% के बीच चालान में त्रुटियां हैं।

किसी दिए गए नमूने के आकार के लिए, सामान्य जनसंख्या में विशेषता के अनुपात वाला विश्वास अंतराल एक सतत यादृच्छिक चर की तुलना में व्यापक प्रतीत होता है। ऐसा इसलिए है क्योंकि एक सतत यादृच्छिक चर के माप में श्रेणीबद्ध डेटा के मापन की तुलना में अधिक जानकारी होती है। दूसरे शब्दों में, केवल दो मान लेने वाले श्रेणीबद्ध डेटा में उनके वितरण के मापदंडों का अनुमान लगाने के लिए अपर्याप्त जानकारी होती है।

परपरिमित जनसंख्या से प्राप्त अनुमानों की गणना

गणितीय अपेक्षा का अनुमान।अंतिम जनसंख्या के लिए सुधार कारक ( पांचवें वेतन आयोग) का उपयोग मानक त्रुटि को एक कारक द्वारा कम करने के लिए किया गया था। जनसंख्या मापदंडों के अनुमानों के लिए विश्वास अंतराल की गणना करते समय, उन स्थितियों में एक सुधार कारक लागू किया जाता है जहां नमूने बिना प्रतिस्थापन के लिए जाते हैं। इस प्रकार, गणितीय अपेक्षा के लिए कॉन्फिडेंस इंटरवल, जिसका कॉन्फिडेंस लेवल के बराबर होता है (1 - α)x100%, सूत्र द्वारा गणना की जाती है:

उदाहरण 4एक सीमित आबादी के लिए एक सुधार कारक के आवेदन को स्पष्ट करने के लिए, आइए हम ऊपर उदाहरण 3 में चर्चा की गई चालानों की औसत राशि के लिए विश्वास अंतराल की गणना करने की समस्या पर लौटते हैं। मान लीजिए कि एक कंपनी प्रति माह 5,000 चालान जारी करती है, और एक्स=110.27 अमरीकी डालर, एस= $28.95 एन = 5000, एन = 100, α = 0.05, t99 = 1.9842। सूत्र (6) के अनुसार हम प्राप्त करते हैं:

सुविधा के हिस्से का अनुमान।नो रिटर्न चुनते समय, कॉन्फिडेंस इंटरवल उस फीचर के अनुपात के लिए होता है जिसका कॉन्फिडेंस लेवल के बराबर होता है (1 - α)x100%, सूत्र द्वारा गणना की जाती है:

विश्वास अंतराल और नैतिक मुद्दे

जनसंख्या का नमूना लेते समय और सांख्यिकीय निष्कर्ष तैयार करते समय, नैतिक समस्याएं अक्सर उत्पन्न होती हैं। मुख्य बात यह है कि नमूना आँकड़ों के विश्वास अंतराल और बिंदु अनुमान कैसे सहमत होते हैं। उचित विश्वास अंतराल (आमतौर पर 95% आत्मविश्वास के स्तर पर) निर्दिष्ट किए बिना प्रकाशन बिंदु अनुमान और जिस नमूना आकार से वे प्राप्त किए गए हैं, वे भ्रामक हो सकते हैं। इससे उपयोगकर्ता को यह आभास हो सकता है कि एक बिंदु अनुमान ठीक वही है जो उसे पूरी आबादी के गुणों की भविष्यवाणी करने के लिए चाहिए। इस प्रकार यह समझना आवश्यक है कि किसी भी शोध में बिंदु नहीं, बल्कि अंतराल अनुमानों को सबसे आगे रखा जाना चाहिए। इसके अलावा, नमूना आकारों के सही चुनाव पर विशेष ध्यान दिया जाना चाहिए।

सबसे अधिक बार, सांख्यिकीय जोड़तोड़ की वस्तुएं विभिन्न राजनीतिक मुद्दों पर जनसंख्या के समाजशास्त्रीय सर्वेक्षण के परिणाम हैं। साथ ही सर्वेक्षण के परिणामों को समाचार पत्रों के पहले पन्ने पर रखा जाता है, और नमूना त्रुटि और सांख्यिकीय विश्लेषण की पद्धति बीच में कहीं छपी होती है। प्राप्त बिंदु अनुमानों की वैधता को साबित करने के लिए, नमूना आकार को इंगित करना आवश्यक है जिसके आधार पर उन्हें प्राप्त किया गया था, विश्वास अंतराल की सीमाएं और इसका महत्व स्तर।

अगला नोट

लेविन एट अल पुस्तक से सामग्री प्रबंधकों के लिए सांख्यिकी का उपयोग किया जाता है। - एम .: विलियम्स, 2004. - पी। 448-462

केंद्रीय सीमा प्रमेययह बताता है कि, पर्याप्त रूप से बड़े नमूना आकार को देखते हुए, साधनों के नमूना वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है। यह संपत्ति जनसंख्या वितरण के प्रकार पर निर्भर नहीं करती है।

पिछले उपखंडों में, हमने अज्ञात पैरामीटर के आकलन के प्रश्न पर विचार किया एक नंबर। इस तरह के आकलन को "बिंदु" कहा जाता है। कई कार्यों में, न केवल पैरामीटर खोजने की आवश्यकता होती है उपयुक्त संख्यात्मक मान, लेकिन इसकी सटीकता और विश्वसनीयता का मूल्यांकन भी करते हैं। यह जानना आवश्यक है कि पैरामीटर प्रतिस्थापन किन त्रुटियों को जन्म दे सकता है इसका बिंदु अनुमान और हम किस हद तक विश्वास के साथ उम्मीद कर सकते हैं कि ये त्रुटियां ज्ञात सीमाओं से आगे नहीं बढ़ेंगी?

इस तरह की समस्याएं विशेष रूप से कम संख्या में टिप्पणियों के लिए प्रासंगिक होती हैं, जब बिंदु का अनुमान लगाया जाता है और मेंकाफी हद तक यादृच्छिक है और a का अनुमानित प्रतिस्थापन गंभीर त्रुटियों को जन्म दे सकता है।

अनुमान की सटीकता और विश्वसनीयता का अंदाजा लगाने के लिए ,

गणितीय आँकड़ों में, तथाकथित विश्वास अंतराल और आत्मविश्वास की संभावनाओं का उपयोग किया जाता है।

चलो पैरामीटर के लिए अनुभव से प्राप्त निष्पक्ष अनुमान ए।हम इस मामले में संभावित त्रुटि का अनुमान लगाना चाहते हैं। आइए हम कुछ पर्याप्त रूप से बड़ी प्रायिकता p (उदाहरण के लिए, p = 0.9, 0.95, या 0.99) इस प्रकार निर्दिष्ट करें कि प्रायिकता p वाली एक घटना को व्यावहारिक रूप से निश्चित माना जा सके, और s का मान ज्ञात करें जिसके लिए

फिर त्रुटि के व्यावहारिक रूप से संभावित मूल्यों की सीमा जो प्रतिस्थापित करते समय होती है पर , ± एस होगा; बड़ी निरपेक्ष त्रुटियाँ केवल एक छोटी प्रायिकता a = 1 - p के साथ दिखाई देंगी। आइए फिर से लिखें (14.3.1) इस प्रकार:

समानता (14.3.2) का अर्थ है कि प्रायिकता p के साथ पैरामीटर का अज्ञात मान अंतराल के भीतर आता है

इस मामले में, एक परिस्थिति पर ध्यान दिया जाना चाहिए। पहले, हमने बार-बार किसी दिए गए गैर-यादृच्छिक अंतराल में एक यादृच्छिक चर के गिरने की प्रायिकता पर विचार किया। यहां स्थिति अलग है: यादृच्छिक नहीं, बल्कि यादृच्छिक अंतराल / आर। एक्स-अक्ष पर यादृच्छिक रूप से इसकी स्थिति, इसके केंद्र द्वारा निर्धारित ; सामान्य तौर पर, अंतराल 2s की लंबाई भी यादृच्छिक होती है, क्योंकि s के मान की गणना, एक नियम के रूप में, प्रयोगात्मक डेटा से की जाती है। इसलिए, इस मामले में, पी के मूल्य की व्याख्या करना बेहतर होगा, न कि बिंदु को "मारने" की संभावना के रूप में अंतराल / पी में, लेकिन संभावना के रूप में कि एक यादृच्छिक अंतराल / पी बिंदु को कवर करेगा (चित्र 14.3.1)।

चावल। 14.3.1

प्रायिकता p कहलाती है आत्मविश्वास का स्तर, और अंतराल / पी - विश्वास अंतराल।अंतराल सीमाएं अगर। ए एक्स \u003d ए-रेत ए 2 = ए +और कहा जाता है विश्वास की सीमाएँ।

आइए एक विश्वास अंतराल की अवधारणा को एक और व्याख्या दें: इसे पैरामीटर मानों के अंतराल के रूप में माना जा सकता है ए,प्रयोगात्मक डेटा के साथ संगत और उनका खंडन नहीं करना। दरअसल, अगर हम एक संभावना के साथ एक घटना पर विचार करने के लिए सहमत हैं a = 1-p व्यावहारिक रूप से असंभव है, तो पैरामीटर के वे मान जिनके लिए a ए - ए> s को प्रयोगात्मक डेटा के विरोधाभासी के रूप में पहचाना जाना चाहिए, और जिनके लिए |a - एक टी ना 2।

चलो पैरामीटर के लिए एक निष्पक्ष अनुमान है ए।अगर हम मात्रा के वितरण के नियम को जानते हैं , विश्वास अंतराल खोजने की समस्या काफी सरल होगी: यह s का मान ज्ञात करने के लिए पर्याप्त होगा जिसके लिए

कठिनाई इस तथ्य में निहित है कि अनुमान का वितरण कानून मात्रा के वितरण के नियम पर निर्भर करता है एक्सऔर, फलस्वरूप, इसके अज्ञात मापदंडों पर (विशेष रूप से, पैरामीटर पर ही ए)।

इस कठिनाई को दूर करने के लिए, कोई निम्नलिखित मोटे तौर पर अनुमानित चाल को लागू कर सकता है: अज्ञात पैरामीटर को s के लिए उनके बिंदु अनुमानों के साथ बदलें। अपेक्षाकृत बड़ी संख्या में प्रयोगों के साथ पी(लगभग 20 ... 30) यह तकनीक आमतौर पर सटीकता के मामले में संतोषजनक परिणाम देती है।

एक उदाहरण के रूप में, गणितीय अपेक्षा के लिए विश्वास अंतराल की समस्या पर विचार करें।

चलो उत्पादित पी एक्स,जिनकी विशेषताएँ गणितीय अपेक्षाएँ हैं टीऔर भिन्नता डी- अनजान। इन मापदंडों के लिए, निम्नलिखित अनुमान प्राप्त किए गए थे:

गणितीय अपेक्षा के लिए कॉन्फिडेंस इंटरवल / р, कॉन्फिडेंस प्रायिकता р के अनुरूप बनाना आवश्यक है टीमात्रा एक्स।

इस समस्या को हल करने में, हम इस तथ्य का उपयोग करते हैं कि मात्रा टीयोग है पीस्वतंत्र समान रूप से वितरित यादृच्छिक चर एक्स एचऔर पर्याप्त रूप से बड़े के लिए केंद्रीय सीमा प्रमेय के अनुसार पीइसका वितरण कानून सामान्य के करीब है। व्यवहार में, अपेक्षाकृत कम संख्या में (10 ... 20 के क्रम के) के साथ, योग के वितरण कानून को लगभग सामान्य माना जा सकता है। हम मान लेंगे कि मूल्य टीसामान्य कानून के अनुसार वितरित। इस कानून की विशेषताएं - गणितीय अपेक्षा और विचरण - क्रमशः समान हैं टीऔर

(अध्याय 13 उपधारा 13.3 देखें)। मान लेते हैं कि मान डीहमें ज्ञात है और हमें ऐसा मूल्य ईपी मिलेगा जिसके लिए

अध्याय 6 के सूत्र (6.3.5) का प्रयोग करते हुए, हम (14.3.5) के बाईं ओर प्रायिकता को सामान्य वितरण फलन के रूप में व्यक्त करते हैं।

अनुमान का मानक विचलन कहाँ है टी।

समीकरण से

एसपी मान पाएं:

जहाँ arg * (x) * का प्रतिलोम फलन है (एक्स),वे। तर्क का ऐसा मान जिसके लिए सामान्य वितरण फलन के बराबर है एक्स।

फैलाव डी,जिसके माध्यम से मूल्य व्यक्त किया जाता है 1P, हम ठीक से नहीं जानते; इसके अनुमानित मूल्य के रूप में, आप अनुमान का उपयोग कर सकते हैं डी(14.3.4) और लगभग रखें:

इस प्रकार, विश्वास अंतराल के निर्माण की समस्या लगभग हल हो गई है, जो इसके बराबर है:

जहां जीपी सूत्र (14.3.7) द्वारा परिभाषित किया गया है।

फ़ंक्शन की तालिकाओं में रिवर्स इंटरपोलेशन से बचने के लिए * (एल) एसपी की गणना करते समय, एक विशेष तालिका (तालिका 14.3.1) संकलित करना सुविधाजनक होता है, जो मात्रा के मूल्यों को सूचीबद्ध करता है

आर पर निर्भर करता है मान (पी सामान्य कानून के लिए मानक विचलन की संख्या निर्धारित करता है जिसे फैलाव केंद्र के दाएं और बाएं सेट किया जाना चाहिए ताकि परिणामी क्षेत्र में गिरने की संभावना पी के बराबर हो।

7 पी के मान के माध्यम से, विश्वास अंतराल को इस प्रकार व्यक्त किया जाता है:

तालिका 14.3.1

उदाहरण 1. मान पर 20 प्रयोग किए गए एक्स;परिणाम तालिका में दिखाए गए हैं। 14.3.2.

तालिका 14.3.2

मात्रा की गणितीय अपेक्षा के लिए अनुमान लगाना आवश्यक है एक्सऔर एक कॉन्फिडेंस लेवल p = 0.8 के अनुरूप कॉन्फिडेंस इंटरवल तैयार करें।

फेसला।हमारे पास है:

मूल n: = 10 के लिए चयन, तीसरे सूत्र (14.2.14) के अनुसार हम निष्पक्ष अनुमान पाते हैं डी :

तालिका के अनुसार 14.3.1 हम पाते हैं

आत्मविश्वास की सीमा:

विश्वास अंतराल:

पैरामीटर मान टी,इस अंतराल में पड़े हुए तालिका में दिए गए प्रयोगात्मक डेटा के साथ संगत हैं। 14.3.2.

इसी तरह, विचरण के लिए एक विश्वास अंतराल का निर्माण किया जा सकता है।

चलो उत्पादित पीयादृच्छिक चर पर स्वतंत्र प्रयोग एक्सअज्ञात मापदंडों के साथ और ए से, और विचरण के लिए डीनिष्पक्ष अनुमान प्राप्त होता है:

विचरण के लिए लगभग एक विश्वास अंतराल बनाना आवश्यक है।

सूत्र (14.3.11) से यह देखा जा सकता है कि मान डीप्रतिनिधित्व करता है

रकम पीफॉर्म के यादृच्छिक चर। ये मान नहीं हैं

स्वतंत्र, क्योंकि उनमें से किसी में भी मात्रा शामिल है टी,अन्य सभी पर निर्भर। हालाँकि, यह दिखाया जा सकता है कि जैसे पीउनके योग का वितरण नियम भी सामान्य के करीब है। लगभग पी= 20...30 इसे पहले से ही सामान्य माना जा सकता है।

आइए मान लें कि यह ऐसा है, और इस कानून की विशेषताओं को खोजें: गणितीय अपेक्षा और भिन्नता। स्कोर के बाद से डी- निष्पक्ष, फिर एम [डी] = डी।

प्रसरण गणना डी डीअपेक्षाकृत जटिल गणनाओं से जुड़ा है, इसलिए हम व्युत्पत्ति के बिना इसकी अभिव्यक्ति देते हैं:

जहाँ c 4 - मात्रा का चौथा केंद्रीय क्षण एक्स।

इस अभिव्यक्ति का उपयोग करने के लिए, आपको इसमें 4 और . के मानों को प्रतिस्थापित करना होगा डी(कम से कम अनुमानित)। के बजाय डीआप मूल्यांकन का उपयोग कर सकते हैं डी।सिद्धांत रूप में, चौथे केंद्रीय क्षण को इसके अनुमान से भी बदला जा सकता है, उदाहरण के लिए, फॉर्म के मूल्य से:

लेकिन ऐसा प्रतिस्थापन बेहद कम सटीकता देगा, क्योंकि सामान्य तौर पर, सीमित संख्या में प्रयोगों के साथ, उच्च-क्रम के क्षण बड़ी त्रुटियों के साथ निर्धारित किए जाते हैं। हालांकि, व्यवहार में अक्सर ऐसा होता है कि मात्रा के वितरण कानून का रूप एक्सपहले से ज्ञात: केवल इसके पैरामीटर अज्ञात हैं। तब हम u4 को के रूप में व्यक्त करने का प्रयास कर सकते हैं डी।

आइए हम सबसे आम मामला लें, जब मूल्य एक्ससामान्य कानून के अनुसार वितरित। फिर इसका चौथा केंद्रीय क्षण विचरण के रूप में व्यक्त किया जाता है (अध्याय 6 उपखंड 6.2 देखें);

और सूत्र (14.3.12) देता है या

(14.3.14) अज्ञात में बदलना डीउसका आकलन डी, हमें मिलता है: कहाँ से

जिस क्षण u 4 को के रूप में व्यक्त किया जा सकता है डीकुछ अन्य मामलों में भी, जब मात्रा का वितरण एक्ससामान्य नहीं है, लेकिन इसकी उपस्थिति ज्ञात है। उदाहरण के लिए, एकसमान घनत्व के नियम के लिए (अध्याय 5 देखें) हमारे पास है:

जहां (ए, पी) वह अंतराल है जिस पर कानून दिया गया है।

इसलिये,

सूत्र (14.3.12) के अनुसार हम प्राप्त करते हैं: जहां से हम लगभग पाते हैं

ऐसे मामलों में जहां मूल्य 26 के वितरण के कानून का रूप अज्ञात है, जब एक / के मूल्य का अनुमान लगाया जाता है, तब भी सूत्र (14.3.16) का उपयोग करने की सिफारिश की जाती है, अगर इस कानून पर विश्वास करने के लिए कोई विशेष आधार नहीं हैं सामान्य से बहुत अलग है (एक ध्यान देने योग्य सकारात्मक या नकारात्मक कुर्टोसिस है)।

यदि a / का अनुमानित मान किसी न किसी रूप में प्राप्त किया जाता है, तो विचरण के लिए एक विश्वास अंतराल का निर्माण उसी तरह संभव है जैसे हमने इसे गणितीय अपेक्षा के लिए बनाया था:

जहां दी गई प्रायिकता के आधार पर मान तालिका में पाया जाता है। 14.3.1.

उदाहरण 2. एक यादृच्छिक चर के भिन्नता के लिए लगभग 80% विश्वास अंतराल खोजें एक्सउदाहरण 1 की शर्तों के तहत, यदि यह ज्ञात है कि मान एक्ससामान्य के करीब एक कानून के अनुसार वितरित।

फेसला।मान तालिका के समान ही रहता है। 14.3.1:

सूत्र के अनुसार (14.3.16)

सूत्र (14.3.18) के अनुसार हम विश्वास अंतराल पाते हैं:

मानक विचलन के मूल्यों की संगत श्रेणी: (0.21; 0.29)।

14.4. सामान्य कानून के अनुसार वितरित एक यादृच्छिक चर के मापदंडों के लिए विश्वास अंतराल के निर्माण के लिए सटीक तरीके

पिछले उपखंड में, हमने माध्य और विचरण के लिए विश्वास अंतरालों के निर्माण के लिए मोटे तौर पर अनुमानित तरीकों पर विचार किया था। यहां हम उसी समस्या को हल करने के सटीक तरीकों का एक विचार देते हैं। हम इस बात पर जोर देते हैं कि विश्वास अंतराल को सटीक रूप से खोजने के लिए, मात्रा के वितरण के नियम के रूप को पहले से जानना नितांत आवश्यक है एक्स,जबकि यह अनुमानित विधियों के अनुप्रयोग के लिए आवश्यक नहीं है।

विश्वास अंतराल के निर्माण के लिए सटीक तरीकों का विचार इस प्रकार है। कुछ असमानताओं की पूर्ति की संभावना को व्यक्त करने वाली स्थिति से कोई विश्वास अंतराल पाया जाता है, जिसमें हमारे लिए ब्याज का अनुमान शामिल है ए।ग्रेड वितरण कानून सामान्य मामले में मात्रा के अज्ञात मापदंडों पर निर्भर करता है एक्स।हालांकि, कभी-कभी एक यादृच्छिक चर से असमानताओं को पारित करना संभव है देखे गए मूल्यों के किसी अन्य कार्य के लिए एक्स पी एक्स 2, ..., एक्स पी.जिसका वितरण नियम अज्ञात मापदंडों पर निर्भर नहीं करता है, बल्कि केवल प्रयोगों की संख्या और मात्रा के वितरण कानून के रूप पर निर्भर करता है। एक्स।इस प्रकार के यादृच्छिक चर गणितीय आँकड़ों में एक बड़ी भूमिका निभाते हैं; मात्रा के सामान्य वितरण के मामले में उनका सबसे अधिक विस्तार से अध्ययन किया गया है एक्स।

उदाहरण के लिए, यह साबित हो गया है कि मात्रा के सामान्य वितरण के तहत एक्सयादृच्छिक मूल्य

तथाकथित के अधीन छात्र वितरण कानूनसाथ पी- स्वतंत्रता की 1 डिग्री; इस कानून के घनत्व का रूप है

जहाँ G(x) ज्ञात गामा फलन है:

यह भी सिद्ध होता है कि यादृच्छिक चर

के साथ "वितरण% 2" है पी- स्वतंत्रता की 1 डिग्री (अध्याय 7 देखें), जिसका घनत्व सूत्र द्वारा व्यक्त किया गया है

वितरणों की व्युत्पत्तियों (14.4.2) और (14.4.4) पर ध्यान दिए बिना, हम दिखाएंगे कि मापदंडों के लिए विश्वास अंतराल का निर्माण करते समय उन्हें कैसे लागू किया जा सकता है टाइ डी।

चलो उत्पादित पीयादृच्छिक चर पर स्वतंत्र प्रयोग एक्स,अज्ञात मापदंडों के साथ सामान्य कानून के अनुसार वितरित टीआईओ।इन मापदंडों के लिए, अनुमान

कॉन्फिडेंस प्रायिकता p के अनुरूप दोनों मापदंडों के लिए कॉन्फिडेंस इंटरवल का निर्माण करना आवश्यक है।

आइए पहले गणितीय अपेक्षा के लिए एक विश्वास अंतराल का निर्माण करें। इस अंतराल को के संबंध में सममित लेना स्वाभाविक है टी; अंतराल की आधी लंबाई को s p से निरूपित करें। एसपी का मान चुना जाना चाहिए ताकि शर्त

आइए एक यादृच्छिक चर से समानता (14.4.5) के बाईं ओर पारित करने का प्रयास करें टीएक यादृच्छिक चर के लिए टी,छात्र कानून के अनुसार वितरित। ऐसा करने के लिए, हम असमानता के दोनों भागों को गुणा करते हैं |m-w?|

सकारात्मक मूल्य के लिए: या, संकेतन (14.4.1) का उपयोग करते हुए,

आइए हम एक संख्या / पी इस तरह खोजें कि मूल्य / पी को शर्त से पाया जा सके

यह सूत्र (14.4.2) से देखा जा सकता है कि (1) एक सम फलन है, इसलिए (14.4.8) देता है

समानता (14.4.9) पी के आधार पर मूल्य / पी निर्धारित करती है। यदि आपके पास अपने निपटान में अभिन्न मूल्यों की एक तालिका है

तब मान / p तालिका में रिवर्स इंटरपोलेशन द्वारा पाया जा सकता है। हालांकि, अग्रिम में मूल्यों / पी की एक तालिका संकलित करना अधिक सुविधाजनक है। ऐसी तालिका परिशिष्ट (सारणी 5) में दी गई है। यह तालिका आत्मविश्वास की संभावना पी और स्वतंत्रता की डिग्री की संख्या के आधार पर मान दिखाती है पी- 1. तालिका के अनुसार निर्धारित / पी। 5 और मान लेना

हम कॉन्फिडेंस इंटरवल / p की आधी चौड़ाई और खुद इंटरवल पाते हैं

उदाहरण 1. यादृच्छिक चर पर 5 स्वतंत्र प्रयोग किए गए एक्स,सामान्य रूप से अज्ञात मापदंडों के साथ वितरित टीऔर उस बारे में। प्रयोगों के परिणाम तालिका में दिए गए हैं। 14.4.1.

तालिका 14.4.1

एक अनुमान खोजें टीगणितीय अपेक्षा के लिए और इसके लिए 90% विश्वास अंतराल / p का निर्माण करें (अर्थात, विश्वास संभावना p \u003d 0.9 के अनुरूप अंतराल)।

फेसला।हमारे पास है:

के लिए आवेदन की तालिका 5 के अनुसार पी - 1 = 4 और p = 0.9 हम पाते हैं कहाँ पे

कॉन्फिडेंस इंटरवल होगा

उदाहरण 2। उपखंड 14.3 के उदाहरण 1 की शर्तों के लिए, मान मानकर एक्ससामान्य रूप से वितरित, सटीक विश्वास अंतराल खोजें।

फेसला।आवेदन की तालिका 5 के अनुसार, हम पाते हैं पी - 1 = 19ir =

0.8 / पी = 1.328; यहां से

उपखंड 14.3 (ई पी = 0.072) के उदाहरण 1 के समाधान की तुलना में, हम देखते हैं कि विसंगति बहुत छोटी है। यदि हम सटीकता को दूसरे दशमलव स्थान पर रखते हैं, तो सटीक और अनुमानित विधियों द्वारा पाया गया विश्वास अंतराल समान है:

आइए विचरण के लिए एक विश्वास अंतराल बनाने के लिए आगे बढ़ते हैं। निष्पक्ष विचरण अनुमान पर विचार करें

और यादृच्छिक चर व्यक्त करें डीमूल्य के माध्यम से वी(14.4.3) वितरण x 2 (14.4.4) वाले:

मात्रा के वितरण नियम को जानना वी,उस अंतराल को ज्ञात करना संभव है / (1 ) जिसमें यह दी गई प्रायिकता p के साथ आता है।

वितरण कानून के एन _ एक्स (वी) I 7 का मान अंजीर में दिखाया गया रूप है। 14.4.1.

चावल। 14.4.1

सवाल उठता है: अंतराल / पी कैसे चुनें? यदि मात्रा का वितरण नियम वीसममित था (एक सामान्य कानून या छात्र के वितरण की तरह), गणितीय अपेक्षा के संबंध में अंतराल / पी सममित लेना स्वाभाविक होगा। इस मामले में कानून के एन _ एक्स (वी)विषम। आइए हम अंतराल / पी को चुनने के लिए सहमत हों ताकि मात्रा के उत्पादन की संभावनाएं वीअंतराल के बाहर दाएं और बाएं (चित्र 14.4.1 में छायांकित क्षेत्र) समान और बराबर थे

इस गुण के साथ एक अंतराल / p बनाने के लिए, हम तालिका का उपयोग करते हैं। 4 अनुप्रयोग: इसमें संख्याएँ होती हैं वाई)ऐसा है कि

मात्रा के लिए वी,स्वतंत्रता की r डिग्री के साथ x 2-वितरण होना। हमारे मामले में आर = एन- 1. फिक्स आर = एन- 1 और तालिका की संगत पंक्ति में खोजें। 4 दो मान एक्स 2 -एक प्रायिकता के संगत दूसरा - प्रायिकताएँ आइए हम इन्हें निर्दिष्ट करें

मूल्यों दो परऔर एक्सएल?अंतराल है वाई 2,उसके बाएं के साथ, और वाई~दाहिना छोर।

अब हम आवश्यक विश्वास अंतराल पाते हैं /| सीमाओं के साथ विचरण के लिए डी, और डी 2,जो बिंदु को कवर करता है डीसंभावना पी के साथ:

आइए हम एक ऐसा अंतराल / (, = (?> b A) बनाते हैं, जो बिंदु को कवर करता है डीअगर और केवल अगर मूल्य वीअंतराल / आर में पड़ता है। आइए हम दिखाते हैं कि अंतराल

इस शर्त को पूरा करता है। दरअसल, असमानताएं असमानताओं के बराबर हैं

और ये असमानताएँ प्रायिकता p के साथ होती हैं। इस प्रकार, फैलाव के लिए विश्वास अंतराल पाया जाता है और सूत्र (14.4.13) द्वारा व्यक्त किया जाता है।

उदाहरण 3. उपधारा 14.3 के उदाहरण 2 की शर्तों के तहत विचरण के लिए विश्वास अंतराल ज्ञात कीजिए, यदि यह ज्ञात हो कि मान एक्ससामान्य रूप से वितरित।

फेसला।हमारे पास है . आवेदन की तालिका 4 के अनुसार

हम पाते हैं आर = एन - 1 = 19

सूत्र (14.4.13) के अनुसार हम फैलाव के लिए विश्वास अंतराल पाते हैं

मानक विचलन के लिए संगत अंतराल: (0.21; 0.32)। यह अंतराल अनुमानित विधि द्वारा उपखंड 14.3 के उदाहरण 2 में प्राप्त अंतराल (0.21; 0.29) से केवल थोड़ा अधिक है।

  • चित्र 14.3.1 एक विश्वास अंतराल पर विचार करता है जो सममित है a. सामान्य तौर पर, जैसा कि हम बाद में देखेंगे, यह आवश्यक नहीं है।

विश्वास अंतराल का अनुमान

सीखने के मकसद

आंकड़े निम्नलिखित पर विचार करते हैं दो मुख्य कार्य:

    हमारे पास नमूना डेटा के आधार पर कुछ अनुमान हैं और हम अनुमान लगाने वाले पैरामीटर का सही मूल्य कहां है, इसके बारे में कुछ संभाव्य बयान देना चाहते हैं।

    हमारे पास एक विशिष्ट परिकल्पना है जिसे नमूना डेटा के आधार पर परीक्षण करने की आवश्यकता है।

इस विषय में, हम पहली समस्या पर विचार करते हैं। हम एक कॉन्फिडेंस इंटरवल की परिभाषा भी पेश करते हैं।

कॉन्फिडेंस इंटरवल एक ऐसा अंतराल है जो एक पैरामीटर के अनुमानित मूल्य के आसपास बनाया गया है और यह दर्शाता है कि अनुमानित पैरामीटर का सही मूल्य एक प्राथमिकता दी गई संभावना के साथ कहां है।

इस विषय पर सामग्री का अध्ययन करने के बाद, आप:

    जानें कि अनुमान का विश्वास अंतराल क्या है;

    सांख्यिकीय समस्याओं को वर्गीकृत करना सीखें;

    सांख्यिकीय फ़ार्मुलों का उपयोग करके और सॉफ़्टवेयर टूल का उपयोग करके, विश्वास अंतराल के निर्माण की तकनीक में महारत हासिल करें;

    सांख्यिकीय अनुमानों की सटीकता के कुछ मापदंडों को प्राप्त करने के लिए आवश्यक नमूना आकार निर्धारित करना सीखें।

नमूना विशेषताओं का वितरण

टी वितरण

जैसा कि ऊपर चर्चा की गई है, यादृच्छिक चर का वितरण पैरामीटर 0 और 1 के साथ एक मानकीकृत सामान्य वितरण के करीब है। चूंकि हम σ का मान नहीं जानते हैं, इसलिए हम इसे कुछ अनुमान s से बदल देते हैं। मात्रा का पहले से ही एक अलग वितरण है, अर्थात्, या छात्र का वितरण, जो पैरामीटर n -1 (स्वतंत्रता की डिग्री की संख्या) द्वारा निर्धारित किया जाता है। यह वितरण सामान्य वितरण के करीब है (बड़ा n, वितरण के करीब)।

अंजीर पर। 95
30 डिग्री स्वतंत्रता के साथ छात्र का वितरण प्रस्तुत किया गया है। जैसा कि आप देख सकते हैं, यह सामान्य वितरण के बहुत करीब है।

सामान्य वितरण NORMDIST और NORMINV के साथ काम करने के कार्यों के समान, t-वितरण के साथ काम करने के लिए कार्य हैं - STUDIST (TDIST) और STUDRSPBR (TINV). इन कार्यों के उपयोग का एक उदाहरण STUDRIST.XLS फ़ाइल (टेम्पलेट और समाधान) और अंजीर में पाया जा सकता है। 96
.

अन्य विशेषताओं का वितरण

जैसा कि हम पहले से ही जानते हैं, उम्मीद अनुमान की सटीकता निर्धारित करने के लिए, हमें टी-वितरण की आवश्यकता है। अन्य मापदंडों का अनुमान लगाने के लिए, जैसे विचरण, अन्य वितरणों की आवश्यकता होती है। उनमें से दो एफ-वितरण हैं और एक्स 2-वितरण.

माध्य के लिए विश्वास अंतराल

विश्वास अंतरालएक अंतराल है जो पैरामीटर के अनुमानित मूल्य के आसपास बनाया गया है और दिखाता है कि अनुमानित पैरामीटर का सही मूल्य प्राथमिकता दी गई संभावना के साथ कहां है।

माध्य मान के लिए एक विश्वास अंतराल का निर्माण होता है इस अनुसार:

उदाहरण

फास्ट फूड रेस्तरां एक नए प्रकार के सैंडविच के साथ अपने वर्गीकरण का विस्तार करने की योजना बना रहा है। इसकी मांग का अनुमान लगाने के लिए, प्रबंधक ने उन लोगों में से 40 आगंतुकों का बेतरतीब ढंग से चयन करने की योजना बनाई है, जिन्होंने पहले से ही इसे आजमाया है और उन्हें 1 से 10 के पैमाने पर नए उत्पाद के प्रति अपने दृष्टिकोण को रेट करने के लिए कहते हैं। प्रबंधक अनुमान लगाना चाहता है नए उत्पाद को प्राप्त होने वाले अंकों की अपेक्षित संख्या और इस अनुमान के लिए 95% विश्वास अंतराल का निर्माण करेगी। यह कैसे करना है? (देखें फ़ाइल SANDWICH1.XLS (टेम्पलेट और समाधान)।

फेसला

इस समस्या को हल करने के लिए, आप उपयोग कर सकते हैं। परिणाम को आंकड़े में दर्शाया गया है। 97
.

कुल मान के लिए कॉन्फिडेंस इंटरवल

कभी-कभी, नमूना डेटा के अनुसार, गणितीय अपेक्षा का नहीं, बल्कि मूल्यों के कुल योग का अनुमान लगाना आवश्यक होता है। उदाहरण के लिए, एक ऑडिटर की स्थिति में, इनवॉइस के औसत मूल्य का नहीं, बल्कि सभी चालानों के योग का अनुमान लगाना रुचिकर हो सकता है।

एन को तत्वों की कुल संख्या होने दें, एन नमूना आकार हो, टी 3 नमूने में मूल्यों का योग हो, टी "पूरी आबादी पर योग का अनुमान हो, फिर , और विश्वास अंतराल की गणना सूत्र द्वारा की जाती है, जहां s नमूने के लिए मानक विचलन का अनुमान है, नमूने के माध्य का अनुमान है।

उदाहरण

मान लें कि कोई कर कार्यालय 10,000 करदाताओं के लिए कुल कर वापसी की राशि का अनुमान लगाना चाहता है। करदाता या तो धनवापसी प्राप्त करता है या अतिरिक्त करों का भुगतान करता है। 500 लोगों का नमूना आकार मानकर, धनवापसी राशि के लिए 95% विश्वास अंतराल ज्ञात करें (देखें फ़ाइल REFUND AMOUNT.XLS (टेम्पलेट और समाधान)।

फेसला

इस मामले के लिए StatPro में कोई विशेष प्रक्रिया नहीं है, हालाँकि, आप देख सकते हैं कि उपरोक्त सूत्रों का उपयोग करके माध्य के लिए सीमा से सीमाएँ प्राप्त की जा सकती हैं (चित्र 98)।
).

अनुपात के लिए विश्वास अंतराल

मान लीजिए कि p ग्राहकों के हिस्से की अपेक्षा है, और pv इस शेयर का एक अनुमान है, जो आकार n के नमूने से प्राप्त होता है। यह दिखाया जा सकता है कि पर्याप्त रूप से बड़े के लिए अनुमान वितरण औसत पी और मानक विचलन के साथ सामान्य के करीब होगा . इस मामले में अनुमान की मानक त्रुटि के रूप में व्यक्त किया जाता है , और विश्वास अंतराल के रूप में .

उदाहरण

फास्ट फूड रेस्तरां एक नए प्रकार के सैंडविच के साथ अपने वर्गीकरण का विस्तार करने की योजना बना रहा है। इसकी मांग का अनुमान लगाने के लिए, प्रबंधक ने बेतरतीब ढंग से उन लोगों में से 40 आगंतुकों का चयन किया, जिन्होंने पहले से ही इसे आजमाया था और उन्हें 1 से 10 के पैमाने पर नए उत्पाद के प्रति अपने दृष्टिकोण को रेट करने के लिए कहा। प्रबंधक अपेक्षित अनुपात का अनुमान लगाना चाहता है। उन ग्राहकों की संख्या जो नए उत्पाद को कम से कम 6 अंक से अधिक रेट करते हैं (उन्हें उम्मीद है कि ये ग्राहक नए उत्पाद के उपभोक्ता होंगे)।

फेसला

प्रारंभ में, हम 1 के आधार पर एक नया कॉलम बनाते हैं यदि क्लाइंट का स्कोर 6 अंक से अधिक था और अन्यथा 0 (SANDWICH2.XLS फ़ाइल (टेम्पलेट और समाधान देखें) देखें।

विधि 1

1 की राशि की गणना करते हुए, हम हिस्से का अनुमान लगाते हैं, और फिर हम सूत्रों का उपयोग करते हैं।

z करोड़ का मान विशेष सामान्य वितरण तालिकाओं से लिया जाता है (उदाहरण के लिए, 95% विश्वास अंतराल के लिए 1.96)।

95% अंतराल बनाने के लिए इस दृष्टिकोण और विशिष्ट डेटा का उपयोग करके, हम निम्नलिखित परिणाम प्राप्त करते हैं (चित्र 99 .)
) पैरामीटर z करोड़ का महत्वपूर्ण मान 1.96 है। अनुमान की मानक त्रुटि 0.077 है। विश्वास अंतराल की निचली सीमा 0.475 है। विश्वास अंतराल की ऊपरी सीमा 0.775 है। इस प्रकार, एक प्रबंधक 95% निश्चितता के साथ यह मान सकता है कि किसी नए उत्पाद को 6 अंक या अधिक रेट करने वाले ग्राहकों का प्रतिशत 47.5 और 77.5 के बीच होगा।

विधि 2

इस समस्या को मानक StatPro टूल का उपयोग करके हल किया जा सकता है। ऐसा करने के लिए, यह नोट करना पर्याप्त है कि इस मामले में शेयर टाइप कॉलम के औसत मूल्य के साथ मेल खाता है। अगला आवेदन StatPro/सांख्यिकीय अनुमान/एक-नमूना विश्लेषणटाइप कॉलम के लिए माध्य मान (अपेक्षा अनुमान) के लिए एक विश्वास अंतराल बनाने के लिए। इस मामले में प्राप्त परिणाम पहली विधि (छवि 99) के परिणाम के बहुत करीब होंगे।

मानक विचलन के लिए विश्वास अंतराल

s का उपयोग मानक विचलन के अनुमान के रूप में किया जाता है (सूत्र खंड 1 में दिया गया है)। अनुमान s का घनत्व फलन ची-वर्ग फलन है, जिसमें t-वितरण की तरह स्वतंत्रता की n-1 डिग्री है। इस वितरण CHI2DIST (CHIDIST) और CHI2OBR (CHIINV) के साथ काम करने के लिए विशेष कार्य हैं।

इस मामले में विश्वास अंतराल अब सममित नहीं होगा। सीमाओं की सशर्त योजना अंजीर में दिखाई गई है। 100.

उदाहरण

मशीन को 10 सेमी के व्यास के साथ भागों का उत्पादन करना चाहिए हालांकि, विभिन्न परिस्थितियों के कारण त्रुटियां होती हैं। गुणवत्ता नियंत्रक दो चीजों के बारे में चिंतित है: पहला, औसत मूल्य 10 सेमी होना चाहिए; दूसरे, इस मामले में भी, यदि विचलन बड़े हैं, तो कई विवरण अस्वीकार कर दिए जाएंगे। हर दिन वह 50 भागों का एक नमूना बनाता है (फ़ाइल गुणवत्ता नियंत्रण देखें। XLS (टेम्पलेट और समाधान)। ऐसा नमूना क्या निष्कर्ष दे सकता है?

फेसला

हम माध्य के लिए और मानक विचलन के लिए 95% विश्वास अंतराल का निर्माण करते हैं StatPro/सांख्यिकीय अनुमान/एक-नमूना विश्लेषण(चित्र 101
).

इसके अलावा, व्यास के सामान्य वितरण की धारणा का उपयोग करते हुए, हम दोषपूर्ण उत्पादों के अनुपात की गणना करते हैं, 0.065 का अधिकतम विचलन निर्धारित करते हैं। लुकअप टेबल (दो मापदंडों का मामला) की क्षमताओं का उपयोग करके, हम माध्य मान और मानक विचलन (चित्र। 102) पर अस्वीकृति के प्रतिशत की निर्भरता का निर्माण करते हैं।
).

दो साधनों के अंतर के लिए कॉन्फिडेंस इंटरवल

यह सांख्यिकीय विधियों के सबसे महत्वपूर्ण अनुप्रयोगों में से एक है। स्थिति उदाहरण।

    एक कपड़े की दुकान प्रबंधक यह जानना चाहेगा कि औसत महिला खरीदार एक पुरुष की तुलना में दुकान में कितना अधिक या कम खर्च करती है।

    दोनों एयरलाइंस समान मार्गों पर उड़ान भरती हैं। एक उपभोक्ता संगठन दोनों एयरलाइनों के लिए औसत अपेक्षित उड़ान विलंब समय के बीच अंतर की तुलना करना चाहेगा।

    कंपनी एक शहर में कुछ प्रकार के सामानों के लिए कूपन भेजती है और दूसरे में नहीं भेजती है। प्रबंधक अगले दो महीनों में इन वस्तुओं की औसत खरीद की तुलना करना चाहते हैं।

    एक कार डीलर अक्सर प्रस्तुतियों में विवाहित जोड़ों के साथ व्यवहार करता है। प्रस्तुति के प्रति उनकी व्यक्तिगत प्रतिक्रियाओं को समझने के लिए, जोड़ों का अक्सर अलग-अलग साक्षात्कार किया जाता है। प्रबंधक पुरुषों और महिलाओं द्वारा दी गई रेटिंग में अंतर का मूल्यांकन करना चाहता है।

स्वतंत्र नमूनों का मामला

माध्य अंतर में n 1 + n 2 - 2 डिग्री स्वतंत्रता के साथ t-वितरण होगा। μ 1 - μ 2 के लिए विश्वास अंतराल अनुपात द्वारा व्यक्त किया जाता है:

इस समस्या को न केवल उपरोक्त सूत्रों द्वारा हल किया जा सकता है, बल्कि मानक स्टेटप्रो टूल द्वारा भी हल किया जा सकता है। ऐसा करने के लिए, यह लागू करने के लिए पर्याप्त है

अनुपात के बीच अंतर के लिए विश्वास अंतराल

आइए शेयरों की गणितीय अपेक्षा करें। आज्ञा देना उनके नमूना अनुमान क्रमशः आकार n 1 और n 2 के नमूनों पर बनाया गया है। फिर अंतर के लिए एक अनुमान है। इसलिए, इस अंतर के लिए विश्वास अंतराल इस प्रकार व्यक्त किया जाता है:

यहाँ z cr विशेष तालिकाओं के सामान्य वितरण से प्राप्त मूल्य है (उदाहरण के लिए, 95% विश्वास अंतराल के लिए 1.96)।

अनुमान की मानक त्रुटि इस मामले में संबंध द्वारा व्यक्त की जाती है:

.

उदाहरण

बड़ी बिक्री की तैयारी में स्टोर ने निम्नलिखित विपणन अनुसंधान किया। शीर्ष 300 खरीदारों का चयन किया गया और बेतरतीब ढंग से 150 सदस्यों के दो समूहों में विभाजित किया गया। सभी चयनित खरीदारों को बिक्री में भाग लेने के लिए निमंत्रण भेजा गया था, लेकिन केवल पहले समूह के सदस्यों के लिए 5% छूट का अधिकार देने वाला एक कूपन संलग्न किया गया था। सेल के दौरान सभी चयनित 300 खरीदारों की खरीदारी दर्ज की गई। एक प्रबंधक परिणामों की व्याख्या कैसे कर सकता है और कूपनिंग की प्रभावशीलता के बारे में निर्णय कैसे ले सकता है? (देखें कूपन.एक्सएलएस फ़ाइल (टेम्पलेट और समाधान))।

फेसला

हमारे विशेष मामले के लिए, छूट कूपन प्राप्त करने वाले 150 ग्राहकों में से 55 ने बिक्री पर खरीदारी की, और 150 में से जिन्हें कूपन प्राप्त नहीं हुआ, केवल 35 ने खरीदारी की (चित्र 103)
) तब नमूना अनुपात का मान क्रमशः 0.3667 और 0.2333 है। और उनके बीच नमूना अंतर क्रमशः 0.1333 के बराबर है। 95% के विश्वास अंतराल को मानते हुए, हम सामान्य वितरण तालिका z cr = 1.96 से पाते हैं। नमूना अंतर की मानक त्रुटि की गणना 0.0524 है। अंत में, हम पाते हैं कि 95% विश्वास अंतराल की निचली सीमा क्रमशः 0.0307 है, और ऊपरी सीमा क्रमशः 0.2359 है। प्राप्त परिणामों की व्याख्या इस तरह से की जा सकती है कि छूट कूपन प्राप्त करने वाले प्रत्येक 100 ग्राहकों के लिए, हम 3 से 23 नए ग्राहकों की अपेक्षा कर सकते हैं। हालांकि, यह ध्यान में रखा जाना चाहिए कि इस निष्कर्ष का मतलब कूपन का उपयोग करने की दक्षता नहीं है (क्योंकि छूट प्रदान करने से, हम लाभ में हार जाते हैं!)। आइए इसे विशिष्ट डेटा पर प्रदर्शित करें। मान लीजिए कि औसत खरीद राशि 400 रूबल है, जिसमें से 50 रूबल। एक स्टोर लाभ है। फिर प्रति 100 ग्राहकों पर अपेक्षित लाभ, जिन्हें कूपन नहीं मिला, के बराबर है:

50 0.2333 100 \u003d 1166.50 रूबल।

कूपन प्राप्त करने वाले 100 खरीदारों के लिए समान गणना दें:

30 0.3667 100 \u003d 1100.10 रूबल।

औसत लाभ में 30 की कमी को इस तथ्य से समझाया गया है कि छूट का उपयोग करके, कूपन प्राप्त करने वाले खरीदार औसतन 380 रूबल की खरीदारी करेंगे।

इस प्रकार, अंतिम निष्कर्ष इस विशेष स्थिति में ऐसे कूपन का उपयोग करने की अक्षमता को इंगित करता है।

टिप्पणी। इस समस्या को मानक StatPro टूल का उपयोग करके हल किया जा सकता है। ऐसा करने के लिए, यह इस समस्या को कम करने के लिए विधि द्वारा दो औसत के अंतर का अनुमान लगाने की समस्या को कम करने के लिए पर्याप्त है, और फिर लागू करें StatPro/सांख्यिकीय अनुमान/दो-नमूना विश्लेषणदो माध्य मानों के बीच अंतर के लिए एक विश्वास अंतराल बनाने के लिए।

कॉन्फिडेंस इंटरवल कंट्रोल

विश्वास अंतराल की लंबाई निर्भर करती है निम्नलिखित शर्तें:

    सीधे डेटा (मानक विचलन);

    महत्वपूर्ण स्तर;

    नमूने का आकार।

माध्य का अनुमान लगाने के लिए नमूना आकार

आइए पहले सामान्य मामले में समस्या पर विचार करें। आइए हम दिए गए विश्वास अंतराल की आधी लंबाई के मान को B (चित्र 104 .) के रूप में निरूपित करें
) हम जानते हैं कि कुछ यादृच्छिक चर X के माध्य मान के लिए विश्वास अंतराल को इस प्रकार व्यक्त किया जाता है , कहाँ पे . यह मानते हुए:

और n व्यक्त करते हुए, हम प्राप्त करते हैं।

दुर्भाग्य से, हम यादृच्छिक चर X के प्रसरण का सटीक मान नहीं जानते हैं। इसके अलावा, हम t करोड़ के मूल्य को नहीं जानते हैं क्योंकि यह स्वतंत्रता की डिग्री की संख्या के माध्यम से n पर निर्भर करता है। इस स्थिति में, हम निम्न कार्य कर सकते हैं। प्रसरण s के बजाय, हम अध्ययन के तहत यादृच्छिक चर के कुछ उपलब्ध अहसासों के लिए विचरण के कुछ अनुमान का उपयोग करते हैं। t cr मान के बजाय, हम सामान्य वितरण के लिए z cr मान का उपयोग करते हैं। यह काफी स्वीकार्य है, क्योंकि सामान्य और टी-वितरण के लिए घनत्व कार्य बहुत करीब हैं (छोटे n के मामले को छोड़कर)। इस प्रकार, वांछित सूत्र रूप लेता है:

.

चूंकि सूत्र देता है, आम तौर पर बोलते हुए, गैर-पूर्णांक परिणाम, परिणाम की अधिकता के साथ गोल करना वांछित नमूना आकार के रूप में लिया जाता है।

उदाहरण

फास्ट फूड रेस्तरां एक नए प्रकार के सैंडविच के साथ अपने वर्गीकरण का विस्तार करने की योजना बना रहा है। इसकी मांग का अनुमान लगाने के लिए, प्रबंधक बेतरतीब ढंग से उन लोगों में से कई आगंतुकों का चयन करने की योजना बना रहा है, जिन्होंने पहले से ही इसे आजमाया है, और उन्हें 1 से 10 के पैमाने पर नए उत्पाद के प्रति अपने दृष्टिकोण को रेट करने के लिए कहें। प्रबंधक चाहता है नए उत्पाद को प्राप्त होने वाले अंकों की अपेक्षित संख्या का अनुमान लगाने के लिए उत्पाद और उस अनुमान के 95% विश्वास अंतराल को प्लॉट करें। हालांकि, वह चाहता है कि कॉन्फिडेंस इंटरवल की आधी चौड़ाई 0.3 से अधिक न हो। उसे मतदान करने के लिए कितने आगंतुकों की आवश्यकता है?

निम्नलिखित नुसार:

यहां आर ओटीएसअंश p का एक अनुमान है, और B विश्वास अंतराल की लंबाई का आधा दिया गया है। एन के लिए एक फुलाया हुआ मूल्य मूल्य का उपयोग करके प्राप्त किया जा सकता है आर ओटीएस= 0.5. इस मामले में, विश्वास अंतराल की लंबाई p के किसी भी वास्तविक मान के लिए दिए गए मान B से अधिक नहीं होगी।

उदाहरण

पिछले उदाहरण से प्रबंधक को उन ग्राहकों के अनुपात का अनुमान लगाने की योजना बनाएं जो एक नए प्रकार के उत्पाद को पसंद करते हैं। वह 90% विश्वास अंतराल बनाना चाहता है जिसकी आधी लंबाई 0.05 से कम या उसके बराबर हो। यादृच्छिक रूप से कितने ग्राहकों का नमूना लिया जाना चाहिए?

फेसला

हमारे मामले में, z करोड़ का मान = 1.645। इसलिए, आवश्यक मात्रा की गणना इस प्रकार की जाती है .

यदि प्रबंधक के पास यह मानने का कारण था कि p का वांछित मान, उदाहरण के लिए, लगभग 0.3 है, तो इस मान को उपरोक्त सूत्र में प्रतिस्थापित करने पर, हमें यादृच्छिक नमूने का एक छोटा मान प्राप्त होगा, अर्थात् 228।

निर्धारित करने का सूत्र यादृच्छिक नमूना आकार दो साधनों के बीच अंतर के मामले मेंके रूप में लिखा है:

.

उदाहरण

कुछ कंप्यूटर कंपनी का एक ग्राहक सेवा केंद्र है। हाल ही में, सेवा की खराब गुणवत्ता के बारे में ग्राहकों की शिकायतों की संख्या में वृद्धि हुई है। सेवा केंद्र मुख्य रूप से दो प्रकार के कर्मचारियों को नियुक्त करता है: जिनके पास कम अनुभव है, लेकिन जिन्होंने विशेष प्रशिक्षण पाठ्यक्रम पूरा कर लिया है, और जिनके पास व्यापक व्यावहारिक अनुभव है, लेकिन जिन्होंने विशेष पाठ्यक्रम पूरा नहीं किया है। कंपनी पिछले छह महीनों में ग्राहकों की शिकायतों का विश्लेषण करना चाहती है और कर्मचारियों के दो समूहों में से प्रत्येक की औसत संख्या की तुलना करना चाहती है। यह माना जाता है कि दोनों समूहों के नमूनों में संख्या समान होगी। 95% अंतराल प्राप्त करने के लिए नमूने में कितने कर्मचारियों को शामिल किया जाना चाहिए, जिसकी आधी लंबाई 2 से अधिक नहीं है?

फेसला

यहां ots दोनों यादृच्छिक चरों के मानक विचलन का अनुमान है, इस धारणा के तहत कि वे करीब हैं। इस प्रकार, हमारे कार्य में, हमें किसी तरह यह अनुमान प्राप्त करने की आवश्यकता है। यह किया जा सकता है, उदाहरण के लिए, इस प्रकार है। पिछले छह महीनों में ग्राहक शिकायत डेटा को देखते हुए, एक प्रबंधक यह देख सकता है कि आम तौर पर प्रति कर्मचारी 6 से 36 शिकायतें होती हैं। यह जानते हुए कि एक सामान्य वितरण के लिए, व्यावहारिक रूप से सभी मान माध्य से तीन मानक विचलन से अधिक नहीं हैं, वह यथोचित रूप से विश्वास कर सकता है कि:

, जहां से ots = 5.

इस मान को सूत्र में प्रतिस्थापित करने पर, हम प्राप्त करते हैं .

निर्धारित करने का सूत्र शेयरों के बीच अंतर का अनुमान लगाने के मामले में एक यादृच्छिक नमूने का आकारकी तरह लगता है:

उदाहरण

कुछ कंपनी के समान उत्पादों के उत्पादन के लिए दो कारखाने हैं। एक कंपनी का प्रबंधक दोनों कारखानों की दोष दरों की तुलना करना चाहता है। उपलब्ध जानकारी के अनुसार, दोनों कारखानों में अस्वीकृति दर 3 से 5% तक है। इसे 99% कॉन्फिडेंस इंटरवल बनाना चाहिए जिसकी आधी लंबाई 0.005 (या 0.5%) से अधिक न हो। प्रत्येक कारखाने से कितने उत्पादों का चयन किया जाना चाहिए?

फेसला

यहाँ p 1ot और p 2ot पहली और दूसरी फैक्ट्रियों में अस्वीकार के दो अज्ञात अंशों का अनुमान है। यदि हम p 1ots \u003d p 2ots \u003d 0.5 डालते हैं, तो हमें n के लिए एक overestimated मान मिलेगा। लेकिन चूंकि हमारे मामले में हमारे पास इन शेयरों के बारे में कुछ प्राथमिक जानकारी है, इसलिए हम इन शेयरों का ऊपरी अनुमान, अर्थात् 0.05 लेते हैं। हम पाते हैं

नमूना डेटा से कुछ जनसंख्या मापदंडों का आकलन करते समय, न केवल पैरामीटर का एक बिंदु अनुमान प्रदान करना उपयोगी होता है, बल्कि एक आत्मविश्वास अंतराल भी होता है जो इंगित करता है कि अनुमानित पैरामीटर का सटीक मूल्य कहां हो सकता है।

इस अध्याय में, हम मात्रात्मक संबंधों से भी परिचित हुए हैं जो हमें विभिन्न मापदंडों के लिए ऐसे अंतराल बनाने की अनुमति देते हैं; आत्मविश्वास अंतराल की लंबाई को नियंत्रित करने के तरीके सीखे।

हम यह भी नोट करते हैं कि नमूना आकार (प्रयोग नियोजन समस्या) का अनुमान लगाने की समस्या को मानक स्टेटप्रो टूल्स का उपयोग करके हल किया जा सकता है, अर्थात् StatPro/सांख्यिकीय अनुमान/नमूना आकार चयन.

मन न केवल ज्ञान में है, बल्कि ज्ञान को व्यवहार में लागू करने की क्षमता में भी है। (अरस्तू)

विश्वास अंतराल

सामान्य समीक्षा

जनसंख्या से एक नमूना लेते हुए, हम अपने लिए ब्याज के पैरामीटर का एक बिंदु अनुमान प्राप्त करेंगे और अनुमान की सटीकता को इंगित करने के लिए मानक त्रुटि की गणना करेंगे।

हालांकि, ज्यादातर मामलों के लिए, इस तरह की मानक त्रुटि स्वीकार्य नहीं है। जनसंख्या पैरामीटर के लिए अंतराल अनुमान के साथ परिशुद्धता के इस माप को जोड़ना अधिक उपयोगी है।

यह पैरामीटर के लिए एक कॉन्फिडेंस इंटरवल (CI - कॉन्फिडेंस इंटरवल, CI - कॉन्फिडेंस इंटरवल) की गणना करने के लिए सैंपल स्टैटिस्टिक (पैरामीटर) के सैद्धांतिक संभाव्यता वितरण के ज्ञान का उपयोग करके किया जा सकता है।

सामान्य तौर पर, कॉन्फिडेंस इंटरवल दोनों दिशाओं में अनुमानों को मानक त्रुटि (किसी दिए गए पैरामीटर के) के कुछ गुणकों द्वारा बढ़ाता है; अंतराल को परिभाषित करने वाले दो मान (विश्वास सीमा) आमतौर पर अल्पविराम से अलग होते हैं और कोष्ठक में संलग्न होते हैं।

माध्य के लिए विश्वास अंतराल

सामान्य वितरण का उपयोग करना

यदि नमूना आकार बड़ा है, तो नमूना माध्य का सामान्य वितरण होता है, इसलिए नमूना माध्य पर विचार करते समय सामान्य वितरण का ज्ञान लागू किया जा सकता है।

विशेष रूप से, नमूना साधनों के वितरण का 95% जनसंख्या माध्य के 1.96 मानक विचलन (एसडी) के भीतर है।

जब हमारे पास केवल एक नमूना होता है, तो हम इसे माध्य (SEM) की मानक त्रुटि कहते हैं और माध्य के लिए 95% विश्वास अंतराल की गणना निम्नानुसार करते हैं:

यदि यह प्रयोग कई बार दोहराया जाता है, तो अंतराल में वास्तविक जनसंख्या माध्य 95% समय होगा।

यह आमतौर पर एक आत्मविश्वास अंतराल होता है, जैसे मूल्यों की वह सीमा जिसके भीतर वास्तविक जनसंख्या माध्य (सामान्य माध्य) 95% आत्मविश्वास स्तर के साथ होता है।

हालांकि यह काफी सख्त नहीं है (जनसंख्या माध्य एक निश्चित मूल्य है और इसलिए इससे संबंधित कोई संभावना नहीं हो सकती है) इस तरह से विश्वास अंतराल की व्याख्या करने के लिए, इसे समझना अवधारणात्मक रूप से आसान है।

प्रयोग टी-वितरण

यदि आप जनसंख्या में विचरण का मान जानते हैं तो आप सामान्य वितरण का उपयोग कर सकते हैं। इसके अलावा, जब नमूना आकार छोटा होता है, तो नमूना माध्य सामान्य वितरण का अनुसरण करता है यदि जनसंख्या के अंतर्गत डेटा सामान्य रूप से वितरित किया जाता है।

यदि जनसंख्या अंतर्निहित डेटा सामान्य रूप से वितरित नहीं किया जाता है और/या सामान्य भिन्नता (जनसंख्या भिन्नता) अज्ञात है, तो नमूना माध्य का पालन करता है छात्र का टी-वितरण.

जनसंख्या माध्य के लिए 95% विश्वास अंतराल की गणना निम्नानुसार करें:

कहां - प्रतिशत अंक (प्रतिशत) टी-स्वतंत्रता की (n-1) डिग्री के साथ छात्र वितरण, जो 0.05 की दो-पूंछ संभावना देता है।

सामान्य तौर पर, यह सामान्य वितरण का उपयोग करते समय की तुलना में एक व्यापक अंतराल प्रदान करता है, क्योंकि यह अतिरिक्त अनिश्चितता को ध्यान में रखता है जो जनसंख्या मानक विचलन का अनुमान लगाकर और/या छोटे नमूना आकार के कारण पेश किया जाता है।

जब नमूना आकार बड़ा होता है (100 या अधिक के क्रम का), तो दो वितरणों के बीच का अंतर ( टी छात्रऔर सामान्य) नगण्य है। हालांकि, हमेशा उपयोग करें टी-विश्वास अंतराल की गणना करते समय वितरण, भले ही नमूना आकार बड़ा हो।

आमतौर पर 95% सीआई दिया जाता है। अन्य विश्वास अंतरालों की गणना की जा सकती है, जैसे कि माध्य के लिए 99% सीआई।

मानक त्रुटि और तालिका मान के उत्पाद के बजाय टी-वितरण जो 0.05 की दो-पुच्छीय संभावना से मेल खाता है, इसे (मानक त्रुटि) 0.01 की दो-पूंछ संभावना से मेल खाने वाले मान से गुणा करें। यह 95% मामले की तुलना में एक व्यापक विश्वास अंतराल है क्योंकि यह बढ़े हुए विश्वास को दर्शाता है कि अंतराल में वास्तव में जनसंख्या माध्य शामिल है।

अनुपात के लिए विश्वास अंतराल

अनुपातों के न्यादर्श वितरण का द्विपद बंटन होता है। हालांकि, यदि नमूना आकार एनयथोचित रूप से बड़ा है, तो अनुपात नमूना वितरण माध्य के साथ लगभग सामान्य है।

नमूना अनुपात द्वारा अनुमान पी = आर / एन(कहाँ पे आर- नमूने में हमारे लिए रुचि की विशेषताओं वाले व्यक्तियों की संख्या), और मानक त्रुटि का अनुमान है:

अनुपात के लिए 95% विश्वास अंतराल अनुमानित है:

यदि नमूना आकार छोटा है (आमतौर पर जब एनपीया एन(1-पी)छोटे 5 ), तो सटीक विश्वास अंतराल की गणना के लिए द्विपद वितरण का उपयोग किया जाना चाहिए।

ध्यान दें कि अगर पीप्रतिशत के रूप में व्यक्त किया जाता है, तो (1-पी)द्वारा प्रतिस्थापित (100पी).

विश्वास अंतराल की व्याख्या

विश्वास अंतराल की व्याख्या करते समय, हम निम्नलिखित प्रश्नों में रुचि रखते हैं:

कॉन्फिडेंस इंटरवल कितना चौड़ा है?

एक विस्तृत विश्वास अंतराल इंगित करता है कि अनुमान सटीक नहीं है; संकीर्ण एक अच्छा अनुमान इंगित करता है।

विश्वास अंतराल की चौड़ाई मानक त्रुटि के आकार पर निर्भर करती है, जो बदले में नमूना आकार पर निर्भर करती है, और डेटा की परिवर्तनशीलता से एक संख्यात्मक चर पर विचार करते समय, कुछ के बड़े डेटा सेट के अध्ययन की तुलना में व्यापक आत्मविश्वास अंतराल दें। चर।

क्या सीआई में विशेष रुचि के कोई मूल्य शामिल हैं?

आप जांच सकते हैं कि जनसंख्या पैरामीटर के लिए संभावित मान विश्वास अंतराल के भीतर आता है या नहीं। यदि हाँ, तो परिणाम इस संभावित मान के अनुरूप हैं। यदि नहीं, तो यह संभावना नहीं है (95% विश्वास अंतराल के लिए, संभावना लगभग 5% है) कि पैरामीटर का यह मान है।