लक्ष्य- सांख्यिकीय मापदंडों के विश्वास अंतराल की गणना के लिए छात्रों को एल्गोरिदम सिखाने के लिए।
डेटा के सांख्यिकीय प्रसंस्करण के दौरान, परिकलित अंकगणितीय माध्य, भिन्नता का गुणांक, सहसंबंध गुणांक, अंतर मानदंड और अन्य बिंदु आँकड़ों को मात्रात्मक विश्वास सीमाएँ प्राप्त करनी चाहिए, जो विश्वास अंतराल के भीतर संकेतक के संभावित उतार-चढ़ाव को इंगित करती हैं।
उदाहरण 3.1
.
बंदरों के रक्त सीरम में कैल्शियम का वितरण, जैसा कि पहले स्थापित किया गया था, निम्नलिखित चुनिंदा संकेतकों की विशेषता है: = 11.94 मिलीग्राम%; = 0.127 मिलीग्राम%; एन= 100. सामान्य औसत के लिए विश्वास अंतराल निर्धारित करना आवश्यक है (
) आत्मविश्वास की संभावना के साथ पी
= 0,95.
सामान्य औसत अंतराल में एक निश्चित संभावना के साथ है:
, कहाँ पे
- नमूना अंकगणितीय माध्य; टी- छात्र की कसौटी;
अंकगणित माध्य की त्रुटि है।
तालिका "छात्र के मानदंड के मूल्य" के अनुसार हम मूल्य पाते हैं
0.95 के आत्मविश्वास के स्तर और स्वतंत्रता की डिग्री की संख्या के साथ क\u003d 100-1 \u003d 99. यह 1.982 के बराबर है। अंकगणित माध्य और सांख्यिकीय त्रुटि के मूल्यों के साथ, हम इसे सूत्र में प्रतिस्थापित करते हैं:
या 11.69 12,19
इस प्रकार, 95% की संभावना के साथ, यह तर्क दिया जा सकता है कि इस सामान्य वितरण का सामान्य औसत 11.69 और 12.19 मिलीग्राम% के बीच है।
उदाहरण 3.2
. सामान्य विचरण के लिए 95% विश्वास अंतराल की सीमाएं निर्धारित करें ( ) बंदरों के रक्त में कैल्शियम का वितरण, यदि यह ज्ञात हो कि
= 1.60, साथ एन
= 100.
समस्या को हल करने के लिए, आप निम्न सूत्र का उपयोग कर सकते हैं:
कहाँ विचरण की सांख्यिकीय त्रुटि है।
सूत्र का उपयोग करके नमूना विचरण त्रुटि का पता लगाएं: . यह 0.11 के बराबर है। अर्थ टी- 0.95 की आत्मविश्वास संभावना और स्वतंत्रता की डिग्री की संख्या के साथ मानदंड क= 100–1 = 99 पिछले उदाहरण से जाना जाता है।
आइए सूत्र का उपयोग करें और प्राप्त करें:
या 1.38 1,82
सामान्य विचरण के लिए एक अधिक सटीक विश्वास अंतराल का निर्माण किया जा सकता है (ची-स्क्वायर) - पियर्सन का परीक्षण। इस मानदंड के लिए महत्वपूर्ण बिंदु एक विशेष तालिका में दिए गए हैं। मानदंड का उपयोग करते समय
एक विश्वास अंतराल बनाने के लिए दो-तरफा महत्व स्तर का उपयोग किया जाता है। निचली सीमा के लिए, महत्व स्तर की गणना सूत्र द्वारा की जाती है
, ऊपरी के लिए
. उदाहरण के लिए, आत्मविश्वास के स्तर के लिए
=
0,99
= 0,010,
= 0.990। तदनुसार, महत्वपूर्ण मूल्यों के वितरण की तालिका के अनुसार
, गणना किए गए आत्मविश्वास के स्तर और स्वतंत्रता की डिग्री की संख्या के साथ क= 100 – 1= 99, मान ज्ञात कीजिए
और
. हम पाते हैं
बराबर 135.80, और
70.06 के बराबर है।
सामान्य प्रसरण की विश्वास सीमा ज्ञात करने के लिए हम सूत्रों का उपयोग करते हैं: निचली सीमा के लिए
, ऊपरी सीमा के लिए
. पाए गए मानों के लिए कार्य डेटा को प्रतिस्थापित करें
सूत्रों में:
=
1,17;
= 2.26. इस प्रकार, एक आत्मविश्वास के स्तर के साथ पी= 0.99 या 99% सामान्य विचरण 1.17 से 2.26 मिलीग्राम% समावेशी की सीमा में होगा।
उदाहरण 3.3 . लिफ्ट में पहुंचे लॉट से आए 1000 गेहूं के बीजों में से 120 बीज एर्गोट से संक्रमित पाए गए। गेहूं के दिए गए बैच में संक्रमित बीजों के कुल अनुपात की संभावित सीमाओं को निर्धारित करना आवश्यक है।
इसके सभी संभावित मूल्यों के लिए सामान्य हिस्सेदारी के लिए विश्वास सीमा सूत्र द्वारा निर्धारित की जानी चाहिए:
,
कहाँ एन टिप्पणियों की संख्या है; एमसमूहों में से एक की पूर्ण संख्या है; टीसामान्यीकृत विचलन है।
संक्रमित बीजों का नमूना अंश बराबर होता है या 12%। आत्मविश्वास के स्तर के साथ आर= 95% सामान्यीकृत विचलन ( टी-छात्र की कसौटी क
=
)टी
= 1,960.
हम उपलब्ध डेटा को सूत्र में प्रतिस्थापित करते हैं:
इसलिए, विश्वास अंतराल की सीमाएं हैं = 0.122–0.041 = 0.081, या 8.1%;
= 0.122 + 0.041 = 0.163, या 16.3%।
इस प्रकार, 95% के आत्मविश्वास के स्तर के साथ, यह कहा जा सकता है कि संक्रमित बीजों का कुल अनुपात 8.1 से 16.3% के बीच है।
उदाहरण 3.4 . भिन्नता का गुणांक, जो बंदरों के रक्त सीरम में कैल्शियम (मिलीग्राम%) की भिन्नता को दर्शाता है, 10.6% के बराबर था। नमूने का आकार एन= 100. सामान्य पैरामीटर के लिए 95% विश्वास अंतराल की सीमाओं को निर्धारित करना आवश्यक है सीवी.
भिन्नता के सामान्य गुणांक के लिए विश्वास सीमा सीवी निम्नलिखित सूत्रों द्वारा निर्धारित किया जाता है:
और
, कहाँ पे क
सूत्र द्वारा परिकलित मध्यवर्ती मान
.
यह जानते हुए कि आत्मविश्वास के स्तर के साथ आर= 95% सामान्यीकृत विचलन (छात्र के लिए t-परीक्षण क
=
)टी
= 1.960, मान की पूर्व-गणना करें को:
.
या 9.3%
या 12.3%
इस प्रकार, 95% की आत्मविश्वास संभावना के साथ भिन्नता का सामान्य गुणांक 9.3 से 12.3% की सीमा में है। दोहराए गए नमूनों के साथ, भिन्नता का गुणांक 12.3% से अधिक नहीं होगा और 100 में से 95 मामलों में 9.3% से कम नहीं होगा।
आत्म-नियंत्रण के लिए प्रश्न:
![](https://i0.wp.com/studfiles.net/html/2706/209/html_PFBcsAX2iL.qTCl/img-ussnvM.png)
स्वतंत्र समाधान के लिए कार्य।
1. खोलमोगोरी क्रॉस की गायों के दुग्धपान के लिए दूध में वसा का औसत प्रतिशत इस प्रकार था: 3.4; 3.6; 3.2; 3.1; 2.9; 3.7; 3.2; 3.6; 4.0; 3.4; 4.1; 3.8; 3.4; 4.0; 3.3; 3.7; 3.5; 3.6; 3.4; 3.8. समग्र माध्य के लिए आत्मविश्वास अंतराल को 95% विश्वास स्तर (20 अंक) पर सेट करें।
2. संकर राई के 400 पौधों पर पहले फूल बुवाई के 70.5 दिनों के बाद औसतन दिखाई देते हैं। मानक विचलन 6.9 दिन था। महत्व के स्तर पर जनसंख्या माध्य और विचरण के लिए माध्य और विश्वास अंतराल की त्रुटि का निर्धारण करें वू= 0.05 और वू= 0.01 (25 अंक)।
3. उद्यान स्ट्रॉबेरी के 502 नमूनों की पत्तियों की लंबाई का अध्ययन करते समय, निम्नलिखित आंकड़े प्राप्त हुए:
= 7.86 सेमी; = 1.32 सेमी,
\u003d ± 0.06 सेमी। 0.01 के महत्व के स्तर के साथ जनसंख्या के अंकगणितीय माध्य के लिए आत्मविश्वास अंतराल निर्धारित करें; 0.02; 0.05. (25 अंक)।
4. 150 वयस्क पुरुषों की जांच करते समय, औसत ऊंचाई 167 सेमी थी, और σ \u003d 6 सेमी। 0.99 और 0.95 की आत्मविश्वास संभावना के साथ सामान्य औसत और सामान्य विचरण की सीमाएं क्या हैं? (25 अंक)।
5. बंदरों के रक्त सीरम में कैल्शियम का वितरण निम्नलिखित चुनिंदा संकेतकों की विशेषता है:
= 11.94 मिलीग्राम%, σ
= 1,27, एन
= 100. इस वितरण के जनसंख्या माध्य के लिए 95% विश्वास अंतराल प्लॉट करें। भिन्नता के गुणांक (25 अंक) की गणना करें।
6. 37 और 180 दिनों की उम्र में एल्बिनो चूहों के रक्त प्लाज्मा में कुल नाइट्रोजन सामग्री का अध्ययन किया गया था। परिणाम प्लाज्मा के प्रति 100 सेमी 3 ग्राम में व्यक्त किए जाते हैं। 37 दिनों की उम्र में, 9 चूहों में: 0.98; 0.83; 0.99; 0.86; 0.90; 0.81; 0.94; 0.92; 0.87. 180 दिनों की उम्र में, 8 चूहों के पास: 1.20; 1.18; 1.33; 1.21; 1.20; 1.07; 1.13; 1.12. 0.95 (50 अंक) के आत्मविश्वास स्तर के साथ अंतर के लिए विश्वास अंतराल निर्धारित करें।
7. बंदरों के रक्त सीरम में कैल्शियम (मिलीग्राम%) के वितरण के सामान्य विचरण के लिए 95% विश्वास अंतराल की सीमाएं निर्धारित करें, यदि इस वितरण के लिए नमूना आकार n = 100, नमूना विचरण की सांख्यिकीय त्रुटि एस σ 2 = 1.60 (40 अंक)।
8. लंबाई (σ 2 = 40.87 मिमी 2) के साथ गेहूं के 40 स्पाइकलेट के वितरण के सामान्य भिन्नता के लिए 95% विश्वास अंतराल की सीमाएं निर्धारित करें। (25 अंक)।
9. धूम्रपान को ऑब्सट्रक्टिव पल्मोनरी डिजीज का मुख्य कारक माना जाता है। निष्क्रिय धूम्रपान को ऐसा कारक नहीं माना जाता है। वैज्ञानिकों ने निष्क्रिय धूम्रपान की सुरक्षा पर सवाल उठाया और धूम्रपान न करने वाले, निष्क्रिय और सक्रिय धूम्रपान करने वालों में वायुमार्ग की जांच की। श्वसन पथ की स्थिति को चिह्नित करने के लिए, हमने बाहरी श्वसन के कार्य के संकेतकों में से एक लिया - साँस छोड़ने के बीच का अधिकतम वॉल्यूमेट्रिक वेग। इस सूचक में कमी बिगड़ा हुआ वायुमार्ग धैर्य का संकेत है। सर्वेक्षण डेटा तालिका में दिखाया गया है।
जांच की संख्या |
अधिकतम मध्य-श्वसन प्रवाह दर, एल / एस |
||
मानक विचलन |
|||
धूम्रपान न करने वालों |
|||
धूम्रपान रहित क्षेत्र में काम करें | |||
धुएँ से भरे कमरे में काम करें | |||
धूम्रपान करने वालों के |
|||
कम संख्या में सिगरेट पीना | |||
सिगरेट पीने वालों की औसत संख्या | |||
बड़ी संख्या में सिगरेट पीना |
तालिका से, प्रत्येक समूह के लिए सामान्य माध्य और सामान्य भिन्नता के लिए 95% विश्वास अंतराल खोजें। समूहों के बीच अंतर क्या हैं? परिणामों को ग्राफिक रूप से प्रस्तुत करें (25 अंक)।
10. 95% और 99% विश्वास अंतराल की सीमाएं निर्धारित करें, 64 फ़रोइंग में पिगलेट की संख्या के सामान्य विचरण के लिए, यदि नमूना विचरण की सांख्यिकीय त्रुटि एस σ 2 = 8.25 (30 अंक)।
11. यह ज्ञात है कि खरगोशों का औसत वजन 2.1 किलो है। सामान्य माध्य और विचरण के लिए 95% और 99% विश्वास अंतराल की सीमाएं निर्धारित करें जब एन= 30, = 0.56 किग्रा (25 अंक)।
12. 100 कानों में, कान के दाने की मात्रा को मापा गया ( एक्स), स्पाइक लंबाई ( यू) और कान में अनाज का द्रव्यमान ( जेड) सामान्य माध्य और विचरण के लिए विश्वास अंतराल खोजें पी 1
= 0,95, पी 2
= 0,99, पी 3
= 0.999 अगर
= 19, = 6.766 सेमी, = 0.554 ग्राम; x 2 = 29.153, y 2 = 2.111, z 2 = 0.064. (25 अंक)।
13. सर्दियों के गेहूं के 100 कानों में बेतरतीब ढंग से चुने गए स्पाइकलेट्स की संख्या को गिना गया। नमूना सेट को निम्नलिखित संकेतकों की विशेषता थी:
= 15 स्पाइकलेट और = 2.28 पीसी। उस सटीकता का निर्धारण करें जिसके साथ औसत परिणाम प्राप्त होता है (
) और समग्र माध्य और विचरण के लिए आत्मविश्वास अंतराल को 95% और 99% महत्व स्तरों (30 अंक) पर प्लॉट करें।
14. जीवाश्म मोलस्क के गोले पर पसलियों की संख्या ऑर्थोम्बोनाइट्स सुलेख:
ह ज्ञात है कि एन = 19, σ = 4.25. महत्व के स्तर पर सामान्य माध्य और सामान्य विचरण के लिए विश्वास अंतराल की सीमाएं निर्धारित करें वू = 0.01 (25 अंक)।
15. एक व्यावसायिक डेयरी फार्म पर दूध की पैदावार निर्धारित करने के लिए प्रतिदिन 15 गायों की उत्पादकता निर्धारित की गई। वर्ष के आंकड़ों के अनुसार, प्रत्येक गाय ने प्रति दिन औसतन निम्नलिखित मात्रा में दूध दिया (एल): 22; उन्नीस; 25; 20; 27; 17; तीस; 21; अठारह; 24; 26; 23; 25; 20; 24. सामान्य विचरण और अंकगणित माध्य के लिए विश्वास अंतराल प्लॉट करें। क्या हम प्रति गाय औसत वार्षिक दूध उत्पादन 10,000 लीटर होने की उम्मीद कर सकते हैं? (50 अंक)।
16. खेत के लिए औसत गेहूं की उपज निर्धारित करने के लिए 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 और 2 हेक्टेयर के नमूना भूखंडों पर बुवाई की गई। भूखंडों से उपज (सी/हेक्टेयर) 39.4 थी; 38; 35.8; 40; 35; 42.7; 39.3; 41.6; 33; 42; 29 क्रमशः। सामान्य विचरण और अंकगणित माध्य के लिए विश्वास अंतराल प्लॉट करें। क्या यह उम्मीद करना संभव है कि कृषि क्षेत्र के लिए औसत उपज 42 सेंटीमीटर प्रति हेक्टेयर होगी? (50 अंक)।
आँकड़ों में, अनुमान दो प्रकार के होते हैं: बिंदु और अंतराल। बिंदु अनुमानएक एकल नमूना आँकड़ा है जिसका उपयोग जनसंख्या पैरामीटर का अनुमान लगाने के लिए किया जाता है। उदाहरण के लिए, नमूना माध्य जनसंख्या माध्य का एक बिंदु अनुमान है, और नमूना विचरण एस 2- जनसंख्या विचरण का बिंदु अनुमान 2. यह दिखाया गया कि नमूना माध्य जनसंख्या अपेक्षा का एक निष्पक्ष अनुमान है। नमूना माध्य को निष्पक्ष कहा जाता है क्योंकि सभी नमूने का मतलब (समान नमूना आकार के साथ) एन) सामान्य जनसंख्या की गणितीय अपेक्षा के बराबर है।
नमूना विचरण के क्रम में एस 2जनसंख्या भिन्नता का एक निष्पक्ष अनुमानक बन गया 2, नमूना विचरण के हर के बराबर सेट किया जाना चाहिए एन – 1 , लेकिन नहीं एन. दूसरे शब्दों में, जनसंख्या विचरण सभी संभावित नमूना प्रसरणों का औसत है।
जनसंख्या मापदंडों का आकलन करते समय, यह ध्यान में रखा जाना चाहिए कि नमूना आँकड़े जैसे , विशिष्ट नमूनों पर निर्भर करते हैं। इस तथ्य को ध्यान में रखते हुए, प्राप्त करने के लिए अंतराल अनुमानसामान्य जनसंख्या की गणितीय अपेक्षा नमूना साधनों के वितरण का विश्लेषण करती है (अधिक विवरण के लिए, देखें)। निर्मित अंतराल एक निश्चित आत्मविश्वास स्तर की विशेषता है, जो कि संभावना है कि सामान्य आबादी के सही पैरामीटर का सही अनुमान लगाया गया है। किसी विशेषता के अनुपात का अनुमान लगाने के लिए समान विश्वास अंतराल का उपयोग किया जा सकता है आरऔर सामान्य आबादी का मुख्य वितरित द्रव्यमान।
नोट या प्रारूप में डाउनलोड करें, प्रारूप में उदाहरण
एक ज्ञात मानक विचलन के साथ सामान्य जनसंख्या की गणितीय अपेक्षा के लिए एक विश्वास अंतराल का निर्माण
सामान्य जनसंख्या में एक विशेषता के अनुपात के लिए एक विश्वास अंतराल का निर्माण
इस खंड में, एक विश्वास अंतराल की अवधारणा को श्रेणीबद्ध डेटा तक बढ़ाया गया है। यह आपको सामान्य आबादी में विशेषता के हिस्से का अनुमान लगाने की अनुमति देता है आरएक नमूना शेयर के साथ आरएस= एक्स/एन. जैसा कि उल्लेख किया गया है, यदि मान एनआरऔर एन(1 - पी)संख्या 5 से अधिक, द्विपद वितरण को सामान्य द्वारा अनुमानित किया जा सकता है। इसलिए, सामान्य जनसंख्या में एक विशेषता के हिस्से का अनुमान लगाने के लिए आरएक अंतराल का निर्माण करना संभव है जिसका आत्मविश्वास स्तर बराबर है (1 - α)x100%.
कहाँ पे पीएस- सुविधा का नमूना हिस्सा, के बराबर एक्स/एन, अर्थात। नमूना आकार से विभाजित सफलताओं की संख्या, आर- सामान्य आबादी में विशेषता का हिस्सा, जेडमानकीकृत सामान्य वितरण का महत्वपूर्ण मूल्य है, एन- नमूने का आकार।
उदाहरण 3मान लें कि सूचना प्रणाली से एक नमूना निकाला गया है, जिसमें पिछले महीने के दौरान पूरे किए गए 100 चालान शामिल हैं। मान लें कि इनमें से 10 चालान गलत हैं। इस प्रकार, आर= 10/100 = 0.1. 95% आत्मविश्वास का स्तर महत्वपूर्ण मान Z = 1.96 से मेल खाता है।
इस प्रकार, 95% संभावना है कि 4.12% और 15.88% के बीच चालान में त्रुटियां हैं।
किसी दिए गए नमूने के आकार के लिए, सामान्य जनसंख्या में विशेषता के अनुपात वाला विश्वास अंतराल एक सतत यादृच्छिक चर की तुलना में व्यापक प्रतीत होता है। ऐसा इसलिए है क्योंकि एक सतत यादृच्छिक चर के माप में श्रेणीबद्ध डेटा के मापन की तुलना में अधिक जानकारी होती है। दूसरे शब्दों में, केवल दो मान लेने वाले श्रेणीबद्ध डेटा में उनके वितरण के मापदंडों का अनुमान लगाने के लिए अपर्याप्त जानकारी होती है।
परपरिमित जनसंख्या से प्राप्त अनुमानों की गणना
गणितीय अपेक्षा का अनुमान।अंतिम जनसंख्या के लिए सुधार कारक ( पांचवें वेतन आयोग) का उपयोग मानक त्रुटि को एक कारक द्वारा कम करने के लिए किया गया था। जनसंख्या मापदंडों के अनुमानों के लिए विश्वास अंतराल की गणना करते समय, उन स्थितियों में एक सुधार कारक लागू किया जाता है जहां नमूने बिना प्रतिस्थापन के लिए जाते हैं। इस प्रकार, गणितीय अपेक्षा के लिए कॉन्फिडेंस इंटरवल, जिसका कॉन्फिडेंस लेवल के बराबर होता है (1 - α)x100%, सूत्र द्वारा गणना की जाती है:
उदाहरण 4एक सीमित आबादी के लिए एक सुधार कारक के आवेदन को स्पष्ट करने के लिए, आइए हम ऊपर उदाहरण 3 में चर्चा की गई चालानों की औसत राशि के लिए विश्वास अंतराल की गणना करने की समस्या पर लौटते हैं। मान लीजिए कि एक कंपनी प्रति माह 5,000 चालान जारी करती है, और एक्स=110.27 अमरीकी डालर, एस= $28.95 एन = 5000, एन = 100, α = 0.05, t99 = 1.9842। सूत्र (6) के अनुसार हम प्राप्त करते हैं:
सुविधा के हिस्से का अनुमान।नो रिटर्न चुनते समय, कॉन्फिडेंस इंटरवल उस फीचर के अनुपात के लिए होता है जिसका कॉन्फिडेंस लेवल के बराबर होता है (1 - α)x100%, सूत्र द्वारा गणना की जाती है:
विश्वास अंतराल और नैतिक मुद्दे
जनसंख्या का नमूना लेते समय और सांख्यिकीय निष्कर्ष तैयार करते समय, नैतिक समस्याएं अक्सर उत्पन्न होती हैं। मुख्य बात यह है कि नमूना आँकड़ों के विश्वास अंतराल और बिंदु अनुमान कैसे सहमत होते हैं। उचित विश्वास अंतराल (आमतौर पर 95% आत्मविश्वास के स्तर पर) निर्दिष्ट किए बिना प्रकाशन बिंदु अनुमान और जिस नमूना आकार से वे प्राप्त किए गए हैं, वे भ्रामक हो सकते हैं। इससे उपयोगकर्ता को यह आभास हो सकता है कि एक बिंदु अनुमान ठीक वही है जो उसे पूरी आबादी के गुणों की भविष्यवाणी करने के लिए चाहिए। इस प्रकार यह समझना आवश्यक है कि किसी भी शोध में बिंदु नहीं, बल्कि अंतराल अनुमानों को सबसे आगे रखा जाना चाहिए। इसके अलावा, नमूना आकारों के सही चुनाव पर विशेष ध्यान दिया जाना चाहिए।
सबसे अधिक बार, सांख्यिकीय जोड़तोड़ की वस्तुएं विभिन्न राजनीतिक मुद्दों पर जनसंख्या के समाजशास्त्रीय सर्वेक्षण के परिणाम हैं। साथ ही सर्वेक्षण के परिणामों को समाचार पत्रों के पहले पन्ने पर रखा जाता है, और नमूना त्रुटि और सांख्यिकीय विश्लेषण की पद्धति बीच में कहीं छपी होती है। प्राप्त बिंदु अनुमानों की वैधता को साबित करने के लिए, नमूना आकार को इंगित करना आवश्यक है जिसके आधार पर उन्हें प्राप्त किया गया था, विश्वास अंतराल की सीमाएं और इसका महत्व स्तर।
अगला नोट
लेविन एट अल पुस्तक से सामग्री प्रबंधकों के लिए सांख्यिकी का उपयोग किया जाता है। - एम .: विलियम्स, 2004. - पी। 448-462
केंद्रीय सीमा प्रमेययह बताता है कि, पर्याप्त रूप से बड़े नमूना आकार को देखते हुए, साधनों के नमूना वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है। यह संपत्ति जनसंख्या वितरण के प्रकार पर निर्भर नहीं करती है।
पिछले उपखंडों में, हमने अज्ञात पैरामीटर के आकलन के प्रश्न पर विचार किया एएक नंबर। इस तरह के आकलन को "बिंदु" कहा जाता है। कई कार्यों में, न केवल पैरामीटर खोजने की आवश्यकता होती है एउपयुक्त संख्यात्मक मान, लेकिन इसकी सटीकता और विश्वसनीयता का मूल्यांकन भी करते हैं। यह जानना आवश्यक है कि पैरामीटर प्रतिस्थापन किन त्रुटियों को जन्म दे सकता है एइसका बिंदु अनुमान एऔर हम किस हद तक विश्वास के साथ उम्मीद कर सकते हैं कि ये त्रुटियां ज्ञात सीमाओं से आगे नहीं बढ़ेंगी?
इस तरह की समस्याएं विशेष रूप से कम संख्या में टिप्पणियों के लिए प्रासंगिक होती हैं, जब बिंदु का अनुमान लगाया जाता है और मेंकाफी हद तक यादृच्छिक है और a का अनुमानित प्रतिस्थापन गंभीर त्रुटियों को जन्म दे सकता है।
अनुमान की सटीकता और विश्वसनीयता का अंदाजा लगाने के लिए ए,
गणितीय आँकड़ों में, तथाकथित विश्वास अंतराल और आत्मविश्वास की संभावनाओं का उपयोग किया जाता है।
चलो पैरामीटर के लिए एअनुभव से प्राप्त निष्पक्ष अनुमान ए।हम इस मामले में संभावित त्रुटि का अनुमान लगाना चाहते हैं। आइए हम कुछ पर्याप्त रूप से बड़ी प्रायिकता p (उदाहरण के लिए, p = 0.9, 0.95, या 0.99) इस प्रकार निर्दिष्ट करें कि प्रायिकता p वाली एक घटना को व्यावहारिक रूप से निश्चित माना जा सके, और s का मान ज्ञात करें जिसके लिए
फिर त्रुटि के व्यावहारिक रूप से संभावित मूल्यों की सीमा जो प्रतिस्थापित करते समय होती है एपर ए, ± एस होगा; बड़ी निरपेक्ष त्रुटियाँ केवल एक छोटी प्रायिकता a = 1 - p के साथ दिखाई देंगी। आइए फिर से लिखें (14.3.1) इस प्रकार:
समानता (14.3.2) का अर्थ है कि प्रायिकता p के साथ पैरामीटर का अज्ञात मान एअंतराल के भीतर आता है
इस मामले में, एक परिस्थिति पर ध्यान दिया जाना चाहिए। पहले, हमने बार-बार किसी दिए गए गैर-यादृच्छिक अंतराल में एक यादृच्छिक चर के गिरने की प्रायिकता पर विचार किया। यहां स्थिति अलग है: एयादृच्छिक नहीं, बल्कि यादृच्छिक अंतराल / आर। एक्स-अक्ष पर यादृच्छिक रूप से इसकी स्थिति, इसके केंद्र द्वारा निर्धारित ए; सामान्य तौर पर, अंतराल 2s की लंबाई भी यादृच्छिक होती है, क्योंकि s के मान की गणना, एक नियम के रूप में, प्रयोगात्मक डेटा से की जाती है। इसलिए, इस मामले में, पी के मूल्य की व्याख्या करना बेहतर होगा, न कि बिंदु को "मारने" की संभावना के रूप में एअंतराल / पी में, लेकिन संभावना के रूप में कि एक यादृच्छिक अंतराल / पी बिंदु को कवर करेगा ए(चित्र 14.3.1)।
चावल। 14.3.1
प्रायिकता p कहलाती है आत्मविश्वास का स्तर, और अंतराल / पी - विश्वास अंतराल।अंतराल सीमाएं अगर। ए एक्स \u003d ए-रेत ए 2 = ए +और कहा जाता है विश्वास की सीमाएँ।
आइए एक विश्वास अंतराल की अवधारणा को एक और व्याख्या दें: इसे पैरामीटर मानों के अंतराल के रूप में माना जा सकता है ए,प्रयोगात्मक डेटा के साथ संगत और उनका खंडन नहीं करना। दरअसल, अगर हम एक संभावना के साथ एक घटना पर विचार करने के लिए सहमत हैं a = 1-p व्यावहारिक रूप से असंभव है, तो पैरामीटर के वे मान जिनके लिए a ए - ए> s को प्रयोगात्मक डेटा के विरोधाभासी के रूप में पहचाना जाना चाहिए, और जिनके लिए |a - एएक टी ना 2।
चलो पैरामीटर के लिए एएक निष्पक्ष अनुमान है ए।अगर हम मात्रा के वितरण के नियम को जानते हैं ए, विश्वास अंतराल खोजने की समस्या काफी सरल होगी: यह s का मान ज्ञात करने के लिए पर्याप्त होगा जिसके लिए
कठिनाई इस तथ्य में निहित है कि अनुमान का वितरण कानून एमात्रा के वितरण के नियम पर निर्भर करता है एक्सऔर, फलस्वरूप, इसके अज्ञात मापदंडों पर (विशेष रूप से, पैरामीटर पर ही ए)।
इस कठिनाई को दूर करने के लिए, कोई निम्नलिखित मोटे तौर पर अनुमानित चाल को लागू कर सकता है: अज्ञात पैरामीटर को s के लिए उनके बिंदु अनुमानों के साथ बदलें। अपेक्षाकृत बड़ी संख्या में प्रयोगों के साथ पी(लगभग 20 ... 30) यह तकनीक आमतौर पर सटीकता के मामले में संतोषजनक परिणाम देती है।
एक उदाहरण के रूप में, गणितीय अपेक्षा के लिए विश्वास अंतराल की समस्या पर विचार करें।
चलो उत्पादित पी एक्स,जिनकी विशेषताएँ गणितीय अपेक्षाएँ हैं टीऔर भिन्नता डी- अनजान। इन मापदंडों के लिए, निम्नलिखित अनुमान प्राप्त किए गए थे:
गणितीय अपेक्षा के लिए कॉन्फिडेंस इंटरवल / р, कॉन्फिडेंस प्रायिकता р के अनुरूप बनाना आवश्यक है टीमात्रा एक्स।
इस समस्या को हल करने में, हम इस तथ्य का उपयोग करते हैं कि मात्रा टीयोग है पीस्वतंत्र समान रूप से वितरित यादृच्छिक चर एक्स एचऔर पर्याप्त रूप से बड़े के लिए केंद्रीय सीमा प्रमेय के अनुसार पीइसका वितरण कानून सामान्य के करीब है। व्यवहार में, अपेक्षाकृत कम संख्या में (10 ... 20 के क्रम के) के साथ, योग के वितरण कानून को लगभग सामान्य माना जा सकता है। हम मान लेंगे कि मूल्य टीसामान्य कानून के अनुसार वितरित। इस कानून की विशेषताएं - गणितीय अपेक्षा और विचरण - क्रमशः समान हैं टीऔर
(अध्याय 13 उपधारा 13.3 देखें)। मान लेते हैं कि मान डीहमें ज्ञात है और हमें ऐसा मूल्य ईपी मिलेगा जिसके लिए
अध्याय 6 के सूत्र (6.3.5) का प्रयोग करते हुए, हम (14.3.5) के बाईं ओर प्रायिकता को सामान्य वितरण फलन के रूप में व्यक्त करते हैं।
अनुमान का मानक विचलन कहाँ है टी।
समीकरण से
एसपी मान पाएं:
जहाँ arg * (x) * का प्रतिलोम फलन है (एक्स),वे। तर्क का ऐसा मान जिसके लिए सामान्य वितरण फलन के बराबर है एक्स।
फैलाव डी,जिसके माध्यम से मूल्य व्यक्त किया जाता है ए 1P, हम ठीक से नहीं जानते; इसके अनुमानित मूल्य के रूप में, आप अनुमान का उपयोग कर सकते हैं डी(14.3.4) और लगभग रखें:
इस प्रकार, विश्वास अंतराल के निर्माण की समस्या लगभग हल हो गई है, जो इसके बराबर है:
जहां जीपी सूत्र (14.3.7) द्वारा परिभाषित किया गया है।
फ़ंक्शन की तालिकाओं में रिवर्स इंटरपोलेशन से बचने के लिए * (एल) एसपी की गणना करते समय, एक विशेष तालिका (तालिका 14.3.1) संकलित करना सुविधाजनक होता है, जो मात्रा के मूल्यों को सूचीबद्ध करता है
आर पर निर्भर करता है मान (पी सामान्य कानून के लिए मानक विचलन की संख्या निर्धारित करता है जिसे फैलाव केंद्र के दाएं और बाएं सेट किया जाना चाहिए ताकि परिणामी क्षेत्र में गिरने की संभावना पी के बराबर हो।
7 पी के मान के माध्यम से, विश्वास अंतराल को इस प्रकार व्यक्त किया जाता है:
तालिका 14.3.1
उदाहरण 1. मान पर 20 प्रयोग किए गए एक्स;परिणाम तालिका में दिखाए गए हैं। 14.3.2.
तालिका 14.3.2
मात्रा की गणितीय अपेक्षा के लिए अनुमान लगाना आवश्यक है एक्सऔर एक कॉन्फिडेंस लेवल p = 0.8 के अनुरूप कॉन्फिडेंस इंटरवल तैयार करें।
फेसला।हमारे पास है:
मूल n: = 10 के लिए चयन, तीसरे सूत्र (14.2.14) के अनुसार हम निष्पक्ष अनुमान पाते हैं डी :
तालिका के अनुसार 14.3.1 हम पाते हैं
आत्मविश्वास की सीमा:
विश्वास अंतराल:
पैरामीटर मान टी,इस अंतराल में पड़े हुए तालिका में दिए गए प्रयोगात्मक डेटा के साथ संगत हैं। 14.3.2.
इसी तरह, विचरण के लिए एक विश्वास अंतराल का निर्माण किया जा सकता है।
चलो उत्पादित पीयादृच्छिक चर पर स्वतंत्र प्रयोग एक्सअज्ञात मापदंडों के साथ और ए से, और विचरण के लिए डीनिष्पक्ष अनुमान प्राप्त होता है:
विचरण के लिए लगभग एक विश्वास अंतराल बनाना आवश्यक है।
सूत्र (14.3.11) से यह देखा जा सकता है कि मान डीप्रतिनिधित्व करता है
रकम पीफॉर्म के यादृच्छिक चर। ये मान नहीं हैं
स्वतंत्र, क्योंकि उनमें से किसी में भी मात्रा शामिल है टी,अन्य सभी पर निर्भर। हालाँकि, यह दिखाया जा सकता है कि जैसे पीउनके योग का वितरण नियम भी सामान्य के करीब है। लगभग पी= 20...30 इसे पहले से ही सामान्य माना जा सकता है।
आइए मान लें कि यह ऐसा है, और इस कानून की विशेषताओं को खोजें: गणितीय अपेक्षा और भिन्नता। स्कोर के बाद से डी- निष्पक्ष, फिर एम [डी] = डी।
प्रसरण गणना डी डीअपेक्षाकृत जटिल गणनाओं से जुड़ा है, इसलिए हम व्युत्पत्ति के बिना इसकी अभिव्यक्ति देते हैं:
जहाँ c 4 - मात्रा का चौथा केंद्रीय क्षण एक्स।
इस अभिव्यक्ति का उपयोग करने के लिए, आपको इसमें 4 और . के मानों को प्रतिस्थापित करना होगा डी(कम से कम अनुमानित)। के बजाय डीआप मूल्यांकन का उपयोग कर सकते हैं डी।सिद्धांत रूप में, चौथे केंद्रीय क्षण को इसके अनुमान से भी बदला जा सकता है, उदाहरण के लिए, फॉर्म के मूल्य से:
लेकिन ऐसा प्रतिस्थापन बेहद कम सटीकता देगा, क्योंकि सामान्य तौर पर, सीमित संख्या में प्रयोगों के साथ, उच्च-क्रम के क्षण बड़ी त्रुटियों के साथ निर्धारित किए जाते हैं। हालांकि, व्यवहार में अक्सर ऐसा होता है कि मात्रा के वितरण कानून का रूप एक्सपहले से ज्ञात: केवल इसके पैरामीटर अज्ञात हैं। तब हम u4 को के रूप में व्यक्त करने का प्रयास कर सकते हैं डी।
आइए हम सबसे आम मामला लें, जब मूल्य एक्ससामान्य कानून के अनुसार वितरित। फिर इसका चौथा केंद्रीय क्षण विचरण के रूप में व्यक्त किया जाता है (अध्याय 6 उपखंड 6.2 देखें);
और सूत्र (14.3.12) देता है या
(14.3.14) अज्ञात में बदलना डीउसका आकलन डी, हमें मिलता है: कहाँ से
जिस क्षण u 4 को के रूप में व्यक्त किया जा सकता है डीकुछ अन्य मामलों में भी, जब मात्रा का वितरण एक्ससामान्य नहीं है, लेकिन इसकी उपस्थिति ज्ञात है। उदाहरण के लिए, एकसमान घनत्व के नियम के लिए (अध्याय 5 देखें) हमारे पास है:
जहां (ए, पी) वह अंतराल है जिस पर कानून दिया गया है।
इसलिये,
सूत्र (14.3.12) के अनुसार हम प्राप्त करते हैं: जहां से हम लगभग पाते हैं
ऐसे मामलों में जहां मूल्य 26 के वितरण के कानून का रूप अज्ञात है, जब एक / के मूल्य का अनुमान लगाया जाता है, तब भी सूत्र (14.3.16) का उपयोग करने की सिफारिश की जाती है, अगर इस कानून पर विश्वास करने के लिए कोई विशेष आधार नहीं हैं सामान्य से बहुत अलग है (एक ध्यान देने योग्य सकारात्मक या नकारात्मक कुर्टोसिस है)।
यदि a / का अनुमानित मान किसी न किसी रूप में प्राप्त किया जाता है, तो विचरण के लिए एक विश्वास अंतराल का निर्माण उसी तरह संभव है जैसे हमने इसे गणितीय अपेक्षा के लिए बनाया था:
जहां दी गई प्रायिकता के आधार पर मान तालिका में पाया जाता है। 14.3.1.
उदाहरण 2. एक यादृच्छिक चर के भिन्नता के लिए लगभग 80% विश्वास अंतराल खोजें एक्सउदाहरण 1 की शर्तों के तहत, यदि यह ज्ञात है कि मान एक्ससामान्य के करीब एक कानून के अनुसार वितरित।
फेसला।मान तालिका के समान ही रहता है। 14.3.1:
सूत्र के अनुसार (14.3.16)
सूत्र (14.3.18) के अनुसार हम विश्वास अंतराल पाते हैं:
मानक विचलन के मूल्यों की संगत श्रेणी: (0.21; 0.29)।
14.4. सामान्य कानून के अनुसार वितरित एक यादृच्छिक चर के मापदंडों के लिए विश्वास अंतराल के निर्माण के लिए सटीक तरीके
पिछले उपखंड में, हमने माध्य और विचरण के लिए विश्वास अंतरालों के निर्माण के लिए मोटे तौर पर अनुमानित तरीकों पर विचार किया था। यहां हम उसी समस्या को हल करने के सटीक तरीकों का एक विचार देते हैं। हम इस बात पर जोर देते हैं कि विश्वास अंतराल को सटीक रूप से खोजने के लिए, मात्रा के वितरण के नियम के रूप को पहले से जानना नितांत आवश्यक है एक्स,जबकि यह अनुमानित विधियों के अनुप्रयोग के लिए आवश्यक नहीं है।
विश्वास अंतराल के निर्माण के लिए सटीक तरीकों का विचार इस प्रकार है। कुछ असमानताओं की पूर्ति की संभावना को व्यक्त करने वाली स्थिति से कोई विश्वास अंतराल पाया जाता है, जिसमें हमारे लिए ब्याज का अनुमान शामिल है ए।ग्रेड वितरण कानून एसामान्य मामले में मात्रा के अज्ञात मापदंडों पर निर्भर करता है एक्स।हालांकि, कभी-कभी एक यादृच्छिक चर से असमानताओं को पारित करना संभव है एदेखे गए मूल्यों के किसी अन्य कार्य के लिए एक्स पी एक्स 2, ..., एक्स पी.जिसका वितरण नियम अज्ञात मापदंडों पर निर्भर नहीं करता है, बल्कि केवल प्रयोगों की संख्या और मात्रा के वितरण कानून के रूप पर निर्भर करता है। एक्स।इस प्रकार के यादृच्छिक चर गणितीय आँकड़ों में एक बड़ी भूमिका निभाते हैं; मात्रा के सामान्य वितरण के मामले में उनका सबसे अधिक विस्तार से अध्ययन किया गया है एक्स।
उदाहरण के लिए, यह साबित हो गया है कि मात्रा के सामान्य वितरण के तहत एक्सयादृच्छिक मूल्य
तथाकथित के अधीन छात्र वितरण कानूनसाथ पी- स्वतंत्रता की 1 डिग्री; इस कानून के घनत्व का रूप है
जहाँ G(x) ज्ञात गामा फलन है:
यह भी सिद्ध होता है कि यादृच्छिक चर
के साथ "वितरण% 2" है पी- स्वतंत्रता की 1 डिग्री (अध्याय 7 देखें), जिसका घनत्व सूत्र द्वारा व्यक्त किया गया है
वितरणों की व्युत्पत्तियों (14.4.2) और (14.4.4) पर ध्यान दिए बिना, हम दिखाएंगे कि मापदंडों के लिए विश्वास अंतराल का निर्माण करते समय उन्हें कैसे लागू किया जा सकता है टाइ डी।
चलो उत्पादित पीयादृच्छिक चर पर स्वतंत्र प्रयोग एक्स,अज्ञात मापदंडों के साथ सामान्य कानून के अनुसार वितरित टीआईओ।इन मापदंडों के लिए, अनुमान
कॉन्फिडेंस प्रायिकता p के अनुरूप दोनों मापदंडों के लिए कॉन्फिडेंस इंटरवल का निर्माण करना आवश्यक है।
आइए पहले गणितीय अपेक्षा के लिए एक विश्वास अंतराल का निर्माण करें। इस अंतराल को के संबंध में सममित लेना स्वाभाविक है टी; अंतराल की आधी लंबाई को s p से निरूपित करें। एसपी का मान चुना जाना चाहिए ताकि शर्त
आइए एक यादृच्छिक चर से समानता (14.4.5) के बाईं ओर पारित करने का प्रयास करें टीएक यादृच्छिक चर के लिए टी,छात्र कानून के अनुसार वितरित। ऐसा करने के लिए, हम असमानता के दोनों भागों को गुणा करते हैं |m-w?|
सकारात्मक मूल्य के लिए: या, संकेतन (14.4.1) का उपयोग करते हुए,
आइए हम एक संख्या / पी इस तरह खोजें कि मूल्य / पी को शर्त से पाया जा सके
यह सूत्र (14.4.2) से देखा जा सकता है कि (1) एक सम फलन है, इसलिए (14.4.8) देता है
समानता (14.4.9) पी के आधार पर मूल्य / पी निर्धारित करती है। यदि आपके पास अपने निपटान में अभिन्न मूल्यों की एक तालिका है
तब मान / p तालिका में रिवर्स इंटरपोलेशन द्वारा पाया जा सकता है। हालांकि, अग्रिम में मूल्यों / पी की एक तालिका संकलित करना अधिक सुविधाजनक है। ऐसी तालिका परिशिष्ट (सारणी 5) में दी गई है। यह तालिका आत्मविश्वास की संभावना पी और स्वतंत्रता की डिग्री की संख्या के आधार पर मान दिखाती है पी- 1. तालिका के अनुसार निर्धारित / पी। 5 और मान लेना
हम कॉन्फिडेंस इंटरवल / p की आधी चौड़ाई और खुद इंटरवल पाते हैं
उदाहरण 1. यादृच्छिक चर पर 5 स्वतंत्र प्रयोग किए गए एक्स,सामान्य रूप से अज्ञात मापदंडों के साथ वितरित टीऔर उस बारे में। प्रयोगों के परिणाम तालिका में दिए गए हैं। 14.4.1.
तालिका 14.4.1
एक अनुमान खोजें टीगणितीय अपेक्षा के लिए और इसके लिए 90% विश्वास अंतराल / p का निर्माण करें (अर्थात, विश्वास संभावना p \u003d 0.9 के अनुरूप अंतराल)।
फेसला।हमारे पास है:
के लिए आवेदन की तालिका 5 के अनुसार पी - 1 = 4 और p = 0.9 हम पाते हैं कहाँ पे
कॉन्फिडेंस इंटरवल होगा
उदाहरण 2। उपखंड 14.3 के उदाहरण 1 की शर्तों के लिए, मान मानकर एक्ससामान्य रूप से वितरित, सटीक विश्वास अंतराल खोजें।
फेसला।आवेदन की तालिका 5 के अनुसार, हम पाते हैं पी - 1 = 19ir =
0.8 / पी = 1.328; यहां से
उपखंड 14.3 (ई पी = 0.072) के उदाहरण 1 के समाधान की तुलना में, हम देखते हैं कि विसंगति बहुत छोटी है। यदि हम सटीकता को दूसरे दशमलव स्थान पर रखते हैं, तो सटीक और अनुमानित विधियों द्वारा पाया गया विश्वास अंतराल समान है:
आइए विचरण के लिए एक विश्वास अंतराल बनाने के लिए आगे बढ़ते हैं। निष्पक्ष विचरण अनुमान पर विचार करें
और यादृच्छिक चर व्यक्त करें डीमूल्य के माध्यम से वी(14.4.3) वितरण x 2 (14.4.4) वाले:
मात्रा के वितरण नियम को जानना वी,उस अंतराल को ज्ञात करना संभव है / (1 ) जिसमें यह दी गई प्रायिकता p के साथ आता है।
वितरण कानून के एन _ एक्स (वी) I 7 का मान अंजीर में दिखाया गया रूप है। 14.4.1.
![](https://i1.wp.com/bstudy.net/htm/img/3/10801/1484.png)
चावल। 14.4.1
सवाल उठता है: अंतराल / पी कैसे चुनें? यदि मात्रा का वितरण नियम वीसममित था (एक सामान्य कानून या छात्र के वितरण की तरह), गणितीय अपेक्षा के संबंध में अंतराल / पी सममित लेना स्वाभाविक होगा। इस मामले में कानून के एन _ एक्स (वी)विषम। आइए हम अंतराल / पी को चुनने के लिए सहमत हों ताकि मात्रा के उत्पादन की संभावनाएं वीअंतराल के बाहर दाएं और बाएं (चित्र 14.4.1 में छायांकित क्षेत्र) समान और बराबर थे
इस गुण के साथ एक अंतराल / p बनाने के लिए, हम तालिका का उपयोग करते हैं। 4 अनुप्रयोग: इसमें संख्याएँ होती हैं वाई)ऐसा है कि
मात्रा के लिए वी,स्वतंत्रता की r डिग्री के साथ x 2-वितरण होना। हमारे मामले में आर = एन- 1. फिक्स आर = एन- 1 और तालिका की संगत पंक्ति में खोजें। 4 दो मान एक्स 2 -एक प्रायिकता के संगत दूसरा - प्रायिकताएँ आइए हम इन्हें निर्दिष्ट करें
मूल्यों दो परऔर एक्सएल?अंतराल है वाई 2,उसके बाएं के साथ, और वाई~दाहिना छोर।
अब हम आवश्यक विश्वास अंतराल पाते हैं /| सीमाओं के साथ विचरण के लिए डी, और डी 2,जो बिंदु को कवर करता है डीसंभावना पी के साथ:
आइए हम एक ऐसा अंतराल / (, = (?> b A) बनाते हैं, जो बिंदु को कवर करता है डीअगर और केवल अगर मूल्य वीअंतराल / आर में पड़ता है। आइए हम दिखाते हैं कि अंतराल
इस शर्त को पूरा करता है। दरअसल, असमानताएं असमानताओं के बराबर हैं
और ये असमानताएँ प्रायिकता p के साथ होती हैं। इस प्रकार, फैलाव के लिए विश्वास अंतराल पाया जाता है और सूत्र (14.4.13) द्वारा व्यक्त किया जाता है।
उदाहरण 3. उपधारा 14.3 के उदाहरण 2 की शर्तों के तहत विचरण के लिए विश्वास अंतराल ज्ञात कीजिए, यदि यह ज्ञात हो कि मान एक्ससामान्य रूप से वितरित।
फेसला।हमारे पास है . आवेदन की तालिका 4 के अनुसार
हम पाते हैं आर = एन - 1 = 19
सूत्र (14.4.13) के अनुसार हम फैलाव के लिए विश्वास अंतराल पाते हैं
मानक विचलन के लिए संगत अंतराल: (0.21; 0.32)। यह अंतराल अनुमानित विधि द्वारा उपखंड 14.3 के उदाहरण 2 में प्राप्त अंतराल (0.21; 0.29) से केवल थोड़ा अधिक है।
- चित्र 14.3.1 एक विश्वास अंतराल पर विचार करता है जो सममित है a. सामान्य तौर पर, जैसा कि हम बाद में देखेंगे, यह आवश्यक नहीं है।
विश्वास अंतराल का अनुमान
सीखने के मकसद
आंकड़े निम्नलिखित पर विचार करते हैं दो मुख्य कार्य:
हमारे पास नमूना डेटा के आधार पर कुछ अनुमान हैं और हम अनुमान लगाने वाले पैरामीटर का सही मूल्य कहां है, इसके बारे में कुछ संभाव्य बयान देना चाहते हैं।
हमारे पास एक विशिष्ट परिकल्पना है जिसे नमूना डेटा के आधार पर परीक्षण करने की आवश्यकता है।
इस विषय में, हम पहली समस्या पर विचार करते हैं। हम एक कॉन्फिडेंस इंटरवल की परिभाषा भी पेश करते हैं।
कॉन्फिडेंस इंटरवल एक ऐसा अंतराल है जो एक पैरामीटर के अनुमानित मूल्य के आसपास बनाया गया है और यह दर्शाता है कि अनुमानित पैरामीटर का सही मूल्य एक प्राथमिकता दी गई संभावना के साथ कहां है।
इस विषय पर सामग्री का अध्ययन करने के बाद, आप:
जानें कि अनुमान का विश्वास अंतराल क्या है;
सांख्यिकीय समस्याओं को वर्गीकृत करना सीखें;
सांख्यिकीय फ़ार्मुलों का उपयोग करके और सॉफ़्टवेयर टूल का उपयोग करके, विश्वास अंतराल के निर्माण की तकनीक में महारत हासिल करें;
सांख्यिकीय अनुमानों की सटीकता के कुछ मापदंडों को प्राप्त करने के लिए आवश्यक नमूना आकार निर्धारित करना सीखें।
नमूना विशेषताओं का वितरण
टी वितरण
जैसा कि ऊपर चर्चा की गई है, यादृच्छिक चर का वितरण पैरामीटर 0 और 1 के साथ एक मानकीकृत सामान्य वितरण के करीब है। चूंकि हम σ का मान नहीं जानते हैं, इसलिए हम इसे कुछ अनुमान s से बदल देते हैं। मात्रा का पहले से ही एक अलग वितरण है, अर्थात्, या छात्र का वितरण, जो पैरामीटर n -1 (स्वतंत्रता की डिग्री की संख्या) द्वारा निर्धारित किया जाता है। यह वितरण सामान्य वितरण के करीब है (बड़ा n, वितरण के करीब)।
अंजीर पर। 95 30 डिग्री स्वतंत्रता के साथ छात्र का वितरण प्रस्तुत किया गया है। जैसा कि आप देख सकते हैं, यह सामान्य वितरण के बहुत करीब है।
सामान्य वितरण NORMDIST और NORMINV के साथ काम करने के कार्यों के समान, t-वितरण के साथ काम करने के लिए कार्य हैं - STUDIST (TDIST) और STUDRSPBR (TINV). इन कार्यों के उपयोग का एक उदाहरण STUDRIST.XLS फ़ाइल (टेम्पलेट और समाधान) और अंजीर में पाया जा सकता है। 96 .
अन्य विशेषताओं का वितरण
जैसा कि हम पहले से ही जानते हैं, उम्मीद अनुमान की सटीकता निर्धारित करने के लिए, हमें टी-वितरण की आवश्यकता है। अन्य मापदंडों का अनुमान लगाने के लिए, जैसे विचरण, अन्य वितरणों की आवश्यकता होती है। उनमें से दो एफ-वितरण हैं और एक्स 2-वितरण.
माध्य के लिए विश्वास अंतराल
विश्वास अंतरालएक अंतराल है जो पैरामीटर के अनुमानित मूल्य के आसपास बनाया गया है और दिखाता है कि अनुमानित पैरामीटर का सही मूल्य प्राथमिकता दी गई संभावना के साथ कहां है।
माध्य मान के लिए एक विश्वास अंतराल का निर्माण होता है इस अनुसार:
उदाहरण
फास्ट फूड रेस्तरां एक नए प्रकार के सैंडविच के साथ अपने वर्गीकरण का विस्तार करने की योजना बना रहा है। इसकी मांग का अनुमान लगाने के लिए, प्रबंधक ने उन लोगों में से 40 आगंतुकों का बेतरतीब ढंग से चयन करने की योजना बनाई है, जिन्होंने पहले से ही इसे आजमाया है और उन्हें 1 से 10 के पैमाने पर नए उत्पाद के प्रति अपने दृष्टिकोण को रेट करने के लिए कहते हैं। प्रबंधक अनुमान लगाना चाहता है नए उत्पाद को प्राप्त होने वाले अंकों की अपेक्षित संख्या और इस अनुमान के लिए 95% विश्वास अंतराल का निर्माण करेगी। यह कैसे करना है? (देखें फ़ाइल SANDWICH1.XLS (टेम्पलेट और समाधान)।
फेसला
इस समस्या को हल करने के लिए, आप उपयोग कर सकते हैं। परिणाम को आंकड़े में दर्शाया गया है। 97 .
कुल मान के लिए कॉन्फिडेंस इंटरवल
कभी-कभी, नमूना डेटा के अनुसार, गणितीय अपेक्षा का नहीं, बल्कि मूल्यों के कुल योग का अनुमान लगाना आवश्यक होता है। उदाहरण के लिए, एक ऑडिटर की स्थिति में, इनवॉइस के औसत मूल्य का नहीं, बल्कि सभी चालानों के योग का अनुमान लगाना रुचिकर हो सकता है।
एन को तत्वों की कुल संख्या होने दें, एन नमूना आकार हो, टी 3 नमूने में मूल्यों का योग हो, टी "पूरी आबादी पर योग का अनुमान हो, फिर , और विश्वास अंतराल की गणना सूत्र द्वारा की जाती है, जहां s नमूने के लिए मानक विचलन का अनुमान है, नमूने के माध्य का अनुमान है।
उदाहरण
मान लें कि कोई कर कार्यालय 10,000 करदाताओं के लिए कुल कर वापसी की राशि का अनुमान लगाना चाहता है। करदाता या तो धनवापसी प्राप्त करता है या अतिरिक्त करों का भुगतान करता है। 500 लोगों का नमूना आकार मानकर, धनवापसी राशि के लिए 95% विश्वास अंतराल ज्ञात करें (देखें फ़ाइल REFUND AMOUNT.XLS (टेम्पलेट और समाधान)।
फेसला
इस मामले के लिए StatPro में कोई विशेष प्रक्रिया नहीं है, हालाँकि, आप देख सकते हैं कि उपरोक्त सूत्रों का उपयोग करके माध्य के लिए सीमा से सीमाएँ प्राप्त की जा सकती हैं (चित्र 98)। ).
अनुपात के लिए विश्वास अंतराल
मान लीजिए कि p ग्राहकों के हिस्से की अपेक्षा है, और pv इस शेयर का एक अनुमान है, जो आकार n के नमूने से प्राप्त होता है। यह दिखाया जा सकता है कि पर्याप्त रूप से बड़े के लिए अनुमान वितरण औसत पी और मानक विचलन के साथ सामान्य के करीब होगा
. इस मामले में अनुमान की मानक त्रुटि के रूप में व्यक्त किया जाता है
, और विश्वास अंतराल के रूप में
.
उदाहरण
फास्ट फूड रेस्तरां एक नए प्रकार के सैंडविच के साथ अपने वर्गीकरण का विस्तार करने की योजना बना रहा है। इसकी मांग का अनुमान लगाने के लिए, प्रबंधक ने बेतरतीब ढंग से उन लोगों में से 40 आगंतुकों का चयन किया, जिन्होंने पहले से ही इसे आजमाया था और उन्हें 1 से 10 के पैमाने पर नए उत्पाद के प्रति अपने दृष्टिकोण को रेट करने के लिए कहा। प्रबंधक अपेक्षित अनुपात का अनुमान लगाना चाहता है। उन ग्राहकों की संख्या जो नए उत्पाद को कम से कम 6 अंक से अधिक रेट करते हैं (उन्हें उम्मीद है कि ये ग्राहक नए उत्पाद के उपभोक्ता होंगे)।
फेसला
प्रारंभ में, हम 1 के आधार पर एक नया कॉलम बनाते हैं यदि क्लाइंट का स्कोर 6 अंक से अधिक था और अन्यथा 0 (SANDWICH2.XLS फ़ाइल (टेम्पलेट और समाधान देखें) देखें।
विधि 1
1 की राशि की गणना करते हुए, हम हिस्से का अनुमान लगाते हैं, और फिर हम सूत्रों का उपयोग करते हैं।
z करोड़ का मान विशेष सामान्य वितरण तालिकाओं से लिया जाता है (उदाहरण के लिए, 95% विश्वास अंतराल के लिए 1.96)।
95% अंतराल बनाने के लिए इस दृष्टिकोण और विशिष्ट डेटा का उपयोग करके, हम निम्नलिखित परिणाम प्राप्त करते हैं (चित्र 99 .) ) पैरामीटर z करोड़ का महत्वपूर्ण मान 1.96 है। अनुमान की मानक त्रुटि 0.077 है। विश्वास अंतराल की निचली सीमा 0.475 है। विश्वास अंतराल की ऊपरी सीमा 0.775 है। इस प्रकार, एक प्रबंधक 95% निश्चितता के साथ यह मान सकता है कि किसी नए उत्पाद को 6 अंक या अधिक रेट करने वाले ग्राहकों का प्रतिशत 47.5 और 77.5 के बीच होगा।
विधि 2
इस समस्या को मानक StatPro टूल का उपयोग करके हल किया जा सकता है। ऐसा करने के लिए, यह नोट करना पर्याप्त है कि इस मामले में शेयर टाइप कॉलम के औसत मूल्य के साथ मेल खाता है। अगला आवेदन StatPro/सांख्यिकीय अनुमान/एक-नमूना विश्लेषणटाइप कॉलम के लिए माध्य मान (अपेक्षा अनुमान) के लिए एक विश्वास अंतराल बनाने के लिए। इस मामले में प्राप्त परिणाम पहली विधि (छवि 99) के परिणाम के बहुत करीब होंगे।
मानक विचलन के लिए विश्वास अंतराल
s का उपयोग मानक विचलन के अनुमान के रूप में किया जाता है (सूत्र खंड 1 में दिया गया है)। अनुमान s का घनत्व फलन ची-वर्ग फलन है, जिसमें t-वितरण की तरह स्वतंत्रता की n-1 डिग्री है। इस वितरण CHI2DIST (CHIDIST) और CHI2OBR (CHIINV) के साथ काम करने के लिए विशेष कार्य हैं।
इस मामले में विश्वास अंतराल अब सममित नहीं होगा। सीमाओं की सशर्त योजना अंजीर में दिखाई गई है। 100.
उदाहरण
मशीन को 10 सेमी के व्यास के साथ भागों का उत्पादन करना चाहिए हालांकि, विभिन्न परिस्थितियों के कारण त्रुटियां होती हैं। गुणवत्ता नियंत्रक दो चीजों के बारे में चिंतित है: पहला, औसत मूल्य 10 सेमी होना चाहिए; दूसरे, इस मामले में भी, यदि विचलन बड़े हैं, तो कई विवरण अस्वीकार कर दिए जाएंगे। हर दिन वह 50 भागों का एक नमूना बनाता है (फ़ाइल गुणवत्ता नियंत्रण देखें। XLS (टेम्पलेट और समाधान)। ऐसा नमूना क्या निष्कर्ष दे सकता है?
फेसला
हम माध्य के लिए और मानक विचलन के लिए 95% विश्वास अंतराल का निर्माण करते हैं StatPro/सांख्यिकीय अनुमान/एक-नमूना विश्लेषण(चित्र 101 ).
इसके अलावा, व्यास के सामान्य वितरण की धारणा का उपयोग करते हुए, हम दोषपूर्ण उत्पादों के अनुपात की गणना करते हैं, 0.065 का अधिकतम विचलन निर्धारित करते हैं। लुकअप टेबल (दो मापदंडों का मामला) की क्षमताओं का उपयोग करके, हम माध्य मान और मानक विचलन (चित्र। 102) पर अस्वीकृति के प्रतिशत की निर्भरता का निर्माण करते हैं। ).
दो साधनों के अंतर के लिए कॉन्फिडेंस इंटरवल
यह सांख्यिकीय विधियों के सबसे महत्वपूर्ण अनुप्रयोगों में से एक है। स्थिति उदाहरण।
एक कपड़े की दुकान प्रबंधक यह जानना चाहेगा कि औसत महिला खरीदार एक पुरुष की तुलना में दुकान में कितना अधिक या कम खर्च करती है।
दोनों एयरलाइंस समान मार्गों पर उड़ान भरती हैं। एक उपभोक्ता संगठन दोनों एयरलाइनों के लिए औसत अपेक्षित उड़ान विलंब समय के बीच अंतर की तुलना करना चाहेगा।
कंपनी एक शहर में कुछ प्रकार के सामानों के लिए कूपन भेजती है और दूसरे में नहीं भेजती है। प्रबंधक अगले दो महीनों में इन वस्तुओं की औसत खरीद की तुलना करना चाहते हैं।
एक कार डीलर अक्सर प्रस्तुतियों में विवाहित जोड़ों के साथ व्यवहार करता है। प्रस्तुति के प्रति उनकी व्यक्तिगत प्रतिक्रियाओं को समझने के लिए, जोड़ों का अक्सर अलग-अलग साक्षात्कार किया जाता है। प्रबंधक पुरुषों और महिलाओं द्वारा दी गई रेटिंग में अंतर का मूल्यांकन करना चाहता है।
स्वतंत्र नमूनों का मामला
माध्य अंतर में n 1 + n 2 - 2 डिग्री स्वतंत्रता के साथ t-वितरण होगा। μ 1 - μ 2 के लिए विश्वास अंतराल अनुपात द्वारा व्यक्त किया जाता है:
![](https://i0.wp.com/e-biblio.ru/xbook/new/xbook306/files/Formula_043.gif)
इस समस्या को न केवल उपरोक्त सूत्रों द्वारा हल किया जा सकता है, बल्कि मानक स्टेटप्रो टूल द्वारा भी हल किया जा सकता है। ऐसा करने के लिए, यह लागू करने के लिए पर्याप्त है
अनुपात के बीच अंतर के लिए विश्वास अंतराल
आइए शेयरों की गणितीय अपेक्षा करें। आज्ञा देना उनके नमूना अनुमान क्रमशः आकार n 1 और n 2 के नमूनों पर बनाया गया है। फिर अंतर के लिए एक अनुमान है। इसलिए, इस अंतर के लिए विश्वास अंतराल इस प्रकार व्यक्त किया जाता है:
यहाँ z cr विशेष तालिकाओं के सामान्य वितरण से प्राप्त मूल्य है (उदाहरण के लिए, 95% विश्वास अंतराल के लिए 1.96)।
अनुमान की मानक त्रुटि इस मामले में संबंध द्वारा व्यक्त की जाती है:
.
उदाहरण
बड़ी बिक्री की तैयारी में स्टोर ने निम्नलिखित विपणन अनुसंधान किया। शीर्ष 300 खरीदारों का चयन किया गया और बेतरतीब ढंग से 150 सदस्यों के दो समूहों में विभाजित किया गया। सभी चयनित खरीदारों को बिक्री में भाग लेने के लिए निमंत्रण भेजा गया था, लेकिन केवल पहले समूह के सदस्यों के लिए 5% छूट का अधिकार देने वाला एक कूपन संलग्न किया गया था। सेल के दौरान सभी चयनित 300 खरीदारों की खरीदारी दर्ज की गई। एक प्रबंधक परिणामों की व्याख्या कैसे कर सकता है और कूपनिंग की प्रभावशीलता के बारे में निर्णय कैसे ले सकता है? (देखें कूपन.एक्सएलएस फ़ाइल (टेम्पलेट और समाधान))।
फेसला
हमारे विशेष मामले के लिए, छूट कूपन प्राप्त करने वाले 150 ग्राहकों में से 55 ने बिक्री पर खरीदारी की, और 150 में से जिन्हें कूपन प्राप्त नहीं हुआ, केवल 35 ने खरीदारी की (चित्र 103) ) तब नमूना अनुपात का मान क्रमशः 0.3667 और 0.2333 है। और उनके बीच नमूना अंतर क्रमशः 0.1333 के बराबर है। 95% के विश्वास अंतराल को मानते हुए, हम सामान्य वितरण तालिका z cr = 1.96 से पाते हैं। नमूना अंतर की मानक त्रुटि की गणना 0.0524 है। अंत में, हम पाते हैं कि 95% विश्वास अंतराल की निचली सीमा क्रमशः 0.0307 है, और ऊपरी सीमा क्रमशः 0.2359 है। प्राप्त परिणामों की व्याख्या इस तरह से की जा सकती है कि छूट कूपन प्राप्त करने वाले प्रत्येक 100 ग्राहकों के लिए, हम 3 से 23 नए ग्राहकों की अपेक्षा कर सकते हैं। हालांकि, यह ध्यान में रखा जाना चाहिए कि इस निष्कर्ष का मतलब कूपन का उपयोग करने की दक्षता नहीं है (क्योंकि छूट प्रदान करने से, हम लाभ में हार जाते हैं!)। आइए इसे विशिष्ट डेटा पर प्रदर्शित करें। मान लीजिए कि औसत खरीद राशि 400 रूबल है, जिसमें से 50 रूबल। एक स्टोर लाभ है। फिर प्रति 100 ग्राहकों पर अपेक्षित लाभ, जिन्हें कूपन नहीं मिला, के बराबर है:
50 0.2333 100 \u003d 1166.50 रूबल।
कूपन प्राप्त करने वाले 100 खरीदारों के लिए समान गणना दें:
30 0.3667 100 \u003d 1100.10 रूबल।
औसत लाभ में 30 की कमी को इस तथ्य से समझाया गया है कि छूट का उपयोग करके, कूपन प्राप्त करने वाले खरीदार औसतन 380 रूबल की खरीदारी करेंगे।
इस प्रकार, अंतिम निष्कर्ष इस विशेष स्थिति में ऐसे कूपन का उपयोग करने की अक्षमता को इंगित करता है।
टिप्पणी। इस समस्या को मानक StatPro टूल का उपयोग करके हल किया जा सकता है। ऐसा करने के लिए, यह इस समस्या को कम करने के लिए विधि द्वारा दो औसत के अंतर का अनुमान लगाने की समस्या को कम करने के लिए पर्याप्त है, और फिर लागू करें StatPro/सांख्यिकीय अनुमान/दो-नमूना विश्लेषणदो माध्य मानों के बीच अंतर के लिए एक विश्वास अंतराल बनाने के लिए।
कॉन्फिडेंस इंटरवल कंट्रोल
विश्वास अंतराल की लंबाई निर्भर करती है निम्नलिखित शर्तें:
सीधे डेटा (मानक विचलन);
महत्वपूर्ण स्तर;
नमूने का आकार।
माध्य का अनुमान लगाने के लिए नमूना आकार
आइए पहले सामान्य मामले में समस्या पर विचार करें। आइए हम दिए गए विश्वास अंतराल की आधी लंबाई के मान को B (चित्र 104 .) के रूप में निरूपित करें ) हम जानते हैं कि कुछ यादृच्छिक चर X के माध्य मान के लिए विश्वास अंतराल को इस प्रकार व्यक्त किया जाता है
, कहाँ पे
. यह मानते हुए:
और n व्यक्त करते हुए, हम प्राप्त करते हैं।
दुर्भाग्य से, हम यादृच्छिक चर X के प्रसरण का सटीक मान नहीं जानते हैं। इसके अलावा, हम t करोड़ के मूल्य को नहीं जानते हैं क्योंकि यह स्वतंत्रता की डिग्री की संख्या के माध्यम से n पर निर्भर करता है। इस स्थिति में, हम निम्न कार्य कर सकते हैं। प्रसरण s के बजाय, हम अध्ययन के तहत यादृच्छिक चर के कुछ उपलब्ध अहसासों के लिए विचरण के कुछ अनुमान का उपयोग करते हैं। t cr मान के बजाय, हम सामान्य वितरण के लिए z cr मान का उपयोग करते हैं। यह काफी स्वीकार्य है, क्योंकि सामान्य और टी-वितरण के लिए घनत्व कार्य बहुत करीब हैं (छोटे n के मामले को छोड़कर)। इस प्रकार, वांछित सूत्र रूप लेता है:
.
चूंकि सूत्र देता है, आम तौर पर बोलते हुए, गैर-पूर्णांक परिणाम, परिणाम की अधिकता के साथ गोल करना वांछित नमूना आकार के रूप में लिया जाता है।
उदाहरण
फास्ट फूड रेस्तरां एक नए प्रकार के सैंडविच के साथ अपने वर्गीकरण का विस्तार करने की योजना बना रहा है। इसकी मांग का अनुमान लगाने के लिए, प्रबंधक बेतरतीब ढंग से उन लोगों में से कई आगंतुकों का चयन करने की योजना बना रहा है, जिन्होंने पहले से ही इसे आजमाया है, और उन्हें 1 से 10 के पैमाने पर नए उत्पाद के प्रति अपने दृष्टिकोण को रेट करने के लिए कहें। प्रबंधक चाहता है नए उत्पाद को प्राप्त होने वाले अंकों की अपेक्षित संख्या का अनुमान लगाने के लिए उत्पाद और उस अनुमान के 95% विश्वास अंतराल को प्लॉट करें। हालांकि, वह चाहता है कि कॉन्फिडेंस इंटरवल की आधी चौड़ाई 0.3 से अधिक न हो। उसे मतदान करने के लिए कितने आगंतुकों की आवश्यकता है?
निम्नलिखित नुसार:
यहां आर ओटीएसअंश p का एक अनुमान है, और B विश्वास अंतराल की लंबाई का आधा दिया गया है। एन के लिए एक फुलाया हुआ मूल्य मूल्य का उपयोग करके प्राप्त किया जा सकता है आर ओटीएस= 0.5. इस मामले में, विश्वास अंतराल की लंबाई p के किसी भी वास्तविक मान के लिए दिए गए मान B से अधिक नहीं होगी।
उदाहरण
पिछले उदाहरण से प्रबंधक को उन ग्राहकों के अनुपात का अनुमान लगाने की योजना बनाएं जो एक नए प्रकार के उत्पाद को पसंद करते हैं। वह 90% विश्वास अंतराल बनाना चाहता है जिसकी आधी लंबाई 0.05 से कम या उसके बराबर हो। यादृच्छिक रूप से कितने ग्राहकों का नमूना लिया जाना चाहिए?
फेसला
हमारे मामले में, z करोड़ का मान = 1.645। इसलिए, आवश्यक मात्रा की गणना इस प्रकार की जाती है .
यदि प्रबंधक के पास यह मानने का कारण था कि p का वांछित मान, उदाहरण के लिए, लगभग 0.3 है, तो इस मान को उपरोक्त सूत्र में प्रतिस्थापित करने पर, हमें यादृच्छिक नमूने का एक छोटा मान प्राप्त होगा, अर्थात् 228।
निर्धारित करने का सूत्र यादृच्छिक नमूना आकार दो साधनों के बीच अंतर के मामले मेंके रूप में लिखा है:
.
उदाहरण
कुछ कंप्यूटर कंपनी का एक ग्राहक सेवा केंद्र है। हाल ही में, सेवा की खराब गुणवत्ता के बारे में ग्राहकों की शिकायतों की संख्या में वृद्धि हुई है। सेवा केंद्र मुख्य रूप से दो प्रकार के कर्मचारियों को नियुक्त करता है: जिनके पास कम अनुभव है, लेकिन जिन्होंने विशेष प्रशिक्षण पाठ्यक्रम पूरा कर लिया है, और जिनके पास व्यापक व्यावहारिक अनुभव है, लेकिन जिन्होंने विशेष पाठ्यक्रम पूरा नहीं किया है। कंपनी पिछले छह महीनों में ग्राहकों की शिकायतों का विश्लेषण करना चाहती है और कर्मचारियों के दो समूहों में से प्रत्येक की औसत संख्या की तुलना करना चाहती है। यह माना जाता है कि दोनों समूहों के नमूनों में संख्या समान होगी। 95% अंतराल प्राप्त करने के लिए नमूने में कितने कर्मचारियों को शामिल किया जाना चाहिए, जिसकी आधी लंबाई 2 से अधिक नहीं है?
फेसला
यहां ots दोनों यादृच्छिक चरों के मानक विचलन का अनुमान है, इस धारणा के तहत कि वे करीब हैं। इस प्रकार, हमारे कार्य में, हमें किसी तरह यह अनुमान प्राप्त करने की आवश्यकता है। यह किया जा सकता है, उदाहरण के लिए, इस प्रकार है। पिछले छह महीनों में ग्राहक शिकायत डेटा को देखते हुए, एक प्रबंधक यह देख सकता है कि आम तौर पर प्रति कर्मचारी 6 से 36 शिकायतें होती हैं। यह जानते हुए कि एक सामान्य वितरण के लिए, व्यावहारिक रूप से सभी मान माध्य से तीन मानक विचलन से अधिक नहीं हैं, वह यथोचित रूप से विश्वास कर सकता है कि:
, जहां से ots = 5.
इस मान को सूत्र में प्रतिस्थापित करने पर, हम प्राप्त करते हैं .
निर्धारित करने का सूत्र शेयरों के बीच अंतर का अनुमान लगाने के मामले में एक यादृच्छिक नमूने का आकारकी तरह लगता है:
उदाहरण
कुछ कंपनी के समान उत्पादों के उत्पादन के लिए दो कारखाने हैं। एक कंपनी का प्रबंधक दोनों कारखानों की दोष दरों की तुलना करना चाहता है। उपलब्ध जानकारी के अनुसार, दोनों कारखानों में अस्वीकृति दर 3 से 5% तक है। इसे 99% कॉन्फिडेंस इंटरवल बनाना चाहिए जिसकी आधी लंबाई 0.005 (या 0.5%) से अधिक न हो। प्रत्येक कारखाने से कितने उत्पादों का चयन किया जाना चाहिए?
फेसला
यहाँ p 1ot और p 2ot पहली और दूसरी फैक्ट्रियों में अस्वीकार के दो अज्ञात अंशों का अनुमान है। यदि हम p 1ots \u003d p 2ots \u003d 0.5 डालते हैं, तो हमें n के लिए एक overestimated मान मिलेगा। लेकिन चूंकि हमारे मामले में हमारे पास इन शेयरों के बारे में कुछ प्राथमिक जानकारी है, इसलिए हम इन शेयरों का ऊपरी अनुमान, अर्थात् 0.05 लेते हैं। हम पाते हैं
नमूना डेटा से कुछ जनसंख्या मापदंडों का आकलन करते समय, न केवल पैरामीटर का एक बिंदु अनुमान प्रदान करना उपयोगी होता है, बल्कि एक आत्मविश्वास अंतराल भी होता है जो इंगित करता है कि अनुमानित पैरामीटर का सटीक मूल्य कहां हो सकता है।
इस अध्याय में, हम मात्रात्मक संबंधों से भी परिचित हुए हैं जो हमें विभिन्न मापदंडों के लिए ऐसे अंतराल बनाने की अनुमति देते हैं; आत्मविश्वास अंतराल की लंबाई को नियंत्रित करने के तरीके सीखे।
हम यह भी नोट करते हैं कि नमूना आकार (प्रयोग नियोजन समस्या) का अनुमान लगाने की समस्या को मानक स्टेटप्रो टूल्स का उपयोग करके हल किया जा सकता है, अर्थात् StatPro/सांख्यिकीय अनुमान/नमूना आकार चयन.
मन न केवल ज्ञान में है, बल्कि ज्ञान को व्यवहार में लागू करने की क्षमता में भी है। (अरस्तू)
विश्वास अंतराल
सामान्य समीक्षा
जनसंख्या से एक नमूना लेते हुए, हम अपने लिए ब्याज के पैरामीटर का एक बिंदु अनुमान प्राप्त करेंगे और अनुमान की सटीकता को इंगित करने के लिए मानक त्रुटि की गणना करेंगे।
हालांकि, ज्यादातर मामलों के लिए, इस तरह की मानक त्रुटि स्वीकार्य नहीं है। जनसंख्या पैरामीटर के लिए अंतराल अनुमान के साथ परिशुद्धता के इस माप को जोड़ना अधिक उपयोगी है।
यह पैरामीटर के लिए एक कॉन्फिडेंस इंटरवल (CI - कॉन्फिडेंस इंटरवल, CI - कॉन्फिडेंस इंटरवल) की गणना करने के लिए सैंपल स्टैटिस्टिक (पैरामीटर) के सैद्धांतिक संभाव्यता वितरण के ज्ञान का उपयोग करके किया जा सकता है।
सामान्य तौर पर, कॉन्फिडेंस इंटरवल दोनों दिशाओं में अनुमानों को मानक त्रुटि (किसी दिए गए पैरामीटर के) के कुछ गुणकों द्वारा बढ़ाता है; अंतराल को परिभाषित करने वाले दो मान (विश्वास सीमा) आमतौर पर अल्पविराम से अलग होते हैं और कोष्ठक में संलग्न होते हैं।
माध्य के लिए विश्वास अंतराल
सामान्य वितरण का उपयोग करना
यदि नमूना आकार बड़ा है, तो नमूना माध्य का सामान्य वितरण होता है, इसलिए नमूना माध्य पर विचार करते समय सामान्य वितरण का ज्ञान लागू किया जा सकता है।
विशेष रूप से, नमूना साधनों के वितरण का 95% जनसंख्या माध्य के 1.96 मानक विचलन (एसडी) के भीतर है।
जब हमारे पास केवल एक नमूना होता है, तो हम इसे माध्य (SEM) की मानक त्रुटि कहते हैं और माध्य के लिए 95% विश्वास अंतराल की गणना निम्नानुसार करते हैं:
यदि यह प्रयोग कई बार दोहराया जाता है, तो अंतराल में वास्तविक जनसंख्या माध्य 95% समय होगा।
यह आमतौर पर एक आत्मविश्वास अंतराल होता है, जैसे मूल्यों की वह सीमा जिसके भीतर वास्तविक जनसंख्या माध्य (सामान्य माध्य) 95% आत्मविश्वास स्तर के साथ होता है।
हालांकि यह काफी सख्त नहीं है (जनसंख्या माध्य एक निश्चित मूल्य है और इसलिए इससे संबंधित कोई संभावना नहीं हो सकती है) इस तरह से विश्वास अंतराल की व्याख्या करने के लिए, इसे समझना अवधारणात्मक रूप से आसान है।
प्रयोग टी-वितरण
यदि आप जनसंख्या में विचरण का मान जानते हैं तो आप सामान्य वितरण का उपयोग कर सकते हैं। इसके अलावा, जब नमूना आकार छोटा होता है, तो नमूना माध्य सामान्य वितरण का अनुसरण करता है यदि जनसंख्या के अंतर्गत डेटा सामान्य रूप से वितरित किया जाता है।
यदि जनसंख्या अंतर्निहित डेटा सामान्य रूप से वितरित नहीं किया जाता है और/या सामान्य भिन्नता (जनसंख्या भिन्नता) अज्ञात है, तो नमूना माध्य का पालन करता है छात्र का टी-वितरण.
जनसंख्या माध्य के लिए 95% विश्वास अंतराल की गणना निम्नानुसार करें:
कहां - प्रतिशत अंक (प्रतिशत) टी-स्वतंत्रता की (n-1) डिग्री के साथ छात्र वितरण, जो 0.05 की दो-पूंछ संभावना देता है।
सामान्य तौर पर, यह सामान्य वितरण का उपयोग करते समय की तुलना में एक व्यापक अंतराल प्रदान करता है, क्योंकि यह अतिरिक्त अनिश्चितता को ध्यान में रखता है जो जनसंख्या मानक विचलन का अनुमान लगाकर और/या छोटे नमूना आकार के कारण पेश किया जाता है।
जब नमूना आकार बड़ा होता है (100 या अधिक के क्रम का), तो दो वितरणों के बीच का अंतर ( टी छात्रऔर सामान्य) नगण्य है। हालांकि, हमेशा उपयोग करें टी-विश्वास अंतराल की गणना करते समय वितरण, भले ही नमूना आकार बड़ा हो।
आमतौर पर 95% सीआई दिया जाता है। अन्य विश्वास अंतरालों की गणना की जा सकती है, जैसे कि माध्य के लिए 99% सीआई।
मानक त्रुटि और तालिका मान के उत्पाद के बजाय टी-वितरण जो 0.05 की दो-पुच्छीय संभावना से मेल खाता है, इसे (मानक त्रुटि) 0.01 की दो-पूंछ संभावना से मेल खाने वाले मान से गुणा करें। यह 95% मामले की तुलना में एक व्यापक विश्वास अंतराल है क्योंकि यह बढ़े हुए विश्वास को दर्शाता है कि अंतराल में वास्तव में जनसंख्या माध्य शामिल है।
अनुपात के लिए विश्वास अंतराल
अनुपातों के न्यादर्श वितरण का द्विपद बंटन होता है। हालांकि, यदि नमूना आकार एनयथोचित रूप से बड़ा है, तो अनुपात नमूना वितरण माध्य के साथ लगभग सामान्य है।
नमूना अनुपात द्वारा अनुमान पी = आर / एन(कहाँ पे आर- नमूने में हमारे लिए रुचि की विशेषताओं वाले व्यक्तियों की संख्या), और मानक त्रुटि का अनुमान है:
अनुपात के लिए 95% विश्वास अंतराल अनुमानित है:
यदि नमूना आकार छोटा है (आमतौर पर जब एनपीया एन(1-पी)छोटे 5
), तो सटीक विश्वास अंतराल की गणना के लिए द्विपद वितरण का उपयोग किया जाना चाहिए।
ध्यान दें कि अगर पीप्रतिशत के रूप में व्यक्त किया जाता है, तो (1-पी)द्वारा प्रतिस्थापित (100पी).
विश्वास अंतराल की व्याख्या
विश्वास अंतराल की व्याख्या करते समय, हम निम्नलिखित प्रश्नों में रुचि रखते हैं:
कॉन्फिडेंस इंटरवल कितना चौड़ा है?
एक विस्तृत विश्वास अंतराल इंगित करता है कि अनुमान सटीक नहीं है; संकीर्ण एक अच्छा अनुमान इंगित करता है।
विश्वास अंतराल की चौड़ाई मानक त्रुटि के आकार पर निर्भर करती है, जो बदले में नमूना आकार पर निर्भर करती है, और डेटा की परिवर्तनशीलता से एक संख्यात्मक चर पर विचार करते समय, कुछ के बड़े डेटा सेट के अध्ययन की तुलना में व्यापक आत्मविश्वास अंतराल दें। चर।
क्या सीआई में विशेष रुचि के कोई मूल्य शामिल हैं?
आप जांच सकते हैं कि जनसंख्या पैरामीटर के लिए संभावित मान विश्वास अंतराल के भीतर आता है या नहीं। यदि हाँ, तो परिणाम इस संभावित मान के अनुरूप हैं। यदि नहीं, तो यह संभावना नहीं है (95% विश्वास अंतराल के लिए, संभावना लगभग 5% है) कि पैरामीटर का यह मान है।