मानक विश्वास अंतराल। मात्रात्मक विश्लेषण के तरीके: विश्वास अंतराल का आकलन

और अन्य। वे सभी अपने सैद्धांतिक समकक्षों के अनुमान हैं, जो एक नमूना नहीं, बल्कि सामान्य आबादी होने पर प्राप्त किया जा सकता है। लेकिन अफसोस, आम जनता बहुत महंगी है और अक्सर अनुपलब्ध रहती है।

अंतराल अनुमान की अवधारणा

किसी भी नमूना अनुमान में कुछ बिखराव होता है, क्योंकि एक विशेष नमूने में मूल्यों के आधार पर एक यादृच्छिक चर है। इसलिए, अधिक विश्वसनीय सांख्यिकीय अनुमानों के लिए, किसी को न केवल बिंदु अनुमान, बल्कि अंतराल भी जानना चाहिए, जिसकी उच्च संभावना है γ (गामा) अनुमानित संकेतक को कवर करता है θ (थीटा)।

औपचारिक रूप से, ये दो ऐसे मान (आँकड़े) हैं टी 1 (एक्स)और टी 2 (एक्स), क्या टी1< T 2 , जिसके लिए संभाव्यता के एक निश्चित स्तर पर γ शर्त पूरी होती है:

संक्षेप में, इसकी संभावना है γ या अधिक सही मान बिंदुओं के बीच है टी 1 (एक्स)और टी 2 (एक्स), जिन्हें निचली और ऊपरी सीमा कहा जाता है विश्वास अंतराल.

आत्मविश्वास अंतराल के निर्माण की शर्तों में से एक इसकी अधिकतम संकीर्णता है, अर्थात। यह यथासंभव छोटा होना चाहिए। इच्छा बिलकुल स्वाभाविक है, क्योंकि। शोधकर्ता वांछित पैरामीटर की खोज को अधिक सटीक रूप से स्थानीयकृत करने का प्रयास करता है।

यह इस प्रकार है कि विश्वास अंतराल को वितरण की अधिकतम संभावनाओं को कवर करना चाहिए। और स्कोर ही केंद्र में हो।

यानी ऊपर की ओर विचलन (अनुमान से सही संकेतक की) की संभावना नीचे की ओर विचलन की संभावना के बराबर है। यह भी ध्यान दिया जाना चाहिए कि विषम वितरण के लिए, दाईं ओर का अंतराल बाईं ओर के अंतराल के बराबर नहीं है।

ऊपर दिया गया आंकड़ा स्पष्ट रूप से दिखाता है कि आत्मविश्वास का स्तर जितना अधिक होगा, अंतराल उतना ही व्यापक होगा - एक सीधा संबंध।

यह अज्ञात मापदंडों के अंतराल आकलन के सिद्धांत का एक छोटा सा परिचय था। आइए गणितीय अपेक्षा के लिए आत्मविश्वास की सीमा खोजने के लिए आगे बढ़ें।

गणितीय अपेक्षा के लिए विश्वास अंतराल

यदि मूल डेटा को वितरित किया जाता है, तो औसत सामान्य मान होगा। यह इस नियम से चलता है कि सामान्य मूल्यों के रैखिक संयोजन का भी सामान्य वितरण होता है। इसलिए, संभावनाओं की गणना करने के लिए, हम सामान्य वितरण कानून के गणितीय तंत्र का उपयोग कर सकते हैं।

हालांकि, इसके लिए दो मापदंडों के ज्ञान की आवश्यकता होगी - अपेक्षित मूल्य और विचरण, जो आमतौर पर ज्ञात नहीं होते हैं। बेशक, आप मापदंडों (अंकगणित माध्य और) के बजाय अनुमानों का उपयोग कर सकते हैं, लेकिन तब माध्य का वितरण बिल्कुल सामान्य नहीं होगा, यह थोड़ा चपटा हो जाएगा। आयरलैंड के नागरिक विलियम गॉसेट ने इस तथ्य को बखूबी नोट किया जब उन्होंने बायोमेट्रिका के मार्च 1908 के अंक में अपनी खोज प्रकाशित की। गोपनीयता के उद्देश्य से, गॉसेट ने छात्र के साथ हस्ताक्षर किए। इस प्रकार विद्यार्थी का t-वितरण प्रकट हुआ।

हालांकि, खगोलीय प्रेक्षणों में त्रुटियों के विश्लेषण में के. गॉस द्वारा उपयोग किए गए डेटा का सामान्य वितरण, स्थलीय जीवन में अत्यंत दुर्लभ है और इसे स्थापित करना काफी कठिन है (उच्च सटीकता के लिए, लगभग 2 हजार टिप्पणियों की आवश्यकता होती है)। इसलिए, सामान्यता की धारणा को छोड़ना और उन तरीकों का उपयोग करना सबसे अच्छा है जो मूल डेटा के वितरण पर निर्भर नहीं करते हैं।

प्रश्न उठता है: यदि किसी अज्ञात वितरण के डेटा से गणना की जाती है तो अंकगणितीय माध्य का वितरण क्या होता है? उत्तर सुप्रसिद्ध प्रायिकता सिद्धांत द्वारा दिया गया है केंद्रीय सीमा प्रमेय(सीपीटी)। गणित में, इसके कई संस्करण हैं (वर्षों में सूत्रों को परिष्कृत किया गया है), लेकिन उनमें से सभी मोटे तौर पर इस कथन पर आते हैं कि बड़ी संख्या में स्वतंत्र यादृच्छिक चर का योग सामान्य वितरण कानून का पालन करता है।

अंकगणित माध्य की गणना करते समय, यादृच्छिक चर के योग का उपयोग किया जाता है। इससे यह पता चलता है कि अंकगणितीय माध्य का एक सामान्य वितरण होता है, जिसमें अपेक्षित मूल्य मूल डेटा का अपेक्षित मूल्य होता है, और विचरण होता है।

स्मार्ट लोग सीएलटी को साबित करना जानते हैं, लेकिन हम इसे एक्सेल में किए गए एक प्रयोग की मदद से सत्यापित करेंगे। आइए 50 समान रूप से वितरित यादृच्छिक चर (एक्सेल रैंडमबेटवेन फ़ंक्शन का उपयोग करके) का एक नमूना अनुकरण करें। फिर हम ऐसे 1000 नमूने बनाएंगे और प्रत्येक के लिए अंकगणितीय माध्य की गणना करेंगे। आइए उनके वितरण को देखें।

यह देखा जा सकता है कि औसत का वितरण सामान्य कानून के करीब है। यदि नमूनों की मात्रा और उनकी संख्या को और भी बड़ा कर दिया जाए, तो समानता और भी बेहतर हो जाएगी।

अब जब हमने अपने लिए सीएलटी की वैधता देख ली है, तो हम अंकगणितीय माध्य के लिए विश्वास अंतराल की गणना कर सकते हैं, जो किसी दिए गए संभाव्यता के साथ सही माध्य या गणितीय अपेक्षा को कवर करता है।

ऊपरी और निचली सीमाओं को स्थापित करने के लिए, सामान्य वितरण के मापदंडों को जानना आवश्यक है। एक नियम के रूप में, वे नहीं हैं, इसलिए अनुमानों का उपयोग किया जाता है: अंकगणित औसतऔर नमूना विचरण. फिर से, यह विधि केवल बड़े नमूनों के लिए एक अच्छा सन्निकटन देती है। जब नमूने छोटे होते हैं, तो अक्सर छात्र के वितरण का उपयोग करने की सिफारिश की जाती है। विश्वास मत करो! माध्य के लिए विद्यार्थी का वितरण तभी होता है जब मूल डेटा का सामान्य वितरण होता है, यानी लगभग कभी नहीं। इसलिए, आवश्यक डेटा की मात्रा के लिए न्यूनतम बार तुरंत सेट करना और विषम रूप से सही तरीकों का उपयोग करना बेहतर है। वे कहते हैं कि 30 अवलोकन पर्याप्त हैं। 50 लो - तुम गलत नहीं हो सकते।

टी 1.2विश्वास अंतराल की निचली और ऊपरी सीमाएँ हैं

- नमूना अंकगणित माध्य

एस0- नमूना मानक विचलन (निष्पक्ष)

एन - नमूने का आकार

γ - आत्मविश्वास का स्तर (आमतौर पर 0.9, 0.95 या 0.99) के बराबर

सी γ =Φ -1 ((1+γ)/2)मानक सामान्य वितरण फ़ंक्शन का पारस्परिक है। सरल शब्दों में, यह अंकगणित माध्य से निचली या ऊपरी सीमा तक मानक त्रुटियों की संख्या है (संकेतित तीन संभावनाएं 1.64, 1.96 और 2.58 के मानों के अनुरूप हैं)।

सूत्र का सार यह है कि अंकगणित माध्य लिया जाता है और फिर उसमें से एक निश्चित राशि अलग कर दी जाती है ( . के साथ) मानक त्रुटियां ( एस 0 /√n) सब कुछ ज्ञात है, इसे लो और गिनें।

पीसी के बड़े पैमाने पर उपयोग से पहले, सामान्य वितरण फ़ंक्शन और इसके व्युत्क्रम के मूल्यों को प्राप्त करने के लिए, उन्होंने . वे अभी भी उपयोग किए जाते हैं, लेकिन तैयार एक्सेल फ़ार्मुलों की ओर मुड़ना अधिक कुशल है। उपरोक्त सूत्र ( , और ) के सभी तत्वों की गणना एक्सेल में आसानी से की जा सकती है। लेकिन कॉन्फिडेंस इंटरवल की गणना के लिए एक रेडीमेड फॉर्मूला भी है - विश्वास मानदंड. इसका सिंटैक्स निम्न है।

विश्वास मानदंड (अल्फा, मानक_देव, आकार)

अल्फा- महत्व स्तर या आत्मविश्वास का स्तर, जो उपरोक्त संकेतन में 1-γ के बराबर है, अर्थात। संभावना है कि गणितीयउम्मीद विश्वास अंतराल के बाहर होगी। 0.95 के आत्मविश्वास स्तर के साथ, अल्फा 0.05 है, और इसी तरह।

मानक_ऑफनमूना डेटा का मानक विचलन है। आपको मानक त्रुटि की गणना करने की आवश्यकता नहीं है, एक्सेल n की जड़ से विभाजित होगा।

आकार- नमूना आकार (एन)।

CONFIDENCE.NORM फ़ंक्शन का परिणाम विश्वास अंतराल की गणना के लिए सूत्र से दूसरा शब्द है, अर्थात। आधा अंतराल। तदनुसार, निचले और ऊपरी बिंदु औसत ± प्राप्त मूल्य हैं।

इस प्रकार, अंकगणित माध्य के लिए विश्वास अंतराल की गणना के लिए एक सार्वभौमिक एल्गोरिथ्म बनाना संभव है, जो प्रारंभिक डेटा के वितरण पर निर्भर नहीं करता है। सार्वभौमिकता की कीमत इसकी स्पर्शोन्मुख प्रकृति है, अर्थात। अपेक्षाकृत बड़े नमूनों का उपयोग करने की आवश्यकता। हालांकि, आधुनिक तकनीक के युग में, सही मात्रा में डेटा एकत्र करना आमतौर पर मुश्किल नहीं होता है।

एक विश्वास अंतराल का उपयोग करके सांख्यिकीय परिकल्पना का परीक्षण करना

(मॉड्यूल 111)

सांख्यिकी में हल की जाने वाली मुख्य समस्याओं में से एक है। संक्षेप में इसका सार यही है। उदाहरण के लिए, एक धारणा बनाई जाती है कि सामान्य जनसंख्या की अपेक्षा कुछ मूल्य के बराबर होती है। फिर नमूना साधनों के वितरण का निर्माण किया जाता है, जिसे एक निश्चित अपेक्षा के साथ देखा जा सकता है। इसके बाद, हम देखते हैं कि इस सशर्त वितरण में वास्तविक औसत कहाँ स्थित है। यदि यह स्वीकार्य सीमा से अधिक हो जाता है, तो इस तरह के औसत की उपस्थिति बहुत ही असंभव है, और प्रयोग की एक पुनरावृत्ति के साथ यह लगभग असंभव है, जो कि परिकल्पना के विपरीत है, जिसे सफलतापूर्वक खारिज कर दिया गया है। यदि औसत महत्वपूर्ण स्तर से आगे नहीं जाता है, तो परिकल्पना को खारिज नहीं किया जाता है (लेकिन यह भी साबित नहीं होता है!)

तो, विश्वास अंतराल की सहायता से, हमारे मामले में अपेक्षा के लिए, आप कुछ परिकल्पनाओं का परीक्षण भी कर सकते हैं। यह करना बहुत आसान है। मान लीजिए कि किसी नमूने के लिए अंकगणितीय माध्य 100 है। परिकल्पना का परीक्षण किया जा रहा है कि अपेक्षित मान, मान लीजिए, 90 है। अर्थात, यदि हम प्रश्न को मूल रूप से रखते हैं, तो ऐसा लगता है: क्या यह हो सकता है कि वास्तविक मूल्य के साथ औसत 90 के बराबर, देखा गया औसत 100 था?

इस प्रश्न का उत्तर देने के लिए, मानक विचलन और नमूना आकार पर अतिरिक्त जानकारी की आवश्यकता होगी। मान लें कि मानक विचलन 30 है, और अवलोकनों की संख्या 64 है (मूल को आसानी से निकालने के लिए)। तब माध्य की मानक त्रुटि 30/8 या 3.75 है। 95% विश्वास अंतराल की गणना करने के लिए, आपको माध्य के दोनों किनारों पर दो मानक त्रुटियों को अलग रखना होगा (अधिक सटीक रूप से, 1.96)। विश्वास अंतराल लगभग 100 ± 7.5, या 92.5 से 107.5 तक होगा।

आगे तर्क इस प्रकार है। यदि परीक्षण किया गया मान विश्वास अंतराल के भीतर आता है, तो यह परिकल्पना का खंडन नहीं करता है, क्योंकि यादृच्छिक उतार-चढ़ाव की सीमा के भीतर फिट बैठता है (95% की संभावना के साथ)। यदि परीक्षण बिंदु विश्वास अंतराल के बाहर है, तो ऐसी घटना की संभावना बहुत कम है, किसी भी मामले में स्वीकार्य स्तर से नीचे। अतः परिकल्पना को प्रेक्षित आँकड़ों के विपरीत बताते हुए अस्वीकृत किया जाता है। हमारे मामले में, उम्मीद की परिकल्पना विश्वास अंतराल के बाहर है (90 का परीक्षण मूल्य 100 ± 7.5 के अंतराल में शामिल नहीं है), इसलिए इसे अस्वीकार कर दिया जाना चाहिए। उपरोक्त आदिम प्रश्न का उत्तर देते हुए, किसी को कहना चाहिए: नहीं, यह किसी भी मामले में नहीं हो सकता है, ऐसा बहुत कम होता है। अक्सर, यह परिकल्पना (पी-स्तर) की गलत अस्वीकृति की एक विशिष्ट संभावना को इंगित करता है, न कि किसी दिए गए स्तर के अनुसार, जिसके अनुसार आत्मविश्वास अंतराल बनाया गया था, लेकिन उस पर एक और समय।

जैसा कि आप देख सकते हैं, माध्य (या गणितीय अपेक्षा) के लिए एक विश्वास अंतराल बनाना मुश्किल नहीं है। मुख्य बात सार को पकड़ना है, और फिर चीजें चली जाएंगी। व्यवहार में, अधिकांश 95% विश्वास अंतराल का उपयोग करते हैं, जो कि माध्य के दोनों ओर लगभग दो मानक त्रुटियां हैं।

अभी के लिए इतना ही। शुभकामनाएं!

अनुदेश

कृपया ध्यान दें कि मध्यान्तर(l1 या l2), जिसका मध्य क्षेत्र अनुमान l* होगा, और यह भी जिसमें पैरामीटर का सही मान निहित होने की संभावना है, बस विश्वास होगा मध्यान्तरओम या कॉन्फिडेंस लेवल अल्फा का संगत मान। इस मामले में, l* स्वयं बिंदु अनुमानों को संदर्भित करेगा। उदाहरण के लिए, यादृच्छिक मान X (x1, x2,..., xn) के किसी भी नमूना मान के परिणामों के आधार पर, अज्ञात संकेतक पैरामीटर l की गणना करना आवश्यक है, जिस पर वितरण निर्भर करेगा। इस मामले में, किसी दिए गए पैरामीटर l* का अनुमान प्राप्त करने का अर्थ यह होगा कि प्रत्येक नमूने के लिए पैरामीटर के एक निश्चित मान को लाइन में रखना आवश्यक होगा, अर्थात संकेतक Q के अवलोकन के परिणामों का एक फ़ंक्शन बनाना, जिसका मान एक सूत्र के रूप में पैरामीटर l* के अनुमानित मान के बराबर लिया जाएगा: l*=Q*(x1, x2,..., xn)।

ध्यान दें कि प्रेक्षण के परिणामों पर कोई भी फलन आँकड़ा कहलाता है। इसके अलावा, यदि यह विचाराधीन पैरामीटर (घटना) का पूरी तरह से वर्णन करता है, तो इसे पर्याप्त आंकड़े कहा जाता है। और क्योंकि प्रेक्षणों के परिणाम यादृच्छिक हैं, तो l * भी एक यादृच्छिक चर होगा। आँकड़ों की गणना का कार्य इसकी गुणवत्ता के मानदंडों को ध्यान में रखते हुए किया जाना चाहिए। यहां यह ध्यान रखना आवश्यक है कि अनुमान का वितरण नियम काफी निश्चित है, संभाव्यता घनत्व W(x, l) का वितरण।

आप आत्मविश्वास की गणना कर सकते हैं मध्यान्तरकाफी आसान है यदि आप मूल्यांकन के वितरण के बारे में कानून जानते हैं। उदाहरण के लिए, ट्रस्ट मध्यान्तरगणितीय अपेक्षा (यादृच्छिक मान का औसत मान) के संबंध में अनुमान mx* =(1/n)*(x1+x2+ …+xn) । यह अनुमान निष्पक्ष होगा, यानी संकेतक की गणितीय अपेक्षा या औसत मूल्य पैरामीटर (एम (एमएक्स *) = एमएक्स) के सही मूल्य के बराबर होगा।

आप यह स्थापित कर सकते हैं कि गणितीय अपेक्षा से अनुमान का विचरण है: bx*^2=Dx/n। सीमा केंद्रीय प्रमेय के आधार पर, हम उचित निष्कर्ष निकाल सकते हैं कि इस अनुमान का वितरण कानून गाऊसी (सामान्य) है। इसलिए, गणना के लिए, आप संकेतक (z) का उपयोग कर सकते हैं - संभावनाओं का अभिन्न अंग। इस मामले में, ट्रस्ट की लंबाई चुनें मध्यान्तरऔर दूसरा, तो आपको मिलता है: अल्फा \u003d पी (एमएक्स-एलडी (सूत्र के अनुसार संभाव्यता अभिन्न की संपत्ति का उपयोग करके: Ф (-z) \u003d 1- Ф (जेड))।

विश्वास का निर्माण मध्यान्तरगणितीय अपेक्षा के अनुमान: - सूत्र का मान ज्ञात करें (अल्फा + 1) / 2; - संभाव्यता अभिन्न तालिका से ld / sqrt (Dx / n) के बराबर मान का चयन करें; - वास्तविक विचरण का अनुमान लें: डीएक्स * = (1 / एन) * ( (एक्स1 - एमएक्स*)^2+(x2 - एमएक्स*)^2+…+(एक्सएन - एमएक्स*)^2); मध्यान्तरसूत्र के अनुसार: (एमएक्स*-एलडी, एमएक्स*+एलडी)।

आँकड़ों में, अनुमान दो प्रकार के होते हैं: बिंदु और अंतराल। बिंदु अनुमानएक एकल नमूना आँकड़ा है जिसका उपयोग जनसंख्या पैरामीटर का अनुमान लगाने के लिए किया जाता है। उदाहरण के लिए, नमूना माध्य जनसंख्या माध्य का एक बिंदु अनुमान है, और नमूना विचरण एस 2- जनसंख्या विचरण का बिंदु अनुमान 2. यह दिखाया गया कि नमूना माध्य जनसंख्या अपेक्षा का एक निष्पक्ष अनुमान है। नमूना माध्य को निष्पक्ष कहा जाता है क्योंकि सभी नमूने का मतलब (समान नमूना आकार के साथ) एन) सामान्य जनसंख्या की गणितीय अपेक्षा के बराबर है।

नमूना विचरण के क्रम में एस 2जनसंख्या भिन्नता का एक निष्पक्ष अनुमानक बन गया 2, नमूना विचरण के हर के बराबर सेट किया जाना चाहिए एन – 1 , लेकिन नहीं एन. दूसरे शब्दों में, जनसंख्या विचरण सभी संभावित नमूना प्रसरणों का औसत है।

जनसंख्या मापदंडों का आकलन करते समय, यह ध्यान में रखा जाना चाहिए कि नमूना आँकड़े जैसे , विशिष्ट नमूनों पर निर्भर करते हैं। इस तथ्य को ध्यान में रखते हुए, प्राप्त करने के लिए अंतराल अनुमानसामान्य जनसंख्या की गणितीय अपेक्षा नमूना साधनों के वितरण का विश्लेषण करती है (अधिक विवरण के लिए, देखें)। निर्मित अंतराल एक निश्चित आत्मविश्वास स्तर की विशेषता है, जो कि संभावना है कि सामान्य आबादी के सही पैरामीटर का सही अनुमान लगाया गया है। किसी विशेषता के अनुपात का अनुमान लगाने के लिए समान विश्वास अंतराल का उपयोग किया जा सकता है आरऔर सामान्य आबादी का मुख्य वितरित द्रव्यमान।

नोट या प्रारूप में डाउनलोड करें, प्रारूप में उदाहरण

एक ज्ञात मानक विचलन के साथ सामान्य जनसंख्या की गणितीय अपेक्षा के लिए एक विश्वास अंतराल का निर्माण

सामान्य जनसंख्या में एक विशेषता के अनुपात के लिए एक विश्वास अंतराल का निर्माण

इस खंड में, एक विश्वास अंतराल की अवधारणा को श्रेणीबद्ध डेटा तक बढ़ाया गया है। यह आपको सामान्य आबादी में विशेषता के हिस्से का अनुमान लगाने की अनुमति देता है आरएक नमूना शेयर के साथ आरएस= एक्स/एन. जैसा कि उल्लेख किया गया है, यदि मान एनआरऔर एन(1 - पी)संख्या 5 से अधिक, द्विपद वितरण को सामान्य द्वारा अनुमानित किया जा सकता है। इसलिए, सामान्य जनसंख्या में एक विशेषता के हिस्से का अनुमान लगाने के लिए आरएक अंतराल का निर्माण करना संभव है जिसका आत्मविश्वास स्तर बराबर है (1 - α)x100%.


कहाँ पे पीएस- सुविधा का नमूना हिस्सा, के बराबर एक्स/एन, अर्थात। नमूना आकार से विभाजित सफलताओं की संख्या, आर- सामान्य आबादी में विशेषता का हिस्सा, जेडमानकीकृत सामान्य वितरण का महत्वपूर्ण मूल्य है, एन- नमूने का आकार।

उदाहरण 3मान लें कि सूचना प्रणाली से एक नमूना निकाला गया है, जिसमें पिछले महीने के दौरान पूरे किए गए 100 चालान शामिल हैं। मान लें कि इनमें से 10 चालान गलत हैं। इस प्रकार, आर= 10/100 = 0.1. 95% आत्मविश्वास का स्तर महत्वपूर्ण मान Z = 1.96 से मेल खाता है।

इस प्रकार, 95% संभावना है कि 4.12% और 15.88% के बीच चालान में त्रुटियां हैं।

किसी दिए गए नमूने के आकार के लिए, सामान्य जनसंख्या में विशेषता के अनुपात वाले विश्वास अंतराल एक सतत यादृच्छिक चर की तुलना में व्यापक प्रतीत होता है। ऐसा इसलिए है क्योंकि एक सतत यादृच्छिक चर के माप में श्रेणीबद्ध डेटा के मापन की तुलना में अधिक जानकारी होती है। दूसरे शब्दों में, केवल दो मान लेने वाले श्रेणीबद्ध डेटा में उनके वितरण के मापदंडों का अनुमान लगाने के लिए अपर्याप्त जानकारी होती है।

परपरिमित जनसंख्या से प्राप्त अनुमानों की गणना

गणितीय अपेक्षा का अनुमान।अंतिम जनसंख्या के लिए सुधार कारक ( पांचवें वेतन आयोग) का उपयोग मानक त्रुटि को एक कारक द्वारा कम करने के लिए किया गया था। जनसंख्या मापदंडों के अनुमानों के लिए विश्वास अंतराल की गणना करते समय, उन स्थितियों में एक सुधार कारक लागू किया जाता है जहां नमूने बिना प्रतिस्थापन के लिए जाते हैं। इस प्रकार, गणितीय अपेक्षा के लिए कॉन्फिडेंस इंटरवल, जिसका कॉन्फिडेंस लेवल के बराबर होता है (1 - α)x100%, सूत्र द्वारा गणना की जाती है:

उदाहरण 4एक सीमित आबादी के लिए एक सुधार कारक के आवेदन को स्पष्ट करने के लिए, आइए हम ऊपर उदाहरण 3 में चर्चा की गई चालानों की औसत राशि के लिए विश्वास अंतराल की गणना करने की समस्या पर लौटते हैं। मान लीजिए कि एक कंपनी प्रति माह 5,000 चालान जारी करती है, और एक्स=110.27 अमरीकी डालर, एस= $28.95 एन = 5000, एन = 100, α = 0.05, t99 = 1.9842। सूत्र (6) के अनुसार हम प्राप्त करते हैं:

सुविधा के हिस्से का अनुमान।नो रिटर्न चुनते समय, कॉन्फिडेंस इंटरवल उस फीचर के अनुपात के लिए होता है जिसका कॉन्फिडेंस लेवल के बराबर होता है (1 - α)x100%, सूत्र द्वारा गणना की जाती है:

विश्वास अंतराल और नैतिक मुद्दे

जनसंख्या का नमूना लेते समय और सांख्यिकीय निष्कर्ष तैयार करते समय, नैतिक समस्याएं अक्सर उत्पन्न होती हैं। मुख्य बात यह है कि नमूना आँकड़ों के विश्वास अंतराल और बिंदु अनुमान कैसे सहमत होते हैं। उचित विश्वास अंतराल (आमतौर पर 95% विश्वास स्तरों पर) को निर्दिष्ट किए बिना प्रकाशन बिंदु अनुमान और जिस नमूना आकार से वे प्राप्त किए गए हैं, वे भ्रामक हो सकते हैं। इससे उपयोगकर्ता को यह आभास हो सकता है कि एक बिंदु अनुमान ठीक वही है जो उसे पूरी आबादी के गुणों की भविष्यवाणी करने के लिए चाहिए। इस प्रकार यह समझना आवश्यक है कि किसी भी शोध में बिंदु नहीं, बल्कि अंतराल अनुमानों को सबसे आगे रखा जाना चाहिए। इसके अलावा, नमूना आकारों के सही चुनाव पर विशेष ध्यान दिया जाना चाहिए।

सबसे अधिक बार, सांख्यिकीय जोड़तोड़ की वस्तुएं विभिन्न राजनीतिक मुद्दों पर जनसंख्या के समाजशास्त्रीय सर्वेक्षण के परिणाम हैं। साथ ही सर्वेक्षण के परिणामों को समाचार पत्रों के पहले पन्ने पर रखा जाता है, और नमूना त्रुटि और सांख्यिकीय विश्लेषण की पद्धति बीच में कहीं छपी होती है। प्राप्त बिंदु अनुमानों की वैधता को साबित करने के लिए, नमूना आकार को इंगित करना आवश्यक है जिसके आधार पर उन्हें प्राप्त किया गया था, विश्वास अंतराल की सीमाएं और इसका महत्व स्तर।

अगला नोट

लेविन एट अल पुस्तक से सामग्री प्रबंधकों के लिए सांख्यिकी का उपयोग किया जाता है। - एम .: विलियम्स, 2004. - पी। 448-462

केंद्रीय सीमा प्रमेययह बताता है कि, पर्याप्त रूप से बड़े नमूने के आकार को देखते हुए, साधनों का नमूना वितरण एक सामान्य वितरण द्वारा अनुमानित किया जा सकता है। यह संपत्ति जनसंख्या वितरण के प्रकार पर निर्भर नहीं करती है।

विश्वास अंतराल(सीआई; अंग्रेजी में, आत्मविश्वास अंतराल - सीआई) नमूने पर अध्ययन में प्राप्त ऐसे सभी रोगियों (सामान्य जनसंख्या) की आबादी के बारे में निष्कर्ष निकालने के लिए, अध्ययन के परिणामों की सटीकता (या अनिश्चितता) का एक माप देता है। ) 95% CI की सही परिभाषा निम्नानुसार तैयार की जा सकती है: ऐसे अंतरालों के 95% में जनसंख्या में सही मान होगा। यह व्याख्या कुछ हद तक कम सटीक है: सीआई मूल्यों की श्रेणी है जिसके भीतर आप 95% सुनिश्चित हो सकते हैं कि इसमें सही मूल्य है। सीआई का उपयोग करते समय, पी मान के विपरीत मात्रात्मक प्रभाव को निर्धारित करने पर जोर दिया जाता है, जो सांख्यिकीय महत्व के परीक्षण के परिणामस्वरूप प्राप्त होता है। पी मान किसी भी राशि का मूल्यांकन नहीं करता है, बल्कि "कोई प्रभाव नहीं" की शून्य परिकल्पना के खिलाफ सबूत की ताकत के एक उपाय के रूप में कार्य करता है। P का मान अपने आप में अंतर के परिमाण के बारे में या उसकी दिशा के बारे में भी कुछ नहीं बताता है। इसलिए, पी के स्वतंत्र मूल्य लेखों या सार में बिल्कुल जानकारीपूर्ण नहीं हैं। इसके विपरीत, सीआई तत्काल ब्याज के प्रभाव की मात्रा, जैसे उपचार की उपयोगिता और साक्ष्य की ताकत दोनों को इंगित करता है। इसलिए डीआई का सीधा संबंध डीएम की प्रैक्टिस से है।

सांख्यिकीय विश्लेषण के लिए अनुमान दृष्टिकोण, सीआई द्वारा सचित्र, का उद्देश्य ब्याज के प्रभाव (नैदानिक ​​​​परीक्षण की संवेदनशीलता, अनुमानित घटना, उपचार के साथ सापेक्ष जोखिम में कमी, आदि) के साथ-साथ उसमें अनिश्चितता की माप को मापना है। प्रभाव। अक्सर, सीआई अनुमान के दोनों ओर मूल्यों की श्रेणी है जिसमें वास्तविक मूल्य निहित होने की संभावना है, और आप इसके बारे में 95% सुनिश्चित हो सकते हैं। 95% प्रायिकता का उपयोग करने की परंपरा मनमाना है, साथ ही P . का मान भी है<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

सीआई इस विचार पर आधारित है कि रोगियों के विभिन्न समूहों पर किया गया एक ही अध्ययन समान परिणाम नहीं देगा, लेकिन यह कि उनके परिणाम सही लेकिन अज्ञात मूल्य के आसपास वितरित किए जाएंगे। दूसरे शब्दों में, सीआई इसे "नमूना-निर्भर परिवर्तनशीलता" के रूप में वर्णित करता है। सीआई अन्य कारणों से अतिरिक्त अनिश्चितता को नहीं दर्शाता है; विशेष रूप से, इसमें ट्रैकिंग, खराब अनुपालन या गलत परिणाम माप, अंधापन की कमी आदि पर रोगियों के चयनात्मक नुकसान के प्रभाव शामिल नहीं हैं। इस प्रकार CI हमेशा अनिश्चितता की कुल मात्रा को कम करके आंकता है।

विश्वास अंतराल गणना

तालिका ए1.1। कुछ नैदानिक ​​मापों के लिए मानक त्रुटियां और आत्मविश्वास अंतराल

आम तौर पर, सीआई की गणना मात्रात्मक माप के एक अनुमानित अनुमान से की जाती है, जैसे कि अंतर (डी) दो अनुपातों के बीच, और उस अंतर के अनुमान में मानक त्रुटि (एसई)। इस प्रकार प्राप्त अनुमानित 95% CI d ± 1.96 SE है। परिणाम माप की प्रकृति और सीआई के कवरेज के अनुसार सूत्र बदलता है। उदाहरण के लिए, अकोशिकीय पर्टुसिस वैक्सीन के एक यादृच्छिक, प्लेसीबो-नियंत्रित परीक्षण में, 1670 (4.3%) शिशुओं में से 72 में काली खांसी विकसित हुई, जिन्होंने टीका प्राप्त किया और नियंत्रण समूह में 1665 में से 240 (14.4%)। प्रतिशत अंतर, जिसे पूर्ण जोखिम में कमी के रूप में जाना जाता है, 10.1% है। इस अंतर का SE 0.99% है। तदनुसार, 95% चक्रवृद्धि ब्याज 10.1% + 1.96 x 0.99% है, अर्थात। 8.2 से 12.0 तक।

विभिन्न दार्शनिक दृष्टिकोणों के बावजूद, सीआई और सांख्यिकीय महत्व के परीक्षण गणितीय रूप से निकट से संबंधित हैं।

इस प्रकार, P का मान "महत्वपूर्ण" है, अर्थात। आर<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

सीआई में व्यक्त अनुमान की अनिश्चितता (अशुद्धि), काफी हद तक नमूना आकार के वर्गमूल से संबंधित है। छोटे नमूने बड़े नमूनों की तुलना में कम जानकारी प्रदान करते हैं, और सीआई छोटे नमूनों में तदनुसार व्यापक होते हैं। उदाहरण के लिए, हेलिकोबैक्टर पाइलोरी संक्रमण का निदान करने के लिए इस्तेमाल किए गए तीन परीक्षणों के प्रदर्शन की तुलना करने वाले एक लेख ने यूरिया सांस परीक्षण संवेदनशीलता 95.8% (95% सीआई 75-100) की सूचना दी। जबकि 95.8% का आंकड़ा प्रभावशाली दिखता है, 24 वयस्क एच। पाइलोरी रोगियों के छोटे नमूने के आकार का मतलब है कि इस अनुमान में महत्वपूर्ण अनिश्चितता है, जैसा कि विस्तृत सीआई द्वारा इंगित किया गया है। दरअसल, 75% की निचली सीमा 95.8% अनुमान से काफी कम है। यदि 240 लोगों के नमूने में समान संवेदनशीलता देखी गई, तो 95% सीआई 92.5-98.0 होगा, यह अधिक आश्वासन देता है कि परीक्षण अत्यधिक संवेदनशील है।

यादृच्छिक नियंत्रित परीक्षणों (आरसीटी) में, गैर-महत्वपूर्ण परिणाम (यानी, पी> 0.05 वाले) विशेष रूप से गलत व्याख्या के लिए अतिसंवेदनशील होते हैं। सीआई यहां विशेष रूप से उपयोगी है क्योंकि यह इंगित करता है कि परिणाम चिकित्सकीय रूप से उपयोगी सच्चे प्रभाव के साथ कितने अनुकूल हैं। उदाहरण के लिए, बृहदान्त्र में सिवनी बनाम स्टेपल सम्मिलन की तुलना करने वाले आरसीटी में, घाव संक्रमण क्रमशः 10.9% और 13.5% रोगियों में विकसित हुआ, (पी = 0.30)। इस अंतर के लिए 95% CI 2.6% (-2 से +8) है। इस अध्ययन में भी, जिसमें 652 रोगी शामिल थे, यह संभावना बनी हुई है कि दो प्रक्रियाओं के परिणामस्वरूप संक्रमण की घटनाओं में मामूली अंतर है। अध्ययन जितना छोटा होगा, अनिश्चितता उतनी ही अधिक होगी। सुंग एट अल। 100 रोगियों में तीव्र वैरिकाज़ रक्तस्राव के लिए आपातकालीन स्क्लेरोथेरेपी के साथ ऑक्टेरोटाइड जलसेक की तुलना करते हुए एक आरसीटी का प्रदर्शन किया। ऑक्टेरोटाइड समूह में, रक्तस्राव की गिरफ्तारी दर 84% थी; स्क्लेरोथेरेपी समूह में - 90%, जो P = 0.56 देता है। ध्यान दें कि निरंतर रक्तस्राव की दर उल्लिखित अध्ययन में घाव के संक्रमण के समान है। इस मामले में, हालांकि, हस्तक्षेपों में अंतर के लिए 95% सीआई 6% (-7 से +19) है। नैदानिक ​​रुचि के 5% अंतर की तुलना में यह सीमा काफी विस्तृत है। यह स्पष्ट है कि अध्ययन प्रभावकारिता में महत्वपूर्ण अंतर से इंकार नहीं करता है। इसलिए, लेखकों का निष्कर्ष "ऑक्टेरोटाइड जलसेक और स्क्लेरोथेरेपी वैरिकाज़ से रक्तस्राव के उपचार में समान रूप से प्रभावी हैं" निश्चित रूप से मान्य नहीं है। इस तरह के मामलों में जहां पूर्ण जोखिम में कमी (एआरआर) के लिए 95% सीआई में शून्य शामिल है, जैसा कि यहां, एनएनटी के लिए सीआई (इलाज के लिए आवश्यक संख्या) की व्याख्या करना मुश्किल है। एनएलपी और इसका सीआई एसीपी के व्युत्क्रम से प्राप्त किया जाता है (यदि इन मानों को प्रतिशत के रूप में दिया जाता है तो उन्हें 100 से गुणा करें)। यहां हमें एनपीपी = 100: 6 = 16.6 मिलता है जिसमें 95% सीआई -14.3 से 5.3 तक होता है। जैसा कि तालिका में फुटनोट "डी" से देखा जा सकता है। A1.1, इस CI में NTPP के लिए 5.3 से अनंत तक और NTLP के 14.3 से अनंत तक के मान शामिल हैं।

सीआई का निर्माण सबसे अधिक इस्तेमाल किए जाने वाले सांख्यिकीय अनुमानों या तुलनाओं के लिए किया जा सकता है। आरसीटी के लिए, इसमें औसत अनुपात, सापेक्ष जोखिम, अंतर अनुपात और एनआरआर के बीच का अंतर शामिल है। इसी तरह, नैदानिक ​​परीक्षण सटीकता के अध्ययन में किए गए सभी प्रमुख अनुमानों के लिए सीआई प्राप्त किए जा सकते हैं - संवेदनशीलता, विशिष्टता, सकारात्मक भविष्य कहनेवाला मूल्य (जिनमें से सभी सरल अनुपात हैं), और संभावना अनुपात - मेटा-विश्लेषण और तुलना-से-नियंत्रण में प्राप्त अनुमान अध्ययन करते हैं। एक व्यक्तिगत कंप्यूटर प्रोग्राम जो DI के इन उपयोगों में से कई को कवर करता है, सांख्यिकी के दूसरे संस्करण में कॉन्फिडेंस के साथ उपलब्ध है। अनुपात के लिए सीआई की गणना के लिए मैक्रोज़ एक्सेल और सांख्यिकीय कार्यक्रमों एसपीएसएस और मिनिटैब के लिए http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm पर स्वतंत्र रूप से उपलब्ध हैं।

उपचार प्रभाव के एकाधिक मूल्यांकन

जबकि एक अध्ययन के प्राथमिक परिणामों के लिए सीआई का निर्माण वांछनीय है, वे सभी परिणामों के लिए आवश्यक नहीं हैं। सीआई चिकित्सकीय रूप से महत्वपूर्ण तुलनाओं की चिंता करता है। उदाहरण के लिए, दो समूहों की तुलना करते समय, सही CI वह है जो समूहों के बीच अंतर के लिए बनाया गया है, जैसा कि ऊपर के उदाहरणों में दिखाया गया है, न कि CI जिसे प्रत्येक समूह में अनुमान के लिए बनाया जा सकता है। न केवल प्रत्येक समूह में अंकों के लिए अलग-अलग सीआई देना बेकार है, यह प्रस्तुति भ्रामक हो सकती है। इसी तरह, विभिन्न उपसमूहों में उपचार प्रभावकारिता की तुलना करते समय सही दृष्टिकोण दो (या अधिक) उपसमूहों की सीधे तुलना करना है। यह मान लेना गलत है कि उपचार केवल एक उपसमूह में प्रभावी है यदि इसका सीआई बिना किसी प्रभाव के मान को बाहर कर देता है, जबकि अन्य नहीं करते हैं। कई उपसमूहों में परिणामों की तुलना करते समय सीआई भी उपयोगी होते हैं। अंजीर पर। A1.1 मैग्नीशियम सल्फेट के प्लेसबो-नियंत्रित आरसीटी से महिलाओं के उपसमूहों में प्रीक्लेम्पसिया वाली महिलाओं में एक्लम्पसिया के सापेक्ष जोखिम को दर्शाता है।

चावल। ए1.2. फॉरेस्ट ग्राफ डायरिया बनाम प्लेसीबो की रोकथाम के लिए गोजातीय रोटावायरस वैक्सीन के 11 यादृच्छिक नैदानिक ​​​​परीक्षणों के परिणाम दिखाता है। दस्त के सापेक्ष जोखिम का अनुमान लगाने के लिए 95% विश्वास अंतराल का उपयोग किया गया था। काले वर्ग का आकार सूचना की मात्रा के समानुपाती होता है। इसके अलावा, उपचार प्रभावकारिता का एक सारांश अनुमान और 95% विश्वास अंतराल (एक हीरे द्वारा इंगित) दिखाया गया है। मेटा-विश्लेषण ने एक यादृच्छिक-प्रभाव मॉडल का उपयोग किया जो कुछ पूर्व-स्थापित मॉडल से अधिक है; उदाहरण के लिए, यह नमूना आकार की गणना में उपयोग किया जाने वाला आकार हो सकता है। अधिक कड़े मानदंड के तहत, सीआई की पूरी श्रृंखला को एक पूर्व निर्धारित न्यूनतम से अधिक लाभ दिखाना चाहिए।

हम पहले ही सांख्यिकीय महत्व की अनुपस्थिति को एक संकेत के रूप में लेने की भ्रांति पर चर्चा कर चुके हैं कि दो उपचार समान रूप से प्रभावी हैं। नैदानिक ​​​​महत्व के साथ सांख्यिकीय महत्व की बराबरी नहीं करना भी उतना ही महत्वपूर्ण है। नैदानिक ​​​​महत्व को तब माना जा सकता है जब परिणाम सांख्यिकीय रूप से महत्वपूर्ण हो और उपचार प्रतिक्रिया का परिमाण हो

अध्ययन दिखा सकते हैं कि क्या परिणाम सांख्यिकीय रूप से महत्वपूर्ण हैं और कौन से चिकित्सकीय रूप से महत्वपूर्ण हैं और कौन से नहीं हैं। अंजीर पर। A1.2 चार परीक्षणों के परिणाम दिखाता है जिसके लिए संपूर्ण CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

इस लेख से आप सीखेंगे:

    क्या विश्वास अंतराल?

    क्या बात है 3 सिग्मा नियम?

    इस ज्ञान को कैसे व्यवहार में लाया जा सकता है?

आजकल, उत्पादों, बिक्री निर्देशों, कर्मचारियों, गतिविधियों आदि के एक बड़े वर्गीकरण से जुड़ी सूचनाओं की अधिकता के कारण, मुख्य चुनना मुश्किल है, जो, सबसे पहले, ध्यान देने योग्य है और प्रबंधन के लिए प्रयास करने योग्य है। परिभाषा विश्वास अंतरालऔर वास्तविक मूल्यों की अपनी सीमाओं से परे जाने का विश्लेषण - एक ऐसी तकनीक जो स्थितियों की पहचान करने में आपकी सहायता करें, प्रवृत्तियों को प्रभावित करना।आप सकारात्मक कारकों को विकसित करने और नकारात्मक कारकों के प्रभाव को कम करने में सक्षम होंगे। इस तकनीक का इस्तेमाल दुनिया की कई नामी कंपनियों में किया जाता है।

तथाकथित हैं अलर्ट", कौन सा प्रबंधकों को सूचित करेंयह बताते हुए कि एक निश्चित दिशा में अगला मान परे चला गया विश्वास अंतराल. इसका क्या मतलब है? यह एक संकेत है कि कुछ गैर-मानक घटना हुई है, जो इस दिशा में मौजूदा प्रवृत्ति को बदल सकती है। यह संकेत हैउस के लिए इसका समाधान करेंस्थिति में और समझें कि इससे क्या प्रभावित हुआ।

उदाहरण के लिए, कई स्थितियों पर विचार करें। हमने 2011 के लिए 100 कमोडिटी वस्तुओं के लिए पूर्वानुमान सीमाओं के साथ बिक्री पूर्वानुमान की गणना महीनों और मार्च में वास्तविक बिक्री के लिए की है:

  1. "सूरजमुखी के तेल" के लिए वे पूर्वानुमान की ऊपरी सीमा को पार कर गए और विश्वास अंतराल में नहीं आए।
  2. "सूखी खमीर" के लिए पूर्वानुमान की निचली सीमा से आगे निकल गया।
  3. "दलिया दलिया" पर ऊपरी सीमा के माध्यम से तोड़ दिया।

बाकी सामानों के लिए, वास्तविक बिक्री निर्दिष्ट पूर्वानुमान सीमा के भीतर थी। वे। उनकी बिक्री उम्मीदों के अनुरूप रही। इसलिए, हमने 3 उत्पादों की पहचान की जो सीमाओं से परे गए, और यह पता लगाना शुरू किया कि सीमाओं से परे जाने पर क्या प्रभाव पड़ा:

  1. सूरजमुखी के तेल के साथ, हमने एक नए व्यापारिक नेटवर्क में प्रवेश किया, जिससे हमें अतिरिक्त बिक्री की मात्रा मिली, जिससे ऊपरी सीमा से आगे निकल गया। इस उत्पाद के लिए, इस श्रृंखला की बिक्री के पूर्वानुमान को ध्यान में रखते हुए, वर्ष के अंत तक पूर्वानुमान की पुनर्गणना करना उचित है।
  2. ड्राई यीस्ट के लिए कार कस्टम पर फंस गई और 5 दिनों के भीतर ही कमी हो गई, जिससे बिक्री में गिरावट और निचली सीमा से आगे जाने पर असर पड़ा। यह पता लगाना सार्थक हो सकता है कि क्या कारण है और इस स्थिति को दोहराने की कोशिश न करें।
  3. ओटमील के लिए, एक बिक्री प्रचार शुरू किया गया था, जिसके परिणामस्वरूप बिक्री में उल्लेखनीय वृद्धि हुई और पूर्वानुमान की अधिकता हुई।

हमने 3 कारकों की पहचान की जो पूर्वानुमान के ओवरशूट को प्रभावित करते थे। जीवन में उनमें से कई और हो सकते हैं। पूर्वानुमान और योजना की सटीकता में सुधार करने के लिए, कारक जो इस तथ्य की ओर ले जाते हैं कि वास्तविक बिक्री पूर्वानुमान से परे जा सकती है, यह उनके लिए अलग से पूर्वानुमान और योजनाओं को उजागर करने और बनाने के लायक है। और फिर मुख्य बिक्री पूर्वानुमान पर उनके प्रभाव को ध्यान में रखें। आप इन कारकों के प्रभाव का नियमित रूप से मूल्यांकन भी कर सकते हैं और स्थिति को बेहतर के लिए बदल सकते हैं नकारात्मक के प्रभाव को कम करके और सकारात्मक कारकों के प्रभाव को बढ़ाकर.

विश्वास अंतराल के साथ, हम यह कर सकते हैं:

  1. गंतव्यों को हाइलाइट करें, जो ध्यान देने योग्य हैं, क्योंकि इन क्षेत्रों में ऐसी घटनाएं हुई हैं जो प्रभावित कर सकती हैं प्रवृत्ति में परिवर्तन.
  2. कारक निर्धारित करेंजो वास्तव में फर्क करते हैं।
  3. मंजूर करना भारित निर्णय(उदाहरण के लिए, खरीद के बारे में, योजना बनाते समय, आदि)।

अब आइए देखें कि एक कॉन्फिडेंस इंटरवल क्या है और एक उदाहरण का उपयोग करके एक्सेल में इसकी गणना कैसे करें।

कॉन्फिडेंस इंटरवल क्या है?

विश्वास अंतराल पूर्वानुमान सीमाएं (ऊपरी और निचला) है, जिसके भीतर दी गई प्रायिकता (सिग्मा) के साथवास्तविक मान प्राप्त करें।

वे। हम पूर्वानुमान की गणना करते हैं - यह हमारा मुख्य बेंचमार्क है, लेकिन हम समझते हैं कि वास्तविक मूल्य हमारे पूर्वानुमान के बराबर 100% होने की संभावना नहीं है। और सवाल उठता है किस हद तकवास्तविक मूल्य प्राप्त कर सकते हैं, अगर मौजूदा रुझान जारी रहा? और यह सवाल हमें जवाब देने में मदद करेगा आत्मविश्वास अंतराल गणना, अर्थात। - पूर्वानुमान की ऊपरी और निचली सीमा।

दी गई प्रायिकता सिग्मा क्या है?

गणना करते समयविश्वास अंतराल हम कर सकते हैं संभावना सेट करें हिट्सवास्तविक मूल्य दी गई पूर्वानुमान सीमा के भीतर. यह कैसे करना है? ऐसा करने के लिए, हम सिग्मा का मान निर्धारित करते हैं और, यदि सिग्मा इसके बराबर है:

    3 सिग्मा- फिर, कॉन्फिडेंस इंटरवल में अगले वास्तविक मान को हिट करने की संभावना 99.7%, या 300 से 1 होगी, या सीमाओं से परे जाने की 0.3% संभावना है।

    2 सिग्मा- फिर, सीमाओं के भीतर अगले मान से टकराने की संभावना ≈ 95.5% है, अर्थात। ऑड्स लगभग 20 से 1 हैं, या सीमा से बाहर जाने की 4.5% संभावना है।

    1 सिग्मा- तो, ​​प्रायिकता 68.3% है, अर्थात। संभावना लगभग 2 से 1 है, या 31.7% संभावना है कि अगला मान कॉन्फिडेंस इंटरवल से बाहर हो जाएगा।

हमने तैयार किया 3 सिग्मा नियम,जो कहता है कि हिट संभावनाएक और यादृच्छिक मूल्य विश्वास अंतराल मेंदिए गए मान के साथ थ्री सिग्मा 99.7% है.

महान रूसी गणितज्ञ चेबीशेव ने एक प्रमेय साबित किया कि तीन सिग्मा के दिए गए मूल्य के साथ पूर्वानुमान की सीमाओं से परे जाने का 10% मौका है। वे। 3 सिग्मा विश्वास अंतराल में गिरने की संभावना कम से कम 90% होगी, जबकि पूर्वानुमान और इसकी सीमाओं की "आंख से" गणना करने का प्रयास बहुत अधिक महत्वपूर्ण त्रुटियों से भरा है।

एक्सेल में आत्मविश्वास अंतराल की स्वतंत्र रूप से गणना कैसे करें?

आइए एक उदाहरण का उपयोग करके एक्सेल (यानी पूर्वानुमान की ऊपरी और निचली सीमा) में विश्वास अंतराल की गणना पर विचार करें। हमारे पास एक समय श्रृंखला है - 5 वर्षों के लिए महीनों तक बिक्री। संलग्न फाइल देखें।

पूर्वानुमान की सीमाओं की गणना करने के लिए, हम गणना करते हैं:

  1. बिक्री पूर्वानुमान().
  2. सिग्मा - मानक विचलनवास्तविक मूल्यों से पूर्वानुमान मॉडल।
  3. तीन सिग्मा।
  4. विश्वास अंतराल।

1. बिक्री पूर्वानुमान।

=(आरसी[-14] (समय श्रृंखला में डेटा)-आरसी [-1] (मॉडल मूल्य))^2(वर्ग)


3. प्रत्येक महीने के लिए चरण 8 से विचलन मान योग((Xi-Ximod)^2), अर्थात। आइए प्रत्येक वर्ष के लिए जनवरी, फरवरी... का योग करें।

ऐसा करने के लिए, सूत्र का उपयोग करें =SUMIF()

SUMIF(चक्र के अंदर की अवधियों की संख्या के साथ सरणी (1 से 12 तक के महीनों के लिए); चक्र में अवधि की संख्या के संदर्भ में; प्रारंभिक डेटा और के मूल्यों के बीच अंतर के वर्गों के साथ एक सरणी का संदर्भ अवधि)


4. चक्र में प्रत्येक अवधि के लिए 1 से 12 तक मानक विचलन की गणना करें (चरण 10 .) संलग्न फाइल में).

ऐसा करने के लिए, चरण 9 में गणना किए गए मान से, हम रूट निकालते हैं और इस चक्र में अवधियों की संख्या से विभाजित करते हैं माइनस 1 = ROOT((Sum(Xi-Ximod)^2/(n-1))

आइए एक्सेल में सूत्रों का उपयोग करें =रूट(R8 .) (संदर्भ (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (चक्र संख्याओं के साथ एक सरणी का संदर्भ); O8 (एक विशिष्ट चक्र संख्या का संदर्भ, जिसे हम सरणी में मानते हैं))-1))

एक्सेल सूत्र का उपयोग करना = COUNTIFहम संख्या n . गिनते हैं


पूर्वानुमान मॉडल से वास्तविक डेटा के मानक विचलन की गणना करके, हमने प्रत्येक माह के लिए सिग्मा मान प्राप्त किया - चरण 10 संलग्न फाइल में ।

3. 3 सिग्मा की गणना करें।

चरण 11 में, हम सिग्मा की संख्या निर्धारित करते हैं - हमारे उदाहरण में, "3" (चरण 11 .) संलग्न फाइल में):

इसके अलावा व्यावहारिक सिग्मा मूल्य:

1.64 सिग्मा - सीमा से अधिक जाने की 10% संभावना (10 में 1 मौका);

1.96 सिग्मा - सीमा से बाहर जाने का 5% मौका (20 में 1 मौका);

2.6 सिग्मा - सीमा से बाहर जाने का 1% मौका (100 में से 1 मौका)।

5) हम तीन सिग्मा की गणना करते हैं, इसके लिए हम प्रत्येक माह के लिए "सिग्मा" मानों को "3" से गुणा करते हैं।

3. विश्वास अंतराल निर्धारित करें।

  1. ऊपरी पूर्वानुमान सीमा- वृद्धि और मौसमी + (प्लस) 3 सिग्मा को ध्यान में रखते हुए बिक्री पूर्वानुमान;
  2. कम पूर्वानुमान बाध्य- विकास और मौसमी को ध्यान में रखते हुए बिक्री पूर्वानुमान - (माइनस) 3 सिग्मा;

लंबी अवधि के लिए विश्वास अंतराल की गणना की सुविधा के लिए (संलग्न फ़ाइल देखें), हम एक्सेल सूत्र का उपयोग करते हैं =Y8+VLOOKUP(W8;$U$8:$V$19;2;0), कहाँ पे

Y8- बिक्री पूर्वानुमान;

W8- उस महीने की संख्या जिसके लिए हम 3 सिग्मा का मान लेंगे;

वे। ऊपरी पूर्वानुमान सीमा= "बिक्री पूर्वानुमान" + "3 सिग्मा" (उदाहरण में, VLOOKUP(महीने की संख्या; 3 सिग्मा मानों वाली तालिका; कॉलम जिसमें से हम संबंधित पंक्ति में महीने की संख्या के बराबर सिग्मा मान निकालते हैं; 0))।

कम पूर्वानुमान बाध्य= "बिक्री पूर्वानुमान" घटा "3 सिग्मा"।

इसलिए, हमने एक्सेल में कॉन्फिडेंस इंटरवल की गणना की है।

अब हमारे पास एक पूर्वानुमान और सीमाओं के साथ एक सीमा है जिसके भीतर वास्तविक मान दिए गए प्रायिकता सिग्मा के साथ गिरेंगे।

इस लेख में, हमने देखा कि सिग्मा और थ्री सिग्मा नियम क्या हैं, एक आत्मविश्वास अंतराल कैसे निर्धारित करें, और व्यवहार में आप इस तकनीक का क्या उपयोग कर सकते हैं।

सटीक पूर्वानुमान और आपको सफलता!

कैसे पूर्वानुमान4एसी प्रो आपकी मदद कर सकता हैविश्वास अंतराल की गणना करते समय?:

    पूर्वानुमान4एसी प्रो स्वचालित रूप से एक ही समय में 1000 से अधिक समय श्रृंखला के लिए ऊपरी या निचली पूर्वानुमान सीमाओं की गणना करेगा;

    एक कीस्ट्रोक के साथ चार्ट पर पूर्वानुमान, प्रवृत्ति और वास्तविक बिक्री की तुलना में पूर्वानुमान की सीमाओं का विश्लेषण करने की क्षमता;

Forcast4AC PRO प्रोग्राम में, सिग्मा मान को 1 से 3 तक सेट करना संभव है।

हमसे जुड़ें!

फ्री फोरकास्टिंग और बिजनेस इंटेलिजेंस ऐप्स डाउनलोड करें:


  • नोवो पूर्वानुमान लाइट- स्वचालित पूर्वानुमान गणनामें एक्सेल.
  • 4एनालिटिक्स- एबीसी-एक्सवाईजेड विश्लेषणऔर उत्सर्जन का विश्लेषण एक्सेल।
  • क्लिक सेंसडेस्कटॉप और QlikViewव्यक्तिगत संस्करण - डेटा विश्लेषण और विज़ुअलाइज़ेशन के लिए बीआई सिस्टम।

सशुल्क समाधानों की सुविधाओं का परीक्षण करें:

  • नोवो पूर्वानुमान प्रो- बड़े डेटा सरणियों के लिए एक्सेल में पूर्वानुमान।