असतत संभावना वितरण। असतत यादृच्छिक चर का द्विपद वितरण

विदेशी नामों के बावजूद, सामान्य वितरण काफी सहज और एक दूसरे से संबंधित हैं दिलचस्प तरीकेजिससे उन्हें याद रखना और आत्मविश्वास से उनके बारे में बात करना आसान हो जाता है। कुछ स्वाभाविक रूप से अनुसरण करते हैं, उदाहरण के लिए, बर्नौली वितरण से। इन कनेक्शनों का नक्शा दिखाने का समय आ गया है।

प्रत्येक वितरण को उसके वितरण घनत्व फलन (DDF) के उदाहरण द्वारा दर्शाया गया है। यह लेख केवल उन वितरणों के बारे में है जिनके परिणाम − . हैं एकल संख्या. इसलिए, क्षैतिज अक्षप्रत्येक ग्राफ संभावित संख्या-परिणामों का एक समूह है। लंबवत - प्रत्येक परिणाम की संभावना। कुछ वितरण असतत हैं - उनके परिणाम पूर्णांक होने चाहिए, जैसे कि 0 या 5। ये विरल रेखाओं द्वारा इंगित किए जाते हैं, प्रत्येक परिणाम के लिए एक, इस परिणाम की संभावना के अनुरूप ऊंचाई के साथ। कुछ निरंतर हैं, उनके परिणाम कोई भी ले सकते हैं अंकीय मूल्य, जैसे -1.32 या 0.005। इन्हें घने वक्रों के रूप में दिखाया जाता है, जिनमें वक्र के अनुभागों के नीचे के क्षेत्र होते हैं जो संभावनाएं देते हैं। वक्रों के नीचे की रेखाओं और क्षेत्रों की ऊंचाई का योग हमेशा 1 होता है।

इसे प्रिंट करें, बिंदीदार रेखा के साथ काटें, और इसे अपने बटुए में अपने साथ रखें। यह वितरण के देश और उनके रिश्तेदारों के लिए आपका मार्गदर्शक है।

बर्नौली और वर्दी

आप ऊपर दिए गए बर्नौली वितरण को पहले ही दो परिणामों के साथ पूरा कर चुके हैं - शीर्ष या पूंछ। अब इसे 0 और 1, 0 पर चित और 1 पट होने के वितरण के रूप में कल्पना करें। जैसा कि पहले से ही स्पष्ट है, दोनों परिणाम समान रूप से होने की संभावना है, और यह आरेख में परिलक्षित होता है। बर्नौली पीडीएफ में दो लाइनें हैं एक ही ऊंचाई 2 समान रूप से संभावित परिणामों का प्रतिनिधित्व करते हैं: क्रमशः 0 और 1,।

बर्नौली वितरण असमान परिणामों का भी प्रतिनिधित्व कर सकता है, जैसे कि गलत सिक्का उछालना। तब हेड्स की प्रायिकता 0.5 नहीं होगी, बल्कि कुछ अन्य मान p होगी, और टेल्स की प्रायिकता 1-p होगी। कई अन्य वितरणों की तरह, यह वास्तव में कुछ मापदंडों को दिए गए वितरण का एक पूरा परिवार है, जैसे कि p ऊपर। जब आप "बर्नौली" सोचते हैं - "एक (संभवतः गलत) सिक्का उछालने" के बारे में सोचें।

इसलिए बहुत छोटा कदमकई संभावित परिणामों पर वितरण प्रस्तुत करने से पहले: एक समान वितरण एक फ्लैट पीडीएफ द्वारा विशेषता। सही का प्रतिनिधित्व करें पासा. उसके परिणाम 1-6 समान रूप से संभावित हैं। इसे किसी भी परिणाम n के लिए सेट किया जा सकता है, और यहां तक ​​कि एक सतत वितरण के रूप में भी।

के बारे में सोचो वर्दी वितरणएक "सही पासा" के रूप में।

द्विपद और हाइपरजोमेट्रिक

द्विपद वितरण को उन चीजों के परिणामों के योग के रूप में माना जा सकता है जो बर्नौली वितरण का अनुसरण करते हैं।

एक ईमानदार सिक्के को दो बार पलटें - यह कितनी बार चित होगा? यह एक संख्या है जो द्विपद बंटन का पालन करती है। इसके पैरामीटर n हैं, परीक्षणों की संख्या, और p "सफलता" की संभावना है (हमारे मामले में, शीर्ष या 1)। प्रत्येक रोल एक बर्नौली वितरित परिणाम, या परीक्षण है। उपयोग द्विपद वितरणजब एक सिक्का उछालने जैसी चीजों में सफलताओं की संख्या गिनते हैं, जहां प्रत्येक टॉस दूसरों से स्वतंत्र होता है और सफलता की समान संभावना होती है।

या एक कलश की कल्पना करें जिसमें समान संख्या में सफेद और काली गेंदें हों। अपनी आँखें बंद करो, गेंद को बाहर खींचो, उसका रंग लिखो और उसे वापस लौटा दो। दोहराना। काली गेंद कितनी बार खींची गई है? यह संख्या द्विपद बंटन का भी अनुसरण करती है।

यह अजीब स्थितिहमने हाइपरज्यामितीय वितरण के अर्थ को समझना आसान बनाने के लिए परिचय दिया है। यह उसी संख्या का बंटन है, लेकिन ऐसी स्थिति में यदि हम नहींगेंदों को वापस करो। यह निश्चित रूप से चचेरा भाईद्विपद बंटन, लेकिन समान नहीं, क्योंकि प्रत्येक गेंद निकालने के साथ सफलता की संभावना बदल जाती है। यदि ड्रॉ की संख्या की तुलना में गेंदों की संख्या काफी बड़ी है, तो ये वितरण लगभग समान हैं, क्योंकि सफलता की संभावना प्रत्येक ड्रॉ के साथ बहुत कम बदलती है।

जब कोई बिना वापस आए कलशों से गेंदों को निकालने की बात करता है, तो "हाँ, हाइपरज्यामितीय वितरण" कहना लगभग हमेशा सुरक्षित होता है, क्योंकि अपने जीवन में मैं अभी तक किसी ऐसे व्यक्ति से नहीं मिला हूँ जो वास्तव में कलशों को गेंदों से भर दे और फिर उन्हें बाहर निकाल कर वापस लौट आए। उन्हें, या इसके विपरीत। कलशों से मेरा कोई मित्र भी नहीं है। और भी अधिक बार, यह वितरण तब सामने आना चाहिए जब नमूने के रूप में कुछ सामान्य आबादी का एक महत्वपूर्ण उपसमुच्चय चुनते हैं।

टिप्पणी। अनुवाद

यह यहाँ बहुत स्पष्ट नहीं हो सकता है, लेकिन शुरुआती लोगों के लिए ट्यूटोरियल और एक्सप्रेस कोर्स के बाद से, इसे समझाना आवश्यक होगा। जनसंख्या एक ऐसी चीज है जिसका हम सांख्यिकीय रूप से मूल्यांकन करना चाहते हैं। अनुमान लगाने के लिए, हम एक निश्चित भाग (सबसेट) का चयन करते हैं और उस पर आवश्यक अनुमान लगाते हैं (तब इस उपसमुच्चय को एक नमूना कहा जाता है), यह मानते हुए कि अनुमान पूरी आबादी के लिए समान होगा। लेकिन यह सच होने के लिए, नमूने के सबसेट की परिभाषा पर अक्सर अतिरिक्त प्रतिबंधों की आवश्यकता होती है (या इसके विपरीत, एक ज्ञात नमूने से, हमें यह मूल्यांकन करने की आवश्यकता है कि क्या यह जनसंख्या का सटीक रूप से पर्याप्त वर्णन करता है)।

एक व्यावहारिक उदाहरण - हमें E3 की यात्रा करने के लिए 100 लोगों की कंपनी से प्रतिनिधियों का चयन करने की आवश्यकता है। मालूम हो कि पिछले साल इसमें 10 लोग यात्रा कर चुके हैं (लेकिन किसी की पहचान नहीं है)। कम से कम कितना लेना चाहिए ताकि कम से कम एक अनुभवी कॉमरेड के समूह में होने की संभावना हो? पर इस मामले में आबादी- 100, चयन - 10, चयन आवश्यकताएँ - कम से कम एक जो पहले ही E3 की यात्रा कर चुका है।

विकिपीडिया में एक बैच में दोषपूर्ण भागों के बारे में कम मज़ेदार लेकिन अधिक व्यावहारिक उदाहरण है।

प्वाइजन

कॉल करने वाले ग्राहकों की संख्या के बारे में क्या हॉटलाइनहर मिनट तकनीकी सहायता के लिए? यह एक परिणाम है जिसका वितरण पहली नज़र में द्विपद है, अगर हम हर सेकंड को बर्नौली परीक्षण के रूप में मानते हैं, जिसके दौरान ग्राहक या तो कॉल नहीं करता है (0) या कॉल नहीं करता है (1)। लेकिन बिजली आपूर्ति संगठन अच्छी तरह से जानते हैं: जब बिजली बंद हो जाती है, तो दो लोग एक सेकंड में कॉल कर सकते हैं। या सौ से भी अधिकलोगों का। इसे 60,000 मिलीसेकंड परीक्षणों के रूप में प्रस्तुत करना या तो मदद नहीं करता है - अधिक परीक्षण हैं, प्रति मिलीसेकंड कॉल की संभावना कम है, भले ही आप एक ही समय में दो या अधिक की गणना न करें, लेकिन, तकनीकी रूप से, यह अभी भी एक नहीं है बर्नौली परीक्षण। हालांकि, तार्किक तर्क अनंत में संक्रमण के साथ काम करता है। मान लीजिए n अनंत तक जाता है और p 0 पर जाता है, ताकि np स्थिर रहे। यह कॉल की कम और कम संभावना के साथ समय के छोटे और छोटे अंशों में विभाजित करने जैसा है। सीमा में, हमें पॉइसन वितरण मिलता है।

द्विपद वितरण की तरह, पॉइसन वितरण एक मात्रा वितरण है: जितनी बार कुछ होता है। यह प्रायिकता p और परीक्षणों की संख्या n द्वारा नहीं, बल्कि औसत तीव्रता द्वारा पैरामीट्रिज्ड है, जो कि द्विपद के अनुरूप है, बस है नियत मानएन.पी. पॉइसन वितरण क्या है ज़रूरीयाद रखें जब घटनाओं की गिनती की बात आती है कुछ समयनिरंतर दी गई तीव्रता पर।

जब राउटर पर पैकेट आने या स्टोर में आने वाले ग्राहक या लाइन में कुछ इंतजार करने जैसा कुछ होता है, तो पॉइसन के बारे में सोचें।

ज्यामितीय और ऋणात्मक द्विपद

से सरल परीक्षणबर्नौली एक और वितरण प्रतीत होता है। कोई सिक्का चित आने से पहले कितनी बार पट आता है? पूंछ की संख्या एक ज्यामितीय वितरण का अनुसरण करती है। बर्नौली वितरण की तरह, यह एक सफल परिणाम की संभावना से पैरामीट्रिज्ड है, पी। यह संख्या n, परीक्षणों की संख्या से पैरामीट्रिज्ड नहीं है, क्योंकि असफल परीक्षणों की संख्या ठीक परिणाम है।

यदि द्विपद वितरण "कितनी सफलताएँ" है, तो ज्यामितीय वितरण "सफलता से पहले कितनी विफलताएँ हैं?"।

ऋणात्मक द्विपद बंटन पिछले द्विपद बंटन का सरल सामान्यीकरण है। यह r होने से पहले विफलताओं की संख्या है, 1 नहीं, सफलताएँ। इसलिए, यह अतिरिक्त रूप से इस r द्वारा parametrized है। इसे कभी-कभी r विफलताओं से पहले सफलताओं की संख्या के रूप में वर्णित किया जाता है। लेकिन, जैसा कि मेरे जीवन के कोच कहते हैं: "आप तय करते हैं कि सफलता क्या है और विफलता क्या है", तो यह वही है, अगर आप यह नहीं भूलते हैं कि संभावना पी भी होनी चाहिए सही संभावनाक्रमशः सफलता या असफलता।

यदि आपको तनाव को दूर करने के लिए एक चुटकुला की आवश्यकता है, तो आप उल्लेख कर सकते हैं कि द्विपद और हाइपरजोमेट्रिक वितरण एक स्पष्ट जोड़ी हैं, लेकिन ज्यामितीय और नकारात्मक द्विपद वितरण भी काफी समान हैं, और फिर बताएं "अच्छा, उन सभी को कौन कहता है, हुह? "

घातीय और वेइबुल

तकनीकी सहायता के लिए कॉल के बारे में फिर से: अगली कॉल से पहले कितना समय लगेगा? इस प्रतीक्षा समय का वितरण ज्यामितीय प्रतीत होता है, क्योंकि हर सेकंड जब तक कोई कॉल नहीं करता तब तक विफलता की तरह होता है, जब तक कि कॉल अंत में न हो जाए। विफलताओं की संख्या सेकंड की संख्या की तरह है जब तक कि किसी ने कॉल नहीं किया, और यह है वास्तव मेंअगली कॉल तक का समय, लेकिन "व्यावहारिक रूप से" हमारे लिए पर्याप्त नहीं है। लब्बोलुआब यह है कि यह समय पूरे सेकंड का योग होगा, और इस प्रकार इस सेकंड के भीतर कॉल तक प्रतीक्षा की गणना करना संभव नहीं होगा।

खैर, पहले की तरह, हम जाते हैं ज्यामितीय वितरणसीमा तक, समय के शेयरों के संबंध में - और वोइला। हमें एक घातीय वितरण मिलता है, जो कॉल से पहले के समय का सटीक वर्णन करता है। ये है निरंतर वितरण, हमारे पास पहला है, क्योंकि जरूरी नहीं कि परिणाम पूरे सेकंड में हो। पोइसन वितरण की तरह, यह तीव्रता द्वारा पैरामीट्रिज्ड है।

द्विपद और ज्यामितीय के बीच संबंध को प्रतिध्वनित करते हुए, पॉइसन के "एक समय में कितनी घटनाएं?" घातांक "घटना से कितने समय पहले?" से संबंधित है। यदि ऐसी घटनाएँ हैं जिनकी संख्या प्रति इकाई समय पॉइसन वितरण का पालन करती है, तो उनके बीच का समय समान पैरामीटर के साथ घातीय वितरण का पालन करता है। दो वितरणों के बीच इस पत्राचार पर ध्यान दिया जाना चाहिए जब किसी पर चर्चा की जाए।

"घटना का समय", शायद "विफलता का समय" के बारे में सोचते समय घातीय वितरण को ध्यान में रखना चाहिए। वास्तव में, यह इतनी महत्वपूर्ण स्थिति है कि एमटीबीएफ का वर्णन करने के लिए अधिक सामान्यीकृत वितरण हैं, जैसे कि वेइबुल वितरण। जबकि घातीय वितरण उपयुक्त होता है, जब पहनने या विफलता दर, उदाहरण के लिए, स्थिर, वीबुल वितरण समय के साथ बढ़ती (या घटती) विफलता दर का मॉडल कर सकता है। घातीय, सामान्य तौर पर, एक विशेष मामला।

जब एमटीबीएफ की बात आती है तो वेइबुल के बारे में सोचें।

नॉर्मल, लॉगनॉर्मल, स्टूडेंट और ची-स्क्वायर

सामान्य, या गाऊसी, वितरण शायद सबसे महत्वपूर्ण में से एक है। इसकी घंटी के आकार की आकृति तुरंत पहचानने योग्य है। जैसे, यह एक विशेष रूप से जिज्ञासु इकाई है जो हर जगह प्रकट होती है, यहाँ तक कि सबसे बाहरी रूप से भी सरल स्रोत. मूल्यों का एक सेट लें जो समान वितरण का पालन करते हैं - कोई भी! - और उन्हें मोड़ो। उनकी राशि का वितरण (लगभग) के अधीन है सामान्य वितरण. जितनी अधिक चीजों को संक्षेप में प्रस्तुत किया जाता है, उनकी राशि एक सामान्य वितरण से मेल खाती है (चाल: शब्दों का वितरण अनुमानित होना चाहिए, स्वतंत्र होना चाहिए, यह केवल सामान्य होता है)। ऐसा है, मूल वितरण के बावजूद, आश्चर्यजनक है।

टिप्पणी। अनुवाद

मुझे आश्चर्य हुआ कि लेखक तुलनीय वितरण के तुलनीय पैमाने की आवश्यकता के बारे में नहीं लिखता है: यदि कोई दूसरों पर महत्वपूर्ण रूप से हावी है, तो यह बहुत बुरी तरह से अभिसरण करेगा। और, सामान्य तौर पर, पूर्ण पारस्परिक स्वतंत्रता आवश्यक नहीं है, एक कमजोर निर्भरता पर्याप्त है।

खैर, यह शायद पार्टियों के लिए है, जैसा कि उन्होंने लिखा था।


इसे "केंद्रीय सीमा प्रमेय" कहा जाता है, और आपको यह जानना होगा कि यह क्या है, इसे क्यों कहा जाता है और इसका क्या अर्थ है, अन्यथा वे तुरंत इस पर हंसेंगे।

इसके संदर्भ में, सामान्य सभी वितरणों से संबंधित है। हालांकि, मूल रूप से, यह सभी राशियों के वितरण से जुड़ा है। बर्नौली परीक्षणों का योग एक द्विपद वितरण का अनुसरण करता है और, जैसे-जैसे परीक्षणों की संख्या बढ़ती है, यह द्विपद वितरण एक सामान्य वितरण के करीब और करीब होता जाता है। इसी तरह, इसका चचेरा भाई हाइपरजोमेट्रिक वितरण है। पोइसन वितरण - द्विपद का सीमित रूप - भी तीव्रता के बढ़ते पैरामीटर के साथ सामान्य तक पहुंचता है।

एक लॉगअसामान्य वितरण का अनुसरण करने वाले परिणाम वे मान देते हैं जिनका लघुगणक सामान्य रूप से वितरित होता है। या किसी अन्य तरीके से: सामान्य रूप से वितरित मूल्य के घातांक को सामान्य रूप से वितरित किया जाता है। यदि रकम सामान्य रूप से वितरित की जाती है, तो यह भी याद रखें कि उत्पादों को सामान्य रूप से वितरित किया जाता है।

विद्यार्थी का टी-वितरण टी-टेस्ट का आधार है, जिसका अध्ययन कई गैर-सांख्यिकीविद अन्य क्षेत्रों में करते हैं। इसका उपयोग सामान्य वितरण के माध्य के बारे में अनुमान लगाने के लिए किया जाता है और इसके पैरामीटर बढ़ने पर सामान्य वितरण की ओर भी जाता है। विशेष फ़ीचरटी-वितरण इसकी पूंछ है, जो सामान्य वितरण की तुलना में अधिक मोटी होती है।

यदि मोटी पूंछ वाले किस्से ने आपके पड़ोसी को पर्याप्त रूप से हिला नहीं दिया है, तो बीयर की एक मज़ेदार कहानी पर आगे बढ़ें। 100 साल पहले, गिनीज ने अपने कद को सुधारने के लिए आंकड़ों का इस्तेमाल किया। तब विलियम सीली गॉसेट ने एक पूरी तरह से नया आविष्कार किया सांख्यिकीय सिद्धांतजौ की उन्नत खेती के लिए। गॉसेट ने बॉस को आश्वस्त किया कि अन्य शराब बनाने वाले यह नहीं समझ पाएंगे कि उनके विचारों का उपयोग कैसे किया जाए और इसे प्रकाशित करने की अनुमति मिल गई, लेकिन छद्म नाम "छात्र" के तहत। ज़्यादातर प्रसिद्ध उपलब्धिगॉसेट बस यही टी-वितरण है, जिसे कोई कह सकता है, उसके नाम पर रखा गया है।

अंत में, ची-स्क्वायर वितरण सामान्य रूप से वितरित मात्राओं के वर्गों के योग का वितरण है। इस वितरण पर एक ची-स्क्वायर परीक्षण बनाया गया है, जो स्वयं वर्ग अंतर के योग पर आधारित है, जिसे सामान्य रूप से वितरित किया जाना चाहिए।

गामा और बीटा

इस बिंदु पर, यदि आप पहले से ही कुछ ची-स्क्वायर के बारे में बात कर रहे हैं, तो बातचीत गंभीरता से शुरू होती है। आप शायद पहले से ही वास्तविक सांख्यिकीविदों से बात कर रहे हैं, और शायद यह पहले से ही झुकने लायक है, क्योंकि गामा वितरण जैसी चीजें सामने आ सकती हैं। यह एक सामान्यीकरण है औरघातीय औरची-वर्ग वितरण। घातीय वितरण की तरह, इसका उपयोग जटिल विलंबता मॉडल के लिए किया जाता है। उदाहरण के लिए, गामा वितरण तब प्रकट होता है जब अगली n घटनाओं का समय सिम्युलेटेड होता है। में दिखाई देता है यंत्र अधिगमकुछ अन्य वितरणों के लिए "संयुग्म पूर्व" के रूप में।

इन संयुग्म वितरणों के बारे में बातचीत में शामिल न हों, लेकिन यदि आप ऐसा करते हैं, तो बीटा वितरण का उल्लेख करना न भूलें, क्योंकि यह यहां बताए गए अधिकांश वितरणों से पहले का संयुग्म है। डेटा वैज्ञानिकों को यकीन है कि यह वही है जिसके लिए इसे बनाया गया था। अनजाने में इसका उल्लेख करें और दरवाजे पर जाएं।

बुद्धि की शुरुआत

संभाव्यता वितरण कुछ ऐसा है जिसके बारे में आप बहुत अधिक नहीं जान सकते हैं। वास्तव में रुचि रखने वाले सभी संभाव्यता वितरणों के इस सुपर-विस्तृत मानचित्र का उल्लेख कर सकते हैं टैग जोड़ें

उनके विदेशी नामों के बावजूद, सामान्य वितरण एक-दूसरे से इस तरह से संबंधित हैं जो सहज और दिलचस्प हैं जिससे उन्हें याद रखना और आत्मविश्वास के साथ बात करना आसान हो जाता है। कुछ स्वाभाविक रूप से अनुसरण करते हैं, उदाहरण के लिए, बर्नौली वितरण से। इन कनेक्शनों का नक्शा दिखाने का समय आ गया है।

प्रत्येक वितरण को उसके वितरण घनत्व फलन (DDF) के उदाहरण द्वारा दर्शाया गया है। यह आलेख केवल उन वितरणों के बारे में है जिनके परिणाम एकल संख्याएं हैं। इसलिए, प्रत्येक ग्राफ का क्षैतिज अक्ष संभावित संख्या-परिणामों का एक समूह है। लंबवत - प्रत्येक परिणाम की संभावना। कुछ वितरण असतत हैं - उनके परिणाम पूर्णांक होने चाहिए, जैसे कि 0 या 5। ये विरल रेखाओं द्वारा इंगित किए जाते हैं, प्रत्येक परिणाम के लिए एक, इस परिणाम की संभावना के अनुरूप ऊंचाई के साथ। कुछ निरंतर हैं, उनके परिणाम किसी भी संख्यात्मक मान पर ले सकते हैं, जैसे -1.32 या 0.005। इन्हें घने वक्रों के रूप में दिखाया जाता है, जिनमें वक्र के अनुभागों के नीचे के क्षेत्र होते हैं जो संभावनाएं देते हैं। वक्रों के नीचे की रेखाओं और क्षेत्रों की ऊंचाई का योग हमेशा 1 होता है।

इसे प्रिंट करें, बिंदीदार रेखा के साथ काटें, और इसे अपने बटुए में अपने साथ रखें। यह वितरण के देश और उनके रिश्तेदारों के लिए आपका मार्गदर्शक है।

बर्नौली और वर्दी

आप ऊपर दिए गए बर्नौली वितरण को पहले ही दो परिणामों के साथ पूरा कर चुके हैं - शीर्ष या पूंछ। अब इसे 0 और 1, 0 पर चित और 1 पट होने के वितरण के रूप में कल्पना करें। जैसा कि पहले से ही स्पष्ट है, दोनों परिणाम समान रूप से होने की संभावना है, और यह आरेख में परिलक्षित होता है। बर्नौली एफपीआर में समान ऊंचाई की दो रेखाएं होती हैं, जो 2 समान रूप से संभावित परिणामों का प्रतिनिधित्व करती हैं: क्रमशः 0 और 1,।

बर्नौली वितरण असमान परिणामों का भी प्रतिनिधित्व कर सकता है, जैसे कि गलत सिक्का उछालना। तब हेड्स की प्रायिकता 0.5 नहीं होगी, बल्कि कुछ अन्य मान p होगी, और टेल्स की प्रायिकता 1-p होगी। कई अन्य वितरणों की तरह, यह वास्तव में कुछ मापदंडों को दिए गए वितरण का एक पूरा परिवार है, जैसे कि p ऊपर। जब आप "बर्नौली" सोचते हैं - "एक (संभवतः गलत) सिक्का उछालने" के बारे में सोचें।

यहां से यह कई सम-संभाव्य परिणामों पर वितरण प्रस्तुत करने के लिए एक बहुत छोटा कदम है: एक फ्लैट पीडीएफ द्वारा विशेषता एक समान वितरण। सही पासे की कल्पना करो। उसके परिणाम 1-6 समान रूप से संभावित हैं। इसे किसी भी परिणाम n के लिए सेट किया जा सकता है, और यहां तक ​​कि एक सतत वितरण के रूप में भी।

एक समान वितरण को "सही पासा" के रूप में सोचें।

द्विपद और हाइपरजोमेट्रिक

द्विपद वितरण को उन चीजों के परिणामों के योग के रूप में माना जा सकता है जो बर्नौली वितरण का अनुसरण करते हैं।

एक ईमानदार सिक्के को दो बार पलटें - यह कितनी बार चित होगा? यह एक संख्या है जो द्विपद बंटन का पालन करती है। इसके पैरामीटर n हैं, परीक्षणों की संख्या, और p "सफलता" की संभावना है (हमारे मामले में, शीर्ष या 1)। प्रत्येक रोल एक बर्नौली वितरित परिणाम, या परीक्षण है। एक सिक्का उछालने जैसी चीजों में सफलताओं की संख्या गिनते समय द्विपद बंटन का उपयोग करें, जहां प्रत्येक टॉस दूसरों से स्वतंत्र होता है और सफलता की समान संभावना होती है।

या एक कलश की कल्पना करें जिसमें समान संख्या में सफेद और काली गेंदें हों। अपनी आँखें बंद करो, गेंद को बाहर खींचो, उसका रंग लिखो और उसे वापस लौटा दो। दोहराना। काली गेंद कितनी बार खींची गई है? यह संख्या द्विपद बंटन का भी अनुसरण करती है।

हमने हाइपरज्यामितीय वितरण के अर्थ को समझना आसान बनाने के लिए इस अजीब स्थिति को प्रस्तुत किया। यह उसी संख्या का बंटन है, लेकिन ऐसी स्थिति में यदि हम नहींगेंदों को वापस करो। यह निश्चित रूप से द्विपद वितरण का एक चचेरा भाई है, लेकिन समान नहीं है, क्योंकि प्रत्येक गेंद के साथ सफलता की संभावना बदल जाती है। यदि ड्रॉ की संख्या की तुलना में गेंदों की संख्या काफी बड़ी है, तो ये वितरण लगभग समान हैं, क्योंकि प्रत्येक ड्रॉ के साथ सफलता की संभावना बहुत कम बदलती है।

जब कोई बिना वापस आए कलशों से गेंदों को निकालने की बात करता है, तो "हाँ, हाइपरज्यामितीय वितरण" कहना लगभग हमेशा सुरक्षित होता है, क्योंकि अपने जीवन में मैं अभी तक किसी ऐसे व्यक्ति से नहीं मिला हूँ जो वास्तव में कलशों को गेंदों से भर दे और फिर उन्हें बाहर निकाल कर वापस लौट आए। उन्हें, या इसके विपरीत। कलशों से मेरा कोई मित्र भी नहीं है। और भी अधिक बार, यह वितरण तब सामने आना चाहिए जब नमूने के रूप में कुछ सामान्य आबादी का एक महत्वपूर्ण उपसमुच्चय चुनते हैं।

टिप्पणी। अनुवाद

यह यहाँ बहुत स्पष्ट नहीं हो सकता है, लेकिन शुरुआती लोगों के लिए ट्यूटोरियल और एक्सप्रेस कोर्स के बाद से, इसे समझाना आवश्यक होगा। जनसंख्या एक ऐसी चीज है जिसका हम सांख्यिकीय रूप से मूल्यांकन करना चाहते हैं। अनुमान लगाने के लिए, हम एक निश्चित भाग (सबसेट) का चयन करते हैं और उस पर आवश्यक अनुमान लगाते हैं (तब इस उपसमुच्चय को एक नमूना कहा जाता है), यह मानते हुए कि अनुमान पूरी आबादी के लिए समान होगा। लेकिन यह सच होने के लिए, नमूने के सबसेट की परिभाषा पर अक्सर अतिरिक्त प्रतिबंधों की आवश्यकता होती है (या इसके विपरीत, एक ज्ञात नमूने से, हमें यह मूल्यांकन करने की आवश्यकता है कि क्या यह जनसंख्या का सटीक रूप से पर्याप्त वर्णन करता है)।

एक व्यावहारिक उदाहरण - हमें E3 की यात्रा करने के लिए 100 लोगों की कंपनी से प्रतिनिधियों का चयन करने की आवश्यकता है। मालूम हो कि पिछले साल इसमें 10 लोग यात्रा कर चुके हैं (लेकिन किसी की पहचान नहीं है)। कम से कम कितना लेना चाहिए ताकि कम से कम एक अनुभवी कॉमरेड के समूह में होने की संभावना हो? इस मामले में, जनसंख्या 100 है, नमूना 10 है, और नमूना आवश्यकताएं कम से कम एक हैं जो पहले से ही E3 पर सवार हैं।

विकिपीडिया में एक बैच में दोषपूर्ण भागों के बारे में कम मज़ेदार लेकिन अधिक व्यावहारिक उदाहरण है।

प्वाइजन

हर मिनट तकनीकी सहायता हॉटलाइन पर कॉल करने वाले ग्राहकों की संख्या के बारे में क्या? यह एक परिणाम है जिसका वितरण पहली नज़र में द्विपद है, अगर हम हर सेकंड को बर्नौली परीक्षण के रूप में मानते हैं, जिसके दौरान ग्राहक या तो कॉल नहीं करता है (0) या कॉल नहीं करता है (1)। लेकिन बिजली आपूर्ति संगठन अच्छी तरह से जानते हैं: जब बिजली बंद हो जाती है, तो दो लोग एक सेकंड में कॉल कर सकते हैं। या सौ से भी अधिकलोगों का। इसे 60,000 मिलीसेकंड परीक्षणों के रूप में प्रस्तुत करना या तो मदद नहीं करता है - अधिक परीक्षण हैं, प्रति मिलीसेकंड कॉल की संभावना कम है, भले ही आप एक ही समय में दो या अधिक की गणना न करें, लेकिन, तकनीकी रूप से, यह अभी भी एक नहीं है बर्नौली परीक्षण। हालांकि, तार्किक तर्क अनंत में संक्रमण के साथ काम करता है। मान लीजिए n अनंत तक जाता है और p 0 पर जाता है, ताकि np स्थिर रहे। यह कॉल की कम और कम संभावना के साथ समय के छोटे और छोटे अंशों में विभाजित करने जैसा है। सीमा में, हमें पॉइसन वितरण मिलता है।

द्विपद वितरण की तरह, पॉइसन वितरण एक मात्रा वितरण है: जितनी बार कुछ होता है। यह प्रायिकता p और परीक्षणों की संख्या n द्वारा नहीं, बल्कि औसत तीव्रता द्वारा पैरामीट्रिज्ड है, जो कि द्विपद के अनुरूप है, बस np का एक स्थिर मान है। पॉइसन वितरण क्या है ज़रूरीयाद रखें कि जब एक निश्चित समय के लिए एक निश्चित तीव्रता पर घटनाओं को गिनने की बात आती है।

जब राउटर पर पैकेट आने या स्टोर में आने वाले ग्राहक या लाइन में कुछ इंतजार करने जैसा कुछ होता है, तो पॉइसन के बारे में सोचें।

ज्यामितीय और ऋणात्मक द्विपद

सरल बर्नौली परीक्षणों से, एक और वितरण उभर कर आता है। कोई सिक्का चित आने से पहले कितनी बार पट आता है? पूंछ की संख्या एक ज्यामितीय वितरण का अनुसरण करती है। बर्नौली वितरण की तरह, यह एक सफल परिणाम की संभावना से पैरामीट्रिज्ड है, पी। यह संख्या n, परीक्षणों की संख्या से पैरामीट्रिज्ड नहीं है, क्योंकि असफल परीक्षणों की संख्या ठीक परिणाम है।

यदि द्विपद वितरण "कितनी सफलताएँ" है, तो ज्यामितीय वितरण "सफलता से पहले कितनी विफलताएँ हैं?"।

ऋणात्मक द्विपद बंटन पिछले द्विपद बंटन का सरल सामान्यीकरण है। यह r होने से पहले विफलताओं की संख्या है, 1 नहीं, सफलताएँ। इसलिए, यह अतिरिक्त रूप से इस r द्वारा parametrized है। इसे कभी-कभी r विफलताओं से पहले सफलताओं की संख्या के रूप में वर्णित किया जाता है। लेकिन, जैसा कि मेरे जीवन के कोच कहते हैं: "आप तय करते हैं कि सफलता क्या है और असफलता क्या है", तो यह वही है, अगर आप यह नहीं भूलते हैं कि संभावना पी भी क्रमशः सफलता या विफलता की सही संभावना होनी चाहिए।

यदि आपको तनाव को दूर करने के लिए एक चुटकुला की आवश्यकता है, तो आप उल्लेख कर सकते हैं कि द्विपद और हाइपरजोमेट्रिक वितरण एक स्पष्ट जोड़ी हैं, लेकिन ज्यामितीय और नकारात्मक द्विपद वितरण भी काफी समान हैं, और फिर बताएं "अच्छा, उन सभी को कौन कहता है, हुह? "

घातीय और वेइबुल

तकनीकी सहायता के लिए कॉल के बारे में फिर से: अगली कॉल से पहले कितना समय लगेगा? इस प्रतीक्षा समय का वितरण ज्यामितीय प्रतीत होता है, क्योंकि हर सेकंड जब तक कोई कॉल नहीं करता तब तक विफलता की तरह होता है, जब तक कि कॉल अंत में न हो जाए। विफलताओं की संख्या सेकंड की संख्या की तरह है जब तक कि किसी ने कॉल नहीं किया, और यह है वास्तव मेंअगली कॉल तक का समय, लेकिन "व्यावहारिक रूप से" हमारे लिए पर्याप्त नहीं है। लब्बोलुआब यह है कि यह समय पूरे सेकंड का योग होगा, और इस प्रकार इस सेकंड के भीतर कॉल तक प्रतीक्षा की गणना करना संभव नहीं होगा।

ठीक है, पहले की तरह, हम समय के अंशों के संबंध में ज्यामितीय वितरण में सीमा तक गुजरते हैं - और वोइला। हमें एक घातीय वितरण मिलता है, जो कॉल से पहले के समय का सटीक वर्णन करता है। यह एक सतत वितरण है, हमारे पास पहला है, क्योंकि परिणाम पूरे सेकंड में जरूरी नहीं है। पोइसन वितरण की तरह, यह तीव्रता द्वारा पैरामीट्रिज्ड है।

द्विपद और ज्यामितीय के बीच संबंध को प्रतिध्वनित करते हुए, पॉइसन के "एक समय में कितनी घटनाएं?" घातांक "घटना से कितने समय पहले?" से संबंधित है। यदि ऐसी घटनाएँ हैं जिनकी संख्या प्रति इकाई समय पॉइसन वितरण का पालन करती है, तो उनके बीच का समय समान पैरामीटर के साथ घातीय वितरण का पालन करता है। दो वितरणों के बीच इस पत्राचार पर ध्यान दिया जाना चाहिए जब किसी पर चर्चा की जाए।

"घटना का समय", शायद "विफलता का समय" के बारे में सोचते समय घातीय वितरण को ध्यान में रखना चाहिए। वास्तव में, यह इतनी महत्वपूर्ण स्थिति है कि एमटीबीएफ का वर्णन करने के लिए अधिक सामान्यीकृत वितरण हैं, जैसे कि वेइबुल वितरण। जबकि घातीय वितरण उपयुक्त होता है, जब पहनने या विफलता दर, उदाहरण के लिए, स्थिर, वीबुल वितरण समय के साथ बढ़ती (या घटती) विफलता दर का मॉडल कर सकता है। घातीय, सामान्य तौर पर, एक विशेष मामला।

जब एमटीबीएफ की बात आती है तो वेइबुल के बारे में सोचें।

नॉर्मल, लॉगनॉर्मल, स्टूडेंट और ची-स्क्वायर

सामान्य, या गाऊसी, वितरण शायद सबसे महत्वपूर्ण में से एक है। इसकी घंटी के आकार की आकृति तुरंत पहचानने योग्य है। जैसे, यह एक विशेष रूप से जिज्ञासु इकाई है जो हर जगह खुद को प्रकट करती है, यहां तक ​​​​कि सबसे सरल स्रोतों से भी। मूल्यों का एक सेट लें जो समान वितरण का पालन करते हैं - कोई भी! - और उन्हें मोड़ो। उनके योग का वितरण एक (लगभग) सामान्य वितरण का अनुसरण करता है। जितनी अधिक चीजों को संक्षेप में प्रस्तुत किया जाता है, उनकी राशि एक सामान्य वितरण से मेल खाती है (चाल: शब्दों का वितरण अनुमानित होना चाहिए, स्वतंत्र होना चाहिए, यह केवल सामान्य होता है)। ऐसा है, मूल वितरण के बावजूद, आश्चर्यजनक है।

टिप्पणी। अनुवाद

मुझे आश्चर्य हुआ कि लेखक तुलनीय वितरण के तुलनीय पैमाने की आवश्यकता के बारे में नहीं लिखता है: यदि कोई दूसरों पर महत्वपूर्ण रूप से हावी है, तो यह बहुत बुरी तरह से अभिसरण करेगा। और, सामान्य तौर पर, पूर्ण पारस्परिक स्वतंत्रता आवश्यक नहीं है, एक कमजोर निर्भरता पर्याप्त है।

खैर, यह शायद पार्टियों के लिए है, जैसा कि उन्होंने लिखा था।


इसे "केंद्रीय सीमा प्रमेय" कहा जाता है, और आपको यह जानना होगा कि यह क्या है, इसे क्यों कहा जाता है और इसका क्या अर्थ है, अन्यथा वे तुरंत इस पर हंसेंगे।

इसके संदर्भ में, सामान्य सभी वितरणों से संबंधित है। हालांकि, मूल रूप से, यह सभी राशियों के वितरण से जुड़ा है। बर्नौली परीक्षणों का योग एक द्विपद वितरण का अनुसरण करता है और, जैसे-जैसे परीक्षणों की संख्या बढ़ती है, यह द्विपद वितरण एक सामान्य वितरण के करीब और करीब होता जाता है। इसी तरह, इसका चचेरा भाई हाइपरजोमेट्रिक वितरण है। पोइसन वितरण - द्विपद का सीमित रूप - भी तीव्रता के बढ़ते पैरामीटर के साथ सामान्य तक पहुंचता है।

एक लॉगअसामान्य वितरण का अनुसरण करने वाले परिणाम वे मान देते हैं जिनका लघुगणक सामान्य रूप से वितरित होता है। या किसी अन्य तरीके से: सामान्य रूप से वितरित मूल्य के घातांक को सामान्य रूप से वितरित किया जाता है। यदि रकम सामान्य रूप से वितरित की जाती है, तो यह भी याद रखें कि उत्पादों को सामान्य रूप से वितरित किया जाता है।

विद्यार्थी का टी-वितरण टी-टेस्ट का आधार है, जिसका अध्ययन कई गैर-सांख्यिकीविद अन्य क्षेत्रों में करते हैं। इसका उपयोग सामान्य वितरण के माध्य के बारे में अनुमान लगाने के लिए किया जाता है और इसके पैरामीटर बढ़ने पर सामान्य वितरण की ओर भी जाता है। टी-वितरण की एक विशिष्ट विशेषता इसकी पूंछ है, जो सामान्य वितरण की तुलना में अधिक मोटी होती है।

यदि मोटी पूंछ वाले किस्से ने आपके पड़ोसी को पर्याप्त रूप से हिला नहीं दिया है, तो बीयर की एक मज़ेदार कहानी पर आगे बढ़ें। 100 साल पहले, गिनीज ने अपने कद को सुधारने के लिए आंकड़ों का इस्तेमाल किया। यह तब था जब विलियम सीली गोसेट ने जौ की बेहतर खेती के लिए एक पूरी तरह से नए सांख्यिकीय सिद्धांत का आविष्कार किया था। गॉसेट ने बॉस को आश्वस्त किया कि अन्य शराब बनाने वाले यह नहीं समझ पाएंगे कि उनके विचारों का उपयोग कैसे किया जाए और इसे प्रकाशित करने की अनुमति मिल गई, लेकिन छद्म नाम "छात्र" के तहत। गॉसेट की सबसे प्रसिद्ध उपलब्धि ठीक यही टी-वितरण है, जिसे कोई कह सकता है, उनके नाम पर रखा गया है।

अंत में, ची-स्क्वायर वितरण सामान्य रूप से वितरित मात्राओं के वर्गों के योग का वितरण है। इस वितरण पर एक ची-स्क्वायर परीक्षण बनाया गया है, जो स्वयं वर्ग अंतर के योग पर आधारित है, जिसे सामान्य रूप से वितरित किया जाना चाहिए।

गामा और बीटा

इस बिंदु पर, यदि आप पहले से ही कुछ ची-स्क्वायर के बारे में बात कर रहे हैं, तो बातचीत गंभीरता से शुरू होती है। आप शायद पहले से ही वास्तविक सांख्यिकीविदों से बात कर रहे हैं, और शायद यह पहले से ही झुकने लायक है, क्योंकि गामा वितरण जैसी चीजें सामने आ सकती हैं। यह एक सामान्यीकरण है औरघातीय औरची-वर्ग वितरण। घातीय वितरण की तरह, इसका उपयोग जटिल विलंबता मॉडल के लिए किया जाता है। उदाहरण के लिए, गामा वितरण तब प्रकट होता है जब अगली n घटनाओं का समय सिम्युलेटेड होता है। यह मशीन लर्निंग में कुछ अन्य वितरणों के लिए "आसन्न पूर्व" के रूप में प्रकट होता है।

इन संयुग्म वितरणों के बारे में बातचीत में शामिल न हों, लेकिन यदि आप ऐसा करते हैं, तो बीटा वितरण का उल्लेख करना न भूलें, क्योंकि यह यहां बताए गए अधिकांश वितरणों से पहले का संयुग्म है। डेटा वैज्ञानिकों को यकीन है कि यह वही है जिसके लिए इसे बनाया गया था। अनजाने में इसका उल्लेख करें और दरवाजे पर जाएं।

बुद्धि की शुरुआत

संभाव्यता वितरण कुछ ऐसा है जिसके बारे में आप बहुत अधिक नहीं जान सकते हैं। वास्तव में रुचि रखने वाले सभी संभाव्यता वितरणों के इस सुपर-विस्तृत मानचित्र का उल्लेख कर सकते हैं टैग जोड़ें

यादृच्छिक घटनाक्या कोई तथ्य है कि, एक परीक्षण के परिणामस्वरूप, हो सकता है या नहीं भी हो सकता है। यादृच्छिक घटनापरीक्षा परिणाम है। परीक्षण- यह एक प्रयोग है, शर्तों के एक निश्चित सेट की पूर्ति जिसमें एक या दूसरी घटना देखी जाती है, एक या दूसरा परिणाम दर्ज किया जाता है।

घटनाओं को लैटिन वर्णमाला ए, बी, सी के बड़े अक्षरों द्वारा दर्शाया गया है।

किसी घटना के घटित होने की संभावना की वस्तुनिष्ठता की डिग्री के एक संख्यात्मक माप को कहा जाता है एक यादृच्छिक घटना की संभावना।

क्लासिक परिभाषाघटना ए की संभावनाएं:

किसी घटना A की प्रायिकता घटना A(m) से के अनुकूल मामलों की संख्या के अनुपात के बराबर है कुल गणनामामले (एन)।

सांख्यिकीय परिभाषासंभावनाओं

सापेक्ष घटना आवृत्तिवास्तव में किए गए परीक्षणों का अनुपात है जिसमें घटना ए दिखाई दी डब्ल्यू = पी * (ए) = एम / एन। यह एक प्रायोगिक प्रायोगिक विशेषता है, जहां m उन प्रयोगों की संख्या है जिनमें घटना A प्रकट हुई; n किए गए सभी प्रयोगों की संख्या है।

किसी घटना की प्रायिकतावह संख्या जिसके चारों ओर आवृत्ति मानों को समूहीकृत किया जाता है, कहलाती है यह आयोजनविभिन्न श्रृंखलाओं में एक लंबी संख्यापरीक्षण पी (ए) =।

घटनाओं को कहा जाता है असंगतयदि उनमें से एक की घटना दूसरे की उपस्थिति को बाहर करती है। अन्यथा, घटनाएं संयुक्त.

जोड़दो घटनाएँ एक घटना है जिसमें इनमें से कम से कम एक घटना (ए या बी) प्रकट होती है।

यदि ए और बी संयुक्तघटनाओं, तो उनका योग ए + बी घटना ए या घटना बी, या दोनों घटनाओं की एक साथ घटना को दर्शाता है।

यदि ए और बी असंगतघटना, तो योग ए + बी का अर्थ है घटना ए या घटना बी की घटना।

2. आश्रित और स्वतंत्र घटनाओं की अवधारणा। सशर्त संभाव्यता, संभावनाओं के गुणन का नियम (प्रमेय)। बेयस सूत्र।

घटना बी कहा जाता है स्वतंत्रघटना ए से, यदि घटना ए की घटना घटना बी की घटना की संभावना को नहीं बदलती है। कई घटनाओं की संभावना स्वतंत्रघटनाएँ इनकी प्रायिकताओं के गुणनफल के बराबर होती हैं:

पी (एबी) = पी (ए) * पी (बी)

के लिए आश्रितआयोजन:

पी (एबी) = पी (ए) * पी (बी / ए)।

दो घटनाओं के गुणनफल की प्रायिकता उनमें से एक की प्रायिकता के गुणनफल के बराबर होती है सशर्त संभाव्यतादूसरा, इस धारणा के तहत पाया गया कि पहली घटना हुई थी।

सशर्त संभाव्यताघटना बी घटना बी की संभावना है, इस शर्त के तहत पाया गया कि घटना ए हुई है। नामित पी(बी/ए)

कार्यदो घटनाएं एक घटना है जिसमें इन घटनाओं (ए और बी) की संयुक्त घटना शामिल है

बेयस सूत्र का उपयोग यादृच्छिक घटनाओं का पुनर्मूल्यांकन करने के लिए किया जाता है

पी(एच/ए) = (पी(एच)*पी(ए/एच))/पी(ए)

P(H) - घटना H . की प्राथमिक संभावना

P(H/A) परिकल्पना H की पश्च प्रायिकता है, बशर्ते कि घटना A पहले ही घटित हो चुकी हो

पी (ए / एच) - विशेषज्ञ निर्णय

पी(ए) - घटना ए की पूरी संभावना

3. असतत और निरंतर यादृच्छिक चर और उनकी विशेषताओं का वितरण: गणितीय अपेक्षा, विचरण, मानक विचलन। सतत यादृच्छिक चर के वितरण का सामान्य नियम।

यादृच्छिक मूल्य- यह वह मान है, जो परीक्षण के परिणामस्वरूप, मामले के आधार पर, इसके मूल्यों के संभावित सेट में से एक लेता है।

अलग यादृच्छिक मूल्य यह एक यादृच्छिक चर है जब यह मूल्यों का एक अलग, पृथक, गणनीय सेट लेता है।

सतत यादृच्छिक चरएक यादृच्छिक चर है जो एक निश्चित अंतराल से कोई मान लेता है। एक सतत यादृच्छिक चर की अवधारणा मापन के दौरान उत्पन्न होती है।

असतत के लिएयादृच्छिक चर, वितरण कानून के रूप में दिया जा सकता है टेबल, विश्लेषणात्मक रूप से (एक सूत्र के रूप में), और रेखांकन.

टेबलवितरण कानून स्थापित करने का यह सबसे सरल रूप है

आवश्यकताएं:

असतत यादृच्छिक चर के लिए

विश्लेषणात्मक:

1)एफ(एक्स)=पी(एक्स

वितरण फलन = संचयी बंटन फलन। असतत और निरंतर यादृच्छिक चर के लिए।

2)एफ(एक्स) = एफ'(एक्स)

प्रायिकता घनत्व = केवल एक सतत यादृच्छिक चर के लिए विभेदक वितरण फलन।

ग्राफिक:

एस-वा: 1) 0≤F(x)≤1

2) असतत यादृच्छिक चर के लिए गैर-घटता

एस-वीए: 1) एफ(एक्स)≥0 पी(एक्स)=

2) क्षेत्र एस = 1

निरंतर यादृच्छिक चर के लिए

विशेषताएँ:

1. गणितीय अपेक्षा - औसत सबसे संभावित घटना

असतत यादृच्छिक चर के लिए।

निरंतर यादृच्छिक चर के लिए।

2) प्रकीर्णन - गणितीय अपेक्षा के इर्दगिर्द प्रकीर्णन

असतत यादृच्छिक चर के लिए:

डी(एक्स)=एक्स आई-एम(एक्स)) 2 *पी आई

निरंतर यादृच्छिक चर के लिए:

डी (एक्स) = एक्स-एम (एक्स)) 2 * एफ (एक्स) डीएक्स

3) मानक विचलन:

(एक्स)=√(डी(एक्स))

- मानक विचलन या मानक

x इसके प्रसरण के वर्गमूल का अंकगणितीय मान है

सामान्य वितरण कानून (NZR) - गाऊसी कानून

आईआरआर एक सतत यादृच्छिक चर का संभाव्यता क्षय है, जिसे एक अंतर फ़ंक्शन द्वारा वर्णित किया जाता है

खंड 6. विशिष्ट वितरण कानून और यादृच्छिक चर की संख्यात्मक विशेषताएं

फलन F(x), p(x), या गणना p(x i) के रूप को यादृच्छिक चर का वितरण नियम कहा जाता है। जबकि कोई अनंत प्रकार के यादृच्छिक चर की कल्पना कर सकता है, वितरण के बहुत कम नियम हैं। सबसे पहले, विभिन्न यादृच्छिक चर में समान वितरण कानून हो सकते हैं। उदाहरण के लिए: y को प्रायिकता 0.5 के साथ केवल 2 मान 1 और -1 लेने दें; मान z = -y का वितरण नियम बिल्कुल समान है।
दूसरे, बहुत बार यादृच्छिक चरों में समान वितरण नियम होते हैं, उदाहरण के लिए, उनके लिए p(x) एक ही रूप के सूत्रों द्वारा व्यक्त किया जाता है, केवल एक या अधिक स्थिरांक में भिन्न होता है। इन स्थिरांकों को वितरण पैरामीटर कहा जाता है।

हालांकि सिद्धांत रूप में वितरण के कई प्रकार के कानून संभव हैं, यहां कुछ सबसे विशिष्ट कानूनों पर विचार किया जाएगा। उन स्थितियों पर ध्यान देना महत्वपूर्ण है जिनके तहत वे उत्पन्न होते हैं, इन वितरणों के पैरामीटर और गुण।

एक । वर्दी वितरण
यह एक यादृच्छिक चर के वितरण का नाम है जो अंतराल (ए, बी) में कोई भी मान ले सकता है, और (ए, बी) के अंदर किसी भी खंड में गिरने की संभावना खंड की लंबाई के समानुपाती होती है और इसकी स्थिति पर निर्भर नहीं करता है, और (ए, बी) के बाहर मूल्यों की संभावना 0 के बराबर है।


चित्र 6.1 एकसमान बंटन का फलन और घनत्व

वितरण पैरामीटर: ए, बी

2. सामान्य वितरण
सूत्र द्वारा वर्णित घनत्व के साथ वितरण

(6.1)

सामान्य कहा जाता है।
वितरण पैरामीटर: ए,


चित्र 6.2 घनत्व और सामान्य वितरण फलन का विशिष्ट दृश्य

3. बर्नौली वितरण
यदि स्वतंत्र परीक्षणों की एक श्रृंखला बनाई जाती है, जिनमें से प्रत्येक घटना में ए समान संभावना पी के साथ प्रकट हो सकता है, तो घटना की घटनाओं की संख्या बर्नौली कानून के अनुसार या द्विपद कानून के अनुसार वितरित एक यादृच्छिक चर है। (दूसरा वितरण नाम).

यहाँ n श्रृंखला में परीक्षणों की संख्या है, m एक यादृच्छिक चर है (घटना A की घटनाओं की संख्या), P n (m) संभावना है कि A ठीक m बार होगा, q \u003d 1 - p (द संभावना है कि ए परीक्षण में उपस्थित नहीं होगा)।

उदाहरण 1 : एक पासे को 5 बार उछाला जाता है, एक 6 के दो बार लुढ़कने की प्रायिकता क्या है?
n=5, m=2, p=1/6, q=5/6

वितरण पैरामीटर: एन, पी

4. पॉसों वितरण
पॉइसन वितरण बर्नौली वितरण के एक सीमित मामले के रूप में प्राप्त किया जाता है यदि पी शून्य की ओर जाता है और n अनंत तक जाता है, लेकिन इस तरह से कि उनका उत्पाद स्थिर रहता है: np = a। औपचारिक रूप से, सीमा तक ऐसा मार्ग सूत्र की ओर ले जाता है

वितरण पैरामीटर: ए

पॉइसन वितरण विज्ञान और व्यावहारिक जीवन में कई यादृच्छिक चर के अधीन है।

उदाहरण 2: एक घंटे में एम्बुलेंस स्टेशन पर प्राप्त कॉलों की संख्या।
आइए हम समय अंतराल T (1 घंटा) को छोटे अंतराल dt में विभाजित करें, जैसे कि dt के दौरान दो या अधिक कॉल प्राप्त करने की संभावना नगण्य है, और एक कॉल p की संभावना dt: p = μdt के समानुपाती है;
हम क्षणों के दौरान अवलोकन पर विचार करेंगे dt स्वतंत्र परीक्षण के रूप में, समय के दौरान ऐसे परीक्षणों की संख्या T: n = T / dt;
यदि हम मानते हैं कि कॉल प्राप्त करने की संभावनाएं एक घंटे के भीतर नहीं बदलती हैं, तो कॉल की कुल संख्या बर्नौली कानून का पालन मापदंडों के साथ करती है: n = T / dt, p = μdt। dt को शून्य की ओर रखते हुए, हम पाते हैं कि n अनंत की ओर जाता है, और उत्पाद n × p स्थिर रहता है: a = n × p = μT।

उदाहरण 3: कुछ निश्चित आयतन V में आदर्श गैस के अणुओं की संख्या।
आइए हम आयतन V को छोटे आयतन dV में इस प्रकार विभाजित करें कि dV में दो या दो से अधिक अणुओं के मिलने की संभावना न के बराबर हो, और एक अणु को खोजने की संभावना dV के समानुपाती हो: р = μdV; हम प्रत्येक खंड dV के अवलोकन को एक स्वतंत्र परीक्षण के रूप में मानेंगे, ऐसे परीक्षणों की संख्या n=V/dV है; यदि हम यह मान लें कि V के भीतर कहीं भी अणु खोजने की प्रायिकताएँ समान हैं, तो आयतन V में अणुओं की कुल संख्या बर्नौली के नियम का पालन मापदंडों के साथ करती है: n = V / dV, p = μdV। dV को शून्य होने देते हुए, हम पाते हैं कि n अनंत की ओर जाता है, और उत्पाद n × p स्थिर रहता है: a = n × p = μV।

यादृच्छिक चर की संख्यात्मक विशेषताएं

एक । गणितीय अपेक्षा (औसत मूल्य)

परिभाषा:
गणितीय अपेक्षा है
  (6.4)

योग उन सभी मानों पर लिया जाता है जो यादृच्छिक चर लेता है। श्रृंखला पूरी तरह से अभिसरण होनी चाहिए (अन्यथा, यादृच्छिक चर कहा जाता है कि कोई गणितीय अपेक्षा नहीं है)

;   (6.5)

अभिन्न बिल्कुल अभिसरण होना चाहिए (अन्यथा यादृच्छिक चर के लिए कोई अपेक्षित मूल्य नहीं कहा जाता है)


गणितीय अपेक्षा के गुण:

ए। यदि C एक स्थिर मान है, तो MC = C
बी। एमएक्स = एसएमएक्स
सी। यादृच्छिक चरों के योग की गणितीय अपेक्षा हमेशा उनकी गणितीय अपेक्षाओं के योग के बराबर होती है: (х+y) = Мх + Мy d । सशर्त गणितीय अपेक्षा की अवधारणा पेश की गई है। यदि एक यादृच्छिक चर अपने मान x i को विभिन्न संभावनाओं के साथ लेता है p(x i /H j) विभिन्न परिस्थितियों में H j , तो सशर्त अपेक्षा निर्धारित की जाती है

जैसा या ;   (6.6)

यदि घटनाओं की प्रायिकताएँ H j ज्ञात हों, तो पूर्ण

अपेक्षित मूल्य: ;   (6.7)

उदाहरण 4: हथियारों के पहले कोट के प्रकट होने से पहले आपको औसतन कितनी बार एक सिक्के को उछालने की आवश्यकता है? इस समस्या को हल किया जा सकता है "माथे पर"

एक्स मैं 1 2 3 ... के..
पी(एक्स मैं) :  ,

लेकिन इस राशि की गणना अभी भी की जानी है। सशर्त और पूर्ण गणितीय अपेक्षा की अवधारणाओं का उपयोग करके आप इसे आसान कर सकते हैं। परिकल्पनाओं पर विचार करें एच 1 - हथियारों का कोट पहली बार गिर गया, एच 2 - यह पहली बार नहीं गिरा। जाहिर है, पी (एच 1) \u003d पी (एच 2) \u003d ½; एमएक्स / एच 1 \u003d 1;
एमएक्स / एच 2 वांछित पूर्ण अपेक्षा से 1 अधिक है, क्योंकि सिक्के के पहले उछाल के बाद, स्थिति नहीं बदली है, लेकिन एक बार इसे पहले ही उछाल दिया गया है। पूर्ण गणितीय अपेक्षा के सूत्र का उपयोग करते हुए, हमारे पास Mx \u003d Mx / H 1 × p (H 1) + Mx / H 2 × p (H 2) \u003d 1 × 0.5 + (Mx + 1) × 0.5, हल है। एमएक्स के लिए समीकरण, हम तुरंत एमएक्स = 2 प्राप्त करते हैं।

इ। यदि f(x) एक यादृच्छिक चर x का एक फलन है, तो एक यादृच्छिक चर के एक फलन की गणितीय अपेक्षा की अवधारणा को परिभाषित किया गया है:

असतत यादृच्छिक चर के लिए: ;   (6.8)

योग उन सभी मानों पर लिया जाता है जो यादृच्छिक चर लेता है। श्रृंखला बिल्कुल अभिसरण होनी चाहिए।

एक सतत यादृच्छिक चर के लिए: ;   (6.9)

अभिन्न बिल्कुल अभिसरण होना चाहिए।

2. यादृच्छिक चर का प्रसरण
परिभाषा:
एक यादृच्छिक चर x का फैलाव इसकी गणितीय अपेक्षा से मात्रा के मान के वर्ग विचलन की गणितीय अपेक्षा है: Dx = M(x-Mx) 2

असतत यादृच्छिक चर के लिए: ;   (6.10)

योग उन सभी मानों पर लिया जाता है जो यादृच्छिक चर लेता है। श्रृंखला अभिसरण होनी चाहिए (अन्यथा यादृच्छिक चर कहा जाता है कि कोई भिन्नता नहीं है)

एक सतत यादृच्छिक चर के लिए: ;   (6.11)

अभिन्न अभिसरण होना चाहिए (अन्यथा यादृच्छिक चर कहा जाता है कि कोई भिन्नता नहीं है)

फैलाव गुण:
ए। यदि C एक स्थिर मान है, तो DC = 0
बी। डीСх = С 2 डीх
सी। यादृच्छिक चरों के योग का प्रसरण हमेशा उनके प्रसरणों के योग के बराबर होता है, यदि ये चर स्वतंत्र हों (स्वतंत्र चर की परिभाषा)
डी। विचरण की गणना करने के लिए, सूत्र का उपयोग करना सुविधाजनक है:

डीएक्स = एमएक्स 2 - (एमएक्स) 2 (6.12)

संख्यात्मक विशेषताओं का संबंध
और विशिष्ट वितरण के पैरामीटर

वितरणविकल्पसूत्रएमएक्सडीएक्स
वर्दीए, बी (बी+ए) / 2(बी-ए) 2 / 12
सामान्यए, 2
Bernoulliएन, पी एनपीएनपीक्यू
प्वासों