द्विपद वितरण और इसके सीमित रूप। एक यादृच्छिक चर का द्विपद वितरण


बेशक, संचयी वितरण फ़ंक्शन की गणना करते समय, किसी को द्विपद और बीटा वितरण के बीच उल्लिखित संबंध का उपयोग करना चाहिए। यह विधि निश्चित रूप से प्रत्यक्ष योग से बेहतर है जब n> 10।

आँकड़ों पर शास्त्रीय पाठ्यपुस्तकों में, द्विपद वितरण के मूल्यों को प्राप्त करने के लिए, अक्सर सीमा प्रमेयों (जैसे मोइवर-लाप्लास सूत्र) के आधार पर सूत्रों का उपयोग करने की सिफारिश की जाती है। इस बात पे ध्यान दिया जाना चाहिए कि विशुद्ध रूप से कम्प्यूटेशनल दृष्टिकोण सेइन प्रमेयों का मान शून्य के करीब है, खासकर अब, जब लगभग हर टेबल पर एक शक्तिशाली कंप्यूटर होता है। उपरोक्त सन्निकटन का मुख्य दोष अधिकांश अनुप्रयोगों के लिए विशिष्ट n के मानों के लिए उनकी पूरी तरह से अपर्याप्त सटीकता है। कोई कम नुकसान एक या दूसरे सन्निकटन की प्रयोज्यता पर किसी भी स्पष्ट सिफारिशों की अनुपस्थिति है (मानक ग्रंथों में, केवल स्पर्शोन्मुख सूत्र दिए गए हैं, वे सटीकता अनुमानों के साथ नहीं हैं और इसलिए, बहुत कम उपयोग के हैं)। मैं कहूंगा कि दोनों सूत्र केवल n . के लिए मान्य हैं< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

मैं यहां मात्राओं को खोजने की समस्या पर विचार नहीं करता: असतत वितरण के लिए, यह तुच्छ है, और उन समस्याओं में जहां ऐसे वितरण उत्पन्न होते हैं, एक नियम के रूप में, यह प्रासंगिक नहीं है। यदि क्वांटाइल्स की अभी भी आवश्यकता है, तो मैं समस्या को इस तरह से सुधारने की सलाह देता हूं जैसे कि पी-वैल्यू (देखे गए महत्व) के साथ काम करना। यहां एक उदाहरण दिया गया है: कुछ गणना एल्गोरिदम को लागू करते समय, प्रत्येक चरण में द्विपद यादृच्छिक चर के बारे में सांख्यिकीय परिकल्पना की जांच करना आवश्यक है। शास्त्रीय दृष्टिकोण के अनुसार, प्रत्येक चरण में मानदंड के आंकड़ों की गणना करना और महत्वपूर्ण सेट की सीमा के साथ इसके मूल्य की तुलना करना आवश्यक है। चूंकि, हालांकि, एल्गोरिथ्म गणनात्मक है, इसलिए हर बार नए सिरे से महत्वपूर्ण सेट की सीमा निर्धारित करना आवश्यक है (आखिरकार, नमूना आकार चरण से चरण में बदलता है), जो अनुत्पादक रूप से समय की लागत को बढ़ाता है। आधुनिक दृष्टिकोण प्रेक्षित महत्व की गणना करने और इसकी तुलना आत्मविश्वास की संभावना के साथ करने की सलाह देता है, मात्राओं की खोज पर बचत करता है।

इसलिए, निम्नलिखित कोड व्युत्क्रम फ़ंक्शन की गणना नहीं करते हैं, इसके बजाय, फ़ंक्शन rev_binomialDF दिया जाता है, जो एकल परीक्षण में सफलता की संभावना p की गणना करता है, जिसमें परीक्षणों की संख्या n, उनमें सफलताओं की संख्या m और मान y दिया जाता है। इन m सफलताओं को प्राप्त करने की संभावना का। यह द्विपद और बीटा वितरण के बीच उपरोक्त संबंध का उपयोग करता है।

वास्तव में, यह फ़ंक्शन आपको विश्वास अंतराल की सीमाएं प्राप्त करने की अनुमति देता है। वास्तव में, मान लीजिए कि हमें n द्विपद परीक्षणों में m सफलताएँ प्राप्त होती हैं। जैसा कि ज्ञात है, पैरामीटर पी के लिए दो-तरफा आत्मविश्वास अंतराल की बाईं सीमा 0 है यदि एम = 0 है, और समीकरण का समाधान है . इसी तरह, दायां बाउंड 1 है यदि m = n, और के लिए समीकरण का हल है . इसका तात्पर्य यह है कि बाईं सीमा को खोजने के लिए, हमें समीकरण के लिए हल करना होगा , और सही खोजने के लिए - समीकरण . वे बिनोम_लेफ्टसीआई और बिनोम_राइटसीआई कार्यों में हल किए जाते हैं, जो क्रमशः दो-तरफा आत्मविश्वास अंतराल की ऊपरी और निचली सीमा लौटाते हैं।

मैं यह नोट करना चाहता हूं कि यदि बिल्कुल अविश्वसनीय सटीकता की आवश्यकता नहीं है, तो पर्याप्त रूप से बड़े n के लिए, आप निम्नलिखित सन्निकटन का उपयोग कर सकते हैं [बी.एल. वैन डेर वेर्डन, गणितीय सांख्यिकी। एम: आईएल, 1960, चौ। 2 सेकेंड्स। 7]: , जहां जी सामान्य वितरण की मात्रा है। इस सन्निकटन का मूल्य यह है कि बहुत ही सरल सन्निकटन हैं जो आपको सामान्य वितरण की मात्राओं की गणना करने की अनुमति देते हैं (सामान्य वितरण और इस संदर्भ के संबंधित अनुभाग की गणना के बारे में पाठ देखें)। मेरे अभ्यास में (मुख्य रूप से n> 100 के लिए), इस सन्निकटन ने लगभग 3-4 अंक दिए, जो एक नियम के रूप में, काफी है।

निम्नलिखित कोड के साथ गणना के लिए बीटाडीएफ.एच, बीटाडीएफ.सीपीपी (बीटा वितरण पर अनुभाग देखें), साथ ही logGamma.h , logGamma.cpp (परिशिष्ट ए देखें) फाइलों की आवश्यकता होती है। आप फ़ंक्शंस का उपयोग करने का एक उदाहरण भी देख सकते हैं।

द्विपद डीएफ.एच फ़ाइल

#ifndef __BINOMIAL_H__ #include "betaDF.h" डबल binomialDF(डबल ट्रायल, डबल सक्सेस, डबल पी); /* *स्वतंत्र टिप्पणियों के "परीक्षण" होने दें * प्रत्येक में सफलता की संभावना "पी" के साथ। * प्रायिकता बी (सफलताएं | परीक्षण, पी) की गणना करें कि सफलताओं की संख्या * 0 और "सफलताएं" (समावेशी) के बीच है। */ डबल रेव_बिनोमियलडीएफ (डबल ट्रायल, डबल सक्सेस, डबल वाई); /* * बर्नौली योजना के परीक्षणों में कम से कम m सफलताओं की प्रायिकता y ज्ञात होने दें। फ़ंक्शन एकल परीक्षण में सफलता की संभावना p * पाता है। * *निम्नलिखित संबंध का उपयोग गणनाओं में किया जाता है * * 1 - p = rev_Beta(परीक्षण-सफलताएं| */ डबल बिनोम_लेफ्टसीआई (डबल ट्रायल, डबल सक्सेस, डबल लेवल); /* स्वतंत्र प्रेक्षणों के "परीक्षण" होने दें * प्रत्येक में सफलता की संभावना "पी" के साथ * और सफलताओं की संख्या "सफलता" है। * दो तरफा विश्वास अंतराल की बाईं सीमा * की गणना महत्व स्तर के स्तर से की जाती है। */ डबल बिनोम_राइटसीआई (डबल एन, डबल सक्सेस, डबल लेवल); /* स्वतंत्र प्रेक्षणों के "परीक्षण" होने दें * प्रत्येक में सफलता की संभावना "पी" के साथ * और सफलताओं की संख्या "सफलता" है। *दो तरफा विश्वास अंतराल की दाहिनी सीमा* की गणना महत्व स्तर के स्तर से की जाती है। */ #endif /* समाप्त होता है #ifndef __BINOMIAL_H__ */

binomialDF.cpp फ़ाइल

/********************************* **** ***********//* द्विपद वितरण *//**************************** **** *****************************/ #शामिल करें #शामिल करना #include "betaDF.h" ENTRY double binomialDF(double n, double m, double p) /* * प्रत्येक में सफलता की प्रायिकता "p" के साथ "n" स्वतंत्र अवलोकन * होने दें। * प्रायिकता B(m|n,p) की गणना करें कि सफलताओं की संख्या * 0 और "m" (समावेशी) के बीच है, अर्थात। * 0 से m तक द्विपद प्रायिकताओं का योग: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * गणना का अर्थ गूंगा योग नहीं है - * केंद्रीय बीटा वितरण के साथ निम्नलिखित संबंध का उपयोग किया जाता है: * * B(m|n,p) = Beta(1-p|n-m,m+1)। * *तर्क सकारात्मक होने चाहिए, 0 . के साथ<= p <= 1. */ { assert((n >0) && (पी >= 0) && (पी<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= एन) वापसी 1; और बीटाडीएफ (एनएम, एम + 1) लौटाएं। मूल्य (1-पी); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * बर्नौली योजना के n परीक्षणों में कम से कम m सफलताओं की प्रायिकता y ज्ञात होने दें। फ़ंक्शन एकल परीक्षण में सफलता की संभावना p * पाता है। * *निम्नलिखित संबंध का उपयोग गणनाओं में किया जाता है * * 1 - p = rev_Beta(y|n-m,m+1)। */ ( जोर दें ((एन > 0) && (एम >= 0) && (एम<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (एम >= 0) && (एम<= n) && (y >= 0.5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (एम >= 0) && (एम<= n) && (y >= 0.5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

द्विपद वितरण पर विचार करें, इसकी गणितीय अपेक्षा, विचरण, बहुलक की गणना करें। MS EXCEL फ़ंक्शन BINOM.DIST () का उपयोग करके, हम वितरण फ़ंक्शन और संभाव्यता घनत्व ग्राफ़ प्लॉट करेंगे। आइए हम वितरण पैरामीटर p, वितरण की गणितीय अपेक्षा और मानक विचलन का अनुमान लगाएं। बर्नौली वितरण पर भी विचार करें।

परिभाषा. उन्हें आयोजित होने दें एनपरीक्षण, जिनमें से प्रत्येक में केवल 2 घटनाएं हो सकती हैं: घटना "सफलता" एक संभावना के साथ पी या घटना "विफलता" संभावना के साथ क्यू = 1-पी (तथाकथित बरनौली योजना,Bernoulliपरीक्षणों).

ठीक-ठीक आने की प्रायिकता एक्स इनमें सफलता एन परीक्षण के बराबर है:

नमूने में सफलताओं की संख्या एक्स एक यादृच्छिक चर है जिसमें द्विपद वितरण(अंग्रेज़ी) द्विपदवितरण) पीऔर एनइस वितरण के पैरामीटर हैं।

याद रखें कि आवेदन करने के लिए बर्नौली योजनाएंऔर तदनुसार द्विपद वितरण,निम्नलिखित शर्तों को पूरा किया जाना चाहिए:

  • प्रत्येक परीक्षण के ठीक दो परिणाम होने चाहिए, जिन्हें सशर्त रूप से "सफलता" और "विफलता" कहा जाता है।
  • प्रत्येक परीक्षण का परिणाम पिछले परीक्षणों (परीक्षण स्वतंत्रता) के परिणामों पर निर्भर नहीं होना चाहिए।
  • सफलता दर पी सभी परीक्षणों के लिए स्थिर होना चाहिए।

एमएस एक्सेल में द्विपद वितरण

MS EXCEL में, संस्करण 2010 से शुरू, के लिए एक BINOM.DIST () फ़ंक्शन है, अंग्रेजी नाम BINOM.DIST () है, जो आपको इस संभावना की गणना करने की अनुमति देता है कि नमूना ठीक होगा एक्स"सफलताएं" (यानी। संभाव्यता सघनता फ़ंक्शन p(x), ऊपर सूत्र देखें), और अभिन्न वितरण समारोह(संभावना है कि नमूना होगा एक्सया कम "सफलताएं", 0 सहित)।

MS EXCEL 2010 से पहले, EXCEL में BINOMDIST () फ़ंक्शन था, जो आपको गणना करने की भी अनुमति देता है वितरण समारोहऔर संभावित गहराईपी (एक्स)। अनुकूलता के लिए BINOMDIST () को MS EXCEL 2010 में छोड़ दिया गया है।

उदाहरण फ़ाइल में ग्राफ़ हैं संभाव्यता वितरण घनत्वऔर .

द्विपद वितरणपदनाम है बी (एन ; पी) .

टिप्पणी: भवन निर्माण के लिए अभिन्न वितरण समारोहसही फिट चार्ट प्रकार अनुसूची, के लिए वितरण घनत्वसमूहन के साथ हिस्टोग्राम. चार्ट बनाने के बारे में अधिक जानकारी के लिए आलेख मुख्य प्रकार के चार्ट पढ़ें।

टिप्पणी: उदाहरण फ़ाइल में सूत्र लिखने की सुविधा के लिए, मापदंडों के लिए नाम बनाए गए हैं द्विपद वितरण: एन और पी।

उदाहरण फ़ाइल MS EXCEL फ़ंक्शंस का उपयोग करके विभिन्न संभाव्यता गणनाएँ दिखाती है:

जैसा कि ऊपर की तस्वीर में देखा गया है, यह माना जाता है कि:

  • जिस अनंत जनसंख्या से नमूना बनाया गया है उसमें 10% (या 0.1) अच्छे तत्व (पैरामीटर .) हैं पी, तीसरा फ़ंक्शन तर्क = BINOM.DIST() )
  • प्रायिकता की गणना करने के लिए कि 10 तत्वों के नमूने में (पैरामीटर .) एन, फ़ंक्शन का दूसरा तर्क) ठीक 5 मान्य तत्व होंगे (पहला तर्क), आपको सूत्र लिखने की आवश्यकता है: =BINOM.DIST(5, 10, 0.1, FALSE)
  • अंतिम, चौथा तत्व सेट है = FALSE, यानी। फ़ंक्शन मान लौटाया जाता है वितरण घनत्व .

यदि चौथे तर्क का मान = TRUE है, तो BINOM.DIST() फ़ंक्शन मान लौटाता है अभिन्न वितरण समारोहया केवल वितरण समारोह. इस मामले में, आप इस संभावना की गणना कर सकते हैं कि नमूने में अच्छी वस्तुओं की संख्या एक निश्चित सीमा से होगी, उदाहरण के लिए, 2 या उससे कम (0 सहित)।

ऐसा करने के लिए, सूत्र लिखें: = BINOM.DIST(2, 10, 0.1, TRUE)

टिप्पणी: x के गैर-पूर्णांक मान के लिए, . उदाहरण के लिए, निम्न सूत्र समान मान लौटाएंगे: = बिनोम। जिला ( 2 ; दस; 0.1; सच)= बिनोम। जिला ( 2,9 ; दस; 0.1; सच)

टिप्पणी: उदाहरण फ़ाइल में संभावित गहराईऔर वितरण समारोहपरिभाषा और COMBIN () फ़ंक्शन का उपयोग करके भी गणना की जाती है।

वितरण संकेतक

पर शीट पर उदाहरण फ़ाइल उदाहरणकुछ वितरण संकेतकों की गणना के लिए सूत्र हैं:

  • = एन * पी;
  • (वर्ग मानक विचलन) = n*p*(1-p);
  • = (एन+1)*पी;
  • =(1-2*p)*रूट(n*p*(1-p)).

हम सूत्र प्राप्त करते हैं गणितीय अपेक्षाद्विपद वितरणका उपयोग करते हुए बर्नौली योजना .

परिभाषा के अनुसार, एक यादृच्छिक चर X in बर्नौली योजना(बर्नौली यादृच्छिक चर) है वितरण समारोह :

इस वितरण को कहा जाता है बर्नौली वितरण .

टिप्पणी : बर्नौली वितरण- विशेष मामला द्विपद वितरणपैरामीटर एन = 1 के साथ।

आइए सफलता की विभिन्न संभावनाओं के साथ 100 संख्याओं के 3 सरणियाँ उत्पन्न करें: 0.1; 0.5 और 0.9। ऐसा करने के लिए, विंडो में यादृच्छिक संख्या पीढ़ीप्रत्येक प्रायिकता p के लिए निम्नलिखित पैरामीटर सेट करें:

टिप्पणी: यदि आप विकल्प सेट करते हैं यादृच्छिक बिखराव (क्रमरहित बीज), तो आप जेनरेट की गई संख्याओं का एक निश्चित यादृच्छिक सेट चुन सकते हैं। उदाहरण के लिए, यह विकल्प = 25 सेट करके, आप विभिन्न कंप्यूटरों पर यादृच्छिक संख्याओं के समान सेट उत्पन्न कर सकते हैं (यदि, निश्चित रूप से, अन्य वितरण पैरामीटर समान हैं)। विकल्प मान 1 से 32,767 तक पूर्णांक मान ले सकता है। विकल्प का नाम यादृच्छिक बिखरावभ्रमित कर सकते हैं। इसका अनुवाद करना बेहतर होगा यादृच्छिक संख्याओं के साथ संख्या सेट करें .

नतीजतन, हमारे पास 100 नंबरों के 3 कॉलम होंगे, जिनके आधार पर, उदाहरण के लिए, हम सफलता की संभावना का अनुमान लगा सकते हैं पीसूत्र के अनुसार: सफलताओं की संख्या/100(से। मी। उदाहरण फ़ाइल शीट बर्नौली उत्पन्न करना).

टिप्पणी: के लिए बर्नौली वितरण p=0.5 के साथ, आप सूत्र =RANDBETWEEN(0;1) का उपयोग कर सकते हैं, जो .

यादृच्छिक संख्या पीढ़ी। द्विपद वितरण

मान लीजिए नमूने में 7 दोषपूर्ण वस्तुएँ हैं। इसका मतलब है कि यह "बहुत संभावना है" कि दोषपूर्ण उत्पादों का अनुपात बदल गया है। पी, जो हमारी उत्पादन प्रक्रिया की एक विशेषता है। हालांकि यह स्थिति "बहुत संभावना" है, एक संभावना है (अल्फा जोखिम, टाइप 1 त्रुटि, "गलत अलार्म") कि पीअपरिवर्तित रहा, और दोषपूर्ण उत्पादों की बढ़ती संख्या यादृच्छिक नमूने के कारण थी।

जैसा कि नीचे दिए गए चित्र में देखा जा सकता है, 7 दोषपूर्ण उत्पादों की संख्या है जो समान मूल्य पर p = 0.21 के साथ एक प्रक्रिया के लिए स्वीकार्य है। अल्फा. यह दर्शाता है कि जब किसी नमूने में दोषपूर्ण वस्तुओं की सीमा पार हो जाती है, पी"शायद" बढ़ गया। वाक्यांश "संभावना" का अर्थ है कि केवल 10% संभावना (100% -90%) है कि दहलीज से ऊपर दोषपूर्ण उत्पादों के प्रतिशत का विचलन केवल यादृच्छिक कारणों से होता है।

इस प्रकार, नमूने में दोषपूर्ण उत्पादों की दहलीज से अधिक संख्या एक संकेत के रूप में काम कर सकती है कि प्रक्रिया परेशान हो गई है और बी का उत्पादन शुरू हो गया है के विषय मेंदोषपूर्ण उत्पादों का उच्च प्रतिशत।

टिप्पणी: MS EXCEL 2010 से पहले, EXCEL का एक फंक्शन CRITBINOM() था, जो BINOM.INV() के बराबर है। CRITBINOM () को संगतता के लिए MS EXCEL 2010 और उच्चतर में छोड़ दिया गया है।

द्विपद वितरण का अन्य वितरणों से संबंध

यदि पैरामीटर एनद्विपद वितरणअनंत की ओर जाता है और पी 0 पर जाता है, तो इस मामले में द्विपद वितरणअनुमानित किया जा सकता है। सन्निकटन होने पर स्थितियां बनाना संभव है पॉसों वितरणअच्छा काम करता है:

  • पी(कम पीऔर अधिक एन, अधिक सटीक सन्निकटन);
  • पी >0,9 (ध्यान में रख कर क्यू =1- पी, इस मामले में गणना का उपयोग करके किया जाना चाहिए क्यू(ए एक्सके साथ प्रतिस्थापित करने की आवश्यकता है एन - एक्स) इसलिए, कम क्यूऔर अधिक एन, अधिक सटीक सन्निकटन)।

0.110 . पर द्विपद वितरणअनुमानित किया जा सकता है।

इसकी बारी में, द्विपद वितरणजनसंख्या का आकार N होने पर एक अच्छे सन्निकटन के रूप में कार्य कर सकता है हाइपरज्यामितीय वितरणनमूना आकार n से बहुत बड़ा (यानी, N>>n या n/N आप लेख में उपरोक्त वितरण के संबंध के बारे में अधिक पढ़ सकते हैं। सन्निकटन के उदाहरण भी वहां दिए गए हैं, और जब संभव हो तो शर्तों की व्याख्या की जाती है और किस सटीकता के साथ।

सलाह: आप लेख में एमएस एक्सेल के अन्य वितरणों के बारे में पढ़ सकते हैं।

संभाव्यता का सिद्धांत हमारे जीवन में अदृश्य रूप से मौजूद है। हम इस पर ध्यान नहीं देते हैं, लेकिन हमारे जीवन में हर घटना की कोई न कोई संभावना होती है। बड़ी संख्या में संभावित परिदृश्यों को ध्यान में रखते हुए, हमारे लिए उनमें से सबसे संभावित और सबसे कम संभावित का निर्धारण करना आवश्यक हो जाता है। ऐसे संभाव्य डेटा का ग्राफिक रूप से विश्लेषण करना सबसे सुविधाजनक है। वितरण इसमें हमारी मदद कर सकता है। द्विपद सबसे आसान और सबसे सटीक में से एक है।

सीधे गणित और संभाव्यता सिद्धांत पर जाने से पहले, आइए जानें कि इस प्रकार के वितरण के साथ सबसे पहले कौन आया था और इस अवधारणा के लिए गणितीय तंत्र के विकास का इतिहास क्या है।

कहानी

संभाव्यता की अवधारणा को प्राचीन काल से जाना जाता है। हालांकि, प्राचीन गणितज्ञों ने इसे अधिक महत्व नहीं दिया और केवल एक सिद्धांत की नींव रखने में सक्षम थे जो बाद में संभाव्यता का सिद्धांत बन गया। उन्होंने कुछ संयोजन विधियों का निर्माण किया जिससे उन लोगों को बहुत मदद मिली जिन्होंने बाद में सिद्धांत को स्वयं बनाया और विकसित किया।

सत्रहवीं शताब्दी के उत्तरार्ध में, संभाव्यता सिद्धांत की बुनियादी अवधारणाओं और विधियों का निर्माण शुरू हुआ। यादृच्छिक चर की परिभाषाएँ, सरल और कुछ जटिल स्वतंत्र और आश्रित घटनाओं की प्रायिकता की गणना करने के तरीके पेश किए गए थे। यादृच्छिक चर और संभावनाओं में इस तरह की रुचि जुए द्वारा तय की गई थी: प्रत्येक व्यक्ति जानना चाहता था कि खेल जीतने की उसकी संभावना क्या है।

अगला चरण संभाव्यता सिद्धांत में गणितीय विश्लेषण के तरीकों का अनुप्रयोग था। लाप्लास, गॉस, पॉइसन और बर्नौली जैसे प्रख्यात गणितज्ञों ने इस कार्य को अंजाम दिया। वे ही थे जिन्होंने गणित के इस क्षेत्र को एक नए स्तर पर पहुँचाया। यह जेम्स बर्नौली थे जिन्होंने द्विपद वितरण कानून की खोज की थी। वैसे, जैसा कि हम बाद में जानेंगे, इस खोज के आधार पर, कई और बनाए गए, जिससे सामान्य वितरण और कई अन्य के कानून बनाना संभव हो गया।

अब, द्विपद बंटन का वर्णन शुरू करने से पहले, हम संभाव्यता सिद्धांत की अवधारणाओं की स्मृति में थोड़ा ताज़ा करेंगे, शायद पहले से ही स्कूल बेंच से भुला दिया गया है।

संभाव्यता सिद्धांत के मूल सिद्धांत

हम ऐसी प्रणालियों पर विचार करेंगे, जिसके परिणामस्वरूप केवल दो परिणाम संभव हैं: "सफलता" और "विफलता"। इसे एक उदाहरण से समझना आसान है: हम एक सिक्का उछालते हैं, यह अनुमान लगाते हुए कि पूंछ गिर जाएगी। संभावित घटनाओं में से प्रत्येक की संभावनाएं (पूंछ - "सफलता", शीर्ष - "सफलता नहीं") पूरी तरह से संतुलित सिक्के के साथ 50 प्रतिशत के बराबर हैं और प्रयोग को प्रभावित करने वाले कोई अन्य कारक नहीं हैं।

यह सबसे सरल घटना थी। लेकिन ऐसी जटिल प्रणालियाँ भी हैं जिनमें क्रमिक क्रियाएं की जाती हैं, और इन क्रियाओं के परिणामों की संभावनाएँ भिन्न होंगी। उदाहरण के लिए, निम्नलिखित प्रणाली पर विचार करें: एक बॉक्स में जिसकी सामग्री हम नहीं देख सकते हैं, छह बिल्कुल समान गेंदें हैं, नीले, लाल और सफेद रंगों के तीन जोड़े हैं। हमें यादृच्छिक रूप से कुछ गेंदें प्राप्त करनी होंगी। तदनुसार, पहले सफेद गेंदों में से एक को बाहर निकालने से, हम इस संभावना को कई गुना कम कर देंगे कि अगली गेंद भी हमें एक सफेद गेंद मिलेगी। ऐसा इसलिए होता है क्योंकि सिस्टम में ऑब्जेक्ट्स की संख्या बदल जाती है।

अगले भाग में, हम अधिक जटिल गणितीय अवधारणाओं को देखेंगे जो हमें "सामान्य वितरण", "द्विपद वितरण" और समान माध्य के शब्दों के करीब लाती हैं।

गणितीय सांख्यिकी के तत्व

सांख्यिकी में, जो संभाव्यता के सिद्धांत के अनुप्रयोग के क्षेत्रों में से एक है, ऐसे कई उदाहरण हैं जहां विश्लेषण के लिए डेटा स्पष्ट रूप से नहीं दिया गया है। यानी संख्या में नहीं, बल्कि विशेषताओं के अनुसार विभाजन के रूप में, उदाहरण के लिए, लिंग के अनुसार। ऐसे डेटा पर गणितीय उपकरण लागू करने और प्राप्त परिणामों से कुछ निष्कर्ष निकालने के लिए, प्रारंभिक डेटा को एक संख्यात्मक प्रारूप में बदलना आवश्यक है। एक नियम के रूप में, इसे लागू करने के लिए, एक सकारात्मक परिणाम को 1 का मान दिया जाता है, और एक नकारात्मक को 0 का मान दिया जाता है। इस प्रकार, हम सांख्यिकीय डेटा प्राप्त करते हैं जिसका गणितीय तरीकों का उपयोग करके विश्लेषण किया जा सकता है।

एक यादृच्छिक चर के द्विपद वितरण को समझने में अगला कदम यादृच्छिक चर के विचरण और गणितीय अपेक्षा को निर्धारित करना है। हम इसके बारे में अगले भाग में बात करेंगे।

अपेक्षित मूल्य

वास्तव में, गणितीय अपेक्षा क्या है, यह समझना कठिन नहीं है। एक ऐसी प्रणाली पर विचार करें जिसमें कई अलग-अलग घटनाएं हैं जिनकी अपनी अलग संभावनाएं हैं। गणितीय अपेक्षा को इन घटनाओं के मूल्यों के उत्पादों के योग के बराबर मूल्य कहा जाएगा (गणितीय रूप में जिसके बारे में हमने पिछले खंड में बात की थी) और उनकी घटना की संभावना।

द्विपद वितरण की गणितीय अपेक्षा की गणना उसी योजना के अनुसार की जाती है: हम एक यादृच्छिक चर का मान लेते हैं, इसे सकारात्मक परिणाम की संभावना से गुणा करते हैं, और फिर सभी चर के लिए प्राप्त डेटा को सारांशित करते हैं। इन आंकड़ों को ग्राफिक रूप से प्रस्तुत करना बहुत सुविधाजनक है - इस तरह विभिन्न मूल्यों की गणितीय अपेक्षाओं के बीच का अंतर बेहतर माना जाता है।

अगले भाग में, हम आपको एक भिन्न अवधारणा के बारे में कुछ बताएंगे - एक यादृच्छिक चर का प्रसरण। यह द्विपद संभाव्यता वितरण जैसी अवधारणा से भी निकटता से संबंधित है, और इसकी विशेषता है।

द्विपद वितरण विचरण

यह मान पिछले एक से निकटता से संबंधित है और सांख्यिकीय डेटा के वितरण की भी विशेषता है। यह उनकी गणितीय अपेक्षा से मूल्यों के विचलन के माध्य वर्ग का प्रतिनिधित्व करता है। यही है, एक यादृच्छिक चर का विचरण एक यादृच्छिक चर के मूल्य और इसकी गणितीय अपेक्षा के बीच वर्ग अंतर का योग है, इस घटना की संभावना से गुणा किया जाता है।

सामान्य तौर पर, द्विपद संभाव्यता वितरण क्या है, यह समझने के लिए हमें विचरण के बारे में जानने की आवश्यकता है। अब हम अपने मुख्य विषय पर चलते हैं। अर्थात्, इस तरह के प्रतीत होने वाले जटिल वाक्यांश "द्विपद वितरण कानून" के पीछे क्या है।

द्विपद वितरण

आइए पहले समझते हैं कि यह बंटन द्विपद क्यों है। यह "बिनोम" शब्द से आया है। आपने न्यूटन के द्विपद के बारे में सुना होगा - एक सूत्र जिसका उपयोग किसी भी दो संख्याओं a और b के योग को n की किसी भी गैर-ऋणात्मक शक्ति तक विस्तारित करने के लिए किया जा सकता है।

जैसा कि आप शायद पहले ही अनुमान लगा चुके हैं, न्यूटन का द्विपद सूत्र और द्विपद वितरण सूत्र लगभग समान सूत्र हैं। एकमात्र अपवाद के साथ कि दूसरे में विशिष्ट मात्राओं के लिए एक लागू मूल्य है, और पहला केवल एक सामान्य गणितीय उपकरण है, जिसके अनुप्रयोग व्यवहार में भिन्न हो सकते हैं।

वितरण सूत्र

द्विपद बंटन फलन को निम्नलिखित पदों के योग के रूप में लिखा जा सकता है:

(एन!/(एन-के)!के!)*पी के *क्यू एन-के

यहाँ n स्वतंत्र यादृच्छिक प्रयोगों की संख्या है, p सफल परिणामों की संख्या है, q असफल परिणामों की संख्या है, k प्रयोग की संख्या है (यह 0 से n तक मान ले सकता है),! - एक भाज्य का पदनाम, किसी संख्या का ऐसा फलन, जिसका मान ऊपर जाने वाली सभी संख्याओं के गुणनफल के बराबर होता है (उदाहरण के लिए, संख्या 4: 4! = 1*2*3*4= के लिए) 24)।

इसके अलावा, द्विपद वितरण फ़ंक्शन को अपूर्ण बीटा फ़ंक्शन के रूप में लिखा जा सकता है। हालांकि, यह पहले से ही एक अधिक जटिल परिभाषा है, जिसका उपयोग केवल जटिल सांख्यिकीय समस्याओं को हल करते समय किया जाता है।

द्विपद वितरण, जिसके उदाहरण हमने ऊपर जांचे हैं, संभाव्यता सिद्धांत में सबसे सरल प्रकार के वितरणों में से एक है। एक सामान्य वितरण भी होता है, जो एक प्रकार का द्विपद बंटन होता है। यह सबसे अधिक उपयोग किया जाता है, और गणना करने में सबसे आसान है। एक बर्नौली वितरण, एक पॉइसन वितरण, एक सशर्त वितरण भी है। ये सभी विभिन्न परिस्थितियों में किसी विशेष प्रक्रिया की प्रायिकता के क्षेत्रों को ग्राफिक रूप से चित्रित करते हैं।

अगले भाग में हम वास्तविक जीवन में इस गणितीय उपकरण के अनुप्रयोग से संबंधित पहलुओं पर विचार करेंगे। पहली नज़र में, निश्चित रूप से, ऐसा लगता है कि यह एक और गणितीय चीज है, जो हमेशा की तरह, वास्तविक जीवन में लागू नहीं होती है, और आमतौर पर गणितज्ञों को छोड़कर किसी को भी इसकी आवश्यकता नहीं होती है। बहरहाल, मामला यह नहीं। आखिरकार, सभी प्रकार के वितरण और उनके चित्रमय प्रतिनिधित्व पूरी तरह से व्यावहारिक उद्देश्यों के लिए बनाए गए थे, न कि वैज्ञानिकों की सनक के रूप में।

आवेदन पत्र

अब तक वितरण का सबसे महत्वपूर्ण अनुप्रयोग सांख्यिकी में पाया जाता है, क्योंकि उन्हें बहुत सारे डेटा के जटिल विश्लेषण की आवश्यकता होती है। जैसा कि अभ्यास से पता चलता है, बहुत से डेटा सरणियों में मूल्यों का लगभग समान वितरण होता है: बहुत कम और बहुत उच्च मूल्यों के महत्वपूर्ण क्षेत्रों में, एक नियम के रूप में, औसत मूल्यों की तुलना में कम तत्व होते हैं।

न केवल आंकड़ों में बड़े डेटा सरणियों का विश्लेषण आवश्यक है। यह अपरिहार्य है, उदाहरण के लिए, भौतिक रसायन विज्ञान में। इस विज्ञान में, इसका उपयोग कई मात्राओं को निर्धारित करने के लिए किया जाता है जो यादृच्छिक कंपन और परमाणुओं और अणुओं की गति से जुड़ी होती हैं।

अगले भाग में हम समझेंगे कि द्विपद जैसी सांख्यिकीय अवधारणाओं को लागू करना कितना महत्वपूर्ण है आपके और मेरे लिए दैनिक जीवन में एक यादृच्छिक चर का वितरण।

मुझे इसकी ज़रूरत क्यों है?

जब गणित की बात आती है तो बहुत से लोग खुद से यह सवाल पूछते हैं। और वैसे भी विज्ञान की रानी कहे जाने वाला गणित व्यर्थ नहीं है। यह भौतिकी, रसायन विज्ञान, जीव विज्ञान, अर्थशास्त्र का आधार है, और इनमें से प्रत्येक विज्ञान में, किसी न किसी प्रकार के वितरण का भी उपयोग किया जाता है: चाहे वह असतत द्विपद वितरण हो या सामान्य, इससे कोई फर्क नहीं पड़ता। और अगर हम अपने आस-पास की दुनिया को करीब से देखें, तो हम देखेंगे कि गणित का इस्तेमाल हर जगह किया जाता है: रोजमर्रा की जिंदगी में, काम पर, और यहां तक ​​​​कि मानवीय रिश्तों को भी सांख्यिकीय आंकड़ों के रूप में प्रस्तुत किया जा सकता है और विश्लेषण किया जा सकता है (यह, वैसे , उन लोगों द्वारा किया जाता है जो सूचना के संग्रह में शामिल विशेष संगठनों में काम करते हैं)।

आइए अब इस बारे में थोड़ी बात करते हैं कि यदि आपको इस विषय पर इस लेख में जो बताया गया है, उससे कहीं अधिक जानने की आवश्यकता है तो क्या करें।

इस लेख में हमने जो जानकारी दी है वह पूरी नहीं है। वितरण किस रूप में हो सकता है, इसके बारे में कई बारीकियां हैं। द्विपद वितरण, जैसा कि हम पहले ही पता लगा चुके हैं, मुख्य प्रकारों में से एक है जिस पर सभी गणितीय आँकड़े और संभाव्यता सिद्धांत आधारित हैं।

यदि आप रुचि रखते हैं, या अपने काम के संबंध में, आपको इस विषय पर और अधिक जानने की आवश्यकता है, तो आपको विशेष साहित्य का अध्ययन करने की आवश्यकता होगी। आपको गणितीय विश्लेषण में एक विश्वविद्यालय के पाठ्यक्रम से शुरू करना चाहिए और वहां संभाव्यता सिद्धांत पर अनुभाग में जाना चाहिए। श्रृंखला के क्षेत्र में भी ज्ञान उपयोगी होगा, क्योंकि द्विपद संभाव्यता वितरण क्रमिक शब्दों की एक श्रृंखला से ज्यादा कुछ नहीं है।

निष्कर्ष

लेख खत्म करने से पहले हम आपको एक और दिलचस्प बात बताना चाहेंगे। यह सीधे हमारे लेख के विषय और सामान्य रूप से सभी गणित से संबंधित है।

बहुत से लोग कहते हैं कि गणित एक बेकार विज्ञान है, और जो कुछ भी उन्होंने स्कूल में सीखा वह उनके लिए उपयोगी नहीं था। लेकिन ज्ञान कभी भी अतिश्योक्तिपूर्ण नहीं होता है, और अगर जीवन में कुछ आपके लिए उपयोगी नहीं है, तो इसका मतलब है कि आपको बस इसे याद नहीं है। अगर आपके पास ज्ञान है, तो वे आपकी मदद कर सकते हैं, लेकिन अगर आपके पास नहीं है, तो आप उनसे मदद की उम्मीद नहीं कर सकते।

इसलिए, हमने द्विपद बंटन की अवधारणा और इससे जुड़ी सभी परिभाषाओं की जांच की और बात की कि इसे हमारे जीवन में कैसे लागू किया जाता है।

अध्याय 7

यादृच्छिक चर के वितरण के विशिष्ट नियम

असतत यादृच्छिक चर के वितरण के नियमों के प्रकार

मान लीजिए एक असतत यादृच्छिक चर मान लेता है एक्स 1 , एक्स 2 , …, एक्स एन,… . इन मूल्यों की संभावनाओं की गणना विभिन्न सूत्रों का उपयोग करके की जा सकती है, उदाहरण के लिए, संभाव्यता सिद्धांत के मूल प्रमेय, बर्नौली के सूत्र, या कुछ अन्य सूत्रों का उपयोग करना। इनमें से कुछ सूत्रों के लिए, वितरण कानून का अपना नाम है।

असतत यादृच्छिक चर के वितरण के सबसे सामान्य नियम द्विपद, ज्यामितीय, हाइपरजोमेट्रिक, पॉइसन के वितरण कानून हैं।

द्विपद वितरण कानून

इसे उत्पादित होने दें एनस्वतंत्र परीक्षण, जिनमें से प्रत्येक में एक घटना हो सकती है या नहीं हो सकती है लेकिन. प्रत्येक एकल परीक्षण में इस घटना की घटना की संभावना स्थिर है, परीक्षण संख्या पर निर्भर नहीं है और बराबर है आर=आर(लेकिन) इसलिए संभावना है कि घटना घटित नहीं होगी लेकिनप्रत्येक परीक्षण में भी स्थिर और बराबर होता है क्यू=1–आर. एक यादृच्छिक चर पर विचार करें एक्सघटना की घटनाओं की संख्या के बराबर लेकिनमें एनपरीक्षण। जाहिर है कि इस मात्रा के मान बराबर हैं

एक्स 1 = 0 - घटना लेकिनमें एनपरीक्षण प्रकट नहीं हुए;

एक्स 2 = 1 - घटना लेकिनमें एनपरीक्षण एक बार दिखाई दिए;

एक्स 3 =2 - घटना लेकिनमें एनपरीक्षण दो बार दिखाई दिए;

…………………………………………………………..

एक्स एन +1 = एन- प्रतिस्पर्धा लेकिनमें एनपरीक्षण सब कुछ दिखाई दिया एनएक बार।

इन मूल्यों की संभावनाओं की गणना बर्नौली सूत्र (4.1) का उपयोग करके की जा सकती है:

कहाँ पे को=0, 1, 2, …,एन .

द्विपद वितरण कानून एक्ससफलताओं की संख्या के बराबर एनबर्नौली परीक्षण, सफलता की संभावना के साथ आर.

तो, एक असतत यादृच्छिक चर का एक द्विपद वितरण होता है (या द्विपद नियम के अनुसार वितरित किया जाता है) यदि इसके संभावित मान 0, 1, 2,…, एन, और संबंधित संभावनाओं की गणना सूत्र (7.1) द्वारा की जाती है।

द्विपद बंटन दो पर निर्भर करता है मापदंडों आरऔर एन.

द्विपद नियम के अनुसार वितरित एक यादृच्छिक चर की वितरण श्रृंखला का रूप है:

एक्स एन
आर

उदाहरण 7.1 . लक्ष्य पर तीन स्वतंत्र शॉट दागे जाते हैं। प्रत्येक शॉट मारने की संभावना 0.4 है। यादृच्छिक मूल्य एक्स- लक्ष्य पर हिट की संख्या। इसकी वितरण श्रृंखला की रचना कीजिए।

फेसला। यादृच्छिक चर के संभावित मान एक्सहैं एक्स 1 =0; एक्स 2 =1; एक्स 3 =2; एक्स 4=3. बर्नौली सूत्र का उपयोग करके संगत प्रायिकताएँ ज्ञात कीजिए। यह दिखाना आसान है कि यहां इस सूत्र का आवेदन पूरी तरह से उचित है। ध्यान दें कि एक शॉट से लक्ष्य को न मारने की संभावना 1-0.4=0.6 के बराबर होगी। पाना

वितरण श्रृंखला के निम्नलिखित रूप हैं:

एक्स
आर 0,216 0,432 0,288 0,064

यह जांचना आसान है कि सभी संभावनाओं का योग 1 के बराबर है। यादृच्छिक चर ही एक्सद्विपद कानून के अनुसार वितरित। मैं

आइए द्विपद नियम के अनुसार वितरित एक यादृच्छिक चर की गणितीय अपेक्षा और विचरण का पता लगाएं।

उदाहरण 6.5 को हल करते समय, यह दिखाया गया था कि किसी घटना के घटित होने की संख्या की गणितीय अपेक्षा लेकिनमें एनस्वतंत्र परीक्षण, यदि घटना की संभावना लेकिनप्रत्येक परीक्षण में स्थिर और बराबर है आर, बराबर एन· आर

इस उदाहरण में, द्विपद नियम के अनुसार वितरित, एक यादृच्छिक चर का उपयोग किया गया था। इसलिए, उदाहरण 6.5 का हल वास्तव में निम्नलिखित प्रमेय का प्रमाण है।

प्रमेय 7.1.द्विपद नियम के अनुसार वितरित असतत यादृच्छिक चर की गणितीय अपेक्षा परीक्षणों की संख्या और "सफलता" की संभावना के उत्पाद के बराबर है, अर्थात। एम(एक्स)=एन· आर।

प्रमेय 7.2.द्विपद नियम के अनुसार वितरित असतत यादृच्छिक चर का विचरण "सफलता" की संभावना और "विफलता" की संभावना से परीक्षणों की संख्या के उत्पाद के बराबर है, अर्थात। डी(एक्स)=एनपीक्यू

द्विपद नियम के अनुसार वितरित एक यादृच्छिक चर का तिरछापन और कुर्टोसिस सूत्रों द्वारा निर्धारित किया जाता है

इन सूत्रों को प्रारंभिक और केंद्रीय क्षणों की अवधारणा का उपयोग करके प्राप्त किया जा सकता है।

द्विपद वितरण कानून कई वास्तविक स्थितियों को रेखांकित करता है। बड़े मूल्यों के लिए एनद्विपद वितरण का अनुमान अन्य वितरणों का उपयोग करके लगाया जा सकता है, विशेष रूप से पॉइसन वितरण का उपयोग करके।

पॉसों वितरण

उसे वही रहने दो एनपरीक्षणों की संख्या के साथ बर्नौली परीक्षण एनकाफी बडा। पहले, यह दिखाया गया था कि इस मामले में (यदि, इसके अलावा, प्रायिकता आरआयोजन लेकिनबहुत छोटा) किसी घटना के होने की प्रायिकता ज्ञात करने के लिए लेकिनउपस्थित होना टीएक बार परीक्षणों में, आप पॉसों सूत्र (4.9) का उपयोग कर सकते हैं। यदि यादृच्छिक चर एक्समतलब घटना की घटनाओं की संख्या लेकिनमें एनबर्नौली परीक्षण, तो संभावना है कि एक्सअर्थ पर ले जाएगा सूत्र द्वारा गणना की जा सकती है

, (7.2)

कहाँ पे λ = एन.आर..

पॉइज़न वितरण कानूनअसतत यादृच्छिक चर का वितरण कहा जाता है एक्स, जिसके लिए संभावित मान गैर-ऋणात्मक पूर्णांक हैं, और संभावनाएं पी टीये मान सूत्र (7.2) द्वारा पाए जाते हैं।

मूल्य λ = एन.आर.बुलाया पैरामीटरपॉसों वितरण।

पॉइसन के नियम के अनुसार वितरित एक यादृच्छिक चर अनंत संख्या में मान ले सकता है। चूँकि इस बंटन की प्रायिकता आरप्रत्येक परीक्षण में एक घटना की घटना छोटी होती है, तो इस वितरण को कभी-कभी दुर्लभ घटना का नियम कहा जाता है।

पॉइसन कानून के अनुसार वितरित एक यादृच्छिक चर की वितरण श्रृंखला का रूप है

एक्स टी
आर

यह सत्यापित करना आसान है कि दूसरी पंक्ति की संभावनाओं का योग 1 के बराबर है। ऐसा करने के लिए, हमें यह याद रखना होगा कि फ़ंक्शन को मैकलॉरिन श्रृंखला में विस्तारित किया जा सकता है, जो किसी भी के लिए अभिसरण करता है एक्स. इस मामले में हमारे पास है

. (7.3)

जैसा कि उल्लेख किया गया है, कुछ सीमित मामलों में पॉइसन का कानून द्विपद कानून की जगह लेता है। एक उदाहरण एक यादृच्छिक चर है एक्स, जिनमें से मान एक तकनीकी उपकरण के बार-बार उपयोग के साथ एक निश्चित अवधि के लिए विफलताओं की संख्या के बराबर होते हैं। यह माना जाता है कि यह उपकरण उच्च विश्वसनीयता का है, अर्थात। एक आवेदन में विफलता की संभावना बहुत कम है।

ऐसे सीमित मामलों के अलावा, व्यवहार में पॉइसन कानून के अनुसार यादृच्छिक चर वितरित किए जाते हैं, द्विपद वितरण से संबंधित नहीं। उदाहरण के लिए, पॉइसन वितरण का उपयोग अक्सर समय की अवधि में होने वाली घटनाओं की संख्या से निपटने के लिए किया जाता है (घंटे के दौरान टेलीफोन एक्सचेंज में कॉल की संख्या, दिन के दौरान कार धोने में आने वाली कारों की संख्या, प्रति सप्ताह मशीन स्टॉप की संख्या, आदि।) इन सभी घटनाओं को घटनाओं के तथाकथित प्रवाह का निर्माण करना चाहिए, जो कतार सिद्धांत की मूल अवधारणाओं में से एक है। पैरामीटर λ घटनाओं के प्रवाह की औसत तीव्रता की विशेषता है।

उदाहरण 7.2 . संकाय में 500 छात्र हैं। क्या संभावना है कि 1 सितंबर को इस संकाय में तीन छात्रों का जन्मदिन है?

फेसला . चूंकि छात्रों की संख्या एन=500 काफी बड़ा है और आर- किसी भी छात्र के लिए पहली सितंबर को पैदा होने की संभावना है, अर्थात। काफी छोटा है, तो हम मान सकते हैं कि यादृच्छिक चर एक्स- पहली सितंबर को जन्म लेने वाले छात्रों की संख्या को पॉइसन कानून के अनुसार पैरामीटर के साथ वितरित किया जाता है λ = एनपी= = 1.36986। फिर, सूत्र (7.2) के अनुसार, हम प्राप्त करते हैं

प्रमेय 7.3।यादृच्छिक चर होने दें एक्सपॉइसन के नियम के अनुसार वितरित। तब इसकी गणितीय अपेक्षा और विचरण एक दूसरे के बराबर और पैरामीटर के मान के बराबर होते हैं λ , अर्थात। एम(एक्स) = डी(एक्स) = λ = एनपी.

प्रमाण।गणितीय अपेक्षा की परिभाषा से, सूत्र (7.3) और पॉइसन कानून के अनुसार वितरित एक यादृच्छिक चर की वितरण श्रृंखला का उपयोग करके, हम प्राप्त करते हैं

विचरण ज्ञात करने से पहले, हम पहले माने गए यादृच्छिक चर के वर्ग की गणितीय अपेक्षा पाते हैं। हम पाते हैं

इसलिए, फैलाव की परिभाषा से, हम प्राप्त करते हैं

प्रमेय सिद्ध हो चुका है।

प्रारंभिक और केंद्रीय क्षणों की अवधारणाओं को लागू करते हुए, यह दिखाया जा सकता है कि पॉइसन कानून के अनुसार वितरित एक यादृच्छिक चर के लिए, तिरछापन और कुर्टोसिस गुणांक सूत्रों द्वारा निर्धारित किया जाता है

यह समझना आसान है, क्योंकि पैरामीटर की शब्दार्थ सामग्री λ = एनपीसकारात्मक है, तो पॉइसन के नियम के अनुसार वितरित एक यादृच्छिक चर में हमेशा विषमता और कुर्टोसिस दोनों सकारात्मक होते हैं।

सभी घटनाओं को मात्रात्मक पैमाने पर नहीं मापा जाता है जैसे 1, 2, 3 ... 100500 ... हमेशा एक घटना अनंत या बड़ी संख्या में विभिन्न राज्यों को नहीं ले सकती है। उदाहरण के लिए, किसी व्यक्ति का लिंग या तो एम या एफ हो सकता है। शूटर या तो लक्ष्य को हिट करता है या चूक जाता है। आप या तो "के लिए" या "विरुद्ध", आदि वोट कर सकते हैं। आदि। दूसरे शब्दों में, ऐसा डेटा एक वैकल्पिक विशेषता की स्थिति को दर्शाता है - या तो "हां" (घटना हुई) या "नहीं" (घटना नहीं हुई)। आने वाली घटना (सकारात्मक परिणाम) को "सफलता" भी कहा जाता है।

ऐसे डेटा वाले प्रयोगों को कहा जाता है बर्नौली योजना, प्रसिद्ध स्विस गणितज्ञ के सम्मान में, जिन्होंने पाया कि बड़ी संख्या में परीक्षणों के साथ, सकारात्मक परिणामों का अनुपात परीक्षणों की कुल संख्या में इस घटना के होने की संभावना की ओर जाता है।

वैकल्पिक सुविधा चर

विश्लेषण में गणितीय उपकरण का उपयोग करने के लिए, ऐसे अवलोकनों के परिणामों को संख्यात्मक रूप में लिखा जाना चाहिए। ऐसा करने के लिए, एक सकारात्मक परिणाम को नंबर 1 दिया जाता है, एक नकारात्मक - 0। दूसरे शब्दों में, हम एक ऐसे चर के साथ काम कर रहे हैं जो केवल दो मान ले सकता है: 0 या 1।

इससे क्या लाभ प्राप्त किया जा सकता है? वास्तव में, सामान्य डेटा से कम नहीं। इसलिए, सकारात्मक परिणामों की संख्या गिनना आसान है - यह सभी मूल्यों को समेटने के लिए पर्याप्त है, अर्थात। सभी 1 (सफलता)। आप आगे जा सकते हैं, लेकिन इसके लिए आपको कुछ नोटेशन पेश करने होंगे।

ध्यान देने वाली पहली बात यह है कि सकारात्मक परिणामों (जो 1 के बराबर हैं) के होने की कुछ संभावना होती है। उदाहरण के लिए, एक सिक्के को उछालने पर चित प्राप्त करना 1/2 या 0.5 है। इस संभावना को पारंपरिक रूप से लैटिन अक्षर . द्वारा निरूपित किया जाता है पी. इसलिए, एक वैकल्पिक घटना के घटित होने की प्रायिकता है 1-पी, जिसे द्वारा भी दर्शाया गया है क्यू, अर्थात क्यू = 1 - पी. इन पदनामों को एक चर वितरण प्लेट के रूप में दृष्टिगत रूप से व्यवस्थित किया जा सकता है एक्स.

हमें संभावित मूल्यों और उनकी संभावनाओं की एक सूची मिली है। गणना की जा सकती है अपेक्षित मूल्यऔर फैलाव. उम्मीद सभी संभावित मूल्यों और उनकी संबंधित संभावनाओं के उत्पादों का योग है:

आइए उपरोक्त तालिकाओं में संकेतन का उपयोग करके अपेक्षित मान की गणना करें।

यह पता चला है कि एक वैकल्पिक संकेत की गणितीय अपेक्षा इस घटना की संभावना के बराबर है - पी.

अब आइए परिभाषित करें कि वैकल्पिक विशेषता का प्रसरण क्या है। फैलाव गणितीय अपेक्षा से विचलन का औसत वर्ग है। सामान्य सूत्र (असतत डेटा के लिए) है:

इसलिए वैकल्पिक सुविधा का प्रसरण:

यह देखना आसान है कि इस फैलाव में अधिकतम 0.25 (at .) है पी = 0.5).

मानक विचलन - विचरण की जड़:

अधिकतम मान 0.5 से अधिक नहीं है।

जैसा कि आप देख सकते हैं, गणितीय अपेक्षा और वैकल्पिक चिह्न के विचरण दोनों का एक बहुत ही कॉम्पैक्ट रूप है।

एक यादृच्छिक चर का द्विपद वितरण

आइए स्थिति को एक अलग कोण से देखें। वास्तव में, कौन परवाह करता है कि एक टॉस पर सिर का औसत नुकसान 0.5 है? इसकी कल्पना करना भी असंभव है। किसी दिए गए थ्रो की संख्या के लिए आने वाले शीर्षों की संख्या का प्रश्न उठाना अधिक दिलचस्प है।

दूसरे शब्दों में, शोधकर्ता अक्सर एक निश्चित संख्या में सफल घटनाओं के घटित होने की संभावना में रुचि रखता है। यह जाँच किए जा रहे बैच में दोषपूर्ण उत्पादों की संख्या (1 - दोषपूर्ण, 0 - अच्छा) या ठीक होने की संख्या (1 - स्वस्थ, 0 - बीमार), आदि हो सकती है। ऐसी "सफलताओं" की संख्या चर के सभी मूल्यों के योग के बराबर होगी एक्स, अर्थात। एकल परिणामों की संख्या

यादृच्छिक मूल्य बीद्विपद कहलाता है और 0 से . तक मान लेता है एन(पर बी= 0 - सभी भाग अच्छे हैं, साथ बी = एन- सभी भाग दोषपूर्ण हैं)। यह माना जाता है कि सभी मान एक्सएक दूसरे से स्वतंत्र। द्विपद चर की मुख्य विशेषताओं पर विचार करें, अर्थात्, हम इसकी गणितीय अपेक्षा, विचरण और वितरण स्थापित करेंगे।

द्विपद चर की अपेक्षा को प्राप्त करना बहुत आसान है। मूल्यों के योग की गणितीय अपेक्षा प्रत्येक जोड़े गए मूल्य की गणितीय अपेक्षाओं का योग है, और यह सभी के लिए समान है, इसलिए:

उदाहरण के लिए, 100 टॉस पर चितों की संख्या की अपेक्षा 100 × 0.5 = 50 है।

अब हम द्विपद चर के प्रसरण का सूत्र प्राप्त करते हैं। स्वतंत्र यादृच्छिक चर के योग का प्रसरण, प्रसरणों का योग है। यहां से

मानक विचलन, क्रमशः

100 सिक्के उछालने के लिए, शीर्षों की संख्या का मानक विचलन है

और अंत में, द्विपद राशि के वितरण पर विचार करें, अर्थात। संभावना है कि यादृच्छिक चर बीअलग मान लेगा , कहाँ पे 0≤k≤n. एक सिक्के के लिए, यह समस्या कुछ इस तरह लग सकती है: 100 टॉस में 40 चित आने की प्रायिकता क्या है?

गणना पद्धति को समझने के लिए, आइए कल्पना करें कि सिक्का केवल 4 बार उछाला जाता है। कोई भी पक्ष हर बार गिर सकता है। हम खुद से पूछते हैं: 4 टॉस में से 2 हेड आने की क्या प्रायिकता है। प्रत्येक फेंक एक दूसरे से स्वतंत्र है। इसका मतलब यह है कि किसी भी संयोजन को प्राप्त करने की संभावना प्रत्येक व्यक्तिगत फेंक के लिए दिए गए परिणाम की संभावनाओं के उत्पाद के बराबर होगी। मान लीजिए O सिर है और P पूंछ है। फिर, उदाहरण के लिए, हमारे लिए उपयुक्त संयोजनों में से एक ओओपीपी जैसा दिख सकता है, वह है:

ऐसे संयोजन की प्रायिकता शीर्ष आने की दो प्रायिकताओं और शीर्ष न आने की दो और प्रायिकताओं के गुणनफल के बराबर होती है। 1-पी), अर्थात। 0.5×0.5×(1-0.5)×(1-0.5)=0.0625. यह उन संयोजनों में से एक की संभावना है जो हमें सूट करते हैं। लेकिन सवाल चील की कुल संख्या के बारे में था, न कि किसी विशेष आदेश के बारे में। फिर आपको उन सभी संयोजनों की संभावनाओं को जोड़ने की जरूरत है जिनमें ठीक 2 ईगल हैं। यह स्पष्ट है कि वे सभी समान हैं (उत्पाद कारकों के स्थानों को बदलने से नहीं बदलता है)। इसलिए, आपको उनकी संख्या की गणना करने की आवश्यकता है, और फिर ऐसे किसी भी संयोजन की संभावना से गुणा करें। आइए 2 चील के 4 थ्रो के सभी संयोजनों को गिनें: RROO, RORO, ROOR, ORRO, OROR, OORR। केवल 6 विकल्प।

इसलिए, 4 बार फेंकने के बाद 2 चित प्राप्त करने की वांछित प्रायिकता 6×0.0625=0.375 है।

हालाँकि, इस तरह से गिनती करना थकाऊ है। पहले से ही 10 सिक्कों के लिए, क्रूर बल द्वारा कुल विकल्पों की संख्या प्राप्त करना बहुत मुश्किल होगा। इसलिए, स्मार्ट लोगों ने बहुत पहले एक सूत्र का आविष्कार किया, जिसकी मदद से वे विभिन्न संयोजनों की संख्या की गणना करते हैं एनतत्वों द्वारा , कहाँ पे एनतत्वों की कुल संख्या है, उन तत्वों की संख्या है जिनके व्यवस्था विकल्पों की गणना की जाती है। का संयोजन सूत्र एनतत्वों द्वारा है:

इसी तरह की चीजें कॉम्बिनेटरिक्स सेक्शन में होती हैं। मैं उन सभी को भेजता हूं जो अपने ज्ञान में सुधार करना चाहते हैं। इसलिए, वैसे, द्विपद वितरण का नाम (उपरोक्त सूत्र न्यूटन द्विपद के विस्तार में गुणांक है)।

संभाव्यता निर्धारित करने का सूत्र किसी भी संख्या के लिए आसानी से सामान्यीकृत किया जा सकता है एनऔर . परिणामस्वरूप, द्विपद बंटन सूत्र का निम्न रूप होता है।

उनमें से किसी एक की प्रायिकता से मेल खाने वाले संयोजनों की संख्या गुणा करें।

व्यावहारिक उपयोग के लिए, द्विपद बंटन के सूत्र को जानना ही पर्याप्त है। और आप शायद यह भी नहीं जानते होंगे - नीचे एक्सेल का उपयोग करके प्रायिकता निर्धारित करने का तरीका बताया गया है। लेकिन यह जानना बेहतर है।

आइए इस सूत्र का उपयोग 100 टॉस में 40 शीर्ष प्राप्त करने की संभावना की गणना करने के लिए करें:

या सिर्फ 1.08%। तुलना के लिए, इस प्रयोग की गणितीय अपेक्षा, यानी 50 शीर्ष, की संभावना 7.96% है। द्विपद मान की अधिकतम प्रायिकता गणितीय अपेक्षा के अनुरूप मान से संबंधित होती है।

एक्सेल में द्विपद वितरण की संभावनाओं की गणना

यदि आप केवल कागज और एक कैलकुलेटर का उपयोग करते हैं, तो द्विपद वितरण सूत्र का उपयोग करके गणना, अभिन्न की अनुपस्थिति के बावजूद, काफी कठिन है। उदाहरण के लिए, 100 का मान! - 150 से अधिक वर्ण हैं। पहले, और अब भी, ऐसी मात्राओं की गणना के लिए अनुमानित सूत्रों का उपयोग किया जाता था। फिलहाल, एमएस एक्सेल जैसे विशेष सॉफ्टवेयर का उपयोग करने की सलाह दी जाती है। इस प्रकार, कोई भी उपयोगकर्ता (यहां तक ​​​​कि शिक्षा द्वारा मानवतावादी भी) आसानी से द्विपद रूप से वितरित यादृच्छिक चर के मूल्य की संभावना की गणना कर सकता है।

सामग्री को समेकित करने के लिए, हम कुछ समय के लिए एक नियमित कैलकुलेटर के रूप में एक्सेल का उपयोग करेंगे, अर्थात। आइए द्विपद वितरण सूत्र का उपयोग करके चरण-दर-चरण गणना करें। आइए गणना करें, उदाहरण के लिए, 50 शीर्ष प्राप्त करने की संभावना। नीचे गणना चरणों और अंतिम परिणाम के साथ एक तस्वीर है।

जैसा कि आप देख सकते हैं, मध्यवर्ती परिणामों में ऐसा पैमाना होता है कि वे एक सेल में फिट नहीं होते हैं, हालांकि इस प्रकार के सरल कार्यों का उपयोग हर जगह किया जाता है: FACTOR (फैक्टोरियल कैलकुलेशन), POWER (एक संख्या को एक शक्ति तक बढ़ाना), साथ ही साथ गुणा और भाग ऑपरेटरों। इसके अलावा, यह गणना बल्कि बोझिल है, किसी भी मामले में यह कॉम्पैक्ट नहीं है, क्योंकि कई कोशिकाएं शामिल हैं। और हाँ, इसका पता लगाना मुश्किल है।

सामान्य तौर पर, एक्सेल द्विपद वितरण की संभावनाओं की गणना के लिए एक तैयार कार्य प्रदान करता है। समारोह कहा जाता है बिनोम.जिला.

सफलताओं की संख्या सफल परीक्षणों की संख्या है। हमारे पास उनमें से 50 हैं।

परीक्षणों की संख्या - थ्रो की संख्या: 100 बार।

सफलता की संभावना - एक टॉस पर चित आने की प्रायिकता 0.5 है।

अभिन्न - या तो 1 या 0 इंगित किया गया है। यदि 0 है, तो संभावना की गणना की जाती है पी (बी = के); यदि 1 है, तो द्विपद बंटन फलन की गणना की जाती है, अर्थात्। से सभी संभावनाओं का योग बी = 0इससे पहले बी = केसहित।

हम ओके दबाते हैं और हमें ऊपर जैसा ही परिणाम मिलता है, केवल सब कुछ की गणना एक फ़ंक्शन द्वारा की जाती है।

बहुत आराम से। प्रयोग के लिए, अंतिम पैरामीटर 0 के बजाय, हम 1 डालते हैं। हमें 0.5398 मिलता है। इसका मतलब है कि 100 सिक्कों के उछाल में, 0 और 50 के बीच शीर्ष आने की संभावना लगभग 54% है। और पहले तो लगा कि यह 50% होना चाहिए। सामान्य तौर पर, गणना आसानी से और जल्दी से की जाती है।

एक वास्तविक विश्लेषक को यह समझना चाहिए कि फ़ंक्शन कैसे व्यवहार करता है (इसका वितरण क्या है), तो आइए 0 से 100 तक के सभी मानों की संभावनाओं की गणना करें। यानी, आइए खुद से पूछें: क्या संभावना है कि एक भी ईगल बाहर नहीं गिरेगा , वह 1 उकाब गिरेगा, 2, 3, 50, 90 या 100। गणना निम्नलिखित चित्र में दिखाई गई है। नीली रेखा स्वयं द्विपद बंटन है, लाल बिंदु विशिष्ट संख्या में सफलताओं की प्रायिकता है k।

कोई पूछ सकता है, क्या द्विपद बंटन समान नहीं है... हाँ, बहुत समान। यहां तक ​​​​कि डी मोइवर (1733 में) ने कहा कि बड़े नमूनों के साथ द्विपद वितरण दृष्टिकोण (मुझे नहीं पता कि इसे तब क्या कहा जाता था), लेकिन किसी ने उसकी बात नहीं सुनी। 60-70 साल बाद केवल गॉस और फिर लाप्लास ने फिर से खोजा और सामान्य वितरण कानून का ध्यानपूर्वक अध्ययन किया। ऊपर दिया गया ग्राफ स्पष्ट रूप से दिखाता है कि अधिकतम संभावना गणितीय अपेक्षा पर पड़ती है, और जैसे-जैसे यह इससे विचलित होती है, यह तेजी से घटती जाती है। बिल्कुल सामान्य कानून की तरह।

द्विपद वितरण का बहुत व्यावहारिक महत्व है, यह अक्सर होता है। एक्सेल का उपयोग करके, गणना आसानी से और जल्दी से की जाती है।