संभावना वितरण। असतत यादृच्छिक चर का द्विपद वितरण

संभाव्यता सिद्धांत गणित की एक शाखा है जो यादृच्छिक घटनाओं के पैटर्न का अध्ययन करती है: यादृच्छिक घटनाएं, यादृच्छिक चर, उनके गुण और उन पर संचालन।

लंबे समय तकसंभाव्यता के सिद्धांत की स्पष्ट परिभाषा नहीं थी। यह केवल 1929 में तैयार किया गया था। एक विज्ञान के रूप में संभाव्यता सिद्धांत के उद्भव का श्रेय मध्य युग और पहले प्रयासों को दिया जाता है गणितीय विश्लेषणजुआ (टॉस, पासा, रूले)। फ्रांसीसी गणितज्ञ XVII सदी ब्लेज़ पास्कल और पियरे फ़र्मेट, में जीत की भविष्यवाणी की खोज जुआ, पहले संभाव्य पैटर्न की खोज की जो पासा फेंकते समय उत्पन्न होते हैं।

संभाव्यता का सिद्धांत इस विश्वास से एक विज्ञान के रूप में उभरा कि कुछ नियमितताएं बड़े पैमाने पर यादृच्छिक घटनाओं से गुजरती हैं। संभाव्यता सिद्धांत इन पैटर्नों का अध्ययन करता है।

संभाव्यता सिद्धांत उन घटनाओं के अध्ययन से संबंधित है, जिनकी घटना निश्चित रूप से ज्ञात नहीं है। यह आपको दूसरों की तुलना में कुछ घटनाओं के घटित होने की संभावना की डिग्री का न्याय करने की अनुमति देता है।

उदाहरण के लिए: एक सिक्का उछालने के परिणामस्वरूप "सिर" या "पूंछ" के नुकसान के परिणाम को स्पष्ट रूप से निर्धारित करना असंभव है, लेकिन कई उछाल के साथ, लगभग वही नंबरसिर और पूंछ, जिसका मतलब है कि सिर या पूंछ होने की 50% संभावना है।

परीक्षणइस मामले में, शर्तों के एक निश्चित सेट के कार्यान्वयन को कहा जाता है, अर्थात् इस मामले मेंसिक्के को उछालना। चुनौती को असीमित बार खेला जा सकता है। इस मामले में, परिस्थितियों के परिसर में यादृच्छिक कारक शामिल हैं।

परीक्षा परिणाम है प्रतिस्पर्धा. घटना होती है:

  1. विश्वसनीय (हमेशा परीक्षण के परिणामस्वरूप होता है)।
  2. असंभव (कभी नहीं होता)।
  3. यादृच्छिक (परीक्षण के परिणामस्वरूप हो भी सकता है और नहीं भी)।

उदाहरण के लिए, एक सिक्का उछालते समय असंभव घटना- सिक्का किनारे पर होगा, एक यादृच्छिक घटना - "सिर" या "पूंछ" का नुकसान। विशिष्ट परीक्षा परिणाम को कहा जाता है प्रारंभिक घटना. परीक्षण के परिणामस्वरूप, केवल प्राथमिक घटनाएं होती हैं। सभी संभावित, भिन्न, विशिष्ट परीक्षण परिणामों की समग्रता कहलाती है प्राथमिक घटना स्थान.

सिद्धांत की मूल अवधारणाएं

संभावना- घटना के घटित होने की संभावना की डिग्री। जब किसी संभावित घटना के होने के कारण वास्तव में विपरीत कारणों से अधिक होते हैं, तो इस घटना को संभावित कहा जाता है, अन्यथा - असंभावित या असंभव।

यादृच्छिक मूल्य- यह एक ऐसा मूल्य है, जो परीक्षण के परिणामस्वरूप, एक या दूसरा मान ले सकता है, और यह पहले से ज्ञात नहीं है कि कौन सा है। उदाहरण के लिए: प्रतिदिन फायर स्टेशनों की संख्या, 10 शॉट्स के साथ हिट की संख्या आदि।

यादृच्छिक चर को दो श्रेणियों में विभाजित किया जा सकता है।

  1. असतत यादृच्छिक चरऐसा मूल्य कहा जाता है, जो परीक्षण के परिणामस्वरूप ले सकता है कुछ मूल्यएक निश्चित संभावना के साथ, एक गणनीय सेट (एक सेट जिसके तत्वों को क्रमांकित किया जा सकता है) बनाते हैं। यह सेट या तो परिमित या अनंत हो सकता है। उदाहरण के लिए, लक्ष्य पर पहली हिट से पहले शॉट्स की संख्या एक असतत यादृच्छिक चर है, क्योंकि यह मान अनंत पर ले सकता है, हालांकि गणनीय, मानों की संख्या।
  2. सतत यादृच्छिक चरएक मात्रा है जो किसी परिमित या अनंत अंतराल से कोई भी मान ले सकती है। जाहिर है, एक सतत यादृच्छिक चर के संभावित मूल्यों की संख्या अनंत है।

प्रायिकता स्थान- ए.एन. द्वारा पेश की गई अवधारणा। कोलमोगोरोव ने XX सदी के 30 के दशक में संभाव्यता की अवधारणा को औपचारिक रूप दिया, जिसने को जन्म दिया त्वरित विकासएक कठोर गणितीय अनुशासन के रूप में संभाव्यता सिद्धांत।

संभाव्यता स्थान एक तिहाई है (कभी-कभी कोण कोष्ठक में तैयार किया जाता है: , जहां

यह एक मनमाना समुच्चय है, जिसके तत्व प्राथमिक घटनाएँ, परिणाम या बिंदु कहलाते हैं;
- उपसमुच्चय का सिग्मा-बीजगणित (यादृच्छिक) घटनाएँ;
- संभाव्य उपाय या संभाव्यता, अर्थात। सिग्मा-योज्य परिमित माप जैसे कि .

डी मोइवरे-लाप्लास प्रमेय- 1812 में लाप्लास द्वारा स्थापित संभाव्यता सिद्धांत के सीमित प्रमेयों में से एक। वह कहती है कि दो संभावित परिणामों के साथ एक ही यादृच्छिक प्रयोग को दोहराने में सफलताओं की संख्या लगभग सामान्य रूप से वितरित की जाती है। यह आपको संभाव्यता का अनुमानित मूल्य खोजने की अनुमति देता है।

यदि, प्रत्येक स्वतंत्र परीक्षण के लिए, किसी यादृच्छिक घटना के घटित होने की प्रायिकता () के बराबर है और वास्तव में होने वाले परीक्षणों की संख्या है, तो असमानता की वैधता की संभावना करीब है (बड़े के लिए) लाप्लास इंटीग्रल के मूल्य के लिए।

संभाव्यता सिद्धांत में वितरण कार्य- एक यादृच्छिक चर या एक यादृच्छिक वेक्टर के वितरण की विशेषता वाला एक फ़ंक्शन; संभावना है कि यादृच्छिक मूल्य X, x से कम या उसके बराबर मान लेगा, जहां x मनमाना है वास्तविक संख्या. कुछ शर्तों के तहत, यह पूरी तरह से एक यादृच्छिक चर निर्धारित करता है।

अपेक्षित मूल्य- एक यादृच्छिक चर का औसत मूल्य (यह एक यादृच्छिक चर का संभाव्यता वितरण है, जिसे संभाव्यता सिद्धांत में माना जाता है)। अंग्रेजी साहित्य में, इसे रूसी में - द्वारा दर्शाया गया है। सांख्यिकी में, अंकन का अक्सर उपयोग किया जाता है।

मान लीजिए कि एक प्रायिकता स्थान और उस पर परिभाषित एक यादृच्छिक चर दिया गया है। वह है, परिभाषा के अनुसार, एक मापने योग्य कार्य। फिर, यदि अंतरिक्ष में लेबेस्ग इंटीग्रल मौजूद है, तो इसे गणितीय अपेक्षा, या माध्य मान कहा जाता है, और इसे द्वारा दर्शाया जाता है।

यादृच्छिक चर का प्रसरण- किसी दिए गए यादृच्छिक चर के प्रसार का एक उपाय, यानी गणितीय अपेक्षा से इसका विचलन। रूसी साहित्य और विदेशी में नामित। सांख्यिकी में, पदनाम या अक्सर प्रयोग किया जाता है। वर्गमूलविचरण को मानक विचलन, मानक विचलन या मानक प्रसार कहा जाता है।

आज्ञा देना कुछ पर परिभाषित एक यादृच्छिक चर हो संभाव्यता स्थान. फिर

जहां प्रतीक का अर्थ है अपेक्षित मूल्य.

संभाव्यता सिद्धांत में, दो यादृच्छिक घटनाएंबुलाया स्वतंत्रयदि उनमें से एक के घटित होने से दूसरे के घटित होने की प्रायिकता में परिवर्तन नहीं होता है। इसी प्रकार, दो यादृच्छिक चर कहलाते हैं आश्रितयदि उनमें से एक का मूल्य दूसरे के मूल्यों की संभावना को प्रभावित करता है।

कानून का सबसे सरल रूप बड़ी संख्या- यह बर्नौली का प्रमेय है, जिसमें कहा गया है कि यदि किसी घटना की संभावना सभी परीक्षणों में समान है, तो परीक्षणों की संख्या में वृद्धि के साथ, घटना की आवृत्ति घटना की संभावना की ओर जाती है और यादृच्छिक होना बंद हो जाती है।

संभाव्यता सिद्धांत में बड़ी संख्या का नियम कहता है कि एक निश्चित वितरण से एक परिमित नमूने का अंकगणितीय माध्य उस वितरण के सैद्धांतिक माध्य के करीब है। अभिसरण के प्रकार के आधार पर, बड़ी संख्या का एक कमजोर कानून प्रतिष्ठित किया जाता है, जब संभाव्यता में अभिसरण होता है, और बड़ी संख्या का एक मजबूत कानून, जब अभिसरण लगभग निश्चित रूप से होता है।

बड़ी संख्या के नियम का सामान्य अर्थ - संयुक्त क्रिया एक लंबी संख्यासमान और स्वतंत्र यादृच्छिक कारक एक परिणाम की ओर ले जाते हैं जो सीमा में मामले पर निर्भर नहीं करता है।

परिमित नमूने के विश्लेषण के आधार पर संभाव्यता का अनुमान लगाने के तरीके इस संपत्ति पर आधारित हैं। अच्छा उदाहरणमतदाताओं के नमूने के आधार पर चुनाव परिणामों की भविष्यवाणी है।

केंद्रीय सीमा प्रमेय- संभाव्यता सिद्धांत में प्रमेयों का एक वर्ग, जिसमें कहा गया है कि पर्याप्त रूप से बड़ी संख्या में कमजोर निर्भर यादृच्छिक चर का योग जिसमें लगभग समान पैमाना होता है (कोई भी शब्द हावी नहीं होता है, योग में निर्णायक योगदान नहीं देता है) का वितरण करीब है सामान्य।

चूंकि अनुप्रयोगों में कई यादृच्छिक चर कई कमजोर निर्भर यादृच्छिक कारकों के प्रभाव में बनते हैं, इसलिए उनका वितरण सामान्य माना जाता है। इस मामले में, इस शर्त को देखा जाना चाहिए कि कोई भी कारक प्रमुख नहीं है। इन मामलों में केंद्रीय सीमा प्रमेय सामान्य वितरण के आवेदन को सही ठहराते हैं।

खंड 6. विशिष्ट वितरण कानून और यादृच्छिक चर की संख्यात्मक विशेषताएं

फलन F(x), p(x), या गणना p(x i) के रूप को यादृच्छिक चर का वितरण नियम कहा जाता है। जबकि कोई अनंत प्रकार के यादृच्छिक चर की कल्पना कर सकता है, वितरण के बहुत कम नियम हैं। सबसे पहले, विभिन्न यादृच्छिक चर में समान वितरण कानून हो सकते हैं। उदाहरण के लिए: y को प्रायिकता 0.5 के साथ केवल 2 मान 1 और -1 लेने दें; मान z = -y का वितरण नियम बिल्कुल समान है।
दूसरे, बहुत बार यादृच्छिक चरों में समान वितरण नियम होते हैं, उदाहरण के लिए, उनके लिए p(x) एक ही रूप के सूत्रों द्वारा व्यक्त किया जाता है, केवल एक या अधिक स्थिरांक में भिन्न होता है। इन स्थिरांकों को वितरण पैरामीटर कहा जाता है।

हालांकि, सिद्धांत रूप में, अधिकांश अलग कानूनवितरण, कुछ सबसे विशिष्ट कानूनों पर यहां विचार किया जाएगा। उन स्थितियों पर ध्यान देना महत्वपूर्ण है जिनके तहत वे उत्पन्न होते हैं, इन वितरणों के पैरामीटर और गुण।

एक । वर्दी वितरण
यह एक यादृच्छिक चर के वितरण का नाम है जो अंतराल (ए, बी) में कोई भी मान ले सकता है, और (ए, बी) के अंदर किसी भी खंड में गिरने की संभावना खंड की लंबाई के समानुपाती होती है और इसकी स्थिति पर निर्भर नहीं करता है, और (ए, बी) के बाहर मूल्यों की संभावना 0 के बराबर है।


चित्र 6.1 एकसमान बंटन का फलन और घनत्व

वितरण पैरामीटर: ए, बी

2. सामान्य वितरण
सूत्र द्वारा वर्णित घनत्व के साथ वितरण

(6.1)

सामान्य कहा जाता है।
वितरण पैरामीटर: ए,


चित्र 6.2 घनत्व और सामान्य वितरण फलन का विशिष्ट दृश्य

3. बर्नौली वितरण
यदि स्वतंत्र परीक्षणों की एक श्रृंखला बनाई जाती है, जिनमें से प्रत्येक घटना में ए समान संभावना पी के साथ प्रकट हो सकता है, तो घटना की घटनाओं की संख्या बर्नौली कानून के अनुसार या द्विपद कानून के अनुसार वितरित एक यादृच्छिक चर है। (दूसरा वितरण नाम).

यहाँ n श्रृंखला में परीक्षणों की संख्या है, m एक यादृच्छिक चर है (घटना A की घटनाओं की संख्या), P n (m) संभावना है कि A ठीक m बार होगा, q \u003d 1 - p (द संभावना है कि ए परीक्षण में उपस्थित नहीं होगा)।

उदाहरण 1 : एक पासे को 5 बार उछाला जाता है, एक 6 के दो बार लुढ़कने की प्रायिकता क्या है?
n=5, m=2, p=1/6, q=5/6

वितरण पैरामीटर: एन, पी

4. पॉसों वितरण
पॉइसन वितरण बर्नौली वितरण के एक सीमित मामले के रूप में प्राप्त किया जाता है यदि पी शून्य की ओर जाता है और n अनंत तक जाता है, लेकिन इस तरह से कि उनका उत्पाद स्थिर रहता है: np = a। औपचारिक रूप से, ऐसे सीमा के लिए मार्गसूत्र की ओर जाता है

वितरण पैरामीटर: ए

पॉइसन वितरण विज्ञान और व्यावहारिक जीवन में कई यादृच्छिक चर के अधीन है।

उदाहरण 2: एक घंटे में एम्बुलेंस स्टेशन पर प्राप्त कॉलों की संख्या।
आइए हम समय अंतराल T (1 घंटा) को छोटे अंतराल dt में विभाजित करें, जैसे कि dt के दौरान दो या अधिक कॉल प्राप्त करने की संभावना नगण्य है, और एक कॉल p की संभावना dt: p = μdt के समानुपाती है;
हम क्षणों के दौरान अवलोकन पर विचार करेंगे डीटी स्वतंत्र परीक्षण के रूप में, समय के दौरान ऐसे परीक्षणों की संख्या टी: एन = टी / डीटी;
यदि हम यह मान लें कि कॉल प्राप्त करने की प्रायिकता घंटे के दौरान नहीं बदलती है, तो कुल गणनाकॉल मापदंडों के साथ बर्नौली के नियम का पालन करते हैं: n = T / dt, p = μdt। dt को शून्य की ओर रखते हुए, हम पाते हैं कि n अनंत की ओर जाता है, और उत्पाद n × p स्थिर रहता है: a = n × p = μT।

उदाहरण 3: अणुओं की संख्या आदर्श गैसकुछ निश्चित आयतन में V.
आइए हम आयतन V को छोटे आयतन dV में इस प्रकार विभाजित करें कि dV में दो या दो से अधिक अणुओं के मिलने की संभावना न के बराबर हो, और एक अणु को खोजने की संभावना dV के समानुपाती हो: р = μdV; हम प्रत्येक वॉल्यूम dV के अवलोकन पर विचार करेंगे: स्वतंत्र परीक्षण, ऐसे परीक्षणों की संख्या n=V/dV; यदि हम यह मान लें कि V के भीतर कहीं भी अणु खोजने की प्रायिकताएँ समान हैं, तो आयतन V में अणुओं की कुल संख्या बर्नौली के नियम का पालन मापदंडों के साथ करती है: n = V / dV, p = μdV। dV को शून्य होने देते हुए, हम पाते हैं कि n अनंत की ओर जाता है, और उत्पाद n × p स्थिर रहता है: a = n × p = μV।

यादृच्छिक चर की संख्यात्मक विशेषताएं

एक । गणितीय अपेक्षा (औसत मूल्य)

परिभाषा:
गणितीय अपेक्षा है
  (6.4)

योग उन सभी मानों पर लिया जाता है जो यादृच्छिक चर लेता है। श्रृंखला पूरी तरह से अभिसरण होनी चाहिए (अन्यथा, यादृच्छिक चर कहा जाता है कि कोई गणितीय अपेक्षा नहीं है)

;   (6.5)

अभिन्न बिल्कुल अभिसरण होना चाहिए (अन्यथा यादृच्छिक चर के लिए कोई अपेक्षित मूल्य नहीं कहा जाता है)


गणितीय अपेक्षा के गुण:

ए। अगर साथ - लगातार, तो एमएस = सी
बी। एमएक्स = एसएमएक्स
सी। यादृच्छिक चरों के योग की गणितीय अपेक्षा हमेशा उनकी गणितीय अपेक्षाओं के योग के बराबर होती है: (х+y) = Мх + Мy d । सशर्त गणितीय अपेक्षा की अवधारणा पेश की गई है। यदि एक यादृच्छिक चर अपने मान x i को विभिन्न संभावनाओं के साथ लेता है p(x i /H j) at अलग-अलग स्थितियांएच जे , तो सशर्त अपेक्षा निर्धारित की जाती है

जैसा या ;   (6.6)

यदि घटनाओं की प्रायिकताएँ H j ज्ञात हों, तो पूर्ण

अपेक्षित मूल्य: ;   (6.7)

उदाहरण 4: हथियारों के पहले कोट के प्रकट होने से पहले आपको औसतन कितनी बार एक सिक्के को उछालने की आवश्यकता है? इस समस्या को हल किया जा सकता है "माथे पर"

एक्स मैं 1 2 3 ... के..
पी(एक्स मैं) :  ,

लेकिन इस राशि की गणना अभी भी की जानी है। सशर्त और पूर्ण गणितीय अपेक्षा की अवधारणाओं का उपयोग करके आप इसे आसान कर सकते हैं। परिकल्पनाओं पर विचार करें एच 1 - हथियारों का कोट पहली बार गिर गया, एच 2 - यह पहली बार नहीं गिरा। जाहिर है, पी (एच 1) \u003d पी (एच 2) \u003d ½; एमएक्स / एच 1 \u003d 1;
एमएक्स / एच 2 वांछित पूर्ण अपेक्षा से 1 अधिक है, क्योंकि सिक्के के पहले उछाल के बाद, स्थिति नहीं बदली है, लेकिन एक बार इसे पहले ही उछाल दिया गया है। पूर्ण गणितीय अपेक्षा के सूत्र का उपयोग करते हुए, हमारे पास Mx \u003d Mx / H 1 × p (H 1) + Mx / H 2 × p (H 2) \u003d 1 × 0.5 + (Mx + 1) × 0.5, हल है। एमएक्स के लिए समीकरण, हम तुरंत एमएक्स = 2 प्राप्त करते हैं।

इ। यदि f(x) एक यादृच्छिक चर x का एक फलन है, तो एक यादृच्छिक चर के एक फलन की गणितीय अपेक्षा की अवधारणा को परिभाषित किया गया है:

असतत यादृच्छिक चर के लिए: ;   (6.8)

योग उन सभी मानों पर लिया जाता है जो यादृच्छिक चर लेता है। श्रृंखला बिल्कुल अभिसरण होनी चाहिए।

एक सतत यादृच्छिक चर के लिए: ;   (6.9)

अभिन्न बिल्कुल अभिसरण होना चाहिए।

2. यादृच्छिक चर का प्रसरण
परिभाषा:
एक यादृच्छिक चर x का फैलाव इसकी गणितीय अपेक्षा से मात्रा के मान के वर्ग विचलन की गणितीय अपेक्षा है: Dx = M(x-Mx) 2

असतत यादृच्छिक चर के लिए: ;   (6.10)

योग उन सभी मानों पर लिया जाता है जो यादृच्छिक चर लेता है। श्रृंखला अभिसरण होना चाहिए (अन्यथा यादृच्छिक चर कहा जाता है कि कोई भिन्नता नहीं है)

एक सतत यादृच्छिक चर के लिए: ;   (6.11)

अभिन्न अभिसरण होना चाहिए (अन्यथा यादृच्छिक चर कहा जाता है कि कोई भिन्नता नहीं है)

फैलाव गुण:
ए। यदि C एक स्थिर मान है, तो DC = 0
बी। डीСх = С 2 डीх
सी। यादृच्छिक चरों के योग का प्रसरण हमेशा उनके प्रसरणों के योग के बराबर होता है, यदि ये चर स्वतंत्र हों (स्वतंत्र चर की परिभाषा)
डी। विचरण की गणना करने के लिए, सूत्र का उपयोग करना सुविधाजनक है:

डीएक्स = एमएक्स 2 - (एमएक्स) 2 (6.12)

संख्यात्मक विशेषताओं का संबंध
और विशिष्ट वितरण के पैरामीटर

वितरणविकल्पसूत्रएमएक्सडीएक्स
वर्दीए, बी (बी+ए) / 2(बी-ए) 2 / 12
सामान्यए, 2
Bernoulliएन, पी एनपीएनपीक्यू
प्वासों

व्यवहार में, अधिकांश यादृच्छिक चर प्रभावित होते हैं एक बड़ी संख्या कीयादृच्छिक कारक, पालन करें सामान्य कानूनसंभाव्यता वितरण। इसलिए, संभाव्यता सिद्धांत के विभिन्न अनुप्रयोगों में, इस कानून का विशेष महत्व है।

एक यादृच्छिक चर $X$ सामान्य संभाव्यता वितरण कानून का पालन करता है यदि इसकी संभाव्यता वितरण घनत्व निम्न रूप है

$$f\बाएं(x\दाएं)=((1)\over (\sigma \sqrt(2\pi )))e^(-(((\left(x-a\right))^2)\over ( 2(\sigma )^2))$$

योजनाबद्ध रूप से, फ़ंक्शन $f\left(x\right)$ का ग्राफ चित्र में दिखाया गया है और इसका नाम "गॉसियन कर्व" है। इस ग्राफिक के दाईं ओर जर्मन 10 मार्क बैंकनोट है, जो यूरो की शुरुआत से पहले भी उपयोग में था। यदि आप बारीकी से देखें, तो आप इस नोट पर गाऊसी वक्र और इसके खोजकर्ता को देख सकते हैं महानतम गणितज्ञकार्ल फ्रेडरिक गॉस।

आइए अपने घनत्व फ़ंक्शन $f\left(x\right)$ पर वापस जाएं और वितरण पैरामीटर $a,\ (\sigma)^2$ के बारे में कुछ स्पष्टीकरण दें। पैरामीटर $a$ यादृच्छिक चर के मानों के फैलाव के केंद्र की विशेषता है, अर्थात इसका गणितीय अपेक्षा का अर्थ है। जब पैरामीटर $a$ बदलता है और पैरामीटर $(\sigma )^2$ अपरिवर्तित रहता है, तो हम एब्सिस्सा अक्ष के साथ फ़ंक्शन $f\left(x\right)$ के ग्राफ़ की शिफ्ट का निरीक्षण कर सकते हैं, जबकि घनत्व ग्राफ स्वयं अपना आकार नहीं बदलता है।

पैरामीटर $(\sigma )^2$ विचरण है और घनत्व वक्र $f\left(x\right)$ के आकार की विशेषता है। पैरामीटर $(\sigma )^2$ को पैरामीटर $a$ अपरिवर्तित के साथ बदलते समय, हम देख सकते हैं कि कैसे घनत्व ग्राफ अपने आकार को बदलता है, सिकुड़ता या खींचता है, जबकि एब्सिस्सा के साथ शिफ्ट नहीं होता है।

किसी दिए गए अंतराल में सामान्य रूप से वितरित यादृच्छिक चर के गिरने की प्रायिकता

जैसा कि ज्ञात है, संभावना है कि एक यादृच्छिक चर $X$ अंतराल $\left(\alpha ;\ \beta \right)$ में आता है $P\left(\alpha) की गणना की जा सकती है< X < \beta \right)=\int^{\beta }_{\alpha }{f\left(x\right)dx}$. Для нормального распределения случайной величины $X$ с параметрами $a,\ \sigma $ справедлива следующая формула:

$$P\बाएं(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right)$$

यहाँ समारोह $\Phi \left(x\right)=((1)\over (\sqrt(2\pi )))\int^x_0(e^(-t^2/2)dt)$ है लाप्लास समारोह। इस फ़ंक्शन के मान से लिए गए हैं। फ़ंक्शन के निम्नलिखित गुण $\Phi \left(x\right)$ नोट किए जा सकते हैं।

1 . $\Phi \left(-x\right)=-\Phi \left(x\right)$, यानी समारोह $\Phi \left(x\right)$ विषम है।

2 . $\Phi \left(x\right)$ एक नीरस रूप से बढ़ता हुआ कार्य है।

3 . $(\mathop(lim)_(x\to +\infty ) \Phi \left(x\right)\ )=0.5$, $(\mathop(lim)_(x\to -\infty ) \ Phi \ लेफ्ट (एक्स\राइट)\ )=-0.5$.

$\Phi \left(x\right)$ फ़ंक्शन के मानों की गणना करने के लिए, आप एक्सेल पैकेज के $f_x$ फ़ंक्शन विज़ार्ड का भी उपयोग कर सकते हैं: $\Phi \left(x\right)=NORMDIST\left (एक्स;0;1;1\दाएं)-0.5$। उदाहरण के लिए, आइए $x=2$ के लिए $\Phi \left(x\right)$ फ़ंक्शन के मानों की गणना करें।

संभावना है कि एक सामान्य रूप से वितरित यादृच्छिक चर $X\in N\left(a;\ (\sigma )^2\right)$ उम्मीद के संबंध में एक अंतराल सममित में गिरता है $a$ की गणना सूत्र द्वारा की जा सकती है

$$पी\बाएं(\बाएं|एक्स-ए\दाएं|< \delta \right)=2\Phi \left({{\delta }\over {\sigma }}\right).$$

थ्री सिग्मा रूल. यह व्यावहारिक रूप से निश्चित है कि सामान्य रूप से वितरित यादृच्छिक चर $X$ अंतराल $\बाएं(a-3\sigma;a+3\sigma \right)$ में आता है।

उदाहरण 1 . यादृच्छिक चर $X$ पैरामीटर $a=2,\ \sigma =3$ के साथ सामान्य संभाव्यता वितरण कानून के अधीन है। प्रायिकता ज्ञात कीजिए कि $X$ अंतराल $\left(0,5;1\right)$ में आता है और प्रायिकता कि असमानता $\left|X-a\right|< 0,2$.

सूत्र का उपयोग करना

$$P\बाएं(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right),$$

$P\left(0,5;1\right)=\Phi \left(((1-2)\over (3))\right)-\Phi \left(((0,5-2)\ over (3))\right)=\Phi\left(-0.33\right)-\Phi \left(-0.5\right)=\Phi \left(0.5\right)-\Phi \ left(0.33\right) =0.191-0.129=$0.062।

$$पी\बाएं(\बाएं|एक्स-ए\दाएं|< 0,2\right)=2\Phi \left({{\delta }\over {\sigma }}\right)=2\Phi \left({{0,2}\over {3}}\right)=2\Phi \left(0,07\right)=2\cdot 0,028=0,056.$$

उदाहरण 2 . मान लीजिए कि वर्ष के दौरान एक निश्चित कंपनी के शेयरों की कीमत एक यादृच्छिक चर है जो सामान्य कानून के अनुसार 50 पारंपरिक मौद्रिक इकाइयों के बराबर गणितीय अपेक्षा और 10 के बराबर मानक विचलन के साथ वितरित किया जाता है। क्या संभावना है कि, यादृच्छिक रूप से चर्चा के तहत अवधि का चुना हुआ दिन, शेयर की कीमत होगी:

क) 70 से अधिक पारंपरिक मौद्रिक इकाइयाँ?

बी) प्रति शेयर 50 से नीचे?

ग) 45 और 58 के बीच सशर्त मौद्रिक इकाइयाँप्रति शेयर?

मान लीजिए कि यादृच्छिक चर $X$ किसी कंपनी के शेयरों की कीमत है। शर्त के अनुसार, $X$ पैरामीटर $a=50$ के साथ एक सामान्य वितरण के अधीन है - गणितीय अपेक्षा, $\sigma =10$ - मानक विचलन. प्रायिकता $P\बाएं(\alpha< X < \beta \right)$ попадания $X$ в интервал $\left(\alpha ,\ \beta \right)$ будем находить по формуле:

$$P\बाएं(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right).$$

$$a)\ P\बाएं(X>70\दाएं)=\Phi \बाएं(((\infty -50)\over (10))\right)-\Phi \left(((70-50)\ ओवर (10))\दाएं)=0.5-\Phi \बाएं(2\दाएं)=0.5-0.4772=0.0228.$$

$$b)\ P\बाएं(X< 50\right)=\Phi \left({{50-50}\over {10}}\right)-\Phi \left({{-\infty -50}\over {10}}\right)=\Phi \left(0\right)+0,5=0+0,5=0,5.$$

$$c)\ P\बाएं(45< X < 58\right)=\Phi \left({{58-50}\over {10}}\right)-\Phi \left({{45-50}\over {10}}\right)=\Phi \left(0,8\right)-\Phi \left(-0,5\right)=\Phi \left(0,8\right)+\Phi \left(0,5\right)=$$

विदेशी नामों के बावजूद, सामान्य वितरण काफी सहज और एक दूसरे से संबंधित हैं दिलचस्प तरीकेजिससे उन्हें याद रखना और आत्मविश्वास से उनके बारे में बात करना आसान हो जाता है। कुछ स्वाभाविक रूप से अनुसरण करते हैं, उदाहरण के लिए, बर्नौली वितरण से। इन कनेक्शनों का नक्शा दिखाने का समय आ गया है।

प्रत्येक वितरण को उसके वितरण घनत्व फलन (DDF) के उदाहरण द्वारा दर्शाया गया है। यह लेख केवल उन वितरणों के बारे में है जिनके परिणाम − . हैं एकल संख्या. इसलिए, क्षैतिज अक्षप्रत्येक ग्राफ संभावित संख्या-परिणामों का एक समूह है। लंबवत - प्रत्येक परिणाम की संभावना। कुछ वितरण असतत हैं - उनके परिणाम पूर्णांक होने चाहिए, जैसे कि 0 या 5। ये विरल रेखाओं द्वारा इंगित किए जाते हैं, प्रत्येक परिणाम के लिए एक, इस परिणाम की संभावना के अनुरूप ऊंचाई के साथ। कुछ निरंतर हैं, उनके परिणाम कोई भी ले सकते हैं अंकीय मूल्य, जैसे -1.32 या 0.005। इन्हें घने वक्रों के रूप में दिखाया जाता है, जिनमें वक्र के अनुभागों के नीचे के क्षेत्र होते हैं जो संभावनाएं देते हैं। वक्रों के नीचे की रेखाओं और क्षेत्रों की ऊंचाई का योग हमेशा 1 होता है।

इसे प्रिंट करें, बिंदीदार रेखा के साथ काटें, और इसे अपने बटुए में अपने साथ रखें। यह वितरण के देश और उनके रिश्तेदारों के लिए आपका मार्गदर्शक है।

बर्नौली और वर्दी

आप ऊपर दिए गए बर्नौली वितरण को पहले ही दो परिणामों के साथ पूरा कर चुके हैं - शीर्ष या पूंछ। अब इसे 0 और 1, 0 पर चित और 1 पट होने के वितरण के रूप में कल्पना करें। जैसा कि पहले से ही स्पष्ट है, दोनों परिणाम समान रूप से होने की संभावना है, और यह आरेख में परिलक्षित होता है। बर्नौली पीडीएफ में दो लाइनें हैं एक ही ऊंचाई 2 समान रूप से संभावित परिणामों का प्रतिनिधित्व करते हैं: क्रमशः 0 और 1,।

बर्नौली वितरण असमान परिणामों का भी प्रतिनिधित्व कर सकता है, जैसे कि गलत सिक्का उछालना। तब हेड्स की प्रायिकता 0.5 नहीं होगी, बल्कि कुछ अन्य मान p होगी, और टेल्स की प्रायिकता 1-p होगी। कई अन्य वितरणों की तरह, यह वास्तव में कुछ मापदंडों को दिए गए वितरण का एक पूरा परिवार है, जैसे कि p ऊपर। जब आप "बर्नौली" सोचते हैं - "एक (संभवतः गलत) सिक्का उछालने" के बारे में सोचें।

इसलिए बहुत छोटा कदमकई संभावित परिणामों पर वितरण प्रस्तुत करने से पहले: एक समान वितरण एक फ्लैट पीडीएफ द्वारा विशेषता। सही का प्रतिनिधित्व करें पासा. उसके परिणाम 1-6 समान रूप से संभावित हैं। इसे किसी भी परिणाम n के लिए सेट किया जा सकता है, और यहां तक ​​कि एक सतत वितरण के रूप में भी।

के बारे में सोचो वर्दी वितरणएक "सही पासा" के रूप में।

द्विपद और हाइपरज्यामितीय

द्विपद वितरण को उन चीजों के परिणामों के योग के रूप में माना जा सकता है जो बर्नौली वितरण का अनुसरण करते हैं।

एक ईमानदार सिक्के को दो बार पलटें - यह कितनी बार चित होगा? यह एक संख्या है जो द्विपद बंटन का पालन करती है। इसके पैरामीटर n हैं, परीक्षणों की संख्या, और p "सफलता" की संभावना है (हमारे मामले में, शीर्ष या 1)। प्रत्येक रोल एक बर्नौली वितरित परिणाम, या परीक्षण है। एक सिक्का उछालने जैसी चीजों में सफलताओं की संख्या की गणना करते समय द्विपद वितरण का उपयोग करें, जहां प्रत्येक फ्लिप दूसरों से स्वतंत्र है और सफलता की समान संभावना है।

या एक कलश की कल्पना करें जिसमें समान संख्या में सफेद और काली गेंदें हों। अपनी आँखें बंद करो, गेंद को बाहर खींचो, उसका रंग लिखो और उसे वापस लौटा दो। दोहराना। काली गेंद कितनी बार खींची गई है? यह संख्या द्विपद बंटन का भी अनुसरण करती है।

यह अजीब स्थितिहमने हाइपरज्यामितीय वितरण के अर्थ को समझना आसान बनाने के लिए परिचय दिया है। यह उसी संख्या का बंटन है, लेकिन ऐसी स्थिति में यदि हम नहींगेंदों को वापस करो। यह निश्चित रूप से चचेरा भाईद्विपद बंटन, लेकिन समान नहीं, क्योंकि प्रत्येक गेंद निकालने के साथ सफलता की संभावना बदल जाती है। यदि ड्रॉ की संख्या की तुलना में गेंदों की संख्या काफी बड़ी है, तो ये वितरण लगभग समान हैं, क्योंकि सफलता की संभावना प्रत्येक ड्रॉ के साथ बहुत कम बदलती है।

जब कोई बिना वापस आए कलशों से गेंदों को निकालने की बात करता है, तो "हाँ, हाइपरज्यामितीय वितरण" कहना लगभग हमेशा सुरक्षित होता है, क्योंकि अपने जीवन में मैं अभी तक किसी ऐसे व्यक्ति से नहीं मिला हूँ जो वास्तव में कलशों को गेंदों से भर दे और फिर उन्हें बाहर निकाल कर वापस लौट आए। उन्हें, या इसके विपरीत। कलशों से मेरा कोई मित्र भी नहीं है। और भी अधिक बार, यह वितरण एक नमूने के रूप में कुछ सामान्य आबादी के महत्वपूर्ण उपसमुच्चय को चुनते समय सामने आना चाहिए।

टिप्पणी। अनुवाद

यह यहाँ बहुत स्पष्ट नहीं हो सकता है, लेकिन शुरुआती लोगों के लिए ट्यूटोरियल और एक्सप्रेस कोर्स के बाद से, इसे समझाना आवश्यक होगा। जनसंख्या एक ऐसी चीज है जिसका हम सांख्यिकीय रूप से मूल्यांकन करना चाहते हैं। अनुमान लगाने के लिए, हम एक निश्चित भाग (सबसेट) का चयन करते हैं और उस पर आवश्यक अनुमान लगाते हैं (तब इस उपसमुच्चय को एक नमूना कहा जाता है), यह मानते हुए कि अनुमान पूरी आबादी के लिए समान होगा। लेकिन यह सच होने के लिए, नमूने के सबसेट की परिभाषा पर अक्सर अतिरिक्त प्रतिबंधों की आवश्यकता होती है (या इसके विपरीत, एक ज्ञात नमूने से, हमें यह मूल्यांकन करने की आवश्यकता है कि क्या यह जनसंख्या का सटीक रूप से पर्याप्त वर्णन करता है)।

एक व्यावहारिक उदाहरण - हमें E3 की यात्रा करने के लिए 100 लोगों की कंपनी से प्रतिनिधियों का चयन करने की आवश्यकता है। मालूम हो कि पिछले साल इसमें 10 लोग यात्रा कर चुके हैं (लेकिन किसी की पहचान नहीं है)। कम से कम कितना लेना चाहिए ताकि कम से कम एक अनुभवी कॉमरेड के समूह में होने की संभावना हो? इस मामले में आबादी- 100, चयन - 10, चयन आवश्यकताएँ - कम से कम एक जो पहले ही E3 की यात्रा कर चुका है।

विकिपीडिया में एक बैच में दोषपूर्ण भागों के बारे में कम मज़ेदार लेकिन अधिक व्यावहारिक उदाहरण है।

प्वाइजन

कॉल करने वाले ग्राहकों की संख्या के बारे में क्या? हॉटलाइनहर मिनट तकनीकी सहायता के लिए? यह एक परिणाम है जिसका वितरण पहली नज़र में द्विपद है, अगर हम हर सेकंड को बर्नौली परीक्षण के रूप में मानते हैं, जिसके दौरान ग्राहक या तो कॉल नहीं करता है (0) या कॉल नहीं करता है (1)। लेकिन बिजली आपूर्ति संगठन अच्छी तरह से जानते हैं: जब बिजली बंद हो जाती है, तो दो लोग एक सेकंड में कॉल कर सकते हैं। या सौ से भी अधिकलोगों का। इसे 60,000 मिलीसेकंड परीक्षणों के रूप में प्रस्तुत करना या तो मदद नहीं करता है - अधिक परीक्षण हैं, प्रति मिलीसेकंड कॉल की संभावना कम है, भले ही आप एक ही समय में दो या अधिक की गणना न करें, लेकिन, तकनीकी रूप से, यह अभी भी एक नहीं है बर्नौली परीक्षण। हालाँकि, तार्किक तर्क अनंत में संक्रमण के साथ काम करता है। मान लीजिए n अनंत तक जाता है और p 0 पर जाता है, ताकि np स्थिर रहे। यह कॉल की कम और कम संभावना के साथ समय के छोटे और छोटे अंशों में विभाजित करने जैसा है। सीमा में, हमें पॉइसन वितरण मिलता है।

द्विपद वितरण की तरह, पॉइसन वितरण एक मात्रा वितरण है: जितनी बार कुछ होता है। यह प्रायिकता p और परीक्षणों की संख्या n द्वारा नहीं, बल्कि औसत तीव्रता द्वारा पैरामीट्रिज किया जाता है, जो कि द्विपद के अनुरूप है, बस है नियत मानएन.पी. पॉइसन वितरण क्या है ज़रूरीयाद रखें जब घटनाओं की गिनती की बात आती है कुछ समयनिरंतर दी गई तीव्रता पर।

जब राउटर पर पैकेट आने या स्टोर में आने वाले ग्राहक या लाइन में कुछ इंतजार करने जैसा कुछ होता है, तो पॉइसन के बारे में सोचें।

ज्यामितीय और ऋणात्मक द्विपद

से सरल परीक्षणबर्नौली एक और वितरण प्रतीत होता है। एक सिक्का चित आने से पहले कितनी बार पट आता है? पूंछ की संख्या एक ज्यामितीय वितरण का अनुसरण करती है। बर्नौली वितरण की तरह, यह एक सफल परिणाम की संभावना से पैरामीट्रिज्ड है, पी। यह संख्या n, परीक्षणों की संख्या से पैरामीट्रिज्ड नहीं है, क्योंकि असफल परीक्षणों की संख्या ठीक परिणाम है।

यदि द्विपद वितरण "कितनी सफलताएँ" है, तो ज्यामितीय वितरण "सफलता से पहले कितनी विफलताएँ हैं?"।

ऋणात्मक द्विपद बंटन पिछले द्विपद बंटन का सरल सामान्यीकरण है। यह r होने से पहले विफलताओं की संख्या है, 1 नहीं, सफलताएँ। इसलिए, यह अतिरिक्त रूप से इस r द्वारा parametrized है। इसे कभी-कभी r विफलताओं से पहले सफलताओं की संख्या के रूप में वर्णित किया जाता है। लेकिन, जैसा कि मेरे जीवन के कोच कहते हैं: "आप तय करते हैं कि सफलता क्या है और विफलता क्या है", तो यह वही है, अगर आप यह नहीं भूलते हैं कि संभावना पी भी होनी चाहिए सही संभावनाक्रमशः सफलता या असफलता।

यदि आपको तनाव को दूर करने के लिए एक चुटकुला की आवश्यकता है, तो आप उल्लेख कर सकते हैं कि द्विपद और हाइपरजोमेट्रिक वितरण एक स्पष्ट जोड़ी हैं, लेकिन ज्यामितीय और नकारात्मक द्विपद वितरण भी काफी समान हैं, और फिर बताएं "अच्छा, उन सभी को कौन कहता है, हुह? "

घातीय और वेइबुल

तकनीकी सहायता के लिए कॉल के बारे में फिर से: अगली कॉल से पहले कितना समय लगेगा? इस प्रतीक्षा समय का वितरण ज्यामितीय प्रतीत होता है, क्योंकि हर सेकंड जब तक कोई कॉल नहीं करता तब तक विफलता की तरह होता है, जब तक कि कॉल अंत में न हो जाए। विफलताओं की संख्या सेकंड की संख्या की तरह है जब तक कि किसी ने कॉल नहीं किया, और यह है वास्तव मेंअगली कॉल तक का समय, लेकिन "व्यावहारिक रूप से" हमारे लिए पर्याप्त नहीं है। लब्बोलुआब यह है कि यह समय पूरे सेकंड का योग होगा, और इस प्रकार इस सेकंड के भीतर कॉल तक प्रतीक्षा की गणना करना संभव नहीं होगा।

खैर, पहले की तरह, हम जाते हैं ज्यामितीय वितरणसीमा तक, समय के शेयरों के संबंध में - और वोइला। हमें एक घातीय वितरण मिलता है, जो कॉल से पहले के समय का सटीक वर्णन करता है। ये है निरंतर वितरण, हमारे पास पहला है, क्योंकि जरूरी नहीं कि परिणाम पूरे सेकंड में हो। पोइसन वितरण की तरह, यह तीव्रता द्वारा पैरामीट्रिज्ड है।

द्विपद और ज्यामितीय के बीच संबंध को प्रतिध्वनित करते हुए, पॉइसन के "एक समय में कितनी घटनाएं?" घातांक "घटना से कितने समय पहले?" से संबंधित है। यदि ऐसी घटनाएँ हैं जिनकी संख्या प्रति इकाई समय पॉइसन वितरण का पालन करती है, तो उनके बीच का समय समान पैरामीटर के साथ घातीय वितरण का पालन करता है। दो वितरणों के बीच इस पत्राचार पर ध्यान दिया जाना चाहिए जब किसी पर चर्चा की जाए।

"घटना का समय", शायद "विफलता का समय" के बारे में सोचते समय घातीय वितरण को ध्यान में रखना चाहिए। वास्तव में, यह इतनी महत्वपूर्ण स्थिति है कि एमटीबीएफ का वर्णन करने के लिए अधिक सामान्यीकृत वितरण हैं, जैसे कि वेइबुल वितरण। जबकि घातीय वितरण उपयुक्त होता है जब पहनने या विफलता दर, उदाहरण के लिए, स्थिर, वीबुल वितरण समय के साथ बढ़ती (या घटती) विफलता दर का मॉडल कर सकता है। घातीय, सामान्य तौर पर, एक विशेष मामला।

जब एमटीबीएफ की बात आती है तो वेइबुल के बारे में सोचें।

नॉर्मल, लॉगनॉर्मल, स्टूडेंट और ची-स्क्वायर

सामान्य, या गाऊसी, वितरण शायद सबसे महत्वपूर्ण में से एक है। इसकी घंटी के आकार की आकृति तुरंत पहचानने योग्य है। जैसे, यह एक विशेष रूप से जिज्ञासु इकाई है जो हर जगह प्रकट होती है, यहाँ तक कि सबसे बाहरी रूप से भी सरल स्रोत. मूल्यों का एक सेट लें जो समान वितरण का पालन करते हैं - कोई भी! - और उन्हें मोड़ो। उनकी राशि का वितरण (लगभग) के अधीन है सामान्य वितरण. जितनी अधिक चीजों को संक्षेप में प्रस्तुत किया जाता है, उनकी राशि एक सामान्य वितरण के करीब होती है (चाल: शब्दों का वितरण अनुमानित होना चाहिए, स्वतंत्र होना चाहिए, यह केवल सामान्य होता है)। ऐसा है, मूल वितरण के बावजूद, आश्चर्यजनक है।

टिप्पणी। अनुवाद

मुझे आश्चर्य हुआ कि लेखक तुलनीय वितरण के तुलनीय पैमाने की आवश्यकता के बारे में नहीं लिखता है: यदि कोई दूसरों पर महत्वपूर्ण रूप से हावी है, तो यह बहुत बुरी तरह से अभिसरण करेगा। और, सामान्य तौर पर, पूर्ण पारस्परिक स्वतंत्रता आवश्यक नहीं है, एक कमजोर निर्भरता पर्याप्त है।

खैर, यह शायद पार्टियों के लिए है, जैसा कि उन्होंने लिखा था।


इसे "केंद्रीय सीमा प्रमेय" कहा जाता है, और आपको यह जानना होगा कि यह क्या है, इसे क्यों कहा जाता है और इसका क्या अर्थ है, अन्यथा वे तुरंत इस पर हंसेंगे।

इसके संदर्भ में, सामान्य सभी वितरणों से संबंधित है। हालांकि, मूल रूप से, यह सभी राशियों के वितरण से जुड़ा है। बर्नौली परीक्षणों का योग एक द्विपद वितरण का अनुसरण करता है और, जैसे-जैसे परीक्षणों की संख्या बढ़ती है, यह द्विपद वितरण एक सामान्य वितरण के करीब और करीब होता जाता है। इसी तरह, इसका चचेरा भाई हाइपरजोमेट्रिक वितरण है। पॉसों वितरण - सीमा प्रपत्रद्विपद - तीव्रता पैरामीटर में वृद्धि के साथ सामान्य भी पहुंचता है।

एक लॉगअसामान्य वितरण का अनुसरण करने वाले परिणाम वे मान देते हैं जिनका लघुगणक सामान्य रूप से वितरित होता है। या किसी अन्य तरीके से: सामान्य रूप से वितरित मूल्य के घातांक को सामान्य रूप से वितरित किया जाता है। यदि रकम सामान्य रूप से वितरित की जाती है, तो यह भी याद रखें कि उत्पादों को सामान्य रूप से वितरित किया जाता है।

विद्यार्थी का टी-वितरण टी-टेस्ट का आधार है, जिसका अध्ययन कई गैर-सांख्यिकीविद अन्य क्षेत्रों में करते हैं। इसका उपयोग सामान्य वितरण के माध्य के बारे में अनुमान लगाने के लिए किया जाता है और इसके पैरामीटर बढ़ने पर सामान्य वितरण की ओर भी जाता है। विशेष फ़ीचरटी-वितरण इसकी पूंछ है, जो सामान्य वितरण की तुलना में अधिक मोटी होती है।

यदि मोटी पूंछ वाले किस्से ने आपके पड़ोसी को पर्याप्त रूप से हिला नहीं दिया है, तो बीयर की एक मज़ेदार कहानी पर आगे बढ़ें। 100 साल पहले, गिनीज ने अपने कद को सुधारने के लिए आंकड़ों का इस्तेमाल किया। तब विलियम सीली गॉसेट ने एक पूरी तरह से नया आविष्कार किया सांख्यिकीय सिद्धांतजौ की उन्नत खेती के लिए। गॉसेट ने बॉस को आश्वस्त किया कि अन्य शराब बनाने वाले यह नहीं समझ पाएंगे कि उनके विचारों का उपयोग कैसे किया जाए और इसे प्रकाशित करने की अनुमति मिल गई, लेकिन छद्म नाम "छात्र" के तहत। ज़्यादातर प्रसिद्ध उपलब्धिगॉसेट बस यही टी-वितरण है, जिसे कोई कह सकता है, उसके नाम पर रखा गया है।

अंत में, ची-स्क्वायर वितरण सामान्य रूप से वितरित मात्राओं के वर्गों के योग का वितरण है। इस वितरण पर एक ची-स्क्वायर परीक्षण बनाया गया है, जो स्वयं वर्ग अंतर के योग पर आधारित है, जिसे सामान्य रूप से वितरित किया जाना चाहिए।

गामा और बीटा

इस बिंदु पर, यदि आप पहले से ही कुछ ची-स्क्वायर के बारे में बात कर रहे हैं, तो बातचीत गंभीरता से शुरू होती है। आप शायद पहले से ही वास्तविक सांख्यिकीविदों से बात कर रहे हैं, और शायद यह पहले से ही झुकने लायक है, क्योंकि गामा वितरण जैसी चीजें सामने आ सकती हैं। यह एक सामान्यीकरण है औरघातीय औरची-वर्ग वितरण। घातीय वितरण की तरह, इसका उपयोग जटिल विलंबता मॉडल के लिए किया जाता है। उदाहरण के लिए, गामा वितरण तब प्रकट होता है जब अगली n घटनाओं का समय सिम्युलेटेड होता है। में दिखाई देता है यंत्र अधिगमकुछ अन्य वितरणों के लिए "संयुग्म पूर्व" के रूप में।

इन संयुग्म वितरणों के बारे में बातचीत में शामिल न हों, लेकिन यदि आप ऐसा करते हैं, तो बीटा वितरण का उल्लेख करना न भूलें, क्योंकि यह यहां बताए गए अधिकांश वितरणों से पहले का संयुग्म है। डेटा वैज्ञानिकों को यकीन है कि यह वही है जिसके लिए इसे बनाया गया था। अनजाने में इसका उल्लेख करें और दरवाजे पर जाएं।

बुद्धि की शुरुआत

संभाव्यता वितरण कुछ ऐसा है जिसके बारे में आप बहुत अधिक नहीं जान सकते हैं। वास्तव में रुचि रखने वाले सभी संभाव्यता वितरणों के इस सुपर-विस्तृत मानचित्र का उल्लेख कर सकते हैं टैग जोड़ें

जैसा कि ज्ञात है, अनियमित चर बुलाया चर, जो मामले के आधार पर कुछ मूल्यों को ग्रहण कर सकता है। यादृच्छिक चर निरूपित करते हैं बड़े अक्षर लैटिन वर्णमाला(एक्स, वाई, जेड) और उनके मान उनके संबंधित लोअरकेस अक्षरों (एक्स, वाई, जेड) में हैं। यादृच्छिक चर को असंतत (असतत) और निरंतर में विभाजित किया गया है।

असतत यादृच्छिक चर एक यादृच्छिक चर है जो कुछ गैर-शून्य संभावनाओं वाले मानों का केवल एक परिमित या अनंत (गणनीय) सेट लेता है।

असतत यादृच्छिक चर का वितरण नियम एक फ़ंक्शन है जो एक यादृच्छिक चर के मूल्यों को उनकी संबंधित संभावनाओं से जोड़ता है। वितरण कानून को निम्नलिखित तरीकों में से एक में निर्दिष्ट किया जा सकता है।

1 . वितरण कानून तालिका द्वारा दिया जा सकता है:

जहाँ >0, k = 0, 1, 2,… .

में)के जरिए वितरण फलन F(x) , जो प्रत्येक मान x के लिए प्रायिकता निर्धारित करता है कि यादृच्छिक चर X, x से कम मान लेता है, अर्थात। एफ(एक्स) = पी(एक्स< x).

फलन के गुण F(x)

3 . वितरण कानून को ग्राफिक रूप से सेट किया जा सकता है - वितरण बहुभुज (बहुभुज) (समस्या 3 देखें)।

ध्यान दें कि कुछ समस्याओं को हल करने के लिए, वितरण कानून को जानना आवश्यक नहीं है। कुछ मामलों में, एक या अधिक संख्याओं को जानना पर्याप्त होता है जो सबसे अधिक दर्शाती हैं महत्वपूर्ण विशेषताएंवितरण कानून। यह एक संख्या हो सकती है जिसका एक यादृच्छिक चर के "औसत मूल्य" का अर्थ है, या एक संख्या जो दिखाती है औसत आकारकिसी यादृच्छिक चर का उसके माध्य मान से विचलन। इस प्रकार की संख्याओं को यादृच्छिक चर के संख्यात्मक अभिलक्षण कहते हैं।

मुख्य संख्यात्मक विशेषताएंअसतत यादृच्छिक चर :

  • गणितीय अपेक्षा असतत यादृच्छिक चर का (माध्य मान) एम(एक्स)=Σ एक्स आई पी आई.
    द्विपद बंटन के लिए M(X)=np, पॉइसन बंटन के लिए M(X)=λ
  • फैलाव असतत यादृच्छिक चर डी (एक्स) = एम 2या डी (एक्स) = एम (एक्स 2) - 2. अंतर X-M(X) को एक यादृच्छिक चर का उसकी गणितीय अपेक्षा से विचलन कहा जाता है।
    द्विपद बंटन के लिए D(X)=npq, पॉइसन बंटन के लिए D(X)=λ
  • मानक विचलन (मानक विचलन) (एक्स)=√डी(एक्स).

"असतत यादृच्छिक चर के वितरण का नियम" विषय पर समस्याओं को हल करने के उदाहरण

कार्य 1।

जारी किया गया 1000 लॉटरी टिकट: उनमें से 5 को 500 रूबल की राशि में जीत मिलती है, 10 - 100 रूबल की जीत, 20 - 50 रूबल की जीत, 50 - 10 रूबल की जीत। यादृच्छिक चर X - प्रति टिकट जीत के प्रायिकता वितरण के नियम का निर्धारण करें।

फेसला। समस्या की स्थिति के अनुसार संभव है निम्नलिखित मानयादृच्छिक चर X: 0, 10, 50, 100 और 500।

बिना जीते टिकटों की संख्या 1000 - (5+10+20+50) = 915 है, फिर P(X=0) = 915/1000 = 0.915।

इसी तरह, हम अन्य सभी संभावनाएं पाते हैं: P(X=0) = 50/1000=0.05, P(X=50) = 20/1000=0.02, P(X=100) = 10/1000=0.01 , P(X =500) = 5/1000=0.005। हम परिणामी कानून को एक तालिका के रूप में प्रस्तुत करते हैं:

X की गणितीय अपेक्षा ज्ञात कीजिए: M(X) = 1*1/6 + 2*1/6 + 3*1/6 + 4*1/6 + 5*1/6 + 6*1/6 = (1 + 2+3+4+5+6)/6 = 21/6 = 3.5

कार्य 3.

डिवाइस में तीन स्वतंत्र रूप से काम करने वाले तत्व होते हैं। एक प्रयोग में प्रत्येक तत्व के विफल होने की प्रायिकता 0.1 है। एक प्रयोग में असफल तत्वों की संख्या के लिए एक वितरण कानून बनाएं, एक वितरण बहुभुज बनाएं। वितरण फलन F(x) ज्ञात कीजिए और इसे आलेखित कीजिए। एक असतत यादृच्छिक चर की गणितीय अपेक्षा, विचरण और मानक विचलन ज्ञात कीजिए।

फेसला। 1. असतत यादृच्छिक चर X=(एक प्रयोग में विफल तत्वों की संख्या) में निम्नलिखित हैं संभावित मान: x 1 \u003d 0 (डिवाइस का कोई भी तत्व विफल नहीं हुआ), x 2 \u003d 1 (एक तत्व विफल), x 3 \u003d 2 (दो तत्व विफल) और x 4 \u003d 3 (तीन तत्व विफल)।

तत्वों की विफलताएं एक दूसरे से स्वतंत्र होती हैं, प्रत्येक तत्व की विफलता की संभावनाएं एक दूसरे के बराबर होती हैं, इसलिए यह लागू होता है बर्नौली का सूत्र . यह देखते हुए कि, शर्त के अनुसार, n=3, p=0.1, q=1-p=0.9, हम मानों की प्रायिकता निर्धारित करते हैं:
पी 3 (0) \u003d सी 3 0 पी 0 क्यू 3-0 \u003d क्यू 3 \u003d 0.9 3 \u003d 0.729;
पी 3 (1) \u003d सी 3 1 पी 1 क्यू 3-1 \u003d 3 * 0.1 * 0.9 2 \u003d 0.243;
पी 3 (2) \u003d सी 3 2 पी 2 क्यू 3-2 \u003d 3 * 0.1 2 * 0.9 \u003d 0.027;
पी 3 (3) \u003d सी 3 3 पी 3 क्यू 3-3 \u003d पी 3 \u003d 0.1 3 \u003d 0.001;
जाँच करें: p i = 0.729+0.243+0.027+0.001=1.

इस प्रकार, वांछित द्विपद वितरण नियम X का रूप है:

एब्सिस्सा अक्ष पर, हम संभावित मानों को प्लॉट करते हैं x i, और कोऑर्डिनेट अक्ष पर, संबंधित संभावनाएं р i । आइए अंक एम 1 (0; 0.729), एम 2 (1; 0.243), एम 3 (2; 0.027), एम 4 (3; 0.001) बनाएं। इन बिंदुओं को रेखाखंडों से जोड़ने पर हमें वांछित बंटन बहुभुज प्राप्त होता है।

3. वितरण फलन ज्ञात कीजिए F(x) = P(X

x 0 के लिए हमारे पास F(x) = P(X .) है<0) = 0;
0 . के लिए< x ≤1 имеем F(x) = Р(Х<1) = Р(Х = 0) = 0,729;
1 के लिए< x ≤ 2 F(x) = Р(Х<2) = Р(Х=0) + Р(Х=1) =0,729+ 0,243 = 0,972;
2 के लिए< x ≤ 3 F(x) = Р(Х<3) = Р(Х = 0) + Р(Х = 1) + Р(Х = 2) = 0,972+0,027 = 0,999;
x > 3 के लिए यह F(x) = 1 होगा, क्योंकि घटना निश्चित है।

फलन का ग्राफ F(x)

4. द्विपद बंटन X के लिए:
- गणितीय अपेक्षा М(X) = np = 3*0.1 = 0.3;
- फैलाव डी (एक्स) = एनपीक्यू = 3 * 0.1 * 0.9 = 0.27;
- औसत मानक विचलन(X) = D(X) = 0.27 ≈ 0.52।