गणितीय अपेक्षा और विचरण
आइए एक यादृच्छिक चर को मापें एनउदाहरण के लिए, हम हवा की गति को दस गुना मापते हैं और औसत मान ज्ञात करना चाहते हैं। माध्य मान वितरण फलन से किस प्रकार संबंधित है?
हम पासे को बहुत बार घुमाएंगे। प्रत्येक थ्रो के दौरान पासे पर गिरने वाले अंकों की संख्या एक यादृच्छिक चर है और 1 से 6 तक कोई भी प्राकृतिक मान ले सकता है। एनयह एक बहुत ही विशिष्ट संख्या की ओर जाता है - गणितीय अपेक्षा एमएक्स. इस मामले में एमएक्स = 3,5.
यह मूल्य कैसे आया? भीतर आएं एनटेस्ट एक बार 1 अंक, एक बार - 2 अंक और इसी तरह से बाहर हो गए। फिर एन→ ∞ परिणामों की संख्या जिसमें एक अंक गिरे, इसी प्रकार, यहाँ से
मॉडल 4.5। पासा
आइए अब मान लें कि हम यादृच्छिक चर के वितरण के नियम को जानते हैं एक्स, अर्थात्, हम जानते हैं कि यादृच्छिक चर एक्समान ले सकते हैं एक्स 1 , एक्स 2 , ..., एक्स केसंभावनाओं के साथ पी 1 , पी 2 , ..., पी के.
अपेक्षित मूल्य एमएक्सअनियमित चर एक्सबराबर:
जवाब। 2,8.
गणितीय अपेक्षा हमेशा कुछ यादृच्छिक चर का उचित अनुमान नहीं होती है। इसलिए, औसत वेतन का अनुमान लगाने के लिए, माध्यिका की अवधारणा का उपयोग करना अधिक उचित है, अर्थात ऐसा मूल्य कि औसत वेतन से कम और अधिक प्राप्त करने वाले लोगों की संख्या समान हो।
मंझलाएक यादृच्छिक चर को एक संख्या कहा जाता है एक्स 1/2 ऐसा कि पी (एक्स < एक्स 1/2) = 1/2.
दूसरे शब्दों में, प्रायिकता पी 1 कि यादृच्छिक चर एक्सकम होगा एक्स 1/2 , और प्रायिकता पी 2 कि एक यादृच्छिक चर एक्सबड़ा होगा एक्स 1/2 समान हैं और 1/2 के बराबर हैं। माध्यिका सभी वितरणों के लिए विशिष्ट रूप से निर्धारित नहीं होती है।
यादृच्छिक चर पर वापस जाएं एक्स, जो मान ले सकता है एक्स 1 , एक्स 2 , ..., एक्स केसंभावनाओं के साथ पी 1 , पी 2 , ..., पी के.
फैलावअनियमित चर एक्सएक यादृच्छिक चर के वर्ग विचलन का उसकी गणितीय अपेक्षा से माध्य मान है:
उदाहरण 2
पिछले उदाहरण की शर्तों के तहत, एक यादृच्छिक चर के प्रसरण और मानक विचलन की गणना करें एक्स.
जवाब। 0,16, 0,4.
मॉडल 4.6। लक्ष्य पे निशाना
उदाहरण 3
पहले फेंक से पासे पर लुढ़के अंकों की संख्या, माध्यिका, गणितीय अपेक्षा, विचरण और मानक विचलन का प्रायिकता वितरण ज्ञात कीजिए।
किसी भी चेहरे को गिराना समान रूप से संभावित है, इसलिए वितरण इस तरह दिखेगा:
मानक विचलन यह देखा जा सकता है कि माध्य मान से मान का विचलन बहुत बड़ा है।
गणितीय अपेक्षा के गुण:
- स्वतंत्र यादृच्छिक चर के योग की गणितीय अपेक्षा उनकी गणितीय अपेक्षाओं के योग के बराबर है:
उदाहरण 4
दो पासों पर लुढ़के अंकों के योग और गुणनफल की गणितीय अपेक्षा ज्ञात कीजिए।
उदाहरण 3 में, हमने पाया कि एक घन के लिए एम (एक्स) = 3.5. तो दो घनों के लिए
फैलाव गुण:
- स्वतंत्र यादृच्छिक चर के योग का विचरण, प्रसरणों के योग के बराबर होता है:
डी एक्स + आप = डी एक्स + डीवाई.
चलो एनपासा रोल आपअंक। फिर
यह परिणाम न केवल पासा रोल के लिए सही है। कई मामलों में, यह अनुभवजन्य रूप से गणितीय अपेक्षा को मापने की सटीकता को निर्धारित करता है। यह देखा जा सकता है कि माप की संख्या में वृद्धि के साथ एनमाध्य के आसपास मूल्यों का प्रसार, अर्थात मानक विचलन, आनुपातिक रूप से घटता है
एक यादृच्छिक चर का प्रसरण इस यादृच्छिक चर के वर्ग की गणितीय अपेक्षा से निम्नलिखित संबंध से संबंधित है:
आइए हम इस समानता के दोनों भागों की गणितीय अपेक्षाएँ ज्ञात करें। ए-प्राथमिकता,
गणितीय अपेक्षाओं की संपत्ति के अनुसार समानता के दाहिने पक्ष की गणितीय अपेक्षा बराबर है
मानक विचलन
मानक विचलनविचरण के वर्गमूल के बराबर होता है:
अध्ययन की गई आबादी (n> 30) की पर्याप्त बड़ी मात्रा के लिए मानक विचलन का निर्धारण करते समय, निम्नलिखित सूत्रों का उपयोग किया जाता है:
इसी तरह की जानकारी।
नमूना सर्वेक्षण के अनुसार, जमाकर्ताओं को शहर के सर्बैंक में जमा के आकार के अनुसार समूहीकृत किया गया था:
परिभाषित करना:
1) भिन्नता की सीमा;
2) औसत जमा राशि;
3) औसत रैखिक विचलन;
4) फैलाव;
5) मानक विचलन;
6) योगदान की भिन्नता का गुणांक।
फेसला:
इस वितरण श्रृंखला में खुले अंतराल हैं। ऐसी श्रृंखला में, पहले समूह के अंतराल का मान पारंपरिक रूप से अगले समूह के अंतराल के मान के बराबर माना जाता है, और अंतिम समूह के अंतराल का मान पिछले समूह के अंतराल के मान के बराबर होता है। एक।
दूसरे समूह का अंतराल मान 200 है, इसलिए, पहले समूह का मान भी 200 है। अंतिम समूह का अंतराल मान 200 है, जिसका अर्थ है कि अंतिम अंतराल का भी मान 200 के बराबर होगा।
1) भिन्नता की सीमा को विशेषता के सबसे बड़े और सबसे छोटे मूल्य के बीच के अंतर के रूप में परिभाषित करें:
योगदान के आकार में भिन्नता की सीमा 1000 रूबल है।
2) योगदान का औसत आकार अंकगणितीय भारित औसत के सूत्र द्वारा निर्धारित किया जाता है।
आइए हम प्रत्येक अंतराल में विशेषता के असतत मूल्य को प्रारंभिक रूप से निर्धारित करें। ऐसा करने के लिए, सरल अंकगणितीय माध्य सूत्र का उपयोग करते हुए, हम अंतरालों के मध्य बिंदु पाते हैं।
पहले अंतराल का औसत मान इसके बराबर होगा:
दूसरा - 500, आदि।
आइए गणना के परिणामों को तालिका में रखें:
जमा राशि, रगड़। | योगदानकर्ताओं की संख्या, f | अंतराल के मध्य, x | एक्सएफ |
---|---|---|---|
200-400 | 32 | 300 | 9600 |
400-600 | 56 | 500 | 28000 |
600-800 | 120 | 700 | 84000 |
800-1000 | 104 | 900 | 93600 |
1000-1200 | 88 | 1100 | 96800 |
कुल | 400 | - | 312000 |
शहर के Sberbank में औसत जमा 780 रूबल होगा:
3) औसत रैखिक विचलन कुल औसत से विशेषता के व्यक्तिगत मूल्यों के पूर्ण विचलन का अंकगणितीय औसत है:
अंतराल वितरण श्रृंखला में औसत रैखिक विचलन की गणना करने की प्रक्रिया इस प्रकार है:
1. अंकगणितीय भारित औसत की गणना की जाती है, जैसा कि पैराग्राफ 2 में दिखाया गया है)।
2. माध्य से भिन्न का पूर्ण विचलन निर्धारित किया जाता है:
3. प्राप्त विचलन को आवृत्तियों से गुणा किया जाता है:
4. संकेत को ध्यान में रखे बिना भारित विचलन का योग पाया जाता है:
5. भारित विचलन के योग को आवृत्तियों के योग से विभाजित किया जाता है:
गणना किए गए डेटा की तालिका का उपयोग करना सुविधाजनक है:
जमा राशि, रगड़। | योगदानकर्ताओं की संख्या, f | अंतराल के मध्य, x | |||
---|---|---|---|---|---|
200-400 | 32 | 300 | -480 | 480 | 15360 |
400-600 | 56 | 500 | -280 | 280 | 15680 |
600-800 | 120 | 700 | -80 | 80 | 9600 |
800-1000 | 104 | 900 | 120 | 120 | 12480 |
1000-1200 | 88 | 1100 | 320 | 320 | 28160 |
कुल | 400 | - | - | - | 81280 |
Sberbank ग्राहकों की जमा राशि का औसत रैखिक विचलन 203.2 रूबल है।
4) फैलाव अंकगणित माध्य से प्रत्येक विशेषता मान के वर्ग विचलन का अंकगणितीय माध्य है।
अंतराल वितरण श्रृंखला में विचरण की गणना सूत्र के अनुसार की जाती है:
इस मामले में विचरण की गणना करने की प्रक्रिया इस प्रकार है:
1. अंकगणितीय भारित औसत निर्धारित करें, जैसा कि पैराग्राफ 2 में दिखाया गया है)।
2. माध्य से विचलन ज्ञात कीजिए:
3. माध्य से प्रत्येक विकल्प के विचलन का वर्ग करना:
4. भार (आवृत्तियों) द्वारा वर्ग विचलन को गुणा करें:
5. प्राप्त कार्यों को सारांशित करें:
6. परिणामी राशि को भार (आवृत्तियों) के योग से विभाजित किया जाता है:
आइए गणनाओं को एक तालिका में रखें:
जमा राशि, रगड़। | योगदानकर्ताओं की संख्या, f | अंतराल के मध्य, x | |||
---|---|---|---|---|---|
200-400 | 32 | 300 | -480 | 230400 | 7372800 |
400-600 | 56 | 500 | -280 | 78400 | 4390400 |
600-800 | 120 | 700 | -80 | 6400 | 768000 |
800-1000 | 104 | 900 | 120 | 14400 | 1497600 |
1000-1200 | 88 | 1100 | 320 | 102400 | 9011200 |
कुल | 400 | - | - | - | 23040000 |
परिकल्पनाओं का सांख्यिकीय परीक्षण करते समय, यादृच्छिक चर के बीच एक रैखिक संबंध को मापते समय।
मानक विचलन:
मानक विचलन(यादृच्छिक चर तल के मानक विचलन का एक अनुमान, हमारे चारों ओर की दीवारें और छत, एक्सइसके विचरण के निष्पक्ष अनुमान के आधार पर इसकी गणितीय अपेक्षा के सापेक्ष):
कहाँ - विचरण; - फर्श, हमारे चारों ओर की दीवारें और छत, मैं-वें नमूना तत्व; - नमूने का आकार; - नमूने का अंकगणितीय माध्य:
यह ध्यान दिया जाना चाहिए कि दोनों अनुमान पक्षपाती हैं। सामान्य मामले में, निष्पक्ष अनुमान का निर्माण करना असंभव है। हालांकि, एक निष्पक्ष विचरण अनुमान पर आधारित एक अनुमान सुसंगत है।
तीन सिग्मा नियम
तीन सिग्मा नियम() - सामान्य रूप से वितरित यादृच्छिक चर के लगभग सभी मान अंतराल में होते हैं। अधिक सख्ती से - 99.7% से कम निश्चितता के साथ, सामान्य रूप से वितरित यादृच्छिक चर का मान निर्दिष्ट अंतराल में होता है (बशर्ते कि मान सत्य हो, और नमूना प्रसंस्करण के परिणामस्वरूप प्राप्त न हो)।
यदि सही मूल्य अज्ञात है, तो आपको उपयोग नहीं करना चाहिए, लेकिन फर्श, हमारे चारों ओर की दीवारें और छत, एस. इस प्रकार, थ्री सिग्मा के नियम का अनुवाद थ्री फ्लोर, हमारे चारों ओर की दीवारों और छत के नियम में किया जाता है, एस .
मानक विचलन के मूल्य की व्याख्या
मानक विचलन का एक बड़ा मूल्य सेट के औसत मूल्य के साथ प्रस्तुत सेट में मूल्यों का एक बड़ा प्रसार दर्शाता है; एक छोटा मान, क्रमशः इंगित करता है कि सेट में मान औसत मान के आसपास समूहीकृत हैं।
उदाहरण के लिए, हमारे पास तीन संख्या सेट हैं: (0, 0, 14, 14), (0, 6, 8, 14) और (6, 6, 8, 8)। सभी तीन सेटों में क्रमशः 7 के माध्य मान और 7, 5, और 1 के मानक विचलन होते हैं। अंतिम सेट में एक छोटा मानक विचलन होता है क्योंकि सेट में मान माध्य के आसपास क्लस्टर किए जाते हैं; पहले सेट में मानक विचलन का सबसे बड़ा मान होता है - सेट के भीतर के मान औसत मान से दृढ़ता से भिन्न होते हैं।
सामान्य तौर पर, मानक विचलन को अनिश्चितता का एक उपाय माना जा सकता है। उदाहरण के लिए, भौतिकी में, मानक विचलन का उपयोग कुछ मात्रा के क्रमिक मापों की एक श्रृंखला की त्रुटि को निर्धारित करने के लिए किया जाता है। सिद्धांत द्वारा अनुमानित मूल्य की तुलना में अध्ययन के तहत घटना की संभावना को निर्धारित करने के लिए यह मूल्य बहुत महत्वपूर्ण है: यदि माप का औसत मूल्य सिद्धांत (बड़े मानक विचलन) द्वारा अनुमानित मूल्यों से बहुत भिन्न होता है, तो प्राप्त मूल्यों या उन्हें प्राप्त करने की विधि को फिर से जांचना चाहिए।
प्रायोगिक उपयोग
व्यवहार में, मानक विचलन आपको यह निर्धारित करने की अनुमति देता है कि सेट में मान औसत मूल्य से कितना भिन्न हो सकते हैं।
जलवायु
मान लीजिए कि एक ही औसत दैनिक अधिकतम तापमान वाले दो शहर हैं, लेकिन एक तट पर स्थित है और दूसरा अंतर्देशीय है। तटीय शहरों को अंतर्देशीय शहरों की तुलना में कई अलग-अलग दैनिक अधिकतम तापमान कम होने के लिए जाना जाता है। इसलिए, तटीय शहर में अधिकतम दैनिक तापमान का मानक विचलन दूसरे शहर की तुलना में कम होगा, इस तथ्य के बावजूद कि इस मूल्य का औसत मूल्य उनके लिए समान है, जो व्यवहार में इसका मतलब है कि अधिकतम हवा की संभावना वर्ष के प्रत्येक विशेष दिन का तापमान महाद्वीप के अंदर स्थित एक शहर के लिए औसत मूल्य से अधिक मजबूत होगा।
खेल
आइए मान लें कि कई फ़ुटबॉल टीमें हैं जिन्हें कुछ मापदंडों के अनुसार रैंक किया गया है, उदाहरण के लिए, गोल किए गए और स्वीकार किए गए गोलों की संख्या, स्कोर करने की संभावना आदि। यह सबसे अधिक संभावना है कि इस समूह की सर्वश्रेष्ठ टीम के पास सर्वश्रेष्ठ होगा अधिक मापदंडों में मान। प्रस्तुत मापदंडों में से प्रत्येक के लिए टीम का मानक विचलन जितना छोटा होगा, टीम का परिणाम उतना ही अधिक अनुमानित होगा, ऐसी टीमें संतुलित हैं। दूसरी ओर, एक बड़े मानक विचलन वाली टीम के परिणाम की भविष्यवाणी करना मुश्किल होता है, जो बदले में असंतुलन द्वारा समझाया जाता है, उदाहरण के लिए, एक मजबूत रक्षा, लेकिन एक कमजोर हमला।
टीम के मापदंडों के मानक विचलन का उपयोग किसी को कुछ हद तक दो टीमों के बीच मैच के परिणाम की भविष्यवाणी करने की अनुमति देता है, टीमों की ताकत और कमजोरियों का मूल्यांकन करता है, और इसलिए संघर्ष के चुने हुए तरीके।
तकनीकी विश्लेषण
यह सभी देखें
साहित्य
इस लेख को हटाने का प्रस्ताव है।
कारणों की व्याख्या और संबंधित चर्चा पृष्ठ पर पाई जा सकती है विकिपीडिया: मिटाया जाना/दिसंबर 17, 2012। |
* बोरोविकोव, वी.सांख्यिकी। कंप्यूटर डेटा विश्लेषण की कला: पेशेवरों / वी। बोरोविकोव के लिए। - सेंट पीटर्सबर्ग। : पीटर, 2003. - 688 पी। - आईएसबीएन 5-272-00078-1.
सांख्यिकीय संकेतक | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
वर्णनात्मक आंकड़े |
|
||||||||||
सांख्यिकीय निकासी और इंतिहान परिकल्पना |
|
फैलाव। मानक विचलन
फैलावकुल माध्य से प्रत्येक विशेषता मान के वर्ग विचलन का अंकगणितीय माध्य है। स्रोत डेटा के आधार पर, विचरण भारित (सरल) या भारित हो सकता है।
फैलाव की गणना निम्नलिखित सूत्रों का उपयोग करके की जाती है:
असमूहीकृत डेटा के लिए
समूहीकृत डेटा के लिए
भारित विचरण की गणना करने की प्रक्रिया:
1. अंकगणितीय भारित औसत निर्धारित करें
2. माध्य से भिन्न विचलन निर्धारित किए जाते हैं
3. माध्य से प्रत्येक विकल्प के विचलन का वर्ग करें
4. वर्ग विचलन को भार (आवृत्तियों) से गुणा करें
5. प्राप्त कार्यों को सारांशित करें
6. परिणामी राशि को भार के योग से विभाजित किया जाता है
विचरण निर्धारित करने के सूत्र को निम्न सूत्र में परिवर्तित किया जा सकता है:
- सरल
विचरण की गणना करने की प्रक्रिया सरल है:
1. समांतर माध्य ज्ञात कीजिए
2. समांतर माध्य का वर्ग करें
3. प्रत्येक पंक्ति विकल्प को चौकोर करें
4. वर्गों का योग ज्ञात कीजिए विकल्प
5. विकल्प के वर्गों के योग को उनकी संख्या से विभाजित करें, अर्थात्। माध्य वर्ग निर्धारित करें
6. विशेषता के माध्य वर्ग और माध्य के वर्ग के बीच अंतर ज्ञात कीजिए
साथ ही भारित विचरण को निर्धारित करने के सूत्र को निम्न सूत्र में परिवर्तित किया जा सकता है:
वे। विचरण विशेषता मानों के वर्गों के माध्य और अंकगणित माध्य के वर्ग के बीच के अंतर के बराबर है। परिवर्तित सूत्र का उपयोग करते समय, एक्स से विशेषता के व्यक्तिगत मूल्यों के विचलन की गणना के लिए एक अतिरिक्त प्रक्रिया को बाहर रखा गया है और विचलन के गोलाई से जुड़ी गणना में त्रुटि को बाहर रखा गया है।
फैलाव में कई गुण होते हैं, जिनमें से कुछ की गणना करना आसान हो जाता है:
1) एक स्थिर मान का फैलाव शून्य है;
2) यदि विशेषता मानों के सभी वेरिएंट एक ही संख्या से कम हो जाते हैं, तो विचरण कम नहीं होगा;
3) यदि विशेषता मानों के सभी प्रकारों को समान संख्या (समय) से कम किया जाता है, तो विचरण एक कारक से कम हो जाएगा
मानक विचलन- विचरण का वर्गमूल है:
असमूहीकृत डेटा के लिए:
;
एक भिन्नता श्रृंखला के लिए:
भिन्नता के परिसर, माध्य रैखिक और माध्य वर्ग विचलन को मात्राएँ कहते हैं। उनके पास माप की समान इकाइयाँ हैं जो व्यक्तिगत विशेषता मूल्यों के रूप में हैं।
फैलाव और मानक विचलन भिन्नता के सबसे व्यापक रूप से उपयोग किए जाने वाले उपाय हैं। यह इस तथ्य से समझाया गया है कि वे संभाव्यता सिद्धांत के अधिकांश प्रमेयों में शामिल हैं, जो गणितीय आंकड़ों की नींव के रूप में कार्य करता है। इसके अलावा, विचरण को इसके घटक तत्वों में विघटित किया जा सकता है, जिससे विभिन्न कारकों के प्रभाव का आकलन करने की अनुमति मिलती है जो एक विशेषता की भिन्नता का कारण बनते हैं।
लाभ के आधार पर समूहीकृत बैंकों के लिए भिन्नता संकेतकों की गणना तालिका में दिखाई गई है।
लाभ, मिलियन रूबल | बैंकों की संख्या | परिकलित संकेतक | ||||
3,7 - 4,6 (-) | 4,15 | 8,30 | -1,935 | 3,870 | 7,489 | |
4,6 - 5,5 | 5,05 | 20,20 | - 1,035 | 4,140 | 4,285 | |
5,5 - 6,4 | 5,95 | 35,70 | - 0,135 | 0,810 | 0,109 | |
6,4 - 7,3 | 6,85 | 34,25 | +0,765 | 3,825 | 2,926 | |
7,3 - 8,2 | 7,75 | 23,25 | +1,665 | 4,995 | 8,317 | |
कुल: | 121,70 | 17,640 | 23,126 |
माध्य रैखिक और माध्य वर्ग विचलन दर्शाता है कि अध्ययन के तहत इकाइयों और जनसंख्या के लिए विशेषता के मूल्य में औसतन कितना उतार-चढ़ाव होता है। तो, इस मामले में, लाभ की मात्रा में उतार-चढ़ाव का औसत मूल्य है: औसत रैखिक विचलन के अनुसार, 0.882 मिलियन रूबल; मानक विचलन के अनुसार - 1.075 मिलियन रूबल। मानक विचलन हमेशा औसत रैखिक विचलन से अधिक होता है। यदि विशेषता का वितरण सामान्य के करीब है, तो एस और डी: एस = 1.25 डी, या डी = 0.8 एस के बीच एक संबंध है। मानक विचलन से पता चलता है कि समांतर माध्य के सापेक्ष जनसंख्या इकाइयाँ किस प्रकार स्थित हैं। वितरण के रूप के बावजूद, विशेषता के 75 मान x 2S अंतराल में आते हैं, और सभी मानों में से कम से कम 89 x 3S अंतराल (P.L. Chebyshev's theorem) में आते हैं।
इस लेख में, मैं बात करूंगा मानक विचलन कैसे ज्ञात करें. गणित की पूरी समझ के लिए यह सामग्री अत्यंत महत्वपूर्ण है, इसलिए गणित के शिक्षक को इसका अध्ययन करने के लिए एक अलग पाठ या यहां तक कि कई पाठ समर्पित करने चाहिए। इस लेख में, आपको एक विस्तृत और समझने योग्य वीडियो ट्यूटोरियल का लिंक मिलेगा जो बताता है कि मानक विचलन क्या है और इसे कैसे खोजना है।
मानक विचलनएक निश्चित पैरामीटर को मापने के परिणामस्वरूप प्राप्त मूल्यों के प्रसार का अनुमान लगाना संभव बनाता है। इसे एक प्रतीक (ग्रीक अक्षर "सिग्मा") द्वारा दर्शाया जाता है।
गणना का सूत्र काफी सरल है। मानक विचलन ज्ञात करने के लिए, आपको प्रसरण का वर्गमूल निकालना होगा। तो अब आपको पूछना है, "विचरण क्या है?"
फैलाव क्या है
विचरण की परिभाषा इस प्रकार है। फैलाव माध्य से मानों के वर्ग विचलन का अंकगणितीय माध्य है।
विचरण का पता लगाने के लिए, निम्नलिखित गणना क्रमिक रूप से करें:
- माध्य (मानों की एक श्रृंखला का सरल अंकगणितीय माध्य) निर्धारित करें।
- फिर प्रत्येक मान से औसत घटाएं और परिणामी अंतर का वर्ग करें (हमें मिला अंतर चुकता).
- अगला चरण प्राप्त अंतरों के वर्गों के अंकगणितीय माध्य की गणना करना है (आप पता लगा सकते हैं कि वर्ग नीचे क्यों हैं)।
आइए एक उदाहरण देखें। मान लें कि आप और आपके मित्र अपने कुत्तों की ऊंचाई (मिलीमीटर में) मापने का निर्णय लेते हैं। माप के परिणामस्वरूप, आपको निम्नलिखित ऊंचाई माप (मुरझाए पर) प्राप्त हुए: 600 मिमी, 470 मिमी, 170 मिमी, 430 मिमी और 300 मिमी।
आइए माध्य, विचरण और मानक विचलन की गणना करें।
आइए पहले औसत ज्ञात करें. जैसा कि आप पहले से ही जानते हैं, इसके लिए आपको सभी मापा मूल्यों को जोड़ने और माप की संख्या से विभाजित करने की आवश्यकता है। गणना प्रगति:
औसत मिमी।
तो, औसत (अंकगणितीय माध्य) 394 मिमी है।
अब हमें परिभाषित करने की आवश्यकता है औसत से प्रत्येक कुत्ते की ऊंचाई का विचलन:
आखिरकार, विचरण की गणना करने के लिए, प्राप्त अंतरों में से प्रत्येक को चुकता किया जाता है, और फिर हम प्राप्त परिणामों का अंकगणितीय माध्य पाते हैं:
फैलाव मिमी 2।
इस प्रकार, फैलाव 21704 मिमी 2 है।
मानक विचलन कैसे ज्ञात करें
तो अब विचरण को जानकर, मानक विचलन की गणना कैसे करें? जैसा कि हमें याद है, इसका वर्गमूल लें। अर्थात्, मानक विचलन है:
मिमी (मिमी में निकटतम पूर्ण संख्या तक गोल)।
इस पद्धति का उपयोग करते हुए, हमने पाया कि कुछ कुत्ते (जैसे रोटवीलर) बहुत बड़े कुत्ते हैं। लेकिन बहुत छोटे कुत्ते भी हैं (उदाहरण के लिए, दछशुंड, लेकिन आपको उन्हें यह नहीं बताना चाहिए)।
सबसे दिलचस्प बात यह है कि मानक विचलन में उपयोगी जानकारी होती है। अब हम दिखा सकते हैं कि वृद्धि को मापने के कौन से प्राप्त परिणाम उस अंतराल के भीतर हैं जो हमें औसत (इसके दोनों ओर) मानक विचलन से अलग रखने पर मिलता है।
यही है, मानक विचलन का उपयोग करते हुए, हमें एक "मानक" विधि मिलती है जो आपको यह पता लगाने की अनुमति देती है कि कौन सा मान सामान्य (सांख्यिकीय औसत) है, और जो असाधारण रूप से बड़ा है या, इसके विपरीत, छोटा है।
मानक विचलन क्या है
लेकिन ... अगर हम विश्लेषण करें तो चीजें थोड़ी अलग होंगी नमूनाजानकारी। हमारे उदाहरण में, हमने माना सामान्य जनसंख्या।यानी हमारे 5 कुत्ते दुनिया के इकलौते कुत्ते थे जिन्होंने हमें दिलचस्पी दी।
लेकिन अगर डेटा एक नमूना है (एक बड़ी आबादी से चुना गया मान), तो गणना अलग तरीके से करने की आवश्यकता है।
यदि मान हैं, तो:
अन्य सभी गणनाएँ उसी तरह की जाती हैं, जिसमें औसत का निर्धारण भी शामिल है।
उदाहरण के लिए, यदि हमारे पांच कुत्ते कुत्तों की आबादी (ग्रह पर सभी कुत्तों) का सिर्फ एक नमूना हैं, तो हमें विभाजित करना होगा 5 के बजाय 4अर्थात्:
नमूना विचरण = मिमी 2।
इस मामले में, नमूने के लिए मानक विचलन बराबर है मिमी (निकटतम पूर्ण संख्या तक गोल)।
हम कह सकते हैं कि हमने उस स्थिति में कुछ "सुधार" किया है जब हमारे मूल्य केवल एक छोटा सा नमूना हैं।
टिप्पणी। वास्तव में मतभेदों के वर्ग क्यों?
लेकिन विचरण की गणना करते समय हम अंतरों के वर्ग क्यों लेते हैं? आइए कुछ पैरामीटर के मापन पर स्वीकार करते हैं, आपको निम्नलिखित मानों का सेट प्राप्त हुआ: 4; 4; -4; -4. यदि हम केवल आपस में माध्य (अंतर) से पूर्ण विचलन जोड़ते हैं ... नकारात्मक मान सकारात्मक के साथ रद्द हो जाते हैं:
.
यह पता चला है कि यह विकल्प बेकार है। तो शायद यह विचलन के पूर्ण मूल्यों (यानी इन मूल्यों के मॉड्यूल) की कोशिश करने लायक है?
पहली नज़र में, यह खराब नहीं निकला (परिणामी मूल्य, वैसे, औसत निरपेक्ष विचलन कहा जाता है), लेकिन सभी मामलों में नहीं। आइए एक और उदाहरण का प्रयास करें। मान के निम्नलिखित सेट में माप परिणाम दें: 7; एक; -6; -2। तब माध्य निरपेक्ष विचलन है:
ब्लीमी! हमें फिर से परिणाम 4 मिला, हालांकि मतभेदों का प्रसार बहुत अधिक है।
अब देखते हैं कि क्या होता है यदि हम अंतरों को वर्गित करते हैं (और फिर उनके योग का वर्गमूल लेते हैं)।
पहले उदाहरण के लिए, आपको मिलता है:
.
दूसरे उदाहरण के लिए, आपको मिलता है:
अब यह पूरी तरह से अलग मामला है! मूल-माध्य-वर्ग विचलन जितना अधिक होता है, मतभेदों का प्रसार उतना ही अधिक होता है ... जिसके लिए हम प्रयास कर रहे थे।
वास्तव में, यह विधि उसी विचार का उपयोग करती है जैसे बिंदुओं के बीच की दूरी की गणना करते समय, केवल एक अलग तरीके से लागू होती है।
और गणित की दृष्टि से विचलनों के निरपेक्ष मूल्यों के आधार पर वर्गमूलों और वर्गमूलों का प्रयोग अधिक उपयोगी होता है, जिसके कारण मानक विचलन अन्य गणितीय समस्याओं पर लागू होता है।
सर्गेई वेलेरिविच ने आपको बताया कि मानक विचलन कैसे प्राप्त करें