वर्ग मतलब। माइक्रोसॉफ्ट एक्सेल में मानक विचलन की गणना

सांख्यिकीय विश्लेषण के मुख्य उपकरणों में से एक मानक विचलन की गणना है। यह संकेतक आपको एक नमूने के लिए या सामान्य आबादी के लिए मानक विचलन का अनुमान लगाने की अनुमति देता है। आइए जानें कि एक्सेल में मानक विचलन सूत्र का उपयोग कैसे करें।

आइए तुरंत परिभाषित करें कि मानक विचलन क्या है और इसका सूत्र कैसा दिखता है। यह मान श्रृंखला के सभी मानों और उनके अंकगणितीय माध्य के बीच अंतर के वर्गों के अंकगणितीय माध्य का वर्गमूल है। इस सूचक का एक समान नाम है - मानक विचलन। दोनों नाम पूरी तरह समकक्ष हैं।

लेकिन, ज़ाहिर है, एक्सेल में, उपयोगकर्ता को इसकी गणना करने की आवश्यकता नहीं है, क्योंकि कार्यक्रम उसके लिए सब कुछ करता है। आइए जानें कि एक्सेल में मानक विचलन की गणना कैसे करें।

एक्सेल में गणना

आप दो विशेष कार्यों का उपयोग करके एक्सेल में निर्दिष्ट मान की गणना कर सकते हैं एसटीडीईवी.बी(नमूने के अनुसार) और एसटीडीईवी.जी(आम जनता के अनुसार)। उनके संचालन का सिद्धांत बिल्कुल समान है, लेकिन उन्हें तीन तरीकों से बुलाया जा सकता है, जिसके बारे में हम नीचे चर्चा करेंगे।

विधि 1: फंक्शन विजार्ड


विधि 2: सूत्र टैब


विधि 3: सूत्र को मैन्युअल रूप से दर्ज करना

एक तरीका यह भी है कि आपको तर्क विंडो को बिल्कुल भी कॉल करने की आवश्यकता नहीं है। ऐसा करने के लिए, मैन्युअल रूप से सूत्र दर्ज करें।


जैसा कि आप देख सकते हैं, एक्सेल में मानक विचलन की गणना के लिए तंत्र बहुत सरल है। उपयोगकर्ता को केवल आबादी से नंबर दर्ज करने या उन कक्षों से लिंक करने की आवश्यकता होती है जिनमें वे होते हैं। सभी गणना कार्यक्रम द्वारा ही की जाती है। यह समझना अधिक कठिन है कि परिकलित संकेतक क्या है और गणना के परिणामों को व्यवहार में कैसे लागू किया जा सकता है। लेकिन इसे समझना पहले से ही सॉफ्टवेयर के साथ काम करना सीखने की तुलना में आंकड़ों के दायरे से अधिक है।

ज्यामितीय माध्य सरल की गणना करने के लिए, सूत्र का उपयोग किया जाता है:

ज्यामितीय भारित

ज्यामितीय भारित औसत निर्धारित करने के लिए, सूत्र का उपयोग किया जाता है:

पहियों, पाइपों के औसत व्यास, वर्गों के औसत पक्षों को मूल माध्य वर्ग का उपयोग करके निर्धारित किया जाता है।

कुछ संकेतकों की गणना के लिए आरएमएस मूल्यों का उपयोग किया जाता है, जैसे कि भिन्नता का गुणांक, जो आउटपुट की लय की विशेषता है। यहां, एक निश्चित अवधि के लिए नियोजित आउटपुट से मानक विचलन निम्न सूत्र द्वारा निर्धारित किया जाता है:

ये मान अपने औसत मूल्य में लिए गए आधार मूल्य की तुलना में आर्थिक संकेतकों में परिवर्तन को सटीक रूप से दर्शाते हैं।

द्विघात सरल

माध्य वर्ग सरल की गणना सूत्र द्वारा की जाती है:

द्विघात भारित

भारित मूल माध्य वर्ग है:

22. भिन्नता के पूर्ण उपायों में शामिल हैं:

भिन्नता की सीमा

माध्य रैखिक विचलन

फैलाव

मानक विचलन

भिन्नता की सीमा (आर)

अवधि भिन्नताविशेषता के अधिकतम और न्यूनतम मूल्यों के बीच का अंतर है

यह उन सीमाओं को दर्शाता है जिनमें अध्ययन की गई जनसंख्या में विशेषता के मूल्य में परिवर्तन होता है।

पिछली नौकरी में पांच आवेदकों का कार्य अनुभव है: 2,3,4,7 और 9 वर्ष। हल: भिन्नता का परिसर = 9 - 2 = 7 वर्ष।

विशेषता के मूल्यों में अंतर की एक सामान्यीकृत विशेषता के लिए, औसत भिन्नता संकेतक की गणना अंकगणितीय माध्य से विचलन के लिए भत्ता के आधार पर की जाती है। अंतर को माध्य से विचलन के रूप में लिया जाता है।

साथ ही, माध्य (माध्य की शून्य संपत्ति) से विशेषता विकल्पों के विचलन के योग को शून्य में बदलने से बचने के लिए, किसी को या तो विचलन के संकेतों को अनदेखा करना होगा, अर्थात यह योग मोडुलो लें , या विचलन मानों का वर्ग करें

माध्य रैखिक और वर्ग विचलन

औसत रैखिक विचलनमाध्य से विशेषता के व्यक्तिगत मूल्यों के निरपेक्ष विचलन का अंकगणितीय माध्य है।

औसत रैखिक विचलन सरल है:

पिछली नौकरी में पांच आवेदकों का कार्य अनुभव है: 2,3,4,7 और 9 वर्ष।

हमारे उदाहरण में: वर्ष;

उत्तर : 2.4 वर्ष।

औसत रैखिक विचलन भारितसमूहीकृत डेटा पर लागू होता है:

औसत रैखिक विचलन, इसकी सशर्तता के कारण, व्यवहार में अपेक्षाकृत कम उपयोग किया जाता है (विशेष रूप से, वितरण की एकरूपता के संदर्भ में संविदात्मक दायित्वों की पूर्ति को चिह्नित करने के लिए; उत्पाद की गुणवत्ता के विश्लेषण में, उत्पादन की तकनीकी विशेषताओं को ध्यान में रखते हुए) )

मानक विचलन

भिन्नता की सबसे उत्तम विशेषता मानक विचलन है, जिसे मानक (या मानक विचलन) कहा जाता है। मानक विचलन() अंकगणित माध्य से विशेषता के व्यक्तिगत मूल्यों के विचलन के माध्य वर्ग के वर्गमूल के बराबर है:

मानक विचलन सरल है:

भारित मानक विचलन समूहीकृत डेटा के लिए लागू किया जाता है:

सामान्य वितरण की शर्तों के तहत माध्य वर्ग और माध्य रैखिक विचलन के बीच, निम्नलिखित संबंध होता है: ~ 1.25।

मानक विचलन, भिन्नता का मुख्य निरपेक्ष माप होने के नाते, सामान्य वितरण वक्र के निर्देशांक के मूल्यों को निर्धारित करने में, नमूना अवलोकन के संगठन से संबंधित गणनाओं में और नमूना विशेषताओं की सटीकता स्थापित करने में उपयोग किया जाता है, साथ ही साथ में एक सजातीय आबादी में एक विशेषता की भिन्नता की सीमाओं का आकलन करना।

अनुदेश

मान लीजिए कि कई संख्याएँ हैं - या सजातीय मात्राएँ। उदाहरण के लिए, माप के परिणाम, वजन, सांख्यिकीय अवलोकन, आदि। प्रस्तुत सभी मात्राओं को एक ही माप से मापा जाना चाहिए। मानक विचलन ज्ञात करने के लिए, निम्न कार्य करें।

सभी संख्याओं का अंकगणितीय माध्य निर्धारित करें: सभी संख्याओं को जोड़ें और योग को संख्याओं की कुल संख्या से विभाजित करें।

संख्याओं का फैलाव (बिखराव) निर्धारित करें: पहले पाए गए विचलन के वर्गों को जोड़ें और परिणामी योग को संख्याओं की संख्या से विभाजित करें।

वार्ड में सात मरीज हैं जिनका तापमान 34, 35, 36, 37, 38, 39 और 40 डिग्री सेल्सियस है।

औसत से औसत विचलन निर्धारित करना आवश्यक है।
फेसला:
"वार्ड में": (34+35+36+37+38+39+40)/7=37 ;

औसत से तापमान विचलन (इस मामले में, सामान्य मूल्य): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, यह पता चला है: -3, -2, -1, 0, 1, 2, 3 (ºС);

पहले प्राप्त संख्याओं के योग को उनकी संख्या से भाग दें। गणना की सटीकता के लिए, कैलकुलेटर का उपयोग करना बेहतर है। विभाजन का परिणाम योगों का अंकगणितीय माध्य है।

गणना के सभी चरणों पर पूरा ध्यान दें, क्योंकि कम से कम एक गणना में त्रुटि गलत अंतिम संकेतक की ओर ले जाएगी। प्रत्येक चरण में प्राप्त गणनाओं की जाँच करें। अंकगणितीय औसत में संख्याओं के योग के समान मीटर होता है, अर्थात यदि आप औसत उपस्थिति निर्धारित करते हैं, तो सभी संकेतक "व्यक्ति" होंगे।

गणना की इस पद्धति का उपयोग केवल गणितीय और सांख्यिकीय गणनाओं में किया जाता है। इसलिए, उदाहरण के लिए, कंप्यूटर विज्ञान में अंकगणितीय माध्य का एक अलग गणना एल्गोरिथ्म है। अंकगणित माध्य एक बहुत ही सशर्त संकेतक है। यह किसी घटना की संभावना को दर्शाता है, बशर्ते कि इसमें केवल एक कारक या संकेतक हो। सबसे गहन विश्लेषण के लिए, कई कारकों को ध्यान में रखा जाना चाहिए। इसके लिए अधिक सामान्य मात्राओं की गणना का उपयोग किया जाता है।

अंकगणित माध्य केंद्रीय प्रवृत्ति के उपायों में से एक है, जिसका व्यापक रूप से गणित और सांख्यिकीय गणना में उपयोग किया जाता है। कई मानों के लिए अंकगणितीय औसत खोजना बहुत सरल है, लेकिन प्रत्येक कार्य की अपनी बारीकियां होती हैं, जिन्हें सही गणना करने के लिए जानना आवश्यक है।

ऐसे प्रयोगों के मात्रात्मक परिणाम।

अंकगणित माध्य कैसे ज्ञात करें

संख्याओं की एक सरणी के लिए अंकगणितीय माध्य की खोज इन मानों के बीजगणितीय योग के निर्धारण के साथ शुरू होनी चाहिए। उदाहरण के लिए, यदि सरणी में संख्याएँ 23, 43, 10, 74 और 34 हैं, तो उनका बीजगणितीय योग 184 के बराबर होगा। लिखते समय, अंकगणितीय माध्य को अक्षर μ (mu) या x (x के साथ a) द्वारा दर्शाया जाता है। छड़)। इसके बाद, बीजीय योग को सरणी में संख्याओं की संख्या से विभाजित किया जाना चाहिए। इस उदाहरण में, पाँच संख्याएँ थीं, इसलिए अंकगणितीय माध्य 184/5 होगा और 36.8 होगा।

नकारात्मक संख्याओं के साथ काम करने की विशेषताएं

यदि सरणी में ऋणात्मक संख्याएँ हैं, तो समान एल्गोरिथम का उपयोग करके अंकगणित माध्य पाया जाता है। प्रोग्रामिंग वातावरण में गणना करते समय, या कार्य में अतिरिक्त शर्तें होने पर ही अंतर होता है। इन मामलों में, विभिन्न चिह्नों वाली संख्याओं का अंकगणितीय माध्य ज्ञात करना तीन चरणों में आता है:

1. मानक विधि द्वारा सामान्य अंकगणितीय माध्य ज्ञात करना;
2. ऋणात्मक संख्याओं का समांतर माध्य ज्ञात करना।
3. धनात्मक संख्याओं के समांतर माध्य की गणना।

प्रत्येक क्रिया की प्रतिक्रियाएँ अल्पविराम से अलग करके लिखी जाती हैं।

प्राकृतिक और दशमलव अंश

यदि संख्याओं की सरणी को दशमलव अंशों द्वारा दर्शाया जाता है, तो समाधान पूर्णांकों के अंकगणितीय माध्य की गणना की विधि के अनुसार होता है, लेकिन उत्तर की सटीकता के लिए कार्य की आवश्यकताओं के अनुसार परिणाम कम हो जाता है।

प्राकृतिक अंशों के साथ काम करते समय, उन्हें एक सामान्य हर में घटाया जाना चाहिए, जिसे सरणी में संख्याओं की संख्या से गुणा किया जाता है। उत्तर का अंश मूल भिन्नात्मक तत्वों के दिए गए अंशों का योग होगा।

इसका उपयोग उन मामलों में किया जाता है, जब किसी विशेषता के व्यक्तिगत मूल्यों को औसत मूल्य से प्रतिस्थापित करते समय, मूल मूल्यों के वर्गों के योग को अपरिवर्तित रखना आवश्यक होता है।

इसके उपयोग का मुख्य क्षेत्र अंकगणित माध्य (मानक विचलन) के सापेक्ष एक विशेषता के व्यक्तिगत मूल्यों के उतार-चढ़ाव की डिग्री का मापन है। इसके अलावा, रूट माध्य वर्ग का उपयोग उन मामलों में किया जाता है जहां वर्ग या घन इकाइयों में व्यक्त की गई विशेषता के औसत मूल्य की गणना करना आवश्यक होता है (वर्ग वर्गों के औसत आकार की गणना करते समय, पाइप, ट्रंक, आदि के औसत व्यास)।

वर्गमूल औसत का वर्गदो रूपों में गणना:

- कितना सरल

कितना भारित

(4.22)

सभी बिजली औसतघातांक के मूल्यों से एक दूसरे से भिन्न होते हैं। वहीं,घातांक जितना अधिक होगा, उतना ही अधिक औसत का मात्रात्मक मूल्य :

शक्ति साधन के इस गुण को गुण कहते हैं प्रमुखतामध्यम।

इस प्रकार,औसत संकेतक के प्रकार की पसंद का उसके संख्यात्मक मूल्य पर महत्वपूर्ण प्रभाव पड़ता है। औसत के प्रकार का चुनाव में निर्धारित किया जाता है अध्ययन आबादी का विश्लेषण करके प्रत्येक व्यक्तिगत मामला, घटना की सामग्री का अध्ययन। घातीय माध्य सही ढंग से चुना गया है, यदि गणना के सभी चरणों में इसका तार्किक सूत्र नहीं बदलता है , वे। औसत की सामाजिक-आर्थिक सामग्री संकेत।

एक विशेष प्रकार का औसत संरचनात्मक औसत। इनका उपयोग फीचर मूल्यों की वितरण श्रृंखला की आंतरिक संरचना के अध्ययन में किया जाता है। इनमें बहुलक और माध्यिका शामिल हैं।

मोड और माध्यिका एक सांख्यिकीय इकाई की विशेषता के मूल्य की विशेषता है जो भिन्नता श्रृंखला में एक निश्चित स्थान रखती है।

पहनावा (एमओ) - जनसंख्या में विशेषता का सबसे सामान्य मूल्य।सांख्यिकीय अभ्यास में बहुलक का व्यापक रूप से उपयोग किया जाता है: उपभोक्ता मांग, मूल्य पंजीकरण आदि का अध्ययन करना।

माध्यिका ( मैं) - एक सांख्यिकीय इकाई की एक विशेषता का मान जो रैंक की गई श्रृंखला के मध्य में होता है और जनसंख्या को समान संख्या में दो भागों में विभाजित करता है।

असतत परिवर्तनशील श्रृंखला के लिए एमओऔर मैंपरिभाषाओं के अनुसार चुने गए हैं: मोड - उच्चतम आवृत्ति के साथ सुविधा के मूल्य के रूप में \ एन मैं ; एक विषम जनसंख्या आकार के लिए माध्यिका की स्थिति उसकी संख्या से निर्धारित होती है
, कहाँ पे एन- सांख्यिकीय जनसंख्या की मात्रा। श्रृंखला की एक समान लंबाई के लिए, माध्यिका श्रृंखला के मध्य में दो विकल्पों के औसत के बराबर होती है।

माध्यिका का उपयोग सबसे विश्वसनीय संकेतक के रूप में किया जाता है ठेठएक विषम जनसंख्या के मूल्य, क्योंकि यह असंवेदनशील है विशेषता के चरम मूल्य, जो काफी भिन्न हो सकते हैं इसके मूल्यों की मुख्य सरणी। इसके अलावा, माध्यिका पाता है एक विशेष गणितीय संपत्ति के कारण व्यावहारिक अनुप्रयोग:
.

निम्नलिखित पर बहुलक और माध्यिका की परिभाषा पर विचार करें: उदाहरण:

कौशल स्तर के आधार पर कार्य स्थलों का वितरण बहुत है। डेटा तालिका 4.4 में दिखाया गया है।

तालिका 4.4 - कौशल स्तर द्वारा कार्य क्षेत्रों का वितरण

संचित

मोड को अधिकतम आवृत्ति मान के अनुसार चुना जाता है: at एन मैक्स = 14, एमओ= 4, यानी चौथी श्रेणी सबसे आम है। माध्यिका ज्ञात करने के लिए मैंकेंद्रीय इकाइयों को परिभाषित किया गया है ( एन+1)/2। ये 25वीं और 26वीं इकाइयां हैं। जिस समूह में ये इकाइयाँ गिरती हैं वह संचित आवृत्तियों द्वारा निर्धारित किया जाता है। यह चौथा समूह है, जिसमें फीचर वैल्यू 4 है। इस प्रकार, मैं= 4, इसका मतलब है कि आधे कर्मचारियों की रैंक 4 से नीचे है, और दूसरे की रैंक 4 से ऊपर है।

अंतराल श्रृंखला मूल्यों में एमओऔर मैंअधिक जटिल तरीके से गणना की जाती है।

मोड को निम्नानुसार परिभाषित किया गया है:

वह अंतराल जिसमें बहुलक मान स्थित है, अधिकतम आवृत्ति मान द्वारा निर्धारित किया जाता है। इसे मोडल कहते हैं।

मोडल अंतराल के भीतर, मोड मान की गणना सूत्र द्वारा की जाती है:

कहाँ पे
- मोडल अंतराल की निचली सीमा;

एमओ - मोडल अंतराल चौड़ाई;

एन एमओ , एन मो-1 , एन मो+1 - क्रमशः, मोडल, प्रीमॉडल (पूर्ववर्ती मोडल) और पोस्टमॉडल (निम्नलिखित मोडल) अंतराल की आवृत्तियां।

अंतराल श्रृंखला में माध्यिका की गणना के लिए निम्नलिखित दृष्टिकोण का उपयोग किया जाता है:

संचित आवृत्तियों के आधार पर माध्यिका अंतराल ज्ञात किया जाता है।

माध्यिका केंद्रीय इकाई वाला अंतराल है।

माध्यिका अंतराल मान के अंदर मैंसूत्र द्वारा निर्धारित किया जाता है:

(4.25)

कहाँ पे
- माध्यिका अंतराल की निचली सीमा;

मैं -मध्य अंतराल की चौड़ाई;

एनसांख्यिकीय जनसंख्या का आयतन है;

एन एमई-1- पूर्व-मध्य अंतराल की संचित आवृत्ति;

एन मैं - माध्यिका अंतराल की आवृत्ति।

आइए हम सेवा की लंबाई (तालिका 4.5) द्वारा श्रमिकों के वितरण की एक श्रृंखला के उदाहरण का उपयोग करके वितरण की अंतराल श्रृंखला के लिए बहुलक और माध्यिका की गणना पर विचार करें।

तालिका 4.5 - सेवा की लंबाई के अनुसार कार्य क्षेत्र का वितरण

मध्यान्तर

मैं

एन मैं

एन मैं

हिसाबएमओ:

अधिकतम आवृत्ति एन मैक्स = 13, यह चौथे समूह से मेल खाती है, इसलिए, 12-16 वर्षों की सीमाओं के साथ अंतराल मोडल है।

मोड की गणना सूत्र द्वारा की जाती है:

अक्सर ऐसे कर्मचारी होते हैं जिनके पास लगभग 13 वर्षों का कार्य अनुभव होता है।

मोड मोडल अंतराल के बीच में स्थित नहीं है, इसे इसकी निचली सीमा पर स्थानांतरित कर दिया गया है, यह इस वितरण श्रृंखला की संरचना के कारण है (प्रीमॉडल अंतराल की आवृत्ति पोस्टमॉडल अंतराल की आवृत्ति से बहुत अधिक है)।

माध्य गणना:

माध्यिका अंतराल संचयी बारंबारता ग्राफ से निर्धारित होता है। इसमें 25वीं और 26वीं सांख्यिकीय इकाइयाँ शामिल हैं, जो अलग-अलग समूहों में हैं - तीसरे और चौथे में। खोजने के लिए मैंआप उनमें से किसी का भी उपयोग कर सकते हैं। हम तीसरे समूह के लिए गणना करेंगे:

एक ही अर्थ मैंचौथे समूह के लिए इसकी गणना करते समय प्राप्त किया जा सकता है:

दोहरे केंद्र के साथ मैंहमेशा केंद्रीय इकाइयों वाले अंतराल के जंक्शन पर स्थित होता है। परिकलित मूल्य मैंयह दर्शाता है कि पहले 25 कर्मचारियों के पास 12 वर्ष से कम का कार्य अनुभव है, और शेष 25 के पास 12 वर्ष से अधिक का कार्य अनुभव है।

मोड को असतत श्रृंखला में वितरण बहुभुज द्वारा, वितरण हिस्टोग्राम द्वारा - अंतराल श्रृंखला में, और माध्यिका - संचयी द्वारा निर्धारित किया जा सकता है।

अंतराल श्रृंखला में मोड खोजने के लिए, मोडल आयत का दायाँ शीर्ष पिछले आयत के ऊपरी दाएँ कोने से जुड़ा होना चाहिए, और बायाँ शीर्ष अगले आयत के ऊपरी बाएँ कोने से जुड़ा होना चाहिए। इन रेखाओं के प्रतिच्छेदन बिंदु का भुज वितरण विधा होगा।

माध्यिका निर्धारित करने के लिए, कुल जनसंख्या के अनुरूप, संचयी के सबसे बड़े कोटि की ऊंचाई को आधे में विभाजित किया जाता है। एब्सिस्सा अक्ष के समानांतर प्राप्त बिंदु के माध्यम से एक सीधी रेखा खींची जाती है, जब तक कि यह संचयी के साथ प्रतिच्छेद न करे। प्रतिच्छेदन बिंदु का भुज माध्यिका है।

के अलावा एमओऔर मैंभिन्न श्रृंखला में, अन्य संरचनात्मक विशेषताओं - क्वांटाइल्स - को निर्धारित किया जा सकता है। क्वांटाइल्स वितरण श्रृंखला की संरचना के गहन अध्ययन के लिए अभिप्रेत हैं। मात्रा- यह उस विशेषता का मान है जो इस सुविधा द्वारा क्रमित जनसंख्या में एक निश्चित स्थान रखता है। निम्नलिखित प्रकार के क्वांटाइल हैं:

- चतुर्थकों- आदेशित सेट को 4 बराबर भागों में विभाजित करने वाले विशेषता मान;

- दशमांश- जनसंख्या को 10 बराबर भागों में विभाजित करने वाले विशेषता मान;

- प्रतिशत- विशेषता मान जनसंख्या को 100 बराबर भागों में विभाजित करते हैं।

इस प्रकार, वितरण श्रृंखला के केंद्र की स्थिति को चिह्नित करने के लिए, 3 संकेतकों का उपयोग किया जा सकता है: अर्थसंकेत,मोड, माध्यिका.

वितरण केंद्र के विशिष्ट संकेतक का प्रकार और रूप चुनते समय, निम्नलिखित अनुशंसाओं से आगे बढ़ना आवश्यक है:

स्थायी सामाजिक-आर्थिक प्रक्रियाओं के लिए, अंकगणितीय माध्य का उपयोग केंद्र के संकेतक के रूप में किया जाता है। ऐसी प्रक्रियाओं को सममित वितरण द्वारा विशेषता है, जिसमें

= मैं= एमओ;

अस्थिर प्रक्रियाओं के लिए, वितरण केंद्र की स्थिति की विशेषता है एमओया मैं. असममित प्रक्रियाओं के लिए, वितरण केंद्र की पसंदीदा विशेषता माध्यिका है, क्योंकि यह अंकगणितीय माध्य और बहुलक के बीच एक स्थान रखता है।

यह ध्यान दिया जाना चाहिए कि विचरण की इस गणना में एक खामी है - यह पक्षपाती हो जाता है, अर्थात। इसकी गणितीय अपेक्षा विचरण के वास्तविक मूल्य के बराबर नहीं है। इसके बारे में और अधिक। इसी समय, सब कुछ इतना बुरा नहीं है। नमूना आकार में वृद्धि के साथ, यह अभी भी अपने सैद्धांतिक समकक्ष के पास पहुंचता है, अर्थात। असम्बद्ध रूप से निष्पक्ष है। इसलिए, बड़े नमूना आकारों के साथ काम करते समय, उपरोक्त सूत्र का उपयोग किया जा सकता है।

संकेतों की भाषा को शब्दों की भाषा में अनुवाद करना उपयोगी है। यह पता चला है कि विचरण विचलन का औसत वर्ग है। अर्थात्, पहले औसत मूल्य की गणना की जाती है, फिर प्रत्येक मूल और औसत मूल्य के बीच के अंतर को लिया जाता है, चुकता किया जाता है, जोड़ा जाता है और फिर इस जनसंख्या में मूल्यों की संख्या से विभाजित किया जाता है। व्यक्तिगत मूल्य और माध्य के बीच का अंतर विचलन के माप को दर्शाता है। यह सुनिश्चित करने के लिए चुकता किया जाता है कि सभी विचलन विशेष रूप से सकारात्मक संख्या बन जाते हैं और जब उन्हें योग किया जाता है तो सकारात्मक और नकारात्मक विचलन के पारस्परिक रद्दीकरण से बचने के लिए। फिर, वर्ग विचलन को देखते हुए, हम केवल अंकगणितीय माध्य की गणना करते हैं। औसत - वर्ग - विचलन। विचलन चुकता है, और औसत माना जाता है। इसका जवाब सिर्फ तीन शब्दों में है।

हालांकि, अपने शुद्ध रूप में, जैसे, उदाहरण के लिए, अंकगणितीय माध्य, या सूचकांक, फैलाव का उपयोग नहीं किया जाता है। यह बल्कि एक सहायक और मध्यवर्ती संकेतक है जो अन्य प्रकार के सांख्यिकीय विश्लेषण के लिए आवश्यक है। उसके पास माप की एक सामान्य इकाई भी नहीं है। सूत्र को देखते हुए, यह मूल डेटा इकाई का वर्ग है। बोतल के बिना, जैसा कि वे कहते हैं, आप नहीं समझेंगे।

(मॉड्यूल 111)

फैलाव को वास्तविकता में वापस लाने के लिए, यानी इसे अधिक सांसारिक उद्देश्यों के लिए उपयोग करने के लिए, इसमें से एक वर्गमूल निकाला जाता है। यह तथाकथित पता चला है मानक विचलन (आरएमएस). "मानक विचलन" या "सिग्मा" (ग्रीक अक्षर के नाम से) नाम हैं। मानक विचलन सूत्र है:

नमूने के लिए यह संकेतक प्राप्त करने के लिए, सूत्र का उपयोग करें:

विचरण के साथ, थोड़ा अलग गणना विकल्प है। लेकिन जैसे-जैसे नमूना बढ़ता है, अंतर गायब हो जाता है।

मानक विचलन, जाहिर है, डेटा फैलाव के माप की भी विशेषता है, लेकिन अब (फैलाव के विपरीत) इसकी तुलना मूल डेटा से की जा सकती है, क्योंकि उनके पास माप की समान इकाइयाँ हैं (यह गणना सूत्र से स्पष्ट है)। लेकिन यहां तक ​​​​कि अपने शुद्ध रूप में यह संकेतक बहुत जानकारीपूर्ण नहीं है, क्योंकि इसमें बहुत अधिक मध्यवर्ती गणनाएं हैं जो भ्रमित करने वाली हैं (विचलन, वर्ग, योग, औसत, जड़)। फिर भी, मानक विचलन के साथ सीधे काम करना पहले से ही संभव है, क्योंकि इस सूचक के गुण अच्छी तरह से अध्ययन और ज्ञात हैं। उदाहरण के लिए, यह है तीन सिग्मा नियम, जो बताता है कि 1000 में से 997 डेटा अंक अंकगणितीय माध्य के ±3 सिग्मा के भीतर हैं। मानक विचलन, अनिश्चितता के एक उपाय के रूप में, कई सांख्यिकीय गणनाओं में भी शामिल है। इसकी मदद से, विभिन्न अनुमानों और पूर्वानुमानों की सटीकता की डिग्री स्थापित की जाती है। यदि भिन्नता बहुत बड़ी है, तो मानक विचलन भी बड़ा हो जाएगा, इसलिए, पूर्वानुमान गलत होगा, जिसे व्यक्त किया जाएगा, उदाहरण के लिए, बहुत व्यापक विश्वास अंतराल में।

भिन्नता का गुणांक

मानक विचलन प्रसार माप का एक पूर्ण अनुमान देता है। इसलिए, यह समझने के लिए कि प्रसार स्वयं मूल्यों के सापेक्ष कितना बड़ा है (अर्थात, उनके पैमाने की परवाह किए बिना), एक सापेक्ष संकेतक की आवश्यकता है। इस सूचक को कहा जाता है गुणांक का परिवर्तनऔर निम्न सूत्र का उपयोग करके गणना की जाती है:

भिन्नता के गुणांक को प्रतिशत के रूप में मापा जाता है (यदि 100% से गुणा किया जाता है)। इस सूचक द्वारा, आप विभिन्न प्रकार की घटनाओं की तुलना कर सकते हैं, उनके पैमाने और माप की इकाइयों की परवाह किए बिना। यही तथ्य भिन्नता के गुणांक को इतना लोकप्रिय बनाता है।

आंकड़ों में, यह स्वीकार किया जाता है कि यदि भिन्नता के गुणांक का मान 33% से कम है, तो जनसंख्या को सजातीय माना जाता है, यदि यह 33% से अधिक है, तो यह विषम है। मेरे लिए यहां टिप्पणी करना मुश्किल है। मुझे नहीं पता कि इसे किसने और क्यों इस तरह परिभाषित किया, लेकिन इसे एक स्वयंसिद्ध माना जाता है।

मुझे लगता है कि मैं एक सूखे सिद्धांत से बह गया था और मुझे कुछ दृश्य और आलंकारिक लाने की जरूरत है। दूसरी ओर, भिन्नता के सभी संकेतक लगभग एक ही चीज़ का वर्णन करते हैं, केवल उनकी गणना अलग तरह से की जाती है। इसलिए, विभिन्न उदाहरणों के साथ चमकना मुश्किल है केवल संकेतकों के मूल्य भिन्न हो सकते हैं, लेकिन उनका सार नहीं। तो आइए तुलना करें कि डेटा के एक ही सेट के लिए भिन्नता के विभिन्न संकेतकों के मान कैसे भिन्न होते हैं। आइए औसत रैखिक विचलन (के) की गणना के साथ एक उदाहरण लेते हैं। यहाँ मूल डेटा है:

और एक अनुस्मारक चार्ट।

इन आंकड़ों के आधार पर, हम भिन्नता के विभिन्न संकेतकों की गणना करते हैं।

माध्य सामान्य अंकगणितीय माध्य है।

भिन्नता की सीमा अधिकतम और न्यूनतम के बीच का अंतर है:

औसत रैखिक विचलन की गणना सूत्र द्वारा की जाती है:

मानक विचलन:

हम एक तालिका में गणना को सारांशित करते हैं।

जैसा कि आप देख सकते हैं, रैखिक माध्य और मानक विचलन डेटा भिन्नता की डिग्री के लिए समान मान देते हैं। विचरण सिग्मा चुकता है, इसलिए यह हमेशा एक अपेक्षाकृत बड़ी संख्या होगी, जो वास्तव में कुछ नहीं कहती है। भिन्नता की सीमा चरम सीमाओं के बीच का अंतर है और बहुत कुछ बता सकती है।

आइए कुछ परिणामों का योग करें।

एक संकेतक की भिन्नता एक प्रक्रिया या घटना की परिवर्तनशीलता को दर्शाती है। इसकी डिग्री को कई संकेतकों का उपयोग करके मापा जा सकता है।

1. भिन्नता की सीमा अधिकतम और न्यूनतम के बीच का अंतर है। संभावित मूल्यों की सीमा को दर्शाता है।
2. औसत रैखिक विचलन - उनके औसत मूल्य से विश्लेषित जनसंख्या के सभी मूल्यों के निरपेक्ष (मॉड्यूलो) विचलन के औसत को दर्शाता है।
3. फैलाव - विचलन का औसत वर्ग।
4. मानक विचलन - विचरण की जड़ (मतलब वर्ग विचलन)।
5. भिन्नता का गुणांक सबसे सार्वभौमिक संकेतक है जो मूल्यों के फैलाव की डिग्री को दर्शाता है, उनके पैमाने और माप की इकाइयों की परवाह किए बिना। भिन्नता के गुणांक को प्रतिशत के रूप में मापा जाता है और इसका उपयोग विभिन्न प्रक्रियाओं और घटनाओं की भिन्नता की तुलना करने के लिए किया जा सकता है।

इस प्रकार, सांख्यिकीय विश्लेषण में घटनाओं की एकरूपता और प्रक्रियाओं की स्थिरता को दर्शाने वाले संकेतकों की एक प्रणाली होती है। अक्सर, भिन्नता संकेतकों का स्वतंत्र अर्थ नहीं होता है और आगे के डेटा विश्लेषण (विश्वास अंतराल की गणना) के लिए उपयोग किया जाता है