उदाहरणों की एक श्रृंखला बनाएँ। विविधता श्रृंखला

  • परिचयात्मक पाठ मुफ्त का;
  • बड़ी संख्या में अनुभवी शिक्षक (देशी और रूसी भाषी);
  • पाठ्यक्रम एक विशिष्ट अवधि (महीने, छह महीने, वर्ष) के लिए नहीं, बल्कि एक विशिष्ट संख्या में पाठों के लिए (5, 10, 20, 50);
  • 10,000 से अधिक संतुष्ट ग्राहक।
  • रूसी भाषी शिक्षक के साथ एक पाठ की लागत - 600 रूबल से, एक देशी वक्ता के साथ - 1500 रूबल से

एक भिन्नता श्रृंखला की अवधारणा।सांख्यिकीय अवलोकन की सामग्री को व्यवस्थित करने में पहला कदम उन इकाइयों की संख्या की गणना करना है जिनमें एक या दूसरी विशेषता है। इकाइयों को उनकी मात्रात्मक विशेषता के आरोही या अवरोही क्रम में व्यवस्थित करने और विशेषता के विशिष्ट मूल्य के साथ इकाइयों की संख्या की गणना करने के बाद, हम एक भिन्नता श्रृंखला प्राप्त करते हैं। भिन्नता श्रृंखला कुछ मात्रात्मक विशेषता के अनुसार एक निश्चित सांख्यिकीय आबादी की इकाइयों के वितरण की विशेषता है।

भिन्नता श्रृंखला में दो कॉलम होते हैं, बाएं कॉलम में वैरिएबल विशेषता के मान होते हैं, जिन्हें वेरिएंट कहा जाता है और (x) द्वारा दर्शाया जाता है, और दाएं कॉलम में पूर्ण संख्याएं होती हैं जो दर्शाती हैं कि प्रत्येक प्रकार कितनी बार होता है। इस कॉलम के मानों को फ़्रीक्वेंसी कहा जाता है और इन्हें (f) द्वारा दर्शाया जाता है।

योजनाबद्ध रूप से, भिन्नता श्रृंखला को तालिका 5.1 के रूप में दर्शाया जा सकता है:

तालिका 5.1

विविधता श्रृंखला का प्रकार

विकल्प (एक्स)

आवृत्तियों (एफ)

दाएं कॉलम में, आवृत्तियों की कुल मात्रा में अलग-अलग वेरिएंट की आवृत्ति के अनुपात को दर्शाने वाले सापेक्ष संकेतकों का भी उपयोग किया जा सकता है। इन सापेक्ष संकेतकों को बारंबारता कहा जाता है और इन्हें पारंपरिक रूप से दर्शाया जाता है, अर्थात। . सभी आवृत्तियों का योग एक के बराबर होता है। आवृत्तियों को प्रतिशत के रूप में भी व्यक्त किया जा सकता है, और फिर उनका योग 100% के बराबर होगा।

चर संकेत एक अलग प्रकृति के हो सकते हैं। कुछ चिह्नों के प्रकार पूर्णांकों में व्यक्त किए जाते हैं, उदाहरण के लिए, एक अपार्टमेंट में कमरों की संख्या, प्रकाशित पुस्तकों की संख्या आदि। इन संकेतों को असंतत, या असतत कहा जाता है। अन्य विशेषताओं के वेरिएंट कुछ सीमाओं के भीतर किसी भी मूल्य पर ले जा सकते हैं, जैसे कि नियोजित लक्ष्यों की पूर्ति, मजदूरी आदि। इन सुविधाओं को निरंतर कहा जाता है।

असतत भिन्नता श्रृंखला।यदि परिवर्तनशील श्रृंखला के रूपों को असतत मूल्यों के रूप में व्यक्त किया जाता है, तो ऐसी परिवर्तनशील श्रृंखला को असतत कहा जाता है, इसकी उपस्थिति तालिका में प्रस्तुत की जाती है। 5.2:

तालिका 5.2

परीक्षा में प्राप्त ग्रेड द्वारा छात्रों का वितरण

रेटिंग (एक्स)

छात्रों की संख्या (एफ)

कुल के% में ()

असतत श्रृंखला में वितरण की प्रकृति को एक वितरण बहुभुज के रूप में रेखांकन द्वारा दर्शाया गया है, चित्र 5.1।

चावल। 5.1. परीक्षा में प्राप्त ग्रेड द्वारा छात्रों का वितरण।

अंतराल भिन्नता श्रृंखला।निरंतर सुविधाओं के लिए, भिन्नता श्रृंखला का निर्माण अंतराल श्रृंखला के रूप में किया जाता है, अर्थात। उनमें विशेषता मान "से और से" अंतराल के रूप में व्यक्त किए जाते हैं। इस मामले में, ऐसे अंतराल में किसी विशेषता के न्यूनतम मान को अंतराल की निचली सीमा कहा जाता है, और अधिकतम मान को अंतराल की ऊपरी सीमा कहा जाता है।

इंटरवल वेरिएबल सीरीज़ का निर्माण असंतत विशेषताओं (असतत) और बड़ी रेंज में भिन्नता वाले दोनों के लिए किया जाता है। अंतराल पंक्तियाँ समान और असमान अंतरालों के साथ हो सकती हैं। आर्थिक व्यवहार में, अधिकांश भाग के लिए, असमान अंतरालों का उपयोग किया जाता है, जो उत्तरोत्तर बढ़ते या घटते हैं। ऐसी आवश्यकता विशेष रूप से उन मामलों में उत्पन्न होती है जहां संकेत का उतार-चढ़ाव असमान रूप से और बड़ी सीमा के भीतर किया जाता है।

समान अंतराल वाली अंतराल श्रृंखला के प्रकार पर विचार करें, तालिका। 5.3:

तालिका 5.3

आउटपुट द्वारा श्रमिकों का वितरण

आउटपुट, ट्र। (एक्स)

श्रमिकों की संख्या (एफ)

संचयी आवृत्ति (f´)

अंतराल वितरण श्रृंखला को एक हिस्टोग्राम के रूप में ग्राफिक रूप से दर्शाया गया है, चित्र 5.2।

चित्र 5.2. आउटपुट द्वारा श्रमिकों का वितरण

संचित (संचयी) आवृत्ति।व्यवहार में, वितरण श्रृंखला को में बदलने की आवश्यकता है संचयी पंक्तियाँ,संचित आवृत्तियों पर निर्मित। उनका उपयोग संरचनात्मक औसत को परिभाषित करने के लिए किया जा सकता है जो वितरण श्रृंखला डेटा के विश्लेषण की सुविधा प्रदान करते हैं।

संचयी आवृत्तियों को वितरण श्रृंखला के बाद के समूहों के इन संकेतकों के पहले समूह की आवृत्तियों (या आवृत्तियों) में क्रमिक रूप से जोड़कर निर्धारित किया जाता है। वितरण श्रृंखला को चित्रित करने के लिए संचयी और तोरण का उपयोग किया जाता है। उन्हें बनाने के लिए, एक असतत विशेषता (या अंतराल के सिरों) के मूल्यों को एब्सिस्सा अक्ष पर चिह्नित किया जाता है, और आवृत्तियों के बढ़ते योग (क्यूम्युलेट) को ऑर्डिनेट अक्ष, Fig.5.3 पर चिह्नित किया जाता है।

चावल। 5.3. विकास द्वारा श्रमिकों का संचयी वितरण

यदि आवृत्तियों और वेरिएंट के पैमाने को आपस में बदल दिया जाता है, अर्थात। एब्सिस्सा अक्ष पर संचित आवृत्तियों को प्रतिबिंबित करते हैं, और कोऑर्डिनेट अक्ष पर विकल्पों के मूल्यों को दर्शाते हैं, फिर समूह से समूह में आवृत्तियों में परिवर्तन को दर्शाने वाले वक्र को वितरण तोरण कहा जाएगा, चित्र 5.4।

चावल। 5.4. उत्पादन के लिए श्रमिकों का ओजीवा वितरण

समान अंतराल वाली विविधता श्रृंखला सांख्यिकीय वितरण श्रृंखला के लिए सबसे महत्वपूर्ण आवश्यकताओं में से एक प्रदान करती है, जिससे समय और स्थान में उनकी तुलना सुनिश्चित होती है।

वितरण घनत्व।हालांकि, इन श्रृंखलाओं में अलग-अलग असमान अंतरालों की आवृत्तियां सीधे तुलनीय नहीं हैं। ऐसे मामलों में, आवश्यक तुलना सुनिश्चित करने के लिए, वितरण घनत्व की गणना की जाती है, अर्थात। निर्धारित करें कि प्रत्येक समूह में कितनी इकाइयाँ अंतराल मान की प्रति इकाई हैं।

असमान अंतराल के साथ एक परिवर्तनशील श्रृंखला के वितरण के ग्राफ का निर्माण करते समय, आयतों की ऊंचाई आवृत्तियों के अनुपात में निर्धारित की जाती है, लेकिन संबंधित अंतराल में अध्ययन किए गए गुण के मूल्यों के वितरण घनत्व के संकेतकों के लिए निर्धारित की जाती है। .

एक परिवर्तनशील श्रृंखला तैयार करना और उसका चित्रमय प्रतिनिधित्व प्रारंभिक डेटा को संसाधित करने का पहला कदम है और अध्ययन के तहत जनसंख्या का विश्लेषण करने में पहला कदम है। परिवर्तनशील श्रृंखला के विश्लेषण में अगला कदम मुख्य सामान्यीकरण संकेतकों का निर्धारण है, जिन्हें श्रृंखला की विशेषताएं कहा जाता है। इन विशेषताओं से जनसंख्या की इकाइयों में विशेषता के औसत मूल्य का अंदाजा लगाना चाहिए।

औसत मूल्य. औसत मूल्य अध्ययन की गई जनसंख्या में अध्ययन की गई विशेषता की एक सामान्यीकृत विशेषता है, जो स्थान और समय की विशिष्ट परिस्थितियों में प्रति जनसंख्या इकाई के विशिष्ट स्तर को दर्शाती है।

औसत मूल्य हमेशा नामित होता है, जनसंख्या की व्यक्तिगत इकाइयों की विशेषता के समान आयाम होता है।

औसत मूल्यों की गणना करने से पहले, गुणात्मक रूप से सजातीय समूहों को उजागर करते हुए, अध्ययन की गई आबादी की इकाइयों को समूहित करना आवश्यक है।

समग्र रूप से जनसंख्या के लिए गणना की गई औसत को सामान्य औसत कहा जाता है, और प्रत्येक समूह के लिए - समूह औसत।

औसत दो प्रकार के होते हैं: शक्ति (अंकगणितीय औसत, हार्मोनिक औसत, ज्यामितीय औसत, मूल माध्य द्विघात); संरचनात्मक (मोड, माध्यिका, चतुर्थक, दशमांश)।

गणना के लिए औसत का चुनाव उद्देश्य पर निर्भर करता है।

शक्ति औसत के प्रकार और उनकी गणना के तरीके।एकत्रित सामग्री के सांख्यिकीय प्रसंस्करण के अभ्यास में, विभिन्न समस्याएं उत्पन्न होती हैं, जिनके समाधान के लिए अलग-अलग औसत की आवश्यकता होती है।

गणितीय आँकड़े घात माध्य सूत्रों से विभिन्न साधन प्राप्त करते हैं:

औसत मूल्य कहां है; एक्स - व्यक्तिगत विकल्प (सुविधा मान); z - घातांक (z = 1 पर - अंकगणितीय माध्य, z = 0 ज्यामितीय माध्य, z = - 1 - हार्मोनिक माध्य, z = 2 - माध्य द्विघात)।

हालांकि, प्रत्येक व्यक्तिगत मामले में किस प्रकार का औसत लागू किया जाना चाहिए, इस सवाल का समाधान अध्ययन के तहत आबादी के विशिष्ट विश्लेषण द्वारा किया जाता है।

आँकड़ों में सबसे सामान्य प्रकार का औसत है अंकगणित औसत. इसकी गणना उन मामलों में की जाती है जब अध्ययन की गई सांख्यिकीय आबादी की व्यक्तिगत इकाइयों के लिए औसत विशेषता का आयतन इसके मूल्यों के योग के रूप में बनता है।

प्रारंभिक डेटा की प्रकृति के आधार पर, अंकगणितीय माध्य विभिन्न तरीकों से निर्धारित किया जाता है:

यदि डेटा असमूहीकृत है, तो गणना एक साधारण औसत मान के सूत्र के अनुसार की जाती है

एक असतत श्रृंखला में अंकगणितीय माध्य की गणनासूत्र 3.4 के अनुसार होता है।

अंतराल श्रृंखला में अंकगणितीय माध्य की गणना।एक अंतराल भिन्नता श्रृंखला में, जहां अंतराल के मध्य को सशर्त रूप से प्रत्येक समूह में एक विशेषता के मूल्य के रूप में लिया जाता है, अंकगणितीय माध्य अवर्गीकृत डेटा से गणना किए गए माध्य से भिन्न हो सकता है। इसके अलावा, समूहों में अंतराल जितना बड़ा होगा, समूहित डेटा से परिकलित औसत का संभावित विचलन अवर्गीकृत डेटा से परिकलित औसत से उतना ही अधिक होगा।

अंतराल भिन्नता श्रृंखला के लिए औसत की गणना करते समय, आवश्यक गणना करने के लिए, एक अंतराल से उनके मध्य बिंदुओं तक जाता है। और फिर अंकगणितीय भारित औसत के सूत्र द्वारा औसत मान की गणना करें।

अंकगणित माध्य के गुण।अंकगणित माध्य में कुछ गुण होते हैं जो हमें गणनाओं को सरल बनाने की अनुमति देते हैं, आइए उन पर विचार करें।

1. अचर संख्याओं का समांतर माध्य इस अचर संख्या के बराबर होता है।

अगर एक्स = ए। फिर .

2. यदि सभी विकल्पों के भारों को आनुपातिक रूप से बदल दिया जाता है, अर्थात। समान संख्या में गुणा या वृद्धि करें, तो नई श्रृंखला का अंकगणितीय माध्य इससे नहीं बदलेगा।

यदि सभी भार f को k गुना कम कर दिया जाए, तो .

3. औसत से अलग-अलग विकल्पों के सकारात्मक और नकारात्मक विचलन का योग, भार से गुणा, शून्य के बराबर है, अर्थात।

तो अगर । यहां से।

यदि सभी विकल्पों को किसी संख्या से घटाया या बढ़ाया जाता है, तो नई श्रृंखला का अंकगणितीय माध्य उसी राशि से घटेगा या बढ़ेगा।

सभी विकल्पों को कम करें एक्सपर , अर्थात। एक्स´ = एक्सए।

फिर

प्रारंभिक श्रृंखला के अंकगणितीय माध्य को घटाए गए माध्य में जोड़कर प्राप्त किया जा सकता है जो पहले वेरिएंट से घटाया गया था , अर्थात। .

5. यदि सभी विकल्पों को घटाया या बढ़ाया जाता है बार, तो नई श्रृंखला का अंकगणितीय माध्य उसी राशि से घटेगा या बढ़ेगा, अर्थात। में एक बार।

चलो फिर .

इसलिए, यानी। मूल श्रृंखला का औसत प्राप्त करने के लिए, नई श्रृंखला के अंकगणितीय माध्य (घटाए गए विकल्पों के साथ) को द्वारा बढ़ाया जाना चाहिए एक बार।

औसत हार्मोनिक।हार्मोनिक माध्य अंकगणित माध्य का व्युत्क्रम है। इसका उपयोग तब किया जाता है जब सांख्यिकीय जानकारी में व्यक्तिगत जनसंख्या विकल्पों के लिए आवृत्तियाँ नहीं होती हैं, लेकिन उनके उत्पाद (M = xf) के रूप में प्रस्तुत किया जाता है। हार्मोनिक माध्य की गणना सूत्र 3.5 . का उपयोग करके की जाएगी

हार्मोनिक माध्य का व्यावहारिक अनुप्रयोग कुछ सूचकांकों की गणना करना है, विशेष रूप से, मूल्य सूचकांक।

जियोमेट्रिक माध्य।ज्यामितीय माध्य का उपयोग करते समय, विशेषता के व्यक्तिगत मान, एक नियम के रूप में, डायनामिक्स के सापेक्ष मान, श्रृंखला मानों के रूप में निर्मित, डायनामिक्स श्रृंखला में प्रत्येक स्तर के पिछले स्तर के अनुपात के रूप में होते हैं। . औसत इस प्रकार औसत विकास दर की विशेषता है।

ज्यामितीय माध्य का उपयोग विशेषता के अधिकतम और न्यूनतम मानों से समदूरस्थ मान को निर्धारित करने के लिए भी किया जाता है। उदाहरण के लिए, एक बीमा कंपनी ऑटो बीमा सेवाओं के प्रावधान के लिए अनुबंध करती है। विशिष्ट बीमित घटना के आधार पर, बीमा भुगतान प्रति वर्ष 10,000 से 100,000 डॉलर तक भिन्न हो सकता है। औसत बीमा भुगतान यूएस$ है।

ज्यामितीय माध्य अनुपात के औसत के रूप में या वितरण श्रृंखला में उपयोग किया जाने वाला मान है, जिसे ज्यामितीय प्रगति के रूप में प्रस्तुत किया जाता है, जब z = 0। यह औसत उपयोग करने के लिए सुविधाजनक होता है जब ध्यान पूर्ण अंतर पर नहीं, बल्कि अनुपात के अनुपात पर दिया जाता है। दो नंबर।

गणना के सूत्र इस प्रकार हैं

औसत फीचर के वेरिएंट कहां हैं; - विकल्पों का उत्पाद; एफ- विकल्पों की आवृत्ति।

औसत वार्षिक वृद्धि दर की गणना में ज्यामितीय माध्य का उपयोग किया जाता है।

वर्ग मतलब।मूल माध्य वर्ग सूत्र का उपयोग वितरण श्रृंखला में अंकगणित माध्य के चारों ओर एक विशेषता के व्यक्तिगत मूल्यों के उतार-चढ़ाव की डिग्री को मापने के लिए किया जाता है। इसलिए, भिन्नता के संकेतकों की गणना करते समय, औसत की गणना अंकगणितीय माध्य से विशेषता के व्यक्तिगत मूल्यों के विचलन के वर्गों से की जाती है।

माध्य वर्ग मान की गणना सूत्र द्वारा की जाती है

आर्थिक अनुसंधान में, मूल माध्य वर्ग का संशोधित रूप व्यापक रूप से एक विशेषता की भिन्नता के संकेतकों की गणना में उपयोग किया जाता है, जैसे कि विचरण, मानक विचलन।

बहुमत नियम।शक्ति-कानून औसत के बीच निम्नलिखित संबंध है - जितना बड़ा घातांक, उतना ही अधिक औसत का मूल्य, तालिका 5.4:

तालिका 5.4

औसत के बीच संबंध

जेड मान

औसत के बीच का अनुपात

इस संबंध को प्रमुखता का नियम कहा जाता है।

संरचनात्मक औसत।जनसंख्या की संरचना को चिह्नित करने के लिए, विशेष संकेतकों का उपयोग किया जाता है, जिन्हें संरचनात्मक औसत कहा जा सकता है। इन उपायों में बहुलक, माध्यिका, चतुर्थक और दशमांश शामिल हैं।

पहनावा।मोड (Mo) जनसंख्या इकाइयों में एक विशेषता का सबसे अधिक बार होने वाला मान है। मोड उस विशेषता का मान है जो सैद्धांतिक वितरण वक्र के अधिकतम बिंदु से मेल खाता है।

उपभोक्ता मांग (कपड़ों और जूतों के आकार का निर्धारण करते समय जो बहुत मांग में हैं), मूल्य पंजीकरण के अध्ययन में व्यावसायिक व्यवहार में फैशन का व्यापक रूप से उपयोग किया जाता है। कुल मिलाकर कई मोड हो सकते हैं।

एक असतत श्रृंखला में मोड गणना।असतत श्रृंखला में, मोड उच्चतम आवृत्ति वाला संस्करण है। एक असतत श्रृंखला में एक मोड खोजने पर विचार करें।

एक अंतराल श्रृंखला में फैशन की गणना।अंतराल भिन्नता श्रृंखला में, मोडल अंतराल के केंद्रीय संस्करण को लगभग एक मोड माना जाता है, अर्थात। उच्चतम आवृत्ति (आवृत्ति) वाला अंतराल। अंतराल के भीतर, विशेषता का मान ज्ञात करना आवश्यक है, जो कि बहुलक है। अंतराल श्रृंखला के लिए, बहुलक सूत्र द्वारा निर्धारित किया जाएगा

मोडल अंतराल की निचली सीमा कहाँ है; मोडल अंतराल का मान है; मोडल अंतराल के अनुरूप आवृत्ति है; मोडल अंतराल से पहले की आवृत्ति है; मोडल के बाद अंतराल की आवृत्ति है।

माध्यिका।माध्यिका () रैंक की गई श्रृंखला की मध्य इकाई में विशेषता का मान है। एक क्रमबद्ध श्रृंखला एक श्रृंखला है जिसमें विशेषता मान आरोही या अवरोही क्रम में लिखे जाते हैं। या माध्यिका एक ऐसा मान है जो एक क्रमित परिवर्तनशील श्रृंखला की संख्या को दो बराबर भागों में विभाजित करता है: एक भाग में एक चर विशेषता का मान होता है जो औसत प्रकार से कम होता है, और दूसरा बड़ा होता है।

माध्यिका ज्ञात करने के लिए सबसे पहले इसका क्रमांक ज्ञात किया जाता है। ऐसा करने के लिए, विषम संख्या में इकाइयों के साथ, सभी आवृत्तियों के योग में एक जोड़ा जाता है और सब कुछ दो से विभाजित किया जाता है। इकाइयों की एक सम संख्या के साथ, माध्यिका को इकाई की विशेषता के मान के रूप में पाया जाता है, जिसकी क्रम संख्या दो से विभाजित आवृत्तियों के कुल योग से निर्धारित होती है। माध्यिका की क्रमिक संख्या जानने के बाद, संचित आवृत्तियों से इसका मान ज्ञात करना आसान है।

एक असतत श्रृंखला में माध्यिका की गणना।नमूना सर्वेक्षण के अनुसार, बच्चों की संख्या के आधार पर परिवारों के वितरण पर डेटा प्राप्त किया गया था, तालिका। 5.5. माध्यिका ज्ञात करने के लिए, पहले उसकी क्रमसूचक संख्या ज्ञात कीजिए

=

फिर हम संचयी आवृत्तियों की एक श्रृंखला बनाते हैं (, क्रम संख्या और संचयी आवृत्ति से हम माध्यिका पाते हैं। संचयी आवृत्ति 33 से पता चलता है कि 33 परिवारों में बच्चों की संख्या 1 बच्चे से अधिक नहीं है, लेकिन चूंकि माध्यिका संख्या 50 है, औसत 34 से 55 परिवारों की सीमा में होगा।

तालिका 5.5

बच्चों की संख्या से परिवारों की संख्या का वितरण

परिवार में बच्चों की संख्या

परिवारों की संख्या, माध्यिका अंतराल का मान है;

शक्ति माध्य के सभी माने गए रूपों में एक महत्वपूर्ण गुण होता है (संरचनात्मक साधनों के विपरीत) - माध्य निर्धारित करने के सूत्र में श्रृंखला के सभी मान शामिल होते हैं अर्थात। औसत का आकार प्रत्येक विकल्प के मूल्य से प्रभावित होता है।

एक ओर, यह एक बहुत ही सकारात्मक संपत्ति है। इस मामले में, अध्ययन के तहत जनसंख्या की सभी इकाइयों को प्रभावित करने वाले सभी कारणों के प्रभाव को ध्यान में रखा जाता है। दूसरी ओर, यहां तक ​​​​कि एक अवलोकन जो गलती से प्रारंभिक डेटा में शामिल हो गया था, विचाराधीन आबादी में अध्ययन किए गए गुण के विकास के स्तर के विचार को महत्वपूर्ण रूप से विकृत कर सकता है (विशेषकर लघु श्रृंखला में)।

चतुर्थक और दशमांश।परिवर्तनशील श्रृंखला में माध्यिका ज्ञात करने की सादृश्यता से, किसी भी श्रेणीबद्ध श्रृंखला इकाई में किसी विशेषता का मान क्रम से ज्ञात किया जा सकता है। इसलिए, विशेष रूप से, श्रृंखला को 4 बराबर भागों में 10, आदि में विभाजित करने वाली इकाइयों के लिए एक विशेषता का मान ज्ञात कर सकते हैं।

चतुर्थक।श्रेणीबद्ध श्रेणी को चार बराबर भागों में विभाजित करने वाले वेरियंट को चतुर्थक कहते हैं।

उसी समय, निम्नलिखित प्रतिष्ठित हैं: निचला (या पहला) चतुर्थक (Q1) - रैंक की गई श्रृंखला की इकाई की विशेषता का मूल्य, जनसंख्या को से के अनुपात में विभाजित करना और ऊपरी (या तीसरा) ) चतुर्थक (Q3) - श्रेणीबद्ध श्रृंखला की इकाई की विशेषता का मान, जनसंख्या को से के अनुपात में विभाजित करता है।

दूसरा चतुर्थक माध्यिका Q2 = Me है। अंतराल श्रृंखला में निचले और ऊपरी चतुर्थक की गणना माध्यिका के समान सूत्र का उपयोग करके की जाती है।

क्रमशः निचले और ऊपरी चतुर्थक वाले अंतराल की निचली सीमा कहां है;

निचले या ऊपरी चतुर्थक वाले अंतराल से पहले के अंतराल की संचयी आवृत्ति है;

- चतुर्थक अंतरालों की आवृत्तियाँ (निचला और ऊपरी)

Q1 और Q3 वाले अंतराल संचित आवृत्तियों (या आवृत्तियों) से निर्धारित होते हैं।

दशमांश।चतुर्थक के अलावा, दशमलव की गणना की जाती है - विकल्प जो रैंक की गई श्रृंखला को 10 बराबर भागों में विभाजित करते हैं।

उन्हें D द्वारा दर्शाया जाता है, पहला डेसाइल D1 श्रृंखला को 1/10 और 9/10 के अनुपात में विभाजित करता है, दूसरा D2 - 2/10 और 8/10, आदि। उनकी गणना उसी तरह की जाती है जैसे माध्यिका और चतुर्थक।

माध्यिका और चतुर्थक और दशमक दोनों तथाकथित क्रमसूचक आँकड़ों से संबंधित हैं, जिसे एक प्रकार के रूप में समझा जाता है जो एक क्रमबद्ध श्रृंखला में एक निश्चित क्रमिक स्थान रखता है।

समूहीकरण विधि आपको मापने की अनुमति भी देती है उतार-चढ़ाव(परिवर्तनशीलता, उतार-चढ़ाव) संकेतों का। जनसंख्या इकाइयों की अपेक्षाकृत कम संख्या के साथ, भिन्नता को उन इकाइयों की श्रेणीबद्ध श्रृंखला के आधार पर मापा जाता है जो जनसंख्या का निर्माण करती हैं। पंक्ति कहा जाता है स्थान पर रहींयदि इकाइयों को आरोही (अवरोही) विशेषता में व्यवस्थित किया जाता है।

हालाँकि, जब भिन्नता की तुलनात्मक विशेषता की आवश्यकता होती है, तो क्रमबद्ध श्रृंखलाएँ सांकेतिक होती हैं। इसके अलावा, कई मामलों में बड़ी संख्या में इकाइयों से युक्त सांख्यिकीय समुच्चय से निपटना पड़ता है, जिन्हें एक विशिष्ट श्रृंखला के रूप में प्रस्तुत करना व्यावहारिक रूप से कठिन होता है। इस संबंध में, सांख्यिकीय डेटा के साथ प्रारंभिक सामान्य परिचित के लिए और विशेष रूप से संकेतों की भिन्नता के अध्ययन की सुविधा के लिए, अध्ययन की गई घटनाओं और प्रक्रियाओं को आमतौर पर समूहों में जोड़ा जाता है, और समूह के परिणाम समूह तालिकाओं के रूप में तैयार किए जाते हैं। .

यदि समूह तालिका में केवल दो स्तंभ हैं - चयनित विशेषता (विकल्प) और समूहों की संख्या (आवृत्तियों या आवृत्तियों) के अनुसार समूह, इसे कहा जाता है वितरण के निकट।

वितरण रेंज -एक विशेषता के अनुसार संरचनात्मक समूहन का सबसे सरल प्रकार, एक समूह तालिका में प्रदर्शित होता है जिसमें दो कॉलम होते हैं जिनमें विशेषता के वेरिएंट और आवृत्तियां होती हैं। कई मामलों में, ऐसे संरचनात्मक समूहन के साथ, अर्थात्। वितरण श्रृंखला के संकलन के साथ, प्रारंभिक सांख्यिकीय सामग्री का अध्ययन शुरू होता है।

एक वितरण श्रृंखला के रूप में एक संरचनात्मक समूह को एक सच्चे संरचनात्मक समूह में बदल दिया जा सकता है यदि चयनित समूहों को न केवल आवृत्तियों द्वारा, बल्कि अन्य सांख्यिकीय संकेतकों द्वारा भी चित्रित किया जाता है। वितरण श्रृंखला का मुख्य उद्देश्य विशेषताओं की भिन्नता का अध्ययन करना है। वितरण श्रृंखला का सिद्धांत गणितीय आँकड़ों द्वारा विस्तार से विकसित किया गया है।

वितरण श्रृंखला में विभाजित हैं ठहराव(विशेषण विशेषताओं के आधार पर समूह बनाना, उदाहरण के लिए, लिंग, राष्ट्रीयता, वैवाहिक स्थिति, आदि द्वारा जनसंख्या का विभाजन) और परिवर्तन संबंधी(मात्रात्मक विशेषताओं द्वारा समूहीकरण)।

विविधता श्रृंखलाएक समूह तालिका है जिसमें दो कॉलम होते हैं: एक मात्रात्मक विशेषता के अनुसार इकाइयों का समूह और प्रत्येक समूह में इकाइयों की संख्या। भिन्नता श्रृंखला में अंतराल आमतौर पर बराबर और बंद होते हैं। औसत प्रति व्यक्ति नकद आय (तालिका 3.10) के संदर्भ में भिन्नता श्रृंखला रूसी आबादी का निम्नलिखित समूह है।

तालिका 3.10

2004-2009 में औसत प्रति व्यक्ति आय के आधार पर रूस की जनसंख्या का वितरण

जनसंख्या समूह औसत प्रति व्यक्ति नकद आय, रगड़/माह

समूह में जनसंख्या, कुल के% में

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

25,000.0 से अधिक

सभी जनसंख्या

परिवर्तनशील श्रृंखला, बदले में, असतत और अंतराल में विभाजित हैं। अलगविविधता श्रृंखला असतत सुविधाओं के वेरिएंट को जोड़ती है जो संकीर्ण सीमाओं के भीतर भिन्न होती हैं। असतत भिन्नता श्रृंखला का एक उदाहरण रूसी परिवारों का उनके बच्चों की संख्या के अनुसार वितरण है।

मध्यान्तरपरिवर्तनशील श्रृंखला या तो निरंतर विशेषताओं या असतत विशेषताओं के वेरिएंट को जोड़ती है जो एक विस्तृत श्रृंखला में बदलते हैं। अंतराल श्रृंखला औसत प्रति व्यक्ति नकद आय के संदर्भ में रूसी आबादी के वितरण की परिवर्तनशील श्रृंखला है।

असतत परिवर्तनशील श्रृंखला व्यवहार में बहुत बार उपयोग नहीं की जाती है। इस बीच, उन्हें संकलित करना मुश्किल नहीं है, क्योंकि समूहों की संरचना उन विशिष्ट रूपों द्वारा निर्धारित की जाती है जो वास्तव में अध्ययन की गई समूह विशेषताओं के पास होती हैं।

अंतराल भिन्नता श्रृंखला अधिक व्यापक हैं। उन्हें संकलित करने में, समूहों की संख्या के साथ-साथ स्थापित किए जाने वाले अंतरालों के आकार के बारे में कठिन प्रश्न उठता है।

इस मुद्दे को हल करने के सिद्धांत सांख्यिकीय समूहों के निर्माण के लिए कार्यप्रणाली पर अध्याय में निर्धारित किए गए हैं (पैराग्राफ 3.3 देखें)।

विविधता श्रृंखला एक कॉम्पैक्ट रूप में विविध जानकारी को संक्षिप्त या संपीड़ित करने का एक साधन है; अध्ययन के तहत सेट में शामिल घटनाओं के संकेतों में अंतर का अध्ययन करने के लिए, भिन्नता की प्रकृति के बारे में स्पष्ट रूप से स्पष्ट निर्णय लेने के लिए उनका उपयोग किया जा सकता है। लेकिन परिवर्तनशील श्रृंखला का सबसे महत्वपूर्ण महत्व यह है कि उनके आधार पर भिन्नता की विशेष सामान्यीकरण विशेषताओं की गणना की जाती है (अध्याय 7 देखें)।

विविधता श्रृंखला: परिभाषा, प्रकार, मुख्य विशेषताएं। गणना की विधि
चिकित्सा और सांख्यिकीय अध्ययनों में फैशन, माध्यिका, अंकगणितीय माध्य
(सशर्त उदाहरण पर दिखाएं)।

एक परिवर्तनशील श्रृंखला अध्ययन के तहत विशेषता के संख्यात्मक मूल्यों की एक श्रृंखला है, जो एक दूसरे से उनके परिमाण में भिन्न होती है और एक निश्चित क्रम (आरोही या अवरोही क्रम में) में व्यवस्थित होती है। श्रृंखला के प्रत्येक संख्यात्मक मान को एक प्रकार (V) कहा जाता है, और इस श्रृंखला की संरचना में यह या वह संस्करण कितनी बार प्रदर्शित होता है, इसे आवृत्ति (p) कहा जाता है।

प्रेक्षणों के मामलों की कुल संख्या, जिनमें भिन्नता श्रृंखला शामिल है, अक्षर n द्वारा निरूपित की जाती है। अध्ययन की गई विशेषताओं के अर्थ में अंतर को भिन्नता कहा जाता है। यदि चर चिह्न में मात्रात्मक माप नहीं है, तो भिन्नता को गुणात्मक कहा जाता है, और वितरण श्रृंखला को विशेषता कहा जाता है (उदाहरण के लिए, रोग के परिणाम, स्वास्थ्य की स्थिति, आदि द्वारा वितरण)।

यदि एक चर चिह्न में मात्रात्मक अभिव्यक्ति होती है, तो इस तरह की भिन्नता को मात्रात्मक कहा जाता है, और वितरण श्रृंखला को भिन्नता कहा जाता है।

विविधता श्रृंखला को असंतत और निरंतर में विभाजित किया जाता है - मात्रात्मक विशेषता की प्रकृति के अनुसार, सरल और भारित - संस्करण की घटना की आवृत्ति के अनुसार।

एक साधारण विविधता श्रृंखला में, प्रत्येक प्रकार केवल एक बार (p=1) होता है, भारित एक में, एक ही प्रकार कई बार होता है (p>1)। ऐसी श्रृंखला के उदाहरणों पर बाद में पाठ में चर्चा की जाएगी। यदि मात्रात्मक विशेषता निरंतर है, अर्थात। पूर्णांक मानों के बीच मध्यवर्ती भिन्नात्मक मान होते हैं, परिवर्तनशील श्रृंखला को निरंतर कहा जाता है।

उदाहरण के लिए: 10.0 - 11.9

14.0 - 15.9, आदि।

यदि मात्रात्मक चिन्ह असंतत है, अर्थात। इसके व्यक्तिगत मान (विकल्प) एक दूसरे से एक पूर्णांक से भिन्न होते हैं और इनमें मध्यवर्ती भिन्नात्मक मान नहीं होते हैं, भिन्नता श्रृंखला को असंतत या असतत कहा जाता है।

हृदय गति के बारे में पिछले उदाहरण के डेटा का उपयोग करना

21 छात्रों के लिए, हम एक विविधता श्रृंखला (तालिका 1) का निर्माण करेंगे।

तालिका नंबर एक

पल्स रेट (बीपीएम) द्वारा मेडिकल छात्रों का वितरण

इस प्रकार, एक परिवर्तनशील श्रृंखला बनाने का अर्थ है व्यवस्थित करना, मौजूदा संख्यात्मक मूल्यों (विकल्प) को सुव्यवस्थित करना, अर्थात। एक निश्चित क्रम में (आरोही या अवरोही क्रम में) उनकी संगत आवृत्तियों के साथ व्यवस्थित करें। विचाराधीन उदाहरण में, विकल्पों को आरोही क्रम में व्यवस्थित किया जाता है और उन्हें असंतत (असतत) पूर्णांकों के रूप में व्यक्त किया जाता है, प्रत्येक विकल्प कई बार आता है, अर्थात। हम एक भारित, असंतत या असतत परिवर्तनशील श्रृंखला के साथ काम कर रहे हैं।

एक नियम के रूप में, यदि हम जिस सांख्यिकीय आबादी का अध्ययन कर रहे हैं, उसमें टिप्पणियों की संख्या 30 से अधिक नहीं है, तो अध्ययन के तहत विशेषता के सभी मूल्यों को बढ़ते क्रम में एक परिवर्तनशील श्रृंखला में व्यवस्थित करने के लिए पर्याप्त है, जैसा कि तालिका में है। 1, या अवरोही क्रम में।

बड़ी संख्या में प्रेक्षणों (n>30) के साथ, घटित होने वाले वेरिएंट की संख्या बहुत बड़ी हो सकती है, इस मामले में एक अंतराल या समूहीकृत विविधता श्रृंखला संकलित की जाती है, जिसमें बाद के प्रसंस्करण को सरल बनाने और वितरण की प्रकृति को स्पष्ट करने के लिए, रूपों को समूहों में जोड़ा जाता है।

आमतौर पर समूह विकल्पों की संख्या 8 से 15 तक होती है।

उनमें से कम से कम 5 होने चाहिए, क्योंकि। अन्यथा, यह बहुत मोटा, अत्यधिक इज़ाफ़ा होगा, जो भिन्नता की समग्र तस्वीर को विकृत करता है और औसत मूल्यों की सटीकता को बहुत प्रभावित करता है। जब समूह विकल्पों की संख्या 20-25 से अधिक होती है, तो औसत मूल्यों की गणना की सटीकता बढ़ जाती है, लेकिन फीचर भिन्नता की विशेषताएं काफी विकृत हो जाती हैं और गणितीय प्रसंस्करण अधिक जटिल हो जाता है।

समूहीकृत श्रृंखला का संकलन करते समय, इस पर विचार करना आवश्यक है

- भिन्न समूहों को एक विशिष्ट क्रम में रखा जाना चाहिए (आरोही या अवरोही);

- भिन्न समूहों में अंतराल समान होना चाहिए;

− अंतराल की सीमाओं का मान मेल नहीं खाना चाहिए, क्योंकि यह स्पष्ट नहीं होगा कि किस समूह में अलग-अलग विकल्पों को विशेषता देना है;

- अंतराल की सीमा निर्धारित करते समय एकत्रित सामग्री की गुणात्मक विशेषताओं को ध्यान में रखना आवश्यक है (उदाहरण के लिए, वयस्कों के वजन का अध्ययन करते समय, 3-4 किलो का अंतराल स्वीकार्य है, और पहले महीनों में बच्चों के लिए) जीवन का यह 100 ग्राम से अधिक नहीं होना चाहिए।)

आइए एक समूहबद्ध (अंतराल) श्रृंखला का निर्माण करें जो परीक्षा से पहले 55 मेडिकल छात्रों के लिए पल्स रेट (बीट्स प्रति मिनट की संख्या) पर डेटा की विशेषता है: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

समूहीकृत श्रृंखला बनाने के लिए, आपको चाहिए:

1. अंतराल का मान निर्धारित करें;

2. भिन्नता श्रृंखला के प्रकार के समूहों के मध्य, शुरुआत और अंत का निर्धारण करें।

अंतराल का मान (i) अपेक्षित समूहों (r) की संख्या से निर्धारित होता है, जिसकी संख्या एक विशेष तालिका के अनुसार टिप्पणियों (n) की संख्या के आधार पर निर्धारित की जाती है

अवलोकनों की संख्या के आधार पर समूहों की संख्या:

हमारे मामले में, 55 छात्रों के लिए 8 से 10 समूह बनाना संभव है।

अंतराल (i) का मान निम्न सूत्र द्वारा निर्धारित किया जाता है -

मैं = वीमैक्स-वीमिन/आर

हमारे उदाहरण में, अंतराल का मान 82-58/8= 3 है।

यदि अंतराल मान एक भिन्नात्मक संख्या है, तो परिणाम को एक पूर्णांक तक पूर्णांकित किया जाना चाहिए।

कई प्रकार के औसत हैं:

अंकगणित माध्य,

ज्यामितीय माध्य,

हार्मोनिक माध्य,

मूल माध्य वर्ग,

● मध्यम प्रगतिशील,

माध्यिका

चिकित्सा आंकड़ों में, अंकगणितीय औसत का सबसे अधिक बार उपयोग किया जाता है।

अंकगणित माध्य (M) एक सामान्यीकरण मान है जो उस विशिष्ट मान को निर्धारित करता है जो संपूर्ण जनसंख्या की विशेषता है। एम की गणना के लिए मुख्य तरीके हैं: अंकगणितीय माध्य विधि और क्षणों की विधि (सशर्त विचलन)।

अंकगणित माध्य विधि का उपयोग सरल अंकगणितीय माध्य और भारित अंकगणितीय माध्य की गणना के लिए किया जाता है। समांतर माध्य मान की गणना के लिए विधि का चुनाव भिन्नता श्रृंखला के प्रकार पर निर्भर करता है। एक साधारण परिवर्तनशील श्रृंखला के मामले में, जिसमें प्रत्येक प्रकार केवल एक बार होता है, सरल अंकगणितीय माध्य सूत्र द्वारा निर्धारित किया जाता है:

जहां: - अंकगणितीय माध्य मान;

V चर विशेषता (विकल्प) का मान है;

- क्रिया को इंगित करता है - योग;

n प्रेक्षणों की कुल संख्या है।

अंकगणित माध्य की गणना का एक उदाहरण सरल है। 35: 20, 22, 19, 15, 16, 21, 17, 23, 18 आयु वर्ग के 9 पुरुषों में श्वसन दर (प्रति मिनट सांसों की संख्या)।

35 वर्ष की आयु के पुरुषों में श्वसन दर का औसत स्तर निर्धारित करने के लिए यह आवश्यक है:

1. सभी विकल्पों को आरोही या अवरोही क्रम में रखते हुए एक परिवर्तनशील श्रृंखला बनाएँ। हमें एक साधारण परिवर्तनशील श्रृंखला मिली है, क्योंकि भिन्न मान केवल एक बार होते हैं।

एम = ∑V/n = 171/9 = 19 श्वास प्रति मिनट

निष्कर्ष। 35 वर्ष की आयु के पुरुषों में श्वसन दर औसतन 19 श्वास प्रति मिनट होती है।

यदि किसी प्रकार के अलग-अलग मान दोहराए जाते हैं, तो प्रत्येक संस्करण को एक पंक्ति में लिखने की कोई आवश्यकता नहीं है; यह होने वाले संस्करण के आकारों को सूचीबद्ध करने के लिए पर्याप्त है (वी) और आगे उनके दोहराव की संख्या को इंगित करने के लिए (पी) ) ऐसी परिवर्तनशील श्रृंखला, जिसमें भिन्नों को उनके अनुरूप आवृत्तियों की संख्या के अनुसार भारित किया जाता है, भारित परिवर्तनशील श्रृंखला कहलाती है, और परिकलित औसत मान अंकगणितीय भारित औसत होता है।

अंकगणितीय भारित औसत सूत्र द्वारा निर्धारित किया जाता है: M= Vp/n

जहां n आवृत्तियों के योग के बराबर प्रेक्षणों की संख्या है - р।

अंकगणितीय भारित औसत की गणना का एक उदाहरण।

चालू वर्ष की पहली तिमाही के दौरान एक स्थानीय चिकित्सक द्वारा इलाज किए गए तीव्र श्वसन रोगों (एआरआई) के 35 रोगियों में विकलांगता की अवधि (दिनों में) थी: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 दिन।

तीव्र श्वसन संक्रमण वाले रोगियों में विकलांगता की औसत अवधि निर्धारित करने की पद्धति इस प्रकार है:

1. आइए एक भारित परिवर्ती श्रंखला का निर्माण करें, क्योंकि अलग-अलग प्रकार के मान कई बार दोहराए जाते हैं। ऐसा करने के लिए, आप सभी विकल्पों को उनकी संगत आवृत्तियों के साथ आरोही या अवरोही क्रम में व्यवस्थित कर सकते हैं।

हमारे मामले में, विकल्प आरोही क्रम में हैं।

2. सूत्र का उपयोग करके अंकगणितीय भारित औसत की गणना करें: M = Vp/n = 233/35 = 6.7 दिन

विकलांगता की अवधि के अनुसार तीव्र श्वसन संक्रमण वाले रोगियों का वितरण:

काम के लिए अक्षमता की अवधि (वी) रोगियों की संख्या (पी) वीपी
p = n = 35 वीपी = 233

निष्कर्ष। तीव्र श्वसन रोगों वाले रोगियों में विकलांगता की अवधि औसतन 6.7 दिन थी।

मोड (मो) विविधता श्रृंखला में सबसे आम प्रकार है। तालिका में प्रस्तुत वितरण के लिए, मोड 10 के बराबर संस्करण से मेल खाता है, यह दूसरों की तुलना में अधिक बार होता है - 6 बार।

अस्पताल के बिस्तर में रहने की अवधि के अनुसार रोगियों का वितरण (दिनों में)

वी
पी

कभी-कभी बहुलक का सटीक मान निर्धारित करना मुश्किल होता है, क्योंकि अध्ययन किए जा रहे डेटा में कई अवलोकन हो सकते हैं जो "सबसे अधिक बार" होते हैं।

माध्यिका (Me) एक गैर-पैरामीट्रिक संकेतक है जो भिन्नता श्रृंखला को दो बराबर हिस्सों में विभाजित करता है: माध्यिका के दोनों किनारों पर समान संख्या में विकल्प स्थित होते हैं।

उदाहरण के लिए, तालिका में दिखाए गए वितरण के लिए, माध्यिका 10 है क्योंकि इस मान के दोनों ओर 14वें विकल्प पर स्थित है, अर्थात्। संख्या 10 इस श्रृंखला में एक केंद्रीय स्थान रखती है और इसकी माध्यिका है।

यह देखते हुए कि इस उदाहरण में प्रेक्षणों की संख्या सम (n=34) है, माध्यिका निम्नानुसार निर्धारित की जा सकती है:

मैं = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

इसका मतलब यह है कि श्रृंखला का मध्य सत्रहवें विकल्प पर पड़ता है, जो 10 के माध्यिका से मेल खाता है। तालिका में प्रस्तुत वितरण के लिए, अंकगणितीय माध्य है:

एम = वीपी/एन = 334/34 = 10.1

तो, तालिका से 34 टिप्पणियों के लिए। 8, हमें मिला: Mo=10, Me=10, समांतर माध्य (M) 10.1 है। हमारे उदाहरण में, तीनों संकेतक एक-दूसरे के बराबर या करीब निकले, हालांकि वे पूरी तरह से अलग हैं।

अंकगणित माध्य सभी प्रभावों का परिणामी योग है; सभी विकल्प, बिना किसी अपवाद के, इसके गठन में भाग लेते हैं, जिसमें चरम वाले भी शामिल हैं, जो अक्सर किसी घटना या सेट के लिए असामान्य होते हैं।

मोड और माध्यिका, अंकगणितीय माध्य के विपरीत, चर विशेषता के सभी व्यक्तिगत मूल्यों (चरम वेरिएंट के मान और श्रृंखला के बिखरने की डिग्री) के मूल्य पर निर्भर नहीं करते हैं। अंकगणित माध्य प्रेक्षणों के पूरे द्रव्यमान की विशेषता है, बहुलक और माध्यिका थोक की विशेषता है

सांख्यिकीय वितरण श्रृंखला- यह एक निश्चित भिन्न विशेषता के अनुसार समूहों में जनसंख्या इकाइयों का एक क्रमबद्ध वितरण है।
वितरण श्रृंखला के गठन में अंतर्निहित विशेषता के आधार पर, वहाँ हैं विशेषता और भिन्नता वितरण श्रृंखला.

एक सामान्य विशेषता की उपस्थिति एक सांख्यिकीय आबादी के गठन का आधार है, जो अध्ययन की वस्तुओं की सामान्य विशेषताओं के विवरण या माप का परिणाम है।

आंकड़ों में अध्ययन का विषय बदल रहा है (अलग-अलग) विशेषताएं या सांख्यिकीय विशेषताएं।

सांख्यिकीय विशेषताओं के प्रकार.

वितरण श्रृंखला को विशेषता श्रृंखला कहा जाता है।गुणवत्ता के आधार पर बनाया गया है। ठहराव- यह एक संकेत है जिसका एक नाम है (उदाहरण के लिए, एक पेशा: एक सीमस्ट्रेस, शिक्षक, आदि)।
वितरण श्रृंखला को तालिकाओं के रूप में व्यवस्थित करने की प्रथा है। तालिका में। 2.8 वितरण की एक विशेषता श्रृंखला दिखाता है।
तालिका 2.8 - रूसी संघ के क्षेत्रों में से एक के नागरिकों को वकीलों द्वारा प्रदान की जाने वाली कानूनी सहायता के प्रकारों का वितरण।

विविधता श्रृंखलाविशेषता मान (या मानों की श्रेणी) और उनकी आवृत्तियाँ हैं।
विविधता श्रृंखला वितरण श्रृंखला हैंमात्रात्मक आधार पर निर्मित। किसी भी परिवर्तनशील श्रृंखला में दो तत्व होते हैं: रूपांतर और आवृत्तियाँ।
वैरिएंट एक विशेषता के व्यक्तिगत मूल्य हैं जो इसे एक भिन्नता श्रृंखला में लेते हैं।
फ़्रीक्वेंसी अलग-अलग वेरिएंट या विविधता श्रृंखला के प्रत्येक समूह की संख्या है, अर्थात। ये संख्याएँ दर्शाती हैं कि वितरण श्रृंखला में कुछ निश्चित विकल्प कितनी बार आते हैं। सभी आवृत्तियों का योग संपूर्ण जनसंख्या का आकार, उसका आयतन निर्धारित करता है।
फ़्रीक्वेंसी को फ़्रीक्वेंसी कहा जाता है, जिसे एक इकाई के अंशों में या कुल के प्रतिशत के रूप में व्यक्त किया जाता है। तदनुसार, आवृत्तियों का योग 1 या 100% के बराबर है। परिवर्तनशील श्रृंखला हमें वास्तविक डेटा के आधार पर वितरण कानून के रूप का मूल्यांकन करने की अनुमति देती है।

विशेषता की भिन्नता की प्रकृति के आधार पर, वहाँ हैं असतत और अंतराल भिन्नता श्रृंखला.
असतत परिवर्तनशील श्रृंखला का एक उदाहरण तालिका में दिया गया है। 2.9.
तालिका 2.9 - रूसी संघ में 1989 में व्यक्तिगत अपार्टमेंट में रहने वाले कमरों की संख्या से परिवारों का वितरण।

तालिका का पहला स्तंभ एक असतत भिन्नता श्रृंखला के रूप प्रस्तुत करता है, दूसरे स्तंभ में भिन्नता श्रृंखला की आवृत्तियाँ होती हैं, और तीसरे स्तंभ में आवृत्ति संकेतक होते हैं।

विविधता श्रृंखला

सामान्य आबादी में, एक निश्चित मात्रात्मक विशेषता की जांच की जा रही है। आयतन का एक नमूना उसमें से यादृच्छिक रूप से निकाला जाता है एन, अर्थात् नमूने में तत्वों की संख्या है एन. सांख्यिकीय प्रसंस्करण के पहले चरण में, लेकरनमूने, यानी नंबर ऑर्डरिंग एक्स 1 , एक्स 2 ,…, एक्स एनआरोही। प्रत्येक मनाया मूल्य एक्स मैंबुलाया विकल्प. आवृत्ति मैं मैंमूल्य के अवलोकनों की संख्या है एक्स मैंनमूने में। सापेक्ष आवृत्ति (आवृत्ति) मैंआवृत्ति अनुपात है मैं मैंनमूना आकार के लिए एन: .
एक परिवर्तनशील श्रृंखला का अध्ययन करते समय, संचयी आवृत्ति और संचयी आवृत्ति की अवधारणाओं का भी उपयोग किया जाता है। रहने दो एक्सकुछ संख्या। फिर विकल्पों की संख्या , जिनका मान कम है एक्स, संचित आवृत्ति कहलाती है: x i . के लिए एनसंचित आवृत्ति w i मैक्स कहा जाता है।
एक विशेषता को असतत रूप से चर कहा जाता है यदि उसके व्यक्तिगत मान (वेरिएंट) एक दूसरे से कुछ परिमित राशि (आमतौर पर एक पूर्णांक) से भिन्न होते हैं। ऐसी विशेषता की एक परिवर्तनशील श्रृंखला को असतत परिवर्तनशील श्रृंखला कहा जाता है।

तालिका 1. आवृत्तियों की असतत परिवर्तनशील श्रृंखला का सामान्य दृश्य

फ़ीचर मानएक्स मैं एक्स 1 x2 एक्स एन
आवृत्तियोंमैं मैं एम 1 एम2 मैं नहीं

एक विशेषता को लगातार अलग-अलग कहा जाता है यदि उसके मान एक दूसरे से मनमाने ढंग से छोटी राशि से भिन्न होते हैं, अर्थात। संकेत एक निश्चित अंतराल में कोई भी मान ले सकता है। ऐसे लक्षण के लिए एक सतत भिन्नता श्रृंखला को अंतराल श्रृंखला कहा जाता है।

तालिका 2. आवृत्तियों की अंतराल भिन्नता श्रृंखला का सामान्य दृश्य

तालिका 3. भिन्नता श्रृंखला की ग्राफिक छवियां

पंक्तिबहुभुज या हिस्टोग्रामअनुभवजन्य वितरण समारोह
अलग
मध्यान्तर
टिप्पणियों के परिणामों को देखते हुए, यह निर्धारित किया जाता है कि प्रत्येक विशिष्ट अंतराल में वेरिएंट के कितने मूल्य गिरे। यह माना जाता है कि प्रत्येक अंतराल इसके किसी एक छोर से संबंधित है: या तो सभी मामलों में बाएं (अधिक बार), या सभी मामलों में दाएं, और आवृत्तियों या आवृत्तियों में संकेतित सीमाओं में निहित विकल्पों की संख्या दिखाई देती है। मतभेद एक मैं - एक मैं +1आंशिक अंतराल कहलाते हैं। बाद की गणनाओं को सरल बनाने के लिए, अंतराल भिन्नता श्रृंखला को सशर्त असतत द्वारा प्रतिस्थापित किया जा सकता है। इस मामले में, माध्य मान मैं-वें अंतराल को एक विकल्प के रूप में लिया जाता है एक्स मैं, और इसी अंतराल आवृत्ति मैं मैं- इस अंतराल की आवृत्ति के लिए।
विविधता श्रृंखला के ग्राफिक प्रतिनिधित्व के लिए, बहुभुज, हिस्टोग्राम, संचयी वक्र और अनुभवजन्य वितरण फ़ंक्शन का सबसे अधिक उपयोग किया जाता है।

तालिका में। 2.3 (अप्रैल 1994 में औसत प्रति व्यक्ति आय के आधार पर रूसी जनसंख्या का समूहन) प्रस्तुत किया गया है अंतराल भिन्नता श्रृंखला.
चित्रमय प्रतिनिधित्व का उपयोग करके वितरण श्रृंखला का विश्लेषण करना सुविधाजनक है, जो किसी को वितरण के आकार का न्याय करने की अनुमति देता है। परिवर्तनशील श्रृंखला की आवृत्तियों में परिवर्तन की प्रकृति का एक दृश्य प्रतिनिधित्व द्वारा दिया गया है बहुभुज और हिस्टोग्राम.
असतत परिवर्तनशील श्रृंखला प्रदर्शित करते समय बहुभुज का उपयोग किया जाता है.
आइए, उदाहरण के लिए, अपार्टमेंट के प्रकार द्वारा आवास स्टॉक के वितरण को ग्राफिक रूप से चित्रित करें (सारणी 2.10)।
तालिका 2.10 - अपार्टमेंट के प्रकार (सशर्त आंकड़े) द्वारा शहरी क्षेत्र के आवास स्टॉक का वितरण।


चावल। आवास वितरण बहुभुज


y-अक्ष पर, न केवल आवृत्तियों के मान, बल्कि भिन्नता श्रृंखला की आवृत्तियों को भी प्लॉट किया जा सकता है।
अंतराल भिन्नता श्रृंखला प्रदर्शित करने के लिए हिस्टोग्राम लिया जाता है. हिस्टोग्राम का निर्माण करते समय, अंतराल के मूल्यों को एब्सिस्सा अक्ष पर प्लॉट किया जाता है, और आवृत्तियों को संबंधित अंतराल पर निर्मित आयतों द्वारा दर्शाया जाता है। समान अंतराल की स्थिति में स्तंभों की ऊंचाई बारंबारताओं के समानुपाती होनी चाहिए। एक हिस्टोग्राम एक ग्राफ है जिसमें एक श्रृंखला को एक दूसरे से सटे बार के रूप में दिखाया जाता है।
आइए तालिका में दी गई अंतराल वितरण श्रृंखला को आलेखीय रूप से चित्रित करें। 2.11.
तालिका 2.11 - प्रति व्यक्ति रहने की जगह के आकार से परिवारों का वितरण (सशर्त आंकड़े)।
एन पी / पी प्रति व्यक्ति रहने की जगह के आकार के अनुसार परिवारों के समूह रहने की जगह के दिए गए आकार वाले परिवारों की संख्या परिवारों की संचित संख्या
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
कुल 115 ----


चावल। 2.2. प्रति व्यक्ति रहने की जगह के आकार से परिवारों के वितरण का हिस्टोग्राम


संचित श्रृंखला (तालिका 2.11) के डेटा का उपयोग करके, हम निर्माण करते हैं वितरण संचयी।


चावल। 2.3. प्रति व्यक्ति रहने की जगह के आकार से परिवारों का संचयी वितरण


एक संचयी के रूप में एक परिवर्तनशील श्रृंखला का प्रतिनिधित्व विशेष रूप से परिवर्तनशील श्रृंखला के लिए प्रभावी होता है, जिसकी आवृत्तियों को श्रृंखला की आवृत्तियों के योग के अंश या प्रतिशत के रूप में व्यक्त किया जाता है।
यदि हम परिवर्तनशील श्रृंखला के ग्राफिक निरूपण में कुल्हाड़ियों को एक संचयी के रूप में बदलते हैं, तो हम प्राप्त करते हैं ओगिवु. अंजीर पर। 2.4 तालिका में आँकड़ों के आधार पर निर्मित तोरण को दर्शाता है। 2.11.
आयतों की भुजाओं के मध्य बिंदुओं को ढूंढकर और फिर इन बिंदुओं को सीधी रेखाओं से जोड़कर एक हिस्टोग्राम को वितरण बहुभुज में परिवर्तित किया जा सकता है। परिणामी वितरण बहुभुज अंजीर में दिखाया गया है। 2.2 बिंदीदार रेखा।
असमान अंतराल के साथ एक परिवर्तनशील श्रृंखला के वितरण के हिस्टोग्राम का निर्माण करते समय, समन्वय अक्ष के साथ, आवृत्तियों को प्लॉट नहीं किया जाता है, लेकिन इसी अंतराल में सुविधा का वितरण घनत्व।
वितरण घनत्व प्रति इकाई अंतराल चौड़ाई की गणना की गई आवृत्ति है, अर्थात। प्रत्येक समूह में कितनी इकाइयाँ प्रति इकाई अंतराल मान हैं। वितरण घनत्व की गणना का एक उदाहरण तालिका में प्रस्तुत किया गया है। 2.12.
तालिका 2.12 - कर्मचारियों की संख्या से उद्यमों का वितरण (आंकड़े सशर्त हैं)
एन पी / पी कर्मचारियों की संख्या से उद्यमों के समूह, प्रति। उद्यमों की संख्या अंतराल आकार, प्रति। वितरण घनत्व
लेकिन 1 2 3=1/2
1 20 तक 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
कुल 147 ---- ----

भिन्नता श्रृंखला के चित्रमय प्रतिनिधित्व के लिए भी इस्तेमाल किया जा सकता है संचयी वक्र. संचयी (राशि का वक्र) की सहायता से संचित आवृत्तियों की एक श्रृंखला प्रदर्शित होती है। संचित आवृत्तियों को समूहों द्वारा आवृत्तियों को क्रमिक रूप से जोड़कर निर्धारित किया जाता है और यह दर्शाता है कि जनसंख्या की कितनी इकाइयों में विशेषता मान माने गए मान से अधिक नहीं हैं।


चावल। 2.4. प्रति व्यक्ति रहने की जगह के आकार के अनुसार परिवारों का ओगिवा वितरण

अंतराल भिन्नता श्रृंखला के संचयी का निर्माण करते समय, श्रृंखला के रूपों को एब्सिस्सा अक्ष के साथ और संचित आवृत्तियों को कोटि अक्ष के साथ प्लॉट किया जाता है।

निरंतर भिन्नता श्रृंखला

एक सतत परिवर्तनशील श्रृंखला एक मात्रात्मक सांख्यिकीय संकेत के आधार पर निर्मित एक श्रृंखला है। उदाहरण। चालू वर्ष में शरद ऋतु-सर्दियों की अवधि में दोषियों (प्रति व्यक्ति दिन) के रोगों की औसत अवधि थी:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5

परिवर्तन संबंधीमात्रात्मक आधार पर निर्मित वितरण श्रृंखला कहलाती है। जनसंख्या की व्यक्तिगत इकाइयों में मात्रात्मक विशेषताओं के मूल्य स्थिर नहीं होते हैं, कमोबेश एक दूसरे से भिन्न होते हैं।

उतार-चढ़ाव- उतार-चढ़ाव, जनसंख्या की इकाइयों में विशेषता के मूल्य की परिवर्तनशीलता। अध्ययन की गई जनसंख्या में होने वाले लक्षण के पृथक संख्यात्मक मान कहलाते हैं विकल्पमूल्य। जनसंख्या के पूर्ण लक्षण वर्णन के लिए औसत मूल्य की अपर्याप्तता औसत मूल्यों को संकेतकों के साथ पूरक करना आवश्यक बनाती है जो अध्ययन के तहत विशेषता के उतार-चढ़ाव (भिन्नता) को मापकर इन औसतों की विशिष्टता का आकलन करना संभव बनाता है।

भिन्नता की उपस्थिति विशेषता स्तर के गठन पर बड़ी संख्या में कारकों के प्रभाव के कारण होती है। ये कारक असमान बल के साथ और विभिन्न दिशाओं में कार्य करते हैं। विशेषता परिवर्तनशीलता के माप का वर्णन करने के लिए विविधता संकेतकों का उपयोग किया जाता है।

भिन्नता के सांख्यिकीय अध्ययन के कार्य:

  • 1) जनसंख्या की अलग-अलग इकाइयों में संकेतों की भिन्नता की प्रकृति और डिग्री का अध्ययन;
  • 2) जनसंख्या की कुछ विशेषताओं की भिन्नता में व्यक्तिगत कारकों या उनके समूहों की भूमिका का निर्धारण।

आंकड़ों में, संकेतकों की एक प्रणाली के उपयोग के आधार पर भिन्नता का अध्ययन करने के लिए विशेष विधियों का उपयोग किया जाता है, साथजिसके द्वारा भिन्नता को मापा जाता है।

भिन्नता का अध्ययन आवश्यक है। नमूना अवलोकन, सहसंबंध और विचरण विश्लेषण आदि करते समय विविधताओं का मापन आवश्यक है। एर्मोलेव ओ.यू. मनोवैज्ञानिकों के लिए गणितीय आँकड़े: पाठ्यपुस्तक [पाठ] / O.Yu. एर्मोलेव। - एम .: मॉस्को साइकोलॉजिकल एंड सोशल इंस्टीट्यूट, 2012 का फ्लिंट पब्लिशिंग हाउस। - 335p।

भिन्नता की डिग्री के अनुसार, कोई जनसंख्या की एकरूपता, विशेषताओं के व्यक्तिगत मूल्यों की स्थिरता और औसत की विशिष्टता का न्याय कर सकता है। उनके आधार पर, संकेतों के बीच संबंध की निकटता के संकेतक विकसित किए जाते हैं, चयनात्मक अवलोकन की सटीकता का आकलन करने के लिए संकेतक विकसित किए जाते हैं।

स्थान में भिन्नता है और समय में भिन्नता है।

अंतरिक्ष में भिन्नता को अलग-अलग क्षेत्रों का प्रतिनिधित्व करने वाली जनसंख्या की इकाइयों में एक विशेषता के मूल्यों के उतार-चढ़ाव के रूप में समझा जाता है। समय में परिवर्तन के तहत विभिन्न अवधियों में विशेषता के मूल्यों में परिवर्तन का मतलब है।

वितरण श्रृंखला में भिन्नता का अध्ययन करने के लिए, विशेषता मानों के सभी प्रकारों को आरोही या अवरोही क्रम में व्यवस्थित किया जाता है। इस प्रक्रिया को श्रृंखला रैंकिंग कहा जाता है।

भिन्नता के सबसे सरल संकेत हैं न्यूनतम और अधिकतम- समुच्चय में विशेषता का सबसे छोटा और सबसे बड़ा मूल्य। फीचर वैल्यू के अलग-अलग वेरिएंट की पुनरावृत्ति की संख्या को पुनरावृत्ति की आवृत्ति (फाई) कहा जाता है। आवृत्तियों के साथ आवृत्तियों को प्रतिस्थापित करना सुविधाजनक है - वाई। आवृत्ति - आवृत्ति का एक सापेक्ष संकेतक, जिसे एक इकाई या प्रतिशत के अंशों में व्यक्त किया जा सकता है और आपको भिन्नता श्रृंखला की तुलना विभिन्न टिप्पणियों के साथ करने की अनुमति देता है। सूत्र द्वारा व्यक्त किया गया:

जहाँ Xmax, Xmin - समुच्चय में विशेषता का अधिकतम और न्यूनतम मान; n समूहों की संख्या है।

एक विशेषता की भिन्नता को मापने के लिए, विभिन्न निरपेक्ष और सापेक्ष संकेतकों का उपयोग किया जाता है। भिन्नता के निरपेक्ष संकेतकों में भिन्नता की सीमा, औसत रैखिक विचलन, विचरण, मानक विचलन शामिल हैं। उतार-चढ़ाव के सापेक्ष संकेतकों में दोलन का गुणांक, सापेक्ष रैखिक विचलन, भिन्नता का गुणांक शामिल है।

विविधता श्रृंखला खोजने का एक उदाहरण

व्यायाम।इस नमूने के लिए:

  • ए) एक भिन्नता श्रृंखला खोजें;
  • बी) वितरण समारोह का निर्माण;

संख्या = 42। नमूना आइटम:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

फेसला।

  • ए) एक क्रमबद्ध विविधता श्रृंखला का निर्माण:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • बी) एक असतत परिवर्तनशील श्रृंखला का निर्माण।

आइए स्टर्गेस सूत्र का उपयोग करके विविधता श्रृंखला में समूहों की संख्या की गणना करें:

आइए 7 के बराबर समूहों की संख्या लें।

समूहों की संख्या जानने के बाद, हम अंतराल के मूल्य की गणना करते हैं:

तालिका बनाने की सुविधा के लिए हम 8 के बराबर समूहों की संख्या लेंगे, अंतराल 1 होगा।

चावल। एक एक निश्चित अवधि के लिए स्टोर द्वारा माल की बिक्री की मात्रा