सांख्यिकी परिभाषा में असतत भिन्नता श्रृंखला। विविधता श्रृंखला

किसी दिए गए प्रयोग या अवलोकन में अध्ययन किए गए पैरामीटर के मूल्यों के सेट को परिमाण (वृद्धि या कमी) द्वारा क्रमबद्ध किया जाता है, एक भिन्नता श्रृंखला कहा जाता है।

आइए मान लें कि हमने ऊपरी बीपी थ्रेशोल्ड प्राप्त करने के लिए दस रोगियों के रक्तचाप को मापा: सिस्टोलिक दबाव, यानी। केवल एक नंबर।

कल्पना कीजिए कि 10 अवलोकनों में धमनी सिस्टोलिक दबाव की टिप्पणियों (सांख्यिकीय जनसंख्या) की एक श्रृंखला का निम्न रूप है (तालिका 1):

तालिका नंबर एक

एक परिवर्तनशील श्रृंखला के घटकों को रूपांतर कहा जाता है। वेरिएंट अध्ययन किए जा रहे गुण के संख्यात्मक मूल्य का प्रतिनिधित्व करते हैं।

प्रेक्षणों के सांख्यिकीय सेट से एक परिवर्तनशील श्रृंखला का निर्माण पूरे सेट की विशेषताओं को समझने की दिशा में केवल पहला कदम है। अगला, अध्ययन किए गए मात्रात्मक गुण (रक्त प्रोटीन का औसत स्तर, रोगियों का औसत वजन, संज्ञाहरण की शुरुआत का औसत समय, आदि) के औसत स्तर को निर्धारित करना आवश्यक है।

औसत स्तर को मानदंड का उपयोग करके मापा जाता है जिसे औसत कहा जाता है। औसत मूल्य गुणात्मक रूप से सजातीय मूल्यों की एक सामान्यीकृत संख्यात्मक विशेषता है, जो एक विशेषता के अनुसार संपूर्ण सांख्यिकीय आबादी की एक संख्या की विशेषता है। औसत मूल्य सामान्य को व्यक्त करता है, जो कि अवलोकनों के दिए गए सेट में एक विशेषता की विशेषता है।

सामान्य उपयोग में तीन प्रकार के औसत होते हैं: मोड (), माध्य () और अंकगणितीय माध्य ()।

किसी भी औसत मूल्य को निर्धारित करने के लिए, व्यक्तिगत टिप्पणियों के परिणामों का उपयोग करना आवश्यक है, उन्हें भिन्नता श्रृंखला (तालिका 2) के रूप में लिखना।

पहनावा- वह मान जो प्रेक्षणों की श्रृंखला में सबसे अधिक बार होता है। हमारे उदाहरण में, बहुलक = 120। यदि भिन्नता श्रृंखला में कोई दोहराए जाने वाले मान नहीं हैं, तो वे कहते हैं कि कोई बहुलक नहीं है। यदि कई मानों को एक ही संख्या में दोहराया जाता है, तो उनमें से सबसे छोटे को बहुलक के रूप में लिया जाता है।

मंझला- वितरण को दो बराबर भागों में विभाजित करने वाला मान, आरोही या अवरोही क्रम में क्रमबद्ध प्रेक्षणों की एक श्रृंखला का केंद्रीय या माध्य मान। अत: यदि परिवर्ती श्रेणी में 5 मान हैं, तो इसका माध्यिका परिवर्तनशील श्रेणी के तीसरे सदस्य के बराबर है, यदि श्रृंखला में सदस्यों की संख्या सम है, तो माध्यिका इसके दोनों का अंकगणितीय माध्य है केंद्रीय अवलोकन, अर्थात्। यदि श्रंखला में 10 प्रेक्षण हैं, तो माध्यिका 5 और 6 प्रेक्षणों के समांतर माध्य के बराबर होती है। हमारे उदाहरण में।

मोड और माध्यिका की एक महत्वपूर्ण विशेषता पर ध्यान दें: उनके मान चरम वेरिएंट के संख्यात्मक मानों से प्रभावित नहीं होते हैं।

अंकगणित औसतसूत्र द्वारा गणना:

-वें प्रेक्षण में प्रेक्षित मान कहाँ है, और प्रेक्षणों की संख्या है। हमारे मामले के लिए।

अंकगणित माध्य में तीन गुण होते हैं:

मध्य एक भिन्नता श्रृंखला में मध्य स्थान रखता है। कड़ाई से सममित पंक्ति में।

औसत एक सामान्यीकरण मूल्य है और यादृच्छिक उतार-चढ़ाव, औसत के पीछे व्यक्तिगत डेटा में अंतर दिखाई नहीं देता है। यह उस विशिष्ट को दर्शाता है जो पूरी आबादी की विशेषता है।

माध्य से सभी प्रकार के विचलनों का योग शून्य के बराबर होता है: . माध्य से भिन्न का विचलन इंगित किया गया है।

भिन्नता श्रृंखला में भिन्नताएं और उनकी संगत आवृत्तियां होती हैं। प्राप्त दस मूल्यों में से, संख्या 120 को 6 बार, 115 - 3 बार, 125 - 1 बार का सामना करना पड़ा। आवृत्ति () - जनसंख्या में व्यक्तिगत विकल्पों की पूर्ण संख्या, यह दर्शाती है कि विविधता श्रृंखला में यह विकल्प कितनी बार आता है।

विविधता श्रृंखला सरल हो सकती है (आवृत्तियां = 1) या समूहीकृत छोटा, प्रत्येक 3-5 विकल्प। एक साधारण श्रृंखला का उपयोग कम संख्या में अवलोकन (), समूहीकृत - बड़ी संख्या में अवलोकन () के साथ किया जाता है।

विविधता श्रृंखला: परिभाषा, प्रकार, मुख्य विशेषताएं। गणना की विधि
चिकित्सा और सांख्यिकीय अध्ययनों में फैशन, माध्यिका, अंकगणितीय माध्य
(सशर्त उदाहरण पर दिखाएं)।

एक परिवर्तनशील श्रृंखला अध्ययन के तहत विशेषता के संख्यात्मक मूल्यों की एक श्रृंखला है, जो एक दूसरे से उनके परिमाण में भिन्न होती है और एक निश्चित क्रम (आरोही या अवरोही क्रम में) में व्यवस्थित होती है। श्रृंखला के प्रत्येक संख्यात्मक मान को एक प्रकार (V) कहा जाता है, और इस श्रृंखला की संरचना में यह या वह संस्करण कितनी बार प्रदर्शित होता है, इसे आवृत्ति (p) कहा जाता है।

प्रेक्षणों के मामलों की कुल संख्या, जिनमें भिन्नता श्रृंखला शामिल है, अक्षर n द्वारा निरूपित की जाती है। अध्ययन की गई विशेषताओं के अर्थ में अंतर को भिन्नता कहा जाता है। यदि चर चिह्न में मात्रात्मक माप नहीं है, तो भिन्नता को गुणात्मक कहा जाता है, और वितरण श्रृंखला को विशेषता कहा जाता है (उदाहरण के लिए, रोग के परिणाम, स्वास्थ्य की स्थिति, आदि द्वारा वितरण)।

यदि एक चर चिह्न में मात्रात्मक अभिव्यक्ति होती है, तो इस तरह की भिन्नता को मात्रात्मक कहा जाता है, और वितरण श्रृंखला को भिन्नता कहा जाता है।

विविधता श्रृंखला को असंतत और निरंतर में विभाजित किया जाता है - मात्रात्मक विशेषता की प्रकृति के अनुसार, सरल और भारित - संस्करण की घटना की आवृत्ति के अनुसार।

एक साधारण विविधता श्रृंखला में, प्रत्येक प्रकार केवल एक बार (p=1) होता है, भारित एक में, एक ही प्रकार कई बार होता है (p>1)। ऐसी श्रृंखला के उदाहरणों पर बाद में पाठ में चर्चा की जाएगी। यदि मात्रात्मक विशेषता निरंतर है, अर्थात। पूर्णांक मानों के बीच मध्यवर्ती भिन्नात्मक मान होते हैं, परिवर्तनशील श्रृंखला को निरंतर कहा जाता है।

उदाहरण के लिए: 10.0 - 11.9

14.0 - 15.9, आदि।

यदि मात्रात्मक चिन्ह असंतत है, अर्थात। इसके व्यक्तिगत मान (विकल्प) एक दूसरे से एक पूर्णांक से भिन्न होते हैं और इनमें मध्यवर्ती भिन्नात्मक मान नहीं होते हैं, भिन्नता श्रृंखला को असंतत या असतत कहा जाता है।

हृदय गति के बारे में पिछले उदाहरण के डेटा का उपयोग करना

21 छात्रों के लिए, हम एक विविधता श्रृंखला (तालिका 1) का निर्माण करेंगे।

तालिका नंबर एक

पल्स रेट (बीपीएम) द्वारा मेडिकल छात्रों का वितरण

इस प्रकार, एक परिवर्तनशील श्रृंखला बनाने का अर्थ है व्यवस्थित करना, मौजूदा संख्यात्मक मूल्यों (विकल्प) को सुव्यवस्थित करना, अर्थात। एक निश्चित क्रम में (आरोही या अवरोही क्रम में) उनकी संगत आवृत्तियों के साथ व्यवस्थित करें। विचाराधीन उदाहरण में, विकल्पों को आरोही क्रम में व्यवस्थित किया जाता है और उन्हें असंतत (असतत) पूर्णांकों के रूप में व्यक्त किया जाता है, प्रत्येक विकल्प कई बार आता है, अर्थात। हम एक भारित, असंतत या असतत परिवर्तनशील श्रृंखला के साथ काम कर रहे हैं।

एक नियम के रूप में, यदि हम जिस सांख्यिकीय आबादी का अध्ययन कर रहे हैं, उसमें टिप्पणियों की संख्या 30 से अधिक नहीं है, तो अध्ययन के तहत विशेषता के सभी मूल्यों को बढ़ते क्रम में एक परिवर्तनशील श्रृंखला में व्यवस्थित करने के लिए पर्याप्त है, जैसा कि तालिका में है। 1, या अवरोही क्रम में।

बड़ी संख्या में प्रेक्षणों (n>30) के साथ, घटित होने वाले वेरिएंट की संख्या बहुत बड़ी हो सकती है, इस मामले में एक अंतराल या समूहीकृत विविधता श्रृंखला संकलित की जाती है, जिसमें बाद के प्रसंस्करण को सरल बनाने और वितरण की प्रकृति को स्पष्ट करने के लिए, रूपों को समूहों में जोड़ा जाता है।

आमतौर पर समूह विकल्पों की संख्या 8 से 15 तक होती है।

उनमें से कम से कम 5 होने चाहिए, क्योंकि। अन्यथा, यह बहुत मोटा, अत्यधिक इज़ाफ़ा होगा, जो भिन्नता की समग्र तस्वीर को विकृत करता है और औसत मूल्यों की सटीकता को बहुत प्रभावित करता है। जब समूह विकल्पों की संख्या 20-25 से अधिक होती है, तो औसत मूल्यों की गणना की सटीकता बढ़ जाती है, लेकिन फीचर भिन्नता की विशेषताएं काफी विकृत हो जाती हैं और गणितीय प्रसंस्करण अधिक जटिल हो जाता है।

समूहीकृत श्रृंखला का संकलन करते समय, इस पर विचार करना आवश्यक है

- भिन्न समूहों को एक विशिष्ट क्रम में रखा जाना चाहिए (आरोही या अवरोही);

- भिन्न समूहों में अंतराल समान होना चाहिए;

− अंतराल की सीमाओं का मान मेल नहीं खाना चाहिए, क्योंकि यह स्पष्ट नहीं होगा कि किस समूह में अलग-अलग विकल्पों को विशेषता देना है;

- अंतराल की सीमा निर्धारित करते समय एकत्रित सामग्री की गुणात्मक विशेषताओं को ध्यान में रखना आवश्यक है (उदाहरण के लिए, वयस्कों के वजन का अध्ययन करते समय, 3-4 किलो का अंतराल स्वीकार्य है, और पहले महीनों में बच्चों के लिए) जीवन का यह 100 ग्राम से अधिक नहीं होना चाहिए।)

आइए एक समूहीकृत (अंतराल) श्रृंखला का निर्माण करें जो परीक्षा से पहले 55 मेडिकल छात्रों के लिए पल्स रेट (बीट्स प्रति मिनट की संख्या) पर डेटा की विशेषता है: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

समूहीकृत श्रृंखला बनाने के लिए, आपको चाहिए:

1. अंतराल का मान निर्धारित करें;

2. भिन्नता श्रृंखला के प्रकार के समूहों के मध्य, शुरुआत और अंत का निर्धारण करें।

अंतराल का मान (i) अपेक्षित समूहों (r) की संख्या से निर्धारित होता है, जिसकी संख्या एक विशेष तालिका के अनुसार टिप्पणियों (n) की संख्या के आधार पर निर्धारित की जाती है

अवलोकनों की संख्या के आधार पर समूहों की संख्या:

हमारे मामले में, 55 छात्रों के लिए 8 से 10 समूह बनाना संभव है।

अंतराल (i) का मान निम्न सूत्र द्वारा निर्धारित किया जाता है -

मैं = वीमैक्स-वीमिन/आर

हमारे उदाहरण में, अंतराल का मान 82-58/8= 3 है।

यदि अंतराल मान एक भिन्नात्मक संख्या है, तो परिणाम को एक पूर्णांक तक पूर्णांकित किया जाना चाहिए।

कई प्रकार के औसत हैं:

अंकगणित माध्य,

ज्यामितीय माध्य,

हार्मोनिक माध्य,

मूल माध्य वर्ग,

● मध्यम प्रगतिशील,

माध्यिका

चिकित्सा आंकड़ों में, अंकगणितीय औसत का सबसे अधिक बार उपयोग किया जाता है।

अंकगणित माध्य (M) एक सामान्यीकरण मान है जो उस विशिष्ट मान को निर्धारित करता है जो संपूर्ण जनसंख्या की विशेषता है। एम की गणना के लिए मुख्य तरीके हैं: अंकगणितीय माध्य विधि और क्षणों की विधि (सशर्त विचलन)।

अंकगणित माध्य विधि का उपयोग सरल अंकगणितीय माध्य और भारित अंकगणितीय माध्य की गणना के लिए किया जाता है। समांतर माध्य मान की गणना के लिए विधि का चुनाव भिन्नता श्रृंखला के प्रकार पर निर्भर करता है। एक साधारण परिवर्तनशील श्रृंखला के मामले में, जिसमें प्रत्येक प्रकार केवल एक बार होता है, सरल अंकगणितीय माध्य सूत्र द्वारा निर्धारित किया जाता है:

जहां: - अंकगणितीय माध्य मान;

V चर विशेषता (विकल्प) का मान है;

- क्रिया को इंगित करता है - योग;

n प्रेक्षणों की कुल संख्या है।

अंकगणित माध्य की गणना का एक उदाहरण सरल है। 35: 20, 22, 19, 15, 16, 21, 17, 23, 18 आयु वर्ग के 9 पुरुषों में श्वसन दर (प्रति मिनट सांसों की संख्या)।

35 वर्ष की आयु के पुरुषों में श्वसन दर का औसत स्तर निर्धारित करने के लिए यह आवश्यक है:

1. सभी विकल्पों को आरोही या अवरोही क्रम में रखकर एक परिवर्तनशील श्रृंखला बनाएँ। हमें एक साधारण परिवर्तनशील श्रृंखला प्राप्त हुई है, क्योंकि भिन्न मान केवल एक बार होते हैं।

एम = ∑V/n = 171/9 = 19 श्वास प्रति मिनट

निष्कर्ष। 35 वर्ष की आयु के पुरुषों में श्वसन दर औसतन 19 श्वास प्रति मिनट होती है।

यदि संस्करण के अलग-अलग मूल्यों को दोहराया जाता है, तो प्रत्येक संस्करण को एक पंक्ति में लिखने की कोई आवश्यकता नहीं है, यह होने वाले संस्करण के आयामों को सूचीबद्ध करने के लिए पर्याप्त है (वी) और आगे उनके दोहराव की संख्या को इंगित करने के लिए ( पी)। ऐसी परिवर्तनशील श्रृंखला, जिसमें भिन्नों को उनके अनुरूप आवृत्तियों की संख्या के अनुसार भारित किया जाता है, भारित परिवर्तनशील श्रृंखला कहलाती है, और परिकलित औसत मान अंकगणितीय भारित औसत होता है।

अंकगणितीय भारित औसत सूत्र द्वारा निर्धारित किया जाता है: M= Vp/n

जहां n आवृत्तियों के योग के बराबर प्रेक्षणों की संख्या है - р।

अंकगणितीय भारित औसत की गणना का एक उदाहरण।

चालू वर्ष की पहली तिमाही के दौरान एक स्थानीय चिकित्सक द्वारा इलाज किए गए तीव्र श्वसन रोगों (एआरआई) के 35 रोगियों में विकलांगता की अवधि (दिनों में) थी: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 दिन।

तीव्र श्वसन संक्रमण वाले रोगियों में विकलांगता की औसत अवधि निर्धारित करने की विधि इस प्रकार है:

1. आइए एक भारित परिवर्ती श्रंखला का निर्माण करें, क्योंकि अलग-अलग प्रकार के मान कई बार दोहराए जाते हैं। ऐसा करने के लिए, आप सभी विकल्पों को उनकी संगत आवृत्तियों के साथ आरोही या अवरोही क्रम में व्यवस्थित कर सकते हैं।

हमारे मामले में, विकल्प आरोही क्रम में हैं।

2. सूत्र का उपयोग करके अंकगणितीय भारित औसत की गणना करें: M = Vp/n = 233/35 = 6.7 दिन

विकलांगता की अवधि के अनुसार तीव्र श्वसन संक्रमण वाले रोगियों का वितरण:

काम के लिए अक्षमता की अवधि (वी) रोगियों की संख्या (पी) वीपी
p = n = 35 वीपी = 233

निष्कर्ष। तीव्र श्वसन रोगों वाले रोगियों में विकलांगता की अवधि औसतन 6.7 दिन थी।

मोड (मो) विविधता श्रृंखला में सबसे आम प्रकार है। तालिका में प्रस्तुत वितरण के लिए, मोड 10 के बराबर संस्करण से मेल खाता है, यह दूसरों की तुलना में अधिक बार होता है - 6 बार।

अस्पताल के बिस्तर में रहने की अवधि के अनुसार रोगियों का वितरण (दिनों में)

वी
पी

कभी-कभी बहुलक का सटीक मान निर्धारित करना मुश्किल होता है, क्योंकि अध्ययन किए जा रहे डेटा में कई अवलोकन हो सकते हैं जो "सबसे अधिक बार" होते हैं।

माध्यिका (Me) एक गैर-पैरामीट्रिक संकेतक है जो भिन्नता श्रृंखला को दो बराबर हिस्सों में विभाजित करता है: समान संख्या में विकल्प माध्यिका के दोनों किनारों पर स्थित होते हैं।

उदाहरण के लिए, तालिका में दिखाए गए वितरण के लिए, माध्यिका 10 है क्योंकि इस मान के दोनों ओर 14वें विकल्प पर स्थित है, अर्थात्। संख्या 10 इस श्रृंखला में एक केंद्रीय स्थान रखती है और इसकी माध्यिका है।

यह देखते हुए कि इस उदाहरण में प्रेक्षणों की संख्या सम (n=34) है, माध्यिका निम्नानुसार निर्धारित की जा सकती है:

मैं = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

इसका मतलब यह है कि श्रृंखला का मध्य सत्रहवें विकल्प पर पड़ता है, जो 10 के माध्यिका से मेल खाता है। तालिका में प्रस्तुत वितरण के लिए, अंकगणितीय माध्य है:

एम = वीपी/एन = 334/34 = 10.1

तो, तालिका से 34 टिप्पणियों के लिए। 8, हमें मिला: Mo=10, Me=10, समांतर माध्य (M) 10.1 है। हमारे उदाहरण में, तीनों संकेतक एक-दूसरे के बराबर या करीब निकले, हालांकि वे पूरी तरह से अलग हैं।

अंकगणित माध्य सभी प्रभावों का परिणामी योग है; सभी विकल्प, बिना किसी अपवाद के, इसके गठन में भाग लेते हैं, जिसमें चरम वाले भी शामिल हैं, जो अक्सर किसी घटना या सेट के लिए असामान्य होते हैं।

मोड और माध्यिका, अंकगणितीय माध्य के विपरीत, चर विशेषता के सभी व्यक्तिगत मूल्यों (चरम वेरिएंट के मान और श्रृंखला के बिखरने की डिग्री) के मूल्य पर निर्भर नहीं करते हैं। अंकगणित माध्य प्रेक्षणों के पूरे द्रव्यमान की विशेषता है, बहुलक और माध्यिका थोक की विशेषता है

समूहीकरण विधि आपको मापने की अनुमति भी देती है उतार-चढ़ावसंकेतों की (परिवर्तनशीलता, उतार-चढ़ाव)। जनसंख्या इकाइयों की अपेक्षाकृत कम संख्या के साथ, भिन्नता को उन इकाइयों की श्रेणीबद्ध श्रृंखला के आधार पर मापा जाता है जो जनसंख्या का निर्माण करती हैं। पंक्ति कहा जाता है स्थान पर रहींयदि इकाइयों को आरोही (अवरोही) विशेषता में व्यवस्थित किया जाता है।

हालाँकि, जब भिन्नता की तुलनात्मक विशेषता की आवश्यकता होती है, तो क्रमबद्ध श्रृंखलाएँ सांकेतिक होती हैं। इसके अलावा, कई मामलों में बड़ी संख्या में इकाइयों से युक्त सांख्यिकीय समुच्चय से निपटना पड़ता है, जिन्हें एक विशिष्ट श्रृंखला के रूप में प्रस्तुत करना व्यावहारिक रूप से कठिन होता है। इस संबंध में, सांख्यिकीय डेटा के साथ प्रारंभिक सामान्य परिचित के लिए और विशेष रूप से संकेतों की भिन्नता के अध्ययन की सुविधा के लिए, अध्ययन की गई घटनाओं और प्रक्रियाओं को आमतौर पर समूहों में जोड़ा जाता है, और समूह के परिणाम समूह तालिकाओं के रूप में तैयार किए जाते हैं। .

यदि समूह तालिका में केवल दो स्तंभ हैं - चयनित विशेषता (विकल्प) और समूहों की संख्या (आवृत्तियों या आवृत्तियों) के अनुसार समूह, इसे कहा जाता है वितरण के निकट।

वितरण रेंज -एक विशेषता के अनुसार संरचनात्मक समूहन का सबसे सरल प्रकार, एक समूह तालिका में प्रदर्शित होता है जिसमें दो कॉलम होते हैं जिनमें विशेषता के वेरिएंट और आवृत्तियां होती हैं। कई मामलों में, ऐसे संरचनात्मक समूहन के साथ, अर्थात्। वितरण श्रृंखला के संकलन के साथ, प्रारंभिक सांख्यिकीय सामग्री का अध्ययन शुरू होता है।

एक वितरण श्रृंखला के रूप में एक संरचनात्मक समूह को एक सच्चे संरचनात्मक समूह में बदल दिया जा सकता है यदि चयनित समूहों को न केवल आवृत्तियों द्वारा, बल्कि अन्य सांख्यिकीय संकेतकों द्वारा भी चित्रित किया जाता है। वितरण श्रृंखला का मुख्य उद्देश्य विशेषताओं की भिन्नता का अध्ययन करना है। वितरण श्रृंखला का सिद्धांत गणितीय आँकड़ों द्वारा विस्तार से विकसित किया गया है।

वितरण श्रृंखला में विभाजित हैं ठहराव(विशेषण विशेषताओं के आधार पर समूह बनाना, उदाहरण के लिए, लिंग, राष्ट्रीयता, वैवाहिक स्थिति, आदि द्वारा जनसंख्या का विभाजन) और परिवर्तन संबंधी(मात्रात्मक विशेषताओं द्वारा समूहीकरण)।

विविधता श्रृंखलाएक समूह तालिका है जिसमें दो कॉलम होते हैं: एक मात्रात्मक विशेषता के अनुसार इकाइयों का समूह और प्रत्येक समूह में इकाइयों की संख्या। भिन्नता श्रृंखला में अंतराल आमतौर पर बराबर और बंद होते हैं। औसत प्रति व्यक्ति नकद आय (तालिका 3.10) के संदर्भ में भिन्नता श्रृंखला रूसी आबादी का निम्नलिखित समूह है।

तालिका 3.10

2004-2009 में औसत प्रति व्यक्ति आय के आधार पर रूस की जनसंख्या का वितरण

जनसंख्या समूह औसत प्रति व्यक्ति नकद आय, रगड़/माह

समूह में जनसंख्या, कुल के% में

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

25,000.0 से अधिक

सभी जनसंख्या

परिवर्तनशील श्रृंखला, बदले में, असतत और अंतराल में विभाजित हैं। अलगविविधता श्रृंखला असतत सुविधाओं के वेरिएंट को जोड़ती है जो संकीर्ण सीमाओं के भीतर भिन्न होती हैं। असतत भिन्नता श्रृंखला का एक उदाहरण रूसी परिवारों का उनके बच्चों की संख्या के अनुसार वितरण है।

मध्यान्तरपरिवर्तनशील श्रृंखला या तो निरंतर विशेषताओं या असतत विशेषताओं के वेरिएंट को जोड़ती है जो एक विस्तृत श्रृंखला में बदलते हैं। अंतराल श्रृंखला औसत प्रति व्यक्ति नकद आय के संदर्भ में रूसी आबादी के वितरण की परिवर्तनशील श्रृंखला है।

असतत परिवर्तनशील श्रृंखला व्यवहार में बहुत बार उपयोग नहीं की जाती है। इस बीच, उन्हें संकलित करना मुश्किल नहीं है, क्योंकि समूहों की संरचना उन विशिष्ट रूपों द्वारा निर्धारित की जाती है जो वास्तव में अध्ययन की गई समूह विशेषताओं के पास होती हैं।

अंतराल भिन्नता श्रृंखला अधिक व्यापक हैं। उन्हें संकलित करने में, समूहों की संख्या के साथ-साथ स्थापित किए जाने वाले अंतरालों के आकार के बारे में कठिन प्रश्न उठता है।

इस मुद्दे को हल करने के सिद्धांत सांख्यिकीय समूहों के निर्माण के लिए कार्यप्रणाली पर अध्याय में निर्धारित किए गए हैं (पैराग्राफ 3.3 देखें)।

विविधता श्रृंखला एक कॉम्पैक्ट रूप में विविध जानकारी को संक्षिप्त या संपीड़ित करने का एक साधन है; अध्ययन के तहत सेट में शामिल घटनाओं के संकेतों में अंतर का अध्ययन करने के लिए, भिन्नता की प्रकृति के बारे में स्पष्ट रूप से स्पष्ट निर्णय लेने के लिए उनका उपयोग किया जा सकता है। लेकिन परिवर्तनशील श्रृंखला का सबसे महत्वपूर्ण महत्व यह है कि उनके आधार पर भिन्नता की विशेष सामान्यीकरण विशेषताओं की गणना की जाती है (अध्याय 7 देखें)।

सांख्यिकीय विश्लेषण में एक विशेष स्थान अध्ययन की गई विशेषता या घटना के औसत स्तर के निर्धारण से संबंधित है। किसी विशेषता का औसत स्तर औसत मानों से मापा जाता है।

औसत मूल्य अध्ययन की गई विशेषता के सामान्य मात्रात्मक स्तर की विशेषता है और यह सांख्यिकीय आबादी की एक समूह संपत्ति है। यह एक दिशा या किसी अन्य में व्यक्तिगत टिप्पणियों के यादृच्छिक विचलन को समतल करता है, कमजोर करता है और अध्ययन के तहत विशेषता की मुख्य, विशिष्ट संपत्ति पर प्रकाश डालता है।

औसत व्यापक रूप से उपयोग किए जाते हैं:

1. जनसंख्या के स्वास्थ्य की स्थिति का आकलन करने के लिए: शारीरिक विकास की विशेषताएं (ऊंचाई, वजन, छाती की परिधि, आदि), विभिन्न रोगों की व्यापकता और अवधि की पहचान करना, जनसांख्यिकीय संकेतकों का विश्लेषण (प्राकृतिक जनसंख्या आंदोलन, औसत जीवन प्रत्याशा, जनसंख्या प्रजनन) , औसत जनसंख्या और आदि)।

2. चिकित्सा संस्थानों, चिकित्सा कर्मियों की गतिविधियों का अध्ययन करने और उनके काम की गुणवत्ता का आकलन करने के लिए, विभिन्न प्रकार की चिकित्सा देखभाल में जनसंख्या की जरूरतों का निर्धारण और निर्धारण करने के लिए (प्रति व्यक्ति प्रति वर्ष अनुरोधों या यात्राओं की औसत संख्या, ठहरने की औसत लंबाई एक अस्पताल में एक रोगी की, परीक्षा के रोगी की औसत अवधि, डॉक्टरों के साथ औसत प्रावधान, बिस्तर, आदि)।

3. स्वच्छता और महामारी विज्ञान की स्थिति (कार्यशाला में हवा की औसत धूल, प्रति व्यक्ति औसत क्षेत्र, प्रोटीन, वसा और कार्बोहाइड्रेट की औसत खपत, आदि) की विशेषता के लिए।

4. प्रयोगशाला डेटा के प्रसंस्करण में मानदंड और विकृति विज्ञान में चिकित्सा और शारीरिक मापदंडों को निर्धारित करने के लिए, सामाजिक-स्वच्छ, नैदानिक, प्रयोगात्मक अध्ययनों में एक चयनात्मक अध्ययन के परिणामों की विश्वसनीयता स्थापित करने के लिए।

औसत मूल्यों की गणना भिन्नता श्रृंखला के आधार पर की जाती है। विविधता श्रृंखला- यह एक गुणात्मक रूप से सजातीय सांख्यिकीय सेट है, जिसकी व्यक्तिगत इकाइयाँ अध्ययन की गई विशेषता या घटना के मात्रात्मक अंतर को दर्शाती हैं।

मात्रात्मक भिन्नता दो प्रकार की हो सकती है: असंतत (असतत) और निरंतर।

एक असंतत (असतत) संकेत केवल एक पूर्णांक के रूप में व्यक्त किया जाता है और इसमें कोई मध्यवर्ती मान नहीं हो सकता है (उदाहरण के लिए, विज़िट की संख्या, साइट की जनसंख्या, परिवार में बच्चों की संख्या, अंकों में रोग की गंभीरता , आदि।)।

एक निरंतर संकेत भिन्नात्मक सहित कुछ सीमाओं के भीतर किसी भी मूल्य पर ले सकता है, और केवल लगभग व्यक्त किया जाता है (उदाहरण के लिए, वजन - वयस्कों के लिए यह किलोग्राम तक सीमित हो सकता है, और नवजात शिशुओं के लिए - ग्राम; ऊंचाई, रक्तचाप, समय) एक रोगी, और आदि को देखने पर खर्च किया गया)।



भिन्नता श्रृंखला में शामिल प्रत्येक व्यक्तिगत विशेषता या घटना के डिजिटल मूल्य को एक प्रकार कहा जाता है और इसे अक्षर द्वारा दर्शाया जाता है वी . गणितीय साहित्य में अन्य संकेतन भी हैं, उदाहरण के लिए एक्स या वाई

एक परिवर्तनशील श्रृंखला, जहाँ प्रत्येक विकल्प को एक बार इंगित किया जाता है, सरल कहलाती है।कंप्यूटर डेटा प्रोसेसिंग के मामले में अधिकांश सांख्यिकीय समस्याओं में ऐसी श्रृंखला का उपयोग किया जाता है।

टिप्पणियों की संख्या में वृद्धि के साथ, एक नियम के रूप में, वेरिएंट के बार-बार मूल्य होते हैं। इस मामले में, यह बनाता है समूहीकृत भिन्नता श्रृंखला, जहां दोहराव की संख्या इंगित की गई है (आवृत्ति, अक्षर द्वारा निरूपित " आर »).

रैंक की गई विविधता श्रृंखलाआरोही या अवरोही क्रम में व्यवस्थित विकल्पों के होते हैं। रैंकिंग के साथ सरल और समूहबद्ध दोनों श्रृंखलाओं की रचना की जा सकती है।

अंतराल भिन्नता श्रृंखलाकंप्यूटर का उपयोग किए बिना, बहुत बड़ी संख्या में अवलोकन इकाइयों (1000 से अधिक) के साथ, बाद की गणना को सरल बनाने के लिए किया जाता है।

निरंतर भिन्नता श्रृंखलाभिन्न मान शामिल हैं, जो कोई भी मान हो सकता है।

यदि परिवर्तनशील श्रेणी में विशेषता के मान (विकल्प) अलग-अलग विशिष्ट संख्याओं के रूप में दिए जाते हैं, तो ऐसी श्रृंखला कहलाती है अलग.

विविधता श्रृंखला में परिलक्षित विशेषता के मूल्यों की सामान्य विशेषताएं औसत मूल्य हैं। उनमें से, सबसे अधिक उपयोग किया जाता है: अंकगणितीय माध्य एम,पहनावा एमओऔर माध्यिका मैं।इनमें से प्रत्येक विशेषता अद्वितीय है। वे एक दूसरे को प्रतिस्थापित नहीं कर सकते हैं, और केवल कुल मिलाकर वे काफी पूर्ण हैं और संक्षिप्त रूप में, वे भिन्नता श्रृंखला की विशेषताओं का प्रतिनिधित्व करते हैं।

पहनावा (मो) सबसे अधिक बार होने वाले विकल्पों के मान को नाम दें।

मंझला (मुझे) श्रेणीबद्ध विविधता श्रृंखला को आधे में विभाजित करने वाले प्रकार का मान है (माध्यिका के प्रत्येक पक्ष पर प्रकार का आधा भाग होता है)। दुर्लभ मामलों में, जब एक सममित भिन्नता श्रृंखला होती है, तो बहुलक और माध्यिका एक दूसरे के बराबर होते हैं और अंकगणितीय माध्य के मान के साथ मेल खाते हैं।

भिन्न मूल्यों की सबसे विशिष्ट विशेषता है अंकगणित औसतमूल्य( एम ) गणितीय साहित्य में, इसे निरूपित किया जाता है .

अंकगणित औसत (एम, ) अध्ययन की गई घटना की एक निश्चित विशेषता की एक सामान्य मात्रात्मक विशेषता है, जो गुणात्मक रूप से सजातीय सांख्यिकीय समुच्चय बनाती है। सरल अंकगणितीय माध्य और भारित माध्य में अंतर स्पष्ट कीजिए। सभी विकल्पों का योग करके और इस योग को इस परिवर्तनशील श्रृंखला में शामिल विकल्पों की कुल संख्या से विभाजित करके एक साधारण परिवर्तनशील श्रृंखला के लिए सरल अंकगणितीय माध्य की गणना की जाती है। गणना सूत्र के अनुसार की जाती है:

,

कहाँ पे: एम - सरल अंकगणितीय माध्य;

Σ वी - राशि विकल्प;

एन- अवलोकनों की संख्या।

समूहीकृत भिन्नता श्रृंखला में, एक भारित अंकगणितीय माध्य निर्धारित किया जाता है। इसकी गणना का सूत्र:

,

कहाँ पे: एम - अंकगणित भारित औसत;

Σ वीपी - उनकी आवृत्तियों पर एक प्रकार के उत्पादों का योग;

एन- अवलोकनों की संख्या।

मैनुअल गणना के मामले में बड़ी संख्या में टिप्पणियों के साथ, क्षणों की विधि का उपयोग किया जा सकता है।

अंकगणितीय माध्य में निम्नलिखित गुण होते हैं:

माध्य से भिन्न के विचलन का योग ( Σ डी ) शून्य के बराबर है (तालिका 15 देखें);

जब सभी विकल्पों को एक ही कारक (भाजक) से गुणा (विभाजित) किया जाता है, तो अंकगणितीय माध्य को उसी कारक (विभाजक) से गुणा (विभाजित) किया जाता है;

यदि आप सभी विकल्पों में एक ही संख्या को जोड़ते हैं (घटते हैं), तो अंकगणितीय माध्य उसी संख्या से बढ़ता (घटता) है।

अंकगणितीय औसत, स्वयं द्वारा लिया गया, उस श्रृंखला की परिवर्तनशीलता को ध्यान में रखे बिना, जिससे उनकी गणना की जाती है, हो सकता है कि भिन्नता श्रृंखला के गुणों को पूरी तरह से प्रतिबिंबित न करें, खासकर जब अन्य औसत के साथ तुलना आवश्यक हो। मूल्य के करीब औसत मूल्य श्रृंखला से बिखरने की विभिन्न डिग्री के साथ प्राप्त किया जा सकता है। व्यक्तिगत विकल्प अपनी मात्रात्मक विशेषताओं के संदर्भ में एक दूसरे के जितने करीब होंगे, उतना ही कम बिखराव (उतार-चढ़ाव, परिवर्तनशीलता)श्रृंखला, अधिक विशिष्ट इसका औसत।

मुख्य पैरामीटर जो किसी विशेषता की परिवर्तनशीलता का आकलन करने की अनुमति देते हैं:

· दायरा;

आयाम;

· मानक विचलन;

· भिन्नता का गुणांक।

लगभग, किसी विशेषता के उतार-चढ़ाव को भिन्नता श्रृंखला के दायरे और आयाम से आंका जा सकता है। श्रेणी श्रृंखला में अधिकतम (वी अधिकतम) और न्यूनतम (वी मिनट) विकल्पों को इंगित करती है। आयाम (ए एम) इन विकल्पों के बीच का अंतर है: ए एम = वी अधिकतम - वी मिनट।

परिवर्तनीय श्रृंखला के उतार-चढ़ाव के मुख्य, आम तौर पर स्वीकृत उपाय हैं फैलाव (डी ) लेकिन अधिक सुविधाजनक पैरामीटर का सबसे अधिक उपयोग किया जाता है, जिसकी गणना विचरण के आधार पर की जाती है - मानक विचलन ( σ ) यह विचलन मान को ध्यान में रखता है ( डी ) इसके अंकगणितीय माध्य से भिन्नता श्रृंखला के प्रत्येक प्रकार का ( डी = वी - एम ).

चूंकि माध्य से भिन्नता का विचलन सकारात्मक और नकारात्मक हो सकता है, जब योग किया जाता है तो वे "0" (एस) मान देते हैं डी = 0) इससे बचने के लिए विचलन मान ( डी) दूसरी शक्ति तक बढ़ाए जाते हैं और औसत होते हैं। इस प्रकार, परिवर्तनशील श्रृंखला का प्रसरण अंकगणित माध्य से भिन्न के विचलन का औसत वर्ग है और इसकी गणना सूत्र द्वारा की जाती है:

.

यह परिवर्तनशीलता की सबसे महत्वपूर्ण विशेषता है और इसका उपयोग कई सांख्यिकीय परीक्षणों की गणना के लिए किया जाता है।

क्योंकि विचरण को विचलनों के वर्ग के रूप में व्यक्त किया जाता है, इसके मान का उपयोग अंकगणितीय माध्य की तुलना में नहीं किया जा सकता है। इन उद्देश्यों के लिए, इसका उपयोग किया जाता है मानक विचलन, जिसे "सिग्मा" चिह्न द्वारा दर्शाया गया है ( σ ) यह एक ही इकाइयों में अंकगणितीय माध्य से भिन्नता श्रृंखला के सभी रूपों के औसत विचलन की विशेषता है, इसलिए उन्हें एक साथ उपयोग किया जा सकता है।

मानक विचलन सूत्र द्वारा निर्धारित किया जाता है:

यह सूत्र प्रेक्षणों की संख्या के लिए लागू होता है ( एन ) 30 से बड़ा है। छोटी संख्या के साथ एन मानक विचलन के मान में गणितीय पूर्वाग्रह से जुड़ी एक त्रुटि होगी ( एन - एक)। इस संबंध में, मानक विचलन की गणना के लिए सूत्र में इस तरह के पूर्वाग्रह को ध्यान में रखते हुए अधिक सटीक परिणाम प्राप्त किया जा सकता है:

मानक विचलन (एस ) यादृच्छिक चर के मानक विचलन का एक अनुमान है एक्सइसके विचरण के निष्पक्ष अनुमान के आधार पर इसकी गणितीय अपेक्षा के सापेक्ष।

मूल्यों के लिए एन > 30 मानक विचलन ( σ ) और मानक विचलन ( एस ) एक ही हो जाएगा ( =एस ). इसलिए, अधिकांश व्यावहारिक मैनुअल में, इन मानदंडों को अलग-अलग अर्थों के रूप में माना जाता है।एक्सेल में, मानक विचलन की गणना फ़ंक्शन = एसटीडीईवी (रेंज) के साथ की जा सकती है। और मानक विचलन की गणना करने के लिए, आपको एक उपयुक्त सूत्र बनाने की आवश्यकता है।

मूल माध्य वर्ग या मानक विचलन आपको यह निर्धारित करने की अनुमति देता है कि किसी विशेषता के मान माध्य मान से कितने भिन्न हो सकते हैं। मान लीजिए गर्मियों में एक ही औसत दैनिक तापमान वाले दो शहर हैं। इनमें से एक शहर तट पर स्थित है, और दूसरा महाद्वीप पर। यह ज्ञात है कि तट पर स्थित शहरों में, अंतर्देशीय स्थित शहरों की तुलना में दिन के तापमान में अंतर कम होता है। इसलिए, तटीय शहर के पास दिन के तापमान का मानक विचलन दूसरे शहर की तुलना में कम होगा। व्यवहार में, इसका मतलब है कि महाद्वीप पर स्थित किसी शहर में प्रत्येक विशेष दिन का औसत हवा का तापमान तट के एक शहर की तुलना में औसत मूल्य से अधिक भिन्न होगा। इसके अलावा, मानक विचलन औसत से संभावित तापमान विचलन का अनुमान लगाने के लिए आवश्यक स्तर की संभावना के साथ संभव बनाता है।

संभाव्यता के सिद्धांत के अनुसार, सामान्य वितरण कानून का पालन करने वाली घटनाओं में, अंकगणितीय माध्य, मानक विचलन और विकल्पों के मूल्यों के बीच एक सख्त संबंध है ( तीन सिग्मा नियम) उदाहरण के लिए, एक चर विशेषता के 68.3% मान M ± 1 . के भीतर हैं σ , 95.5% - एम ± 2 . के भीतर σ और 99.7% - एम ± 3 . के भीतर σ .

मानक विचलन का मान भिन्नता श्रृंखला और अध्ययन के तहत समूह की एकरूपता की प्रकृति का न्याय करना संभव बनाता है। यदि मानक विचलन का मान छोटा है, तो यह अध्ययन के तहत घटना की पर्याप्त उच्च समरूपता को इंगित करता है। इस मामले में अंकगणितीय माध्य को इस परिवर्तनशील श्रृंखला की काफी विशेषता के रूप में पहचाना जाना चाहिए। हालांकि, एक बहुत छोटा सिग्मा अवलोकनों के कृत्रिम चयन के बारे में सोचता है। एक बहुत बड़े सिग्मा के साथ, अंकगणितीय माध्य भिन्नता श्रृंखला को कुछ हद तक दर्शाता है, जो अध्ययन किए गए गुण या घटना या अध्ययन समूह की विविधता की महत्वपूर्ण परिवर्तनशीलता को इंगित करता है। हालांकि, मानक विचलन के मूल्य की तुलना केवल उसी आयाम के संकेतों के लिए संभव है। वास्तव में, यदि हम नवजात शिशुओं और वयस्कों के वजन की विविधता की तुलना करते हैं, तो हमें वयस्कों में हमेशा उच्च सिग्मा मान प्राप्त होंगे।

विभिन्न आयामों की विशेषताओं की परिवर्तनशीलता की तुलना का उपयोग करके किया जा सकता है गुणांक का परिवर्तन. यह विविधता को माध्य के प्रतिशत के रूप में व्यक्त करता है, जो विभिन्न लक्षणों की तुलना की अनुमति देता है। चिकित्सा साहित्य में भिन्नता का गुणांक संकेत द्वारा दर्शाया गया है " साथ में ", और गणितीय में" वी» और सूत्र द्वारा परिकलित:

.

10% से कम भिन्नता के गुणांक के मान एक छोटे से बिखरने का संकेत देते हैं, 10 से 20% तक - औसत के बारे में, 20% से अधिक - अंकगणितीय माध्य के आसपास एक मजबूत प्रकीर्णन के बारे में।

अंकगणित माध्य की गणना आमतौर पर नमूना डेटा के आधार पर की जाती है। यादृच्छिक घटनाओं के प्रभाव में बार-बार अध्ययन के साथ, अंकगणितीय माध्य बदल सकता है। यह इस तथ्य के कारण है कि, एक नियम के रूप में, अवलोकन की संभावित इकाइयों का केवल एक हिस्सा, यानी नमूना आबादी की जांच की जाती है। अध्ययन के तहत घटना का प्रतिनिधित्व करने वाली सभी संभावित इकाइयों के बारे में जानकारी पूरी सामान्य आबादी का अध्ययन करके प्राप्त की जा सकती है, जो हमेशा संभव नहीं होती है। इसी समय, प्रयोगात्मक डेटा को सामान्य बनाने के लिए, सामान्य जनसंख्या में औसत का मूल्य रुचि का है। इसलिए, अध्ययन के तहत घटना के बारे में एक सामान्य निष्कर्ष तैयार करने के लिए, नमूना आबादी के आधार पर प्राप्त परिणामों को सांख्यिकीय विधियों द्वारा सामान्य आबादी में स्थानांतरित किया जाना चाहिए।

नमूना अध्ययन और सामान्य आबादी के बीच संयोग की डिग्री निर्धारित करने के लिए, नमूना अवलोकन के दौरान अनिवार्य रूप से उत्पन्न होने वाली त्रुटि की मात्रा का अनुमान लगाना आवश्यक है। ऐसी त्रुटि कहलाती है प्रतिनिधित्व त्रुटि"या" अंकगणित माध्य की माध्य त्रुटि"। यह वास्तव में, चयनात्मक सांख्यिकीय अवलोकन से प्राप्त औसत और समान मूल्यों के बीच का अंतर है जो एक ही वस्तु के निरंतर अध्ययन से प्राप्त होगा, अर्थात। सामान्य जनसंख्या का अध्ययन करते समय। चूंकि नमूना माध्य एक यादृच्छिक चर है, इसलिए ऐसा पूर्वानुमान शोधकर्ता के लिए स्वीकार्य स्तर की संभावना के साथ किया जाता है। चिकित्सा अनुसंधान में, यह कम से कम 95% है।

प्रतिनिधित्व त्रुटि को पंजीकरण त्रुटियों या ध्यान संबंधी त्रुटियों (गलत छापों, गलत गणनाओं, गलत छापों, आदि) के साथ भ्रमित नहीं होना चाहिए, जिसे प्रयोग में उपयोग की जाने वाली पर्याप्त कार्यप्रणाली और उपकरणों द्वारा कम से कम किया जाना चाहिए।

प्रतिनिधित्व की त्रुटि का परिमाण नमूना आकार और विशेषता की परिवर्तनशीलता दोनों पर निर्भर करता है। प्रेक्षणों की संख्या जितनी अधिक होगी, प्रतिदर्श सामान्य जनसंख्या के जितना निकट होगा और त्रुटि उतनी ही कम होगी। विशेषता जितनी अधिक परिवर्तनशील होगी, सांख्यिकीय त्रुटि उतनी ही अधिक होगी।

व्यवहार में, परिवर्तनशील श्रृंखला में प्रतिनिधित्व त्रुटि को निर्धारित करने के लिए निम्न सूत्र का उपयोग किया जाता है:

,

कहाँ पे: एम - प्रतिनिधित्व त्रुटि;

σ - मानक विचलन;

एननमूने में अवलोकनों की संख्या है।

यह सूत्र से देखा जा सकता है कि औसत त्रुटि का आकार सीधे मानक विचलन के समानुपाती होता है, अर्थात, अध्ययन के तहत विशेषता की परिवर्तनशीलता, और अवलोकनों की संख्या के वर्गमूल के व्युत्क्रमानुपाती होता है।

सापेक्ष मूल्यों की गणना के आधार पर सांख्यिकीय विश्लेषण करते समय, भिन्नता श्रृंखला का निर्माण अनिवार्य नहीं है। इस मामले में, सापेक्ष संकेतकों के लिए औसत त्रुटि का निर्धारण एक सरलीकृत सूत्र का उपयोग करके किया जा सकता है:

,

कहाँ पे: आर- सापेक्ष संकेतक का मान, प्रतिशत, पीपीएम, आदि के रूप में व्यक्त किया जाता है;

क्यू- पी का पारस्परिक और (1-पी), (100-पी), (1000-पी), आदि के रूप में व्यक्त किया जाता है, जिसके आधार पर संकेतक की गणना की जाती है;

एननमूने में अवलोकनों की संख्या है।

हालांकि, सापेक्ष मूल्यों के लिए प्रतिनिधित्व त्रुटि की गणना के लिए संकेतित सूत्र केवल तभी लागू किया जा सकता है जब संकेतक का मूल्य उसके आधार से कम हो। गहन संकेतकों की गणना के कई मामलों में, यह शर्त पूरी नहीं होती है, और संकेतक को 100% या 1000% से अधिक की संख्या के रूप में व्यक्त किया जा सकता है। ऐसी स्थिति में, एक भिन्नता श्रृंखला का निर्माण किया जाता है और मानक विचलन के आधार पर औसत मूल्यों के सूत्र का उपयोग करके प्रतिनिधित्व त्रुटि की गणना की जाती है।

सामान्य जनसंख्या में अंकगणितीय माध्य के मूल्य का पूर्वानुमान दो मूल्यों के संकेत के साथ किया जाता है - न्यूनतम और अधिकतम। संभावित विचलन के ये चरम मूल्य, जिसके भीतर सामान्य जनसंख्या के वांछित औसत मूल्य में उतार-चढ़ाव हो सकता है, कहलाते हैं " आत्मविश्वास की सीमा».

संभाव्यता के सिद्धांत के अभिधारणाओं ने साबित कर दिया कि 99.7% की संभावना के साथ एक विशेषता के सामान्य वितरण के साथ, माध्य के विचलन के चरम मूल्य प्रतिनिधित्व की ट्रिपल त्रुटि के मूल्य से अधिक नहीं होंगे ( एम ± 3 एम ); 95.5% में - औसत मूल्य की दोगुनी औसत त्रुटि के मूल्य से अधिक नहीं ( एम ±2 एम ); 68.3% में - एक औसत त्रुटि के मूल्य से अधिक नहीं ( एम ± 1 एम ) (चित्र 9)।

पी%

चावल। 9. सामान्य वितरण की संभावना घनत्व।

ध्यान दें कि उपरोक्त कथन केवल उस विशेषता के लिए सत्य है जो सामान्य गाऊसी वितरण कानून का पालन करता है।

चिकित्सा के क्षेत्र में उन सहित अधिकांश प्रायोगिक अध्ययन, माप से जुड़े होते हैं, जिसके परिणाम किसी दिए गए अंतराल में लगभग कोई भी मूल्य ले सकते हैं, इसलिए, एक नियम के रूप में, उन्हें निरंतर यादृच्छिक चर के एक मॉडल द्वारा वर्णित किया जाता है। इस संबंध में, अधिकांश सांख्यिकीय विधियां निरंतर वितरण पर विचार करती हैं। इनमें से एक वितरण, जो गणितीय आँकड़ों में मौलिक भूमिका निभाता है, है सामान्य, या गाऊसी, वितरण.

यह कई कारणों से है।

1. सबसे पहले, सामान्य वितरण का उपयोग करके कई प्रयोगात्मक अवलोकनों का सफलतापूर्वक वर्णन किया जा सकता है। यह तुरंत ध्यान दिया जाना चाहिए कि अनुभवजन्य डेटा का कोई वितरण नहीं है जो बिल्कुल सामान्य होगा, क्योंकि सामान्य रूप से वितरित यादृच्छिक चर से सीमा में है, जो व्यवहार में कभी नहीं होता है। हालांकि, सामान्य वितरण अक्सर एक अच्छा सन्निकटन होता है।

क्या मानव शरीर के वजन, ऊंचाई और अन्य शारीरिक मापदंडों का मापन किया जाता है - हर जगह बहुत बड़ी संख्या में यादृच्छिक कारक (प्राकृतिक कारण और माप त्रुटियां) परिणामों को प्रभावित करते हैं। और, एक नियम के रूप में, इनमें से प्रत्येक कारक का प्रभाव नगण्य है। अनुभव से पता चलता है कि ऐसे मामलों में परिणाम लगभग सामान्य रूप से वितरित किए जाएंगे।

2. एक यादृच्छिक नमूने से जुड़े कई वितरण, बाद की मात्रा में वृद्धि के साथ, सामान्य हो जाते हैं।

3. सामान्य वितरण अन्य निरंतर वितरण (उदाहरण के लिए, असममित वाले) के अनुमानित विवरण के रूप में उपयुक्त है।

4. सामान्य वितरण में कई अनुकूल गणितीय गुण होते हैं, जो बड़े पैमाने पर आंकड़ों में इसके व्यापक उपयोग को सुनिश्चित करते हैं।

साथ ही, यह ध्यान दिया जाना चाहिए कि चिकित्सा डेटा में कई प्रयोगात्मक वितरण होते हैं जिन्हें सामान्य वितरण मॉडल द्वारा वर्णित नहीं किया जा सकता है। ऐसा करने के लिए, आँकड़ों ने ऐसी विधियाँ विकसित की हैं जिन्हें आमतौर पर "गैर-पैरामीट्रिक" कहा जाता है।

किसी विशेष प्रयोग के डेटा को संसाधित करने के लिए उपयुक्त सांख्यिकीय पद्धति का चुनाव इस आधार पर किया जाना चाहिए कि प्राप्त डेटा सामान्य वितरण कानून से संबंधित है या नहीं। सामान्य वितरण कानून के लिए एक संकेत के अधीनता के लिए परिकल्पना परीक्षण आवृत्ति वितरण (ग्राफ) के हिस्टोग्राम के साथ-साथ कई सांख्यिकीय मानदंडों का उपयोग करके किया जाता है। उनमें से:

विषमता मानदंड ( बी );

कुर्टोसिस की जांच के लिए मानदंड ( जी );

शापिरो-विल्क्स मानदंड ( वू ) .

प्रत्येक पैरामीटर के लिए डेटा के वितरण की प्रकृति का विश्लेषण (इसे वितरण की सामान्यता के लिए एक परीक्षण भी कहा जाता है) किया जाता है। सामान्य कानून के लिए पैरामीटर वितरण के पत्राचार का आत्मविश्वास से न्याय करने के लिए, पर्याप्त रूप से बड़ी संख्या में अवलोकन इकाइयों (कम से कम 30 मान) की आवश्यकता होती है।

एक सामान्य वितरण के लिए, तिरछापन और कर्टोसिस मानदंड 0 का मान लेते हैं। यदि वितरण को दाईं ओर स्थानांतरित किया जाता है बी > 0 (सकारात्मक विषमता), के साथ बी < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона जी = 0। पर जी > 0 वितरण वक्र तेज है यदि जी < 0 пик более сглаженный, чем функция нормального распределения.

शापिरो-विल्क्स परीक्षण का उपयोग करके सामान्यता के परीक्षण के लिए, सांख्यिकीय तालिकाओं का उपयोग करके इस मानदंड के मूल्य को आवश्यक स्तर पर और अवलोकन की इकाइयों की संख्या (स्वतंत्रता की डिग्री) के आधार पर खोजना आवश्यक है। परिशिष्ट 1. इस मानदंड के छोटे मूल्यों के लिए सामान्यता की परिकल्पना को एक नियम के रूप में, के लिए खारिज कर दिया जाता है वू <0,8.

(एक परिवर्तनशील श्रृंखला की परिभाषा; एक परिवर्तनशील श्रृंखला के घटक; एक परिवर्तनशील श्रृंखला के तीन रूप; एक अंतराल श्रृंखला के निर्माण की समीचीनता; निष्कर्ष जो निर्मित श्रृंखला से निकाले जा सकते हैं)

एक परिवर्तनशील श्रृंखला गैर-घटते क्रम में व्यवस्थित नमूने के सभी तत्वों का एक क्रम है। वही तत्व दोहराए जाते हैं

भिन्नात्मक - ये मात्रात्मक आधार पर निर्मित श्रृंखलाएँ हैं।

विभिन्न वितरण श्रृंखला में दो तत्व होते हैं: रूपांतर और आवृत्तियां:

वेरिएंट वितरण की विविधता श्रृंखला में मात्रात्मक विशेषता के संख्यात्मक मान हैं। वे सकारात्मक या नकारात्मक, पूर्ण या सापेक्ष हो सकते हैं। इसलिए, जब उद्यमों को आर्थिक गतिविधि के परिणामों के अनुसार समूहीकृत किया जाता है, तो विकल्प सकारात्मक होते हैं - यह लाभ है, और नकारात्मक संख्या - यह एक नुकसान है।

फ़्रीक्वेंसी अलग-अलग वेरिएंट या विविधता श्रृंखला के प्रत्येक समूह की संख्या है, अर्थात। ये संख्याएँ दर्शाती हैं कि वितरण श्रृंखला में कुछ निश्चित विकल्प कितनी बार आते हैं। सभी आवृत्तियों के योग को जनसंख्या का आयतन कहा जाता है और यह संपूर्ण जनसंख्या के तत्वों की संख्या से निर्धारित होता है।

फ़्रीक्वेंसी वे फ़्रीक्वेंसी हैं जिन्हें सापेक्ष मूल्यों (इकाइयों या प्रतिशत के अंश) के रूप में व्यक्त किया जाता है। आवृत्तियों का योग एक या 100% के बराबर होता है। बारंबारताओं को बारंबारताओं से बदलने से विभिन्न संख्याओं के प्रेक्षणों के साथ परिवर्तनशील श्रृंखला की तुलना करना संभव हो जाता है।

विविधता श्रृंखला के तीन रूप हैं:क्रमबद्ध श्रृंखला, असतत श्रृंखला और अंतराल श्रृंखला।

एक क्रमबद्ध श्रृंखला अध्ययन के तहत विशेषता के आरोही या अवरोही क्रम में जनसंख्या की व्यक्तिगत इकाइयों का वितरण है। रैंकिंग मात्रात्मक डेटा को समूहों में विभाजित करना आसान बनाता है, तुरंत एक विशेषता के सबसे छोटे और सबसे बड़े मूल्यों का पता लगाता है, और सबसे अधिक बार दोहराए जाने वाले मूल्यों को उजागर करता है।

विविधता श्रृंखला के अन्य रूप अध्ययन के तहत विशेषता के मूल्यों में भिन्नता की प्रकृति के अनुसार संकलित समूह सारणी हैं। भिन्नता की प्रकृति से, असतत (असंतत) और निरंतर संकेत प्रतिष्ठित हैं।

एक असतत श्रृंखला एक ऐसी परिवर्तनशील श्रृंखला है, जिसका निर्माण एक असंतत परिवर्तन (असतत संकेत) वाले संकेतों पर आधारित होता है। उत्तरार्द्ध में टैरिफ श्रेणी, परिवार में बच्चों की संख्या, उद्यम में कर्मचारियों की संख्या आदि शामिल हैं। ये संकेत केवल कुछ निश्चित मानों की सीमित संख्या ले सकते हैं।

एक असतत विविधता श्रृंखला एक तालिका है जिसमें दो कॉलम होते हैं। पहला कॉलम विशेषता के विशिष्ट मूल्य को इंगित करता है, और दूसरा - विशेषता के विशिष्ट मूल्य के साथ जनसंख्या इकाइयों की संख्या।

यदि किसी चिन्ह में निरंतर परिवर्तन होता है (आय की राशि, कार्य अनुभव, किसी उद्यम की अचल संपत्तियों की लागत, आदि, जो कुछ सीमाओं के भीतर कोई भी मूल्य ले सकता है), तो इस संकेत के लिए एक अंतराल भिन्नता श्रृंखला बनाई जानी चाहिए।



यहां समूह तालिका में भी दो स्तंभ हैं। पहला अंतराल "से - से" (विकल्प) में सुविधा के मूल्य को इंगित करता है, दूसरा - अंतराल (आवृत्ति) में शामिल इकाइयों की संख्या।

आवृत्ति (पुनरावृत्ति आवृत्ति) - विशेषता मानों के एक विशेष प्रकार के दोहराव की संख्या, निरूपित फाई, और अध्ययन की गई आबादी के आयतन के बराबर आवृत्तियों का योग, निरूपित

जहाँ k विशेषता मान विकल्पों की संख्या है

बहुत बार, तालिका को एक स्तंभ के साथ पूरक किया जाता है जिसमें संचित आवृत्तियों एस की गणना की जाती है, जो दर्शाती है कि जनसंख्या की कितनी इकाइयों का एक विशेषता मान इस मान से अधिक नहीं है।

एक असतत परिवर्तनशील वितरण श्रृंखला एक श्रृंखला है जिसमें समूह एक विशेषता के अनुसार बनाए जाते हैं जो अलग-अलग होते हैं और केवल पूर्णांक मान लेते हैं।

वितरण की अंतराल भिन्नता श्रृंखला एक श्रृंखला है जिसमें समूहीकरण विशेषता, जो समूहीकरण का आधार बनती है, एक निश्चित अंतराल में भिन्नात्मक सहित कोई भी मान ले सकती है।

एक अंतराल परिवर्तनशील श्रृंखला एक यादृच्छिक चर के मूल्यों की भिन्नता के अंतराल का एक क्रमबद्ध सेट है जिसमें उनमें से प्रत्येक में गिरने वाली मात्रा के मूल्यों की संबंधित आवृत्तियों या आवृत्तियों के साथ होता है।

एक अंतराल वितरण श्रृंखला का निर्माण करना समीचीन है, सबसे पहले, एक विशेषता की निरंतर भिन्नता के साथ, और यह भी कि यदि एक असतत भिन्नता एक विस्तृत श्रृंखला पर प्रकट होती है, अर्थात। असतत सुविधा के लिए विकल्पों की संख्या काफी बड़ी है।

इस श्रृंखला से पहले ही कई निष्कर्ष निकाले जा सकते हैं। उदाहरण के लिए, एक परिवर्तनशील श्रृंखला (माध्यिका) का औसत तत्व माप के सबसे संभावित परिणाम का अनुमान हो सकता है। भिन्नता श्रृंखला का पहला और अंतिम तत्व (अर्थात नमूने का न्यूनतम और अधिकतम तत्व) नमूने के तत्वों के प्रसार को दर्शाता है। कभी-कभी, यदि पहला या अंतिम तत्व बाकी नमूने से बहुत अलग होता है, तो उन्हें माप परिणामों से बाहर रखा जाता है, यह देखते हुए कि ये मान किसी प्रकार की सकल विफलता के परिणामस्वरूप प्राप्त किए गए थे, उदाहरण के लिए, प्रौद्योगिकी।