परिवर्तन श्रृंखला कहलाती है। एक परिवर्तनशील श्रृंखला को परिभाषित करें

परिवर्तनशील श्रृंखला, उनके तत्व।

यांत्रिक श्रमिकों की टैरिफ श्रेणी में रुचि रखने वाला एक शोधकर्ता
दुकान, 100 श्रमिकों का एक सर्वेक्षण किया। देखे गए मानों का पता लगाएँ
पुरस्कार-नाका आरोही क्रम में। इस ऑपरेशन को रैंकिंग कहा जाता है
टिस्टिक डेटा। परिणामस्वरूप, हमें निम्नलिखित श्रृंखला प्राप्त होती है, जिसे कहते हैं-
ज़िया रैंक:

1,1,..1, 2,2..2, 3,3,..3, 4,4,..4, 5,5,..5, 6,6,..6.

यह क्रमबद्ध श्रृंखला से इस प्रकार है कि अध्ययन की गई विशेषता (टैरिफ .)
अंक) ने छह अलग-अलग मान लिए: 1, 2, 3, 4, 5, और 6।

आगे विभिन्न अर्थप्राइज-नाका कहा जाएगा विकल्प-
मील,
और अंदर उतार-चढ़ाव -विशेषता के मूल्यों में परिवर्तन को समझें।

चिन्ह द्वारा लिए गए मूल्यों के आधार पर, चिन्हों को विभाजित किया जाता है
पर अलग-अलग और लगातार अलग-अलग।

टैरिफ श्रेणी एक अलग-अलग विशेषता है। संख्या, इंप्रेशन-
प्रेक्षणों की एक श्रृंखला में कितनी बार भिन्न x आता है, कहलाता है घंटा-
टोटोइ
विकल्प एम एक्स।

संस्करण x की आवृत्ति के बजाय, कोई इसके सामान्य से संबंध पर विचार कर सकता है
अवलोकनों की संख्या एन,जिसे कहा जाता है अक्सरवैरिएंट और उसका संबंध पदनाम-शुरू होता है डब्ल्यू एक्स।

डब्ल्यू एक्स =एम एक्स /एन=एम एक्स /åएम एक्स

एक तालिका जो आपको विकल्पों के बीच आवृत्तियों (या आवृत्तियों) के वितरण का न्याय करने की अनुमति देती है, कहलाती है असतत भिन्नता श्रृंखला।

आवृत्ति की अवधारणा के साथ, अवधारणा का उपयोग किया जाता है संचित आवृत्ति,
जो दर्शाया गया है टी एक्स एसीसी।संचित घंटे से पता चलता है कि कितने
अवलोकन, संकेत दिए गए मान x से कम मान लेता है। रिश्तेदार
संचित आवृत्ति कुल गणना n प्रेक्षण कहलाते हैं संचित-
आवृत्ति
और निरूपित करें डब्ल्यू एक्स एनएसी. जाहिर सी बात है



डब्ल्यू एक्स एनएसी = एम एक्स एनएसी / एन = एम एक्स एनएसी / एम एक्स।

संचित आवृत्तियों (एक असतत भिन्नता श्रृंखला के लिए आवृत्तियों_, निम्न तालिका में गणना की जाती है:

एक्स एमएक्स एम एक्स नाक डब्ल्यू एक्स एनएसी
0+4=4 0,04
4+6=10 0,10
10+12=22 0,22
22+16=38 0,38
38+44=82 0,82
82+18=100 1,00
6 . से ऊपर

प्रति कर्मचारी उत्पादन की जांच करना आवश्यक है - रिपोर्टिंग वर्ष में एक यांत्रिक दुकान के एक मशीन ऑपरेटर के प्रतिशत के रूप में पिछले वर्ष. यहां, अध्ययन की गई विशेषता x पिछले वर्ष के प्रतिशत के रूप में रिपोर्टिंग वर्ष में आउटपुट है। यह लगातार बदलता हुआ संकेत है। पहचान करने के लिए विशेषणिक विशेषताएंविशेषता के मूल्यों में भिन्नता को उन श्रमिकों के समूहों में जोड़ा जाएगा जिनका उत्पादन 10% के भीतर भिन्न होता है। हम तालिका में समूहीकृत डेटा प्रस्तुत करेंगे:

शोध करना फ़ीचर x श्रमिकों की संख्या एम श्रमिकों का हिस्सा w संचित आवृत्ति एम एक्स एसीसी डब्ल्यू एक्स एनएसी
80-90 8/117 8/117
90-100 15/117 8+15=23 23/117
100-110 46/117 23+46=69 69/117
110-120 29/117 69+29=98 98/117
120-130 13/117 98+13=111 111/117
130-140 3/117 111+3=114 114/117
140-150 3/117 114+3=117 117/117
å

फ़्रीक्वेंसी टेबल में, m दिखाता है कि फीचर ने कितने अवलोकन किए, उस से संबंधितया अन्य अंतराल। इस आवृत्ति को कहा जाता है मध्यान्तर,और इसका अनुपात प्रेक्षणों की कुल संख्या से है अंतराल आवृत्ति डब्ल्यू।एक तालिका जो आपको किसी विशेषता के मूल्यों में भिन्नता के अंतराल के बीच आवृत्तियों के वितरण का न्याय करने की अनुमति देती है, कहलाती है अंतराल भिन्नता श्रृंखला।

अंतराल भिन्नता श्रृंखला के लिए अवलोकन डेटा के अनुसार बनाया गया है
असंतत रूप से भिन्न विशेषता, साथ ही साथ भिन्न रूप से भिन्न, यदि
बड़ी संख्या में देखे गए विकल्प। एक असतत परिवर्तनशील श्रृंखला निर्मित होती है
केवल एक असतत चर सुविधा के लिए

कभी-कभी अंतराल भिन्नता श्रृंखला को सशर्त रूप से एक असतत से बदल दिया जाता है।
फिर अंतराल के मध्य मान को विकल्प x के रूप में लिया जाता है, और, तदनुसार,
अंतराल आवृत्ति - के लिए टी एक्स.

इष्टतम स्थिर अंतराल निर्धारित करने के लिए अक्सर एच का उपयोग किया जाता है स्टर्गेस सूत्र:

एच=(x अधिकतम - x मिनट)/(1+3.322*lg एन).

int.var.series . का निर्माण

आवृत्तियाँ m दिखाती हैं कि किसी विशेष अंतराल से संबंधित मूल्यों पर विशेषता ने कितने अवलोकन किए। ऐसी आवृत्ति को अंतराल आवृत्ति कहा जाता है, और इसका कुल प्रेक्षणों की संख्या से अनुपात अंतराल आवृत्ति w है। एक तालिका जो किसी विशेषता के मूल्यों में भिन्नता के अंतराल के बीच आवृत्तियों (या आवृत्तियों) के वितरण का न्याय करना संभव बनाती है, अंतराल भिन्नता श्रृंखला कहलाती है।

एक अंतराल भिन्नता श्रृंखला लगातार बदलती विशेषता के लिए अवलोकन डेटा के साथ-साथ एक अलग-अलग भिन्नता के लिए बनाई गई है, यदि देखे गए रूपों की संख्या बड़ी है। एक असतत परिवर्तनशील श्रृंखला केवल एक अलग-अलग विशेषता के लिए बनाई गई है।

कभी-कभी अंतराल भिन्नता श्रृंखला को सशर्त रूप से एक असतत से बदल दिया जाता है। फिर अंतराल के मध्य मान को भिन्न x के रूप में लिया जाता है, और इसी अंतराल आवृत्ति को mx . के रूप में लिया जाता है

अंतराल भिन्नता श्रृंखला बनाने के लिए, अंतराल का मान निर्धारित करना आवश्यक है, सेट पूर्ण पैमानेअंतराल और, इसके अनुसार, अवलोकन के परिणामों को समूहित करें।

इष्टतम स्थिर अंतराल एच निर्धारित करने के लिए, स्टर्गेस सूत्र का अक्सर उपयोग किया जाता है:

h = (xmax - xmin) /(1+ 3.322 log n) ।

जहां xmax xmin क्रमशः अधिकतम और न्यूनतम विकल्प हैं। यदि, गणनाओं के परिणामस्वरूप, h एक भिन्नात्मक संख्या बन जाती है, तो या तो निकटतम पूर्णांक या निकटतम साधारण भिन्न को अंतराल के मान के रूप में लिया जाना चाहिए।

पहले अंतराल की शुरुआत के रूप में मान a1=xmin-h/2 लेने की अनुशंसा की जाती है; दूसरे अंतराल की शुरुआत पहले के अंत के साथ मेल खाती है और बराबर है a2=a1 +h; तीसरे अंतराल की शुरुआत दूसरे के अंत के साथ मेल खाती है और a3=a2 + h के बराबर होती है। अंतराल का निर्माण तब तक जारी रहता है जब तक कि अगले अंतराल की शुरुआत क्रम में xmax से अधिक न हो। अंतराल के पैमाने को स्थापित करने के बाद, टिप्पणियों के परिणामों को समूहीकृत किया जाना चाहिए।

5) अवधारणा, अभिव्यक्ति के रूप और सांख्यिकीय संकेतकों के प्रकार।

सांख्यिकीयगुणात्मक निश्चितता के संदर्भ में सामाजिक-आर्थिक घटनाओं और प्रक्रियाओं की मात्रात्मक विशेषता है। संकेतक की गुणात्मक निश्चितता इस तथ्य में निहित है कि यह सीधे से संबंधित है आंतरिक सामग्रीजिस घटना या प्रक्रिया का अध्ययन किया जा रहा है, उसका सार।

सांख्यिकीय संकेतक प्रणालीपरस्पर संबंधित संकेतकों का एक समूह है जिसमें एकल-स्तरीय या बहु-स्तरीय संरचना होती है और इसका उद्देश्य एक विशिष्ट सांख्यिकीय समस्या को हल करना होता है।

एक संकेत के विपरीत, एक सांख्यिकीय संकेतक गणना द्वारा प्राप्त किया जाता है। यह जनसंख्या इकाइयों की एक साधारण गणना, उनके गुण मानों का योग, 2 या अधिक मानों की तुलना, या अधिक जटिल गणनाएँ हो सकती हैं।

एक विशिष्ट सांख्यिकीय संकेतक और एक संकेतक-श्रेणी के बीच अंतर किया जाता है।

विशिष्ट आँकड़ाकिसी दिए गए स्थान और में अध्ययन की जा रही घटना या प्रक्रिया के आकार, परिमाण की विशेषता है समय दिया गया. हालांकि, में सैद्धांतिक कार्यऔर सांख्यिकीय अवलोकन के डिजाइन चरण में, वे पूर्ण संकेतक या संकेतक-श्रेणियों के साथ भी काम करते हैं।

श्रेणी संकेतकसार को प्रतिबिंबित करें, सामान्य विशिष्ट गुणस्थान, समय और संख्यात्मक मान निर्दिष्ट किए बिना एक ही प्रकार के विशिष्ट सांख्यिकीय संकेतक। सभी सांख्यिकीय संकेतक जनसंख्या इकाइयों के कवरेज के अनुसार व्यक्तिगत और मुक्त में विभाजित हैं, और फॉर्म के अनुसार - पूर्ण, सापेक्ष और औसत में।

व्यक्तिगत संकेतकएक अलग वस्तु या आबादी की एक अलग इकाई की विशेषता - एक उद्यम, एक फर्म, एक बैंक, आदि। एक उदाहरण एक उद्यम के औद्योगिक और उत्पादन कर्मियों की संख्या है। एक ही वस्तु या इकाई की विशेषता वाले दो अलग-अलग निरपेक्ष संकेतकों के सहसंबंध के आधार पर, एक व्यक्तिगत सापेक्ष संकेतक प्राप्त किया जाता है।

सारांश संकेतकअलग-अलग लोगों के विपरीत, वे इकाइयों के एक समूह की विशेषता रखते हैं, जो सांख्यिकीय आबादी या पूरी आबादी का एक हिस्सा है। इन संकेतकों को वॉल्यूमेट्रिक और परिकलित में विभाजित किया गया है।

वॉल्यूम संकेतकजनसंख्या की व्यक्तिगत इकाइयों की विशेषता के मूल्यों को जोड़कर प्राप्त किया जाता है। परिणामी मान, जिसे विशेषता का आयतन कहा जाता है, एक आयतन निरपेक्ष संकेतक के रूप में कार्य कर सकता है, और इसकी तुलना किसी अन्य आयतन निरपेक्ष मान या जनसंख्या के आयतन से की जा सकती है। पिछले 2 मामलों में, वॉल्यूमेट्रिक सापेक्ष और वॉल्यूमेट्रिक औसत प्राप्त किए जाते हैं।

अनुमानित संकेतक, विभिन्न फ़ार्मुलों द्वारा परिकलित, व्यक्ति को हल करने का काम करता है सांख्यिकीय कार्यविश्लेषण - भिन्नता का मापन, संरचनात्मक परिवर्तनों की विशेषताएँ, संबंध का आकलन आदि। उन्हें निरपेक्ष, सापेक्ष या औसत में भी विभाजित किया जाता है।

इस समूह में सूचकांक, निकटता गुणांक, नमूना त्रुटियां और अन्य संकेतक शामिल हैं।

जनसंख्या इकाइयों का कवरेज और अभिव्यक्ति का रूप मुख्य हैं, लेकिन सांख्यिकीय संकेतकों की एकमात्र वर्गीकरण विशेषताएं नहीं हैं। महत्वपूर्ण वर्गीकरण सुविधाएक समय कारक भी है। सामाजिक-आर्थिक प्रक्रियाएं और घटनाएं सांख्यिकीय संकेतकों में या के रूप में परिलक्षित होती हैं एक निश्चित क्षणसमय, आमतौर पर निश्चित दिनांक, एक महीने, वर्ष, या की शुरुआत या अंत निश्चित अवधि- दिन, सप्ताह, महीना, तिमाही, साल। पहले मामले में, संकेतक हैं क्षणिक,क्षण में - मध्यान्तर।

अध्ययन की एक या दो वस्तुओं से संबंधित होने के आधार पर, वहाँ हैं एकल वस्तुतथा अंतर-वस्तु संकेतक. यदि पूर्व केवल एक वस्तु की विशेषता है, तो बाद वाले को विभिन्न वस्तुओं से संबंधित दो मात्राओं की तुलना करके प्राप्त किया जाता है।

स्थानिक निश्चितता की दृष्टि से, सांख्यिकीय संकेतकों को विभाजित किया गया है सभी क्षेत्रीयपूरे देश में अध्ययन की गई वस्तु या घटना की विशेषता, क्षेत्रीय और स्थानीयक्षेत्र के किसी हिस्से या किसी अलग वस्तु से संबंधित।

6) सापेक्ष संकेतकों के प्रकार और संबंध.

सापेक्ष संकेतक एक निरपेक्ष संकेतक को दूसरे से विभाजित करने का परिणाम है और के बीच के अनुपात को व्यक्त करता है मात्रात्मक विशेषताएंसामाजिक-आर्थिक प्रक्रियाएं और घटनाएं। इसलिए, के संबंध में निरपेक्ष संकेतकफॉर्म में सापेक्ष संकेतक या संकेतक सापेक्ष मूल्यव्युत्पन्न हैं।

एक सापेक्ष संकेतक की गणना करते समय, परिणामी अनुपात के अंश में निरपेक्ष संकेतक को कहा जाता है वर्तमानया तुलनीय. वह सूचक जिससे तुलना की जाती है और जो हर में होता है, तुलना का आधार या आधार कहलाता है। सापेक्ष संकेतकों को प्रतिशत, पीपीएम, अनुपात के रूप में व्यक्त किया जा सकता है, या उन्हें संख्याओं का नाम दिया जा सकता है।

व्यवहार में उपयोग किए जाने वाले सभी सापेक्ष संकेतकों में विभाजित हैं:

गतिकी; योजना; योजना का कार्यान्वयन; संरचनाएं; समन्वय; इको-गो विकास की तीव्रता और स्तर; तुलना

गतिकी का सापेक्ष संकेतकपूर्व-एक निश्चित अवधि के लिए अध्ययन के तहत प्रक्रिया या घटना के स्तर का पूर्व में उसी प्रक्रिया या घटना के स्तर का अनुपात है।

ओपीडी = वर्तमान संकेतक / पिछला। या आधार रेखा।

इस तरह से परिकलित मान दिखाता है कि कितनी बार वर्तमान स्तरपिछले एक से अधिक है या पिछले एक का कितना अनुपात है। यदि इस सूचक को बहु अनुपात के रूप में व्यक्त किया जाता है, तो इसे कहा जाता है विकास का पहलू, जब इस गुणांक को 100% से गुणा किया जाता है, तो हम प्राप्त करते हैं विकास दर।

सापेक्ष संरचना सूचकांकअध्ययन के तहत वस्तु के संरचनात्मक भागों और उनके पूरे के अनुपात का प्रतिनिधित्व करता है। संरचना का सापेक्ष संकेतक एक इकाई के अंशों में या प्रतिशत के रूप में व्यक्त किया जाता है। परिकलित मान (डी i), जिन्हें क्रमशः शेयर या विशिष्ट गुरुत्व कहा जाता है, दिखाते हैं कि कौन सा हिस्सा है या कौन सा विशिष्ट गुरुत्वकुल में i-th हिस्सा है।

समन्वय के सापेक्ष संकेतकपूरे के अलग-अलग हिस्सों के अनुपात को एक-दूसरे से जोड़ दें। साथ ही जिस हिस्से का हिस्सा सबसे ज्यादा होता है या आर्थिक, सामाजिक या किसी अन्य दृष्टिकोण से प्राथमिकता होती है, उसे तुलना के आधार के रूप में चुना जाता है। परिणाम यह है कि प्रत्येक संरचनात्मक भाग की कितनी इकाइयाँ मूल संरचनात्मक भाग की 1 इकाई के लिए होती हैं।

सापेक्ष तीव्रता संकेतकअपने अंतर्निहित वातावरण में अध्ययन के तहत प्रक्रिया या घटना के वितरण की डिग्री की विशेषता है। इस सूचक की गणना तब की जाती है जब निरपेक्ष मूल्यघटना के पैमाने, उसके आकार, संतृप्ति और वितरण घनत्व के बारे में उचित निष्कर्ष निकालने के लिए अपर्याप्त हो जाता है। इसे प्रतिशत, पीपीएम या नामित मान के रूप में व्यक्त किया जा सकता है। तीव्रता के विभिन्न सापेक्ष संकेतक हैं इको-वें विकास के स्तर के सापेक्ष संकेतक,प्रति व्यक्ति उत्पादन को चिह्नित करना और खेलना महत्वपूर्ण भूमिकाराज्य की अर्थव्यवस्था के विकास का आकलन करने में। अभिव्यक्ति के रूप में, ये संकेतक औसत संकेतकों के करीब हैं, जो अक्सर उनके भ्रम या पहचान की ओर जाता है। उनके बीच अंतर केवल इस तथ्य में निहित है कि औसत की गणना करते समय, हम इकाइयों के एक सेट के साथ काम कर रहे हैं, जिनमें से प्रत्येक एक औसत विशेषता का वाहक है।

सापेक्ष तुलना सूचकांकएक ही नाम की विशेषता के पूर्ण संकेतकों का अनुपात है विभिन्न वस्तुएं(उद्यमों, फर्मों, क्षेत्रों, जिलों, आदि)

विविधता संकेतक

भिन्नता का अध्ययन (जनसंख्या के भीतर एक विशेषता के मूल्यों में परिवर्तन) है बहुत महत्वसांख्यिकी और सामान्य रूप से सामाजिक और आर्थिक अनुसंधान में। भिन्नता के निरपेक्ष और सापेक्ष संकेतक, एक अलग विशेषता के मूल्यों के उतार-चढ़ाव की विशेषता, विशेष रूप से, कनेक्शन और संबंध की डिग्री को मापने के लिए, जनसंख्या की एकरूपता की डिग्री का आकलन करने के लिए, विशिष्टता और स्थिरता की अनुमति देते हैं। माध्य, और नमूना अवलोकन की संभावित त्रुटि के परिमाण को निर्धारित करने के लिए।

भिन्नता के पूर्ण संकेतकों में भिन्नता की सीमा, औसत शामिल है रैखिक विचलन, विचरण, माध्य मानक विचलनऔर त्रैमासिक विचलन।

भिन्नता की सीमा दर्शाती है कि मात्रात्मक रूप से भिन्न विशेषता का मान कितना बदलता है

R=xmax-xmin, जहां xmax(xmin) कुल (वितरण श्रृंखला में) विशेषता का अधिकतम (न्यूनतम) मान है।

माध्य रैखिक विचलन d को इस प्रकार परिभाषित किया गया है: औसत मूल्यमॉडुलो द्वारा ली गई पहली डिग्री में औसत से विशेषता विकल्पों के विचलन से:

औसत रैखिक विचलन का उपयोग किसी विशेषता की भिन्नता का आकलन करने के लिए अपेक्षाकृत कम किया जाता है। आमतौर पर, विचरण और मानक विचलन की गणना की जाती है।

यदि एक सेट में कई विशेषताओं के उतार-चढ़ाव की तुलना करना आवश्यक है या एक ही सुविधा के साथ कई सेटों में तुलना करना आवश्यक है विभिन्न संकेतकवितरण केंद्र, फिर भिन्नता के सापेक्ष संकेतकों का उपयोग करें।

इनमें निम्नलिखित संकेतक शामिल हैं:

1. दोलन गुणांक:

2. सापेक्ष रैखिक विचलन:

3. भिन्नता का गुणांक:

4. चतुर्थक भिन्नता का सापेक्ष संकेतक:

सापेक्ष भिन्नता का सबसे अधिक इस्तेमाल किया जाने वाला माप भिन्नता का गुणांक है। इस सूचक का उपयोग न केवल भिन्नता के तुलनात्मक मूल्यांकन के लिए किया जाता है, बल्कि जनसंख्या की एकरूपता की विशेषता के रूप में भी किया जाता है। सेट को सजातीय माना जाता है यदि<0,33.

प्रपत्र।

1. स्टेट। रिपोर्टिंग एक ऐसा संगठनात्मक रूप है जिसमें वेधशालाओं की इकाइयाँ अपनी गतिविधियों के बारे में प्रपत्रों, एक नियामक तंत्र के रूप में जानकारी प्रदान करती हैं।

रिपोर्टिंग की ख़ासियत यह है कि यह अनिवार्य रूप से उचित है, निष्पादन में अनिवार्य है और कानूनी रूप से प्रमुख या जिम्मेदार व्यक्ति के हस्ताक्षर द्वारा पुष्टि की जाती है।

2. विशेष रूप से संगठित अवलोकन इस प्रकार के अवलोकन का सबसे आकर्षक और सरल उदाहरण है। जनगणना जनगणना आमतौर पर एक ही समय में पूरे अध्ययन क्षेत्र में एक साथ नियमित अंतराल पर की जाती है।

रूसी सांख्यिकीय निकाय कुछ प्रकार की बस्तियों और संगठनों, भौतिक संसाधनों, बारहमासी वृक्षारोपण, एनजेड निर्माण वस्तुओं आदि की आबादी का जनगणना करते हैं।

4. अवलोकन का रजिस्टर फॉर्म - सांख्यिकीय रजिस्टर के रखरखाव के आधार पर। रजिस्टर में प्रत्येक यूनिट obl-I har-Xia संकेतकों की संख्या। घरेलू सांख्यिकीय अभ्यास में, सबसे व्यापक रूप से उपयोग किए जाने वाले रजिस्टर यूएस-आई और पी / पी रजिस्टर हैं।

जनसंख्या का पंजीकरण - रजिस्ट्री कार्यालय द्वारा संचालित

पंजीकरण पी / पी - यूएसआरईओ लीड.ओआरजी। सांख्यिकी।

प्रकार।

निम्नलिखित के अनुसार समूहों में विभाजित किया जा सकता है। विशेष रुप से प्रदर्शित:

क) पंजीकरण के समय

b) cos-ti . की इकाइयों के कवरेज के संदर्भ में

समय के अनुसार reg. वे हैं:

वर्तमान (निरंतर)

असंतत (आवधिक और एक बार)

वर्तमान में ओ.एस. घटनाओं और प्रक्रियाओं में परिवर्तन दर्ज किए जाते हैं जैसे वे प्राप्त होते हैं (जन्म, मृत्यु, विवाह, तलाक, आदि का पंजीकरण)

सामयिक ओ.एस. के माध्यम से किया गया अंतराल (एन जनगणना हर 10 साल में)

वन टाइम ओ.एस. अनियमित रूप से या केवल एक बार आयोजित (जनमत संग्रह)

दायरे से cos. स्टेट. ob. वहाँ हैं:

ठोस

टूटनेवाला

सतत निरीक्षण। cos . की सभी इकाइयों का एक सर्वेक्षण है

गैर-निरंतर अवलोकन मानता है कि अनुसंधान का केवल एक हिस्सा रखरखाव के अधीन है।

कई प्रकार के असंतत अवलोकन हैं:

मुख्य विधि सरणी

चयनात्मक (स्वयं)

विशेष निबंध का

यह विधि x-Xia है, जिसमें एक नियम के रूप में, सबसे अधिक प्राणियों का चयन किया जाता है, आमतौर पर सबसे बड़ी इकाइयाँ। एक बिल्ली में उल्लू। मध्य साधन। सभी देखने योग्य संकेतों का हिस्सा।

मोनोग्राफिक अवलोकन के साथ, सावधान ए। के अधीन हैं इकाइयों ओह उल्लू या एम.बी. का अध्ययन करें। या इस cov-ti इकाइयों के लिए विशिष्ट। या घटनाओं की कुछ नई किस्मों का प्रतिनिधित्व करते हैं।

अवलोकन विकास में प्रवृत्तियों की पहचान करने या उभरने के क्रम में किया जाता है यह घटना.

तरीके

प्रत्यक्ष अवलोकन

वृत्तचित्र अवलोकन।

सीधे बुलाया। ऐसा देखने योग्य एक बिल्ली के साथ रजिस्ट्रार स्वयं, प्रत्यक्ष माप, गणना, नियंत्रण के माध्यम से, पंजीकरण के अधीन तथ्य को स्थापित करते हैं और इस आधार पर, फॉर्म में एक प्रविष्टि करते हैं।

दस्तावेजी विधि ओबी. लेखांकन एक्स-आरए (यानी सांख्यिकीय रिपोर्टिंग) के नियम के रूप में सूचना के स्रोतों के रूप में विभिन्न दस्तावेजों के उपयोग के आधार पर

पोल एक बिल्ली के साथ अनुनय की एक विधि है। आवश्यक जानकारी प्रतिवादी (यानी प्रतिवादी) (मौखिक, संवाददाता, प्रश्नावली, निजी, आदि) के शब्दों से प्राप्त की जाती है।

नमूना त्रुटियों का निर्धारण।

नमूना अवलोकन की प्रक्रिया में, दो प्रकार की त्रुटियों को प्रतिष्ठित किया जाता है: पंजीकरण और प्रतिनिधित्व।

पंजीकरण त्रुटियां - सांख्यिकीय अवलोकन के दौरान प्राप्त संकेतक के मूल्य और उसके वास्तविक मूल्य के बीच विचलन। ये त्रुटियां निरंतर और गैर-निरंतर अवलोकन दोनों के दौरान प्रकट हो सकती हैं। गलत या गलत जानकारी के कारण पंजीकरण त्रुटियां होती हैं। इस प्रकार की त्रुटि के स्रोत मुद्दे के सार की गलतफहमी, रजिस्ट्रार की असावधानी, अवलोकन की व्यक्तिगत इकाइयों की चूक या बार-बार गिनती हो सकती है। पंजीकरण त्रुटियों में विभाजित हैं व्यवस्थितएक दिशा में कार्य करने और परीक्षा के परिणामों को सुचारू करने (आंकड़ों को गोल करना), और यादृच्छिक रूप से, जो विभिन्न यादृच्छिक कारकों (आसन्न अंकों की पुनर्व्यवस्था) की कार्रवाई का परिणाम हैं। यादृच्छिक त्रुटियों की अलग-अलग दिशाएँ होती हैं और सर्वेक्षण की गई आबादी की पर्याप्त बड़ी मात्रा के साथ, एक दूसरे को रद्द कर देते हैं।

प्रतिनिधित्व त्रुटियाँ - प्रारंभिक जनसंख्या में इसके मूल्य से सर्वेक्षण की गई जनसंख्या के संकेतक के मूल्यों का विचलन। इन त्रुटियों को भी विभाजित किया गया है व्यवस्थित, प्रारंभिक आबादी से देखी जाने वाली इकाइयों के चयन के सिद्धांतों के उल्लंघन के परिणामस्वरूप प्रकट होना, और यादृच्छिक रूप सेयह तब उत्पन्न होता है जब चयनित जनसंख्या संपूर्ण जनसंख्या को अपूर्ण रूप से पुन: उत्पन्न करती है। यादृच्छिक त्रुटि की मात्रा का अनुमान लगाया जा सकता है।

नमूनाकरण त्रुटि- सामान्य जनसंख्या में विशेषता के मूल्य और चयनात्मक अवलोकन के परिणामों से गणना के मूल्य के बीच का अंतर। नमूना सर्वेक्षणों के अभ्यास में, औसत और सीमांत नमूनाकरण त्रुटियां सबसे अधिक बार निर्धारित की जाती हैं।

विभिन्न चयन विधियों के लिए औसत नमूनाकरण त्रुटि की गणना अलग तरीके से की जाती है। यदि यादृच्छिक या यांत्रिक चयन, तो

औसत के लिए: एम \u003d एस 2 / (एन) 1/2

भिन्न के लिए: m = (w(1-w)/n) 1/2 , जहाँ

मी - माध्य नमूना त्रुटि

एस 2 - सामान्य फैलाव

एन - वॉल्यूम नमूना चयन ढांचा

यदि नमूना सेट एक विशिष्ट नमूने के आधार पर बनता है और इकाइयों का चयन विशिष्ट समूहों की मात्रा के अनुपात में किया जाता है, तो औसत त्रुटि बराबर होती है:

बीच के लिए: एम = (एस मैं 2 / एन) 1/2

शेयर के लिए: एम = (डब्ल्यू मैं (1-डब्ल्यू आई) / एन) 1/2 , कहाँ पे

s i 2 - इंट्रा-ग्रुप वेरिएंस का औसत

w i पूरे समूह में उन इकाइयों का अनुपात है जिनका अध्ययन किया जा रहा है।

s मैं 2 = s 2 n i / n i

सीरियल सैंपलिंग की औसत त्रुटि के बराबर है:

बीच के लिए: एम = (डी एक्स 2 / आर) 1/2

शेयर के लिए: एम = (डी 2 डब्ल्यू / आर) 1/2

घ 2 डब्ल्यू -शेयर का अंतरसमूह विचरण

डी एक्स 2 -एक मात्रात्मक विशेषता का अंतरसमूह फैलाव।

r चयनित श्रृंखला की संख्या है/

डी 2 एक्स \u003d (एक्स आई -एक्स) 2 / आर

डी 2 डब्ल्यू \u003d (डब्ल्यू आई - डब्ल्यू) 2 / आर

यदि सामान्य जनसंख्या से इकाइयों का चयन गैर-दोहराव तरीके से किया जाता है, तो माध्य त्रुटि सूत्रों में एक संशोधन किया जाता है: (1-एन/एन) 1/2

सीमांत नमूना त्रुटिडी की गणना विश्वास कारक टी और औसत नमूना त्रुटि के उत्पाद के रूप में की जाती है: डी = टी * एम।डी संभावना स्तर से संबंधित है जो इसकी गारंटी देता है। यह स्तर आत्मविश्वास कारक टी निर्धारित करता है, और इसके विपरीत। t के मान विशेष गणितीय तालिकाओं में दिए गए हैं।

नमूना आकार का निर्धारण।

नमूना आकार की गणना, एक नियम के रूप में, एक नमूना सर्वेक्षण तैयार करने के चरण में की जाती है। नमूना आकार निर्धारित करने के सूत्र सीमांत नमूनाकरण त्रुटियों के सूत्रों से अनुसरण करते हैं।

यादृच्छिक और यांत्रिक दोहराए गए नमूनों की मात्रा सूत्रों द्वारा निर्धारित की जाती है:

औसत के लिए एन \u003d टी 2 एस 2 / डी 2

शेयर के लिए एन \u003d टी 2 डब्ल्यू (1-डब्ल्यू) / डी 2

गैर-पुन: प्रयास नमूने के मामले में:

औसत के लिए एन \u003d टी 2 एस 2 एन / एनडी 2 + टी 2 एस 2

शेयर के लिए एन = टी 2 डब्ल्यू(1-डब्ल्यू)एन / एनडी 2 +टी 2 डब्ल्यू(1-डब्ल्यू).

मान s 2 और वूयादृच्छिक अवलोकन से पहले अज्ञात हैं। लगभग वे इस प्रकार पाए जाते हैं:

1. पिछले सर्वेक्षणों से लिया गया;

2. यदि विशेषता के अधिकतम और न्यूनतम मान ज्ञात हैं, तो मानक विचलन "तीन सिग्मा" नियम के अनुसार निर्धारित किया जाता है:

एस = xmax - xmin / 6

3. एक वैकल्पिक संकेत का अध्ययन करते समय, यदि सामान्य जनसंख्या में इसके हिस्से के बारे में कोई जानकारी नहीं है, तो अधिकतम संभव मान w = 0.5 लिया जाता है

विशिष्ट चयन के साथ, विशिष्ट समूहों के आकार के समानुपाती, प्रत्येक समूह के लिए नमूना आकार सूत्र द्वारा निर्धारित किया जाता है : एन मैं = एन * एन मैं / एन, कहाँ पे

एन मैं - i-वें समूह से नमूना आकार

एन आई- जीन-वें cos-ti में i-वें समूह का आयतन।

विशेषता की भिन्नता के आनुपातिक नमूने के साथ, प्रत्येक समूह से नमूना आकार निम्नानुसार पाया जाता है: n i = nN i s i /åN i s i ।

समूहों के आकार के आनुपातिक पुन: नमूनाकरण के साथ, कुल नमूना आकार निम्नानुसार पाया जाता है:

औसत के लिए एन \u003d टी 2 एस 2 आई / डी 2

शेयर के लिए एन \u003d टी 2 डब्ल्यू (1-डब्ल्यू) / डी 2

गैर-दोहराए जाने वाले विशिष्ट नमूने के मामले में:

औसत के लिए एन = टी 2 एस 2 आई एन / डी 2 एन+टी 2 एस 2 आई

शेयर के लिए एन = टी 2 डब्ल्यू(1-डब्ल्यू)एन / डी 2 एन+टी 2 डब्ल्यू(1-डब्ल्यू)

सहसंबंध और प्रतिगमन विश्लेषण के उपयोग के लिए बुनियादी अवधारणाएं और पूर्वापेक्षाएँ।

सह - संबंधयादृच्छिक चर के बीच एक सांख्यिकीय निर्भरता है जिसमें कड़ाई से कार्यात्मक चरित्र नहीं होता है, जिसमें एक में परिवर्तन होता है यादृच्छिक चरदूसरे की गणितीय अपेक्षा में परिवर्तन की ओर ले जाता है।

सहसंबंध विश्लेषण- इसके कार्य के रूप में दो संकेतों के बीच और प्रभावी और कई कारक संकेतों के बीच संबंध की निकटता का मात्रात्मक निर्धारण है। संबंध की जकड़न मात्रात्मक रूप से सहसंबंध गुणांक के मूल्य द्वारा व्यक्त की जाती है।

सहसंबंध-प्रतिगमनएक सामान्य अवधारणा के रूप में विश्लेषण में जकड़न की माप, संचार की दिशा और संचार की एक विश्लेषणात्मक अभिव्यक्ति (रूप) की स्थापना (प्रतिगमन विश्लेषण) शामिल है।

प्रतिगमन विश्लेषणसंबंध की विश्लेषणात्मक अभिव्यक्ति को निर्धारित करने में शामिल है, जिसमें एक मूल्य में परिवर्तन (आश्रित या प्रभावी विशेषता कहा जाता है) एक या एक से अधिक स्वतंत्र मूल्यों (कारकों) के प्रभाव के कारण होता है, और अन्य सभी कारकों का सेट जो कि निर्भर मूल्य को भी प्रभावित करता है, स्थिर और औसत मूल्यों के लिए मेहनत करता है। प्रतिगमन एकल-कारक (जोड़ी) और बहु-कारक (एकाधिक) हो सकता है।

प्रतिगमन विश्लेषण का उद्देश्यफैक्टरियल (x 1, x 2, ... x k) संकेतों पर प्रभावी विशेषता (Y) के सशर्त औसत मूल्य की कार्यात्मक निर्भरता का आकलन है।

प्रतिगमन विश्लेषण का मुख्य आधारयह है कि केवल परिणामी चिह्न (Y) सामान्य वितरण कानून का पालन करता है, और कारक चिह्न x 1, x 2, ..., x k का एक मनमाना वितरण कानून हो सकता है। समय श्रृंखला के विश्लेषण में, समय t एक कारक चिह्न के रूप में कार्य करता है। उसी समय, प्रतिगमन विश्लेषण में, प्रभावी (Y) फैक्टोरियल (x 1, x 2, ..., x k) संकेतों के बीच कारण संबंधों की उपस्थिति पहले से निहित है। प्रतिगमन समीकरण, या सामाजिक-आर्थिक घटना के संबंध का सांख्यिकीय मॉडल, फ़ंक्शन Y x \u003d f (x 1, x 2, ..., x k) द्वारा व्यक्त किया गया, वास्तविक नकली घटना या प्रक्रिया के लिए काफी पर्याप्त है। यदि निम्नलिखित मनाया जाता है उनके निर्माण के लिए आवश्यकताएँ.

1. अध्ययन के तहत प्रारंभिक डेटा की समग्रता सजातीय है और गणितीय रूप से निरंतर कार्यों द्वारा वर्णित है।

2. कारण और प्रभाव संबंधों के एक या अधिक समीकरणों द्वारा सिम्युलेटेड घटना का वर्णन करने की संभावना।

3. सभी कारक चिह्नों में मात्रात्मक (संख्यात्मक) अभिव्यक्ति होनी चाहिए।

4. अध्ययन के तहत नमूने की पर्याप्त बड़ी मात्रा की उपस्थिति।

5. घटना और प्रक्रियाओं के बीच कारण और प्रभाव संबंधों को निर्भरता के रैखिक या रैखिक रूप में वर्णित किया जाना चाहिए।

6. संचार मॉडल के मापदंडों पर मात्रात्मक प्रतिबंधों का अभाव।

7. अध्ययन की गई आबादी की क्षेत्रीय और लौकिक संरचना की स्थिरता।

सहसंबंध और प्रतिगमन विश्लेषण के आधार पर निर्मित संबंध मॉडल की सैद्धांतिक वैधता निम्नलिखित को देखकर सुनिश्चित की जाती है: बुनियादी शर्तें.

1. सभी संकेत और उनके संयुक्त वितरण को सामान्य वितरण कानून का पालन करना चाहिए;

2. मान (Y) और कारक लक्षणों के मानों को बदलते समय प्रतिरूपित गुण (Y) का प्रसरण हमेशा स्थिर रहना चाहिए।

3. अलग-अलग प्रेक्षण स्वतंत्र होने चाहिए, अर्थात i-वें अवलोकन में प्राप्त परिणाम पिछले वाले से संबंधित नहीं होने चाहिए और इसमें बाद के अवलोकनों के बारे में जानकारी होनी चाहिए, साथ ही उन्हें प्रभावित करना चाहिए।

सारांश उद्देश्य और सामग्री

अवलोकन अध्ययन के तहत वस्तु की प्रत्येक इकाई के बारे में जानकारी प्रदान करता है। प्राप्त आंकड़े सामान्य संकेतक नहीं हैं। उनकी मदद से, प्रारंभिक डेटा प्रोसेसिंग के बिना समग्र रूप से वस्तु के बारे में निष्कर्ष निकालना असंभव है।

इसलिए, सांख्यिकीय अनुसंधान के अगले चरण का लक्ष्य प्राथमिक डेटा को व्यवस्थित करना और इस आधार पर, सांख्यिकीय क्षेत्रों के सामान्यीकरण की सहायता से संपूर्ण वस्तु की एक सारांश विशेषता प्राप्त करना है।

सारांश - विशिष्ट एकल तथ्यों को सामान्य बनाने के लिए अनुक्रमिक संचालन का एक सेट जो एक पूरे के रूप में अध्ययन के तहत घटना में निहित विशिष्ट विशेषताओं और पैटर्न की पहचान करने के लिए एक सेट बनाते हैं।

यदि सांख्यिकीय अवलोकन के दौरान किसी वस्तु की प्रत्येक इकाई के बारे में डेटा एकत्र किया जाता है, तो सारांश का परिणाम विस्तृत डेटा होता है जो संपूर्ण जनसंख्या को समग्र रूप से दर्शाता है

एक सांख्यिकीय सारांश घटना और प्रक्रियाओं के प्रारंभिक सैद्धांतिक विश्लेषण के आधार पर आयोजित किया जाना चाहिए ताकि सारांश के दौरान अध्ययन के तहत घटना के बारे में जानकारी खो न जाए और सभी सांख्यिकीय परिणाम वस्तु की सबसे महत्वपूर्ण विशिष्ट विशेषताओं को प्रतिबिंबित करें।

सामग्री प्रसंस्करण की गहराई के अनुसार, सारांश सरल और जटिल हो सकता है।

एक साधारण सारांश अवलोकन की समान इकाइयों के लिए योग की गणना का संचालन है।

एक जटिल सारांश संचालन का एक सेट है जिसमें समूह अवलोकन इकाइयां शामिल हैं, प्रत्येक समूह के लिए और संपूर्ण वस्तु के लिए योगों की गणना करना, और समूहीकरण और सारांश परिणामों को सांख्यिकीय तालिकाओं के रूप में प्रस्तुत करना शामिल है।

सारांश इसके कार्यक्रम के विकास से पहले होता है, जिसमें निम्नलिखित चरण होते हैं: समूहीकरण विशेषताओं का चयन; समूहों के गठन के क्रम का निर्धारण; समूहों और वस्तु को समग्र रूप से चिह्नित करने के लिए सांख्यिकीय पोक-लेई की एक प्रणाली का विकास; सांख्यिकीय तालिकाओं के लेआउट की एक प्रणाली का विकास जिसमें सारांश के परिणाम प्रस्तुत किए जाने चाहिए।

सामग्री प्रसंस्करण के रूप के अनुसार, सारांश: विकेंद्रीकृत और केंद्रीकृत।

एक विकेंद्रीकृत सारांश के साथ (यह एक नियम के रूप में, सांख्यिकीय रिपोर्टिंग के प्रसंस्करण में उपयोग किया जाता है), सामग्री का विकास क्रमिक चरणों में किया जाता है। इसलिए, उद्यमों की रिपोर्ट को रूसी संघ के घटक संस्थाओं के सांख्यिकीय अधिकारियों द्वारा संक्षेपित किया जाता है, और इस क्षेत्र के परिणाम पहले से ही रूस की राज्य सांख्यिकी समिति को भेजे जाते हैं, और वहां वे यह निर्धारित करते हैं कि क्या देश की राष्ट्रीय अर्थव्यवस्था समग्र रूप से है निर्धारित किया जाता है।

एक केंद्रीकृत सारांश के साथ, सभी प्राथमिक सामग्री एक संगठन में प्रवेश करती है, जहां इसे शुरू से अंत तक संसाधित किया जाता है। केंद्रीकृत सारांश आमतौर पर एक बार के सांख्यिकीय सर्वेक्षणों से सामग्री को संसाधित करने के लिए उपयोग किया जाता है।

निष्पादन की तकनीक के अनुसार, सांख्यिकीय सारांश को यंत्रीकृत और मैनुअल में विभाजित किया गया है।

मशीनीकृत सारांश - जिसमें इलेक्ट्रॉनिक कंप्यूटर का उपयोग करके सभी कार्य किए जाते हैं। मैनुअल सारांश के साथ, सभी बुनियादी संचालन (समूह और कुल योग की गणना) मैन्युअल रूप से किए जाते हैं।

सारांश को पूरा करने के लिए, एक योजना तैयार की जाती है जो संगठनात्मक मुद्दों को निर्धारित करती है: किसके द्वारा और कब सभी संचालन किए जाएंगे, इसके संचालन की प्रक्रिया, आवधिक प्रेस में प्रकाशित होने वाली जानकारी की संरचना।

दीन-कि की समापन पंक्तियाँ

दीन-की की पंक्तियों का विश्लेषण करते समय, उन्हें बंद करना आवश्यक हो जाता है - दो या दो से अधिक पंक्तियों को एक पंक्ति में मिला दें। उन मामलों में बंद करना आवश्यक है जहां क्षेत्रीय परिवर्तनों के कारण श्रृंखला के स्तर अतुलनीय हैं, कीमतों में बदलाव के कारण और श्रृंखला के स्तरों की गणना के लिए कार्यप्रणाली में बदलाव के कारण। उपरोक्त दो पंक्तियों को एक में बंद करना (गठबंधन) करना आवश्यक है। यह तुलनीयता कारक का उपयोग करके किया जा सकता है। प्राप्त गुणांक द्वारा वर्ष के लिए डेटा को गुणा करने पर, हमें निरपेक्ष मूल्यों की गतिशीलता की एक बंद (तुलनीय) श्रृंखला मिलती है, और परिवर्तन के बाद 100% के रूप में लिया जाता है, और बाकी को क्रमशः इन स्तरों के सापेक्ष प्रतिशत के रूप में पुनर्गणना किया जाता है।

30. M-dy संरेखण पंक्तियाँ दिन-ki

दीन-की की किसी भी श्रृंखला को सैद्धांतिक रूप से तीन घटकों के रूप में दर्शाया जा सकता है:

रुझान (गतिशील श्रृंखला की मुख्य प्रवृत्ति और विकास);

मौसमी सहित चक्रीय (आवधिक) उतार-चढ़ाव;

यादृच्छिक उतार-चढ़ाव।

गतिशील श्रृंखला के विश्लेषण में उत्पन्न होने वाले कार्यों में से एक अध्ययन के तहत घटना के स्तरों में परिवर्तन स्थापित करना है। कुछ मामलों में, दिन-की की एक श्रृंखला के स्तरों में परिवर्तन का पैटर्न काफी स्पष्ट है, उदाहरण के लिए, या तो एक श्रृंखला के स्तरों में एक व्यवस्थित कमी, या उनकी वृद्धि। कभी-कभी श्रृंखला के स्तरों में कई प्रकार के परिवर्तन होते हैं (कभी-कभी वे बढ़ते हैं, कभी-कभी वे घटते हैं)। इस मामले में, हम केवल एक सामान्य प्रवृत्ति और विकास की बात कर सकते हैं: या तो वृद्धि या गिरावट के लिए।

मुख्य प्रवृत्ति और विकास (प्रवृत्ति) की पहचान को समय श्रृंखला का संरेखण कहा जाता है, और मुख्य प्रवृत्ति एम-डाई लेवलिंग की एम-डाई पहचान।

प्रवृत्ति का प्रत्यक्ष चयन तीन मी-मील द्वारा किया जा सकता है।

* एमडी मोटे अंतराल। यह एमडी समय रेखाओं के विस्तार पर आधारित है, जिसमें श्रृंखला के स्तर शामिल हैं। उदाहरण के लिए, दीन-कि की एक पंक्ति

दैनिक उत्पादन को मासिक उत्पादन अनुमानों की एक श्रृंखला द्वारा प्रतिस्थापित किया जाता है, और इसी तरह।

* एमडी मूविंग एवरेज। इस एम-डी में, श्रृंखला के प्रारंभिक स्तरों को औसत मूल्यों से बदल दिया जाता है, जो किसी दिए गए स्तर से प्राप्त होते हैं और कई सममित रूप से आसपास के होते हैं। स्तरों की पूर्णांक संख्या जिस पर औसत मान की गणना की जाती है, चौरसाई अंतराल कहलाती है। चौरसाई अंतराल विषम (3, 5, 7, आदि अंक) या सम (2, 4, 6, आदि अंक) हो सकता है। औसत की गणना स्लाइडिंग विधि द्वारा की जाती है, अर्थात, पहले स्तर को धीरे-धीरे स्वीकृत स्लाइडिंग अवधि से बाहर करके और अगले एक को शामिल करके किया जाता है। विषम चौरसाई के साथ, परिणामी अंकगणितीय माध्य मान परिकलित अंतराल के मध्य को निर्दिष्ट किया जाता है।

मूविंग एवरेज द्वारा चौरसाई के "-" एम-डिका में श्रृंखला की शुरुआत और अंत में बिंदुओं के लिए सुचारू स्तर निर्धारित करने की पारंपरिकता शामिल है।

* विश्लेषणात्मक संरेखण - मुख्य प्रवृत्ति और विकास की पहचान करने का सबसे प्रभावी तरीका है। इस मामले में, गतिकी की एक श्रृंखला के स्तरों को समय के एक फलन के रूप में व्यक्त किया जाता है: Yt=f(t)

दीन-वें श्रृंखला के विश्लेषणात्मक संरेखण का उद्देश्य विश्लेषणात्मक-वें कारखाने f(t) का निर्धारण करना है। व्यवहार में, उपलब्ध समय श्रृंखला के अनुसार, प्रपत्र सेट किया जाता है और फ़ंक्शन f(t) के पैरामीटर पाए जाते हैं, और फिर प्रवृत्ति से विचलन के व्यवहार का विश्लेषण किया जाता है।

अर्थशास्त्र में, फॉर्म का एक फ़ंक्शन अक्सर उपयोग किया जाता है: i = а0 +∑ ai +ti

फ़ॉर्म (3.12) के कार्यों में से, सबसे अधिक बार समतल करते समय, रैखिक प्रणाली / (*) \u003d ao + a1 * t या परवलयिक f (t) \u003d a0 + att + a2 t2 का उपयोग किया जाता है।

गुणांक a,a,a2,...,ap सूत्र में कम से कम वर्गों द्वारा पाए जाते हैं।

इस पद्धति के अनुसार, p-th डिग्री बहुपद के मापदंडों को खोजने के लिए, तथाकथित सामान्य समीकरणों की प्रणाली को हल करना आवश्यक है:

नाओ+a1∑t=∑Y

ao∑t+ a1∑t*t= ∑Y*t.

प्रवृत्ति से पता चलता है कि व्यवस्थित कारक दिन-की के स्तर को कैसे प्रभावित करते हैं। प्रवृत्ति के आसपास के स्तरों का उतार-चढ़ाव अवशिष्ट (यादृच्छिक) कारकों के प्रभाव के माप के रूप में कार्य करता है। इस प्रभाव का आकलन किया जा सकता है

मानक विचलन सूत्र के अनुसार।

सहसंबंध-प्रतिगमन विश्लेषण की मूल अवधारणाएँ।

मापदण्ड नाम अर्थ
लेख विषय: विविधता श्रृंखला
रूब्रिक (विषयगत श्रेणी) उत्पादन

एक यादृच्छिक चर के देखे गए मान एक्स 1 , एक्स 2 , …, एक्स केबुलाया विकल्प.

आवृत्तिविकल्प एक्समुझे एक नंबर कहा जाता है मैं (मैं=1,…,) दिखा रहा है कि नमूने में यह विविधता कितनी बार होती है।

आवृत्ति(सापेक्ष आवृत्ति, शेयर) विकल्प एक्स मैं (मैं=1,…,) को आमतौर पर इसकी आवृत्ति का अनुपात कहा जाता है मैंनमूना आकार के लिए एन.

आवृत्तियों और आवृत्तियों को कहा जाता है तराजू.

संचित आवृत्तियह विकल्पों की संख्या को कॉल करने के लिए प्रथागत है, जिनमें से मान दिए गए से कम हैं एक्स:

संचित आवृत्तियह संचित आवृत्ति के अनुपात को नमूना आकार में कॉल करने के लिए प्रथागत है:

विविधता श्रृंखला(सांख्यिकीय श्रृंखला) - यह आरोही क्रम में लिखे गए विकल्पों के अनुक्रम और उनके संबंधित भार को कॉल करने के लिए प्रथागत है।

विविधता श्रृंखला होनी चाहिए अलग(एक असतत यादृच्छिक चर के मूल्यों का नमूना) और निरंतर (अंतराल)(एक सतत यादृच्छिक चर के मूल्यों का चयन)।

असतत परिवर्तनशील श्रृंखला का रूप है:

जब विकल्पों की संख्या बड़ी होती है या विशेषता निरंतर होती है (एक यादृच्छिक चर एक निश्चित अंतराल में कोई भी मान ले सकता है), वे हैं मध्यान्तरविविधता श्रृंखला।

अंतराल भिन्नता श्रृंखला बनाने के लिए, निष्पादित करें समूहीकरणविकल्प - वे अलग-अलग अंतराल में विभाजित हैं:

कभी-कभी अंतरालों की संख्या का उपयोग करके निर्धारित किया जाता है स्टर्ज सूत्र:

फिर प्रत्येक अंतराल में आने वाले वेरिएंट की संख्या की गणना की जाती है - आवृत्तियों मैं(या आवृत्ति मैं/एन) यदि वेरिएंट अंतराल की सीमा पर है, तो यह सही अंतराल से जुड़ा हुआ है।

अंतराल भिन्नता श्रृंखला का रूप है:

विकल्प
आवृत्तियों

अनुभवजन्य (सांख्यिकीय) वितरण समारोहयह एक फ़ंक्शन को कॉल करने के लिए प्रथागत है जिसका मूल्य बिंदु पर है एक्सउस सापेक्ष आवृत्ति के बराबर है जो वैरिएंट के मान से कम होगा एक्स(के लिए संचयी आवृत्ति एक्स):

आवृत्ति बहुभुजएक पॉलीलाइन कहा जाता है जिसके खंड निर्देशांक के साथ बिंदुओं को जोड़ते हैं ( एक्स 1 ; एन 1), (एक्स 2 ; एन 2), …, (एक्स के; एनके) आवृत्ति बहुभुज, जो वितरण बहुभुज का सांख्यिकीय एनालॉग है।

यह कहने योग्य है कि एक निरंतर परिवर्तनशील श्रृंखला के लिए, एक बहुभुज बनाया जा सकता है यदि मान एक्स 1 , एक्स 2 , …, एक्स केअंतराल के मध्य बिंदु ले लो।

एक अंतराल भिन्नता श्रृंखला को आमतौर पर का उपयोग करके ग्राफिक रूप से दर्शाया जाता है आयतचित्र.

बार चार्ट- एक चरणबद्ध आकृति जिसमें आयताकार होते हैं जिनके आधार आंशिक लंबाई अंतराल होते हैं एच= एक्स मैं +1 – एक्स मैं, मैं= 0,…,-1, और ऊंचाई अंतराल के आवृत्तियों (या आवृत्तियों) के बराबर हैं मैं (मैं).

संचयी(संचयी वक्र) - संचित आवृत्तियों (आवृत्तियों) का वक्र। के लिये असतत श्रृंखलासंचयी बिंदुओं को जोड़ने वाली एक टूटी हुई रेखा है या , . के लिये अंतराल श्रृंखलासंचयी बिंदु से शुरू होता है, जिसका भुज पहले अंतराल की शुरुआत के बराबर है, और कोटि शून्य के बराबर संचित आवृत्ति (आवृत्ति) है। इस टूटी हुई रेखा के अन्य बिंदु अंतराल के सिरों के अनुरूप हैं।

विविधता श्रृंखला - अवधारणा और प्रकार। "विविधता श्रृंखला" 2017, 2018 श्रेणी का वर्गीकरण और विशेषताएं।

  • - वितरण की विविधता श्रृंखला

    स्वामित्व के प्रकार से 1995 में रूसी संघ में खुदरा व्यापार कारोबार का वितरण, मिलियन रूबल वितरण श्रृंखला के प्रकार व्याख्यान VIII। वितरण श्रृंखला प्राथमिक सांख्यिकीय डेटा के प्रसंस्करण और व्यवस्थितकरण के परिणामस्वरूप, वे प्राप्त करते हैं ....


  • - विविधता श्रृंखला

    सांख्यिकीय डेटा का सबसे सरल परिवर्तन परिमाण द्वारा उनका क्रम है। सामान्य जनसंख्या से नमूना आकार, तत्वों के गैर-घटते क्रम में आदेश दिया गया है, अर्थात। , एक भिन्नता श्रृंखला कहा जाता है:। मामले में जब टिप्पणियों की मात्रा ....


  • - कार्य 2. अंतराल भिन्नता श्रृंखला

    1. कार्य प्रकार के अनुरूप दिए गए नमूने के आधार पर, अंतराल भिन्नता श्रृंखला बनाएं; एक हिस्टोग्राम बनाएं और संचय करें (दो विधियों का उपयोग करें: एक एक्सेल चार्ट और "डेटा विश्लेषण" पैकेज का "हिस्टोग्राम" मोड सम्मिलित करना)। 2. परिणामी हिस्टोग्राम का विश्लेषण करें। ....


  • - सेम के बीज या उसी उम्र के किसी भी पौधे की पत्तियों की विशेषता की परिवर्तनशीलता की विविधता श्रृंखला संकलित करें। विशेषता परिवर्तनशीलता के पैटर्न प्रकट करें।

    जनसंख्या एक प्रजाति की संरचनात्मक इकाई है। आबादी की संख्या। जनसंख्या में उतार-चढ़ाव के कारण। आबादी में और एक ही और विभिन्न प्रजातियों की विभिन्न आबादी के बीच व्यक्तियों का संबंध। 1. किसी प्रजाति की एक महत्वपूर्ण विशेषता समूहों में उसका वितरण है, आबादी में ...

  • विविधता श्रृंखला: परिभाषा, प्रकार, मुख्य विशेषताएं। गणना की विधि
    चिकित्सा और सांख्यिकीय अध्ययनों में फैशन, माध्यिका, अंकगणितीय माध्य
    (सशर्त उदाहरण पर दिखाएं)।

    एक परिवर्तनशील श्रृंखला अध्ययन के तहत विशेषता के संख्यात्मक मूल्यों की एक श्रृंखला है, जो एक दूसरे से उनके परिमाण में भिन्न होती है और में स्थित होती है निश्चित क्रम(आरोही या अवरोही क्रम में)। श्रृंखला के प्रत्येक संख्यात्मक मान को एक प्रकार (V) कहा जाता है, और इस श्रृंखला की संरचना में यह या वह संस्करण कितनी बार प्रदर्शित होता है, इसे आवृत्ति (p) कहा जाता है।

    प्रेक्षणों के मामलों की कुल संख्या, जिनमें भिन्नता श्रृंखला शामिल है, अक्षर n द्वारा निरूपित की जाती है। अध्ययन की गई विशेषताओं के अर्थ में अंतर को भिन्नता कहा जाता है। यदि चर चिह्न में मात्रात्मक माप नहीं है, तो भिन्नता को गुणात्मक कहा जाता है, और वितरण श्रृंखला को गुणकारी कहा जाता है (उदाहरण के लिए, रोग के परिणाम, स्वास्थ्य की स्थिति, आदि द्वारा वितरण)।

    यदि एक चर चिह्न में मात्रात्मक अभिव्यक्ति होती है, तो इस तरह की भिन्नता को मात्रात्मक कहा जाता है, और वितरण श्रृंखला को भिन्नता कहा जाता है।

    विविधता श्रृंखला को असंतत और निरंतर में विभाजित किया जाता है - मात्रात्मक विशेषता की प्रकृति के अनुसार, सरल और भारित - संस्करण की घटना की आवृत्ति के अनुसार।

    एक साधारण विविधता श्रृंखला में, प्रत्येक प्रकार केवल एक बार (p=1) होता है, भारित एक में, एक ही प्रकार कई बार होता है (p>1)। ऐसी श्रृंखला के उदाहरणों पर बाद में पाठ में चर्चा की जाएगी। यदि एक मात्रात्मक विशेषतानिरंतर है, अर्थात्। पूर्णांकों के बीच मध्यवर्ती होते हैं भिन्नात्मक मात्रा, परिवर्तनशील श्रृंखला को सतत कहा जाता है।

    उदाहरण के लिए: 10.0 - 11.9

    14.0 - 15.9, आदि।

    यदि मात्रात्मक चिन्ह असंतत है, अर्थात। इसके अलग-अलग मान (वेरिएंट) एक दूसरे से एक पूर्णांक से भिन्न होते हैं और इनमें मध्यवर्ती नहीं होता है भिन्नात्मक मान, परिवर्तनशील श्रृंखला को असंतत या असतत कहा जाता है।

    हृदय गति के बारे में पिछले उदाहरण के डेटा का उपयोग करना

    21 छात्रों के लिए, हम एक विविधता श्रृंखला (तालिका 1) का निर्माण करेंगे।

    तालिका एक

    पल्स रेट (बीपीएम) द्वारा मेडिकल छात्रों का वितरण

    इस प्रकार, एक परिवर्तनशील श्रृंखला बनाने का अर्थ है उपलब्ध संख्यात्मक मूल्य(विकल्प) व्यवस्थित करना, सुव्यवस्थित करना, अर्थात्। एक निश्चित क्रम में (आरोही या अवरोही क्रम में) उनकी संगत आवृत्तियों के साथ व्यवस्थित करें। विचाराधीन उदाहरण में, विकल्पों को आरोही क्रम में व्यवस्थित किया जाता है और उन्हें असंतत (असतत) पूर्णांकों के रूप में व्यक्त किया जाता है, प्रत्येक विकल्प कई बार आता है, अर्थात। हम एक भारित, असंतत या असतत परिवर्तनशील श्रृंखला के साथ काम कर रहे हैं।

    एक नियम के रूप में, यदि हम जिस सांख्यिकीय आबादी का अध्ययन कर रहे हैं, उसमें टिप्पणियों की संख्या 30 से अधिक नहीं है, तो अध्ययन के तहत विशेषता के सभी मूल्यों को बढ़ते क्रम में एक परिवर्तनशील श्रृंखला में व्यवस्थित करने के लिए पर्याप्त है, जैसा कि तालिका में है। 1, या अवरोही क्रम में।

    पर बड़ी संख्या मेंअवलोकन (एन> 30), होने वाले वेरिएंट की संख्या बहुत बड़ी हो सकती है, इस मामले में एक अंतराल या समूहीकृत विविधता श्रृंखला संकलित की जाती है, जिसमें बाद के प्रसंस्करण को सरल बनाने और वितरण की प्रकृति को स्पष्ट करने के लिए, वेरिएंट को समूहों में जोड़ा जाता है .

    आमतौर पर संख्या समूह विकल्प 8 से 15 के बीच है।

    उनमें से कम से कम 5 होने चाहिए, क्योंकि। अन्यथा, यह बहुत मोटा, अत्यधिक इज़ाफ़ा होगा, जो भिन्नता की समग्र तस्वीर को विकृत करता है और औसत मूल्यों की सटीकता को बहुत प्रभावित करता है। जब समूह विकल्पों की संख्या 20-25 से अधिक होती है, तो औसत मूल्यों की गणना की सटीकता बढ़ जाती है, लेकिन विशेषता भिन्नता की विशेषताएं काफी विकृत हो जाती हैं और गणितीय प्रसंस्करण अधिक जटिल हो जाता है।

    समूहीकृत श्रृंखला का संकलन करते समय, इस पर विचार करना आवश्यक है

    - भिन्न समूहों को एक विशिष्ट क्रम में रखा जाना चाहिए (आरोही या अवरोही);

    - भिन्न समूहों में अंतराल समान होना चाहिए;

    − अंतराल की सीमाओं का मान मेल नहीं खाना चाहिए, क्योंकि यह स्पष्ट नहीं होगा कि किस समूह में अलग-अलग विकल्पों को विशेषता देना है;

    - अंतराल की सीमा निर्धारित करते समय एकत्रित सामग्री की गुणात्मक विशेषताओं को ध्यान में रखना आवश्यक है (उदाहरण के लिए, वयस्कों के वजन का अध्ययन करते समय, 3-4 किलोग्राम का अंतराल स्वीकार्य है, और पहले महीनों में बच्चों के लिए) जीवन का यह 100 ग्राम से अधिक नहीं होना चाहिए।)

    आइए एक समूहीकृत (अंतराल) श्रृंखला का निर्माण करें जो परीक्षा से पहले 55 मेडिकल छात्रों के लिए पल्स रेट (बीट्स प्रति मिनट की संख्या) पर डेटा की विशेषता है: 64, 66, 60, 62,

    64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

    64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

    79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

    समूहीकृत श्रृंखला बनाने के लिए, आपको चाहिए:

    1. अंतराल का मान निर्धारित करें;

    2. भिन्नता श्रृंखला के प्रकार के समूहों के मध्य, शुरुआत और अंत का निर्धारण करें।

    अंतराल का मान (i) अपेक्षित समूहों (r) की संख्या से निर्धारित होता है, जिसकी संख्या एक विशेष तालिका के अनुसार टिप्पणियों (n) की संख्या के आधार पर निर्धारित की जाती है

    अवलोकनों की संख्या के आधार पर समूहों की संख्या:

    हमारे मामले में, 55 छात्रों के लिए 8 से 10 समूह बनाना संभव है।

    अंतराल (i) का मान निम्न सूत्र द्वारा निर्धारित किया जाता है -

    मैं = वीमैक्स-वीमिन/आर

    हमारे उदाहरण में, अंतराल का मान 82-58/8= 3 है।

    यदि अंतराल मान है भिन्नात्मक संख्या, परिणाम को एक पूर्णांक तक गोल किया जाना चाहिए।

    कई प्रकार के औसत हैं:

    अंकगणित औसत,

    जियोमेट्रिक माध्य,

    हार्मोनिक माध्य,

    वर्गमूल औसत का वर्ग,

    ● मध्यम प्रगतिशील,

    माध्यिका

    चिकित्सा आंकड़ों में, अंकगणितीय औसत का सबसे अधिक बार उपयोग किया जाता है।

    मध्यम अंकगणितीय मान(एम) एक सामान्यीकरण मूल्य है जो उस विशिष्ट को निर्धारित करता है जो संपूर्ण जनसंख्या की विशेषता है। एम की गणना के लिए मुख्य तरीके हैं: अंकगणितीय माध्य विधि और क्षणों की विधि (सशर्त विचलन)।

    अंकगणित माध्य विधि का उपयोग सरल अंकगणितीय माध्य और भारित अंकगणितीय माध्य की गणना के लिए किया जाता है। समांतर माध्य मान की गणना के लिए विधि का चुनाव भिन्नता श्रृंखला के प्रकार पर निर्भर करता है। एक साधारण परिवर्तनशील श्रृंखला के मामले में, जिसमें प्रत्येक प्रकार केवल एक बार होता है, सरल अंकगणितीय माध्य सूत्र द्वारा निर्धारित किया जाता है:

    जहां: - अंकगणितीय माध्य मान;

    V चर विशेषता (विकल्प) का मान है;

    - क्रिया को इंगित करता है - योग;

    n प्रेक्षणों की कुल संख्या है।

    अंकगणित माध्य की गणना का एक उदाहरण सरल है। 35: 20, 22, 19, 15, 16, 21, 17, 23, 18 आयु वर्ग के 9 पुरुषों में श्वसन दर (प्रति मिनट सांसों की संख्या)।

    35 वर्ष की आयु के पुरुषों में श्वसन दर का औसत स्तर निर्धारित करने के लिए यह आवश्यक है:

    1. सभी विकल्पों को आरोही या अवरोही क्रम में रखते हुए एक परिवर्तनशील श्रृंखला बनाएँ। हमें एक साधारण परिवर्तनशील श्रृंखला मिली है, क्योंकि भिन्न मान केवल एक बार होते हैं।

    एम = ∑V/n = 171/9 = 19 श्वास प्रति मिनट

    निष्कर्ष। 35 वर्ष की आयु के पुरुषों में श्वसन आवृत्ति औसतन 19 . होती है श्वसन गतिप्रति मिनट।

    यदि किसी प्रकार के अलग-अलग मान दोहराए जाते हैं, तो प्रत्येक संस्करण को एक पंक्ति में लिखने की कोई आवश्यकता नहीं है; यह होने वाले संस्करण के आकारों को सूचीबद्ध करने के लिए पर्याप्त है (वी) और आगे उनके दोहराव की संख्या को इंगित करने के लिए (पी) ) ऐसी विविधता श्रृंखला, जिसमें विकल्प होते हैं, जैसे कि, उनके अनुरूप आवृत्तियों की संख्या के अनुसार भारित, भारित भिन्नता श्रृंखला कहलाती है, और परिकलित औसत मान अंकगणितीय भारित औसत होता है।

    अंकगणितीय भारित औसत सूत्र द्वारा निर्धारित किया जाता है: M= Vp/n

    जहाँ n प्रेक्षणों की संख्या है, योग के बराबरआवृत्तियों - r।

    अंकगणितीय भारित औसत की गणना का एक उदाहरण।

    तीव्र श्वसन रोगों (एआरआई) वाले 35 रोगियों में विकलांगता की अवधि (दिनों में) जिनका पहली तिमाही के दौरान स्थानीय चिकित्सक द्वारा इलाज किया गया था चालू वर्षथा: 6, 7, 5, 3, 9, 8, 7, 5, 6, 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6, 7 दिन।

    तीव्र श्वसन संक्रमण वाले रोगियों में विकलांगता की औसत अवधि निर्धारित करने की पद्धति इस प्रकार है:

    1. आइए एक भारित परिवर्ती श्रंखला का निर्माण करें, क्योंकि अलग-अलग प्रकार के मान कई बार दोहराए जाते हैं। ऐसा करने के लिए, आप सभी विकल्पों को उनकी संगत आवृत्तियों के साथ आरोही या अवरोही क्रम में व्यवस्थित कर सकते हैं।

    हमारे मामले में, विकल्प आरोही क्रम में हैं।

    2. सूत्र का उपयोग करके अंकगणितीय भारित औसत की गणना करें: M = Vp/n = 233/35 = 6.7 दिन

    विकलांगता की अवधि के अनुसार तीव्र श्वसन संक्रमण वाले रोगियों का वितरण:

    काम के लिए अक्षमता की अवधि (वी) रोगियों की संख्या (पी) वीपी
    p = n = 35 वीपी = 233

    निष्कर्ष। तीव्र श्वसन रोगों वाले रोगियों में विकलांगता की अवधि औसतन 6.7 दिन थी।

    मोड (मो) विविधता श्रृंखला में सबसे आम प्रकार है। तालिका में प्रस्तुत वितरण के लिए, मोड 10 के बराबर संस्करण से मेल खाता है, यह दूसरों की तुलना में अधिक बार होता है - 6 बार।

    ठहरने की अवधि के अनुसार रोगियों का वितरण अस्पताल का बिस्तर(दिनों में)

    वी
    पी

    कभी-कभी बहुलक का सटीक मान निर्धारित करना मुश्किल होता है, क्योंकि अध्ययन किए जा रहे डेटा में कई अवलोकन हो सकते हैं जो "सबसे अधिक बार" होते हैं।

    माध्यिका (Me) एक गैर-पैरामीट्रिक संकेतक है जो भिन्नता श्रृंखला को दो बराबर हिस्सों में विभाजित करता है: माध्यिका के दोनों ओर है वही नंबरविकल्प।

    उदाहरण के लिए, तालिका में दिखाए गए वितरण के लिए, माध्यिका 10 है क्योंकि इस मान के दोनों ओर 14वें विकल्प पर स्थित है, अर्थात्। नंबर 10 लेता है केंद्रीय स्थितिइस श्रृंखला में इसका माध्यिका है।

    यह देखते हुए कि इस उदाहरण में प्रेक्षणों की संख्या सम (n=34) है, माध्यिका निम्नानुसार निर्धारित की जा सकती है:

    मैं = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

    इसका अर्थ है कि श्रृंखला का मध्य सत्रहवें विकल्प पर पड़ता है, जो 10 के माध्यिका से मेल खाता है। तालिका में प्रस्तुत वितरण के लिए, अंकगणितीय माध्य है:

    एम = वीपी/एन = 334/34 = 10.1

    तो, तालिका से 34 टिप्पणियों के लिए। 8, हमें मिला: Mo=10, Me=10, समांतर माध्य (M) 10.1 है। हमारे उदाहरण में, तीनों संकेतक एक-दूसरे के बराबर या करीब निकले, हालांकि वे पूरी तरह से अलग हैं।

    अंकगणित माध्य सभी प्रभावों का परिणामी योग है; सभी प्रकार, बिना किसी अपवाद के, इसके गठन में भाग लेते हैं, जिसमें चरम वाले भी शामिल हैं, जो अक्सर किसी घटना या सेट के लिए असामान्य होते हैं।

    बहुलक और माध्यिका, अंकगणितीय माध्य के विपरीत, सभी के मान पर निर्भर नहीं करते हैं व्यक्तिगत मूल्यचर संकेत (चरम प्रकार के मूल्य और श्रृंखला के बिखरने की डिग्री)। अंकगणित माध्य प्रेक्षणों के पूरे द्रव्यमान की विशेषता है, बहुलक और माध्यिका थोक की विशेषता है

    विविधता श्रृंखला - एक श्रृंखला जिसमें उनकी तुलना की जाती है (आरोही या अवरोही क्रम में) विकल्पऔर उनके संबंधित आवृत्तियों

    वेरिएंट एक विशेषता के अलग-अलग मात्रात्मक अभिव्यक्ति हैं। मनोनीत लैटिन अक्षर वी . शास्त्रीय समझशब्द "संस्करण" का तात्पर्य है कि प्रत्येक अद्वितीय मूल्यदोहराव की संख्या की परवाह किए बिना सुविधा।

    उदाहरण के लिए, सिस्टोलिक के संकेतकों की विविधता श्रृंखला में रक्त चापदस रोगियों में मापा गया:

    110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

    केवल 6 मान विकल्प हैं:

    110, 120, 130, 140, 160, 170.

    फ़्रिक्वेंसी एक संख्या है जो दर्शाती है कि कोई विकल्प कितनी बार दोहराया जाता है। एक लैटिन अक्षर द्वारा निरूपित पी . सभी आवृत्तियों का योग (जो, निश्चित रूप से, सभी अध्ययन की संख्या के बराबर है) को इस प्रकार दर्शाया गया है एन.

      हमारे उदाहरण में, फ़्रीक्वेंसी निम्नलिखित मानों पर आधारित होगी:
    • वैरिएंट 110 फ़्रीक्वेंसी P = 1 के लिए (मान 110 एक मरीज़ में होता है),
    • वैरिएंट 120 फ़्रीक्वेंसी P = 2 के लिए (मान 120 दो रोगियों में होता है),
    • वैरिएंट के लिए 130 आवृत्ति पी = 3 (मूल्य 130 तीन रोगियों में होता है),
    • वैरिएंट 140 फ़्रीक्वेंसी P = 2 के लिए (मान 140 दो रोगियों में होता है),
    • संस्करण के लिए 160 आवृत्ति पी = 1 (मूल्य 160 एक रोगी में होता है),
    • संस्करण के लिए 170 आवृत्ति पी = 1 (मूल्य 170 एक रोगी में होता है),

    विविधता श्रृंखला के प्रकार:

    1. सरल- यह एक श्रृंखला है जिसमें प्रत्येक विकल्प केवल एक बार होता है (सभी आवृत्तियाँ 1 के बराबर होती हैं);
    2. निलंबित- एक श्रृंखला जिसमें एक या अधिक विकल्प बार-बार आते हैं।

    विविधता श्रृंखला का उपयोग संख्याओं के बड़े सरणियों का वर्णन करने के लिए किया जाता है; यह इस रूप में है कि बहुमत के एकत्रित डेटा को शुरू में प्रस्तुत किया जाता है। चिकित्सा अनुसंधान. भिन्नता श्रृंखला को चिह्नित करने के लिए, विशेष संकेतकों की गणना की जाती है, जिसमें औसत मूल्य, परिवर्तनशीलता के संकेतक (तथाकथित फैलाव), नमूना डेटा की प्रतिनिधित्वशीलता के संकेतक शामिल हैं।

    विविधता श्रृंखला संकेतक

    1) अंकगणित माध्य एक सामान्यीकरण संकेतक है जो अध्ययन किए गए गुण के आकार को दर्शाता है। अंकगणित माध्य को के रूप में दर्शाया गया है एम , औसत का सबसे सामान्य प्रकार है। अंकगणित माध्य की गणना अवलोकन की सभी इकाइयों के संकेतकों के मूल्यों के योग के अनुपात के रूप में की जाती है, जो सभी की जांच की जाती है। एक साधारण और भारित भिन्नता श्रृंखला के लिए अंकगणितीय माध्य की गणना करने की विधि भिन्न होती है।

    गणना के लिए सूत्र सरल अंकगणित माध्य:

    गणना के लिए सूत्र भारित अंकगणित माध्य:

    एम = (वी * पी) / एन

    2) मोड - विविधता श्रृंखला का एक और औसत मूल्य, सबसे अधिक बार-बार दोहराए जाने वाले संस्करण के अनुरूप। या, इसे अलग तरीके से रखने के लिए, यह वह विकल्प है जो उच्चतम आवृत्ति से मेल खाता है। के रूप में नामित एमओ . बहुलक की गणना केवल भारित श्रृंखला के लिए की जाती है, क्योंकि in सरल पंक्तियाँकोई भी विकल्प दोहराया नहीं जाता है और सभी आवृत्तियाँ एक के बराबर होती हैं।

    उदाहरण के लिए, हृदय गति मानों की विविधता श्रृंखला में:

    80, 84, 84, 86, 86, 86, 90, 94;

    मोड का मान 86 है, क्योंकि यह वैरिएंट 3 बार आता है, इसलिए इसकी आवृत्ति सबसे अधिक है।

    3) माध्यिका - विकल्प का मान, भिन्नता श्रृंखला को आधे में विभाजित करना: इसके दोनों ओर है समान संख्याविकल्प। माध्यिका, साथ ही अंकगणितीय माध्य और बहुलक, औसत मानों को संदर्भित करता है। के रूप में नामित मैं

    4) मानक विचलन (समानार्थी शब्द: मानक विचलन, सिग्मा विचलन, सिग्मा) - भिन्नता श्रृंखला की परिवर्तनशीलता का एक उपाय। यह एक अभिन्न संकेतक है जो एक प्रकार के विचलन के सभी मामलों को माध्य से जोड़ता है। वास्तव में, यह इस प्रश्न का उत्तर देता है: अंकगणित माध्य से विकल्प कितनी दूर और कितनी बार फैलते हैं। लक्षित ग्रीक अक्षर σ ("सिग्मा").

    जब जनसंख्या का आकार 30 इकाइयों से अधिक होता है, तो मानक विचलन की गणना निम्न सूत्र का उपयोग करके की जाती है:

    छोटी आबादी के लिए - 30 अवलोकन इकाइयां या उससे कम - मानक विचलन की गणना एक अलग सूत्र का उपयोग करके की जाती है:

    आइए विभिन्न नमूना मानों को कॉल करें विकल्पमूल्यों की एक श्रृंखला और निरूपित करें: एक्स 1 , एक्स 2,…. सबसे पहले, आइए बनाते हैं लेकरविकल्प, यानी उन्हें आरोही या अवरोही क्रम में व्यवस्थित करें। प्रत्येक विकल्प के लिए, अपने स्वयं के वजन का संकेत दिया जाता है, अर्थात। संख्या जो इस विकल्प के योगदान को दर्शाती है कुल जनसंख्या. आवृत्तियाँ या आवृत्तियाँ भार के रूप में कार्य करती हैं।

    आवृत्ति मैं विकल्प एक्स मैंएक संख्या कहलाती है जो यह दर्शाती है कि विचारित नमूना जनसंख्या में यह विकल्प कितनी बार आता है।

    आवृत्ति या सापेक्ष आवृत्ति मैं विकल्प एक्स मैंनंबर कहा जाता है अनुपात के बराबरसभी वेरिएंट की फ़्रीक्वेंसी के योग के लिए वेरिएंट की फ़्रीक्वेंसी। आवृत्ति से पता चलता है कि नमूना आबादी की इकाइयों के किस हिस्से में एक प्रकार दिया गया है।

    आरोही (या अवरोही) क्रम में लिखे गए उनके संगत भार (आवृत्तियों या आवृत्तियों) के साथ विकल्पों के क्रम को कहा जाता है परिवर्तनशील श्रृंखला.

    विभिन्न श्रृंखलाएं असतत और अंतराल हैं।

    एक असतत परिवर्तनशील श्रृंखला के लिए, विशेषता के बिंदु मान निर्दिष्ट किए जाते हैं, अंतराल श्रृंखला के लिए, विशेषता मान अंतराल के रूप में निर्दिष्ट होते हैं। विविधता श्रृंखला आवृत्तियों के वितरण को दिखा सकती है या सापेक्ष आवृत्तियों(आवृत्तियाँ), जिसके आधार पर प्रत्येक विकल्प के लिए मूल्य का संकेत दिया जाता है - आवृत्ति या आवृत्ति।

    आवृत्ति वितरण की असतत भिन्नता श्रृंखलाकी तरह लगता है:

    बारंबारता सूत्र द्वारा ज्ञात की जाती है, i = 1, 2,…, एम.

    वू 1 +वू 2 + … + वूएम = 1.

    उदाहरण 4.1. संख्याओं के दिए गए सेट के लिए

    4, 6, 6, 3, 4, 9, 6, 4, 6, 6

    असतत निर्माण विविधता श्रृंखलाआवृत्तियों और आवृत्तियों का वितरण।

    समाधान . जनसंख्या की मात्रा है एन= 10. असतत बारंबारता बंटन श्रृंखला का रूप होता है

    अंतराल श्रृंखला में रिकॉर्डिंग का एक समान रूप होता है।

    आवृत्ति वितरण की अंतराल भिन्नता श्रृंखलाके रूप में लिखा गया है:

    सभी आवृत्तियों का योग प्रेक्षणों की कुल संख्या के बराबर होता है, अर्थात। कुल मात्रा: एन = एन 1 +एन 2 + … + एनएम ।

    सापेक्ष आवृत्तियों (आवृत्तियों) के वितरण की अंतराल भिन्नता श्रृंखलाकी तरह लगता है:

    आवृत्ति सूत्र द्वारा ज्ञात की जाती है, i = 1, 2,…, एम.

    सभी आवृत्तियों का योग एक के बराबर है: वू 1 +वू 2 + … + वूएम = 1.

    अक्सर अभ्यास में, अंतराल श्रृंखला का उपयोग किया जाता है। यदि बहुत सारे सांख्यिकीय नमूना डेटा हैं और उनके मान मनमाने ढंग से एक दूसरे से भिन्न हैं छोटी राशि, तो इन आंकड़ों के लिए असतत श्रृंखला काफी बोझिल और असुविधाजनक होगी आगे का अन्वेषण. इस मामले में, डेटा ग्रुपिंग का उपयोग किया जाता है, अर्थात। विशेषता के सभी मूल्यों वाले अंतराल को कई आंशिक अंतरालों में विभाजित किया जाता है और प्रत्येक अंतराल के लिए आवृत्ति की गणना करके, एक अंतराल श्रृंखला प्राप्त की जाती है। आइए, यह मानते हुए कि आंशिक अंतरालों की लंबाई समान होगी, हम एक अंतराल श्रृंखला के निर्माण की योजना को और अधिक विस्तार से लिखेंगे।

    2.2 अंतराल श्रृंखला का निर्माण

    एक अंतराल श्रृंखला बनाने के लिए, आपको चाहिए:

    अंतराल की संख्या निर्धारित करें;

    अंतराल की लंबाई निर्धारित करें;

    अक्ष पर अंतराल का स्थान निर्धारित करें।

    निर्धारण के लिए अंतराल की संख्या एक स्टर्गेस सूत्र है, जिसके अनुसार

    ,

    कहाँ पे एन- कुल की मात्रा।

    उदाहरण के लिए, यदि 100 विशेषता मान (संस्करण) हैं, तो अंतराल श्रृंखला के निर्माण के लिए अंतरालों की संख्या को अंतराल के बराबर लेने की अनुशंसा की जाती है।

    हालांकि, अभ्यास में अक्सर शोधकर्ता द्वारा अंतराल की संख्या को चुना जाता है, यह देखते हुए कि यह संख्या बहुत बड़ी नहीं होनी चाहिए, ताकि श्रृंखला बोझिल न हो, लेकिन बहुत छोटी भी न हो, ताकि कुछ गुणों को न खोएं वितरण।

    अंतराल लंबाई एच निम्नलिखित सूत्र द्वारा निर्धारित किया जाता है:

    ,

    कहाँ पे एक्सअधिकतम और एक्सन्यूनतम सबसे बड़ा और सबसे अधिक है छोटा मूल्यविकल्प।

    मूल्य बुलाया बड़े पैमाने परपंक्ति।

    अंतरालों को स्वयं बनाने के लिए, वे अलग-अलग तरीकों से आगे बढ़ते हैं। सबसे ज्यादा सरल तरीकेइस प्रकार है। मान को पहले अंतराल की शुरुआत के रूप में लिया जाता है
    . फिर अंतरालों की शेष सीमाएँ सूत्र द्वारा ज्ञात की जाती हैं। जाहिर है, अंतिम अंतराल का अंत एकएम + 1 को शर्त को पूरा करना चाहिए

    अंतराल की सभी सीमाएँ मिल जाने के बाद, इन अंतरालों की आवृत्तियाँ (या आवृत्तियाँ) निर्धारित की जाती हैं। इस समस्या को हल करने के लिए, वे सभी विकल्पों को देखते हैं और एक विशेष अंतराल में आने वाले विकल्पों की संख्या निर्धारित करते हैं। पूर्ण निर्माणआइए एक उदाहरण का उपयोग करते हुए एक अंतराल श्रृंखला को देखें।

    उदाहरण 4.2. आरोही क्रम में लिखे गए निम्नलिखित आँकड़ों के लिए, 5 के बराबर अंतरालों की संख्या के साथ एक अंतराल श्रृंखला बनाएँ:

    11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

    समाधान। कुल एन= 50 भिन्न मान।

    अंतराल की संख्या समस्या की स्थिति में निर्दिष्ट है, अर्थात। =5.

    अंतराल की लंबाई है
    .

    आइए अंतराल की सीमाओं को परिभाषित करें:

    एक 1 = 11 − 8,5 = 2,5; एक 2 = 2,5 + 17 = 19,5; एक 3 = 19,5 + 17 = 36,5;

    एक 4 = 36,5 + 17 = 53,5; एक 5 = 53,5 + 17 = 70,5; एक 6 = 70,5 + 17 = 87,5;

    एक 7 = 87,5 +17 = 104,5.

    अंतराल की आवृत्ति निर्धारित करने के लिए, हम इस अंतराल में आने वाले विकल्पों की संख्या की गणना करते हैं। उदाहरण के लिए, विकल्प 11, 12, 12, 14, 14, 15 पहले अंतराल में 2.5 से 19.5 तक आते हैं। उनकी संख्या 6 है, इसलिए, पहले अंतराल की आवृत्ति है एन 1=6. पहले अंतराल की आवृत्ति है . वेरिएंट 21, 21, 22, 23, 25, जिनकी संख्या 5 है, दूसरे अंतराल में 19.5 से 36.5 तक आते हैं। इसलिए, दूसरे अंतराल की आवृत्ति है एन 2 =5, और बारंबारता . सभी अंतरालों के लिए समान आवृत्तियों और आवृत्तियों को प्राप्त करने के बाद, हम निम्नलिखित अंतराल श्रृंखला प्राप्त करते हैं।

    आवृत्ति वितरण की अंतराल श्रृंखला का रूप है:

    आवृत्तियों का योग 6+5+9+11+8+11=50 है।

    आवृत्ति वितरण की अंतराल श्रृंखला का रूप है:

    आवृत्तियों का योग 0.12+0.1+0.18+0.22+0.16+0.22=1 है। मैं

    अंतराल श्रृंखला का निर्माण करते समय, विचाराधीन समस्या की विशिष्ट स्थितियों के आधार पर, अन्य नियम लागू किए जा सकते हैं, अर्थात्

    1. अंतराल भिन्नता श्रृंखला में आंशिक अंतराल शामिल हो सकते हैं अलग लंबाई. अंतराल की असमान लंबाई एक विशेषता के असमान वितरण के साथ एक सांख्यिकीय आबादी के गुणों को अलग करना संभव बनाती है। उदाहरण के लिए, यदि अंतराल की सीमाएं शहरों में निवासियों की संख्या निर्धारित करती हैं, तो इस समस्या में अंतराल का उपयोग करने की सलाह दी जाती है जो लंबाई में असमान हैं। जाहिर है कि इसके लिए बड़े शहरमायने रखता है और कोई बड़ा अंतर नहींनिवासियों की संख्या में, और बड़े शहरों के लिए दसियों और सैकड़ों निवासियों में अंतर महत्वपूर्ण नहीं है। अंतराल श्रृंखलाआंशिक अंतराल की असमान लंबाई के साथ मुख्य रूप से अध्ययन किया जाता है सामान्य सिद्धांतसांख्यिकी और उनका विचार इस मैनुअल के दायरे से बाहर है।

    2. इन गणितीय सांख्यिकीकभी-कभी अंतराल श्रृंखला पर विचार किया जाता है, जिसके लिए पहले अंतराल की बाईं सीमा -∞ के बराबर मानी जाती है, और अंतिम अंतराल की दाहिनी सीमा +∞ होती है। यह लाने के लिए किया जाता है सांख्यिकीय वितरणसैद्धांतिक को।

    3. अंतराल श्रृंखला का निर्माण करते समय, यह पता चल सकता है कि कुछ प्रकार का मान अंतराल सीमा के साथ बिल्कुल मेल खाता है। इस मामले में करने के लिए सबसे अच्छी बात इस प्रकार है। यदि ऐसा केवल एक ही संयोग है, तो विचार करें कि इसकी आवृत्ति के साथ विचाराधीन संस्करण अंतराल श्रृंखला के मध्य के करीब स्थित अंतराल में गिर गया है, यदि ऐसे कई प्रकार हैं, तो उन सभी को अंतराल को सौंपा गया है इन प्रकार के दाईं ओर, या सभी बाईं ओर।

    4. अंतरालों की संख्या और उनकी लंबाई निर्धारित करने के बाद, अंतरालों का स्थान दूसरे तरीके से किया जा सकता है। विकल्पों के सभी माने गए मानों का अंकगणितीय माध्य ज्ञात कीजिए एक्ससीएफ और पहले अंतराल का निर्माण इस तरह से करें कि यह नमूना माध्य कुछ अंतराल के अंदर हो। इस प्रकार, हम अंतराल प्राप्त करते हैं एक्ससीएफ - 0.5 एचइससे पहले एक्सऔसत + 0.5 एच. फिर बाएँ और दाएँ, अंतराल की लंबाई को जोड़ते हुए, हम शेष अंतरालों को तब तक बनाते हैं जब तक एक्समिनट और एक्समैक्स क्रमशः पहले और अंतिम अंतराल में नहीं आएगा।

    5. अंतराल श्रृंखला के लिए बड़ी संख्याअंतराल को लंबवत रूप से लिखना सुविधाजनक है, अर्थात। अंतराल को पहली पंक्ति में नहीं, बल्कि पहले कॉलम में और दूसरे कॉलम में आवृत्तियों (या आवृत्तियों) को रिकॉर्ड करें।

    नमूना डेटा को कुछ यादृच्छिक चर के मान के रूप में माना जा सकता है एक्स. एक यादृच्छिक चर का अपना वितरण नियम होता है। यह संभाव्यता सिद्धांत से जाना जाता है कि एक असतत यादृच्छिक चर के वितरण के नियम को वितरण श्रृंखला के रूप में निर्दिष्ट किया जा सकता है, और निरंतर एक के लिए, वितरण घनत्व फ़ंक्शन का उपयोग करके। हालांकि, एक सार्वभौमिक वितरण कानून है जो असतत और निरंतर यादृच्छिक चर दोनों के लिए है। यह वितरण नियम वितरण फलन के रूप में दिया गया है एफ(एक्स) = पी(एक्स<एक्स) नमूना डेटा के लिए, आप वितरण फ़ंक्शन का एक एनालॉग निर्दिष्ट कर सकते हैं - अनुभवजन्य वितरण फ़ंक्शन।


    इसी तरह की जानकारी।