असतत श्रृंखला ऑनलाइन। निरंतर मात्रात्मक डेटा के लिए अंतराल भिन्नता श्रृंखला का निर्माण

प्रयोगशाला कार्य №1। सांख्यिकीय डेटा का प्राथमिक प्रसंस्करण

वितरण श्रृंखला का निर्माण

किसी एक विशेषता के अनुसार समूहों में जनसंख्या इकाइयों का क्रमबद्ध वितरण कहलाता है वितरण के निकट . इस स्थिति में, चिह्न मात्रात्मक दोनों हो सकता है, तो श्रृंखला कहलाती है परिवर्तन संबंधी , और गुणात्मक, तब श्रृंखला कहलाती है ठहराव . इसलिए, उदाहरण के लिए, एक शहर की आबादी को एक विविधता श्रृंखला में आयु समूहों के अनुसार, या एक विशेषता श्रृंखला में पेशेवर संबद्धता के अनुसार वितरित किया जा सकता है (बेशक, वितरण श्रृंखला के निर्माण के लिए कई और गुणात्मक और मात्रात्मक विशेषताएं प्रस्तावित की जा सकती हैं, विशेषता का चुनाव सांख्यिकीय अनुसंधान के कार्य द्वारा निर्धारित किया जाता है)।

कोई भी वितरण श्रृंखला दो तत्वों की विशेषता होती है:

- विकल्प(एक्स मैं) - ये नमूना जनसंख्या की इकाइयों की विशेषता के व्यक्तिगत मूल्य हैं। वैरिएबल सीरीज़ के लिए, वैरिएंट संख्यात्मक मान लेता है, एक एट्रिब्यूटिव सीरीज़ के लिए - गुणात्मक वाले (उदाहरण के लिए, x = "सिविल सर्वेंट");

- आवृत्ति(एन मैं) एक संख्या है जो दर्शाती है कि यह या वह विशेषता मान कितनी बार आता है। यदि आवृत्ति को एक सापेक्ष संख्या के रूप में व्यक्त किया जाता है (अर्थात, जनसंख्या के कुल आयतन में विकल्पों के दिए गए मान के अनुरूप जनसंख्या तत्वों का अनुपात), तो इसे कहा जाता है सापेक्ष आवृत्तिया आवृत्ति.

विविधता श्रृंखला हो सकती है:

- अलगजब अध्ययन के तहत विशेषता एक निश्चित संख्या (आमतौर पर एक पूर्णांक) की विशेषता होती है।

- मध्यान्तरजब एक सतत परिवर्तनशील विशेषता के लिए "से" और "से" की सीमाओं को परिभाषित किया जाता है। एक अंतराल श्रृंखला भी बनाई जाती है यदि असतत रूप से चर विशेषता के मूल्यों का सेट बड़ा है।

एक अंतराल श्रृंखला समान लंबाई (समान अंतराल श्रृंखला) और असमान अंतराल के साथ दोनों के साथ बनाई जा सकती है, यदि यह सांख्यिकीय अध्ययन की शर्तों से निर्धारित होती है। उदाहरण के लिए, निम्नलिखित अंतरालों के साथ जनसंख्या के आय वितरण की एक श्रृंखला पर विचार किया जा सकता है:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



जहाँ k अंतरालों की संख्या है, n नमूना आकार है। (बेशक, सूत्र आमतौर पर एक भिन्नात्मक संख्या देता है, और परिणामी संख्या के निकटतम पूर्णांक को अंतरालों की संख्या के रूप में चुना जाता है।) इस मामले में अंतराल की लंबाई सूत्र द्वारा निर्धारित की जाती है।

.

आलेखीय रूप से, परिवर्तनशील श्रृंखला को इस प्रकार दर्शाया जा सकता है आयतचित्र(इस अंतराल में आवृत्ति के अनुरूप ऊंचाई का एक "स्तंभ" अंतराल श्रृंखला के प्रत्येक अंतराल के ऊपर बनाया गया है), वितरण क्षेत्र(टूटी हुई रेखा जोड़ने वाले बिंदु ( एक्स मैं;मैं) या संचयी(संचित आवृत्तियों के अनुसार निर्मित, यानी विशेषता के प्रत्येक मूल्य के लिए, वस्तुओं के सेट में घटना की आवृत्ति दी गई विशेषता से कम मूल्य के साथ ली जाती है)।

एक्सेल में काम करते समय, वेरिएबल सीरीज बनाने के लिए निम्नलिखित कार्यों का उपयोग किया जा सकता है:

जाँच करना( डेटा सरणी) - नमूना आकार निर्धारित करने के लिए। तर्क उन कक्षों की श्रेणी है जिनमें नमूना डेटा होता है।

काउंटिफ( श्रेणी; मापदंड) - एक विशेषता या भिन्नता श्रृंखला बनाने के लिए इस्तेमाल किया जा सकता है। तर्क विशेषता नमूना मान सरणी और मानदंड की श्रेणी हैं - विशेषता का संख्यात्मक या पाठ मान या सेल की संख्या जिसमें यह स्थित है। परिणाम नमूने में उस मान के घटित होने की आवृत्ति है।

आवृत्ति( डेटा सरणी; अंतराल सरणी) - एक परिवर्तनशील श्रृंखला बनाने के लिए। तर्क नमूना डेटा सरणी की श्रेणी और अंतराल के स्तंभ हैं। यदि एक असतत श्रृंखला बनाने की आवश्यकता है, तो विकल्पों के मूल्यों को यहां इंगित किया गया है, यदि यह अंतराल है, तो अंतराल की ऊपरी सीमाएं (उन्हें "जेब" भी कहा जाता है)। चूंकि परिणाम आवृत्तियों का एक स्तंभ है, फ़ंक्शन का परिचय CTRL+SHIFT+ENTER कुंजी संयोजन दबाकर पूरा किया जाना चाहिए। ध्यान दें कि किसी फ़ंक्शन को शुरू करते समय अंतराल की एक सरणी सेट करते समय, इसमें अंतिम मान छोड़ा जा सकता है - सभी मान जो पिछले "जेब" में नहीं आते हैं, उन्हें संबंधित "पॉकेट" में रखा जाएगा। यह कभी-कभी त्रुटि से बचने में मदद करता है कि सबसे बड़ा नमूना मान स्वचालित रूप से अंतिम "जेब" में नहीं रखा जाता है।

इसके अलावा, जटिल समूहों (कई मानदंडों के अनुसार) के लिए, "पिवट टेबल" टूल का उपयोग किया जाता है। उनका उपयोग विशेषता और भिन्नता श्रृंखला बनाने के लिए भी किया जा सकता है, लेकिन यह अनावश्यक रूप से कार्य को जटिल बनाता है। इसके अलावा, एक विविधता श्रृंखला और एक हिस्टोग्राम बनाने के लिए, "विश्लेषण पैकेज" ऐड-इन से एक "हिस्टोग्राम" प्रक्रिया है (एक्सेल में ऐड-इन्स का उपयोग करने के लिए, आपको पहले उन्हें डाउनलोड करना होगा, वे डिफ़ॉल्ट रूप से स्थापित नहीं हैं)

हम निम्नलिखित उदाहरणों के साथ प्राथमिक डेटा प्रोसेसिंग की प्रक्रिया का वर्णन करते हैं।

उदाहरण 1.1. 60 परिवारों की मात्रात्मक संरचना पर आंकड़े हैं।

एक विविधता श्रृंखला और एक वितरण बहुभुज बनाएँ

फेसला.

आइए एक्सेल स्प्रेडशीट खोलें। आइए A1:L5 श्रेणी में डेटा की एक सरणी दर्ज करें। यदि आप इलेक्ट्रॉनिक रूप में एक दस्तावेज़ का अध्ययन कर रहे हैं (उदाहरण के लिए, वर्ड प्रारूप में), तो आपको केवल डेटा के साथ एक तालिका का चयन करना है और इसे क्लिपबोर्ड पर कॉपी करना है, फिर सेल ए 1 का चयन करें और डेटा पेस्ट करें - वे स्वचालित रूप से कब्जा कर लेंगे उपयुक्त सीमा। आइए नमूना आकार n - नमूना डेटा की संख्या की गणना करें, इसके लिए सेल B7 में, सूत्र = COUNT (A1: L5) दर्ज करें। ध्यान दें कि सूत्र में वांछित श्रेणी दर्ज करने के लिए, कीबोर्ड से इसका पदनाम दर्ज करना आवश्यक नहीं है, इसे चुनने के लिए पर्याप्त है। आइए सेल B8 में सूत्र =MIN(A1:L5) और सेल B9: =MAX(A1:L5) में सूत्र दर्ज करके नमूने में न्यूनतम और अधिकतम मान निर्धारित करें।

Fig.1.1 उदाहरण 1. एक्सेल टेबल में सांख्यिकीय डेटा का प्राथमिक प्रसंस्करण

इसके बाद, अंतराल कॉलम (वैरिएंट मान) और फ़्रीक्वेंसी कॉलम के नाम दर्ज करके भिन्नता श्रृंखला बनाने के लिए एक तालिका तैयार करते हैं। अंतराल के कॉलम में, न्यूनतम (1) से अधिकतम (6) तक विशेषता के मान दर्ज करें, जो कि सीमा B12:B17 पर कब्जा कर रहा है। फ़्रीक्वेंसी कॉलम चुनें, सूत्र दर्ज करें =FREQUENCY(A1:L5;B12:B17) और कुंजी संयोजन CTRL+SHIFT+ENTER दबाएँ

Fig.1.2 उदाहरण 1. एक भिन्नता श्रृंखला का निर्माण

नियंत्रण के लिए, हम SUM फ़ंक्शन (होम टैब पर संपादन समूह में फ़ंक्शन आइकन S) का उपयोग करके आवृत्तियों के योग की गणना करते हैं, परिकलित योग सेल B7 में पहले परिकलित नमूना आकार से मेल खाना चाहिए।

अब एक बहुभुज बनाते हैं: परिणामी आवृत्ति रेंज का चयन करने के बाद, "सम्मिलित करें" टैब पर "ग्राफ" कमांड का चयन करें। डिफ़ॉल्ट रूप से, क्षैतिज अक्ष पर मान क्रमिक संख्याएँ होंगी - हमारे मामले में, 1 से 6 तक, जो विकल्पों के मूल्यों (टैरिफ श्रेणियों की संख्या) के साथ मेल खाती है।

चार्ट की श्रृंखला का नाम "श्रृंखला 1" या तो "डिज़ाइनर" टैब पर उसी "चयन डेटा" विकल्प का उपयोग करके बदला जा सकता है, या बस हटा दिया जा सकता है।

चित्र.1.3. उदाहरण 1. एक बारंबारता बहुभुज बनाना

उदाहरण 1.2. 50 स्रोतों से प्रदूषक उत्सर्जन पर डेटा उपलब्ध है:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

एक समान अंतराल श्रृंखला संकलित करें, एक हिस्टोग्राम बनाएं

फेसला

आइए एक्सेल शीट में डेटा की एक सरणी जोड़ें, यह A1:J5 की सीमा पर कब्जा कर लेगा, जैसा कि पिछले कार्य में, हम नमूना आकार n, नमूने में न्यूनतम और अधिकतम मान निर्धारित करेंगे। चूंकि अब हमें असतत नहीं, बल्कि एक अंतराल श्रृंखला की आवश्यकता है, और समस्या में अंतरालों की संख्या निर्दिष्ट नहीं है, हम स्टर्गेस सूत्र का उपयोग करके अंतराल k की संख्या की गणना करते हैं। ऐसा करने के लिए, सेल B10 में, सूत्र =1+3.322*LOG10(B7) दर्ज करें।

चित्र 1.4। उदाहरण 2. एक समान अंतराल श्रृंखला की रचना

परिणामी मान एक पूर्णांक नहीं है, यह लगभग 6.64 है। चूंकि k=7 के लिए अंतराल की लंबाई एक पूर्णांक के रूप में व्यक्त की जाएगी (k=6 के मामले के विपरीत), हम सेल C10 में इस मान को दर्ज करके k=7 चुनेंगे। हम सूत्र = (B9-B8) / C10 दर्ज करके सेल B11 में अंतराल d की लंबाई की गणना करते हैं।

आइए अंतराल की एक सरणी को परिभाषित करें, प्रत्येक 7 अंतराल के लिए ऊपरी सीमा निर्दिष्ट करें। ऐसा करने के लिए, सेल E8 में, सूत्र दर्ज करके पहले अंतराल की ऊपरी सीमा की गणना करें =B8+B11; सेल E9 में सूत्र दर्ज करके दूसरे अंतराल की ऊपरी सीमा =E8+B11. अंतराल की ऊपरी सीमा के शेष मूल्यों की गणना करने के लिए, हम $ चिह्न का उपयोग करके दर्ज सूत्र में सेल B11 की संख्या को ठीक करते हैं, ताकि सेल E9 में सूत्र बन जाए =E8+B$11, और की सामग्री की प्रतिलिपि बनाएँ सेल E9 से सेल E10-E14। प्राप्त अंतिम मान सेल B9 में पहले परिकलित नमूने में अधिकतम मान के बराबर है।

चित्र.1.5। उदाहरण 2. एक समान अंतराल श्रृंखला की रचना


अब FREQUENCY फ़ंक्शन का उपयोग करके "जेब" की सरणी भरें, जैसा कि उदाहरण 1 में किया गया था।

चित्र 1.6. उदाहरण 2. एक समान अंतराल श्रृंखला की रचना

परिणामी परिवर्तनशील श्रृंखला के आधार पर, हम एक हिस्टोग्राम बनाएंगे: आवृत्ति कॉलम का चयन करें और "इन्सर्ट" टैब पर "हिस्टोग्राम" चुनें। हिस्टोग्राम प्राप्त करने के बाद, हम इसमें क्षैतिज अक्ष के लेबल को अंतराल की सीमा में मानों में बदल देंगे, इसके लिए हम "डिज़ाइनर" टैब के "डेटा का चयन करें" विकल्प का चयन करते हैं। दिखाई देने वाली विंडो में, "क्षैतिज अक्ष लेबल" अनुभाग के लिए "बदलें" कमांड का चयन करें और इसे "माउस" के साथ चुनकर मानों की श्रेणी दर्ज करें।

चित्र 1.7। उदाहरण 2. एक हिस्टोग्राम बनाना

चित्र 1.8। उदाहरण 2. एक हिस्टोग्राम बनाना

असतत विशेषताओं के लिए एक असतत परिवर्तनशील श्रृंखला का निर्माण किया जाता है।

असतत भिन्नता श्रृंखला बनाने के लिए, आपको निम्नलिखित करने की आवश्यकता है: 1) अवलोकन की इकाइयों को अध्ययन किए गए विशेषता मान के आरोही क्रम में क्रमबद्ध करें,

2) विशेषता x i के सभी संभावित मान निर्धारित करें, उन्हें आरोही क्रम में क्रमबद्ध करें,

साइन वैल्यू, मैं .

सुविधा मूल्य आवृत्ति और निरूपित करें एफ मैं . श्रृंखला की सभी आवृत्तियों का योग अध्ययन की गई जनसंख्या में तत्वों की संख्या के बराबर होता है।

उदाहरण 1 .

परीक्षा में छात्रों द्वारा प्राप्त ग्रेड की सूची: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

यहाँ नंबर एक्स - श्रेणीएक असतत यादृच्छिक चर है, और अनुमानों की परिणामी सूची हैसांख्यिकीय (मनाया गया) डेटा .

    अवलोकन की इकाइयों को विशेषता के अध्ययनित मूल्य के आरोही क्रम में क्रमित करें:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) विशेषता x i के सभी संभावित मान निर्धारित करें, उन्हें आरोही क्रम में क्रमबद्ध करें:

इस उदाहरण में, सभी अंकों को निम्नलिखित मानों के साथ चार समूहों में विभाजित किया जा सकता है: 2; 3; 4; 5.

प्रेक्षित डेटा के एक अलग समूह के संगत यादृच्छिक चर का मान कहलाता है साइन वैल्यू, संस्करण (विकल्प) और नामित करें x मैं .

वह संख्या जो यह दर्शाती है कि प्रेक्षणों की एक श्रृंखला में संगत विशेषता मान कितनी बार आता है, कहलाती है सुविधा मूल्य आवृत्ति और निरूपित करें एफ मैं .

हमारे उदाहरण के लिए

स्कोर 2 होता है - 8 बार,

स्कोर 3 होता है - 12 बार,

स्कोर 4 होता है - 23 बार,

स्कोर 5 होता है - 17 बार।

कुल 60 रेटिंग हैं।

4) प्राप्त डेटा को दो पंक्तियों (कॉलम) - x i और f i की तालिका में लिखें।

इन आंकड़ों के आधार पर, एक असतत परिवर्तनशील श्रृंखला का निर्माण संभव है

असतत भिन्नता श्रृंखला - यह एक तालिका है जिसमें अध्ययन किए गए गुण के होने वाले मूल्यों को आरोही क्रम में अलग-अलग मूल्यों और उनकी आवृत्तियों के रूप में दर्शाया जाता है

  1. अंतराल भिन्नता श्रृंखला का निर्माण

एक असतत परिवर्तनशील श्रृंखला के अलावा, अक्सर अंतराल परिवर्तनशील श्रृंखला के रूप में डेटा को समूहीकृत करने का एक तरीका होता है।

एक अंतराल श्रृंखला बनाई जाती है यदि:

    संकेत में परिवर्तन की निरंतर प्रकृति है;

    बहुत सारे असतत मूल्य हैं (10 से अधिक)

    असतत मूल्यों की आवृत्तियाँ बहुत छोटी हैं (अपेक्षाकृत बड़ी संख्या में अवलोकन इकाइयों के साथ 1-3 से अधिक नहीं);

    एक ही आवृत्ति के साथ एक विशेषता के कई असतत मूल्य।

एक अंतराल भिन्नता श्रृंखला एक तालिका के रूप में डेटा को समूहीकृत करने का एक तरीका है जिसमें दो कॉलम होते हैं (मूल्यों के अंतराल के रूप में विशेषता मान और प्रत्येक अंतराल की आवृत्ति)।

एक असतत श्रृंखला के विपरीत, एक अंतराल श्रृंखला की विशेषता के मूल्यों को व्यक्तिगत मूल्यों द्वारा नहीं, बल्कि मूल्यों के अंतराल ("से - से") द्वारा दर्शाया जाता है।

वह संख्या जो दर्शाती है कि प्रत्येक चयनित अंतराल में कितनी अवलोकन इकाइयाँ गिरीं, कहलाती हैं सुविधा मूल्य आवृत्ति और निरूपित करें एफ मैं . श्रृंखला की सभी आवृत्तियों का योग अध्ययन की गई जनसंख्या में तत्वों (अवलोकन इकाइयों) की संख्या के बराबर है।

यदि किसी इकाई में अंतराल की ऊपरी सीमा के मान के बराबर एक विशेषता मान है, तो उसे अगले अंतराल के लिए संदर्भित किया जाना चाहिए।

उदाहरण के लिए, 100 सेमी की ऊंचाई वाला बच्चा दूसरे अंतराल में गिरेगा, न कि पहले में; और 130 सेमी की ऊंचाई वाला बच्चा अंतिम अंतराल में गिरेगा, न कि तीसरे में।

इन आँकड़ों के आधार पर अंतराल भिन्नता श्रृंखला बनाना संभव है।

प्रत्येक अंतराल की एक निचली सीमा (x n), एक ऊपरी सीमा (x इंच) और एक अंतराल चौड़ाई ( मैं).

अंतराल सीमा एक विशेषता मान है जो दो अंतरालों की सीमा पर स्थित है।

बच्चों की ऊंचाई (सेमी)

बच्चों की ऊंचाई (सेमी)

बच्चों की राशि

130 . से अधिक

यदि किसी अंतराल की ऊपरी और निचली सीमा होती है, तो उसे कहते हैं बंद अंतराल. यदि अंतराल में केवल निचली या केवल ऊपरी सीमा है, तो यह है - खुला अंतराल।केवल पहला या अंतिम अंतराल ही खुला हो सकता है। उपरोक्त उदाहरण में, अंतिम अंतराल खुला है।

अंतराल चौड़ाई (मैं) ऊपरी और निचली सीमा के बीच का अंतर है।

मैं = एक्स एन - एक्स इंच

एक खुले अंतराल की चौड़ाई को आसन्न बंद अंतराल की चौड़ाई के समान माना जाता है।

बच्चों की ऊंचाई (सेमी)

बच्चों की राशि

अंतराल चौड़ाई (i)

गणना के लिए 130+20=150

20 (क्योंकि आसन्न बंद अंतराल की चौड़ाई 20 है)

सभी अंतराल श्रृंखलाओं को समान अंतराल वाली अंतराल श्रृंखला और असमान अंतराल वाली अंतराल श्रृंखला में विभाजित किया जाता है। . समान अंतराल वाली अंतराल पंक्तियों में, सभी अंतरालों की चौड़ाई समान होती है। असमान अंतरालों वाली अंतराल श्रृंखला में, अंतरालों की चौड़ाई भिन्न होती है।

इस उदाहरण में, असमान अंतरालों वाली एक अंतराल श्रृंखला।

उच्च व्यावसायिक शिक्षा

"लोगों की अर्थव्यवस्था की रूसी अकादमी और

राष्ट्रपति के अधीन सिविल सेवा

रूसी संघ"

(कलुगा शाखा)

प्राकृतिक विज्ञान और गणितीय अनुशासन विभाग

परीक्षण

विषय "सांख्यिकी"

छात्र ___ मेबोरोडा गैलिना युरेविना ______

पत्राचार विभाग संकाय राज्य और नगरपालिका प्रबंधन समूह G-12-V

व्याख्याता ____________ हैमर जी.वी.

पीएचडी, एसोसिएट प्रोफेसर

कलुगा-2013

कार्य 1।

कार्य 1.1. 4

कार्य 1.2. सोलह

कार्य 1.3. 24

कार्य 1.4. 33

कार्य 2.

कार्य 2.1. 43

कार्य 2.2. 48

कार्य 2.3. 53

कार्य 2.4. 58

कार्य 3.

कार्य 3.1. 63

कार्य 3.2. 68

कार्य 3.3। 73

कार्य 3.4. 79

कार्य 4.

समस्या 4.1. 85

कार्य 4.2. 88

कार्य 4.3। 90

कार्य 4.4। 93

प्रयुक्त स्रोतों की सूची। 96

कार्य 1।

कार्य 1.1.

क्षेत्र के उद्यमों द्वारा उत्पादन और लाभ की मात्रा पर निम्नलिखित डेटा हैं (तालिका 1)।

तालिका नंबर एक

उत्पादन उत्पादन और उद्यमों द्वारा लाभ की मात्रा पर डेटा

कंपनी संख्या आउटपुट, मिलियन रूबल लाभ, मिलियन रूबल कंपनी संख्या आउटपुट, मिलियन रूबल लाभ, मिलियन रूबल
63,0 6,7 56,0 7,2
48,0 6,2 81,0 9,6
39,0 6,5 55,0 6,3
28,0 3,0 76,0 9,1
72,0 8,2 54,0 6,0
61,0 7,6 53,0 6,4
47,0 5,9 68,0 8,5
37,0 4,2 52,0 6,5
25,0 2,8 44,0 5,0
60,0 7,9 51,0 6,4
46,0 5,5 50,0 5,8
34,0 3,8 65,0 6,7
21,0 2,1 49,0 6,1
58,0 8,0 42,0 4,8
45,0 5,7 32,0 4,6

मूल डेटा के अनुसार:

1. समान अंतराल पर पांच समूह बनाकर उत्पादन द्वारा उद्यमों के वितरण की एक सांख्यिकीय श्रृंखला बनाएं।

वितरण श्रृंखला ग्राफ़ बनाएँ: बहुभुज, हिस्टोग्राम, संचयी। बहुलक और माध्यिका का मान आलेखीय रूप से ज्ञात कीजिए।

2. आउटपुट द्वारा उद्यमों के वितरण की एक श्रृंखला की विशेषताओं की गणना करें: अंकगणितीय माध्य, फैलाव, मानक विचलन, भिन्नता का गुणांक।

निष्कर्ष निकालें।

3. विश्लेषणात्मक समूहन की विधि का उपयोग करते हुए, निर्मित उत्पादों की लागत और प्रति उद्यम लाभ की मात्रा के बीच सहसंबंध की उपस्थिति और प्रकृति को स्थापित करें।

4. अनुभवजन्य सहसंबंध द्वारा उत्पादन की लागत और लाभ की मात्रा के बीच संबंध की जकड़न को मापें।

सामान्य निष्कर्ष निकालें।

फेसला:

आइए वितरण की एक सांख्यिकीय श्रृंखला बनाएं

एक अंतराल भिन्नता श्रृंखला का निर्माण करने के लिए जो उत्पादन के संदर्भ में उद्यमों के वितरण की विशेषता है, श्रृंखला के अंतराल के मूल्य और सीमाओं की गणना करना आवश्यक है।

समान अंतरालों वाली एक श्रृंखला की रचना करते समय, अंतराल का मान एचसूत्र द्वारा निर्धारित किया जाता है:

एक्स मैक्सऔर एक्स मिनट- उद्यमों के अध्ययन किए गए सेट में विशेषता का सबसे बड़ा और सबसे छोटा मूल्य;

- अंतराल श्रृंखला समूहों की संख्या।

समूहों की संख्या असाइनमेंट में निर्दिष्ट। = 5.

एक्स मैक्स= 81 मिलियन रूबल, एक्स मिनट= 21 मिलियन रूबल

अंतराल मूल्य की गणना:

मिलियन रूबल

अंतराल एच = 12 मिलियन रूबल के मूल्य को क्रमिक रूप से जोड़कर। अंतराल की निचली सीमा तक, हम निम्नलिखित समूह प्राप्त करते हैं:

1 समूह: 21 - 33 मिलियन रूबल।

2 समूह: 33 - 45 मिलियन रूबल;

समूह 3: 45 - 57 मिलियन रूबल।

समूह 4: 57 - 69 मिलियन रूबल।

समूह 5: 69 - 81 मिलियन रूबल।

अंतराल श्रृंखला के निर्माण के लिए, प्रत्येक समूह में शामिल उद्यमों की संख्या की गणना करना आवश्यक है ( समूह आवृत्तियों).

आउटपुट वॉल्यूम द्वारा उद्यमों को समूहित करने की प्रक्रिया सहायक तालिका 2 में प्रस्तुत की गई है। इस तालिका के कॉलम 4 को एक विश्लेषणात्मक समूह (कार्य का पैराग्राफ 3) बनाने के लिए आवश्यक है।

तालिका 2

एक अंतराल वितरण श्रृंखला के निर्माण के लिए तालिका और

विश्लेषणात्मक समूहन

उत्पादन द्वारा उद्यमों के समूह, मिलियन रूबल कंपनी संख्या आउटपुट, मिलियन रूबल लाभ, मिलियन रूबल
21-33 21,0 2,1
25,0 2,8
28,0 3,0
32,0 4,6
कुल 106,0 12,5
33-45 34,0 3,8
37,0 4,2
39,0 6,5
42,0 4,8
44,0 5,0
कुल 196,0 24,3
45-57 45,0 5,7
46,0 5,5
47,0 5,9
48,0 6,2
49,0 6,1
50,0 5,8
51,0 6,4
52,0 6,5
53,0 6,4
54,0 6,0
55,0 6,3
56,0 7,2
कुल 606,0 74,0
57-69 58,0 8,0
60,0 7,9
61,0 7,6
63,0 6,7
65,0 6,7
68,0 8,5
कुल 375,0 45,4
69-81 72,0 8,2
76,0 9,1
81,0 9,6
कुल 229,0 26,9
कुल 183,1

"कुल" तालिका 3 की समूह सारांश पंक्तियों के आधार पर, एक अंतिम तालिका 3 बनाई जाती है, जो आउटपुट द्वारा उद्यमों के वितरण की अंतराल श्रृंखला का प्रतिनिधित्व करती है।

टेबल तीन

आउटपुट वॉल्यूम द्वारा उद्यमों के कई वितरण

निष्कर्ष।निर्मित समूहन दर्शाता है कि उत्पादन के संदर्भ में उद्यमों का वितरण एक समान नहीं है। 45 से 57 मिलियन रूबल की उत्पादन मात्रा वाले सबसे आम उद्यम। (12 उद्यम)। 69 से 81 मिलियन रूबल के उत्पादन वाले उद्यम कम से कम आम हैं। (3 उद्यम)।

आइए वितरण श्रृंखला के रेखांकन बनाएं।

बहुभुज अक्सर असतत श्रृंखला का प्रतिनिधित्व करने के लिए प्रयोग किया जाता है। एक आयताकार समन्वय प्रणाली में एक बहुभुज का निर्माण करने के लिए, तर्क के मूल्यों को एब्सिस्सा अक्ष पर प्लॉट किया जाता है, अर्थात विकल्प (अंतराल परिवर्तनशील श्रृंखला के लिए, अंतराल के मध्य को एक तर्क के रूप में लिया जाता है) और समन्वय अक्ष पर - आवृत्ति मूल्य। इसके अलावा, इस समन्वय प्रणाली में, बिंदु बनाए जाते हैं, जिनमें से निर्देशांक भिन्नता श्रृंखला से संबंधित संख्याओं के जोड़े होते हैं। परिणामी बिंदु श्रृंखला में सीधी रेखा खंडों द्वारा जुड़े हुए हैं। बहुभुज चित्र 1 में दिखाया गया है।

दंड आरेख - बार चार्ट। यह आपको वितरण की समरूपता का मूल्यांकन करने की अनुमति देता है। हिस्टोग्राम चित्र 2 में दिखाया गया है।

चित्र 1 - आयतन द्वारा उद्यमों का बहुभुज वितरण

उत्पादन

पहनावा

चित्र 2 - आयतन द्वारा उद्यमों के वितरण का हिस्टोग्राम

उत्पादन

पहनावा- उस विशेषता का मूल्य जो अध्ययन आबादी में सबसे अधिक बार होता है।

अंतराल श्रृंखला के लिए, बहुलक को हिस्टोग्राम (चित्र 2) से आलेखीय रूप से निर्धारित किया जा सकता है। इसके लिए, उच्चतम आयत का चयन किया जाता है, जो इस मामले में मोडल (45-57 मिलियन रूबल) है। फिर मोडल आयत का दायाँ शीर्ष पिछले आयत के ऊपरी दाएँ कोने से जुड़ा है। और मोडल आयत का बायाँ शीर्ष बाद के आयत के ऊपरी बाएँ कोने के साथ है। इसके अलावा, उनके चौराहे के बिंदु से, एक लंबवत को भुज अक्ष पर उतारा जाता है। इन रेखाओं के प्रतिच्छेदन बिंदु का भुज वितरण विधा होगा।

दस लाख रगड़ना।

निष्कर्ष।उद्यमों के कथित सेट में, 52 मिलियन रूबल के उत्पादन वाले उद्यमों का सबसे अधिक बार सामना किया जाता है।

संचयी - टूटा हुआ वक्र। यह संचित आवृत्तियों (तालिका 4 में परिकलित) पर बनाया गया है। संचयी पहले अंतराल (21 मिलियन रूबल) की निचली सीमा से शुरू होता है, संचित आवृत्ति अंतराल की ऊपरी सीमा पर जमा होती है। संचयी चित्र 3 में दिखाया गया है।

मंझला

चित्र 3 - मात्रा के अनुसार उद्यमों का संचयी वितरण

उत्पादन

मेडियन मीउस विशेषता का मान है जो रैंक की गई श्रृंखला के बीच में आता है। माध्यिका के दोनों ओर समान संख्या में जनसंख्या इकाइयाँ हैं।

एक अंतराल श्रृंखला में, माध्यिका को संचयी वक्र से आलेखीय रूप से निर्धारित किया जा सकता है। 50% (30:2 = 15) के अनुरूप संचयी आवृत्ति पैमाने पर बिंदु से माध्यिका निर्धारित करने के लिए, भुजिका अक्ष के समानांतर एक सीधी रेखा खींची जाती है जब तक कि वह संचयी के साथ प्रतिच्छेद न कर ले। फिर, संचयी के साथ संकेतित सीधी रेखा के चौराहे के बिंदु से, एक लंबवत को भुज अक्ष पर उतारा जाता है। प्रतिच्छेदन बिंदु का भुज माध्यिका है।

दस लाख रगड़ना।

निष्कर्ष।उद्यमों के माने गए सेट में, आधे उद्यमों की उत्पादन मात्रा 52 मिलियन रूबल से अधिक नहीं है, और अन्य आधे - 52 मिलियन रूबल से कम नहीं है।


इसी तरह की जानकारी।


बड़ी मात्रा में सूचनाओं को संसाधित करते समय, जो आधुनिक वैज्ञानिक विकास करते समय विशेष रूप से महत्वपूर्ण है, शोधकर्ता को प्रारंभिक डेटा को सही ढंग से समूहित करने के गंभीर कार्य का सामना करना पड़ता है। यदि डेटा असतत है, तो, जैसा कि हमने देखा है, कोई समस्या नहीं है - आपको बस प्रत्येक सुविधा की आवृत्ति की गणना करने की आवश्यकता है। यदि अध्ययन के तहत विशेषता है निरंतरचरित्र (जो व्यवहार में अधिक सामान्य है), तो किसी विशेषता को समूहीकृत करने के लिए अंतराल की इष्टतम संख्या का चुनाव किसी भी तरह से एक तुच्छ कार्य नहीं है।

सतत यादृच्छिक चरों को समूहित करने के लिए, सुविधा की संपूर्ण विविधता श्रेणी को एक निश्चित संख्या में अंतरालों में विभाजित किया जाता है को।

समूहीकृत अंतराल (निरंतर) परिवर्तनशील श्रृंखलासुविधा के मान द्वारा क्रमबद्ध अंतराल कहा जाता है (), जहां संबंधित आवृत्तियों के साथ एक साथ संकेत दिया जाता है () r "वें अंतराल, या सापेक्ष आवृत्तियों () में गिरने वाले अवलोकनों की संख्या:

विशेषता मान अंतराल

मील आवृत्ति

दंड आरेखऔर संचयी (ओजिवा),पहले से ही हमारे द्वारा विस्तार से चर्चा की गई है, यह एक उत्कृष्ट डेटा विज़ुअलाइज़ेशन टूल है जो आपको डेटा संरचना की प्राथमिक समझ प्राप्त करने की अनुमति देता है। इस तरह के ग्राफ़ (चित्र। 1.15) निरंतर डेटा के लिए उसी तरह बनाए जाते हैं जैसे असतत डेटा के लिए, केवल इस तथ्य को ध्यान में रखते हुए कि निरंतर डेटा किसी भी मान को लेते हुए, इसके संभावित मूल्यों के क्षेत्र को पूरी तरह से भर देता है।

चावल। 1.15.

इसलिए हिस्टोग्राम और क्यूम्युलेट पर कॉलम संपर्क में होना चाहिए, ऐसे कोई क्षेत्र नहीं हैं जहां विशेषता मान सभी संभव के भीतर नहीं आते हैं(यानी, हिस्टोग्राम और क्यूम्युलेट में एब्सिस्सा अक्ष के साथ "छेद" नहीं होने चाहिए, जिसमें अध्ययन के तहत चर के मान नहीं आते हैं, जैसा कि चित्र 1.16 में है)। बार की ऊंचाई आवृत्ति से मेल खाती है - दिए गए अंतराल में गिरने वाले अवलोकनों की संख्या, या सापेक्ष आवृत्ति - अवलोकनों का अनुपात। अंतराल पार नहीं करना चाहिएऔर आमतौर पर एक ही चौड़ाई के होते हैं।

चावल। 1.16.

हिस्टोग्राम और बहुभुज संभाव्यता घनत्व वक्र (अंतर समारोह) के अनुमान हैं एफ (एक्स)सैद्धांतिक वितरण, संभाव्यता सिद्धांत के पाठ्यक्रम में माना जाता है। इसलिए, मात्रात्मक निरंतर डेटा के प्राथमिक सांख्यिकीय प्रसंस्करण में उनके निर्माण का इतना महत्व है - उनके रूप से कोई काल्पनिक वितरण कानून का न्याय कर सकता है।

संचयी - अंतराल भिन्नता श्रृंखला की संचित आवृत्तियों (आवृत्तियों) का वक्र। इंटीग्रल डिस्ट्रीब्यूशन फंक्शन के ग्राफ की तुलना क्यूम्युलेट से की जाती है एफ (एक्स), संभाव्यता सिद्धांत के दौरान भी माना जाता है।

मूल रूप से, हिस्टोग्राम और क्यूम्युलेट्स की अवधारणाएं निरंतर डेटा और उनकी अंतराल भिन्नता श्रृंखला के साथ ठीक से जुड़ी हुई हैं, क्योंकि उनके ग्राफ़ क्रमशः संभाव्यता घनत्व फ़ंक्शन और वितरण फ़ंक्शन के अनुभवजन्य अनुमान हैं।

अंतराल भिन्नता श्रृंखला का निर्माण अंतराल की संख्या निर्धारित करने के साथ शुरू होता है क।और यह कार्य अध्ययन के विषय में शायद सबसे कठिन, महत्वपूर्ण और विवादास्पद है।

अंतरालों की संख्या बहुत छोटी नहीं होनी चाहिए, क्योंकि हिस्टोग्राम बहुत चिकना होगा ( अधिक चिकना),प्रारंभिक डेटा की परिवर्तनशीलता की सभी विशेषताओं को खो देता है - अंजीर में। 1.17 आप देख सकते हैं कि कैसे वही डेटा जिस पर अंजीर के रेखांकन। 1.15 का उपयोग कम अंतराल (बाएं ग्राफ) के साथ हिस्टोग्राम बनाने के लिए किया जाता है।

उसी समय, अंतरालों की संख्या बहुत बड़ी नहीं होनी चाहिए - अन्यथा हम संख्यात्मक अक्ष के साथ अध्ययन के तहत डेटा के वितरण घनत्व का अनुमान नहीं लगा पाएंगे: हिस्टोग्राम कम हो जाएगा (समझदार)अपूर्ण अंतरालों के साथ, असमान (चित्र 1.17, दायां ग्राफ देखें)।

चावल। 1.17.

अंतराल की सबसे पसंदीदा संख्या कैसे निर्धारित करें?

1926 में वापस, हर्बर्ट स्टर्गेस ने अंतराल की संख्या की गणना के लिए एक सूत्र प्रस्तावित किया जिसमें अध्ययन की गई विशेषता के मूल्यों के प्रारंभिक सेट को विभाजित करना आवश्यक है। यह सूत्र वास्तव में बहुत लोकप्रिय हो गया है - अधिकांश सांख्यिकीय पाठ्यपुस्तकें इसे पेश करती हैं, और कई सांख्यिकीय पैकेज डिफ़ॉल्ट रूप से इसका उपयोग करते हैं। क्या यह उचित है और सभी मामलों में यह एक बहुत ही गंभीर प्रश्न है।

तो स्टर्गेस फॉर्मूला किस पर आधारित है?

द्विपद वितरण पर विचार करें)