सांख्यिकीय विश्लेषण के तरीके। डेटा विश्लेषण: सांख्यिकीय अनुसंधान के तरीके

नॉलेज बेस में अपना अच्छा काम भेजें सरल है। नीचे दिए गए फॉर्म का प्रयोग करें

छात्र, स्नातक छात्र, युवा वैज्ञानिक जो अपने अध्ययन और कार्य में ज्ञान के आधार का उपयोग करते हैं, वे आपके बहुत आभारी रहेंगे।

http://www.allbest.ru/ पर होस्ट किया गया

  • 3. गतिकी की श्रृंखला
  • साहित्य

1. निरपेक्ष और सापेक्ष मूल्य

सारांश और समूहीकरण के परिणामस्वरूप सांख्यिकीय सामग्रीशोधकर्ता के हाथों में अध्ययन की गई घटनाओं और प्रक्रियाओं के बारे में सबसे विविध जानकारी है। हालाँकि, प्राप्त परिणामों पर ध्यान देना एक बड़ी गलती होगी, क्योंकि दिए गए मानदंडों के अनुसार समूहीकृत और सारणीबद्ध या चित्रमय रूप में परिलक्षित होने पर भी, ये डेटा अभी भी केवल एक प्रकार का चित्रण है, मध्यवर्ती परिणाम, जिसका विश्लेषण किया जाना चाहिए - इस मामले में, सांख्यिकीय। सांख्यिकीयविश्लेषण - यह प्रदर्शन अध्ययन वस्तु में गुणवत्ता विखंडित सिस्टम, वे। जटिल तत्वों और सम्बन्ध, उत्पादक में उसका इंटरैक्शन कार्बनिक पूरा का पूरा.

इस तरह के विश्लेषण के परिणामस्वरूप, अध्ययन के तहत वस्तु का एक मॉडल बनाया जाना चाहिए, और चूंकि हम आंकड़ों के बारे में बात कर रहे हैं, इसलिए मॉडल का निर्माण करते समय सांख्यिकीय रूप से महत्वपूर्ण तत्वों और संबंधों का उपयोग किया जाना चाहिए।

दरअसल, सांख्यिकीय विश्लेषण का उद्देश्य ऐसे महत्वपूर्ण तत्वों और संबंधों की पहचान करना है।

शुद्धसंकेतक(मान) - बिना किसी परिवर्तन के सारांश सांख्यिकीय रिपोर्ट से परिकलित या लिए गए कुल मान। निरपेक्ष संकेतक हमेशा नाममात्र होते हैं और माप की इकाइयों में परिलक्षित होते हैं जो सांख्यिकीय अवलोकन कार्यक्रम (आपराधिक मामलों की संख्या, किए गए अपराधों की संख्या, तलाक की संख्या, आदि) को संकलित करते समय निर्धारित किए गए थे।

निरपेक्ष संकेतक किसी भी आगे के सांख्यिकीय संचालन के लिए बुनियादी हैं, लेकिन वे स्वयं विश्लेषण के लिए बहुत कम उपयोग के हैं। उदाहरण के लिए, निरपेक्ष शब्दों में, अपराध के स्तर को आंकना कठिन है अलग अलग शहरया क्षेत्र और इस प्रश्न का उत्तर देना व्यावहारिक रूप से असंभव है कि अपराध कहाँ अधिक है और कहाँ कम है, क्योंकि शहर या क्षेत्र जनसंख्या, क्षेत्र और अन्य महत्वपूर्ण मापदंडों में महत्वपूर्ण रूप से भिन्न हो सकते हैं।

रिश्तेदारमात्राआंकड़ों में, वे संकेतकों का सामान्यीकरण कर रहे हैं जो दो तुलनात्मक सांख्यिकीय मूल्यों के अनुपात के संख्यात्मक रूप को प्रकट करते हैं। सापेक्ष मूल्यों की गणना करते समय, दो निरपेक्ष मूल्यों की तुलना सबसे अधिक बार की जाती है, लेकिन औसत और सापेक्ष दोनों मूल्यों की तुलना नए सापेक्ष संकेतक प्राप्त करके की जा सकती है। एक सापेक्ष मूल्य की गणना का सबसे सरल उदाहरण प्रश्न का उत्तर है: एक संख्या दूसरी से कितनी गुना बड़ी है?

सापेक्ष मूल्यों पर विचार करना शुरू करते हुए, निम्नलिखित को ध्यान में रखना आवश्यक है। सिद्धांत रूप में, लोमोनोसोव चीनी मिट्टी के बरतन कारखाने द्वारा निर्मित उत्पादों की संख्या के साथ ए 4 पेपर की एक शीट के रैखिक आयामों की भी तुलना की जा सकती है। हालाँकि, ऐसी तुलना हमें कुछ नहीं देगी। सापेक्ष मात्राओं की उपयोगी गणना के लिए सबसे महत्वपूर्ण शर्त निम्नानुसार तैयार की जा सकती है:

1. तुलना की गई मात्राओं के मापन की इकाइयाँ समान या काफी तुलनीय होनी चाहिए। अपराधों, आपराधिक मामलों और दोषियों की संख्या सहसंबद्ध संकेतक हैं, अर्थात। संबंधित है, लेकिन माप की इकाइयों के संदर्भ में तुलनीय नहीं है। एक आपराधिक मामले में, कई अपराधों पर विचार किया जा सकता है और व्यक्तियों के एक समूह को दोषी ठहराया जा सकता है; कई अपराधी एक अपराध कर सकते हैं और इसके विपरीत, एक अपराधी कई कार्य कर सकता है। अपराधों, मामलों और सजाओं की संख्या जनसंख्या, आपराधिक न्याय प्रणाली के कर्मियों की संख्या, लोगों के जीवन स्तर और उसी वर्ष के अन्य आंकड़ों के साथ तुलनीय है। इसके अलावा, एक वर्ष के भीतर माना गया संकेतक एक दूसरे के साथ काफी तुलनीय हैं।

2. तुलनीय डेटा आवश्यक रूप से उनकी प्राप्ति के समय या क्षेत्र, या दोनों के संदर्भ में एक दूसरे के अनुरूप होना चाहिए।

शुद्ध मूल्य, साथ कौन सा तुलना अन्य मेंमुखौटे, बुलाया आधार या आधार तुलना, तुलना करनाऔरखुदी हुई सूचक - आकार तुलना. उदाहरण के लिए, 2000-2010 में रूस में अपराध की गतिशीलता के अनुपात की गणना करते समय। 2000 डेटा बेसलाइन होगा। उन्हें एक इकाई के रूप में लिया जा सकता है (तब सापेक्ष मूल्यएक कारक के रूप में व्यक्त किया जाएगा), प्रति 100 (प्रतिशत के रूप में)। तुलनात्मक मूल्यों के आयाम के आधार पर, सापेक्ष मूल्य की अभिव्यक्ति का सबसे सुविधाजनक, सांकेतिक और दृश्य रूप चुना जाता है।

यदि तुलना किया जा रहा मूल्य आधार से बहुत बड़ा है, तो परिणामी अनुपात गुणांक के रूप में सबसे अच्छा व्यक्त किया जाता है। उदाहरण के लिए, एक निश्चित अवधि (वर्षों में) में अपराध में 2.6 गुना की वृद्धि हुई। इस मामले में समय में अभिव्यक्ति प्रतिशत की तुलना में अधिक सांकेतिक होगी। प्रतिशत के रूप में, सापेक्ष मान तब व्यक्त किए जाते हैं जब तुलना मूल्य आधार से बहुत भिन्न नहीं होता है।

आंकड़ों में उपयोग किए जाने वाले सापेक्ष मूल्य, कानूनी सहित, हैं अलग - अलग प्रकार. कानूनी आंकड़ों में निम्न प्रकार के सापेक्ष मूल्यों का उपयोग किया जाता है:

1. जनसंख्या की संरचना, या वितरण संबंधों की विशेषता वाले संबंध;

2. भाग का संपूर्ण से संबंध, या तीव्रता का संबंध;

3. संबंध जो गतिशीलता की विशेषता रखते हैं;

4. डिग्री और तुलना के संबंध।

रिश्तेदारआकारवितरण - यह रिश्तेदार मूल्य, व्यक्त में प्रतिशत व्यक्ति पार्ट्स समुच्चय अध्ययन घटना(अपराध, अपराधी, दीवानी मामले, मुकदमे, कारण, निवारक उपाय, आदि) को उन्हें आम कुल, स्वीकार किए जाते हैं पीछे 100% . यह आँकड़ों में उपयोग किया जाने वाला सबसे सामान्य (और सरल) प्रकार का सापेक्ष डेटा है। ये हैं, उदाहरण के लिए, अपराध की संरचना (अपराधों के प्रकार के अनुसार), दोषसिद्धि की संरचना (अपराधों के प्रकार से, दोषियों की आयु के अनुसार), आदि।

सांख्यिकीय विश्लेषण निरपेक्ष मूल्य

रवैयातीव्रता(अंश-से-संपूर्ण अनुपात) - एक सामान्यीकरण सापेक्ष मूल्य जो प्रेक्षित में किसी विशेष विशेषता की व्यापकता को दर्शाता है समुच्चय।

कानूनी आंकड़ों में इस्तेमाल की जाने वाली तीव्रता का सबसे आम संकेतक अपराध की तीव्रता है। . अपराध की तीव्रता आमतौर पर अपराध दर से परिलक्षित होती है , वे। प्रति 100 या 10 हजार निवासियों पर अपराधों की संख्या।

केपी \u003d (पी * 100000) / एन

जहां पी - निरपेक्ष संख्यापंजीकृत अपराध, एच जनसंख्या की पूर्ण संख्या है।

एक पूर्वापेक्षा जो ऐसे संकेतकों की गणना की संभावना को निर्धारित करती है, जैसा कि ऊपर उल्लेख किया गया है, यह है कि उपयोग किए जाने वाले सभी पूर्ण संकेतक एक क्षेत्र में और एक समय की अवधि के लिए लिए जाते हैं।

रिश्ते,निस्र्पकगतिकी, प्रतिनिधित्व करना सामान्यीकरण रिश्तेदार मात्रा, दिखा परिवर्तन में समय वे या अन्य संकेतक कानूनी आंकड़े. समय अंतराल आमतौर पर एक वर्ष के रूप में लिया जाता है।

आधार (आधार) के लिए 1, या 100% के बराबर, एक निश्चित वर्ष की अध्ययन की गई विशेषता के बारे में जानकारी ली जाती है, जो अध्ययन के तहत घटना की विशेषता थी। आधार वर्ष का डेटा एक निश्चित आधार के रूप में कार्य करता है, जिससे बाद के वर्षों के संकेतक प्रतिशतित होते हैं।

सांख्यिकीय विश्लेषण कार्यों में अक्सर वार्षिक (या अन्य अवधियों) तुलनाओं की आवश्यकता होती है जब आधार स्वीकार किए जाते हैं जानकारी हर कोई पहले का साल का(माह या अन्य अवधि)। ऐसे आधार को कहा जाता है मोबाइल. यह आमतौर पर समय श्रृंखला (गतिशीलता की श्रृंखला) के विश्लेषण में उपयोग किया जाता है।

रिश्तेडिग्रीऔरतुलनाआपको विभिन्न संकेतकों की तुलना करने की अनुमति देता है ताकि यह पता लगाया जा सके कि कौन सा मूल्य दूसरे की तुलना में बहुत बड़ा है, किस हद तक एक घटना दूसरे से भिन्न है या इसके समान है, देखी गई सांख्यिकीय प्रक्रियाओं में क्या सामान्य और भिन्न है, आदि।

एक सूचकांक तुलना का एक विशेष रूप से बनाया गया सापेक्ष संकेतक है (समय, स्थान, जब पूर्वानुमान के साथ तुलना की जाती है, आदि), यह दर्शाता है कि कुछ स्थितियों में अध्ययन के तहत घटना का स्तर कितनी बार समान घटना के स्तर से भिन्न होता है। स्थितियाँ। सबसे आम सूचकांक आर्थिक आंकड़ों में हैं, हालांकि वे कानूनी घटनाओं के विश्लेषण में भी एक निश्चित भूमिका निभाते हैं।

सूचकांक उन मामलों में अपरिहार्य हैं जहां असमान संकेतकों की तुलना करना आवश्यक है, जिनका सरल योग असंभव है। इसलिए, इंडेक्स को आमतौर पर परिभाषित किया जाता है संख्या-संकेतकके लिएमापनमध्यवक्ताओंसमुच्चयविजातीयतत्वों.

आँकड़ों में, इंडेक्स को आमतौर पर I (i) अक्षर से दर्शाया जाता है। बड़े अक्षरया पूंजी - इस पर निर्भर करता है कि हम एक व्यक्ति (निजी) सूचकांक के बारे में बात कर रहे हैं या यह सामान्य है।

व्यक्तिसूचकांक(i) तुलना की जा रही अवधि के संगत संकेतक के लिए वर्तमान अवधि के संकेतक के अनुपात को दर्शाता है।

समेकितसूचकांकजटिल सामाजिक-आर्थिक घटनाओं के सहसंबंध के विश्लेषण में उपयोग किया जाता है और इसमें दो भाग होते हैं: वास्तविक अनुक्रमित मूल्य और सह-माप ("वजन")।

2. कानूनी आंकड़ों में औसत और उनका आवेदन

निरपेक्ष और सापेक्ष संकेतकों के प्रसंस्करण का परिणाम वितरण श्रृंखला का निर्माण है। पंक्ति वितरण - यहआदेश दियापरगुणवत्तायामात्रात्मकविशेष रुप से प्रदर्शितवितरणइकाइयोंसमुच्चय. इन श्रृंखलाओं का विश्लेषण किसी भी सांख्यिकीय विश्लेषण का आधार है, चाहे वह भविष्य में कितना भी जटिल क्यों न हो।

एक वितरण श्रृंखला गुणात्मक या मात्रात्मक विशेषताओं के आधार पर बनाई जा सकती है। पहले मामले में इसे कहा जाता है ठहराव, क्षण में - परिवर्तन संबंधी. इस मामले में, मात्रात्मक विशेषता में अंतर को कहा जाता है उतार-चढ़ाव, और यह चिन्ह ही - विकल्प. यह परिवर्तनशील श्रृंखला के साथ है कि कानूनी आँकड़ों को सबसे अधिक बार निपटना पड़ता है।

एक परिवर्तनशील श्रृंखला में हमेशा दो कॉलम (ग्राफ) होते हैं। एक मात्रात्मक विशेषता के मूल्य को आरोही क्रम में इंगित करता है, जो वास्तव में, विकल्प कहलाते हैं, जो इंगित किए जाते हैं एक्स. अन्य कॉलम (स्तंभ) उन इकाइयों की संख्या को इंगित करता है जो एक या दूसरे प्रकार की विशेषता हैं। उन्हें आवृत्तियों कहा जाता है और लैटिन अक्षर द्वारा निरूपित किया जाता है एफ.

तालिका 2.1

विकल्प एक्स

आवृत्ति एफ

अन्य महत्वपूर्ण सांख्यिकीय संकेतकों की गणना करते समय एक या दूसरे लक्षण की अभिव्यक्ति की आवृत्ति बहुत महत्वपूर्ण है, अर्थात् औसत और भिन्नता के संकेतक।

रूपांतर श्रृंखला, बदले में, हो सकती है अलगया मध्यान्तर. असतत श्रृंखला, जैसा कि नाम का तात्पर्य है, अलग-अलग विशेषताओं के आधार पर बनाई गई है, और अंतराल श्रृंखला निरंतर विविधताओं के आधार पर बनाई गई है। इसलिए, उदाहरण के लिए, आयु के अनुसार अपराधियों का वितरण या तो असतत (18, 19.20 वर्ष, आदि) या निरंतर (18 वर्ष तक, 18-25 वर्ष पुराना, 25-30 वर्ष पुराना, आदि) हो सकता है। इसके अलावा, अंतराल श्रृंखला स्वयं को असतत और उसके अनुसार दोनों के अनुसार बनाया जा सकता है निरंतर सिद्धांत. पहले मामले में, आसन्न अंतराल की सीमाएं दोहराई नहीं जाती हैं; हमारे उदाहरण में, अंतराल इस तरह दिखेगा: 18 वर्ष तक, 18-25, 26-30, 31-35, आदि। ऐसी श्रृंखला कहलाती है निरंतरअलगपंक्ति. मध्यान्तरपंक्तिसाथनिरंतरउतार-चढ़ावके साथ पिछले अंतराल की ऊपरी सीमा के संयोग को मानता है निम्न परिबंधबाद का।

परिवर्तनशील श्रृंखला का वर्णन करने वाला पहला संकेतक है मध्यम मात्रा. वे कानूनी आँकड़ों में एक महत्वपूर्ण भूमिका निभाते हैं, क्योंकि केवल उनकी मदद से एक मात्रात्मक चर संकेत के अनुसार आबादी को चिह्नित करना संभव है, जिसके द्वारा उनकी तुलना की जा सकती है। औसत मूल्यों की मदद से, कुछ मात्रात्मक विशेषताओं के अनुसार हमारे लिए कानूनी रूप से महत्वपूर्ण घटनाओं के सेट की तुलना करना संभव है और इन तुलनाओं से आवश्यक निष्कर्ष निकालना संभव है।

मध्यममात्राविचार करना अधिकांश आम रुझान (नियमितता), अध्ययन की गई घटनाओं के पूरे द्रव्यमान में निहित है। यह स्वयं में प्रकट होता है ठेठ मात्रात्मक विशेषता, अर्थात्। सभी उपलब्ध (चर) संकेतकों के औसत मूल्य में।

सांख्यिकी ने कई प्रकार के औसत विकसित किए हैं: अंकगणित, ज्यामितीय, घन, हार्मोनिक, आदि। हालांकि, वे व्यावहारिक रूप से कानूनी आंकड़ों में उपयोग नहीं किए जाते हैं, इसलिए हम केवल दो प्रकार के औसत पर विचार करेंगे - अंकगणितीय औसत और ज्यामितीय औसत।

सबसे आम और प्रसिद्ध औसत है औसतअंकगणित. इसकी गणना करने के लिए, संकेतकों के योग की गणना और विभाजित किया जाता है कुल गणनासंकेतक। उदाहरण के लिए, 4 लोगों के परिवार में 38 और 40 वर्ष के माता-पिता और 7 और 10 वर्ष की आयु के दो बच्चे शामिल हैं। हम आयु का योग करते हैं: 38 + 40 + 7 + 10 और परिणामी योग 95 को 4 से विभाजित करते हैं। परिणामी औसत आयुपरिवार - 23.75 वर्ष। या आइए जांचकर्ताओं के औसत मासिक कार्यभार की गणना करें यदि 8 लोगों का एक विभाग प्रति माह 25 मामलों का समाधान करता है। 25 को 8 से विभाजित करें और प्रति अन्वेषक प्रति माह 3,125 मामले प्राप्त करें।

कानूनी आंकड़ों में, कर्मचारियों (जांचकर्ताओं, अभियोजकों, न्यायाधीशों, आदि) के कार्यभार की गणना करते समय अंकगणितीय माध्य का उपयोग किया जाता है, अपराध में पूर्ण वृद्धि की गणना, नमूने की गणना, आदि।

हालांकि, उपरोक्त उदाहरण में, प्रति जांचकर्ता औसत मासिक कार्यभार की गणना गलत तरीके से की गई थी। तथ्य यह है कि साधारण अंकगणितीय माध्य को ध्यान में नहीं रखा जाता है आवृत्तिविशेषता का अध्ययन किया। हमारे उदाहरण में, एक अन्वेषक के लिए औसत मासिक कार्यभार उतना ही सही और सूचनात्मक है जितना कि एक प्रसिद्ध उपाख्यान से "अस्पताल में औसत तापमान", जो कि, जैसा कि आप जानते हैं, कमरे का तापमान है। अंकगणित माध्य की गणना करते समय अध्ययन किए गए गुण की अभिव्यक्तियों की आवृत्ति को ध्यान में रखने के लिए, इसका उपयोग निम्नानुसार किया जाता है औसतअंकगणितभारितया असतत परिवर्तनशील श्रृंखला के लिए औसत। (असतत परिवर्तनशील श्रृंखला - असतत (असंतत) संकेतकों के अनुसार एक संकेत के परिवर्तन का क्रम)।

अंकगणित भारित औसत (भारित औसत) का साधारण अंकगणितीय औसत से कोई मूलभूत अंतर नहीं है। इसमें, समान मान के योग को इस मान को उसकी आवृत्ति से गुणा करके प्रतिस्थापित किया जाता है, अर्थात। इस मामले में, प्रत्येक मान (संस्करण) को घटना की आवृत्ति द्वारा भारित किया जाता है।

इसलिए, जांचकर्ताओं के औसत कार्यभार की गणना करते हुए, हमें उन जांचकर्ताओं की संख्या से मामलों की संख्या को गुणा करना चाहिए जिन्होंने वास्तव में इतने सारे मामलों की जांच की थी। ऐसी गणनाओं को तालिकाओं के रूप में प्रस्तुत करना आमतौर पर सुविधाजनक होता है:

तालिका 2.2

मामलों की संख्या

(विकल्प एक्स)

जांचकर्ताओं की संख्या (आवृत्ति एफ)

कलाकृति विकल्प

आवृत्तियों के लिए ( एक्सएफ)

2. सूत्र द्वारा वास्तविक भारित औसत की गणना करें:

कहाँ पे एक्स- आपराधिक मामलों की संख्या, और एफ- जांचकर्ताओं की संख्या।

इस प्रकार, भारित औसत 3.125 नहीं, बल्कि 4.375 है। यदि आप इसके बारे में सोचते हैं, तो यह ऐसा होना चाहिए: प्रत्येक व्यक्तिगत अन्वेषक पर भार इस तथ्य के कारण बढ़ जाता है कि हमारे काल्पनिक विभाग में एक अन्वेषक एक बेकार निकला - या, इसके विपरीत, एक विशेष रूप से महत्वपूर्ण जांच कर रहा था और जटिल मामला। लेकिन एक सांख्यिकीय अध्ययन के परिणामों की व्याख्या करने के प्रश्न पर विचार किया जाएगा अगला टॉपिक. कुछ मामलों में, अर्थात् समूहीकृत आवृत्तियों के मामलों में असतत वितरण- औसत की गणना, पहली नज़र में, स्पष्ट नहीं है। मान लीजिए कि हमें उम्र के हिसाब से गुंडागर्दी के दोषी व्यक्तियों के वितरण के लिए अंकगणितीय माध्य की गणना करने की आवश्यकता है। वितरण इस तरह दिखता है:

तालिका 2.3

(विकल्प एक्स)

दोषियों की संख्या (आवृत्ति एफ)

अंतराल मध्यबिंदु

कलाकृति विकल्प

आवृत्तियों के लिए ( एक्सएफ)

(21-18) /2+18=19,5

इसके अलावा, औसत की गणना सामान्य नियम के अनुसार की जाती है और इस असतत श्रृंखला के लिए 23.6 वर्ष है। तथाकथित के मामले में। खुली पंक्तियाँ, अर्थात्, उन स्थितियों में जहाँ चरम अंतराल "से कम" द्वारा निर्धारित किए जाते हैं एक्स" या अधिक एक्स", चरम अंतराल का मान अन्य अंतरालों के समान सेट किया जाता है।

3. गतिकी की श्रृंखला

आँकड़ों द्वारा अध्ययन की जाने वाली सामाजिक घटनाएँ हैं निरंतर विकासऔर परिवर्तन। सामाजिक-कानूनी संकेतकों को न केवल एक स्थिर रूप में प्रस्तुत किया जा सकता है, एक निश्चित घटना को दर्शाता है, बल्कि समय और स्थान में होने वाली प्रक्रिया के साथ-साथ अध्ययन के तहत विशेषताओं की बातचीत के रूप में भी प्रस्तुत किया जा सकता है। दूसरे शब्दों में, समय श्रृंखला एक विशेषता के विकास को दर्शाती है, अर्थात। समय, स्थान या पर्यावरणीय परिस्थितियों के आधार पर इसका परिवर्तन।

यह श्रृंखला निर्दिष्ट समय अवधि (प्रत्येक कैलेंडर वर्ष के लिए) में औसत मूल्यों का एक क्रम है।

सामाजिक घटनाओं और उनके विश्लेषण के गहन अध्ययन के लिए, गतिकी की एक श्रृंखला के स्तरों की एक सरल तुलना पर्याप्त नहीं है; गतिशीलता की एक श्रृंखला के व्युत्पन्न संकेतकों की गणना करना आवश्यक है: पूर्ण विकास, विकास दर, विकास दर, औसत वृद्धि और विकास दर, एक प्रतिशत वृद्धि की पूर्ण सामग्री।

गतिकी की श्रृंखला के संकेतकों की गणना उनके स्तरों की तुलना के आधार पर की जाती है। इस मामले में, गतिशील श्रृंखला के स्तरों की तुलना करने के दो तरीके हैं:

बुनियादी संकेतक, जब बाद के सभी स्तरों की तुलना कुछ प्रारंभिक के साथ की जाती है, जिन्हें आधार के रूप में लिया जाता है;

श्रृंखला संकेतक, जब गतिशीलता की एक श्रृंखला के प्रत्येक बाद के स्तर की तुलना पिछले एक से की जाती है।

निरपेक्ष वृद्धि दर्शाती है कि किसी विशिष्ट अवधि के लिए वर्तमान अवधि का स्तर आधार या पिछली अवधि के स्तर से कितनी इकाइयाँ अधिक या कम है।

निरपेक्ष वृद्धि (पी) की गणना तुलनात्मक स्तरों के बीच के अंतर के रूप में की जाती है।

आधार निरपेक्ष विकास:

पी बी = आप मैं - आपअड्डों . (एफ.1)।

श्रृंखला पूर्ण विकास:

पी सी = आप मैं - आप मैं -1 (एफ.2)।

वृद्धि दर (Tr) दर्शाती है कि वर्तमान अवधि का स्तर कितनी बार (किस प्रतिशत से) आधार या पिछली अवधि के स्तर से अधिक या कम है:

आधार विकास दर:

(एफ.3)

श्रृंखला विकास दर:

(एफ.4)

वृद्धि दर (टीपीआर) दर्शाती है कि वर्तमान अवधि का स्तर आधार या पिछली अवधि के स्तर से कितने प्रतिशत अधिक या कम है, जिसे तुलना के आधार के रूप में लिया जाता है, और इसकी गणना निरपेक्ष स्तर से पूर्ण वृद्धि के अनुपात के रूप में की जाती है। , आधार के रूप में लिया गया।

विकास दर की गणना विकास दर से 100% घटाकर भी की जा सकती है।

आधार विकास दर:

या (एफ.5)

श्रृंखला विकास दर:

या (एफ.6)

औसत विकास दर की गणना गतिकी की एक श्रृंखला की वृद्धि दर के ज्यामितीय माध्य के सूत्र द्वारा की जाती है:

(फॉर्म 7)

औसत विकास दर कहां है;

- निश्चित अवधि के लिए विकास दर;

एन- विकास दर की संख्या।

एक नियम के रूप में, तीन से अधिक मूल घातांक के साथ समान समस्याएं, लघुगणक का उपयोग करके हल की जाती हैं। बीजगणित से ज्ञात होता है कि जड़ का लघुगणक लघुगणक के बराबर हैमूल मान को मूल घातांक से विभाजित किया जाता है, और यह कि कई कारकों के गुणनफल का लघुगणक योग के बराबर हैइन कारकों के लघुगणक।

इस प्रकार, औसत वृद्धि दर की गणना जड़ लेकर की जाती है एनव्यक्ति के कार्यों से डिग्री एन- श्रृंखला विकास दर। औसत वृद्धि दर औसत वृद्धि दर और एक (), या 100% के बीच का अंतर है जब विकास दर को प्रतिशत के रूप में व्यक्त किया जाता है:

या

एक गतिशील श्रृंखला के अभाव में मध्यवर्ती स्तरऔसत वृद्धि और वृद्धि दर निम्न सूत्र द्वारा निर्धारित की जाती है:

(एफ.8)

गतिशील श्रृंखला का अंतिम स्तर कहां है;

- गतिशील श्रृंखला का प्रारंभिक स्तर;

एन - स्तरों की संख्या (तारीख)।

यह स्पष्ट है कि फ़ार्मुलों (f.7 और f.8) द्वारा गणना की गई औसत वृद्धि दर और वृद्धि के संकेतक समान संख्यात्मक मान रखते हैं।

1% की वृद्धि की निरपेक्ष सामग्री दर्शाती है कि किस निरपेक्ष मूल्य में 1% की वृद्धि है और इसकी गणना विकास दर के पूर्ण विकास के अनुपात के रूप में की जाती है।

1% वृद्धि की पूर्ण सामग्री:

बुनियादी: (एफ.9)

श्रृंखला: (f.10)

गणना और विश्लेषण निरपेक्ष मूल्यप्रत्येक प्रतिशत वृद्धि अध्ययन के तहत घटना के विकास की प्रकृति की गहरी समझ में योगदान करती है। हमारे उदाहरण के आंकड़े बताते हैं कि विकास दर और विकास दर में उतार-चढ़ाव के बावजूद व्यक्तिगत वर्ष, 1% की वृद्धि की निरपेक्ष सामग्री के मूल संकेतक अपरिवर्तित रहते हैं, जबकि पिछले एक की तुलना में प्रत्येक बाद के वर्ष में एक प्रतिशत की वृद्धि के निरपेक्ष मूल्य में परिवर्तन की विशेषता वाले श्रृंखला संकेतक लगातार बढ़ रहे हैं।

समय श्रृंखला का निर्माण, प्रसंस्करण और विश्लेषण करते समय, निश्चित अवधि के लिए अध्ययन की गई घटनाओं के औसत स्तर को निर्धारित करने की आवश्यकता होती है। औसत कालानुक्रमिक अंतराल श्रृंखला की गणना समान अंतराल पर सरल अंकगणितीय माध्य के सूत्र द्वारा की जाती है, असमान अंतरालों के साथ - अंकगणितीय भारित औसत द्वारा:

कहाँ पे - मध्य स्तरअंतराल श्रृंखला;

- श्रृंखला के प्रारंभिक स्तर;

एन- स्तरों की संख्या।

गतिकी की पल श्रृंखला के लिए, बशर्ते कि तिथियों के बीच का समय अंतराल बराबर हो, औसत स्तर की गणना कालानुक्रमिक औसत सूत्र का उपयोग करके की जाती है:

(एफ.11)

औसत कालानुक्रमिक मूल्य कहाँ है;

आप 1 ,., आप एन- श्रृंखला का पूर्ण स्तर;

एन - गतिकी की श्रृंखला के निरपेक्ष स्तरों की संख्या।

गतिकी की पल श्रृंखला के स्तरों का औसत कालानुक्रमिक इस श्रृंखला के संकेतकों के योग के बराबर होता है, जो बिना एक के संकेतकों की संख्या से विभाजित होता है; इस मामले में, प्रारंभिक और अंतिम स्तरों को आधे में लिया जाना चाहिए, क्योंकि तिथियों की संख्या (क्षण) आमतौर पर अवधियों की संख्या से एक अधिक होती है।

विभिन्न गणना करने के लिए प्रारंभिक डेटा (गतिकी की अंतराल या क्षण श्रृंखला, बराबर या कोई समय अंतराल) की प्रस्तुति की सामग्री और रूप के आधार पर सामाजिक संकेतक, उदाहरण के लिए, अपराधों और अपराधों की औसत वार्षिक संख्या (प्रकार के अनुसार), कार्यशील पूंजी शेष का औसत आकार, अपराधियों की औसत संख्या, आदि, उपयुक्त विश्लेषणात्मक अभिव्यक्तियों का उपयोग करते हैं।

4. सांख्यकी पद्धतियाँअंतर्संबंधों

पिछले प्रश्नों में, हमने विचार किया, यदि मैं ऐसा कह सकता हूं, तो "एक-आयामी" वितरण का विश्लेषण - परिवर्तनशील श्रृंखला। यह एक बहुत ही महत्वपूर्ण है, लेकिन एकमात्र प्रकार के सांख्यिकीय विश्लेषण से बहुत दूर है। परिवर्तनशील श्रृंखला का विश्लेषण अधिक "उन्नत" प्रकार के सांख्यिकीय विश्लेषण का आधार है, मुख्य रूप से पढाईअंतर सम्बन्ध. इस तरह के एक अध्ययन के परिणामस्वरूप, घटना के बीच कारण और प्रभाव संबंधों का पता चलता है, जिससे यह निर्धारित करना संभव हो जाता है कि संकेतों में कौन से परिवर्तन अध्ययन की गई घटनाओं और प्रक्रियाओं की विविधताओं को प्रभावित करते हैं। वहीं, जो संकेत दूसरों में बदलाव का कारण बनते हैं, उन्हें फैक्टोरियल (कारक) कहा जाता है, और जो संकेत उनके प्रभाव में बदलते हैं उन्हें प्रभावी कहा जाता है।

सांख्यिकीय विज्ञान में के बीच दो प्रकार के संबंध होते हैं विभिन्न संकेतऔर उनकी जानकारी - कार्यात्मक संबंध (कठोरता से निर्धारित) और सांख्यिकीय (स्टोकेस्टिक)।

के लिए कार्यात्मकसम्बन्धकारक विशेषता में परिवर्तन और प्रभावी मूल्य में परिवर्तन के बीच पूर्ण पत्राचार विशेषता है। यह संबंध किसी भी जनसंख्या की सभी इकाइयों में समान रूप से प्रकट होता है। सबसे सरल उदाहरण: तापमान में वृद्धि एक थर्मामीटर में पारा की मात्रा में परिलक्षित होती है। इस मामले में, परिवेश का तापमान एक कारक के रूप में कार्य करता है, और पारा की मात्रा - एक प्रभावी विशेषता के रूप में।

रसायन विज्ञान, भौतिकी, यांत्रिकी जैसे विज्ञानों द्वारा अध्ययन की जाने वाली घटनाओं के लिए कार्यात्मक संबंध विशिष्ट हैं, जिसमें "शुद्ध" प्रयोग स्थापित करना संभव है, जिसमें बाहरी कारकों का प्रभाव समाप्त हो जाता है। तथ्य यह है कि कार्यात्मक कनेक्शनदोनों के बीच तभी संभव है जब दूसरा मान (परिणामी विशेषता) निर्भर करता है केवल और केवलपहले से। सार्वजनिक आयोजनों में, यह अत्यंत दुर्लभ है।

सामाजिक-कानूनी प्रक्रियाएं, जो एक साथ प्रभाव का परिणाम हैं एक लंबी संख्याकारकों का वर्णन सांख्यिकीय संबंधों के माध्यम से किया जाता है, अर्थात् संबंध प्रसंभात्य (संयोग से) नियतात्मकजब एक चर के विभिन्न मान दूसरे चर के विभिन्न मूल्यों के अनुरूप होते हैं।

स्टोकेस्टिक निर्भरता का सबसे महत्वपूर्ण (और सामान्य) मामला है सह - संबंधलत. इस तरह की निर्भरता के साथ, कारण स्पष्ट रूप से प्रभाव को निर्धारित नहीं करता है, लेकिन केवल एक निश्चित डिग्री की संभावना के साथ। ऐसे संबंधों की पहचान के लिए एक अलग प्रकार का सांख्यिकीय विश्लेषण समर्पित है - सहसंबंध विश्लेषण।

मुख्य कामसहसंबंध विश्लेषण - अध्ययन की गई विशेषताओं के बीच मौजूद संबंध की मात्रात्मक अभिव्यक्ति स्थापित करने के लिए कड़ाई से गणितीय तरीकों के आधार पर। सहसंबंध की गणना कैसे की जाती है, इसके लिए कई दृष्टिकोण हैं और तदनुसार, कई प्रकार के सहसंबंध गुणांक: आकस्मिकता गुणांक ए.ए. चुप्रोव (गुणात्मक विशेषताओं के बीच संबंध को मापने के लिए), के। पियर्सन का संघ गुणांक, साथ ही स्पीयरमैन और केंडल के रैंक सहसंबंध गुणांक। सामान्य स्थिति में, ऐसे गुणांक उस संभावना को दर्शाते हैं जिसके साथ अध्ययन किए गए संबंध प्रकट होते हैं। तदनुसार, गुणांक जितना अधिक होगा, सुविधाओं के बीच संबंध उतना ही अधिक स्पष्ट होगा।

अध्ययन किए गए कारकों के बीच प्रत्यक्ष और व्युत्क्रम दोनों सहसंबंध मौजूद हो सकते हैं। सीधासह - संबंधलतऐसे मामलों में देखा जाता है जहां कारक के मूल्यों में परिवर्तन परिणामी विशेषता के मूल्य में समान परिवर्तन से मेल खाता है, अर्थात, जब कारक विशेषता का मूल्य बढ़ता है, तो प्रभावी विशेषता का मूल्य भी बढ़ जाता है, और इसके विपरीत विपरीत। उदाहरण के लिए, आपराधिक कारकों और अपराध के बीच सीधा संबंध है ("+" चिह्न के साथ)। यदि एक विशेषता के मूल्यों में वृद्धि दूसरे के मूल्यों में विपरीत परिवर्तन का कारण बनती है, तो ऐसे संबंध को कहा जाता है उल्टा. उदाहरण के लिए, किसी समाज में सामाजिक नियंत्रण जितना अधिक होगा, अपराध दर उतनी ही कम होगी ("-" चिह्न के साथ संबंध)।

प्रत्यक्ष और प्रतिक्रिया दोनों सीधे और घुमावदार हो सकते हैं।

सीधा (रैखिक) संबंध तब प्रकट होते हैं, जब विशेषता-कारक के मूल्यों में वृद्धि के साथ, विशेषता-परिणाम के मूल्य में वृद्धि (प्रत्यक्ष) या कमी (रिवर्स) होती है। गणितीय रूप से, ऐसा संबंध प्रतिगमन समीकरण द्वारा व्यक्त किया जाता है: पर = + बीएक्स, कहाँ पे पर - संकेत-परिणाम; और बी - संगत युग्मन गुणांक; एक्स - संकेत-कारक।

वक्रीय कनेक्शन अलग हैं। कारक विशेषता के मूल्य में वृद्धि का परिणामी विशेषता के मूल्य पर असमान प्रभाव पड़ता है। प्रारंभ में, यह संबंध प्रत्यक्ष हो सकता है, और फिर उल्टा हो सकता है। एक प्रसिद्ध उदाहरण अपराधियों की उम्र के साथ अपराधों का संबंध है। सबसे पहले, व्यक्तियों की आपराधिक गतिविधि अपराधियों की उम्र में वृद्धि (लगभग 30 वर्ष तक) के अनुपात में बढ़ती है, और फिर, बढ़ती उम्र के साथ, आपराधिक गतिविधि कम हो जाती है। इसके अलावा, उम्र के हिसाब से अपराधियों के वितरण वक्र का शिखर औसत से बाईं ओर (छोटी उम्र की ओर) स्थानांतरित हो जाता है और असममित होता है।

सहसंबंध सीधा लिंक हो सकता है एकके विषय मेंकारख़ाने का, जब एक संकेत-कारक और एक संकेत-परिणाम के बीच संबंध की जांच की जाती है (जोड़ी सहसंबंध)। वे भी हो सकते हैं बहुक्रियात्मक,जब संकेत-परिणाम (बहु सहसंबंध) पर कई अंतःक्रियात्मक संकेत-कारकों के प्रभाव का अध्ययन किया जाता है।

लेकिन, कोई फर्क नहीं पड़ता कि कौन से सहसंबंध गुणांक का उपयोग किया जाता है, इससे कोई फर्क नहीं पड़ता कि किस सहसंबंध का अध्ययन किया गया है, केवल सांख्यिकीय संकेतकों के आधार पर संकेतों के बीच संबंध स्थापित करना असंभव है। संकेतकों का प्रारंभिक विश्लेषण हमेशा एक विश्लेषण होता है गुणात्मक, जिसके दौरान घटना की सामाजिक-कानूनी प्रकृति का अध्ययन और समझा जाता है। इस मामले में, उन वैज्ञानिक विधियों और दृष्टिकोणों का उपयोग किया जाता है जो विज्ञान की उस शाखा की विशेषता है जो इस घटना (समाजशास्त्र, कानून, मनोविज्ञान, आदि) का अध्ययन करती है। फिर, समूहों और औसत का विश्लेषण आपको परिकल्पनाओं को आगे बढ़ाने, मॉडल बनाने, कनेक्शन के प्रकार और निर्भरता को निर्धारित करने की अनुमति देता है। इसके बाद ही निर्धारित निर्भरता की मात्रात्मक विशेषता है - वास्तव में, सहसंबंध गुणांक।

साहित्य

1. अवनेसोव जी.ए. आपराधिक पूर्वानुमान की मूल बातें। ट्यूटोरियल। मॉस्को: यूएसएसआर के आंतरिक मामलों के मंत्रालय का उच्च विद्यालय, 1970।

2. अवरुतिन के.ई., गिलिंस्की वाई.आई. क्षेत्र में अपराध का आपराधिक विश्लेषण: कार्यप्रणाली, तकनीक, तकनीक। एल।, 1991।

3. एडमोव ई। एट अल। अर्थशास्त्र और फर्मों के आँकड़े: पाठ्यपुस्तक / एड। एस.डी. इलेनकोवा। एम.: वित्त और सांख्यिकी, 2008।

4. बालाकिना एन.एन. सांख्यिकी: प्रो. - तरीका। जटिल। खाबरोवस्क: आईवीईएसईपी, खाबरोवस्क में शाखा, 2008।

5. ब्लुवेशिन यू.डी., वोल्कोव जी.आई. समय श्रृंखलाअपराध: एक अध्ययन गाइड। मिन्स्क, 1984।

6. बोरोविकोव वी.पी., बोरोविकोव आई.पी. STATISTICA - सांख्यिकीय विश्लेषण और डेटा प्रोसेसिंग in विंडोज वातावरण. एम .: सूचना और प्रकाशन गृह "फिलिन", 1997।

7. बोरोडिन एस.वी. अपराध के खिलाफ लड़ाई : सैद्धांतिक मॉडलव्यापक कार्यक्रम। मॉस्को: नौका, 1990।

8. सांख्यिकी के प्रश्न // रूसी संघ की राज्य सांख्यिकी समिति की मासिक वैज्ञानिक और सूचना पत्रिका। एम।, 2002-2009।

9. गुसारोव वी.एम. सांख्यिकी: प्रो. विश्वविद्यालयों के लिए भत्ता। एम.: यूनिटी-दाना, 2009।

10. डोब्रिनिना एन.वी., निमेन्या आई.एन. सांख्यिकी: प्रो. - तरीका। भत्ता। सेंट पीटर्सबर्ग: एसपीबीजीआईईयू, 2009।

11. एलिसेवा आई.आई., युजबाशेव एम.एम. सामान्य सिद्धांतसांख्यिकी: विश्वविद्यालयों के लिए पाठ्यपुस्तक / एड.आई. I. एलिसेवा। चौथा संस्करण। एम.: वित्त और सांख्यिकी, 1999।

12. एलिसेवा आई.आई., युजबाशेव एम.एम. सांख्यिकी का सामान्य सिद्धांत: पाठ्यपुस्तक। - एम .: वित्त और सांख्यिकी, 1995।

13. एरेमिना टी।, मटियातिना वी।, प्लुशेवस्काया यू। रूसी अर्थव्यवस्था के क्षेत्रों के विकास की समस्याएं // अर्थशास्त्र के प्रश्न। 2009. नंबर 7.

14. एफिमोवा एम.आर., गैंचेंको ओ.आई., पेट्रोवा ई.वी. सांख्यिकी के सामान्य सिद्धांत पर कार्यशाला: प्रो. भत्ता। दूसरा संस्करण।, संशोधित। और अतिरिक्त एम.: वित्त और सांख्यिकी, 2009।

15. एफिमोवा एम.आर., पेट्रोवा ई.वी., रुम्यंतसेव वी.एन. सांख्यिकी का सामान्य सिद्धांत: पाठ्यपुस्तक। - एम.: इंफ्रा-एम, 1998।

16. किरिलोव एल.ए. आंतरिक मामलों के निकायों द्वारा आपराधिक अध्ययन और अपराध की रोकथाम एम।, 1992।

17. कोसोप्लेचेव एन.पी., आपराधिक अनुसंधान के तरीके। एम।, 1984।

18. ली डी.ए. रूस में अपराध: सिस्टम विश्लेषण। एम।, 1997।

19. ली डी.ए. आपराधिक सांख्यिकीय लेखांकन: संरचनात्मक और कार्यात्मक पैटर्न। एम।: सूचना और प्रकाशन एजेंसी "रूसी दुनिया", 1998।

20. मकारोवा एन.वी., ट्रोफिमेट्स वी.वाईए। एक्सेल में सांख्यिकी: प्रो। भत्ता। एम.: वित्त और सांख्यिकी, 2009।

21. नेस्टरोव एल.आई. राष्ट्रीय धन के आँकड़ों में नए रुझान // सांख्यिकी के प्रश्न। 2008. नंबर 11.

22. पेट्रोवा ई.वी. और अन्य।परिवहन सांख्यिकी पर कार्यशाला: प्रो। भत्ता। एम.: वित्त और सांख्यिकी, 2008।

23. नब्बे के दशक में रूस में अपराध और वैधता के कुछ पहलू और इसके खिलाफ लड़ाई। एम।, 1995।

24. अपराध, सांख्यिकी, कानून // एड। प्रो ए.आई. ऋृण। मॉस्को: क्रिमिनोलॉजिकल एसोसिएशन, 1997।

25. रोस्तोव के.टी. रूस के क्षेत्रों में अपराध (सामाजिक और आपराधिक विश्लेषण)। सेंट पीटर्सबर्ग: रूस के आंतरिक मामलों के मंत्रालय की सेंट पीटर्सबर्ग अकादमी, 1998।

26. 2002 की अखिल रूसी जनसंख्या जनगणना के संचालन और जनगणना दस्तावेजों को भरने की प्रक्रिया पर जनगणना लेने वाले के लिए दिशानिर्देश। एम .: PIK "ऑफ़सेट", 2003।

27. सव्युक एल.के. कानूनी आँकड़े: पाठ्यपुस्तक। एम.: न्यायविद, 1999।

28. सालिन वी.एन., शापकोवस्काया ई.पी. सामाजिक-आर्थिक सांख्यिकी: विश्वविद्यालयों के लिए पाठ्यपुस्तक। मॉस्को: गार्डानिका वकील, 2008।

29. सिडेंको ए.वी., पोपोव जी.यू., मतवेवा वी.एम. सांख्यिकी: पाठ्यपुस्तक। मॉस्को: बिजनेस एंड सर्विस, 2008।

30. अपराधों की सामाजिक रोकथाम: सलाह, सिफारिशें // एड। हां। केरीमोव। एम।, 1989।

31. सामाजिक सांख्यिकी: विश्वविद्यालयों के लिए पाठ्यपुस्तक // एड। आई.आई. एलिसेवा। तीसरा संस्करण। एम.: वित्त और सांख्यिकी, 2009।

Allbest.ru . पर होस्ट किया गया

इसी तरह के दस्तावेज़

    सांख्यिकीय विश्लेषण के मुख्य तरीकों पर विचार। कुंगुरस्की नगरपालिका जिले का अध्ययन। वार्षिकी के संकेतकों के अनुसार गणना करना। आवेदन के परिणामों के आधार पर क्षेत्र की जनसांख्यिकी और सामाजिक-आर्थिक विकास का विश्लेषण।

    टर्म पेपर, जोड़ा गया 06/24/2015

    औसत मूल्य - मुक्त विशेषताप्रक्रिया की नियमितता उन परिस्थितियों में जिसमें यह घटित होती है। औसत मूल्यों की गणना के लिए रूप और तरीके। अभ्यास में औसत लागू करना: विभेदन की गणना करना वेतनअर्थव्यवस्था के क्षेत्रों द्वारा।

    टर्म पेपर, जोड़ा गया 12/04/2007

    तलाक के विश्लेषण के सांख्यिकीय तरीके। अमूर क्षेत्र में तलाक का सांख्यिकीय विश्लेषण। तलाक की गतिशीलता और संरचना का विश्लेषण। प्रति वर्ष तलाक की संख्या के अनुसार अमूर क्षेत्र के शहरों और जिलों का समूहन। औसत मूल्यों की गणना और भिन्नता के संकेतक।

    टर्म पेपर, जोड़ा गया 04/12/2014

    आवास प्रावधान के सांख्यिकीय विश्लेषण के पहलू। जनसंख्या के आवास प्रावधान के विश्लेषण के लिए सांख्यिकीय विधियों का अनुप्रयोग। जनसांख्यिकीय भार कारक के संदर्भ में जिलों की जनसंख्या की एकरूपता का विश्लेषण। सहसंबंध-प्रतिगमन विश्लेषण।

    टर्म पेपर, जोड़ा गया 01/18/2009

    संगठन राज्य के आंकड़ेरूस में। एकत्रित डेटा के लिए आवश्यकताएँ। सांख्यिकीय अवलोकन के रूप, प्रकार और तरीके। सांख्यिकीय अवलोकन की तैयारी। सांख्यिकीय अवलोकन की त्रुटियां। आँकड़ों की निगरानी के लिए तरीके।

    सार, 02.12.2007 को जोड़ा गया

    आपराधिक कानून के आंकड़ों, इसके मुख्य चरणों और आवश्यकताओं, कार्यान्वयन के तरीकों और प्रक्रियाओं के लिए एक निगरानी कार्यक्रम का विकास। अध्ययन क्षेत्र में अपराध की स्थिति का निर्धारण। सांख्यिकीय अवलोकन के परिणामों के पंजीकरण के लिए नियम।

    परीक्षण, जोड़ा गया 05/18/2010

    सांख्यिकीय प्रलेखन का वर्गीकरण। दस्तावेजों के प्रकार: लिखित, प्रतीकात्मक, सांख्यिकीय और ध्वन्यात्मक। सामग्री के विश्लेषण के तरीके और तरीके: गैर-औपचारिक (पारंपरिक) और औपचारिक। सामग्री विश्लेषण के कार्यान्वयन की प्रक्रिया।

    प्रस्तुति, जोड़ा गया 02/16/2014

    संकल्पना मध्यम आकार. सामाजिक घटनाओं के अध्ययन में औसत की विधि। सामाजिक घटनाओं के अध्ययन में औसत पद्धति के आवेदन की प्रासंगिकता एकवचन से सामान्य तक, यादृच्छिक से नियमित तक जाने की संभावना से सुनिश्चित होती है।

    टर्म पेपर, जोड़ा गया 01/13/2009

    सांख्यिकीय अवलोकन की अवधारणा। सीधा और वक्रता का विश्लेषण सहसंबंध. सांख्यिकीय अवलोकन के सूत्रों और मूल्यों से परिचित होना। सूचकांकों के संबंध की गणना का विश्लेषण, एक हिस्टोग्राम का निर्माण, एक वितरण श्रृंखला के तत्व।

    परीक्षण, जोड़ा गया 03/27/2012

    सांख्यिकीय विश्लेषण के मुख्य संकेतकों के लक्षण सामाजिक कंडीशनिंग सार्वजनिक स्वास्थ्यमें रूसी संघ. सामाजिक चिकित्सा के दृष्टिकोण से स्वास्थ्य मूल्यांकन के स्तर। स्वास्थ्य समूहों द्वारा जनसंख्या के बच्चों के हिस्से का वर्गीकरण।

में पर्याप्त रूप से विस्तृत घरेलू साहित्य. इस बीच, रूसी उद्यमों के अभ्यास में, उनमें से केवल कुछ का ही उपयोग किया जाता है। आगे कुछ पर विचार करें तरीकों सांख्यिकीय प्रसंस्करण.

सामान्य जानकारी

घरेलू उद्यमों के व्यवहार में, यह मुख्य रूप से आम है सांख्यिकीय नियंत्रण के तरीके. अगर हम तकनीकी प्रक्रिया के नियमन के बारे में बात करते हैं, तो यह बहुत कम ही नोट किया जाता है। सांख्यिकीय विधियों का अनुप्रयोगप्रदान करता है कि उद्यम में उपयुक्त योग्यता रखने वाले विशेषज्ञों का एक समूह बनाया जाता है।

अर्थ

आईएसओ सेर के अनुसार। 9000, आपूर्तिकर्ता को अवसरों के विकास, विनियमन और परीक्षण के दौरान लागू सांख्यिकीय विधियों की आवश्यकता को निर्धारित करने की आवश्यकता है उत्पादन प्रक्रियाऔर उत्पाद विशेषताओं। उपयोग की जाने वाली विधियाँ संभाव्यता के सिद्धांत और गणितीय गणनाओं पर आधारित हैं। डेटा विश्लेषण के लिए सांख्यिकीय तरीकेउत्पाद जीवन चक्र के किसी भी चरण में लागू किया जा सकता है। वे उत्पाद की विविधता की डिग्री या स्थापित संप्रदायों या आवश्यक मूल्यों के सापेक्ष इसके गुणों की परिवर्तनशीलता के साथ-साथ इसके निर्माण की प्रक्रिया की परिवर्तनशीलता का आकलन और खाता प्रदान करते हैं। सांख्यिकीय तरीके हैंतरीके जिससे आप कर सकते हैं दी गई सटीकताऔर जांच की जा रही घटना की स्थिति का न्याय करने के लिए विश्वसनीयता। वे आपको कुछ समस्याओं की भविष्यवाणी करने, अध्ययन की गई तथ्यात्मक जानकारी, प्रवृत्तियों और पैटर्न के आधार पर इष्टतम समाधान विकसित करने की अनुमति देते हैं।

उपयोग की दिशा

मुख्य क्षेत्र जिनमें व्यापक हैं सांख्यिकीय तरीके हैं:


विकसित देशों का अभ्यास

सांख्यिकीय तरीके हैंएक आधार जो उच्च उपभोक्ता विशेषताओं वाले उत्पादों के निर्माण को सुनिश्चित करता है। इन तकनीकों का व्यापक रूप से औद्योगिक देशों में उपयोग किया जाता है। सांख्यिकीय तरीके, वास्तव में, गारंटी देते हैं कि उपभोक्ताओं को ऐसे उत्पाद प्राप्त होते हैं जो स्थापित आवश्यकताओं को पूरा करते हैं। उनके उपयोग का प्रभाव अभ्यास से सिद्ध हुआ है। औद्योगिक उद्यमजापान। यह वे थे जिन्होंने इस देश में उच्चतम उत्पादन स्तर की उपलब्धि में योगदान दिया। विदेशों का लंबा अनुभव बताता है कि ये तकनीकें कितनी कारगर हैं। विशेष रूप से, यह ज्ञात है कि हेवलेट पैकार्ड, सांख्यिकीय विधियों का उपयोग करते हुए, एक मामले में प्रति माह विवाह की संख्या को 9,000 से घटाकर 45 यूनिट करने में सक्षम था।

कार्यान्वयन की कठिनाइयाँ

घरेलू व्यवहार में, कई बाधाएं हैं जो उपयोग की अनुमति नहीं देती हैं अध्ययन के सांख्यिकीय तरीकेसंकेतक। इसके कारण कठिनाइयाँ उत्पन्न होती हैं:


कार्यक्रम विकास

यह कहा जाना चाहिए कि गुणवत्ता के क्षेत्र में कुछ सांख्यिकीय विधियों की आवश्यकता का निर्धारण, विशिष्ट तकनीकों को चुनना, महारत हासिल करना किसी भी घरेलू उद्यम के लिए एक जटिल और लंबा काम है। इसके प्रभावी कार्यान्वयन के लिए, एक विशेष दीर्घकालिक कार्यक्रम विकसित करने की सलाह दी जाती है। इसे एक सेवा के गठन के लिए प्रदान करना चाहिए जिसके कार्यों में संगठन शामिल होगा और कार्यप्रणाली गाइडसांख्यिकीय विधियों का अनुप्रयोग। कार्यक्रम के ढांचे के भीतर, उपयुक्त तकनीकी साधनों, प्रशिक्षण विशेषज्ञों से लैस करने और उत्पादन कार्यों की संरचना का निर्धारण करने के लिए प्रदान करना आवश्यक है जिसे चयनित विधियों का उपयोग करके हल किया जाना चाहिए। सरलतम तरीकों का उपयोग करके शुरू करने के लिए माहिर की सिफारिश की जाती है। उदाहरण के लिए, आप प्रसिद्ध प्राथमिक उत्पादन का उपयोग कर सकते हैं। इसके बाद, अन्य तरीकों पर आगे बढ़ने की सलाह दी जाती है। उदाहरण के लिए, यह विचरण का विश्लेषण, सूचना का चयनात्मक प्रसंस्करण, प्रक्रियाओं का विनियमन, तथ्यात्मक अनुसंधान और प्रयोगों की योजना आदि हो सकता है।

वर्गीकरण

आर्थिक विश्लेषण के सांख्यिकीय तरीकों में शामिल हैं:विभिन्न चालें। कहने की जरूरत नहीं है, उनमें से काफी कुछ हैं। हालांकि, जापान में गुणवत्ता प्रबंधन के क्षेत्र में एक प्रमुख विशेषज्ञ, के. इशिकावा, सात बुनियादी तरीकों का उपयोग करने की सलाह देते हैं:

  1. परेटो चार्ट।
  2. सामान्य विशेषताओं के अनुसार समूहीकरण जानकारी।
  3. नियंत्रण कार्ड।
  4. कारण और प्रभाव आरेख।
  5. हिस्टोग्राम।
  6. नियंत्रण पत्रक।
  7. स्कैटर चार्ट।

प्रबंधन के क्षेत्र में अपने स्वयं के अनुभव के आधार पर, इशिकावा का दावा है कि उद्यम में सभी मुद्दों और समस्याओं का 95% इन सात दृष्टिकोणों का उपयोग करके हल किया जा सकता है।

परेटो चार्ट

यह एक निश्चित अनुपात पर आधारित है। इसे "पेरेटो सिद्धांत" कहा गया है। उनके अनुसार, 20% कारणों में से 80% परिणाम सामने आते हैं। प्रत्येक परिस्थिति के सापेक्ष प्रभाव को स्पष्ट और समझने योग्य तरीके से दिखाता है आम समस्याघटते क्रम में। इस प्रभाव की जांच प्रत्येक कारण से होने वाले नुकसान, दोषों की संख्या पर की जा सकती है। सापेक्ष प्रभाव को बार, संचयी सीधी रेखा द्वारा कारकों के संचयी प्रभाव द्वारा सचित्र किया जाता है।

कारण और प्रभाव आरेख

इस पर अध्ययन के तहत समस्या को पारंपरिक रूप से एक क्षैतिज सीधे तीर के रूप में दर्शाया गया है, और परोक्ष या प्रत्यक्ष रूप से इसे प्रभावित करने वाली स्थितियां और कारक तिरछे तीर के रूप में हैं। निर्माण करते समय, प्रतीत होता है कि नगण्य परिस्थितियों को भी ध्यान में रखा जाना चाहिए। यह इस तथ्य के कारण है कि व्यवहार में अक्सर ऐसे मामले होते हैं जिनमें कई प्रतीत होने वाले महत्वहीन कारकों को छोड़कर समस्या का समाधान सुनिश्चित किया जाता है। मुख्य परिस्थितियों (पहले और बाद के आदेशों के) को प्रभावित करने वाले कारणों को आरेख पर क्षैतिज छोटे तीरों के साथ दर्शाया गया है। विस्तृत आरेख मछली के कंकाल के रूप में होगा।

समूहीकरण जानकारी

यह आर्थिक-सांख्यिकीय विधिकिसी वस्तु के एक या अधिक मापदंडों का मूल्यांकन और माप करके प्राप्त किए गए संकेतकों के एक सेट को व्यवस्थित करने के लिए उपयोग किया जाता है। एक नियम के रूप में, ऐसी जानकारी मूल्यों के एक अनियंत्रित अनुक्रम के रूप में प्रस्तुत की जाती है। ये वर्कपीस के रैखिक आयाम, गलनांक, सामग्री की कठोरता, दोषों की संख्या आदि हो सकते हैं। ऐसी प्रणाली के आधार पर, उत्पाद के गुणों या इसके निर्माण की प्रक्रियाओं के बारे में निष्कर्ष निकालना मुश्किल है। आदेश का उपयोग करके किया जाता है रेखा चार्ट. वे एक निश्चित अवधि में देखे गए मापदंडों में स्पष्ट रूप से परिवर्तन दिखाते हैं।

नियंत्रण पत्र

एक नियम के रूप में, यह संबंधित अंतराल में वस्तु के मापदंडों के मापा मूल्यों की घटना के लिए एक आवृत्ति वितरण तालिका के रूप में प्रस्तुत किया जाता है। जाँच सूची अध्ययन के उद्देश्य के आधार पर संकलित की जाती है। संकेतक मानों की श्रेणी को समान अंतरालों में विभाजित किया गया है। उनकी संख्या आमतौर पर लिए गए मापों की संख्या के वर्गमूल के बराबर चुनी जाती है। फॉर्म भरने, पढ़ने, चेक करने में आने वाली समस्याओं को खत्म करने के लिए फॉर्म सरल होना चाहिए।

दंड आरेख

इसे एक चरणबद्ध बहुभुज के रूप में प्रस्तुत किया जाता है। यह माप संकेतकों के वितरण को स्पष्ट रूप से दर्शाता है। श्रेणी मान सेट करेंको समान अंतरालों में विभाजित किया जाता है, जो x-अक्ष के अनुदिश रखे जाते हैं। प्रत्येक अंतराल के लिए एक आयत बनाया गया है। इसकी ऊंचाई दिए गए अंतराल में मान के घटित होने की आवृत्ति के बराबर है।

तितर बितर भूखंडों

उनका उपयोग दो के बीच संबंध के बारे में परिकल्पना का परीक्षण करने के लिए किया जाता है चर. मॉडल निम्नानुसार बनाया गया है। एक पैरामीटर का मान एब्सिस्सा अक्ष पर प्लॉट किया जाता है, और दूसरे संकेतक का मान कोर्डिनेट पर प्लॉट किया जाता है। नतीजतन, ग्राफ पर एक बिंदु दिखाई देता है। ये क्रियाएं चर के सभी मानों के लिए दोहराई जाती हैं। यदि कोई संबंध है, तो सहसंबंध क्षेत्र बढ़ाया जाता है, और दिशा y-अक्ष की दिशा से मेल नहीं खाती। यदि कोई बाधा नहीं है, तो यह किसी एक कुल्हाड़ी के समानांतर होगा या एक वृत्त के आकार का होगा।

नियंत्रण कार्ड

किसी विशिष्ट अवधि में किसी प्रक्रिया का मूल्यांकन करते समय उनका उपयोग किया जाता है। नियंत्रण चार्ट का निर्माण निम्नलिखित प्रावधानों पर आधारित है:

  1. सभी प्रक्रियाएं समय के साथ निर्धारित मापदंडों से विचलित होती हैं।
  2. घटना का अस्थिर पाठ्यक्रम संयोग से नहीं बदलता है। अपेक्षित सीमा की सीमाओं से परे जाने वाले विचलन गैर-यादृच्छिक हैं।
  3. व्यक्तिगत परिवर्तनों की भविष्यवाणी की जा सकती है।
  4. एक स्थिर प्रक्रिया बेतरतीब ढंग से अपेक्षित सीमा के भीतर विचलित हो सकती है।

रूसी उद्यमों के अभ्यास में उपयोग करें

यह कहा जाना चाहिए कि घरेलू और विदेशी अनुभव से पता चलता है कि उपकरण और तकनीकी प्रक्रियाओं की स्थिरता और सटीकता का आकलन करने के लिए सबसे प्रभावी सांख्यिकीय तरीका नियंत्रण चार्ट का संकलन है। इस पद्धति का उपयोग उत्पादन क्षमता क्षमताओं के नियमन में भी किया जाता है। मानचित्रों का निर्माण करते समय, अध्ययन के तहत पैरामीटर को सही ढंग से चुनना आवश्यक है। उन संकेतकों को वरीयता देने की सिफारिश की जाती है जो सीधे उत्पाद के उद्देश्य से संबंधित हैं, जिन्हें आसानी से मापा जा सकता है और प्रक्रिया नियंत्रण से प्रभावित हो सकते हैं। यदि ऐसा विकल्प कठिन है या उचित नहीं है, तो नियंत्रित पैरामीटर के साथ सहसंबद्ध (अंतरसंबंधित) मूल्यों का मूल्यांकन करना संभव है।

बारीकियों

यदि मात्रात्मक मानदंड के अनुसार मानचित्रण के लिए आवश्यक सटीकता के साथ संकेतकों का माप आर्थिक या तकनीकी रूप से संभव नहीं है, तो एक वैकल्पिक संकेत का उपयोग किया जाता है। इसके साथ "विवाह" और "दोष" जैसे शब्द जुड़े हुए हैं। उत्तरार्द्ध को स्थापित आवश्यकताओं के साथ उत्पाद के प्रत्येक अलग गैर-अनुपालन के रूप में समझा जाता है। विवाह एक ऐसा उत्पाद है, जिसके प्रावधान में दोषों की उपस्थिति के कारण उपभोक्ताओं को अनुमति नहीं है।

peculiarities

प्रत्येक प्रकार के कार्ड की अपनी विशिष्टताएँ होती हैं। किसी विशेष मामले के लिए उन्हें चुनते समय इसे ध्यान में रखा जाना चाहिए। मात्रात्मक मानदंड के आधार पर कार्ड को वैकल्पिक सुविधा का उपयोग करने वालों की तुलना में परिवर्तनों को संसाधित करने के लिए अधिक संवेदनशील माना जाता है। हालांकि, पूर्व अधिक श्रम गहन हैं। इनके लिए उपयोग किया जाता है:

  1. प्रक्रिया डिबगिंग।
  2. प्रौद्योगिकी शुरू करने की संभावनाओं का आकलन।
  3. उपकरण की सटीकता की जाँच करना।
  4. सहिष्णुता परिभाषाएँ।
  5. एकाधिक मैपिंग स्वीकार्य तरीकेउत्पाद निर्माण।

इसके साथ ही

यदि प्रक्रिया के विकार को नियंत्रित पैरामीटर के विस्थापन की विशेषता है, तो एक्स-मैप्स का उपयोग करना आवश्यक है। यदि मूल्यों के फैलाव में वृद्धि होती है, तो आर या एस मॉडल को चुना जाना चाहिए। हालांकि, कई विशेषताओं को ध्यान में रखना आवश्यक है। विशेष रूप से, एस-चार्ट के उपयोग से आर-मॉडल की तुलना में प्रक्रिया के विकार को अधिक सटीक और जल्दी से स्थापित करना संभव हो जाएगा। साथ ही, बाद के निर्माण के लिए जटिल गणना की आवश्यकता नहीं होती है।

निष्कर्ष

अर्थशास्त्र में, उन कारकों का पता लगाना संभव है जो के पाठ्यक्रम में प्रकट होते हैं गुणात्मक मूल्यांकन, अंतरिक्ष और गतिकी में। उनका उपयोग भविष्य कहनेवाला गणना करने के लिए किया जा सकता है। आर्थिक विश्लेषण के सांख्यिकीय तरीकों में आर्थिक प्रक्रियाओं और घटनाओं के कारण और प्रभाव संबंधों का आकलन करने, प्रदर्शन में सुधार के लिए आशाजनक और अप्रयुक्त भंडार की पहचान करने के तरीके शामिल नहीं हैं। दूसरे शब्दों में, तथ्यात्मक तकनीकों को माना दृष्टिकोणों में शामिल नहीं किया गया है।

सांख्यिकी"जैव सांख्यिकी".

1. नाममात्र;
2. क्रमसूचक;
3. अंतराल;

नमूने

प्रतिनिधि

नमूना फ्रेम सरल यादृच्छिक नमूना अंतराल नमूनाकरण

स्तरीकृत प्रतिचयन

समूहऔर नमूनाकरण कोटा

शून्य परिकल्पना

वैकल्पिक परिकल्पना शक्ति

आत्मविश्वास का स्तर».


शीर्षक: सांख्यिकीय डेटा विश्लेषण के मूल सिद्धांत
विस्तृत विवरण:

किसी भी वैज्ञानिक अनुसंधान, मौलिक या प्रायोगिक के पूरा होने के बाद, प्राप्त आंकड़ों का सांख्यिकीय विश्लेषण किया जाता है। सांख्यिकीय विश्लेषण को सफलतापूर्वक करने के लिए और कार्यों को हल करने के लिए, अध्ययन को ठीक से नियोजित किया जाना चाहिए। इसलिए, आँकड़ों की मूल बातें समझे बिना, वैज्ञानिक प्रयोग के परिणामों की योजना बनाना और उन्हें संसाधित करना असंभव है। हालांकि, चिकित्सीय शिक्षान केवल आँकड़ों का ज्ञान प्रदान करता है, बल्कि मूल बातें भी उच्च गणित. इसलिए, बहुत बार किसी की राय आ सकती है कि केवल एक सांख्यिकीविद् को जैव चिकित्सा अनुसंधान में सांख्यिकीय प्रसंस्करण से निपटना चाहिए, और एक चिकित्सा शोधकर्ता को अपने स्वयं के चिकित्सा मुद्दों पर ध्यान केंद्रित करना चाहिए। वैज्ञानिकों का काम. डेटा विश्लेषण में सहायता के लिए श्रम का ऐसा विभाजन पूरी तरह से उचित है। हालांकि, किसी विशेषज्ञ के लिए समस्या की गलत सेटिंग से बचने के लिए कम से कम आंकड़ों के सिद्धांतों की समझ आवश्यक है, जिसके साथ संचार अध्ययन शुरू होने से पहले डेटा प्रोसेसिंग के चरण में उतना ही महत्वपूर्ण है।

सांख्यिकीय विश्लेषण की मूल बातों के बारे में बात करने से पहले, शब्द का अर्थ स्पष्ट करना आवश्यक है " सांख्यिकी". कई परिभाषाएँ हैं, लेकिन सबसे पूर्ण और संक्षिप्त, हमारी राय में, "डेटा एकत्र करने, प्रस्तुत करने और विश्लेषण करने का विज्ञान" के रूप में सांख्यिकी की परिभाषा है। बदले में, जीवित दुनिया के लिए अनुप्रयोगों में आँकड़ों के उपयोग को "बायोमेट्रिक्स" या " जैव सांख्यिकी".

यह ध्यान दिया जाना चाहिए कि अक्सर आंकड़े केवल प्रयोगात्मक डेटा के प्रसंस्करण के लिए कम हो जाते हैं, उन्हें प्राप्त करने के चरण पर ध्यान दिए बिना। हालाँकि, प्रयोग की योजना बनाते समय पहले से ही सांख्यिकीय ज्ञान की आवश्यकता होती है, ताकि इसके दौरान प्राप्त संकेतक शोधकर्ता को दे सकें विश्वसनीय जानकारी. इसलिए, हम कह सकते हैं कि प्रयोग के परिणामों का सांख्यिकीय विश्लेषण अध्ययन शुरू होने से पहले ही शुरू हो जाता है।

पहले से ही एक योजना विकसित करने के चरण में, शोधकर्ता को स्पष्ट रूप से समझना चाहिए कि उसके काम में किस प्रकार के चर होंगे। सभी चरों को दो वर्गों में विभाजित किया जा सकता है: गुणात्मक और मात्रात्मक। एक चर किस सीमा तक ले सकता है यह माप के पैमाने पर निर्भर करता है। चार मुख्य पैमाने हैं:

1. नाममात्र;
2. क्रमसूचक;
3. अंतराल;
4. तर्कसंगत (संबंधों का पैमाना)।

नाममात्र पैमाने ("नाम" के पैमाने) में वस्तुओं के कुछ वर्गों का वर्णन करने के लिए केवल प्रतीक हैं, उदाहरण के लिए, "लिंग" या "रोगी का पेशा"। नाममात्र पैमाने का तात्पर्य है कि चर मान लेगा, मात्रात्मक संबंध जिनके बीच निर्धारित नहीं किया जा सकता है। इस प्रकार, नर और मादा लिंगों के बीच गणितीय संबंध स्थापित करना असंभव है। पारंपरिक संख्यात्मक पदनाम (महिला - 0, पुरुष - 1, या इसके विपरीत) बिल्कुल मनमाने ढंग से दिए गए हैं और केवल कंप्यूटर प्रसंस्करण के लिए अभिप्रेत हैं। नाममात्र का पैमाना अपने शुद्ध रूप में गुणात्मक है, इस पैमाने में अलग-अलग श्रेणियां आवृत्तियों (संख्या या टिप्पणियों के अनुपात, प्रतिशत) द्वारा व्यक्त की जाती हैं।

क्रमिक (क्रमिक) पैमाना यह प्रदान करता है कि इसमें अलग-अलग श्रेणियों को आरोही या अवरोही क्रम में व्यवस्थित किया जा सकता है। चिकित्सा आँकड़ों में, एक सामान्य पैमाने का एक उत्कृष्ट उदाहरण एक बीमारी की गंभीरता का क्रम है। इस मामले में, हम आरोही क्रम में गंभीरता का निर्माण कर सकते हैं, लेकिन फिर भी मात्रात्मक संबंधों को निर्दिष्ट करने की क्षमता नहीं है, यानी क्रमिक पैमाने में मापा मूल्यों के बीच की दूरी अज्ञात है या कोई फर्क नहीं पड़ता। "गंभीरता" चर के मूल्यों के क्रम को स्थापित करना आसान है, लेकिन यह निर्धारित करना असंभव है कि एक गंभीर स्थिति कितनी बार मध्यम स्थिति से भिन्न होती है।

क्रमिक पैमाना लिंग को संदर्भित करता है मात्रात्मक प्रकारडेटा, और इसके उन्नयन को आवृत्तियों (एक गुणात्मक पैमाने के रूप में) और उपायों द्वारा वर्णित किया जा सकता है केंद्रीय मूल्यजिस पर हम नीचे ध्यान देंगे।

अंतराल और तर्कसंगत पैमाने विशुद्ध रूप से मात्रात्मक डेटा प्रकार हैं। अंतराल पैमाने में, हम पहले से ही यह निर्धारित कर सकते हैं कि एक चर का एक मान दूसरे से कितना भिन्न होता है। इस प्रकार, शरीर के तापमान में 1 डिग्री सेल्सियस की वृद्धि का मतलब हमेशा एक निश्चित संख्या में इकाइयों द्वारा जारी गर्मी में वृद्धि है। हालांकि, अंतराल पैमाने में सकारात्मक और दोनों होते हैं नकारात्मक मान(कोई पूर्ण शून्य नहीं)। इस संबंध में, यह कहना असंभव है कि 20 डिग्री सेल्सियस 10 से दोगुना गर्म है। हम केवल यह कह सकते हैं कि 20 डिग्री 10 से अधिक गर्म है, 30, 20 से अधिक गर्म है।

परिमेय पैमाने (अनुपात पैमाने) में एक संदर्भ बिंदु होता है और केवल सकारात्मक मूल्य. चिकित्सा में, अधिकांश तर्कसंगत पैमाने सांद्रता हैं। उदाहरण के लिए, 10 mmol/L का ग्लूकोज स्तर 5 mmol/L की तुलना में सांद्रता का दोगुना है। तापमान के लिए, परिमेय पैमाना केल्विन पैमाना है, जहाँ परम शून्य (गर्मी का अभाव) होता है।

यह जोड़ा जाना चाहिए कि कोई भी मात्रात्मक चर निरंतर हो सकता है, जैसे कि शरीर के तापमान को मापने के मामले में (यह एक निरंतर अंतराल पैमाना है), या असतत, यदि हम रक्त कोशिकाओं की संख्या या प्रयोगशाला जानवरों की संतानों की गणना करते हैं (यह एक है असतत तर्कसंगत पैमाने)।

प्रयोगात्मक परिणामों के सांख्यिकीय विश्लेषण के लिए विधियों के चुनाव के लिए ये अंतर निर्णायक महत्व के हैं। तो, नाममात्र डेटा के लिए, ची-स्क्वायर परीक्षण लागू होता है, और प्रसिद्ध छात्र परीक्षण के लिए आवश्यक है कि चर (अंतराल या तर्कसंगत) निरंतर हो।

चर के प्रकार का प्रश्न हल होने के बाद, इसे बनाना शुरू करना आवश्यक है नमूने. एक नमूना एक निश्चित वर्ग (चिकित्सा में, एक जनसंख्या) की वस्तुओं का एक छोटा समूह है। बिल्कुल सटीक डेटा प्राप्त करने के लिए, किसी दिए गए वर्ग की सभी वस्तुओं का अध्ययन करना आवश्यक है, हालांकि, व्यावहारिक (अक्सर वित्तीय) कारणों से, जनसंख्या का केवल एक हिस्सा, जिसे नमूना कहा जाता है, का अध्ययन किया जाता है। भविष्य में, सांख्यिकीय विश्लेषण शोधकर्ता को एक निश्चित डिग्री सटीकता के साथ पूरी आबादी के लिए प्राप्त पैटर्न का विस्तार करने की अनुमति देता है। वास्तव में, सभी जैव-चिकित्सीय आँकड़ों का उद्देश्य कम से कम संभव संख्या में टिप्पणियों से सबसे सटीक परिणाम प्राप्त करना है, क्योंकि मानव अनुसंधान में, एक नैतिक मुद्दा भी महत्वपूर्ण है। हम जोखिम नहीं उठा सकते बड़ी मात्राआवश्यकता से अधिक रोगी।

एक नमूने के निर्माण को कई अनिवार्य आवश्यकताओं द्वारा नियंत्रित किया जाता है, जिसके उल्लंघन से अध्ययन के परिणामों से गलत निष्कर्ष निकल सकते हैं। सबसे पहले, नमूना आकार महत्वपूर्ण है। अध्ययन किए गए मापदंडों के आकलन की सटीकता नमूना आकार पर निर्भर करती है। यहां "सटीकता" शब्द को ध्यान में रखा जाना चाहिए। कैसे अधिक आकारअध्ययन किए गए समूहों में, वैज्ञानिक को अधिक सटीक (लेकिन जरूरी नहीं कि सही) परिणाम मिले। नमूना अध्ययन के परिणामों को समग्र रूप से पूरी आबादी के लिए हस्तांतरणीय होने के लिए, नमूना होना चाहिए प्रतिनिधि. नमूने की प्रतिनिधित्वशीलता का तात्पर्य है कि यह जनसंख्या के सभी आवश्यक गुणों को दर्शाता है। दूसरे शब्दों में, अध्ययन किए गए समूहों में, अलग-अलग लिंग, आयु, पेशे, सामाजिक स्थिति आदि के व्यक्ति समान आवृत्ति के साथ पूरी आबादी में पाए जाते हैं।

हालांकि, अध्ययन समूह का चयन शुरू करने से पहले, किसी विशेष आबादी का अध्ययन करने की आवश्यकता पर निर्णय लेना चाहिए। एक आबादी का एक उदाहरण एक निश्चित नोसोलॉजी या कामकाजी उम्र के लोग आदि के सभी रोगी हो सकते हैं। इस प्रकार, सैन्य उम्र के युवा लोगों की आबादी के लिए प्राप्त परिणामों को पोस्टमेनोपॉज़ल महिलाओं के लिए शायद ही एक्सट्रपलेशन किया जा सकता है। विशेषताओं का समूह जो अध्ययन समूह के पास होगा वह अध्ययन डेटा की "सामान्यीकरण" को निर्धारित करता है।

नमूने विभिन्न तरीकों से उत्पन्न किए जा सकते हैं। सबसे आसान एक यादृच्छिक संख्या जनरेटर के साथ चुनना है। आवश्यक धनएक आबादी से वस्तुओं या नमूना फ्रेम(नमूना चयन ढांचा)। इस विधि को कहा जाता है सरल यादृच्छिक नमूना". यदि आप नमूना फ्रेम में यादृच्छिक रूप से एक प्रारंभिक बिंदु चुनते हैं, और फिर हर दूसरी, पांचवीं या दसवीं वस्तु लेते हैं (अध्ययन में किस समूह के आकार की आवश्यकता होती है) के आधार पर, आपको मिलता है अंतराल नमूनाकरण. अंतराल नमूनाकरण यादृच्छिक नहीं है, क्योंकि नमूना फ्रेम के भीतर डेटा के आवधिक दोहराव की संभावना को कभी भी बाहर नहीं किया जाता है।

तथाकथित बनाना संभव है " स्तरीकृत प्रतिचयन”, जो मानता है कि जनसंख्या में कई अलग-अलग समूह हैं और इस संरचना को प्रयोगात्मक समूह में पुन: प्रस्तुत किया जाना चाहिए। उदाहरण के लिए, यदि जनसंख्या में पुरुषों का महिलाओं से अनुपात 30:70 है, तो एक स्तरीकृत नमूने में, उनका अनुपात समान होना चाहिए। पर यह पहुचयह गंभीर रूप से महत्वपूर्ण है कि नमूने को अत्यधिक संतुलित न किया जाए, अर्थात इसकी विशेषताओं की एकरूपता से बचने के लिए, अन्यथा शोधकर्ता डेटा में अंतर या संबंध खोजने का मौका चूक सकता है।

समूह बनाने की वर्णित विधियों के अलावा, वहाँ भी हैं समूहऔर नमूनाकरण कोटा. पहले का उपयोग तब किया जाता है जब नमूना फ्रेम के बारे में पूरी जानकारी प्राप्त करना उसके आकार के कारण मुश्किल होता है। फिर नमूना जनसंख्या में शामिल कई समूहों से बनता है। दूसरा - कोटा - एक स्तरीकृत नमूने के समान है, लेकिन यहाँ वस्तुओं का वितरण जनसंख्या के अनुरूप नहीं है।

नमूना आकार पर लौटते हुए, यह कहा जाना चाहिए कि यह पहली और दूसरी तरह की सांख्यिकीय त्रुटियों की संभावना से निकटता से संबंधित है। सांख्यिकीय त्रुटियां इस तथ्य के कारण हो सकती हैं कि अध्ययन पूरी आबादी का नहीं, बल्कि उसके हिस्से का अध्ययन करता है। टाइप I त्रुटि गलत विचलन है शून्य परिकल्पना. बदले में, शून्य परिकल्पना यह धारणा है कि सभी अध्ययन किए गए समूह एक ही सामान्य जनसंख्या से लिए गए हैं, जिसका अर्थ है कि उनके बीच अंतर या संबंध यादृच्छिक हैं। यदि हम नैदानिक ​​परीक्षणों के साथ एक सादृश्य बनाते हैं, तो टाइप I त्रुटि एक गलत सकारात्मक परिणाम है।

टाइप II त्रुटि एक गलत विचलन है वैकल्पिक परिकल्पना, जिसका अर्थ इस तथ्य में निहित है कि समूहों के बीच मतभेद या संबंध एक यादृच्छिक संयोग के कारण नहीं हैं, बल्कि अध्ययन किए गए कारकों के प्रभाव के कारण हैं। और फिर, निदान के साथ सादृश्य: दूसरी तरह की त्रुटि एक गलत नकारात्मक परिणाम है। इस त्रुटि से संबंधित धारणा है शक्ति, जो बताता है कि दी गई शर्तों के तहत एक निश्चित सांख्यिकीय पद्धति कितनी प्रभावी है, इसकी संवेदनशीलता के बारे में। शक्ति की गणना सूत्र द्वारा की जाती है: 1-β, जहां β टाइप II त्रुटि की संभावना है। यह सूचक मुख्य रूप से नमूना आकार पर निर्भर करता है। समूह का आकार जितना बड़ा होगा, टाइप II त्रुटि की संभावना उतनी ही कम होगी और सांख्यिकीय परीक्षणों की शक्ति उतनी ही अधिक होगी। यह निर्भरता कम से कम द्विघात है, यानी नमूने के आकार को आधे से कम करने से कम से कम चार बार शक्ति में गिरावट आएगी। न्यूनतम स्वीकार्य शक्ति को 80% माना जाता है, और पहली तरह की त्रुटि का अधिकतम स्वीकार्य स्तर 5% है। हालाँकि, यह हमेशा याद रखना चाहिए कि ये सीमाएँ मनमानी हैं और अध्ययन की प्रकृति और उद्देश्यों के आधार पर बदल सकती हैं। एक नियम के रूप में, वैज्ञानिक समुदाय सत्ता में एक मनमाना परिवर्तन को पहचानता है, लेकिन अधिकांश मामलों में, पहली तरह की त्रुटि का स्तर 5% से अधिक नहीं हो सकता है।

उपरोक्त सभी सीधे अनुसंधान योजना चरण से संबंधित हैं। हालांकि, कई शोधकर्ता गलती से सांख्यिकीय डेटा प्रोसेसिंग को केवल काम के मुख्य भाग के पूरा होने के बाद किए गए किसी प्रकार के हेरफेर के रूप में संदर्भित करते हैं। अक्सर, एक अनियोजित प्रयोग की समाप्ति के बाद, सांख्यिकीय डेटा के विश्लेषण का आदेश देने की एक अथक इच्छा होती है। लेकिन एक सांख्यिकीविद् के लिए भी "कचरे के ढेर" से शोधकर्ता द्वारा अपेक्षित परिणाम निकालना बहुत मुश्किल होगा। इसलिए, बायोस्टैटिस्टिक्स के अपर्याप्त ज्ञान के साथ, प्रयोग शुरू होने से पहले ही सांख्यिकीय विश्लेषण में मदद लेना आवश्यक है।

विश्लेषण प्रक्रिया की ओर मुड़ते हुए, दो मुख्य प्रकार की सांख्यिकीय तकनीकों को इंगित किया जाना चाहिए: वर्णनात्मक और साक्ष्य-आधारित (विश्लेषणात्मक)। वर्णनात्मक तकनीकों में डेटा को एक कॉम्पैक्ट और आसानी से समझने योग्य तरीके से प्रस्तुत करने की तकनीकें शामिल हैं। इनमें टेबल, ग्राफ, आवृत्तियों (पूर्ण और सापेक्ष), केंद्रीय प्रवृत्ति के उपाय (माध्य, औसत, मोड), और डेटा स्कैटर के उपाय (विचरण, मानक विचलन, इंटरक्वेर्टाइल अंतराल, आदि)। दूसरे शब्दों में, वर्णनात्मक विधियाँ अध्ययन किए गए नमूनों की विशेषता हैं।

उपलब्ध मात्रात्मक डेटा का वर्णन करने का सबसे लोकप्रिय (हालांकि अक्सर भ्रामक) तरीका निम्नलिखित संकेतकों को परिभाषित करना है:

  • नमूने या उसके आकार में टिप्पणियों की संख्या;
  • औसत मूल्य (अंकगणित माध्य);
  • मानक विचलन इस बात का माप है कि चरों के मान कितने व्यापक रूप से बदलते हैं।

यह याद रखना महत्वपूर्ण है कि अंकगणितीय माध्य और मानक विचलन केंद्रीय प्रवृत्ति के माप हैं और काफी कम संख्या में नमूनों में बिखराव हैं। ऐसे नमूनों में, अधिकांश वस्तुओं के मूल्यों के साथ समान रूप से संभावितमाध्य से विचलन, और उनका वितरण एक सममित "घंटी" (गॉसियन या गॉस-लाप्लास वक्र) बनाता है। इस तरह के वितरण को "सामान्य" भी कहा जाता है, लेकिन चिकित्सा प्रयोग के अभ्यास में यह केवल 30% मामलों में होता है। यदि चर के मानों को केंद्र के बारे में विषम रूप से वितरित किया जाता है, तो समूहों को माध्यिका और क्वांटाइल्स (प्रतिशतक, चतुर्थक, दशमांश) का उपयोग करके सबसे अच्छा वर्णित किया जाता है।

समूहों का विवरण पूरा करने के बाद, उनके संबंधों और अध्ययन के परिणामों को पूरी आबादी के लिए सामान्य बनाने की संभावना के बारे में सवाल का जवाब देना आवश्यक है। इसके लिए बायोस्टैटिस्टिक्स के साक्ष्य-आधारित तरीकों का इस्तेमाल किया जाता है। यह उनके बारे में है कि शोधकर्ता सबसे पहले याद करते हैं जब सांख्यिकीय डेटा प्रोसेसिंग की बात आती है। आमतौर पर काम के इस चरण को "सांख्यिकीय परिकल्पना का परीक्षण" कहा जाता है।

परिकल्पना परीक्षण के कार्यों को दो भागों में विभाजित किया जा सकता है बड़े समूह. पहला समूह इस सवाल का जवाब देता है कि क्या कुछ संकेतक के स्तर के संदर्भ में समूहों के बीच अंतर हैं, उदाहरण के लिए, हेपेटाइटिस और स्वस्थ लोगों के रोगियों में यकृत ट्रांसएमिनेस के स्तर में अंतर। दूसरा समूह आपको दो या दो से अधिक संकेतकों के बीच संबंध के अस्तित्व को साबित करने की अनुमति देता है, उदाहरण के लिए, यकृत का कार्य और प्रतिरक्षा प्रणाली।

व्यावहारिक रूप से, पहले समूह के कार्यों को दो उपप्रकारों में विभाजित किया जा सकता है:

  • केवल दो समूहों (स्वस्थ और बीमार, पुरुष और महिला) में संकेतक की तुलना;
  • तीन या अधिक समूहों की तुलना (दवा की विभिन्न खुराकों का अध्ययन)।

यह ध्यान में रखा जाना चाहिए कि गुणात्मक और मात्रात्मक डेटा के लिए सांख्यिकीय तरीके काफी भिन्न होते हैं।

ऐसी स्थिति में जहां अध्ययन किया जा रहा चर गुणात्मक है और केवल दो समूहों की तुलना की जा रही है, काई-स्क्वायर परीक्षण का उपयोग किया जा सकता है। यह एक काफी शक्तिशाली और व्यापक रूप से ज्ञात मानदंड है, हालांकि, यदि अवलोकनों की संख्या कम है तो यह पर्याप्त प्रभावी नहीं है। इस समस्या को हल करने के लिए, कई तरीके हैं, जैसे कि निरंतरता के लिए येट्स सुधार और फिशर की सटीक विधि।

यदि अध्ययनाधीन चर मात्रात्मक है, तो दो प्रकार के सांख्यिकीय परीक्षणों में से एक का उपयोग किया जा सकता है। पहले प्रकार के मानदंड सामान्य जनसंख्या के एक विशिष्ट प्रकार के वितरण पर आधारित होते हैं और इस जनसंख्या के मापदंडों के साथ काम करते हैं। ऐसे मानदंड को "पैरामीट्रिक" कहा जाता है, और वे आमतौर पर मूल्यों के सामान्य वितरण की धारणा पर आधारित होते हैं। गैर-पैरामीट्रिक परीक्षण सामान्य जनसंख्या के वितरण के प्रकार के बारे में धारणा पर आधारित नहीं हैं और इसके मापदंडों का उपयोग नहीं करते हैं। कभी-कभी ऐसे मानदंड को "वितरण-मुक्त परीक्षण" कहा जाता है। कुछ हद तक, यह गलत है, क्योंकि कोई भी गैर-पैरामीट्रिक परीक्षण मानता है कि सभी तुलना समूहों में वितरण समान होगा, अन्यथा गलत सकारात्मक परिणाम प्राप्त हो सकते हैं।

सामान्य रूप से वितरित जनसंख्या से लिए गए डेटा पर दो पैरामीट्रिक परीक्षण लागू होते हैं: दो समूहों की तुलना करने के लिए छात्र का टी-टेस्ट और भिन्नताओं की समानता (उर्फ एनोवा) के परीक्षण के लिए फिशर का एफ-टेस्ट। बहुत अधिक गैर-पैरामीट्रिक मानदंड हैं। विभिन्न परीक्षण उन मान्यताओं में एक दूसरे से भिन्न होते हैं जिन पर वे आधारित होते हैं, गणना की जटिलता में, सांख्यिकीय शक्ति में, आदि। हालांकि, विलकॉक्सन परीक्षण (संबंधित समूहों के लिए) और मान-व्हिटनी परीक्षण, जिसे परीक्षण के रूप में भी जाना जाता है। के लिए विलकॉक्सन स्वतंत्र नमूने. ये परीक्षण इस मायने में सुविधाजनक हैं कि उन्हें डेटा वितरण की प्रकृति के बारे में धारणाओं की आवश्यकता नहीं है। लेकिन अगर यह पता चलता है कि नमूने सामान्य रूप से वितरित सामान्य आबादी से लिए गए हैं, तो उनकी सांख्यिकीय शक्ति छात्र के परीक्षण से महत्वपूर्ण रूप से भिन्न नहीं होगी।

सांख्यिकीय विधियों का पूरा विवरण यहां पाया जा सकता है विशेष साहित्य, हालांकि, मुख्य बिंदु यह है कि प्रत्येक सांख्यिकीय परीक्षण के लिए इसके उपयोग के लिए नियमों (धारणाओं) और शर्तों के एक सेट की आवश्यकता होती है, और "वांछित" परिणाम खोजने के लिए कई तरीकों की यांत्रिक गणना बिल्कुल अस्वीकार्य है वैज्ञानिक बिंदुनज़र। इस अर्थ में, सांख्यिकीय परीक्षण दवाओं के करीब हैं - प्रत्येक में संकेत और मतभेद हैं, दुष्प्रभावऔर असफलता की संभावना। और सांख्यिकीय परीक्षणों का अनियंत्रित उपयोग उतना ही खतरनाक है, क्योंकि परिकल्पना और निष्कर्ष उन पर आधारित होते हैं।

सांख्यिकीय विश्लेषण की सटीकता के मुद्दे की अधिक संपूर्ण समझ के लिए, "की अवधारणा को परिभाषित और विश्लेषण करना आवश्यक है" आत्मविश्वास का स्तर।"कॉन्फिडेंस प्रायिकता संभावित और असंभव घटनाओं के बीच एक सीमा के रूप में लिया गया मान है। परंपरागत रूप से, इसे "पी" अक्षर से दर्शाया जाता है। कई शोधकर्ताओं के लिए, सांख्यिकीय विश्लेषण करने का एकमात्र उद्देश्य प्रतिष्ठित पी मान की गणना करना है, जो अल्पविराम लगाने लगता है प्रसिद्ध वाक्यांश"निष्पादन को माफ नहीं किया जा सकता है।" अधिकतम स्वीकार्य विश्वास स्तर 0.05 है। यह याद रखना चाहिए कि आत्मविश्वास का स्तर किसी घटना की संभावना नहीं है, बल्कि आत्मविश्वास का विषय है। विश्लेषण शुरू करने से पहले आत्मविश्वास की संभावना को उजागर करके, हम अपने शोध के परिणामों में विश्वास की डिग्री निर्धारित करते हैं। और, जैसा कि आप जानते हैं, अत्यधिक भोलापन और अत्यधिक संदेह किसी भी कार्य के परिणामों को समान रूप से नकारात्मक रूप से प्रभावित करते हैं।

आत्मविश्वास का स्तर एक प्रकार I त्रुटि की अधिकतम संभावना को इंगित करता है जिसे शोधकर्ता स्वीकार्य मानता है। आत्मविश्वास के स्तर में कमी, दूसरे शब्दों में, परिकल्पनाओं के परीक्षण के लिए शर्तों को कड़ा करने से टाइप II त्रुटियों की संभावना बढ़ जाती है। इसलिए, पहली और दूसरी तरह की त्रुटियों की घटना से संभावित नुकसान को ध्यान में रखते हुए आत्मविश्वास के स्तर का चुनाव किया जाना चाहिए। उदाहरण के लिए, बायोमेडिकल आँकड़ों में अपनाई गई सख्त सीमाएँ, जो 5% से अधिक के झूठे सकारात्मक परिणामों के अनुपात को निर्धारित करती हैं, एक गंभीर आवश्यकता है, क्योंकि चिकित्सा अनुसंधान के परिणामों के आधार पर नए उपचार पेश या अस्वीकार किए जाते हैं, और यह एक है हजारों लोगों के लिए जीवन की बात।

यह ध्यान में रखा जाना चाहिए कि पी मान स्वयं डॉक्टर के लिए बहुत जानकारीपूर्ण नहीं है, क्योंकि यह केवल शून्य परिकल्पना की गलत अस्वीकृति की संभावना के बारे में बताता है। यह संकेतक कुछ भी नहीं कहता है, उदाहरण के लिए, सामान्य आबादी में अध्ययन दवा का उपयोग करते समय चिकित्सीय प्रभाव के आकार के बारे में। इसलिए, एक राय है कि आत्मविश्वास के स्तर के बजाय, आत्मविश्वास अंतराल के आकार से अध्ययन के परिणामों का मूल्यांकन करना बेहतर होगा। विश्वास अंतरालमूल्यों की सीमा है जिसके भीतर वास्तविक जनसंख्या मूल्य (माध्य, माध्य या आवृत्ति के लिए) एक निश्चित संभावना के साथ समाहित है। व्यवहार में, इन दोनों मूल्यों का होना अधिक सुविधाजनक है, जो समग्र रूप से जनसंख्या पर प्राप्त परिणामों की प्रयोज्यता का अधिक आत्मविश्वास से न्याय करना संभव बनाता है।

अंत में, एक सांख्यिकीविद् या एक शोधकर्ता द्वारा उपयोग किए जाने वाले उपकरणों के बारे में कुछ शब्द कहे जाने चाहिए जो स्वतंत्र रूप से डेटा का विश्लेषण करते हैं। मैनुअल गणना लंबे समय से चली आ रही है। आज जो सांख्यिकीय कंप्यूटर प्रोग्राम मौजूद हैं, वे बिना किसी गंभीर समस्या के सांख्यिकीय विश्लेषण करना संभव बनाते हैं गणितीय प्रशिक्षण. SPSS, SAS, R आदि जैसी शक्तिशाली प्रणालियाँ शोधकर्ता को जटिल और शक्तिशाली सांख्यिकीय विधियों का उपयोग करने में सक्षम बनाती हैं। हालांकि, यह हमेशा अच्छी बात नहीं होती है। विशिष्ट प्रयोगात्मक डेटा के लिए उपयोग किए जाने वाले सांख्यिकीय परीक्षणों की प्रयोज्यता की डिग्री को जाने बिना, शोधकर्ता गणना कर सकता है और आउटपुट पर कुछ संख्याएं भी प्राप्त कर सकता है, लेकिन परिणाम बहुत ही संदिग्ध होगा। इसलिए, शर्तप्रयोग के परिणामों का सांख्यिकीय प्रसंस्करण करने के लिए, एक अच्छा ज्ञान होना चाहिए गणितीय नींवसांख्यिकी।


सांख्यिकीय तरीके - सांख्यिकीय डेटा के विश्लेषण के तरीके। सभी क्षेत्रों में लागू किए जा सकने वाले लागू आँकड़ों के तरीके आवंटित करें वैज्ञानिक अनुसंधानऔर कोई उद्योग राष्ट्रीय अर्थव्यवस्था, और अन्य सांख्यिकीय विधियां, जिनकी प्रयोज्यता एक विशेष क्षेत्र तक सीमित है। यह सांख्यिकीय स्वीकृति नियंत्रण, तकनीकी प्रक्रियाओं के सांख्यिकीय नियंत्रण, विश्वसनीयता और परीक्षण, और प्रयोगों के डिजाइन जैसे तरीकों को संदर्भित करता है।

मानव गतिविधि के लगभग सभी क्षेत्रों में डेटा विश्लेषण के सांख्यिकीय तरीकों का उपयोग किया जाता है। जब भी किसी समूह (वस्तुओं या विषयों) के बारे में कुछ आंतरिक विविधता के साथ किसी भी निर्णय को प्राप्त करने और प्रमाणित करने के लिए आवश्यक होता है तो उनका उपयोग किया जाता है। डेटा विश्लेषण के सांख्यिकीय तरीकों के क्षेत्र में तीन प्रकार की वैज्ञानिक और व्यावहारिक गतिविधियों को अलग करना उचित है (विशिष्ट समस्याओं में विसर्जन से जुड़े तरीकों की विशिष्टता की डिग्री के अनुसार):

ए) आवेदन के क्षेत्र की बारीकियों को ध्यान में रखे बिना सामान्य प्रयोजन विधियों का विकास और अनुसंधान;

बी) सांख्यिकीय मॉडल का विकास और अनुसंधान वास्तविक घटनाऔर गतिविधि के एक विशेष क्षेत्र की जरूरतों के अनुसार प्रक्रियाएं;

ग) विशिष्ट डेटा के सांख्यिकीय विश्लेषण के लिए सांख्यिकीय विधियों और मॉडलों का अनुप्रयोग।

फैलाव विश्लेषण।विचरण का विश्लेषण (लैटिन डिस्पर्सियो से - फैलाव / अंग्रेजी में विचरण का विश्लेषण - एनोवा) का उपयोग एक आश्रित मात्रात्मक चर (प्रतिक्रिया) पर एक या अधिक गुणात्मक चर (कारकों) के प्रभाव का अध्ययन करने के लिए किया जाता है। विचरण का विश्लेषण पर आधारित है यह धारणा कि कुछ चर को कारण (कारक, स्वतंत्र चर) और अन्य को परिणाम (निर्भर चर) के रूप में माना जा सकता है। स्वतंत्र चर को कभी-कभी कहा जाता है समायोज्य कारकठीक है क्योंकि प्रयोग में शोधकर्ता के पास उन्हें बदलने और परिणामी परिणाम का विश्लेषण करने का अवसर होता है।

मुख्य लक्ष्यविचरण का विश्लेषण (ANOVA) भिन्नताओं की तुलना (विश्लेषण) के माध्यम से साधनों के बीच अंतर के महत्व का अध्ययन है। कुल विचरण को कई स्रोतों में विभाजित करने से समूह अंतर के कारण अंतर-समूह परिवर्तनशीलता के कारण भिन्नता की तुलना करने की अनुमति मिलती है। यदि शून्य परिकल्पना सत्य है (सामान्य जनसंख्या से चुने गए अवलोकनों के कई समूहों में साधनों की समानता के बारे में), इंट्राग्रुप परिवर्तनशीलता से जुड़े भिन्नता का अनुमान इंटरग्रुप भिन्नता के अनुमान के करीब होना चाहिए। यदि आप केवल दो नमूनों के साधनों की तुलना कर रहे हैं, तो विचरण का विश्लेषण नियमित स्वतंत्र नमूना टी-परीक्षण के समान परिणाम देगा (यदि आप दो नमूनों की तुलना कर रहे हैं) स्वतंत्र समूहवस्तुओं या प्रेक्षणों) या आश्रित नमूनों के लिए टी-परीक्षण (यदि वस्तुओं या प्रेक्षणों के एक ही सेट पर दो चरों की तुलना की जाती है)।


विचरण के विश्लेषण का सारविशिष्ट कारकों के प्रभाव के कारण अध्ययन के तहत विशेषता के कुल विचरण को अलग-अलग घटकों में विभाजित करना, और अध्ययन के तहत विशेषता पर इन कारकों के प्रभाव के महत्व के बारे में परिकल्पना का परीक्षण करना शामिल है। फिशर एफ-टेस्ट का उपयोग करके एक दूसरे के साथ विचरण के घटकों की तुलना करना, यह निर्धारित करना संभव है कि परिणामी विशेषता की कुल परिवर्तनशीलता का अनुपात समायोज्य कारकों की कार्रवाई के कारण है।

शुरुआती सामग्रीविचरण के विश्लेषण के लिए, तीन या अधिक नमूनों के अध्ययन के डेटा का उपयोग किया जाता है, जो संख्या में बराबर या असमान हो सकते हैं, दोनों जुड़े और डिस्कनेक्ट किए गए हैं। पहचाने गए समायोज्य कारकों की संख्या के संदर्भ में, विचरण का विश्लेषण एकल-कारक हो सकता है (इस मामले में, प्रयोग के परिणामों पर एक कारक के प्रभाव का अध्ययन किया जाता है), दो-कारक (दो कारकों के प्रभाव का अध्ययन करते समय) और बहुक्रियात्मक (आपको न केवल प्रत्येक कारक के प्रभाव का अलग-अलग मूल्यांकन करने की अनुमति देता है, बल्कि उनकी बातचीत भी)।

विचरण का विश्लेषण लागू होता हैपैरामीट्रिक विधियों के समूह के लिए और इसलिए इसे केवल तभी लागू किया जाना चाहिए जब यह सिद्ध हो गया हो कि वितरण सामान्य है।

विचरण का विश्लेषण प्रयोग किया जाता है, यदि आश्रित चर को अनुपात, अंतराल या क्रम के पैमाने पर मापा जाता है, और प्रभावित करने वाले चर एक गैर-संख्यात्मक प्रकृति (नाम पैमाने) के होते हैं।

कार्य उदाहरण।हल किए जा रहे कार्यों में भिन्नता का विश्लेषण, एक संख्यात्मक प्रकृति की प्रतिक्रिया होती है, जो नाममात्र प्रकृति के कई चर से प्रभावित होती है। उदाहरण के लिए, कई प्रकार के पशुओं के चर्बी वाले राशन या उन्हें रखने के दो तरीके आदि।

उदाहरण 1: सप्ताह के दौरान कई फार्मेसी कियोस्क ने तीन अलग-अलग जगहों पर काम किया। भविष्य में, हम केवल एक को छोड़ सकते हैं। यह निर्धारित करना आवश्यक है कि क्या कोई सांख्यिकीय है महत्वपूर्ण अंतरकियोस्क में दवाओं की बिक्री की मात्रा के बीच। यदि हाँ, तो हम उच्चतम औसत दैनिक बिक्री मात्रा वाले कियोस्क का चयन करेंगे। यदि बिक्री की मात्रा में अंतर सांख्यिकीय रूप से महत्वहीन हो जाता है, तो अन्य संकेतक कियोस्क चुनने का आधार होना चाहिए।

उदाहरण 2: समूह साधनों के विरोधाभासों की तुलना। सात राजनीतिक संबद्धताओं को अत्यंत उदार से अत्यंत रूढ़िवादी तक का आदेश दिया गया है, और रैखिक विपरीतता का उपयोग यह परीक्षण करने के लिए किया जाता है कि क्या समूह के साधनों में एक गैर-शून्य ऊपर की ओर प्रवृत्ति है- यानी, क्या औसत आयु में एक महत्वपूर्ण रैखिक वृद्धि हुई है जब समूहों में आदेश दिया गया है उदार से रूढ़िवादी की दिशा।

उदाहरण 3: विचरण का दोतरफा विश्लेषण। स्टोर के आकार के अलावा उत्पाद की बिक्री की संख्या अक्सर उत्पाद के साथ अलमारियों के स्थान से प्रभावित होती है। यह उदाहरणचार शेल्फ लेआउट और तीन स्टोर आकारों की विशेषता वाले साप्ताहिक बिक्री के आंकड़े शामिल हैं। विश्लेषण के परिणाम बताते हैं कि दोनों कारक - माल के साथ अलमारियों का स्थान और स्टोर का आकार - बिक्री की संख्या को प्रभावित करते हैं, लेकिन उनकी बातचीत महत्वपूर्ण नहीं है।

उदाहरण 4:यूनीवेरिएट एनोवा: रैंडमाइज्ड टू-ट्रीटमेंट फुल ब्लॉक डिजाइन। ब्रेड के बेकिंग पर तीन वसा और तीन आटा रिपर के सभी संभावित संयोजनों के प्रभाव की जांच की जाती है। चार अलग-अलग स्रोतों से लिए गए आटे के चार नमूने ब्लॉक फैक्टर के रूप में काम करते हैं। फैट-रिपर इंटरैक्शन के महत्व की पहचान करना आवश्यक है। उसके बाद, विरोधाभासों को चुनने के लिए विभिन्न विकल्पों को निर्धारित करने के लिए, आपको यह पता लगाने की अनुमति मिलती है कि कारकों के स्तरों के कौन से संयोजन भिन्न हैं।

उदाहरण 5: मिश्रित प्रभावों के साथ एक पदानुक्रमित (नेस्टेड) ​​योजना का मॉडल। निर्मित ग्लास कैथोड धारकों के विरूपण पर मशीन टूल में लगे चार बेतरतीब ढंग से चुने गए सिर के प्रभाव का अध्ययन किया जाता है। (सिर मशीन में बने होते हैं, इसलिए एक ही सिर को विभिन्न मशीनों पर इस्तेमाल नहीं किया जा सकता है।) सिर के प्रभाव को एक यादृच्छिक कारक के रूप में माना जाता है। एनोवा के आंकड़े बताते हैं कि मशीनों के बीच कोई महत्वपूर्ण अंतर नहीं है, लेकिन संकेत हैं कि सिर अलग हो सकते हैं। सभी मशीनों के बीच का अंतर महत्वपूर्ण नहीं है, लेकिन उनमें से दो के लिए सिर के प्रकार के बीच का अंतर महत्वपूर्ण है।

उदाहरण 6: स्प्लिट-प्लॉट प्लान का उपयोग करते हुए यूनीवेरिएट बार-बार माप विश्लेषण। यह प्रयोग लगातार चार प्रयासों पर परीक्षा के प्रदर्शन पर किसी व्यक्ति की चिंता रेटिंग के प्रभाव को निर्धारित करने के लिए आयोजित किया गया था। डेटा को व्यवस्थित किया जाता है ताकि उन्हें संपूर्ण डेटा सेट ("संपूर्ण प्लॉट") के सबसेट के समूह के रूप में माना जा सके। चिंता का प्रभाव महत्वपूर्ण नहीं था, जबकि प्रयास का प्रभाव महत्वपूर्ण था।

सहप्रसरण विश्लेषण।सहसंयोजक विश्लेषण - (मुख्य) गुणात्मक कारकों और (संबद्ध) मात्रात्मक कारकों के एक सेट पर एक साथ कुछ यादृच्छिक चर के औसत मूल्य की निर्भरता के मॉडल के विश्लेषण से संबंधित गणितीय आँकड़ों के तरीकों का एक सेट। कारक एफ उन स्थितियों के संयोजन सेट करते हैं जिनके तहत अवलोकन एक्स, वाई प्राप्त किए गए थे, और संकेतक चर का उपयोग करके वर्णित हैं, और साथ और संकेतक चर के बीच यादृच्छिक और गैर-यादृच्छिक (प्रयोग में नियंत्रित) दोनों हो सकते हैं।

यदि यादृच्छिक चर Y एक सदिश है, तो कोई सहप्रसरण के बहुभिन्नरूपी विश्लेषण की बात करता है।

सहप्रसरण का विश्लेषण अक्सर प्रयोग किया जाता हैविचरण के विश्लेषण से पहले, सभी सहवर्ती कारकों के लिए अवलोकन X, Y के नमूने की समरूपता (एकरूपता, प्रतिनिधित्व) की जांच करना।