गणना स्वचालन के साथ एक्सेल में कारक और फैलाव विश्लेषण। विचरण का एकतरफा विश्लेषण

नियंत्रित चर के प्रभाव में किसी विशेषता की परिवर्तनशीलता का विश्लेषण करने के लिए, फैलाव विधि का उपयोग किया जाता है।

मूल्यों के बीच संबंध का अध्ययन करना - तथ्यात्मक विधि। आइए विश्लेषणात्मक उपकरणों पर अधिक विस्तार से विचार करें: परिवर्तनशीलता का आकलन करने के लिए तथ्यात्मक, फैलाव और दो-कारक फैलाव विधियां।

एक्सेल में एनोवा

सशर्त रूप से, फैलाव विधि का लक्ष्य निम्नानुसार तैयार किया जा सकता है: पैरामीटर 3 की कुल परिवर्तनशीलता से विशेष परिवर्तनशीलता को अलग करने के लिए:

  • 1 - अध्ययन किए गए प्रत्येक मूल्यों की कार्रवाई द्वारा निर्धारित;
  • 2 - अध्ययन किए गए मूल्यों के बीच संबंध द्वारा निर्धारित;
  • 3 - यादृच्छिक, परिस्थितियों के लिए सभी बेहिसाब द्वारा निर्धारित।

Microsoft Excel में, "डेटा विश्लेषण" टूल (टैब "डेटा" - "विश्लेषण") का उपयोग करके विचरण का विश्लेषण किया जा सकता है। यह एक स्प्रेडशीट ऐड-ऑन है। यदि ऐड-इन उपलब्ध नहीं है, तो आपको "एक्सेल विकल्प" खोलने और विश्लेषण के लिए सेटिंग को सक्षम करने की आवश्यकता है।

तालिका के डिजाइन के साथ काम शुरू होता है। नियम:

  1. प्रत्येक कॉलम में अध्ययन के तहत एक कारक का मान होना चाहिए।
  2. अध्ययनाधीन पैरामीटर के मान के आरोही/अवरोही क्रम में स्तंभों को व्यवस्थित करें।

एक उदाहरण का उपयोग करके एक्सेल में विचरण के विश्लेषण पर विचार करें।

कंपनी के मनोवैज्ञानिक ने एक विशेष तकनीक का उपयोग करके संघर्ष की स्थिति में कर्मचारियों के व्यवहार की रणनीति का विश्लेषण किया। यह माना जाता है कि व्यवहार शिक्षा के स्तर से प्रभावित होता है (1 - माध्यमिक, 2 - माध्यमिक विशेष, 3 - उच्च शिक्षा)।

एक्सेल स्प्रेडशीट में डेटा दर्ज करें:


महत्वपूर्ण पैरामीटर पीले रंग से भरा है। चूंकि समूहों के बीच पी-मान 1 से अधिक है, इसलिए फिशर के परीक्षण को महत्वपूर्ण नहीं माना जा सकता है। नतीजतन, संघर्ष की स्थिति में व्यवहार शिक्षा के स्तर पर निर्भर नहीं करता है।



एक्सेल में फैक्टर एनालिसिस: एक उदाहरण

कारक विश्लेषण चर के मूल्यों के बीच संबंधों का एक बहुभिन्नरूपी विश्लेषण है। इस पद्धति का उपयोग करके, आप सबसे महत्वपूर्ण कार्यों को हल कर सकते हैं:

  • मापी गई वस्तु का व्यापक रूप से वर्णन करें (इसके अलावा, क्षमता से, सघन रूप से);
  • छिपे हुए चर मूल्यों की पहचान करें जो रैखिक सांख्यिकीय सहसंबंधों की उपस्थिति का निर्धारण करते हैं;
  • चर वर्गीकृत करें (उनके बीच संबंध निर्धारित करें);
  • आवश्यक चर की संख्या कम करें।

कारक विश्लेषण के उदाहरण पर विचार करें। मान लीजिए हम पिछले 4 महीनों से किसी सामान की बिक्री जानते हैं। यह विश्लेषण करना आवश्यक है कि कौन सी वस्तुएं मांग में हैं और कौन सी नहीं।



अब आप स्पष्ट रूप से देख सकते हैं कि किस उत्पाद की बिक्री मुख्य वृद्धि देती है।

एक्सेल में विचरण का दो-तरफ़ा विश्लेषण

दिखाता है कि कैसे दो कारक एक यादृच्छिक चर के मूल्य में परिवर्तन को प्रभावित करते हैं। एक उदाहरण का उपयोग करके एक्सेल में विचरण के दो-तरफ़ा विश्लेषण पर विचार करें।

एक कार्य। पुरुषों और महिलाओं के एक समूह को विभिन्न मात्राओं की ध्वनियों के साथ प्रस्तुत किया गया: 1 - 10 डीबी, 2 - 30 डीबी, 3 - 50 डीबी। प्रतिक्रिया समय मिलीसेकंड में दर्ज किया गया था। यह निर्धारित करना आवश्यक है कि क्या लिंग प्रतिक्रिया को प्रभावित करता है; क्या जोर प्रतिक्रिया को प्रभावित करता है?

व्यायाम । प्रथम वर्ष के छात्रों का सर्वेक्षण उन गतिविधियों की पहचान करने के लिए किया गया था जिनके लिए वे अपना खाली समय समर्पित करते हैं। जांचें कि क्या छात्रों की मौखिक और गैर-मौखिक प्राथमिकताओं का वितरण भिन्न है।

समाधानकैलकुलेटर का उपयोग करके किया गया।
समूह औसत ढूँढना:

एनपी 1पी 2
1 12 17
2 18 19
3 23 25
4 10 7
5 15 17
एक्स सीएफ 15.6 17

आइए p को निरूपित करें - कारक के स्तरों की संख्या (p=2)। प्रत्येक स्तर पर मापों की संख्या समान है और q=5 के बराबर है।
अंतिम पंक्ति में कारक के प्रत्येक स्तर के लिए समूह साधन होते हैं।
समूह के अंकगणितीय माध्य के रूप में समग्र माध्य प्राप्त किया जा सकता है:
(1)
कुल औसत के सापेक्ष विफलता के प्रतिशत के समूह औसत का प्रसार माना कारक और यादृच्छिक कारकों के स्तर में परिवर्तन दोनों से प्रभावित होता है।
इस कारक के प्रभाव को ध्यान में रखने के लिए, कुल नमूना विचरण को दो भागों में विभाजित किया गया है, जिनमें से पहले को फैक्टोरियल एस 2 एफ कहा जाता है, और दूसरा - अवशिष्ट एस 2 बाकी।
इन घटकों को ध्यान में रखने के लिए, कुल औसत से भिन्न के वर्ग विचलन के कुल योग की गणना पहले की जाती है:

और समूह के वर्ग विचलन का तथ्यात्मक योग कुल माध्य से है, जो इस कारक के प्रभाव को दर्शाता है:

अंतिम व्यंजक Rtot व्यंजक में प्रत्येक प्रकार को दिए गए गुणनखंड के समूह माध्य से प्रतिस्थापित करके प्राप्त किया जाता है।
वर्ग विचलन का अवशिष्ट योग अंतर के रूप में प्राप्त किया जाता है:
आर बाकी \u003d आर कुल - आर एफ
कुल नमूना विचरण निर्धारित करने के लिए, Rtotal को मापों की संख्या pq से विभाजित करना आवश्यक है:

और निष्पक्ष कुल नमूना विचरण प्राप्त करने के लिए, इस अभिव्यक्ति को pq/(pq-1) से गुणा किया जाना चाहिए:

तदनुसार, निष्पक्ष तथ्यात्मक नमूना विचरण के लिए:

जहां p-1 निष्पक्ष तथ्यात्मक नमूना विचरण की स्वतंत्रता की डिग्री की संख्या है।
विचाराधीन पैरामीटर में परिवर्तन पर कारक के प्रभाव का आकलन करने के लिए, मान की गणना की जाती है:

चूंकि दो नमूना भिन्नताओं का अनुपात एस 2 एफ और एस 2 रेम फिशर-स्नेडेकोर कानून के अनुसार वितरित किया जाता है, परिणामी मूल्य एफ ओब्स की तुलना वितरण समारोह के मूल्य से की जाती है

महत्व के चुने हुए स्तर के अनुरूप महत्वपूर्ण बिंदु f करोड़ पर।
यदि f obl>f cr, तो कारक का महत्वपूर्ण प्रभाव पड़ता है और इसे ध्यान में रखा जाना चाहिए, अन्यथा इसका एक महत्वहीन प्रभाव होता है जिसे उपेक्षित किया जा सकता है।
निम्नलिखित फ़ार्मुलों का उपयोग रॉब्स और आरएफ की गणना के लिए भी किया जा सकता है:
(4)
(5)
हम सूत्र (1) द्वारा समग्र औसत पाते हैं:
सूत्र (4) का उपयोग करके Rtot की गणना करने के लिए, हम 2 वर्ग विकल्प की एक तालिका संकलित करते हैं:
एनपी 2 1पी 2 2
1 144 289
2 324 361
3 529 625
4 100 49
5 225 289
1322 1613

कुल औसत की गणना सूत्र (1) द्वारा की जाती है:

रॉट = 1322 + 1613 - 5 2 16.3 2 = 278.1
हम सूत्र (5) के अनुसार R f पाते हैं:
आर एफ \u003d 5 (15.6 2 + 17 2) - 2 16.3 2 \u003d 4.9
हमें आर आराम मिलता है: आर आराम \u003d आर कुल - आर एफ \u003d 278.1 - 4.9 \u003d 273.2
हम भाज्य और अवशिष्ट विचरण निर्धारित करते हैं:


यदि अलग-अलग नमूनों के लिए परिकलित यादृच्छिक चर के माध्य मान समान हैं, तो भाज्य और अवशिष्ट प्रसरण के अनुमान सामान्य विचरण के निष्पक्ष अनुमान हैं और नगण्य रूप से भिन्न होते हैं।
फिर फिशर मानदंड के अनुसार इन भिन्नताओं के अनुमानों की तुलना से पता चलता है कि फैक्टोरियल और अवशिष्ट भिन्नताओं की समानता के बारे में शून्य परिकल्पना को अस्वीकार करने का कोई कारण नहीं है।
कारक विचरण का अनुमान अवशिष्ट विचरण के अनुमान से कम है, इसलिए हम नमूने की परतों के लिए गणितीय अपेक्षाओं की समानता के बारे में शून्य परिकल्पना की वैधता पर तुरंत जोर दे सकते हैं।
दूसरे शब्दों में, इस उदाहरण में, कारक यादृच्छिक चर को महत्वपूर्ण रूप से प्रभावित नहीं करता है।
आइए शून्य परिकल्पना एच 0 की जांच करें: एक्स के औसत मूल्यों की समानता।
f obl . खोजें

महत्व स्तर α=0.05, स्वतंत्रता 1 और 8 की डिग्री की संख्या के लिए, हम फिशर-स्नेडेकोर वितरण तालिका से f करोड़ पाते हैं।
च करोड़ (0.05; 1; 8) = 5.32
इस तथ्य के कारण कि f obs< f кр, нулевую гипотезу о существенном влиянии фактора на результаты экспериментов отклоняем.
दूसरे शब्दों में, छात्रों की मौखिक और गैर-मौखिक प्राथमिकताओं का वितरण भिन्न होता है।

व्यायाम. फेसिंग टाइल्स के उत्पादन के लिए संयंत्र में चार लाइनें हैं। शिफ्ट के दौरान प्रत्येक पंक्ति से 10 टाइलों को यादृच्छिक रूप से चुना गया था और उनकी मोटाई (मिमी) को मापा गया था। नाममात्र आकार से विचलन तालिका में दिए गए हैं। उत्पादन लाइन (कारक ए) पर उच्च गुणवत्ता वाली टाइलों के उत्पादन की निर्भरता स्थापित करने के लिए महत्व स्तर ए = 0.05 पर इसकी आवश्यकता होती है।

व्यायाम. महत्व स्तर a = 0.05 पर, कोटिंग के सेवा जीवन पर रंग के रंग के प्रभाव की जांच करें ।

उदाहरण 1। 13 परीक्षण किए गए, जिनमें से 4 कारक के पहले स्तर पर, 4 दूसरे स्तर पर, 3 तीसरे स्तर पर और 2 चौथे स्तर पर थे। 0.05 के सार्थकता स्तर पर विचरण के विश्लेषण की विधि का प्रयोग करते हुए समूह माध्यों की समानता के बारे में शून्य परिकल्पना की जाँच करें। यह माना जाता है कि नमूने समान भिन्नता वाले सामान्य आबादी से लिए गए हैं। परीक्षण के परिणाम तालिका में दिखाए गए हैं।

समाधान:
समूह औसत ढूँढना:

एनपी 1पी 2पी 3पी 4
1 1.38 1.41 1.32 1.31
2 1.38 1.42 1.33 1.33
3 1.42 1.44 1.34 -
4 1.42 1.45 - -
5.6 5.72 3.99 2.64
एक्स सीएफ 1.4 1.43 1.33 1.32

आइए p को निरूपित करें - गुणनखंड के स्तरों की संख्या (p=4)। प्रत्येक स्तर पर माप की संख्या है: 4,4,3,2
अंतिम पंक्ति में कारक के प्रत्येक स्तर के लिए समूह साधन होते हैं।
कुल औसत की गणना सूत्र द्वारा की जाती है:

सूत्र (4) का उपयोग करके स्टोटल की गणना करने के लिए, हम 2 वर्ग विकल्प की एक तालिका संकलित करते हैं:

एनपी 2 1पी 2 2पी 2 3पी 2 4
1 1.9 1.99 1.74 1.72
2 1.9 2.02 1.77 1.77
3 2.02 2.07 1.8 -
4 2.02 2.1 - -
7.84 8.18 5.31 3.49

वर्ग विचलन का कुल योग सूत्र द्वारा ज्ञात किया जाता है:


हम सूत्र द्वारा S f पाते हैं:


हमें एस आराम मिलता है: एस आराम \u003d एस कुल - एस एफ \u003d 0.0293 - 0.0263 \u003d 0.003
कारक विचरण का निर्धारण करें:

और अवशिष्ट विचरण:

यदि अलग-अलग नमूनों के लिए परिकलित यादृच्छिक चर के माध्य मान समान हैं, तो भाज्य और अवशिष्ट प्रसरण के अनुमान सामान्य विचरण के निष्पक्ष अनुमान हैं और नगण्य रूप से भिन्न होते हैं।
फिर फिशर मानदंड के अनुसार इन भिन्नताओं के अनुमानों की तुलना से पता चलता है कि फैक्टोरियल और अवशिष्ट भिन्नताओं की समानता के बारे में शून्य परिकल्पना को अस्वीकार करने का कोई कारण नहीं है।
कारक विचरण का अनुमान अवशिष्ट विचरण के अनुमान से अधिक है, इसलिए हम तुरंत यह दावा कर सकते हैं कि नमूना परतों में गणितीय अपेक्षाओं की समानता के बारे में शून्य परिकल्पना सत्य नहीं है।
दूसरे शब्दों में, इस उदाहरण में, कारक का यादृच्छिक चर पर महत्वपूर्ण प्रभाव पड़ता है।
आइए शून्य परिकल्पना एच 0 की जांच करें: एक्स के औसत मूल्यों की समानता।
f obl . खोजें

महत्व स्तर α=0.05 के लिए, स्वतंत्रता 3 और 12 की डिग्री की संख्या, हम फिशर-स्नेडेकोर वितरण तालिका से f करोड़ पाते हैं।
च करोड़ (0.05; 3; 12) = 3.49
इस तथ्य के कारण कि f obl> f cr, हम प्रयोगों के परिणामों पर कारक के महत्वपूर्ण प्रभाव के बारे में शून्य परिकल्पना को स्वीकार करते हैं (हम समूह साधनों की समानता के बारे में शून्य परिकल्पना को अस्वीकार करते हैं)। दूसरे शब्दों में, समूह का अर्थ समग्र रूप से महत्वपूर्ण रूप से भिन्न है।

उदाहरण # 2। स्कूल में 5 छठी कक्षा है। मनोवैज्ञानिक को यह निर्धारित करने का काम सौंपा जाता है कि कक्षाओं में स्थितिजन्य चिंता का औसत स्तर समान है या नहीं। इसके लिए तालिका में दिया गया था। महत्व स्तर α=0.05 की जाँच करें, यह धारणा कि कक्षाओं में औसत स्थितिजन्य चिंता भिन्न नहीं होती है।

उदाहरण #3। X के मान का अध्ययन करने के लिए, कारक F के पांच स्तरों में से प्रत्येक पर 4 परीक्षण किए गए। परीक्षण के परिणाम तालिका में दिए गए हैं। ज्ञात कीजिए कि क्या गुणनखंड F का X के मान पर प्रभाव महत्वपूर्ण है। α = 0.05 लें। यह माना जाता है कि नमूने समान भिन्नता वाले सामान्य आबादी से लिए गए हैं।

उदाहरण # 4। मान लीजिए कि छात्रों के तीन समूहों, प्रत्येक 10 लोगों ने शैक्षणिक प्रयोग में भाग लिया। समूहों ने विभिन्न शिक्षण विधियों का उपयोग किया: पहले में - पारंपरिक (एफ 1), दूसरे में - कंप्यूटर प्रौद्योगिकी (एफ 2) पर आधारित, तीसरे में - एक ऐसी विधि जो व्यापक रूप से स्वतंत्र कार्य (एफ 3) के लिए कार्यों का उपयोग करती है। ज्ञान का मूल्यांकन दस सूत्री प्रणाली पर किया गया था।
परीक्षा पर प्राप्त आंकड़ों को संसाधित करना और इस बारे में निष्कर्ष निकालना आवश्यक है कि क्या शिक्षण पद्धति का प्रभाव महत्वपूर्ण है, α = 0.05 को महत्व स्तर के रूप में लेते हुए।
परीक्षा के परिणाम तालिका में दिए गए हैं, F j - कारक x ij का स्तर - विधि F j के अनुसार छात्र के i-th छात्र का मूल्यांकन।

कारक स्तर

उदाहरण संख्या 5. फसलों के प्रतिस्पर्धी किस्म परीक्षण के परिणाम दिखाए गए हैं (सी.डी. हेक्टेयर में उपज)। प्रत्येक किस्म का परीक्षण चार भूखंडों में किया गया था। उपज पर विविधता के प्रभाव का अध्ययन करने के लिए विचरण के विश्लेषण की विधि का प्रयोग करें। कारक के प्रभाव का महत्व (कुल भिन्नता में अंतरसमूह भिन्नता का हिस्सा) और प्रयोग के परिणामों के महत्व को 0.05 के महत्व स्तर पर निर्धारित करें।
विभिन्न परीक्षण भूखंडों में पैदावार

विविधता सी के दोहराव पर उत्पादकता। हा से
1 2 3 4
1
2
3
42,4
52,5
52,3
37,4
50,1
53,0
40,7
53,8
51,4
38,2
50,7
53,6

एनोवा सांख्यिकीय विधियों का एक सेट है जिसे कुछ विशेषताओं और अध्ययन किए गए कारकों के बीच संबंधों के बारे में परिकल्पना का परीक्षण करने के लिए डिज़ाइन किया गया है, जिसमें मात्रात्मक विवरण नहीं है, साथ ही कारकों के प्रभाव की डिग्री और उनकी बातचीत को स्थापित करने के लिए। विशेष साहित्य में, इसे अक्सर एनोवा (अंग्रेजी नाम एनालिसिस ऑफ वेरिएशन से) कहा जाता है। इस पद्धति को पहली बार 1925 में आर. फिशर द्वारा विकसित किया गया था।

विचरण के विश्लेषण के लिए प्रकार और मानदंड

इस पद्धति का उपयोग गुणात्मक (नाममात्र) विशेषताओं और एक मात्रात्मक (निरंतर) चर के बीच संबंधों की जांच के लिए किया जाता है। वास्तव में, यह कई नमूनों के अंकगणितीय साधनों की समानता के बारे में परिकल्पना का परीक्षण करता है। इस प्रकार, इसे एक साथ कई नमूनों के केंद्रों की तुलना करने के लिए एक पैरामीट्रिक मानदंड माना जा सकता है। यदि आप दो नमूनों के लिए इस पद्धति का उपयोग करते हैं, तो विचरण के विश्लेषण के परिणाम छात्र के टी-टेस्ट के परिणामों के समान होंगे। हालांकि, अन्य मानदंडों के विपरीत, यह अध्ययन आपको समस्या का अधिक विस्तार से अध्ययन करने की अनुमति देता है।

आंकड़ों में भिन्नता का विश्लेषण कानून पर आधारित है: संयुक्त नमूने के वर्ग विचलन का योग इंट्राग्रुप विचलन के वर्गों के योग और इंटरग्रुप विचलन के वर्गों के योग के बराबर है। अध्ययन के लिए, फिशर के परीक्षण का उपयोग इंटरग्रुप और इंट्राग्रुप वेरिएंस के बीच अंतर के महत्व को स्थापित करने के लिए किया जाता है। हालांकि, इसके लिए आवश्यक पूर्वापेक्षाएँ वितरण की सामान्यता और नमूनों की समरूपता (भिन्नताओं की समानता) हैं। विचरण और बहुभिन्नरूपी (मल्टीफैक्टोरियल) के एक-आयामी (एकल-कारक) विश्लेषण के बीच भेद। पहला एक विशेषता पर अध्ययन के तहत मूल्य की निर्भरता पर विचार करता है, दूसरा - एक साथ कई पर, और आपको उनके बीच के संबंध की पहचान करने की भी अनुमति देता है।

कारकों

कारक नियंत्रित परिस्थितियाँ कहलाती हैं जो अंतिम परिणाम को प्रभावित करती हैं। इसके स्तर या प्रसंस्करण की विधि को वह मान कहा जाता है जो इस स्थिति की विशिष्ट अभिव्यक्ति को दर्शाता है। ये आंकड़े आमतौर पर माप के नाममात्र या क्रमिक पैमाने पर दिए जाते हैं। अक्सर आउटपुट मानों को मात्रात्मक या क्रमिक पैमानों पर मापा जाता है। फिर आउटपुट डेटा को टिप्पणियों की एक श्रृंखला में समूहीकृत करने की समस्या है जो लगभग समान संख्यात्मक मानों के अनुरूप है। यदि समूहों की संख्या बहुत अधिक है, तो उनमें प्रेक्षणों की संख्या विश्वसनीय परिणाम प्राप्त करने के लिए अपर्याप्त हो सकती है। यदि संख्या को बहुत कम लिया जाता है, तो इससे सिस्टम पर प्रभाव की आवश्यक विशेषताओं का नुकसान हो सकता है। डेटा को समूहीकृत करने की विशिष्ट विधि मात्रा और मूल्यों में भिन्नता की प्रकृति पर निर्भर करती है। अविभाज्य विश्लेषण में अंतरालों की संख्या और आकार अक्सर समान अंतराल के सिद्धांत या समान आवृत्तियों के सिद्धांत द्वारा निर्धारित किए जाते हैं।

फैलाव विश्लेषण के कार्य

तो, ऐसे मामले हैं जब आपको दो या दो से अधिक नमूनों की तुलना करने की आवश्यकता होती है। यह तब है जब विचरण के विश्लेषण का उपयोग करना उचित है। विधि का नाम इंगित करता है कि निष्कर्ष विचरण के घटकों के अध्ययन के आधार पर बनाए गए हैं। अध्ययन का सार यह है कि संकेतक में समग्र परिवर्तन को उन घटकों में विभाजित किया जाता है जो प्रत्येक व्यक्तिगत कारक की कार्रवाई के अनुरूप होते हैं। कई समस्याओं पर विचार करें जो विचरण का एक विशिष्ट विश्लेषण हल करता है।

उदाहरण 1

कार्यशाला में कई मशीन टूल्स हैं - स्वचालित मशीनें जो एक विशिष्ट भाग का उत्पादन करती हैं। प्रत्येक भाग का आकार एक यादृच्छिक मान होता है, जो प्रत्येक मशीन की सेटिंग्स और भागों के निर्माण प्रक्रिया के दौरान होने वाले यादृच्छिक विचलन पर निर्भर करता है। भागों के आयामों के माप से यह निर्धारित करना आवश्यक है कि क्या मशीनों को उसी तरह स्थापित किया गया है।

उदाहरण 2

विद्युत उपकरण के निर्माण के दौरान, विभिन्न प्रकार के इन्सुलेट पेपर का उपयोग किया जाता है: संधारित्र, विद्युत, आदि। उपकरण को विभिन्न पदार्थों के साथ लगाया जा सकता है: एपॉक्सी राल, वार्निश, एमएल -2 राल, आदि। वैक्यूम के तहत लीक को समाप्त किया जा सकता है गर्म होने पर ऊंचा दबाव। इसे वार्निश में विसर्जित करके, वार्निश की एक सतत धारा के तहत लगाया जा सकता है, आदि। संपूर्ण रूप से विद्युत उपकरण एक निश्चित यौगिक के साथ डाला जाता है, जिसमें से कई विकल्प हैं। गुणवत्ता संकेतक इन्सुलेशन की ढांकता हुआ ताकत, ऑपरेटिंग मोड में वाइंडिंग का ओवरहीटिंग तापमान और कई अन्य हैं। निर्माण उपकरणों की तकनीकी प्रक्रिया के विकास के दौरान, यह निर्धारित करना आवश्यक है कि सूचीबद्ध कारकों में से प्रत्येक डिवाइस के प्रदर्शन को कैसे प्रभावित करता है।

उदाहरण 3

ट्रॉलीबस डिपो कई ट्रॉलीबस मार्गों पर कार्य करता है। वे विभिन्न प्रकार की ट्रॉली बसों का संचालन करते हैं और 125 निरीक्षक किराया वसूल करते हैं। डिपो का प्रबंधन इस प्रश्न में रुचि रखता है: विभिन्न मार्गों, विभिन्न प्रकार के ट्रॉलीबसों को देखते हुए प्रत्येक नियंत्रक (राजस्व) के आर्थिक प्रदर्शन की तुलना कैसे करें? किसी विशेष मार्ग पर एक निश्चित प्रकार की ट्रॉली बसों को लॉन्च करने की आर्थिक व्यवहार्यता का निर्धारण कैसे करें? विभिन्न प्रकार के ट्रॉलीबसों में प्रत्येक मार्ग पर कंडक्टर द्वारा लाए जाने वाले राजस्व की मात्रा के लिए उचित आवश्यकताओं को कैसे स्थापित किया जाए?

एक विधि चुनने का कार्य यह है कि प्रत्येक कारक के अंतिम परिणाम पर प्रभाव के बारे में अधिकतम जानकारी कैसे प्राप्त की जाए, इस तरह के प्रभाव की संख्यात्मक विशेषताओं का निर्धारण, न्यूनतम लागत पर उनकी विश्वसनीयता और कम से कम संभव समय में। फैलाव विश्लेषण के तरीके ऐसी समस्याओं को हल करने की अनुमति देते हैं।

वस्तु के एक प्रकार विश्लेषण

अध्ययन का उद्देश्य विश्लेषण की जा रही समीक्षा पर किसी विशेष मामले के प्रभाव के परिमाण का आकलन करना है। अविभाजित विश्लेषण का एक अन्य कार्य दो या दो से अधिक परिस्थितियों की एक दूसरे के साथ तुलना करना हो सकता है ताकि रिकॉल पर उनके प्रभाव में अंतर का निर्धारण किया जा सके। यदि शून्य परिकल्पना को खारिज कर दिया जाता है, तो अगला कदम प्राप्त विशेषताओं के लिए विश्वास अंतरालों को मापना और बनाना है। उस स्थिति में जब शून्य परिकल्पना को अस्वीकार नहीं किया जा सकता है, इसे आमतौर पर स्वीकार किया जाता है और प्रभाव की प्रकृति के बारे में निष्कर्ष निकाला जाता है।

विचरण का एकतरफा विश्लेषण क्रुस्कल-वालिस रैंक पद्धति का एक गैर-पैरामीट्रिक एनालॉग बन सकता है। यह 1952 में अमेरिकी गणितज्ञ विलियम क्रुस्कल और अर्थशास्त्री विल्सन वालिस द्वारा विकसित किया गया था। इस परीक्षण का उद्देश्य शून्य परिकल्पना का परीक्षण करना है कि अध्ययन किए गए नमूनों पर प्रभाव का प्रभाव अज्ञात के बराबर है लेकिन समान माध्य मान है। इस मामले में, नमूनों की संख्या दो से अधिक होनी चाहिए।

जोंखियर (जोंखियर-टेरपस्ट्रा) मानदंड स्वतंत्र रूप से 1952 में डच गणितज्ञ टी.जे. टेरपस्ट्रॉम और 1954 में ब्रिटिश मनोवैज्ञानिक ई. अध्ययन के तहत कारक का प्रभाव, जिसे एक क्रमिक पैमाने पर मापा जाता है।

एम - 1937 में ब्रिटिश सांख्यिकीविद् मौरिस स्टीवेन्सन बार्टलेट द्वारा प्रस्तावित बार्टलेट मानदंड का उपयोग कई सामान्य सामान्य आबादी के भिन्नताओं की समानता के बारे में शून्य परिकल्पना का परीक्षण करने के लिए किया जाता है, जिसमें से अध्ययन किए गए नमूने सामान्य मामले में अलग-अलग आकार के होते हैं। (प्रत्येक नमूने की संख्या कम से कम चार होनी चाहिए)।

जी कोचरन परीक्षण है, जिसे 1941 में अमेरिकी विलियम जेमेल कोचरन द्वारा खोजा गया था। इसका उपयोग समान आकार के स्वतंत्र नमूनों के लिए सामान्य आबादी के भिन्नताओं की समानता के बारे में शून्य परिकल्पना का परीक्षण करने के लिए किया जाता है।

1960 में अमेरिकी गणितज्ञ हॉवर्ड लेवेन द्वारा प्रस्तावित गैर-पैरामीट्रिक लेवेन परीक्षण, बार्टलेट परीक्षण का एक विकल्प है, जहां इस बात की कोई निश्चितता नहीं है कि अध्ययन के तहत नमूने सामान्य वितरण का पालन करते हैं।

1974 में, अमेरिकी सांख्यिकीविद् मॉर्टन बी. ब्राउन और एलन बी. फोर्सिथ ने एक परीक्षण (ब्राउन-फोर्सिथ परीक्षण) का प्रस्ताव रखा, जो लेवेन परीक्षण से कुछ अलग है।

दोतरफा विश्लेषण

विचरण के दो-तरफ़ा विश्लेषण का उपयोग लिंक किए गए सामान्य रूप से वितरित नमूनों के लिए किया जाता है। व्यवहार में, इस पद्धति की जटिल तालिकाओं का भी अक्सर उपयोग किया जाता है, विशेष रूप से, जिनमें प्रत्येक सेल में निश्चित स्तर के मूल्यों के अनुरूप डेटा (दोहराया माप) का एक सेट होता है। यदि विचरण के दो-तरफा विश्लेषण को लागू करने के लिए आवश्यक मान्यताओं को पूरा नहीं किया जाता है, तो 1930 के अंत में अमेरिकी अर्थशास्त्री मिल्टन फ्रीडमैन द्वारा विकसित फ्राइडमैन (फ्रीडमैन, केंडल और स्मिथ) के गैर-पैरामीट्रिक रैंक परीक्षण का उपयोग किया जाता है। यह मानदंड वितरण के प्रकार पर निर्भर नहीं करता है।

यह केवल माना जाता है कि मात्राओं का वितरण समान और निरंतर है, और वे स्वयं एक दूसरे से स्वतंत्र हैं। अशक्त परिकल्पना का परीक्षण करते समय, आउटपुट डेटा को एक आयताकार मैट्रिक्स के रूप में प्रस्तुत किया जाता है, जिसमें पंक्तियाँ कारक B के स्तरों के अनुरूप होती हैं, और स्तंभ स्तर A के अनुरूप होते हैं। तालिका (ब्लॉक) की प्रत्येक कोशिका हो सकती है एक वस्तु पर या दोनों कारकों के स्तरों के निरंतर मूल्यों के साथ वस्तुओं के समूह पर मापदंडों के मापन का परिणाम। इस मामले में, संबंधित डेटा को अध्ययन के तहत नमूने के सभी मापों या वस्तुओं के लिए एक निश्चित पैरामीटर के औसत मूल्यों के रूप में प्रस्तुत किया जाता है। आउटपुट मानदंड को लागू करने के लिए, माप के प्रत्यक्ष परिणामों से उनके रैंक तक जाना आवश्यक है। रैंकिंग प्रत्येक पंक्ति के लिए अलग से की जाती है, अर्थात प्रत्येक निश्चित मान के लिए मानों का आदेश दिया जाता है।

1963 में अमेरिकी सांख्यिकीविद् ई.बी. पेज द्वारा प्रस्तावित पेज टेस्ट (एल-टेस्ट) को शून्य परिकल्पना का परीक्षण करने के लिए डिज़ाइन किया गया है। बड़े नमूनों के लिए, पृष्ठ सन्निकटन का उपयोग किया जाता है। वे, संगत अशक्त परिकल्पनाओं की वास्तविकता के अधीन, मानक सामान्य वितरण का पालन करते हैं। मामले में जब स्रोत तालिका की पंक्तियों में समान मान होते हैं, तो औसत रैंक का उपयोग करना आवश्यक होता है। इस मामले में, निष्कर्ष की सटीकता जितनी खराब होगी, ऐसे संयोगों की संख्या उतनी ही अधिक होगी।

क्यू - कोचरन की कसौटी, 1937 में वी। कोचरन द्वारा प्रस्तावित। इसका उपयोग उन मामलों में किया जाता है जहां सजातीय विषयों के समूह दो से अधिक प्रभावों के संपर्क में आते हैं और जिसके लिए समीक्षा के लिए दो विकल्प संभव हैं - सशर्त रूप से नकारात्मक (0) और सशर्त रूप से सकारात्मक (1 ) . शून्य परिकल्पना में प्रभाव प्रभावों की समानता शामिल है। विचरण का दो-तरफा विश्लेषण प्रसंस्करण प्रभावों के अस्तित्व को निर्धारित करना संभव बनाता है, लेकिन यह निर्धारित करना संभव नहीं है कि यह प्रभाव किन स्तंभों के लिए मौजूद है। इस समस्या को हल करते समय, युग्मित नमूनों के लिए कई Scheffe समीकरणों की विधि का उपयोग किया जाता है।

बहुभिन्नरूपी विश्लेषण

विचरण के बहुभिन्नरूपी विश्लेषण की समस्या तब उत्पन्न होती है जब एक निश्चित यादृच्छिक चर पर दो या दो से अधिक स्थितियों के प्रभाव को निर्धारित करना आवश्यक होता है। अध्ययन एक आश्रित यादृच्छिक चर की उपस्थिति के लिए प्रदान करता है, जिसे अंतर या अनुपात के पैमाने पर मापा जाता है, और कई स्वतंत्र चर, जिनमें से प्रत्येक को नामों के पैमाने पर या रैंक पैमाने पर व्यक्त किया जाता है। डेटा का फैलाव विश्लेषण गणितीय आँकड़ों की एक काफी विकसित शाखा है, जिसमें बहुत सारे विकल्प हैं। अध्ययन की अवधारणा अविभाजित और बहुभिन्नरूपी दोनों अध्ययनों के लिए समान है। इसका सार इस तथ्य में निहित है कि कुल भिन्नता घटकों में विभाजित है, जो डेटा के एक निश्चित समूह से मेल खाती है। डेटा के प्रत्येक समूह का अपना मॉडल होता है। यहां हम केवल इसके सबसे अधिक उपयोग किए जाने वाले वेरिएंट को समझने और व्यावहारिक उपयोग के लिए आवश्यक मुख्य प्रावधानों पर विचार करेंगे।

विचरण के कारक विश्लेषण के लिए इनपुट डेटा के संग्रह और प्रस्तुति पर और विशेष रूप से परिणामों की व्याख्या के लिए सावधानीपूर्वक ध्यान देने की आवश्यकता है। एक-कारक के विपरीत, जिसके परिणाम सशर्त रूप से एक निश्चित क्रम में रखे जा सकते हैं, दो-कारक के परिणामों को अधिक जटिल प्रस्तुति की आवश्यकता होती है। तीन, चार या इससे अधिक परिस्थितियाँ होने पर और भी कठिन परिस्थिति उत्पन्न हो जाती है। इस वजह से, मॉडल में शायद ही कभी तीन (चार) से अधिक स्थितियां शामिल होती हैं। एक उदाहरण विद्युत वृत्त के समाई और अधिष्ठापन के एक निश्चित मूल्य पर प्रतिध्वनि की घटना होगी; तत्वों के एक निश्चित सेट के साथ रासायनिक प्रतिक्रिया की अभिव्यक्ति जिससे सिस्टम बनाया गया है; परिस्थितियों के एक निश्चित संयोग के तहत जटिल प्रणालियों में विषम प्रभावों की घटना। बातचीत की उपस्थिति प्रणाली के मॉडल को मौलिक रूप से बदल सकती है और कभी-कभी उस घटना की प्रकृति पर पुनर्विचार कर सकती है जिसके साथ प्रयोगकर्ता काम कर रहा है।

दोहराए गए प्रयोगों के साथ विचरण का बहुभिन्नरूपी विश्लेषण

मापन डेटा को अक्सर दो नहीं, बल्कि अधिक कारकों द्वारा समूहीकृत किया जा सकता है। इसलिए, यदि हम परिस्थितियों (निर्माता और जिस मार्ग पर टायर संचालित होते हैं) को ध्यान में रखते हुए, ट्रॉलीबस पहियों के लिए टायरों के सेवा जीवन के विचरण के विश्लेषण पर विचार करते हैं, तो हम एक अलग स्थिति के रूप में उस मौसम में अंतर कर सकते हैं जिसके दौरान टायर संचालित होते हैं (अर्थात्: सर्दी और गर्मी का संचालन)। नतीजतन, हमें तीन-कारक विधि की समस्या होगी।

अधिक स्थितियों की उपस्थिति में, दृष्टिकोण दो-तरफा विश्लेषण के समान है। सभी मामलों में, मॉडल सरल बनाने की कोशिश कर रहा है। दो कारकों के परस्पर क्रिया की घटना इतनी बार प्रकट नहीं होती है, और ट्रिपल इंटरैक्शन केवल असाधारण मामलों में होता है। उन इंटरैक्शन को शामिल करें जिनके लिए पिछली जानकारी है और मॉडल में इसे ध्यान में रखने के अच्छे कारण हैं। व्यक्तिगत कारकों को अलग करने और उन्हें ध्यान में रखने की प्रक्रिया अपेक्षाकृत सरल है। इसलिए, अक्सर अधिक परिस्थितियों को उजागर करने की इच्छा होती है। आपको इससे दूर नहीं जाना चाहिए। अधिक स्थितियां, मॉडल जितना कम विश्वसनीय होता है और त्रुटि की संभावना उतनी ही अधिक होती है। मॉडल ही, जिसमें बड़ी संख्या में स्वतंत्र चर शामिल हैं, व्यावहारिक उपयोग के लिए व्याख्या करना और असुविधाजनक हो जाता है।

विचरण के विश्लेषण का सामान्य विचार

आंकड़ों में भिन्नता का विश्लेषण अवलोकन परिणाम प्राप्त करने की एक विधि है जो विभिन्न समवर्ती परिस्थितियों पर निर्भर करता है और उनके प्रभाव का आकलन करता है। एक नियंत्रित चर जो अध्ययन की वस्तु पर प्रभाव की विधि से मेल खाता है और एक निश्चित अवधि में एक निश्चित मूल्य प्राप्त करता है उसे कारक कहा जाता है। वे गुणात्मक और मात्रात्मक हो सकते हैं। मात्रात्मक स्थितियों के स्तर संख्यात्मक पैमाने पर एक निश्चित मूल्य प्राप्त करते हैं। उदाहरण हैं तापमान, दबाव दबाव, पदार्थ की मात्रा। गुणात्मक कारक विभिन्न पदार्थ, विभिन्न तकनीकी विधियां, उपकरण, भराव हैं। उनके स्तर नामों के पैमाने के अनुरूप हैं।

गुणवत्ता में पैकेजिंग सामग्री का प्रकार, खुराक के रूप में भंडारण की स्थिति भी शामिल है। कच्चे माल के पीसने की डिग्री, कणिकाओं की भिन्नात्मक संरचना को शामिल करना भी तर्कसंगत है, जिसका मात्रात्मक मूल्य होता है, लेकिन यदि मात्रात्मक पैमाने का उपयोग किया जाता है, तो इसे विनियमित करना मुश्किल होता है। गुणवत्ता कारकों की संख्या खुराक के प्रकार के साथ-साथ औषधीय पदार्थों के भौतिक और तकनीकी गुणों पर निर्भर करती है। उदाहरण के लिए, सीधे संपीड़न द्वारा क्रिस्टलीय पदार्थों से गोलियां प्राप्त की जा सकती हैं। इस मामले में, स्लाइडिंग और स्नेहक एजेंटों के चयन को पूरा करने के लिए पर्याप्त है।

विभिन्न प्रकार के खुराक रूपों के लिए गुणवत्ता कारकों के उदाहरण

  • मिलावट।एक्सट्रैक्टेंट रचना, एक्सट्रैक्टर का प्रकार, कच्चा माल तैयार करने की विधि, उत्पादन विधि, निस्पंदन विधि।
  • अर्क (तरल, गाढ़ा, सूखा)।निकालने वाले की संरचना, निष्कर्षण विधि, स्थापना का प्रकार, निकालने वाले और गिट्टी पदार्थों को हटाने की विधि।
  • गोलियाँ।एक्सीसिएंट्स, फिलर्स, डिसइंटीग्रेंट्स, बाइंडर्स, लुब्रिकेंट्स और लुब्रिकेंट्स की संरचना। टैबलेट प्राप्त करने की विधि, तकनीकी उपकरण का प्रकार। खोल और उसके घटकों के प्रकार, फिल्म बनाने वाले, रंगद्रव्य, रंग, प्लास्टिसाइज़र, सॉल्वैंट्स।
  • इंजेक्शन समाधान।विलायक का प्रकार, निस्पंदन विधि, स्टेबलाइजर्स और परिरक्षकों की प्रकृति, नसबंदी की स्थिति, ampoules भरने की विधि।
  • सपोसिटरी।सपोसिटरी बेस की संरचना, सपोसिटरी, फिलर्स, पैकेजिंग प्राप्त करने की विधि।
  • मलहम।आधार की संरचना, संरचनात्मक घटक, मरहम तैयार करने की विधि, उपकरण का प्रकार, पैकेजिंग।
  • कैप्सूल।खोल सामग्री का प्रकार, कैप्सूल प्राप्त करने की विधि, प्लास्टिसाइज़र का प्रकार, परिरक्षक, डाई।
  • लिनिमेंट्स।उत्पादन विधि, संरचना, उपकरण का प्रकार, पायसीकारकों का प्रकार।
  • निलंबन।विलायक का प्रकार, स्टेबलाइजर का प्रकार, फैलाव विधि।

टैबलेट निर्माण प्रक्रिया में अध्ययन किए गए गुणवत्ता कारकों और उनके स्तरों के उदाहरण

  • बेकिंग पाउडर।आलू स्टार्च, सफेद मिट्टी, साइट्रिक एसिड के साथ सोडियम बाइकार्बोनेट का मिश्रण, मूल मैग्नीशियम कार्बोनेट।
  • बाध्यकारी समाधान।पानी, स्टार्च पेस्ट, चीनी की चाशनी, मिथाइलसेलुलोज घोल, हाइड्रॉक्सीप्रोपाइल मिथाइलसेलुलोज घोल, पॉलीविनाइलपायरोलिडोन घोल, पॉलीविनाइल अल्कोहल घोल।
  • फिसलने वाला पदार्थ।एरोसिल, स्टार्च, तालक।
  • भराव।चीनी, ग्लूकोज, लैक्टोज, सोडियम क्लोराइड, कैल्शियम फॉस्फेट।
  • स्नेहक।स्टीयरिक एसिड, पॉलीइथाइलीन ग्लाइकॉल, पैराफिन।

राज्य की प्रतिस्पर्धा के स्तर के अध्ययन में फैलाव विश्लेषण के मॉडल

राज्य की स्थिति का आकलन करने के लिए सबसे महत्वपूर्ण मानदंडों में से एक, जिसका उपयोग इसके कल्याण और सामाजिक-आर्थिक विकास के स्तर का आकलन करने के लिए किया जाता है, प्रतिस्पर्धात्मकता है, जो कि राष्ट्रीय अर्थव्यवस्था में निहित गुणों का एक समूह है जो क्षमता निर्धारित करती है अन्य देशों के साथ प्रतिस्पर्धा करने के लिए राज्य। विश्व बाजार में राज्य के स्थान और भूमिका को निर्धारित करने के बाद, अंतरराष्ट्रीय स्तर पर आर्थिक सुरक्षा सुनिश्चित करने के लिए एक स्पष्ट रणनीति स्थापित करना संभव है, क्योंकि यह रूस और विश्व बाजार में सभी खिलाड़ियों के बीच सकारात्मक संबंधों की कुंजी है: निवेशक , लेनदारों, राज्य सरकारों।

राज्यों की प्रतिस्पर्धा के स्तर की तुलना करने के लिए, देशों को जटिल सूचकांकों का उपयोग करके रैंक किया जाता है, जिसमें विभिन्न भारित संकेतक शामिल होते हैं। ये सूचकांक आर्थिक, राजनीतिक आदि स्थिति को प्रभावित करने वाले प्रमुख कारकों पर आधारित होते हैं। राज्य की प्रतिस्पर्धात्मकता का अध्ययन करने के लिए मॉडलों का परिसर बहुआयामी सांख्यिकीय विश्लेषण के तरीकों के उपयोग के लिए प्रदान करता है (विशेष रूप से, यह विचरण (सांख्यिकी), अर्थमितीय मॉडलिंग, निर्णय लेने का विश्लेषण है) और इसमें निम्नलिखित मुख्य चरण शामिल हैं:

  1. संकेतक-संकेतकों की एक प्रणाली का गठन।
  2. राज्य की प्रतिस्पर्धात्मकता के संकेतकों का मूल्यांकन और पूर्वानुमान।
  3. संकेतकों की तुलना-राज्यों की प्रतिस्पर्धात्मकता के संकेतक।

और अब आइए इस परिसर के प्रत्येक चरण के मॉडल की सामग्री पर विचार करें।

पहले चरण मेंविशेषज्ञ अध्ययन के तरीकों का उपयोग करते हुए, राज्य की प्रतिस्पर्धा का आकलन करने के लिए आर्थिक संकेतकों-संकेतकों का एक उचित सेट बनाया जाता है, जो अंतरराष्ट्रीय रेटिंग और सांख्यिकीय विभागों के आंकड़ों के आधार पर इसके विकास की बारीकियों को ध्यान में रखते हुए, प्रणाली की स्थिति को दर्शाता है। पूरी तरह से और इसकी प्रक्रियाओं के रूप में। इन संकेतकों की पसंद उन लोगों को चुनने की आवश्यकता से उचित है जो पूरी तरह से, अभ्यास के दृष्टिकोण से, राज्य के स्तर, इसके निवेश आकर्षण और मौजूदा संभावित और वास्तविक खतरों के सापेक्ष स्थानीयकरण की संभावना को निर्धारित करने की अनुमति देते हैं।

अंतरराष्ट्रीय रेटिंग सिस्टम के मुख्य संकेतक-संकेतक सूचकांक हैं:

  1. वैश्विक प्रतिस्पर्धात्मकता (जीसीसी)।
  2. आर्थिक स्वतंत्रता (आईईएस)।
  3. मानव विकास (एचडीआई)।
  4. भ्रष्टाचार की धारणा (सीपीआई)।
  5. आंतरिक और बाहरी खतरे (आईवीजेडजेड)।
  6. अंतर्राष्ट्रीय प्रभाव की संभावना (आईपीआईपी)।

दूसरा चरणदुनिया के 139 राज्यों के अध्ययन के लिए अंतरराष्ट्रीय रेटिंग के अनुसार राज्य की प्रतिस्पर्धात्मकता के संकेतकों के मूल्यांकन और पूर्वानुमान के लिए प्रदान करता है।

तीसरा चरणसहसंबंध और प्रतिगमन विश्लेषण के तरीकों का उपयोग करके राज्यों की प्रतिस्पर्धात्मकता के लिए स्थितियों की तुलना प्रदान करता है।

अध्ययन के परिणामों का उपयोग करके, सामान्य रूप से और राज्य की प्रतिस्पर्धात्मकता के व्यक्तिगत घटकों के लिए प्रक्रियाओं की प्रकृति को निर्धारित करना संभव है; महत्व के उपयुक्त स्तर पर कारकों के प्रभाव और उनके संबंधों के बारे में परिकल्पना का परीक्षण करें।

मॉडलों के प्रस्तावित सेट के कार्यान्वयन से न केवल राज्यों की प्रतिस्पर्धा और निवेश आकर्षण के स्तर की वर्तमान स्थिति का आकलन करने की अनुमति मिलेगी, बल्कि प्रबंधन की कमियों का विश्लेषण करने, गलत निर्णयों की त्रुटियों को रोकने और संकट के विकास को रोकने की भी अनुमति मिलेगी। राज्य में।

विचरण का विश्लेषण विशेषताओं के मूल्यों में अंतर (विविधता) के निर्धारण के आधार पर, यादृच्छिक रूप से चयनित विभिन्न समूहों में कारक और प्रदर्शन विशेषताओं के बीच संबंध का आकलन करने के लिए एक सांख्यिकीय पद्धति है। विचरण का विश्लेषण अध्ययन की गई जनसंख्या की सभी इकाइयों के अंकगणितीय माध्य से विचलन के विश्लेषण पर आधारित है। विचलन के माप के रूप में, फैलाव (बी) लिया जाता है - विचलन का औसत वर्ग। एक कारक विशेषता (कारक) के प्रभाव के कारण होने वाले विचलन की तुलना यादृच्छिक परिस्थितियों के कारण होने वाले विचलन के परिमाण से की जाती है। यदि कारक विशेषता के कारण होने वाले विचलन यादृच्छिक विचलन से अधिक महत्वपूर्ण हैं, तो कारक को परिणामी विशेषता पर एक महत्वपूर्ण प्रभाव माना जाता है।

अंकगणित माध्य, वर्ग से प्रत्येक विकल्प के विचलन मान (विशेषता के प्रत्येक पंजीकृत संख्यात्मक मान) के विचलन की गणना करने के लिए। इससे नकारात्मक संकेतों से छुटकारा मिलेगा। फिर इन विचलनों (अंतरों) को सारांशित किया जाता है और अवलोकनों की संख्या से विभाजित किया जाता है, अर्थात। औसत विचलन। इस प्रकार, फैलाव मान प्राप्त होते हैं।

विचरण के विश्लेषण के अनुप्रयोग के लिए एक महत्वपूर्ण पद्धतिगत मूल्य नमूने का सही गठन है। लक्ष्य और उद्देश्यों के आधार पर, चयनात्मक समूहों को एक-दूसरे से स्वतंत्र रूप से स्वतंत्र रूप से बनाया जा सकता है (कुछ संकेतक का अध्ययन करने के लिए नियंत्रण और प्रयोगात्मक समूह, उदाहरण के लिए, स्ट्रोक के विकास पर उच्च रक्तचाप का प्रभाव)। ऐसे नमूनों को स्वतंत्र कहा जाता है।

अक्सर, कारकों के संपर्क के परिणामों का अध्ययन एक ही नमूना समूह में किया जाता है (उदाहरण के लिए, एक ही रोगियों में) जोखिम से पहले और बाद में (उपचार, रोकथाम, पुनर्वास उपाय), ऐसे नमूनों को आश्रित कहा जाता है।

विचरण का विश्लेषण, जिसमें एक कारक के प्रभाव की जाँच की जाती है, एक-कारक विश्लेषण (एकतरफा विश्लेषण) कहलाता है। एक से अधिक कारकों के प्रभाव का अध्ययन करते समय, विचरण के बहुभिन्नरूपी विश्लेषण (बहुभिन्नरूपी विश्लेषण) का उपयोग किया जाता है।

कारक संकेत वे संकेत हैं जो अध्ययन के तहत घटना को प्रभावित करते हैं।

प्रभावी संकेत वे संकेत हैं जो कारक संकेतों के प्रभाव में बदलते हैं।

विचरण के विश्लेषण के उपयोग के लिए शर्तें:

अध्ययन का कार्य परिणाम पर एक (3 तक) कारकों के प्रभाव की ताकत का निर्धारण करना है या विभिन्न कारकों (लिंग और आयु, शारीरिक गतिविधि और पोषण, आदि) के संयुक्त प्रभाव की ताकत का निर्धारण करना है।

अध्ययन किए गए कारक एक दूसरे से स्वतंत्र (असंबंधित) होने चाहिए। उदाहरण के लिए, कोई कार्य अनुभव और बच्चों की उम्र, ऊंचाई और वजन आदि के संयुक्त प्रभाव का अध्ययन नहीं कर सकता है। जनसंख्या की घटना पर।

अध्ययन के लिए समूहों का चयन यादृच्छिक रूप से (यादृच्छिक चयन) किया जाता है। विकल्पों के यादृच्छिक चयन के सिद्धांत के कार्यान्वयन के साथ एक फैलाव परिसर के संगठन को यादृच्छिककरण (अंग्रेजी से अनुवादित - यादृच्छिक) कहा जाता है, अर्थात। यादृच्छिक रूप से चुना गया।

दोनों मात्रात्मक और गुणात्मक (विशेषण) सुविधाओं का उपयोग किया जा सकता है।

विचरण का एकतरफा विश्लेषण करते समय, यह अनुशंसा की जाती है (आवेदन के लिए आवश्यक शर्त):

1. विश्लेषण किए गए समूहों के वितरण की सामान्यता या सामान्य वितरण के साथ सामान्य आबादी के लिए नमूना समूहों के पत्राचार।

2. समूहों में टिप्पणियों के वितरण की स्वतंत्रता (गैर-जुड़ाव)।

3. प्रेक्षणों की आवृत्ति (पुनरावृत्ति) की उपस्थिति।

सबसे पहले, एक शून्य परिकल्पना तैयार की जाती है, अर्थात यह माना जाता है कि अध्ययन के तहत कारकों का परिणामी विशेषता के मूल्यों पर कोई प्रभाव नहीं पड़ता है और परिणामी अंतर यादृच्छिक होते हैं।

फिर हम निर्धारित करते हैं कि देखे गए (या मजबूत) अंतर प्राप्त करने की संभावना क्या है, बशर्ते कि शून्य परिकल्पना सत्य हो।

यदि यह संभावना कम है, तो हम शून्य परिकल्पना को अस्वीकार करते हैं और निष्कर्ष निकालते हैं कि अध्ययन के परिणाम सांख्यिकीय रूप से महत्वपूर्ण हैं। इसका अभी तक यह मतलब नहीं है कि अध्ययन किए गए कारकों का प्रभाव सिद्ध हो गया है (यह मुख्य रूप से शोध योजना का मामला है), लेकिन यह अभी भी संभावना नहीं है कि परिणाम संयोग के कारण है।

जब विचरण के विश्लेषण को लागू करने की सभी शर्तें पूरी हो जाती हैं, तो गणितीय रूप से कुल विचरण का अपघटन इस तरह दिखता है:

डॉटोट। = डीफैक्ट + डी रेस्ट।,

डॉटोट। - देखे गए मूल्यों (संस्करण) का कुल विचरण, कुल औसत से भिन्न के प्रसार की विशेषता है। इस भिन्नता का कारण बनने वाले सभी कारकों के प्रभाव में पूरी आबादी में एक विशेषता की भिन्नता को मापता है। समग्र विविधता इंटरग्रुप और इंट्राग्रुप से बनी है;

तथ्य - तथ्यात्मक (इंटरग्रुप) फैलाव, प्रत्येक समूह में औसत में अंतर की विशेषता और अध्ययन किए गए कारक के प्रभाव पर निर्भर करता है, जिसके अनुसार प्रत्येक समूह को विभेदित किया जाता है। उदाहरण के लिए, निमोनिया के नैदानिक ​​​​पाठ्यक्रम के विभिन्न एटियलॉजिकल कारकों के समूहों में, बिताए गए बिस्तर-दिन का औसत स्तर समान नहीं है - अंतरसमूह विविधता देखी जाती है।

डी आराम। - अवशिष्ट (इंट्राग्रुप) विचरण, जो समूहों के भीतर वैरिएंट के फैलाव की विशेषता है। यादृच्छिक भिन्नता को दर्शाता है, अर्थात। भिन्नता का वह भाग जो अनिर्दिष्ट कारकों के प्रभाव में होता है और जो लक्षण - समूह में अंतर्निहित कारक पर निर्भर नहीं करता है। अध्ययन के तहत विशेषता की भिन्नता कुछ बेहिसाब यादृच्छिक कारकों के प्रभाव की ताकत पर निर्भर करती है, दोनों संगठित (शोधकर्ता द्वारा दिए गए) और यादृच्छिक (अज्ञात) कारकों पर।

इसलिए, कुल भिन्नता (फैलाव) संगठित (दिए गए) कारकों के कारण होने वाली भिन्नता से बना है, जिसे तथ्यात्मक भिन्नता और असंगठित कारक कहा जाता है, अर्थात। अवशिष्ट भिन्नता (यादृच्छिक, अज्ञात)।

n के एक नमूना आकार के लिए, नमूना विचरण की गणना नमूना माध्य से वर्ग विचलन के योग के रूप में की जाती है जिसे n-1 (नमूना आकार घटा एक) से विभाजित किया जाता है। इस प्रकार, एक निश्चित नमूना आकार n के साथ, विचरण, वर्गों (विचलन) के योग का एक फलन है, जिसे संक्षिप्तता के लिए, SS (वर्गों के अंग्रेजी योग से - वर्गों का योग) के लिए दर्शाया गया है। निम्नलिखित में, हम अक्सर "चयनात्मक" शब्द को छोड़ देते हैं, यह अच्छी तरह से जानते हुए कि हम एक नमूना विचरण या विचरण के अनुमान पर विचार कर रहे हैं। विचरण का विश्लेषण विचरण के भागों या घटकों में विभाजन पर आधारित है। निम्नलिखित डेटासेट पर विचार करें:

दो समूहों के साधन काफी भिन्न हैं (क्रमशः 2 और 6)। प्रत्येक समूह के भीतर वर्ग विचलन का योग 2 है। उन्हें एक साथ जोड़ने पर, हमें 4 मिलता है। यदि हम अब समूह सदस्यता को ध्यान में रखे बिना इन गणनाओं को दोहराते हैं, अर्थात, यदि हम इन दो नमूनों के कुल औसत के आधार पर एसएस की गणना करते हैं, हमें 28 का मान मिलता है। दूसरे शब्दों में, समूह परिवर्तनशीलता के आधार पर विचरण (योग वर्ग) कुल परिवर्तनशीलता (समग्र माध्य के सापेक्ष) के आधार पर गणना की तुलना में बहुत कम मूल्यों में परिणाम देता है। इसका कारण स्पष्ट रूप से साधनों के बीच महत्वपूर्ण अंतर है, और साधनों के बीच का यह अंतर वर्गों के योग के बीच मौजूदा अंतर की व्याख्या करता है।

एसएस सेंट सेंट एमएस एफ पी
प्रभाव 24.0 24.0 24.0 .008
गलती 4.0 1.0

जैसा कि तालिका से देखा जा सकता है, वर्गों का कुल योग एसएस = 28 घटकों में बांटा गया है: समूह के भीतर परिवर्तनशीलता के कारण वर्गों का योग (2+2=4; तालिका की दूसरी पंक्ति देखें) और योग का योग वर्गों के बीच के साधनों में अंतर के कारण वर्ग (28-(2+ 2)=24; तालिका की पहली पंक्ति देखें)। ध्यान दें कि इस तालिका में एमएस, एसएस के बराबर माध्य वर्ग है जो स्वतंत्रता की डिग्री (एसटीडीएफ) की संख्या से विभाजित है।

ऊपर के सरल उदाहरण में, आप तुरंत स्वतंत्र नमूनों के लिए टी-परीक्षण की गणना कर सकते हैं। प्राप्त परिणाम, निश्चित रूप से, विचरण के विश्लेषण के परिणामों के साथ मेल खाते हैं।

हालाँकि, ऐसी परिस्थितियाँ जहाँ कुछ घटना को एक चर द्वारा पूरी तरह से वर्णित किया जाता है, अत्यंत दुर्लभ हैं। उदाहरण के लिए, यदि हम बड़े टमाटर उगाना सीखने का प्रयास कर रहे हैं, तो हमें पौधों की आनुवंशिक संरचना, मिट्टी के प्रकार, प्रकाश, तापमान आदि से संबंधित कारकों पर विचार करना चाहिए। इस प्रकार, एक विशिष्ट प्रयोग करते समय, आपको बड़ी संख्या में कारकों से निपटना होगा। टी-टेस्ट श्रृंखला का उपयोग करके विभिन्न कारक स्तरों पर दो नमूनों की पुन: तुलना करने के लिए एनोवा का उपयोग करने का मुख्य कारण यह है कि एनोवा काफी अधिक कुशल है और छोटे नमूनों के लिए, अधिक जानकारीपूर्ण है।

मान लीजिए कि ऊपर चर्चा किए गए दो-नमूना विश्लेषण उदाहरण में, हम एक और कारक जोड़ते हैं, जैसे कि लिंग। माना अब प्रत्येक समूह में 3 पुरुष और 3 महिलाएं हैं। इस प्रयोग की योजना को एक तालिका के रूप में प्रस्तुत किया जा सकता है:

गणना करने से पहले, आप देख सकते हैं कि इस उदाहरण में, कुल विचरण के कम से कम तीन स्रोत हैं:

1) यादृच्छिक त्रुटि (इंट्राग्रुप विचरण),

2) प्रयोगात्मक समूह से संबंधित परिवर्तनशीलता

3) अवलोकन की वस्तुओं के लिंग के कारण परिवर्तनशीलता।

ध्यान दें कि परिवर्तनशीलता का एक और संभावित स्रोत है - कारकों की बातचीत, जिस पर हम बाद में चर्चा करेंगे)। यदि हम अपने विश्लेषण में लिंग को एक कारक के रूप में शामिल नहीं करते हैं और सामान्य टी-परीक्षण की गणना करते हैं तो क्या होगा? यदि हम लिंग की अनदेखी करने वाले वर्गों के योग की गणना करते हैं (अर्थात समूह के भीतर विचरण की गणना करते समय विभिन्न लिंगों की वस्तुओं को एक समूह में मिलाना और इस प्रकार एसएस = 10 के बराबर प्रत्येक समूह के लिए वर्गों का योग प्राप्त करना और वर्गों का कुल योग एसएस = 10+10 = 20) , तो हमें सेक्स द्वारा उपसमूहों में अतिरिक्त विभाजन के साथ अधिक सटीक विश्लेषण की तुलना में इंट्राग्रुप विचरण का एक बड़ा मूल्य मिलता है (इस मामले में, इंट्राग्रुप का मतलब 2 के बराबर होगा, और वर्गों का कुल इंट्राग्रुप योग बराबर है एसएस = 2+2+2+2 = 8)।

तो, एक अतिरिक्त कारक की शुरूआत के साथ: लिंग, अवशिष्ट भिन्नता कम हो गई। ऐसा इसलिए है क्योंकि पुरुष माध्य महिला माध्य से छोटा होता है, और यदि लिंग को ध्यान में नहीं रखा जाता है तो साधनों में यह अंतर समग्र समूह परिवर्तनशीलता को बढ़ाता है। त्रुटि विचरण को नियंत्रित करने से परीक्षण की संवेदनशीलता (शक्ति) बढ़ जाती है।

यह उदाहरण सामान्य दो-नमूना टी-परीक्षण की तुलना में विचरण के विश्लेषण का एक और लाभ दिखाता है। विचरण का विश्लेषण आपको अन्य कारकों के मूल्यों को नियंत्रित करके प्रत्येक कारक का अध्ययन करने की अनुमति देता है। यह, वास्तव में, इसकी अधिक सांख्यिकीय शक्ति का मुख्य कारण है (सार्थक परिणाम प्राप्त करने के लिए छोटे नमूना आकारों की आवश्यकता होती है)। इस कारण से, छोटे नमूनों पर भी विचरण का विश्लेषण, एक साधारण टी-परीक्षण की तुलना में सांख्यिकीय रूप से अधिक महत्वपूर्ण परिणाम देता है।

) केवल दो आबादी की तुलना करने के लिए डिज़ाइन किया गया है। हालांकि, इसका अक्सर अधिक समूहों (चित्र 1) की जोड़ीदार तुलना के लिए दुरुपयोग किया जाता है, जो तथाकथित का कारण बनता है। कई तुलनाओं का प्रभाव(अंग्रेज़ी) कई तुलना;ग्लांट्ज़ 1999, पी। 101-104)। हम इस प्रभाव के बारे में बात करेंगे और बाद में इससे कैसे निपटेंगे। इस पोस्ट में मैं सिद्धांतों का वर्णन करूंगा विचरण का अविभाज्य विश्लेषणबस के लिए डिज़ाइन किया गया समकालिकदो या दो से अधिक समूहों के औसत मूल्यों की तुलना। एनोवा के सिद्धांत एकविश्लेषण हेएफ वारियान्स, एनोवा) 1920 के दशक में विकसित किए गए थे। सर रोनाल्ड आयलमर फिशर रोनाल्ड आयलमर फिशर) - "एक प्रतिभा जिसने लगभग अकेले ही आधुनिक सांख्यिकी की नींव रखी" (हल्दी 1998).

सवाल उठ सकता है: तुलना के लिए इस्तेमाल की जाने वाली विधि क्यों? मध्यममान कहा जाता है फैलानेवालाविश्लेषण? बात यह है कि औसत मूल्यों के बीच अंतर स्थापित करते समय, हम वास्तव में विश्लेषण की गई आबादी के भिन्नताओं की तुलना कर रहे हैं। हालांकि, पहले चीजें पहले...

समस्या का निरूपण

नीचे दिया गया उदाहरण पुस्तक से लिया गया है मेनडोनाल्ड & भूरा(2010)। टमाटर (पूरे पौधे; वजन, किलो में) के लिए वजन के आंकड़े तीन अलग-अलग प्रायोगिक स्थितियों के तहत 2 महीने के लिए उगाए जाते हैं (trt, से इलाज) - पानी (पानी) पर, उर्वरक (पोषक तत्व) के साथ-साथ उर्वरक और शाकनाशी 2,4-डी (पोषक तत्व + 24D) के अतिरिक्त वातावरण में:

# डेटा के साथ एक टेबल बनाएं:टमाटर<- data.frame (weight= c (1.5 , 1.9 , 1.3 , 1.5 , 2.4 , 1.5 , # water 1.5 , 1.2 , 1.2 , 2.1 , 2.9 , 1.6 , # nutrient 1.9 , 1.6 , 0.8 , 1.15 , 0.9 , 1.6 ) , # nutrient+24D trt = rep (c ("Water" , "Nutrient" , "Nutrient+24D" ) , c (6 , 6 , 6 ) ) ) # परिणाम देखें:वजन भार ट्रट 1 1.50 पानी 2 1.90 पानी 3 1.30 पानी 4 1.50 पानी 5 2.40 पानी 6 1.50 पानी 7 1.50 न्यूट्र 8 1.20 न्यूट्री 9 1.20 न्यूट्र 11 2.90 न्यूट्री 12 1.60 न्यूट्र 13 1.6 1.6 1.6 1.6 1.6 1.6 1.6 1.6 1.6 1.6 1.6 0.80 पोषक तत्व+ 24D 16 1.15 पोषक तत्व+24D 17 0.90 पोषक तत्व+24D 18 1.60 पोषक तत्व+24D


चर trt तीन स्तरों वाला एक कारक है। भविष्य में प्रायोगिक स्थितियों की अधिक दृश्य तुलना के लिए, हम "जल" स्तर को आधार एक बना देंगे (इंग्लैंड। संदर्भ), अर्थात। वह स्तर जिसके विरुद्ध R अन्य सभी स्तरों की तुलना करेगा। यह रिलेवल () फ़ंक्शन के साथ किया जा सकता है:


उपलब्ध आंकड़ों के गुणों को बेहतर ढंग से समझने के लिए, हम समूह साधनों के बीच देखे गए अंतरों का उपयोग करते हुए उनकी कल्पना करते हैं जो महत्वहीन हैं और यादृच्छिक कारकों के प्रभाव के कारण होते हैं (यानी, वास्तव में, सभी प्राप्त पौधे वजन माप सामान्य रूप से वितरित सामान्य आबादी से आते हैं) :

हम एक बार फिर जोर देते हैं कि माना गया उदाहरण मामले से मेल खाता है एक-कारकविचरण का विश्लेषण: हम एक कारक के प्रभाव का अध्ययन करते हैं - बढ़ती परिस्थितियों (तीन स्तरों के साथ - जल, पोषक तत्व और पोषक तत्व + 24D) हमारे लिए ब्याज की प्रतिक्रिया चर पर - पौधों का वजन।

दुर्भाग्य से, शोधकर्ता के पास लगभग कभी भी पूरी आबादी का अध्ययन करने का अवसर नहीं होता है। तो हम कैसे जान सकते हैं कि उपरोक्त शून्य परिकल्पना सत्य है, केवल नमूना डेटा दिया गया है? हम इस प्रश्न को अलग तरह से वाक्यांश दे सकते हैं: एक सामान्य रूप से वितरित जनसंख्या से यादृच्छिक नमूने खींचकर समूह साधनों के बीच देखे गए अंतर प्राप्त करने की संभावना क्या है? इस प्रश्न का उत्तर देने के लिए, हमें एक सांख्यिकीय परीक्षण की आवश्यकता है जो तुलनात्मक रूप से तुलनात्मक समूहों के बीच अंतर के परिमाण को चिह्नित करेगा।