सामान्य वितरण। सामान्य वितरण के साथ सब कुछ सामान्य क्यों नहीं है?

    यदि आप वित्तीय विश्लेषण के क्षेत्र में विशेषज्ञ नहीं हैं तो अपने व्यवसाय के वित्त का ठीक से प्रबंधन कैसे करें - वित्तीय विश्लेषण

    वित्तीय प्रबंधन - विषयों के बीच वित्तीय संबंध, विभिन्न स्तरों पर वित्तीय प्रबंधन, पोर्टफोलियो प्रबंधन, वित्तीय संसाधनों की आवाजाही के प्रबंधन के तरीके - यह विषय की पूरी सूची नहीं है " वित्तीय प्रबंधन"

    आइए बात करते हैं क्या है सिखाना? कुछ का मानना ​​है कि यह एक बुर्जुआ ब्रांड है, दूसरों का मानना ​​है कि यह आधुनिक व्यवसाय के साथ एक सफलता है। कोचिंग सफल व्यवसाय के लिए नियमों का एक समूह है, साथ ही इन नियमों को ठीक से प्रबंधित करने की क्षमता भी है।

4.1. क्या प्रेक्षणों का वितरण अक्सर सामान्य होता है?

अर्थमितीय और आर्थिक-गणितीय मॉडल में, विशेष रूप से, विपणन और प्रबंधन प्रक्रियाओं के अध्ययन और अनुकूलन में, उद्यम और क्षेत्रीय प्रबंधन, तकनीकी प्रक्रियाओं की सटीकता और स्थिरता, पर्यावरणीय सुरक्षा सहित विश्वसनीयता, सुरक्षा की समस्याओं में, तकनीकी के कामकाज में। उपकरणों और वस्तुओं, संगठनात्मक चार्ट के विकास अक्सर संभाव्यता सिद्धांत और गणितीय आंकड़ों की अवधारणाओं और परिणामों को लागू करते हैं। इस मामले में, संभाव्यता वितरण के कुछ पैरामीट्रिक परिवारों का अक्सर उपयोग किया जाता है। सबसे लोकप्रिय सामान्य वितरण है। लॉग-सामान्य वितरण, घातीय वितरण, गामा वितरण, वेइबुल-गनेडेन्को वितरण, आदि का भी उपयोग किया जाता है।

जाहिर है, मॉडल की वास्तविकता के अनुरूप होने की जांच करना हमेशा आवश्यक होता है। दो प्रश्न हैं। क्या वास्तविक वितरण मॉडल में उपयोग किए गए वितरण से भिन्न हैं? यह अंतर किस हद तक निष्कर्षों को प्रभावित करता है?

नीचे, सामान्य वितरण के उदाहरण और इसके आधार पर तेजी से अलग-अलग टिप्पणियों (आउटलेयर) को अस्वीकार करने के तरीकों का उपयोग करते हुए, यह दिखाया गया है कि वास्तविक वितरण लगभग हमेशा शास्त्रीय पैरामीट्रिक परिवारों में शामिल लोगों और दिए गए परिवारों से मौजूदा विचलन से भिन्न होता है। विचाराधीन मामले में इन परिवारों के उपयोग के आधार पर अस्वीकृति के बारे में गलत निष्कर्ष निकालना।

क्या माप परिणामों की सामान्यता को प्राथमिकता देने का कोई कारण है?

कभी-कभी यह तर्क दिया जाता है कि जब माप त्रुटि (या अन्य यादृच्छिक चर) को कई छोटे कारकों की संचयी क्रिया के परिणामस्वरूप निर्धारित किया जाता है, तो, संभाव्यता सिद्धांत के केंद्रीय सीमा प्रमेय (सीएलटी) के कारण, यह मान है एक सामान्य यादृच्छिक चर द्वारा अच्छी तरह से अनुमानित (वितरण द्वारा)। यह कथन सत्य है यदि छोटे कारक एक दूसरे के योगात्मक और स्वतंत्र रूप से कार्य करते हैं। यदि वे गुणनात्मक रूप से कार्य करते हैं, तो, एक ही सीएलटी के कारण, लॉग-सामान्य वितरण द्वारा अनुमानित करना आवश्यक है। अनुप्रयुक्त समस्याओं में, आमतौर पर छोटे कारकों की क्रिया की बहुलता के बजाय योगात्मकता को प्रमाणित करना संभव नहीं होता है। यदि निर्भरता एक सामान्य प्रकृति की है, एक योगात्मक या गुणक रूप में कम नहीं है, और ऐसे मॉडल को स्वीकार करने का कोई आधार नहीं है जो घातीय, वेइबुल-गनेडेन्को, गामा या अन्य वितरण देते हैं, तो व्यावहारिक रूप से वितरण के बारे में कुछ भी ज्ञात नहीं है अंतिम यादृच्छिक चर, नियमितता जैसे अंतर-गणितीय गुणों को छोड़कर।

विशिष्ट डेटा को संसाधित करते समय, कभी-कभी यह माना जाता है कि माप त्रुटियों का सामान्य वितरण होता है। सामान्यता की धारणा पर, प्रतिगमन, फैलाव, कारक विश्लेषण, मेट्रोलॉजिकल मॉडल के शास्त्रीय मॉडल बनाए जाते हैं, जो अभी भी घरेलू नियामक और तकनीकी दस्तावेज और अंतरराष्ट्रीय मानकों दोनों में पाए जाते हैं। आर्थिक संरचनाओं, तकनीकी उपकरणों और वस्तुओं के कामकाज की सुरक्षा सुनिश्चित करने के लिए सिस्टम के डिजाइन में उपयोग की जाने वाली कुछ विशेषताओं के अधिकतम प्राप्य स्तरों की गणना के लिए मॉडल एक ही धारणा पर आधारित हैं। हालांकि, इस तरह की धारणा के लिए कोई सैद्धांतिक आधार नहीं है। प्रयोगात्मक रूप से त्रुटियों के वितरण का अध्ययन करना आवश्यक है।

प्रयोगात्मक परिणाम क्या दिखाते हैं? मोनोग्राफ में दिया गया सारांश हमें यह बताने की अनुमति देता है कि ज्यादातर मामलों में माप त्रुटियों का वितरण सामान्य से भिन्न होता है। इस प्रकार, मशीन-इलेक्ट्रोटेक्निकल इंस्टीट्यूट (वर्ना, बुल्गारिया) में, एनालॉग विद्युत माप उपकरणों के तराजू के लिए अंशांकन त्रुटियों के वितरण का अध्ययन किया गया था। चेकोस्लोवाकिया, यूएसएसआर और बुल्गारिया में निर्मित उपकरणों का अध्ययन किया गया। त्रुटि वितरण कानून समान निकला। इसका घनत्व है

हमने विभिन्न प्रकार के (विद्युत) उपकरणों के साथ विद्युत और गैर-विद्युत दोनों मात्राओं को मापते समय, विभिन्न लेखकों द्वारा अध्ययन किए गए त्रुटियों के 219 वास्तविक वितरण के मापदंडों पर डेटा का विश्लेषण किया। इस अध्ययन के परिणामस्वरूप, यह पता चला कि 111 वितरण, अर्थात्। लगभग 50% घनत्व वाले वितरण वर्ग के हैं

डिग्री पैरामीटर कहां है; बी - शिफ्ट पैरामीटर; - स्केल पैरामीटर; - तर्क के गामा समारोह ;

(से। मी। ); 63 वितरण, अर्थात्। 30% में लंबे, कोमल ढलान वाले फ्लैट-टॉप घनत्व होते हैं और इसे सामान्य या, उदाहरण के लिए, घातीय के रूप में वर्णित नहीं किया जा सकता है। शेष 45 वितरण बिमोडल निकले।

प्रसिद्ध मेट्रोलॉजिस्ट की किताब में प्रो. पीवी नोवित्स्की विभिन्न प्रकार की माप त्रुटियों के वितरण के नियमों के अध्ययन के परिणाम प्रस्तुत करता है। उन्होंने कोर पर इलेक्ट्रोमैकेनिकल उपकरणों की त्रुटियों के वितरण का अध्ययन किया, तापमान और बलों को मापने के लिए इलेक्ट्रॉनिक उपकरण, मैनुअल संतुलन के साथ डिजिटल उपकरण। प्रत्येक नमूने के लिए प्रायोगिक डेटा नमूनों की मात्रा 100-400 रीडिंग थी। यह पता चला कि 47 में से 46 वितरण सामान्य से काफी अलग थे। रेंज के 10 बिंदुओं पर एसएच -1411 डिजिटल वाल्टमीटर की 25 प्रतियों में त्रुटियों के वितरण के आकार का अध्ययन किया गया था। परिणाम समान हैं। अधिक जानकारी मोनोग्राफ में निहित है।

टार्टू स्टेट यूनिवर्सिटी की अनुप्रयुक्त गणित प्रयोगशाला ने वास्तविक सांख्यिकीय डेटा के संग्रह से 2,500 नमूनों का विश्लेषण किया। 92% में, सामान्यता परिकल्पना को अस्वीकार करना पड़ा।

प्रयोगात्मक डेटा के उपरोक्त विवरण से पता चलता है कि ज्यादातर मामलों में माप त्रुटियों में वितरण सामान्य से भिन्न होता है। इसका मतलब है, विशेष रूप से, सामान्य सिद्धांत के आधार पर छात्र के टी-टेस्ट, शास्त्रीय प्रतिगमन विश्लेषण और अन्य सांख्यिकीय विधियों के अधिकांश अनुप्रयोग, सख्ती से बोलना, उचित नहीं हैं, क्योंकि संबंधित यादृच्छिक के वितरण की सामान्यता के अंतर्निहित स्वयंसिद्ध चर गलत है।

जाहिर है, सांख्यिकीय डेटा के विश्लेषण के मौजूदा अभ्यास को सही ठहराने या यथोचित रूप से बदलने के लिए, "अवैध" अनुप्रयोगों में डेटा विश्लेषण प्रक्रियाओं के गुणों का अध्ययन करना आवश्यक है। अस्वीकृति प्रक्रियाओं के अध्ययन से पता चला है कि वे सामान्यता से विचलन के लिए बेहद अस्थिर हैं, और इसलिए वास्तविक डेटा को संसाधित करने के लिए उनका उपयोग करना उचित नहीं है (नीचे देखें); इसलिए, कोई यह दावा नहीं कर सकता है कि सामान्यता से विचलन के खिलाफ मनमाने ढंग से की गई प्रक्रिया स्थिर है।

कभी-कभी यह सुझाव दिया जाता है कि आवेदन करने से पहले, उदाहरण के लिए, दो नमूनों की एकरूपता के लिए छात्र का परीक्षण, सामान्यता की जांच करें। हालांकि इसके लिए कई मानदंड हैं, सामान्यता के लिए परीक्षण एकरूपता के परीक्षण की तुलना में अधिक जटिल और समय लेने वाली सांख्यिकीय प्रक्रिया है (दोनों छात्र-प्रकार के आंकड़ों के साथ और गैर-पैरामीट्रिक परीक्षणों के साथ)। पर्याप्त रूप से मज़बूती से सामान्यता स्थापित करने के लिए काफी बड़ी संख्या में टिप्पणियों की आवश्यकता होती है। इसलिए, यह सुनिश्चित करने के लिए कि टिप्पणियों के परिणामों का वितरण कार्य कुछ सामान्य से 0.01 से अधिक नहीं है (तर्क के किसी भी मूल्य के लिए), लगभग 2500 टिप्पणियों की आवश्यकता है। अधिकांश आर्थिक, तकनीकी, बायोमेडिकल और अन्य अनुप्रयुक्त अध्ययनों में, टिप्पणियों की संख्या काफी कम है। यह आर्थिक संरचनाओं और तकनीकी वस्तुओं के कामकाज की सुरक्षा सुनिश्चित करने से संबंधित समस्याओं के अध्ययन में उपयोग किए जाने वाले डेटा के लिए विशेष रूप से सच है।

कभी-कभी वे मापने वाले उपकरण की तकनीकी योजना में विशेष योजक सहित त्रुटि के वितरण को सामान्य करने के लिए सीसीटी का उपयोग करने का प्रयास करते हैं। आइए इस उपाय की उपयोगिता का मूल्यांकन करें। मान लीजिए Z1, Z2,…, Zk वितरण फलन H = H(x) के साथ समान रूप से वितरित यादृच्छिक चर स्वतंत्र हैं, जैसे कि विचार करें

योजक द्वारा प्रदान की गई सामान्यता की निकटता का सूचक है

पिछले संबंध में सही असमानता पुस्तक में प्राप्त बेरी-एस्सेन असमानता में स्थिरांक के अनुमानों और मोनोग्राफ में उदाहरण से बाईं ओर के अनुमानों का अनुसरण करती है। एक सामान्य कानून के लिए = 1.6, एक समान कानून के लिए = 1.3, दो-बिंदु कानून के लिए = 1 (यह निचली सीमा है)। इसलिए, "असफल" वितरण के लिए सामान्य वितरण के लिए दूरी (कोलमोगोरोव मीट्रिक में) 0.01 से अधिक नहीं सुनिश्चित करने के लिए, कम से कम k0 शर्तों की आवश्यकता होती है, जहां

आमतौर पर इस्तेमाल किए जाने वाले योजकों में, शब्द बहुत छोटे होते हैं। संभावित वितरण एच के वर्ग को कम करके, कोई प्राप्त कर सकता है, जैसा कि मोनोग्राफ में दिखाया गया है, तेजी से अभिसरण, लेकिन यहां सिद्धांत अभी तक अभ्यास के साथ विलय नहीं करता है। इसके अलावा, यह स्पष्ट नहीं है कि सामान्य (एक निश्चित मीट्रिक में) के वितरण की निकटता भी इस वितरण के साथ यादृच्छिक चर से निर्मित आंकड़ों के वितरण की निकटता को सामान्य अवलोकनों के अनुरूप आंकड़ों के वितरण के लिए सुनिश्चित करती है। जाहिर है, प्रत्येक विशिष्ट आँकड़ों के लिए, विशेष सैद्धांतिक अध्ययन की आवश्यकता होती है। मोनोग्राफ के लेखक इस निष्कर्ष पर आते हैं। बाहरी अस्वीकृति समस्याओं में, उत्तर है: "प्रदान नहीं करता" (नीचे देखें)।

ध्यान दें कि किसी भी वास्तविक माप का परिणाम दशमलव स्थानों की एक सीमित संख्या का उपयोग करके दर्ज किया जाता है, आमतौर पर छोटा (2-5), इसलिए किसी भी वास्तविक डेटा को केवल असतत यादृच्छिक चर का उपयोग करके मॉडल करने की सलाह दी जाती है जो कि सीमित संख्या में मान लेते हैं। सामान्य वितरण वास्तविक वितरण का सिर्फ एक अनुमान है। इसलिए, उदाहरण के लिए, कार्य में दिए गए एक विशिष्ट अध्ययन का डेटा 1.0 से 2.2 तक मान लेता है, अर्थात। कुल 13 संभावित मान हैं। यह डिरिचलेट सिद्धांत का अनुसरण करता है कि किसी बिंदु पर कार्य डेटा के अनुसार निर्मित वितरण फ़ंक्शन निकटतम सामान्य वितरण फ़ंक्शन से कम से कम 1/26 से भिन्न होता है, अर्थात। 0.04 द्वारा। इसके अलावा, यह स्पष्ट है कि एक यादृच्छिक चर के सामान्य वितरण के लिए, दशमलव स्थानों की एक निश्चित संख्या के साथ दशमलव संख्याओं के असतत सेट में गिरने की संभावना 0 है।

यह ऊपर से निम्नानुसार है कि माप के परिणाम और, सामान्य रूप से, सांख्यिकीय डेटा में ऐसे गुण होते हैं जो इस तथ्य की ओर ले जाते हैं कि उन्हें यादृच्छिक चर द्वारा वितरण के साथ मॉडल किया जाना चाहिए जो सामान्य से कम या ज्यादा अलग हैं। ज्यादातर मामलों में, वितरण सामान्य वितरण से काफी भिन्न होते हैं; दूसरों में, सामान्य वितरण को स्पष्ट रूप से किसी प्रकार का अनुमान माना जा सकता है, लेकिन कभी भी पूर्ण संयोग नहीं होता है। इसका अर्थ है गैर-शास्त्रीय संभाव्य मॉडल में शास्त्रीय सांख्यिकीय प्रक्रियाओं के गुणों का अध्ययन करने की आवश्यकता (उसी तरह जो छात्र की कसौटी के लिए नीचे किया गया है), और स्थिर विकसित करने की आवश्यकता (सामान्यता से विचलन की उपस्थिति को ध्यान में रखते हुए) और गैर-पैरामीट्रिक, वितरण-मुक्त प्रक्रियाओं सहित, सांख्यिकीय डेटा प्रोसेसिंग के अभ्यास में उनका व्यापक परिचय।

अन्य पैरामीट्रिक परिवारों के लिए यहां छोड़े गए विचार समान निष्कर्षों की ओर ले जाते हैं। परिणाम निम्नानुसार तैयार किया जा सकता है। वास्तविक डेटा वितरण लगभग कभी भी किसी विशेष पैरामीट्रिक परिवार से संबंधित नहीं होते हैं। वास्तविक वितरण हमेशा पैरामीट्रिक परिवारों में शामिल लोगों से भिन्न होते हैं। मतभेद बड़े या छोटे हो सकते हैं, लेकिन वे हमेशा मौजूद रहते हैं। आइए यह समझने की कोशिश करें कि अर्थमितीय विश्लेषण के लिए ये अंतर कितने महत्वपूर्ण हैं।

सर्वाधिकार सुरक्षित। इस साइट की सामग्री का उपयोग केवल इस साइट के लिंक के साथ किया जा सकता है।

सामान्य वितरण (गॉसियन वितरण) ने हमेशा संभाव्यता सिद्धांत में एक केंद्रीय भूमिका निभाई है, क्योंकि यह बहुत बार कई कारकों के प्रभाव के परिणामस्वरूप उत्पन्न होता है, जिनमें से किसी एक का योगदान नगण्य है। सेंट्रल लिमिट थ्योरम (सीएलटी) लगभग सभी अनुप्रयुक्त विज्ञानों में आवेदन पाता है, जिससे सांख्यिकी का तंत्र सार्वभौमिक हो जाता है। हालांकि, बहुत बार ऐसे मामले होते हैं जब इसका आवेदन असंभव होता है, और शोधकर्ता गॉसियन के परिणामों की फिटिंग को व्यवस्थित करने के लिए हर संभव तरीके से प्रयास करते हैं। यह कई कारकों के वितरण पर प्रभाव के मामले में एक वैकल्पिक दृष्टिकोण के बारे में है, मैं आपको अभी बताऊंगा।

सीपीटी का संक्षिप्त इतिहास।जबकि न्यूटन अभी भी जीवित था, अब्राहम डी मोइवर ने एक सामान्य वितरण के लिए स्वतंत्र परीक्षणों की एक श्रृंखला में एक घटना के एक केंद्रित और सामान्यीकृत संख्या के अवलोकन के अभिसरण पर एक प्रमेय साबित किया। 19वीं और 20वीं सदी की शुरुआत में, इस प्रमेय ने सामान्यीकरण के लिए एक वैज्ञानिक मॉडल के रूप में काम किया। लैपलेस ने समान वितरण के मामले को साबित किया, पॉइसन - विभिन्न संभावनाओं वाले मामले के लिए स्थानीय प्रमेय। पोंकारे, लीजेंड्रे और गॉस ने अवलोकन संबंधी त्रुटियों का एक समृद्ध सिद्धांत विकसित किया और सामान्य वितरण के लिए त्रुटियों के अभिसरण के आधार पर कम से कम वर्ग विधि विकसित की। चेबीशेव ने क्षणों की विधि विकसित करके यादृच्छिक चर के योग के लिए एक और भी मजबूत प्रमेय साबित किया। 1900 में ल्यपुनोव, चेबीशेव और मार्कोव पर भरोसा करते हुए, सीएलटी को अपने वर्तमान स्वरूप में साबित कर दिया, लेकिन केवल तीसरे क्रम के क्षणों के अस्तित्व के साथ। और केवल 1934 में फेलर ने इसे समाप्त कर दिया, यह दिखाते हुए कि दूसरे क्रम के क्षणों का अस्तित्व एक आवश्यक और पर्याप्त स्थिति दोनों है।

सीएलटी को निम्नानुसार तैयार किया जा सकता है: यदि यादृच्छिक चर स्वतंत्र हैं, समान रूप से वितरित हैं और शून्य के अलावा एक सीमित भिन्नता है, तो इन चरों के योग (केंद्रित और सामान्यीकृत) सामान्य कानून में परिवर्तित होते हैं। यह इस रूप में है कि यह प्रमेय विश्वविद्यालयों में पढ़ाया जाता है और अक्सर पर्यवेक्षकों और शोधकर्ताओं द्वारा उपयोग किया जाता है जो गणित में पेशेवर नहीं हैं। उसे क्या परेशानी है? वास्तव में, प्रमेय के उन क्षेत्रों में उत्कृष्ट अनुप्रयोग हैं जिन पर गॉस, पॉइनकेयर, चेबीशेव और 19 वीं शताब्दी के अन्य प्रतिभाओं ने काम किया, अर्थात्: अवलोकन संबंधी त्रुटियों का सिद्धांत, सांख्यिकीय भौतिकी, कम से कम वर्ग, जनसांख्यिकीय अध्ययन, और शायद कुछ और। लेकिन जिन वैज्ञानिकों में मौलिकता की खोज, सामान्यीकरण और इस प्रमेय को हर चीज पर लागू करना चाहते हैं, या केवल कानों से सामान्य वितरण को खींचते हैं, जहां यह बस नहीं हो सकता है। यदि आप उदाहरण चाहते हैं, तो मेरे पास है।

खुफिया भागफल IQ। प्रारंभ में, इसका तात्पर्य है कि लोगों की बुद्धि सामान्य रूप से वितरित की जाती है। वे एक ऐसे परीक्षण का संचालन करते हैं जो इस तरह से पूर्व-संकलित होता है जो उत्कृष्ट क्षमताओं को ध्यान में नहीं रखता है, लेकिन एक ही भिन्नात्मक कारकों के साथ अलग से ध्यान में रखा जाता है: तार्किक सोच, मानसिक डिजाइन, कम्प्यूटेशनल क्षमता, अमूर्त सोच और कुछ और। अधिकांश की पहुंच से परे समस्याओं को हल करने की क्षमता, या अल्ट्रा-फास्ट समय में परीक्षा उत्तीर्ण करने की क्षमता को किसी भी तरह से ध्यान में नहीं रखा जाता है, और परीक्षा को पहले पास करने से भविष्य में परिणाम (लेकिन बुद्धि नहीं) बढ़ जाता है। और फिर पलिश्तियों का मानना ​​​​है कि "कोई भी उनसे दोगुना स्मार्ट नहीं हो सकता है", "आइए इसे बुद्धिमानों से दूर ले जाएं और इसे साझा करें।"

दूसरा उदाहरण: वित्तीय संकेतकों में परिवर्तन। स्टॉक मूल्य, मुद्रा उद्धरण, कमोडिटी विकल्पों में परिवर्तन के अध्ययन के लिए गणितीय आंकड़ों के तंत्र के उपयोग की आवश्यकता होती है, और विशेष रूप से यहां यह महत्वपूर्ण है कि वितरण के प्रकार के साथ गलती न करें। मामले में मामला: 1997 में, स्टॉक संकेतकों (तथाकथित सफेद शोर) में वृद्धि के सामान्य वितरण की धारणा के आधार पर, ब्लैक-स्कोल्स मॉडल के प्रस्ताव के लिए अर्थशास्त्र में नोबेल पुरस्कार का भुगतान किया गया था। उसी समय, लेखकों ने स्पष्ट रूप से कहा कि इस मॉडल को परिष्कृत करने की आवश्यकता है, लेकिन आगे के अधिकांश शोधकर्ताओं ने जो निर्णय लिया, वह केवल पॉइसन वितरण को सामान्य वितरण में जोड़ना था। यहां, जाहिर है, लंबी अवधि की श्रृंखला के अध्ययन में अशुद्धि होगी, क्योंकि पॉइसन वितरण सीएलटी को बहुत अच्छी तरह से संतुष्ट करता है, और यहां तक ​​कि 20 शब्दों के साथ भी यह सामान्य वितरण से अप्रभेद्य है। नीचे दी गई तस्वीर को देखें (और यह एक बहुत ही गंभीर आर्थिक पत्रिका से है), यह दर्शाता है कि, काफी बड़ी संख्या में टिप्पणियों और स्पष्ट विकृतियों के बावजूद, वितरण को सामान्य माना जाता है।


यह बिल्कुल स्पष्ट है कि शहर की आबादी के बीच मजदूरी का वितरण, डिस्क पर फाइलों का आकार, शहरों और देशों की आबादी सामान्य नहीं होगी।

इन उदाहरणों के वितरण में आम तौर पर एक तथाकथित "भारी पूंछ" की उपस्थिति होती है, अर्थात, माध्य से दूर मान, और ध्यान देने योग्य विषमता, आमतौर पर सही। आइए विचार करें कि सामान्य के अलावा, ऐसे वितरण और क्या हो सकते हैं। आइए पहले बताए गए पॉइसन से शुरू करें: इसकी एक पूंछ है, लेकिन हम चाहते हैं कि कानून को समूहों के एक समूह के लिए दोहराया जाए, जिनमें से प्रत्येक में यह मनाया जाता है (एक उद्यम के लिए फाइलों के आकार की गणना करें, कई शहरों के लिए वेतन) या स्केल किया गया (ब्लैक-स्कोल्स मॉडल के अंतराल को मनमाने ढंग से बढ़ाएं या घटाएं), जैसा कि अवलोकन दिखाते हैं, पूंछ और विषमता गायब नहीं होती है, लेकिन सीएलटी के अनुसार पॉइसन वितरण सामान्य हो जाना चाहिए। उन्हीं कारणों से, Erlang वितरण, बीटा, लॉगोनॉर्मल, और अन्य सभी फैलाव के साथ काम नहीं करेंगे। यह केवल पारेतो वितरण को काटने के लिए बनी हुई है, लेकिन यह न्यूनतम मूल्य के साथ फैशन के संयोग के कारण फिट नहीं है, जो नमूना डेटा के विश्लेषण में लगभग कभी नहीं होता है।

आवश्यक गुणों वाले वितरण मौजूद होते हैं और उन्हें स्थिर वितरण कहा जाता है।उनका इतिहास भी बहुत दिलचस्प है, और मुख्य प्रमेय को फेलर के काम के एक साल बाद, 1935 में, फ्रांसीसी गणितज्ञ पॉल लेवी और सोवियत गणितज्ञ ए.या के संयुक्त प्रयासों से सिद्ध किया गया था। खिनचिन। सीएलटी को सामान्यीकृत किया गया था, इसमें से फैलाव के अस्तित्व की शर्त को हटा दिया गया था। सामान्य के विपरीत, न तो घनत्व और न ही स्थिर यादृच्छिक चर का वितरण कार्य व्यक्त किया जाता है (एक दुर्लभ अपवाद के साथ, जिसकी चर्चा नीचे की गई है), उनके बारे में जो कुछ भी जाना जाता है वह विशेषता कार्य है (वितरण घनत्व का उलटा फूरियर रूपांतरण, लेकिन सार को समझें, यह नहीं जान सकता)।
तो, प्रमेय: यदि यादृच्छिक चर स्वतंत्र हैं, समान रूप से वितरित हैं, तो इन चरों का योग एक स्थिर कानून में परिवर्तित हो जाता है।

अब परिभाषा। यादृच्छिक मूल्य एक्सस्थिर होगा यदि और केवल यदि इसके विशिष्ट कार्य के लघुगणक को इस प्रकार दर्शाया जा सकता है:

कहाँ पे ।

वास्तव में, यहाँ कुछ भी बहुत जटिल नहीं है, आपको बस चार मापदंडों का अर्थ समझाने की आवश्यकता है। पैरामीटर सिग्मा और म्यू सामान्य पैमाने और ऑफसेट हैं, जैसा कि सामान्य वितरण में होता है, म्यू अपेक्षा के बराबर होगा यदि यह है, और यह तब होता है जब अल्फा एक से अधिक होता है। बीटा पैरामीटर विषमता है; यदि यह शून्य के बराबर है, तो वितरण सममित है। लेकिन अल्फा एक विशेषता पैरामीटर है, जो इंगित करता है कि मात्रा के क्षण किस क्रम में मौजूद हैं, यह दो के करीब है, जितना अधिक वितरण सामान्य जैसा दिखता है, यदि यह दो के बराबर है, तो वितरण सामान्य हो जाता है, और केवल में इस मामले में इसमें बड़े ऑर्डर के क्षण होते हैं, सामान्य वितरण के मामले में भी, तिरछापन कम हो जाता है। मामले में जब अल्फा एक के बराबर होता है और बीटा से शून्य होता है, तो कॉची वितरण प्राप्त होता है, और मामले में जब अल्फा आधा और बीटा एक के बराबर होता है, लेवी वितरण, अन्य मामलों में चतुर्भुज में कोई प्रतिनिधित्व नहीं होता है ऐसी मात्राओं का वितरण घनत्व।
20वीं शताब्दी में, स्थिर मात्राओं और प्रक्रियाओं (लेवी प्रक्रियाओं कहा जाता है) का एक समृद्ध सिद्धांत विकसित किया गया था, भिन्नात्मक इंटीग्रल के साथ उनका संबंध दिखाया गया था, पैरामीटरकरण और मॉडलिंग के विभिन्न तरीकों को पेश किया गया था, मापदंडों का कई तरीकों से अनुमान लगाया गया था, और स्थिरता और स्थिरता अनुमानों में से दिखाया गया है। तस्वीर को देखें, यह लेवी प्रक्रिया के नकली प्रक्षेपवक्र को 15 गुना बढ़ाए गए टुकड़े के साथ दिखाता है।


इस तरह की प्रक्रियाओं और वित्त में उनके आवेदन से निपटने के दौरान बेनोइट मंडेलब्रॉट फ्रैक्टल्स के साथ आए। हालांकि, हर जगह इतना अच्छा नहीं था। 20 वीं शताब्दी का दूसरा भाग लागू और साइबरनेटिक विज्ञान की सामान्य प्रवृत्ति के तहत गुजरा, जिसका अर्थ था शुद्ध गणित का संकट, हर कोई उत्पादन करना चाहता था, लेकिन सोचना नहीं चाहता था, मानविकी ने अपनी पत्रकारिता के साथ गणितीय क्षेत्रों पर कब्जा कर लिया। उदाहरण: अमेरिकन मोस्टेलर की पुस्तक "फिफ्टी एंटरटेनिंग प्रोबेबिलिस्टिक प्रॉब्लम्स विद सॉल्यूशंस", समस्या संख्या 11:


इस समस्या का लेखक का समाधान सामान्य ज्ञान की हार है:

25वें टास्क के साथ भी यही स्थिति है, जहां तीन परस्पर विरोधी उत्तर दिए गए हैं।

लेकिन वापस स्थिर वितरण के लिए। बाकी लेख में, मैं यह दिखाने की कोशिश करूंगा कि उनके साथ काम करते समय कोई अतिरिक्त कठिनाई नहीं होनी चाहिए। अर्थात्, संख्यात्मक और सांख्यिकीय तरीके हैं जो आपको मापदंडों का अनुमान लगाने, वितरण फ़ंक्शन की गणना करने और उनका अनुकरण करने की अनुमति देते हैं, अर्थात किसी अन्य वितरण की तरह ही काम करते हैं।

स्थिर यादृच्छिक चर का मॉडलिंग।चूंकि सब कुछ तुलना में जाना जाता है, मुझे सबसे पहले सबसे सुविधाजनक, गणना के दृष्टिकोण से, एक सामान्य मूल्य उत्पन्न करने की विधि (बॉक्स-मुलर विधि) को याद करना चाहिए: यदि बुनियादी यादृच्छिक चर हैं (समान रूप से वितरित)