छवियों की पहचान प्रक्रियाओं के आधार पर की जाती है। मान्यता गुणवत्ता नियंत्रण कार्य

और संकेत। ऐसे कार्य अक्सर हल हो जाते हैं, उदाहरण के लिए, ट्रैफिक लाइट पर सड़क पार करते समय या गाड़ी चलाते समय। जलती हुई ट्रैफिक लाइट के रंग को पहचानने और सड़क के नियमों को जानने से आपको इस समय सड़क पार करने या न करने के बारे में सही निर्णय लेने की अनुमति मिलती है।

जैविक विकास की प्रक्रिया में, कई जानवरों ने दृश्य और श्रवण तंत्र की सहायता से समस्याओं का समाधान किया। पैटर्न मान्यताकाफी है। कृत्रिम प्रणालियों का निर्माण पैटर्न मान्यताएक कठिन सैद्धांतिक और तकनीकी समस्या बनी हुई है। इस तरह की मान्यता की आवश्यकता विभिन्न क्षेत्रों में उत्पन्न होती है - सैन्य मामलों और सुरक्षा प्रणालियों से लेकर सभी प्रकार के एनालॉग सिग्नलों के डिजिटलीकरण तक।

परंपरागत रूप से, छवि पहचान कार्यों को आर्टिफिशियल इंटेलिजेंस कार्यों के दायरे में शामिल किया जाता है।

पैटर्न पहचान में दिशाएँ

दो मुख्य दिशाएँ हैं:

  • जीवित प्राणियों द्वारा धारण की गई पहचान क्षमताओं का अध्ययन, उनकी व्याख्या और प्रतिरूपण;
  • लागू समस्याओं में व्यक्तिगत समस्याओं को हल करने के लिए डिज़ाइन किए गए उपकरणों के निर्माण के लिए सिद्धांत और विधियों का विकास।

समस्या का औपचारिक विवरण

पैटर्न की पहचान गैर-आवश्यक डेटा के कुल द्रव्यमान से इन डेटा को चिह्नित करने वाली आवश्यक विशेषताओं को उजागर करके एक निश्चित वर्ग को प्रारंभिक डेटा का असाइनमेंट है।

मान्यता की समस्याओं को सेट करते समय, वे गणितीय भाषा का उपयोग करने की कोशिश करते हैं, कृत्रिम तंत्रिका नेटवर्क के सिद्धांत के विपरीत, जहां आधार प्रयोग द्वारा परिणाम प्राप्त करना है, प्रयोग को तार्किक तर्क और गणितीय प्रमाणों के साथ बदलने के लिए।

बहुधा, मोनोक्रोम छवियों को पैटर्न पहचान समस्याओं में माना जाता है, जो एक छवि को एक विमान पर एक फ़ंक्शन के रूप में विचार करना संभव बनाता है। यदि हम एक समतल पर स्थित बिंदु पर विचार करते हैं टी, जहां समारोह एक्स(एक्स,वाई) छवि के प्रत्येक बिंदु पर इसकी विशेषता - चमक, पारदर्शिता, ऑप्टिकल घनत्व को व्यक्त करता है, फिर ऐसा फ़ंक्शन छवि का औपचारिक रिकॉर्ड होता है।

सभी संभावित कार्यों का सेट एक्स(एक्स,वाई) सतह पर टी- सभी छवियों के सेट का एक मॉडल है एक्स. अवधारणा का परिचय समानताछवियों के बीच, आप पहचान का कार्य निर्धारित कर सकते हैं। इस तरह की सेटिंग का विशिष्ट रूप दृढ़ता से एक या दूसरे दृष्टिकोण के अनुसार मान्यता के बाद के चरणों पर निर्भर करता है।

पैटर्न पहचान के तरीके

ऑप्टिकल छवि पहचान के लिए, आप विभिन्न कोणों, पैमानों, ऑफ़सेट आदि पर किसी वस्तु की उपस्थिति पर पुनरावृति की विधि को लागू कर सकते हैं। अक्षरों के लिए, आपको फ़ॉन्ट, फ़ॉन्ट गुणों आदि पर पुनरावृति करने की आवश्यकता होती है।

दूसरा दृष्टिकोण वस्तु की रूपरेखा का पता लगाना और उसके गुणों (कनेक्टिविटी, कोनों की उपस्थिति, आदि) की जांच करना है।

एक अन्य दृष्टिकोण कृत्रिम तंत्रिका नेटवर्क का उपयोग करना है। इस पद्धति के लिए या तो बड़ी संख्या में मान्यता कार्य (सही उत्तरों के साथ) के उदाहरणों की आवश्यकता होती है, या एक विशेष तंत्रिका नेटवर्क संरचना होती है जो इस कार्य की बारीकियों को ध्यान में रखती है।

परसेप्ट्रॉन पैटर्न पहचान की एक विधि के रूप में

एफ। रोसेनब्लैट, एक मस्तिष्क मॉडल की अवधारणा का परिचय देते हुए, जिसका कार्य यह दिखाना है कि किसी भौतिक प्रणाली में मनोवैज्ञानिक घटनाएं कैसे उत्पन्न हो सकती हैं, जिसकी संरचना और कार्यात्मक गुण ज्ञात हैं - सबसे सरल वर्णित भेदभाव प्रयोग. ये प्रयोग पूरी तरह से पैटर्न पहचान विधियों से संबंधित हैं, लेकिन इसमें भिन्नता है कि समाधान एल्गोरिथ्म नियतात्मक नहीं है।

सबसे सरल प्रयोग, जिसके आधार पर एक निश्चित प्रणाली के बारे में मनोवैज्ञानिक रूप से महत्वपूर्ण जानकारी प्राप्त करना संभव है, इस तथ्य पर निर्भर करता है कि मॉडल को दो अलग-अलग उत्तेजनाओं के साथ प्रस्तुत किया जाता है और उन्हें अलग-अलग तरीकों से प्रतिक्रिया देने की आवश्यकता होती है। इस तरह के एक प्रयोग का उद्देश्य प्रयोगकर्ता से हस्तक्षेप की अनुपस्थिति में सिस्टम द्वारा उनके सहज भेदभाव की संभावना का अध्ययन करना हो सकता है, या इसके विपरीत, जबरन भेदभाव का अध्ययन करना, जिसमें प्रयोगकर्ता प्रणाली को लागू करने के लिए सिखाने की कोशिश करता है। आवश्यक वर्गीकरण।

एक सीखने के प्रयोग में, एक परसेप्ट्रॉन को आमतौर पर छवियों के एक निश्चित अनुक्रम के साथ प्रस्तुत किया जाता है, जिसमें प्रत्येक वर्ग के प्रतिनिधियों को प्रतिष्ठित किया जाना शामिल होता है। कुछ स्मृति संशोधन नियम के अनुसार, प्रतिक्रिया का सही विकल्प प्रबल होता है। फिर परसेप्ट्रॉन को नियंत्रण उत्तेजना प्रस्तुत की जाती है और इस वर्ग की उत्तेजनाओं के लिए सही प्रतिक्रिया प्राप्त करने की संभावना निर्धारित की जाती है। इस बात पर निर्भर करते हुए कि चयनित नियंत्रण उत्तेजना प्रशिक्षण क्रम में उपयोग की गई छवियों में से एक से मेल खाती है या नहीं, अलग-अलग परिणाम प्राप्त होते हैं:

  • 1. यदि नियंत्रण उत्तेजना किसी भी सीखने की उत्तेजना के साथ मेल नहीं खाती है, तो प्रयोग न केवल जुड़ा हुआ है शुद्ध भेदभाव, लेकिन इसमें तत्व भी शामिल हैं सामान्यीकरण.
  • 2. यदि नियंत्रण उत्तेजना संवेदी तत्वों के एक निश्चित समूह को उत्तेजित करती है जो उन तत्वों से पूरी तरह से अलग हैं जो उसी वर्ग के पहले प्रस्तुत उत्तेजनाओं के प्रभाव में सक्रिय थे, तो प्रयोग एक अध्ययन है शुद्ध सामान्यीकरण .

परसेप्ट्रॉन में शुद्ध सामान्यीकरण की क्षमता नहीं होती है, लेकिन वे भेदभाव के प्रयोगों में काफी संतोषजनक ढंग से काम करते हैं, खासकर अगर नियंत्रण उत्तेजना उन पैटर्नों में से एक के साथ पर्याप्त रूप से मेल खाती है जिसके बारे में परसेप्ट्रॉन ने पहले ही कुछ अनुभव जमा कर लिया है।

पैटर्न पहचान समस्याओं के उदाहरण

  • अक्षर पहचान।
  • बारकोड पहचान।
  • लाइसेंस प्लेट पहचान।
  • चेहरा पहचान।
  • वाक् पहचान।
  • छवि पहचान।
  • पृथ्वी की पपड़ी के स्थानीय क्षेत्रों की पहचान जिसमें खनिज भंडार स्थित हैं।

पैटर्न पहचान कार्यक्रम

यह सभी देखें

टिप्पणियाँ

लिंक

  • यूरी लिफ्शिट्स। कोर्स "सैद्धांतिक सूचना विज्ञान की आधुनिक समस्याएं" - पैटर्न पहचान, चेहरे की पहचान, पाठ वर्गीकरण के सांख्यिकीय तरीकों पर व्याख्यान
  • जर्नल ऑफ़ पैटर्न रिकॉग्निशन रिसर्च (जर्नल ऑफ़ पैटर्न रिकॉग्निशन रिसर्च)

साहित्य

  • डेविड ए. फोर्सिथ, जीन पोंसकंप्यूटर दृष्टि। आधुनिक दृष्टिकोण = कंप्यूटर विजन: एक आधुनिक दृष्टिकोण। - एम .: "विलियम्स", 2004. - एस 928. - आईएसबीएन 0-13-085198-1
  • जॉर्ज स्टॉकमैन, लिंडा शापिरोकंप्यूटर विजन = कंप्यूटर विजन। - एम .: बिनोम। ज्ञान प्रयोगशाला, 2006. - एस 752. - आईएसबीएन 5947743841
  • एएल गोरेलिक, वीए स्क्रीपकिन, मान्यता के तरीके, एम।: हायर स्कूल, 1989।
  • श्री-के। चेंग, दृश्य सूचना प्रणाली के डिजाइन सिद्धांत, एम .: मीर, 1994।

विकिमीडिया फाउंडेशन। 2010।

- प्रौद्योगिकी में, एक निश्चित वस्तु (वस्तु, प्रक्रिया, घटना, स्थिति, संकेत) से संबंधित स्थापित करने के लिए विधियों के विकास और प्रणालियों के निर्माण (कंप्यूटर के आधार पर सहित) से जुड़ी एक वैज्ञानिक और तकनीकी दिशा पूर्व का...... बड़ा विश्वकोश शब्दकोश

नए क्षेत्रों में से एक साइबरनेटिक्स। आर। के सिद्धांत की सामग्री के बारे में। कई वर्गों से संबंधित वस्तुओं (छवियों) के गुणों का एक्सट्रपलेशन उन वस्तुओं के लिए है जो किसी अर्थ में उनके करीब हैं। आमतौर पर, एक ऑटोमेटन आर। के बारे में पढ़ाते समय। वहाँ है ... ... भूवैज्ञानिक विश्वकोश

अंग्रेज़ी मान्यता, छवि; जर्मन गेस्टाल्ट अल्टरकेनंग। गणितीय साइबरनेटिक्स की एक शाखा जो वस्तुओं को वर्गीकृत करने और पहचानने के लिए सिद्धांतों और विधियों को विकसित करती है, जो उन्हें विशेषता देने वाली सुविधाओं के एक सीमित सेट द्वारा वर्णित है। एंटीनाज़ी। विश्वकोश ... ... समाजशास्त्र का विश्वकोश

पैटर्न मान्यता- कंप्यूटर की मदद से जटिल वस्तुओं का अध्ययन करने की विधि; सुविधाओं के चयन और एल्गोरिदम और प्रोग्राम के विकास में शामिल हैं जो कंप्यूटर को इन सुविधाओं के अनुसार वस्तुओं को स्वचालित रूप से वर्गीकृत करने की अनुमति देते हैं। उदाहरण के लिए, यह निर्धारित करने के लिए कि कौन सा ... ... आर्थिक और गणितीय शब्दकोश

- (तकनीकी), एक वस्तु (विषय, प्रक्रिया, घटना, स्थिति, संकेत) से संबंधित स्थापित करने के लिए विधियों के विकास और सिस्टम के निर्माण (कंप्यूटर-आधारित वाले सहित) से जुड़ी एक वैज्ञानिक और तकनीकी दिशा पूर्व ... ... विश्वकोश शब्दकोश

पैटर्न मान्यता- गणितीय साइबरनेटिक्स का एक खंड जो वर्गीकरण के तरीकों को विकसित करता है, साथ ही वस्तुओं, घटनाओं, प्रक्रियाओं, संकेतों, उन सभी वस्तुओं की स्थितियों की पहचान करता है जिन्हें कुछ विशेषताओं या गुणों के एक सीमित सेट द्वारा वर्णित किया जा सकता है, ... रूसी समाजशास्त्रीय विश्वकोश

पैटर्न मान्यता- 160 पैटर्न की पहचान: स्वचालित माध्यमों का उपयोग करके प्रपत्र अभ्यावेदन और कॉन्फ़िगरेशन की पहचान

इस लेख में, मैं मशीन लर्निंग थ्योरी के कुछ मूलभूत परिणामों को इस तरह से उजागर करने के लिए तैयार हूं, जो उन पाठकों के लिए अवधारणाओं को समझने योग्य बनाता है जो कुछ हद तक वर्गीकरण और प्रतिगमन समस्याओं से परिचित हैं। इस तरह के एक लेख को लिखने का विचार मेरे द्वारा पढ़ी गई प्रत्येक पुस्तक के साथ मेरे दिमाग में अधिक से अधिक स्पष्ट रूप से प्रकट हुआ, जिसमें शिक्षण मान्यता मशीनों के विचारों को बीच से बताया गया था और यह बिल्कुल स्पष्ट नहीं था कि इसके लेखक क्या हैं या इसे विकसित करते समय यह तरीका निर्भर था। दूसरी ओर, मशीन लर्निंग में बुनियादी अवधारणाओं के लिए समर्पित कई किताबें हैं, लेकिन उनमें सामग्री की प्रस्तुति पहली बार पढ़ने के लिए बहुत जटिल लग सकती है।

प्रेरणा

आइए ऐसे कार्य पर विचार करें। हमारे पास दो वर्गों के सेब हैं - स्वादिष्ट और स्वादिष्ट नहीं, 1 और 0। सेब की विशेषताएं हैं - रंग और आकार। रंग 0 से 1 तक लगातार बदलेगा, यानी 0 - पूरी तरह से हरा सेब, 1 - पूरी तरह से लाल। आकार समान रूप से बदल सकता है, 0 - छोटा सेब, 1 - बड़ा। हम एक एल्गोरिदम विकसित करना चाहते हैं जो इनपुट के रूप में एक रंग और आकार लेगा, और एक सेब के वर्ग को आउटपुट के रूप में लौटाएगा - चाहे वह स्वादिष्ट हो या नहीं। यह अत्यधिक वांछनीय है कि इस मामले में त्रुटियों की संख्या जितनी छोटी हो उतना बेहतर है। साथ ही, हमारे पास एक अंतिम सूची है जिसमें सेब के रंग, आकार और वर्ग पर ऐतिहासिक डेटा शामिल है। हम ऐसी समस्या का समाधान कैसे कर सकते हैं?

तार्किक दृष्टिकोण

हमारी समस्या को हल करते हुए, पहली विधि जो दिमाग में आ सकती है वह यह हो सकती है: चलो मैन्युअल रूप से नियम बनाते हैं और, रंग और आकार के मूल्यों के आधार पर, हम सेब को एक निश्चित वर्ग प्रदान करेंगे। वे। हमारे पास पूर्वापेक्षाएँ हैं - यह रंग और आकार है, और एक परिणाम है - एक सेब का स्वाद। यह काफी उचित है जब कुछ संकेत होते हैं और आप आंख से तुलना के लिए दहलीज का अनुमान लगा सकते हैं। लेकिन ऐसा हो सकता है कि स्पष्ट स्थितियों के साथ आना संभव नहीं होगा, और यह डेटा से स्पष्ट नहीं है कि किस सीमा को लेना है, और भविष्य में सुविधाओं की संख्या बढ़ सकती है। लेकिन क्या होगा अगर ऐतिहासिक डेटा के साथ हमारी सूची में, हमें एक ही रंग और आकार के दो सेब मिले, लेकिन एक को स्वादिष्ट के रूप में चिह्नित किया गया और दूसरे को नहीं? इस प्रकार, हमारी पहली विधि उतनी लचीली और मापनीय नहीं है जितनी हम चाहेंगे।

नोटेशन

आइए निम्नलिखित संकेतन का परिचय दें। हम वें सेब को के रूप में निरूपित करेंगे। बदले में, प्रत्येक में दो संख्याएँ होती हैं - रंग और आकार। हम इस तथ्य को संख्याओं के एक युग्म से निरूपित करेंगे: . हम प्रत्येक -वें सेब के वर्ग को के रूप में निरूपित करते हैं। ऐतिहासिक डेटा वाली सूची को अक्षर द्वारा दर्शाया जाएगा, इस सूची की लंबाई बराबर है। इस सूची का वां तत्व सेब और उसके वर्ग का गुण मान है। वे। . इसे हम नमूना भी कहेंगे। बड़े अक्षरों में और हम उन चरों को निरूपित करते हैं जो किसी विशेष सुविधा और वर्ग के मूल्यों को ग्रहण कर सकते हैं। हम एक नई अवधारणा पेश करते हैं - एक निर्णय नियम एक ऐसा कार्य है जो इनपुट के रूप में रंग और आकार मान लेता है, और आउटपुट के रूप में क्लास लेबल देता है:

संभाव्य दृष्टिकोण

परिसर और परिणामों के साथ एक तार्किक पद्धति के विचार को विकसित करते हुए, आइए खुद से सवाल पूछें - क्या संभावना है कि -वें सेब, जो हमारे नमूने से संबंधित नहीं है, स्वादिष्ट होगा, मापा मूल्यों को देखते हुए रंग और आकार का? संभाव्यता सिद्धांत के अंकन में, इस प्रश्न को इस प्रकार लिखा जा सकता है:

इस अभिव्यक्ति में, इसे एक आधार के रूप में, एक परिणाम के रूप में व्याख्या की जा सकती है, लेकिन आधार से परिणाम तक संक्रमण संभाव्य कानूनों का पालन करेगा, तार्किक नहीं। वे। वर्ग के लिए 0 और 1 के बूलियन मानों के साथ एक सत्य तालिका के बजाय, प्रायिकता मान होंगे जो 0 से 1 तक मान लेते हैं। बेज़ के सूत्र को लागू करें और निम्न अभिव्यक्ति प्राप्त करें:

आइए इस अभिव्यक्ति के दाईं ओर अधिक विस्तार से विचार करें। गुणक को पूर्व संभाव्यता कहा जाता है और इसका मतलब सभी संभावित सेबों के बीच एक स्वादिष्ट सेब खोजने की संभावना है। एक बेस्वाद सेब के मिलने की प्राथमिक संभावना है। यह संभावना हमारे व्यक्तिगत ज्ञान को दर्शा सकती है कि प्रकृति में अच्छे और बुरे सेब कैसे वितरित किए जाते हैं। उदाहरण के लिए, हम अपने पिछले अनुभव से जानते हैं कि सभी सेबों में से 80% स्वादिष्ट होते हैं। या हम ऐतिहासिक डेटा एस के साथ हमारी सूची में स्वादिष्ट सेबों के अनुपात की गणना करके इस मूल्य का अनुमान लगा सकते हैं। अगला गुणक दिखाता है कि कक्षा 1 सेब के लिए एक विशेष रंग और आकार मूल्य प्राप्त करने की कितनी संभावना है। इस अभिव्यक्ति को भी कहा जाता है संभाव्यता समारोह और कुछ विशेष वितरण के रूप में हो सकता है, उदाहरण के लिए, सामान्य। हम भाजक को एक सामान्यीकरण स्थिरांक के रूप में उपयोग करते हैं ताकि वांछित संभावना 0 से 1 तक भिन्न हो। हमारा अंतिम लक्ष्य संभावनाओं की खोज करना नहीं है, बल्कि एक निर्णय नियम खोजना है जो हमें तुरंत एक वर्ग देगा। निर्णय नियम का अंतिम रूप इस बात पर निर्भर करता है कि हम किन मूल्यों और मापदंडों को जानते हैं। उदाहरण के लिए, हम केवल पूर्व संभाव्यता के मूल्यों को जान सकते हैं, और शेष मूल्यों का अनुमान नहीं लगाया जा सकता है। तब निर्णायक नियम इस प्रकार होगा - सभी सेबों को उस वर्ग का मान निर्दिष्ट करना जिसके लिए प्राथमिकता संभावना सबसे बड़ी है। वे। यदि हम जानते हैं कि प्रकृति में 80% सेब स्वादिष्ट होते हैं, तो हम प्रत्येक सेब के लिए कक्षा 1 रखते हैं, तो हमारी त्रुटि 20% होगी। यदि हम संभावना फ़ंक्शन $p(X=x_m | Y=1)$ के मानों का भी अनुमान लगा सकते हैं, तो हम बेयस सूत्र का उपयोग करके आवश्यक संभावना का मान भी पा सकते हैं, जैसा कि ऊपर लिखा गया है। यहाँ निर्णय नियम इस प्रकार होगा: उस वर्ग का लेबल लगाएं जिसके लिए संभावना अधिकतम है:

हम इस नियम को बायेसियन क्लासिफायरियर कहेंगे। चूंकि हम संभावनाओं से निपट रहे हैं, यहां तक ​​​​कि एक बड़ी संभावना मूल्य भी गारंटी नहीं देता है कि सेब कक्षा 0 से संबंधित नहीं है। आइए हम सेब पर त्रुटि की संभावना का अनुमान इस प्रकार लगाते हैं: यदि निर्णय नियम 1 के बराबर वर्ग मान लौटाता है, तो त्रुटि संभावना होगी और इसके विपरीत:

हम न केवल इस विशेष उदाहरण में, बल्कि सामान्य रूप से सभी संभव सेबों के लिए वर्गीकरण त्रुटि संभावना में रुचि रखते हैं:

यह अभिव्यक्ति त्रुटि की गणितीय अपेक्षा है। इसलिए, मूल समस्या को हल करते हुए, हम बायेसियन क्लासिफायरियर में आए, लेकिन इसके नुकसान क्या हैं? मुख्य समस्या डेटा से सशर्त संभाव्यता का अनुमान लगाना है। हमारे मामले में, हम वस्तु को संख्याओं - रंग और आकार की एक जोड़ी के रूप में प्रस्तुत करते हैं, लेकिन अधिक जटिल कार्यों में, सुविधाओं का आयाम कई गुना अधिक हो सकता है, और ऐतिहासिक डेटा के साथ हमारी सूची से टिप्पणियों की संख्या पर्याप्त नहीं हो सकती है एक बहुआयामी यादृच्छिक चर की संभावना का अनुमान लगाएं। इसके बाद, हम क्लासिफायर एरर की अपनी अवधारणा को सामान्य बनाने की कोशिश करेंगे, और यह भी देखेंगे कि क्या समस्या को हल करने के लिए किसी अन्य क्लासिफायर को चुनना संभव है।

वर्गीकारक त्रुटियों के कारण हानियाँ

मान लीजिए कि हमारे पास पहले से ही किसी प्रकार का निर्णय नियम है। फिर यह दो प्रकार की त्रुटियां कर सकता है - पहला वर्ग 0 को एक वस्तु निर्दिष्ट करना है, जिसमें 1 का वास्तविक वर्ग है, और इसके विपरीत, कक्षा 1 को एक वस्तु निर्दिष्ट करना है, जिसका वास्तविक वर्ग 0 है। कुछ में समस्याएं, इन मामलों के बीच अंतर करना महत्वपूर्ण हो सकता है। उदाहरण के लिए, हम इस तथ्य से अधिक पीड़ित हैं कि स्वादिष्ट के रूप में लेबल किया गया सेब बेस्वाद निकला और इसके विपरीत। हम अवधारणा में धोखा देने वाली अपेक्षाओं से हमारी असुविधा की डिग्री को औपचारिक रूप देते हैं। अधिक आम तौर पर, हमारे पास एक हानि फ़ंक्शन होता है जो प्रत्येक क्लासिफायर त्रुटि के लिए एक संख्या देता है। आइए एक वास्तविक वर्ग लेबल बनें। हानि फ़ंक्शन तब वास्तविक वर्ग लेबल के लिए हानि मान और हमारे निर्णय नियम का मान लौटाता है। इस फ़ंक्शन के अनुप्रयोग का एक उदाहरण - हम एक ज्ञात वर्ग के साथ एक सेब से लेते हैं, हम सेब को हमारे निर्णय नियम के इनपुट में पास करते हैं, हम निर्णय नियम से वर्ग अनुमान प्राप्त करते हैं, यदि मूल्य और मिलान , तब हम मानते हैं कि क्लासिफायरियर गलत नहीं था और कोई नुकसान नहीं हुआ, यदि मान समान नहीं हैं, तो हमारे कार्य को नुकसान की मात्रा कहेंगे

सशर्त और बायेसियन जोखिम

अब जबकि हमारे पास एक हानि फलन है और जानते हैं कि वस्तु के गलत वर्गीकरण से हम कितना खोते हैं, यह समझना अच्छा होगा कि हम कई वस्तुओं पर औसतन कितना खोते हैं। यदि हम मूल्य जानते हैं - रंग और आकार के मापा मूल्यों के साथ-साथ वर्ग के वास्तविक मूल्य को देखते हुए - वें सेब के स्वादिष्ट होने की संभावना (उदाहरण के लिए, नमूना एस से एक सेब लें, लेख की शुरुआत में देखें), तो हम सशर्त जोखिम की अवधारणा को पेश कर सकते हैं। सशर्त जोखिम निर्णय नियम के लिए सुविधा पर नुकसान का औसत मूल्य है:

बाइनरी वर्गीकरण के हमारे मामले में, जब यह पता चलता है:

ऊपर, हमने निर्णय नियम का वर्णन किया है जो उस वर्ग को एक वस्तु प्रदान करता है जिसकी संभावना उच्चतम है। ऐसा नियम हमारे औसत नुकसान (बायेसियन जोखिम) के लिए न्यूनतम प्रदान करता है, इसलिए बायेसियन क्लासिफायरियर हमारे द्वारा पेश किए गए जोखिम कार्यात्मक के संदर्भ में इष्टतम है। . इसका मतलब यह है कि बायेसियन क्लासिफायरियर में सबसे छोटी संभव वर्गीकरण त्रुटि है।

कुछ विशिष्ट हानि कार्य

सबसे आम नुकसान कार्यों में से एक सममित कार्य है, जब पहली और दूसरी प्रकार की त्रुटियों से होने वाले नुकसान बराबर होते हैं। उदाहरण के लिए, 1-0 हानि फ़ंक्शन (शून्य-एक हानि) को निम्नानुसार परिभाषित किया गया है:

तब a(x) = 1 के लिए सशर्त जोखिम केवल वस्तु पर वर्ग 0 प्राप्त करने का प्रायिकता मान होगा:

इसी प्रकार ए (एक्स) = 0 के लिए:

1-0 हानि फ़ंक्शन मान 1 लेता है यदि क्लासिफायर ऑब्जेक्ट पर कोई त्रुटि करता है और 0 नहीं करता है। अब इसे बनाते हैं ताकि त्रुटि पर मान 1 न हो, लेकिन निर्णय नियम और वास्तविक वर्ग लेबल के आधार पर एक और कार्य क्यू:

तब सशर्त जोखिम निम्नानुसार लिखा जा सकता है:

अंकन पर नोट्स

पिछला पाठ डूडा और हार्ट द्वारा पुस्तक में अपनाए गए अंकन के अनुसार लिखा गया था। मूल पुस्तक में वी.एन. वैपनिक ने ऐसी प्रक्रिया पर विचार किया: प्रकृति $p(x)$ वितरण के अनुसार एक वस्तु का चयन करती है, और फिर सशर्त वितरण $p(y|x)$ के अनुसार इसे एक वर्ग लेबल प्रदान करती है। फिर जोखिम (हानि की उम्मीद) के रूप में परिभाषित किया गया है

वह फ़ंक्शन कहां है जिसके साथ हम अज्ञात निर्भरता का अनुमान लगाने की कोशिश कर रहे हैं, वास्तविक मूल्य और हमारे फ़ंक्शन के मूल्य के लिए हानि फ़ंक्शन है। अगली अवधारणा - अनुभवजन्य जोखिम को पेश करने के लिए यह संकेतन अधिक वर्णनात्मक है।

अनुभवजन्य जोखिम

इस स्तर पर, हमने पहले ही पता लगा लिया है कि तार्किक पद्धति हमारे लिए उपयुक्त नहीं है, क्योंकि यह पर्याप्त लचीला नहीं है, और जब कई विशेषताएं हैं, और प्रशिक्षण के लिए सीमित डेटा है, तो हम बायेसियन क्लासिफायर का उपयोग नहीं कर सकते हैं, और हम संभाव्यता को पुनर्स्थापित नहीं कर पाएंगे। हम यह भी जानते हैं कि बायेसियन क्लासिफायरियर में सबसे छोटी संभव वर्गीकरण त्रुटि है। चूंकि हम बायेसियन क्लासिफायरियर का उपयोग नहीं कर सकते हैं, आइए कुछ सरल लेते हैं। आइए फ़ंक्शन H के कुछ पैरामीट्रिक परिवार को ठीक करें और इस परिवार से एक क्लासिफायरियर का चयन करें।

उदाहरण: फॉर्म के सभी कार्यों का सेट दें

इस सेट के सभी कार्य केवल गुणांक से एक दूसरे से भिन्न होंगे। जब हमने ऐसे परिवार को चुना, तो हमने माना कि कक्षा 1 के अंक और कक्षा 0 के अंक के बीच रंग-आकार के निर्देशांक में गुणांक के साथ एक सीधी रेखा खींचना संभव है इस तरह से कि विभिन्न वर्गों वाले बिंदु एक सीधी रेखा के विपरीत दिशा में स्थित होते हैं। यह ज्ञात है कि इस तरह की एक सीधी रेखा के लिए, गुणांकों का सदिश सीधी रेखा के लिए अभिलम्ब होता है। अब हम ऐसा करते हैं - हम अपना सेब लेते हैं, उसके रंग और आकार को मापते हैं और रंग-आकार के अक्षों में ग्राफ पर प्राप्त निर्देशांक के साथ एक बिंदु बनाते हैं। अगला, हम इस बिंदु और वेक्टर $w$ के बीच के कोण को मापते हैं। हम ध्यान दें कि हमारी बात या तो रेखा के एक तरफ या दूसरी तरफ हो सकती है। तब और बिंदु के बीच का कोण या तो तीव्र या अधिक होगा, और अदिश गुणनफल या तो धनात्मक या ऋणात्मक होता है। यहीं पर निर्णय नियम आता है:

जब हमने कार्यों का वर्ग $H$ तय कर लिया है, तो सवाल उठता है - आवश्यक गुणांक वाले फ़ंक्शन का चयन कैसे करें? उत्तर है - आइए उस फ़ंक्शन को चुनें जो हमारे बायेसियन जोखिम $R()$ को न्यूनतम प्रदान करता है। फिर से, समस्या यह है कि बायेसियन जोखिम के मूल्यों की गणना करने के लिए, आपको वितरण $p(x,y)$ जानने की आवश्यकता है, लेकिन यह हमें नहीं दिया गया है, और इसे पुनर्स्थापित करना हमेशा संभव नहीं होता है यह। एक अन्य विचार यह है कि सभी संभावित वस्तुओं पर नहीं, बल्कि केवल एक नमूने पर जोखिम को कम किया जाए। वे। कम से कम समारोह:

इस कार्य को अनुभवजन्य जोखिम कहा जाता है। अगला सवाल यह है कि हमने अनुभवजन्य जोखिम को कम करके बायेसियन जोखिम को कम करने का फैसला क्यों किया? मैं आपको याद दिला दूं कि हमारा व्यावहारिक कार्य यथासंभव कुछ वर्गीकरण त्रुटियां करना है। जितनी कम त्रुटियां, उतना कम बायेसियन जोखिम। डेटा की मात्रा में वृद्धि के साथ बायेसियन के अनुभवजन्य जोखिम के अभिसरण के लिए तर्क 70 के दशक में दो वैज्ञानिकों - वी. एन. वैपनिक और ए. वाई. चेर्वोनेंकिस द्वारा प्राप्त किया गया था।

अभिसरण गारंटी। सबसे सरल मामला

इसलिए, हम इस निष्कर्ष पर पहुंचे हैं कि बायेसियन क्लासिफायरियर सबसे छोटी संभव त्रुटि देता है, लेकिन ज्यादातर मामलों में हम इसे प्रशिक्षित नहीं कर सकते हैं, और हम त्रुटि (जोखिम) की गणना भी नहीं कर सकते हैं। हालाँकि, हम बायेसियन जोखिम के एक अनुमान की गणना कर सकते हैं, जिसे अनुभवजन्य जोखिम कहा जाता है, और अनुभवजन्य जोखिम को जानते हुए, एक अनुमानित कार्य चुनें जो अनुभवजन्य जोखिम को कम करेगा। आइए सबसे सरल स्थिति पर विचार करें जहां अनुभवजन्य जोखिम न्यूनीकरण एक क्लासिफायरियर पैदा करता है जो बायेसियन जोखिम को भी कम करता है। सरलतम मामले के लिए, हमें एक ऐसी धारणा बनानी होगी जो व्यवहार में शायद ही कभी पूरी होती है, लेकिन जो बाद में कमजोर हो सकती है। हम कार्यों का एक परिमित वर्ग तय करते हैं जिसमें से हम अपना वर्गीकरण चुनेंगे और यह मानेंगे कि स्वाद के लिए हमारे सेब को चिह्नित करने के लिए प्रकृति जिस वास्तविक कार्य का उपयोग करती है वह परिकल्पना के इस सीमित सेट में है: . हमारे पास वस्तुओं पर वितरण से प्राप्त एक नमूना भी है। सभी नमूना वस्तुओं को समान रूप से स्वतंत्र रूप से वितरित (iid) माना जाता है। तो निम्नलिखित सत्य होगा

प्रमेय

अनुभवजन्य जोखिम न्यूनीकरण का उपयोग करते हुए एक वर्ग से एक फ़ंक्शन का चयन करके, हमें यह सुनिश्चित करने की गारंटी दी जाती है कि इसका एक छोटा बायेसियन जोखिम मूल्य है यदि जिस नमूने पर हम न्यूनतम कर रहे हैं उसका आकार पर्याप्त है।

"छोटे मूल्य" और "पर्याप्त आकार" के अर्थ के लिए, नीचे साहित्य देखें।

प्रमाण का विचार

प्रमेय की शर्त के अनुसार, हम वितरण से एक नमूना प्राप्त करते हैं, अर्थात प्रकृति से वस्तुओं के चयन की प्रक्रिया यादृच्छिक होती है। हर बार जब हम एक नमूना एकत्र करते हैं, तो यह उसी वितरण से होगा, लेकिन इसमें मौजूद वस्तुएँ स्वयं भिन्न हो सकती हैं। प्रमाण का मुख्य विचार यह है कि हम ऐसा दुर्भाग्यपूर्ण नमूना प्राप्त कर सकते हैं कि किसी दिए गए नमूने पर अनुभवजन्य जोखिम को कम करके हम जो एल्गोरिथ्म चुनते हैं, वह बायेसियन जोखिम को कम करने में बुरा होगा, लेकिन साथ ही यह अच्छा होगा अनुभवजन्य जोखिम को कम करने के लिए, लेकिन ऐसा नमूना प्राप्त करने की संभावना कम है और नमूना आकार बढ़ने से यह संभावना कम हो जाती है। अधिक यथार्थवादी धारणाओं के लिए समान प्रमेय मौजूद हैं, लेकिन हम यहां उन पर विचार नहीं करेंगे।

व्यावहारिक परिणाम

इस बात का सबूत होने के बाद कि अनुभवजन्य जोखिम को कम करने से मिलने वाले कार्य में प्रशिक्षण नमूने के पर्याप्त आकार के साथ पहले से न देखे गए डेटा पर बड़ी त्रुटि नहीं होगी, हम इस सिद्धांत का उपयोग व्यवहार में कर सकते हैं, उदाहरण के लिए, इस प्रकार - हम अभिव्यक्ति लेते हैं:

और हम हल की जा रही समस्या के आधार पर विभिन्न नुकसान कार्यों को प्रतिस्थापित करते हैं। रैखिक प्रतिगमन के लिए:

लॉजिस्टिक रिग्रेशन के लिए:

हालांकि समर्थन वेक्टर मशीनें मुख्य रूप से ज्यामिति से प्रेरित होती हैं, उन्हें अनुभवजन्य जोखिम न्यूनीकरण समस्याओं के रूप में भी माना जा सकता है।

निष्कर्ष

कई पर्यवेक्षित शिक्षण विधियों पर विचार किया जा सकता है, अन्य बातों के अलावा, वी. एन. वापनिक और ए. वाई. चेर्वोनेंकिस द्वारा विकसित सिद्धांत के विशेष मामलों के रूप में। यह सिद्धांत परीक्षण सेट पर त्रुटि के संबंध में गारंटी प्रदान करता है, बशर्ते प्रशिक्षण सेट का पर्याप्त आकार हो और परिकल्पना स्थान के लिए कुछ आवश्यकताएं हों जिसमें हम अपने एल्गोरिथ्म की तलाश कर रहे हों।

प्रयुक्त पुस्तकें

  • द नेचर ऑफ़ स्टैटिस्टिकल लर्निंग थ्योरी, व्लादिमीर एन. वैपनिक
  • पैटर्न वर्गीकरण, दूसरा संस्करण, रिचर्ड ओ. डूडा, पीटर ई. हार्ट, डेविड जी. स्टॉर्क
  • मशीन लर्निंग को समझना: थ्योरी से एल्गोरिदम तक, शाई शालेव-श्वार्ट्ज, शाई बेन-डेविड
पी.एस. कृपया सभी अशुद्धियों और टाइपो के बारे में व्यक्तिगत रूप से लिखें

टैग: टैग जोड़ें

अध्याय 3: पैटर्न पहचान और निर्णय लेने के तरीकों की विश्लेषणात्मक समीक्षा

पैटर्न पहचान सिद्धांत और नियंत्रण स्वचालन

अनुकूली पैटर्न मान्यता के मुख्य कार्य

मान्यता एक सूचना प्रक्रिया है जिसे कुछ सूचना परिवर्तक (बुद्धिमान सूचना चैनल, मान्यता प्रणाली) द्वारा कार्यान्वित किया जाता है जिसमें एक इनपुट और आउटपुट होता है। सिस्टम का इनपुट इस बात की जानकारी है कि प्रस्तुत वस्तुओं में क्या विशेषताएं हैं। सिस्टम का आउटपुट उन सूचनाओं को प्रदर्शित करता है जिन पर पहचानने योग्य वस्तुओं को वर्ग (सामान्यीकृत चित्र) सौंपा गया है।

स्वचालित पैटर्न पहचान प्रणाली का निर्माण और संचालन करते समय, कई कार्य हल हो जाते हैं। आइए संक्षेप में और सरलता से इन कार्यों पर विचार करें। यह ध्यान दिया जाना चाहिए कि इन समस्याओं के सूत्रीकरण, और स्वयं सेट, अलग-अलग लेखकों के साथ मेल नहीं खाते हैं, क्योंकि कुछ हद तक यह विशिष्ट गणितीय मॉडल पर निर्भर करता है जिस पर यह या वह मान्यता प्रणाली आधारित है। इसके अलावा, कुछ मान्यता मॉडल में कुछ कार्यों का समाधान नहीं होता है और तदनुसार, प्रस्तुत नहीं किया जाता है।

विषय क्षेत्र को औपचारिक रूप देने का कार्य

वास्तव में यह कार्य कोडिंग का कार्य है। सामान्यीकृत वर्गों की एक सूची संकलित की जाती है, जिसमें वस्तुओं के विशिष्ट कार्यान्वयन के साथ-साथ उन विशेषताओं की एक सूची भी शामिल हो सकती है, जो इन वस्तुओं में, सिद्धांत रूप में हो सकती हैं।

प्रशिक्षण नमूना बनाने का कार्य

प्रशिक्षण नमूना एक डेटाबेस है जिसमें फीचर भाषा में वस्तुओं के विशिष्ट कार्यान्वयन का विवरण होता है, जो इन वस्तुओं के बारे में जानकारी के साथ पूरक होता है जो कुछ मान्यता वर्गों के लिए होता है।

मान्यता प्रणाली को प्रशिक्षित करने का कार्य

प्रशिक्षण नमूने का उपयोग इस वर्ग और अन्य वर्गों से संबंधित प्रशिक्षण नमूने की वस्तुओं की विशेषताओं के बारे में जानकारी के सामान्यीकरण के आधार पर मान्यता वर्गों की सामान्यीकृत छवियों को बनाने के लिए किया जाता है।

फीचर स्पेस डायमेंशन में कमी की समस्या

मान्यता प्रणाली को प्रशिक्षित करने के बाद (कक्षा द्वारा फीचर आवृत्तियों के वितरण पर आंकड़े प्राप्त करना), मान्यता समस्या को हल करने के लिए प्रत्येक सुविधा के लिए इसका मूल्य निर्धारित करना संभव हो जाता है। उसके बाद, फीचर सिस्टम से कम से कम मूल्यवान सुविधाओं को हटाया जा सकता है। तब मान्यता प्रणाली को फिर से प्रशिक्षित किया जाना चाहिए, क्योंकि कुछ विशेषताओं को हटाने के परिणामस्वरूप, वर्ग परिवर्तनों द्वारा शेष सुविधाओं के वितरण आँकड़े। इस प्रक्रिया को दोहराया जा सकता है, अर्थात पुनरावृत्त हो।

मान्यता कार्य

एक पहचानने योग्य नमूने की वस्तुओं को पहचाना जाता है, जिसमें विशेष रूप से एक वस्तु शामिल हो सकती है। पहचानने योग्य नमूना प्रशिक्षण के समान ही बनता है, लेकिन इसमें कक्षाओं से संबंधित वस्तुओं के बारे में जानकारी नहीं होती है, क्योंकि यह वही है जो मान्यता प्रक्रिया में निर्धारित होता है। प्रत्येक वस्तु की मान्यता का परिणाम उनके साथ मान्यता प्राप्त वस्तु की समानता की डिग्री के अवरोही क्रम में सभी मान्यता वर्गों का वितरण या सूची है।

मान्यता गुणवत्ता नियंत्रण कार्य

मान्यता के बाद, इसकी पर्याप्तता स्थापित की जा सकती है। प्रशिक्षण नमूने की वस्तुओं के लिए, यह तुरंत किया जा सकता है, क्योंकि उनके लिए यह केवल ज्ञात है कि वे किस वर्ग से संबंधित हैं। अन्य वस्तुओं के लिए, यह जानकारी बाद में प्राप्त की जा सकती है। किसी भी स्थिति में, सभी मान्यता वर्गों के लिए वास्तविक औसत त्रुटि संभाव्यता निर्धारित की जा सकती है, साथ ही किसी विशेष वर्ग को मान्यता प्राप्त वस्तु निर्दिष्ट करते समय त्रुटि संभावना भी निर्धारित की जा सकती है।

मान्यता गुणवत्ता के बारे में उपलब्ध जानकारी को ध्यान में रखते हुए मान्यता परिणामों की व्याख्या की जानी चाहिए।

अनुकूलन कार्य

यदि, गुणवत्ता नियंत्रण प्रक्रिया के परिणामस्वरूप, यह स्थापित हो जाता है कि यह असंतोषजनक है, तो गलत तरीके से पहचानी गई वस्तुओं के विवरण को पहचानने योग्य नमूने से प्रशिक्षण एक में कॉपी किया जा सकता है, पर्याप्त वर्गीकरण जानकारी के साथ पूरक किया जा सकता है, और निर्णय को फिर से आकार देने के लिए उपयोग किया जाता है नियम, अर्थात् ध्यान में रखा। इसके अलावा, यदि ये वस्तुएं पहले से मौजूद मान्यता वर्गों से संबंधित नहीं हैं, जो उनकी गलत पहचान का कारण हो सकता है, तो इस सूची का विस्तार किया जा सकता है। नतीजतन, मान्यता प्रणाली अनुकूलित होती है और इन वस्तुओं को पर्याप्त रूप से वर्गीकृत करना शुरू कर देती है।

उलटा पहचान समस्या

मान्यता का कार्य यह है कि किसी दिए गए वस्तु के लिए, उसकी ज्ञात विशेषताओं के अनुसार, सिस्टम किसी पूर्व अज्ञात वर्ग से संबंधित है। व्युत्क्रम मान्यता समस्या में, इसके विपरीत, किसी दिए गए मान्यता वर्ग के लिए, सिस्टम यह निर्धारित करता है कि कौन सी विशेषताएँ इस वर्ग की वस्तुओं की सबसे विशेषता हैं और कौन सी नहीं हैं (या प्रशिक्षण नमूने की कौन सी वस्तुएँ इस वर्ग से संबंधित हैं)।

क्लस्टर और रचनात्मक विश्लेषण के कार्य

क्लस्टर वस्तुओं, वर्गों या सुविधाओं के ऐसे समूह होते हैं जो प्रत्येक क्लस्टर के भीतर यथासंभव समान होते हैं, और विभिन्न समूहों के बीच वे यथासंभव भिन्न होते हैं।

एक निर्माण (इस खंड में विचार किए गए संदर्भ में) विपरीत समूहों की एक प्रणाली है। इस प्रकार, एक निश्चित अर्थ में, निर्माण क्लस्टर के क्लस्टर विश्लेषण का परिणाम है।

क्लस्टर विश्लेषण में, वस्तुओं (वर्गों, विशेषताओं) की समानता और अंतर की डिग्री को मात्रात्मक रूप से मापा जाता है, और इस जानकारी का उपयोग वर्गीकरण के लिए किया जाता है। क्लस्टर विश्लेषण का नतीजा क्लस्टर द्वारा वस्तुओं का वर्गीकरण है। इस वर्गीकरण को सिमेंटिक नेटवर्क के रूप में दर्शाया जा सकता है।

संज्ञानात्मक विश्लेषण का कार्य

संज्ञानात्मक विश्लेषण में, वर्गों या विशेषताओं की समानता और अंतर के बारे में जानकारी अपने आप में शोधकर्ता के लिए रुचि की है, न कि इसे वर्गीकरण के लिए उपयोग करने के लिए, जैसा कि क्लस्टर और रचनात्मक विश्लेषण में है।

यदि मान्यता के दो वर्गों को एक ही विशेषता द्वारा चित्रित किया जाता है, तो यह इन दो वर्गों की समानता में योगदान देता है। यदि किसी एक वर्ग के लिए यह विशेषता अनैच्छिक है, तो यह अंतर में योगदान देता है।

यदि दो राशियाँ एक-दूसरे से संबंधित हैं, तो एक निश्चित अर्थ में उन्हें एक राशि माना जा सकता है, और यदि वे परस्पर विरोधी हैं, तो अलग-अलग। इस परिस्थिति को ध्यान में रखते हुए, विभिन्न वर्गों में विभिन्न विशेषताओं की उपस्थिति भी उनकी समानता और अंतर में एक निश्चित योगदान देती है।

संज्ञानात्मक विश्लेषण के परिणाम संज्ञानात्मक आरेखों के रूप में प्रस्तुत किए जा सकते हैं।

पैटर्न पहचान के तरीके और उनकी विशेषताएं

पैटर्न पहचान विधियों के वर्गीकरण के सिद्धांत

पैटर्न की पहचान वास्तविक या आदर्श दुनिया में वस्तुओं के संख्यात्मक या प्रतीकात्मक प्रतिनिधित्व पर औपचारिक संचालन के निर्माण और लागू करने का कार्य है, जिसके परिणाम इन वस्तुओं के बीच समानता संबंधों को दर्शाते हैं। तुल्यता संबंध मूल्यांकित वस्तुओं के संबंध को कुछ वर्गों से संबंधित व्यक्त करते हैं, जिन्हें स्वतंत्र सिमेंटिक इकाइयां माना जाता है।

मान्यता एल्गोरिदम का निर्माण करते समय, समतुल्यता वर्ग एक शोधकर्ता द्वारा निर्धारित किया जा सकता है जो अपने स्वयं के सार्थक विचारों का उपयोग करता है या समस्या के समाधान के संदर्भ में समानता और वस्तुओं के अंतर के बारे में बाहरी अतिरिक्त जानकारी का उपयोग करता है। फिर कोई "शिक्षक के साथ पहचान" की बात करता है। अन्यथा, अर्थात् जब एक स्वचालित प्रणाली बाहरी प्रशिक्षण जानकारी को शामिल किए बिना एक वर्गीकरण समस्या को हल करती है, तो कोई स्वत: वर्गीकरण या "अप्रबंधित मान्यता" की बात करता है। अधिकांश पैटर्न पहचान एल्गोरिदम को बहुत महत्वपूर्ण कंप्यूटिंग शक्ति की आवश्यकता होती है, जो केवल उच्च-प्रदर्शन कंप्यूटर प्रौद्योगिकी द्वारा प्रदान की जा सकती है।

विभिन्न लेखक (यू.एल. बरबाश, वी.आई. वसीलीव, ए.एल. गोरेलिक, वी.ए. स्क्रीपकिन, आर. डूडा, पी. हार्ट, एल.टी. कुज़िन, एफ.आई. पेरेगुडोव, एफ.पी. तारासेंको, एफ.ई. टेम्निकोव, जे. तू, आर. गोंजालेज, पी. विंस्टन, K. Fu, Ya. Z. Tsypkin और अन्य) पैटर्न पहचान विधियों की एक अलग टाइपोलॉजी देते हैं। कुछ लेखक पैरामीट्रिक, गैरपैरामीट्रिक और अनुमानी विधियों के बीच अंतर करते हैं, जबकि अन्य ऐतिहासिक विद्यालयों और क्षेत्र में प्रवृत्तियों के आधार पर विधियों के समूहों को अलग करते हैं। उदाहरण के लिए, काम में, जो मान्यता विधियों का अकादमिक अवलोकन देता है, पैटर्न पहचान विधियों की निम्नलिखित टाइपोलॉजी का उपयोग किया जाता है:

  • पृथक्करण के सिद्धांत पर आधारित तरीके;
  • सांख्यिकीय पद्धतियां;
  • "संभावित कार्यों" के आधार पर निर्मित तरीके;
  • ग्रेड (मतदान) की गणना के तरीके;
  • विशेष रूप से तर्क के बीजगणित के उपकरण पर, प्रस्तावपरक कलन पर आधारित विधियाँ।

यह वर्गीकरण पैटर्न मान्यता के औपचारिक तरीकों में अंतर पर आधारित है, और इसलिए मान्यता के लिए अनुमानी दृष्टिकोण पर विचार, जिसे विशेषज्ञ प्रणालियों में पूर्ण और पर्याप्त विकास प्राप्त हुआ है, को छोड़ दिया गया है। अनुमानी दृष्टिकोण कठोर-से-औपचारिक ज्ञान और शोधकर्ता के अंतर्ज्ञान पर आधारित है। उसी समय, शोधकर्ता स्वयं यह निर्धारित करता है कि वांछित मान्यता प्रभाव को प्राप्त करने के लिए सिस्टम को किस जानकारी और कैसे उपयोग करना चाहिए।

मान्यता पर कई कार्यों में विस्तार की अलग-अलग डिग्री के साथ मान्यता विधियों की एक समान टाइपोलॉजी पाई जाती है। साथ ही, प्रसिद्ध टाइपोलॉजी एक बहुत ही महत्वपूर्ण विशेषता को ध्यान में नहीं रखती है, जो कुछ औपचारिक पैटर्न पहचान एल्गोरिदम का उपयोग करके विषय क्षेत्र के बारे में ज्ञान के तरीके की विशिष्टता को दर्शाती है।

डीए पोस्पेलोव (1990) ज्ञान का प्रतिनिधित्व करने के दो मुख्य तरीकों की पहचान करता है:

  • जानबूझकर, विशेषताओं (सुविधाओं) के बीच कनेक्शन की एक योजना के रूप में।
  • विस्तृत, विशिष्ट तथ्यों (वस्तुओं, उदाहरणों) की सहायता से।

आकस्मिक प्रतिनिधित्व डेटा की संरचना की व्याख्या करने वाले पैटर्न और संबंधों को कैप्चर करता है। नैदानिक ​​​​कार्यों के संबंध में, इस तरह के निर्धारण में उन वस्तुओं की विशेषताओं (विशेषताओं) पर संचालन का निर्धारण होता है जो आवश्यक निदान परिणाम की ओर ले जाते हैं। विशेषता मूल्यों पर संचालन के माध्यम से आकस्मिक अभ्यावेदन लागू किए जाते हैं और विशिष्ट सूचना तथ्यों (वस्तुओं) पर संचालन नहीं करते हैं।

बदले में, ज्ञान के विस्तृत निरूपण विषय क्षेत्र से विशिष्ट वस्तुओं के विवरण और निर्धारण से जुड़े होते हैं और संचालन में लागू होते हैं, जिनमें से तत्व अभिन्न प्रणाली के रूप में वस्तुएं हैं।

ज्ञान के गहन और विस्तृत निरूपण और मानव मस्तिष्क के बाएं और दाएं गोलार्द्धों की गतिविधि के अंतर्निहित तंत्र के बीच एक सादृश्य बनाना संभव है। यदि दाएं गोलार्द्ध को आसपास की दुनिया के समग्र प्रोटोटाइपिक प्रतिनिधित्व की विशेषता है, तो बायां गोलार्द्ध पैटर्न के साथ काम करता है जो इस दुनिया की विशेषताओं के कनेक्शन को दर्शाता है।

ऊपर वर्णित ज्ञान प्रतिनिधित्व के दो मौलिक तरीके हमें पैटर्न पहचान विधियों के निम्नलिखित वर्गीकरण का प्रस्ताव करने की अनुमति देते हैं:

  • विशेषताओं के साथ संचालन के आधार पर आकस्मिक तरीके।
  • वस्तुओं के साथ संचालन के आधार पर विस्तार के तरीके।

इस बात पर ज़ोर देना आवश्यक है कि मान्यता विधियों के इन दो (और केवल दो) समूहों का अस्तित्व: जो सुविधाओं के साथ काम कर रहे हैं और जो वस्तुओं के साथ काम कर रहे हैं, वे बहुत स्वाभाविक हैं। इस दृष्टिकोण से, इनमें से कोई भी विधि, दूसरे से अलग से ली गई, विषय क्षेत्र का पर्याप्त प्रतिबिंब बनाना संभव नहीं बनाती है। लेखकों के अनुसार, इन विधियों के बीच एन। बोह्र के अर्थ में पूरकता का संबंध है, इसलिए, होनहार मान्यता प्रणालियों को इन दोनों विधियों के कार्यान्वयन को सुनिश्चित करना चाहिए, न कि उनमें से किसी एक को।

इस प्रकार, डी। ए। पोस्पेलोव द्वारा प्रस्तावित मान्यता विधियों का वर्गीकरण उन मूलभूत कानूनों पर आधारित है जो सामान्य रूप से अनुभूति के मानवीय तरीके को रेखांकित करते हैं, जो इसे अन्य वर्गीकरणों की तुलना में एक बहुत ही विशेष (विशेषाधिकार प्राप्त) स्थिति में रखता है, जो इस पृष्ठभूमि के खिलाफ दिखता है। अधिक हल्का और कृत्रिम।

गहन तरीके

आकस्मिक तरीकों की एक विशिष्ट विशेषता यह है कि वे पैटर्न पहचान एल्गोरिदम के निर्माण और अनुप्रयोग में संचालन के तत्वों के रूप में सुविधाओं और उनके संबंधों की विभिन्न विशेषताओं का उपयोग करते हैं। ऐसे तत्व अलग-अलग मान या फ़ीचर वैल्यू के अंतराल, औसत मान और विचरण, फ़ीचर रिलेशनशिप मेट्रिसेस आदि हो सकते हैं, जिन पर क्रियाएँ की जाती हैं, जिन्हें विश्लेषणात्मक या रचनात्मक रूप में व्यक्त किया जाता है। इसी समय, इन विधियों में वस्तुओं को अभिन्न सूचना इकाइयों के रूप में नहीं माना जाता है, लेकिन उनकी विशेषताओं की बातचीत और व्यवहार का आकलन करने के लिए संकेतक के रूप में कार्य करता है।

गहन पैटर्न मान्यता विधियों का समूह व्यापक है, और उपवर्गों में इसका विभाजन कुछ हद तक मनमाना है।

फीचर वैल्यू के वितरण घनत्व के अनुमान के आधार पर तरीके

इन पैटर्न मान्यता विधियों को सांख्यिकीय निर्णयों के शास्त्रीय सिद्धांत से उधार लिया गया है, जिसमें अध्ययन की वस्तुओं को कुछ कानून के अनुसार फीचर स्पेस में वितरित बहुआयामी यादृच्छिक चर की प्राप्ति के रूप में माना जाता है। वे एक बायेसियन निर्णय लेने की योजना पर आधारित हैं जो एक विशेष पहचानने योग्य वर्ग और फीचर वेक्टर मूल्यों के सशर्त वितरण घनत्व से संबंधित वस्तुओं की प्राथमिक संभावनाओं के लिए अपील करता है। बहुआयामी सुविधा स्थान के विभिन्न क्षेत्रों में संभावना अनुपात निर्धारित करने के लिए इन विधियों को कम किया जाता है।

सुविधा मूल्यों के वितरण घनत्व के आकलन के आधार पर तरीकों का समूह सीधे भेदभावपूर्ण विश्लेषण के तरीकों से संबंधित है। निर्णय लेने के लिए बायेसियन दृष्टिकोण आधुनिक आँकड़ों में सबसे विकसित तथाकथित पैरामीट्रिक विधियों में से एक है, जिसके लिए वितरण कानून (इस मामले में, सामान्य कानून) की विश्लेषणात्मक अभिव्यक्ति को जाना जाता है, और केवल एक मापदंडों की छोटी संख्या (मतलब वैक्टर और सहप्रसरण मैट्रिसेस) का अनुमान लगाने की आवश्यकता है।

इन तरीकों को लागू करने में मुख्य कठिनाइयाँ स्थानीय संभाव्यता वितरण घनत्व और प्रशिक्षण नमूने की गैर-प्रतिनिधित्व के प्रति उच्च संवेदनशीलता के अनुमानों की गणना करने के लिए संपूर्ण प्रशिक्षण नमूने को याद रखने की आवश्यकता है।

निर्णय कार्यों के वर्ग के बारे में मान्यताओं पर आधारित तरीके

विधियों के इस समूह में, निर्णय फलन का सामान्य रूप ज्ञात माना जाता है और इसकी गुणवत्ता कार्यात्मक दी जाती है। इस कार्यात्मक के आधार पर, प्रशिक्षण अनुक्रम से निर्णय समारोह का सबसे अच्छा सन्निकटन पाया जाता है। सबसे आम रैखिक और सामान्यीकृत गैर-रैखिक बहुपदों के रूप में निर्णय कार्यों का प्रतिनिधित्व है। निर्णय नियम की गुणवत्ता कार्यात्मक आमतौर पर वर्गीकरण त्रुटि से जुड़ी होती है।

निर्णय कार्यों के वर्ग के बारे में मान्यताओं के आधार पर विधियों का मुख्य लाभ एक चरम खोजने की समस्या के रूप में मान्यता समस्या के गणितीय सूत्रीकरण की स्पष्टता है। इस समूह के तरीकों की विविधता को उपयोग किए गए निर्णय नियम गुणवत्ता कार्यों और चरम खोज एल्गोरिदम की विस्तृत श्रृंखला द्वारा समझाया गया है। सुविचारित एल्गोरिदम का एक सामान्यीकरण, जिसमें विशेष रूप से, न्यूटन का एल्गोरिथ्म, परसेप्ट्रॉन-प्रकार के एल्गोरिदम आदि शामिल हैं, स्टोकेस्टिक सन्निकटन की विधि है।

विशेष रूप से रैखिक निर्णय नियमों के समूह में एक चरम सीमा खोजने के लिए ग्रेडिएंट एल्गोरिदम की संभावनाओं का अच्छी तरह से अध्ययन किया गया है। इन एल्गोरिदम का अभिसरण केवल उस स्थिति के लिए सिद्ध किया गया है जब कॉम्पैक्ट ज्यामितीय संरचनाओं द्वारा फीचर स्पेस में वस्तुओं के पहचानने योग्य वर्गों को प्रदर्शित किया जाता है।

एल्गोरिदम का उपयोग करके निर्णय नियम की पर्याप्त उच्च गुणवत्ता प्राप्त की जा सकती है, जिसमें वैश्विक चरम पर समाधान के अभिसरण का कठोर गणितीय प्रमाण नहीं है। इस तरह के एल्गोरिदम में विकासवादी मॉडलिंग की दिशा का प्रतिनिधित्व करने वाली अनुमानी प्रोग्रामिंग प्रक्रियाओं का एक बड़ा समूह शामिल है। विकासवादी मॉडलिंग प्रकृति से उधार ली गई एक बायोनिक पद्धति है। यह विकास के ज्ञात तंत्रों के उपयोग पर आधारित है ताकि किसी जटिल वस्तु के अर्थपूर्ण मॉडलिंग की प्रक्रिया को उसके विकास के फेनोमेनोलॉजिकल मॉडलिंग के साथ बदल दिया जा सके। पैटर्न मान्यता में विकासवादी मॉडलिंग का एक प्रसिद्ध प्रतिनिधि तर्कों के समूह लेखांकन (एमजीयूए) की विधि है। GMDH स्व-संगठन के सिद्धांत पर आधारित है, और GMDH एल्गोरिदम बड़े पैमाने पर चयन की योजना को पुन: पेश करता है।

हालांकि, इस मामले में व्यावहारिक लक्ष्यों की उपलब्धि पहचानने योग्य वस्तुओं की प्रकृति के बारे में नए ज्ञान के निष्कर्षण के साथ नहीं है। इस ज्ञान को निकालने की संभावना, विशेष रूप से विशेषताओं (विशेषताओं) की बातचीत के तंत्र के बारे में ज्ञान, मौलिक रूप से इस तरह की बातचीत की दी गई संरचना द्वारा सीमित है, जो निर्णायक कार्यों के चुने हुए रूप में तय की गई है।

बूलियन तरीके

पैटर्न की पहचान के तार्किक तरीके तार्किक बीजगणित के उपकरण पर आधारित हैं और न केवल व्यक्तिगत सुविधाओं में निहित जानकारी के साथ काम करने की अनुमति देते हैं, बल्कि सुविधा मूल्यों के संयोजन में भी। इन विधियों में किसी भी विशेषता के मान को प्रारंभिक घटनाएँ माना जाता है।

सबसे सामान्य रूप में, तार्किक तरीकों को प्रशिक्षण नमूने में तार्किक पैटर्न की एक तरह की खोज और तार्किक निर्णय नियमों की एक निश्चित प्रणाली के गठन के रूप में वर्णित किया जा सकता है (उदाहरण के लिए, प्राथमिक घटनाओं के संयोजन के रूप में), इनमें से प्रत्येक जिसका अपना भार होता है। तार्किक तरीकों का समूह विविध है और इसमें अलग-अलग जटिलता और विश्लेषण की गहराई के तरीके शामिल हैं। द्विबीजपत्री (बूलियन) विशेषताओं के लिए, तथाकथित ट्री-लाइक क्लासिफायर, डेड-एंड टेस्ट विधि, बार्क एल्गोरिथम, आदि लोकप्रिय हैं।

कोरा एल्गोरिदम, पैटर्न पहचान के अन्य तार्किक तरीकों की तरह, गणना के मामले में काफी श्रमसाध्य है, क्योंकि संयोजनों का चयन करते समय एक पूर्ण गणना की आवश्यकता होती है। इसलिए, तार्किक तरीकों को लागू करते समय, कम्प्यूटेशनल प्रक्रिया के कुशल संगठन पर उच्च आवश्यकताएं रखी जाती हैं, और ये विधियां फीचर स्पेस के अपेक्षाकृत छोटे आयामों और केवल शक्तिशाली कंप्यूटरों पर ही काम करती हैं।

भाषाई (संरचनात्मक) तरीके

पैटर्न मान्यता के भाषाई तरीके विशेष व्याकरण के उपयोग पर आधारित होते हैं जो ऐसी भाषाएँ उत्पन्न करते हैं जिनका उपयोग पहचानने योग्य वस्तुओं के गुणों के एक सेट का वर्णन करने के लिए किया जा सकता है।

वस्तुओं के विभिन्न वर्गों के लिए, गैर-व्युत्पन्न (परमाणु) तत्व (सबइमेज, संकेत) और उनके बीच संभावित संबंध प्रतिष्ठित हैं। व्याकरण इन गैर-व्युत्पन्न तत्वों से वस्तुओं के निर्माण के नियमों को संदर्भित करता है।

इस प्रकार, प्रत्येक वस्तु गैर-व्युत्पन्न तत्वों का एक संग्रह है, जो एक दूसरे से "जुड़े" हैं, या दूसरे शब्दों में, किसी "भाषा" के "वाक्य" द्वारा। मैं इस विचार के बहुत महत्वपूर्ण वैचारिक मूल्य पर जोर देना चाहूंगा।

एक "वाक्य" को पार्सिंग (पार्सिंग) करके, इसकी वाक्य-विन्यास "शुद्धता" निर्धारित की जाती है, या, समकक्ष, क्या कक्षा का वर्णन करने वाला कुछ निश्चित व्याकरण मौजूदा वस्तु विवरण उत्पन्न कर सकता है।

हालांकि, किसी दिए गए भाषा को उत्पन्न करने वाले बयानों (वाक्यों - वस्तुओं का विवरण) के एक निश्चित सेट से व्याकरण को पुनर्प्राप्त (परिभाषित) करने का कार्य औपचारिक रूप से मुश्किल है।

विस्तार के तरीके

इस समूह के तरीकों में, आकस्मिक दिशा के विपरीत, अध्ययन की गई प्रत्येक वस्तु को अधिक या कम हद तक एक स्वतंत्र निदान मूल्य दिया जाता है। उनके मूल में, ये विधियां नैदानिक ​​​​दृष्टिकोण के करीब हैं, जो लोगों को एक या दूसरे संकेतक के अनुसार रैंक की गई वस्तुओं की श्रृंखला के रूप में नहीं, बल्कि अभिन्न प्रणालियों के रूप में मानती हैं, जिनमें से प्रत्येक व्यक्तिगत है और एक विशेष नैदानिक ​​​​मूल्य है। अध्ययन की वस्तुओं के लिए इस तरह का सावधानीपूर्वक रवैया किसी को प्रत्येक व्यक्तिगत वस्तु के बारे में जानकारी को बाहर करने या खोने की अनुमति नहीं देता है, जो तब होता है जब गहन दिशा के तरीकों को लागू करते हैं, वस्तुओं का उपयोग केवल उनकी विशेषताओं के व्यवहार के पैटर्न का पता लगाने और ठीक करने के लिए करते हैं।

चर्चा की गई विधियों का उपयोग करके पैटर्न की पहचान में मुख्य संचालन वस्तुओं की समानता और अंतर को निर्धारित करने के संचालन हैं। तरीकों के निर्दिष्ट समूह में वस्तुएं नैदानिक ​​मिसाल की भूमिका निभाती हैं। साथ ही, किसी विशेष कार्य की शर्तों के आधार पर, एक व्यक्तिगत मिसाल की भूमिका व्यापक सीमाओं के भीतर भिन्न हो सकती है: मान्यता प्रक्रिया में मुख्य और परिभाषित से बहुत अप्रत्यक्ष भागीदारी तक। बदले में, समस्या की स्थितियों को एक सफल समाधान के लिए अलग-अलग नैदानिक ​​मिसालों की भागीदारी की आवश्यकता हो सकती है: प्रत्येक पहचानने योग्य वर्ग में एक से लेकर पूर्ण नमूना आकार तक, साथ ही समानता और अंतर के उपायों की गणना करने के विभिन्न तरीके वस्तुओं। ये आवश्यकताएँ उपवर्गों में विस्तारित विधियों के आगे के विभाजन की व्याख्या करती हैं।

प्रोटोटाइप तुलना विधि

यह सबसे सरल विस्तृत पहचान विधि है। इसका उपयोग, उदाहरण के लिए, उस स्थिति में किया जाता है जब कॉम्पैक्ट ज्यामितीय समूहों द्वारा मान्यता प्राप्त वर्गों को फीचर स्पेस में प्रदर्शित किया जाता है। इस मामले में, वर्ग के ज्यामितीय समूहन का केंद्र (या केंद्र के निकटतम वस्तु) को आमतौर पर प्रोटोटाइप बिंदु के रूप में चुना जाता है।

किसी अज्ञात वस्तु को वर्गीकृत करने के लिए, उसके निकटतम प्रोटोटाइप का पता लगाया जाता है, और वस्तु उसी वर्ग की होती है, जो इस प्रोटोटाइप के रूप में होती है। जाहिर है, इस पद्धति में कोई सामान्यीकृत वर्ग छवि नहीं बनती है।

निकटता के माप के रूप में विभिन्न प्रकार की दूरियों का उपयोग किया जा सकता है। अक्सर द्विबीजपत्री विशेषताओं के लिए, हैमिंग दूरी का उपयोग किया जाता है, जो इस मामले में यूक्लिडियन दूरी के वर्ग के बराबर है। इस मामले में, वस्तुओं को वर्गीकृत करने का निर्णय नियम एक रैखिक निर्णय समारोह के बराबर है।

इस तथ्य पर विशेष रूप से ध्यान दिया जाना चाहिए। यह डेटा संरचना के बारे में जानकारी के प्रोटोटाइप और सांकेतिक प्रतिनिधित्व के बीच संबंध को स्पष्ट रूप से प्रदर्शित करता है। उपरोक्त प्रतिनिधित्व का उपयोग करना, उदाहरण के लिए, किसी भी पारंपरिक मापने के पैमाने, जो द्विबीजपत्री विशेषताओं के मूल्यों का एक रैखिक कार्य है, को एक काल्पनिक निदान प्रोटोटाइप के रूप में माना जा सकता है। बदले में, यदि मान्यता प्राप्त वर्गों की स्थानिक संरचना का विश्लेषण हमें यह निष्कर्ष निकालने की अनुमति देता है कि वे ज्यामितीय रूप से कॉम्पैक्ट हैं, तो इनमें से प्रत्येक वर्ग को एक प्रोटोटाइप के साथ बदलने के लिए पर्याप्त है, जो वास्तव में एक रैखिक निदान मॉडल के बराबर है।

व्यवहार में, निश्चित रूप से, वर्णित आदर्श उदाहरण से स्थिति अक्सर अलग होती है। एक शोधकर्ता जो डायग्नोस्टिक कक्षाओं के प्रोटोटाइप के साथ तुलना के आधार पर मान्यता पद्धति को लागू करने का इरादा रखता है, उसे कठिन समस्याओं का सामना करना पड़ता है।

सबसे पहले, यह एक निकटता माप (मीट्रिक) का विकल्प है, जो वस्तुओं के वितरण के स्थानिक विन्यास को महत्वपूर्ण रूप से बदल सकता है। दूसरा, एक स्वतंत्र समस्या प्रायोगिक डेटा की बहुआयामी संरचनाओं का विश्लेषण है। ये दोनों समस्याएं विशेष रूप से फ़ीचर स्पेस के उच्च आयाम की स्थितियों में शोधकर्ता के लिए तीव्र हैं, जो वास्तविक समस्याओं के लिए विशिष्ट है।

k निकटतम पड़ोसी विधि

विवेचक विश्लेषण समस्याओं को हल करने के लिए k निकटतम पड़ोसियों की पद्धति को पहली बार 1952 में प्रस्तावित किया गया था। यह इस प्रकार है।

किसी अज्ञात वस्तु को वर्गीकृत करते समय, फीचर स्पेस (निकटतम पड़ोसी) में ज्यामितीय रूप से इसके निकटतम अन्य वस्तुओं की एक दी गई संख्या (k) पहले से ही पहचानने योग्य वर्गों से संबंधित होती है। एक विशेष डायग्नोस्टिक वर्ग को एक अज्ञात वस्तु सौंपने का निर्णय उसके निकटतम पड़ोसियों की इस ज्ञात सदस्यता के बारे में जानकारी का विश्लेषण करके किया जाता है, उदाहरण के लिए, एक साधारण मतगणना का उपयोग करके।

प्रारंभ में, k निकटतम पड़ोसियों की विधि को संभावना अनुपात का अनुमान लगाने के लिए एक गैर-पैरामीट्रिक विधि के रूप में माना जाता था। इस पद्धति के लिए, इष्टतम बायेसियन क्लासिफायरियर की तुलना में इसकी प्रभावशीलता के सैद्धांतिक अनुमान प्राप्त किए जाते हैं। यह साबित हो गया है कि k निकटतम पड़ोसी विधि के लिए स्पर्शोन्मुख त्रुटि संभावनाएँ बेयस नियम की त्रुटियों से दो गुना से अधिक नहीं है।

पैटर्न की पहचान के लिए k निकटतम पड़ोसियों की विधि का उपयोग करते समय, शोधकर्ता को निदान की गई वस्तुओं की निकटता निर्धारित करने के लिए एक मीट्रिक चुनने की कठिन समस्या को हल करना होगा। फ़ीचर स्पेस के उच्च आयाम की स्थितियों में यह समस्या इस पद्धति की पर्याप्त जटिलता के कारण अत्यंत बढ़ जाती है, जो उच्च-प्रदर्शन वाले कंप्यूटरों के लिए भी महत्वपूर्ण हो जाती है। इसलिए, यहां, प्रोटोटाइप तुलना पद्धति की तरह, नैदानिक ​​​​वर्गों का प्रतिनिधित्व करने वाली वस्तुओं की संख्या को कम करने के लिए प्रयोगात्मक डेटा की बहुआयामी संरचना का विश्लेषण करने की रचनात्मक समस्या को हल करना आवश्यक है।

प्रशिक्षण नमूने (नैदानिक ​​मिसाल) में वस्तुओं की संख्या को कम करने की आवश्यकता इस पद्धति का नुकसान है, क्योंकि यह प्रशिक्षण नमूने की प्रतिनिधित्व क्षमता को कम करता है।

ग्रेड की गणना के लिए एल्गोरिदम ("मतदान")

मूल्यांकन एल्गोरिदम (एबीओ) के संचालन का सिद्धांत प्राथमिकताओं (समानता स्कोर) की गणना करना है जो फीचर एन्सेम्बल की प्रणाली के अनुसार मान्यता प्राप्त और संदर्भ वस्तुओं की "निकटता" की विशेषता है, जो कि सुविधाओं के दिए गए सेट के सबसेट की एक प्रणाली है। .

पहले से विचार किए गए सभी तरीकों के विपरीत, अनुमानों की गणना के लिए एल्गोरिदम मूल रूप से नए तरीके से वस्तु विवरण के साथ काम करते हैं। इन एल्गोरिदम के लिए, फीचर स्पेस के बहुत अलग उप-स्थानों में ऑब्जेक्ट एक साथ मौजूद हैं। ABO वर्ग अपने तार्किक निष्कर्ष पर सुविधाओं का उपयोग करने का विचार लाता है: चूंकि यह हमेशा ज्ञात नहीं होता है कि सुविधाओं का कौन सा संयोजन सबसे अधिक जानकारीपूर्ण है, ABO में वस्तुओं की समानता की डिग्री की गणना सभी संभव या कुछ विशेषताओं के संयोजनों की तुलना करके की जाती है। वस्तुओं के विवरण में शामिल।

विशेषताओं (उप-स्थानों) के उपयोग किए गए संयोजनों को समर्थन सेट या वस्तुओं के आंशिक विवरण के सेट कहा जाता है। मान्यता प्राप्त वस्तु और प्रशिक्षण नमूने की वस्तुओं (ज्ञात वर्गीकरण के साथ) के बीच सामान्यीकृत निकटता की अवधारणा, जिसे संदर्भ वस्तु कहा जाता है, पेश की जाती है। आंशिक विवरण के सेट पर गणना की गई संदर्भ वस्तुओं के साथ मान्यता प्राप्त वस्तु की निकटता के संयोजन द्वारा इस निकटता का प्रतिनिधित्व किया जाता है। इस प्रकार, ABO k निकटतम पड़ोसियों की विधि का विस्तार है, जिसमें वस्तुओं की निकटता को केवल एक दिए गए फीचर स्पेस में माना जाता है।

ABO का एक और विस्तार यह है कि इन एल्गोरिदम में वस्तुओं की समानता और अंतर को निर्धारित करने की समस्या को पैरामीट्रिक के रूप में तैयार किया जाता है और प्रशिक्षण नमूने पर ABO को ट्यून करने के चरण का चयन किया जाता है, जिस पर दर्ज किए गए इष्टतम मान मापदंडों का चयन किया जाता है। गुणवत्ता मानदंड मान्यता त्रुटि है, और शाब्दिक रूप से सब कुछ मानकीकृत है:

  • व्यक्तिगत विशेषताओं द्वारा वस्तुओं की निकटता की गणना के नियम;
  • सुविधा उप-स्थानों में वस्तुओं की निकटता की गणना के लिए नियम;
  • नैदानिक ​​मिसाल के रूप में किसी विशेष संदर्भ वस्तु के महत्व की डिग्री;
  • किसी निदान वर्ग के साथ मान्यता प्राप्त वस्तु की समानता के अंतिम मूल्यांकन के लिए सुविधाओं के प्रत्येक संदर्भ सेट के योगदान का महत्व।

एयर कूलर पैरामीटर थ्रेसहोल्ड वैल्यू के रूप में और (या) संकेतित घटकों के वजन के रूप में सेट किए गए हैं।

एबीओ की सैद्धांतिक संभावनाएं कम से कम किसी भी अन्य पैटर्न मान्यता एल्गोरिदम की तुलना में कम नहीं हैं, क्योंकि एबीओ की मदद से अध्ययन के तहत वस्तुओं के साथ सभी बोधगम्य संचालन को लागू किया जा सकता है।

लेकिन, जैसा कि आमतौर पर होता है, संभावनाओं का विस्तार उनके व्यावहारिक कार्यान्वयन में बड़ी कठिनाइयों का सामना करता है, विशेष रूप से इस प्रकार के एल्गोरिदम के निर्माण (ट्यूनिंग) के स्तर पर।

k निकटतम पड़ोसी पद्धति पर चर्चा करते समय अलग-अलग कठिनाइयों को पहले नोट किया गया था, जिसे ABO के एक संक्षिप्त संस्करण के रूप में व्याख्या किया जा सकता है। इसे पैरामीट्रिक रूप में भी माना जा सकता है और चयनित प्रकार के भारित मीट्रिक को खोजने में समस्या को कम कर सकता है। इसी समय, उच्च-आयामी समस्याओं के लिए जटिल सैद्धांतिक प्रश्न और एक कुशल कम्प्यूटेशनल प्रक्रिया के संगठन से जुड़ी समस्याएं पहले से ही यहां उत्पन्न होती हैं।

ABO के लिए, यदि आप इन एल्गोरिदम की क्षमताओं का पूर्ण रूप से उपयोग करने का प्रयास करते हैं, तो ये कठिनाइयाँ कई गुना बढ़ जाती हैं।

उल्लेखनीय समस्याएं इस तथ्य की व्याख्या करती हैं कि व्यवहार में उच्च-आयामी समस्याओं को हल करने के लिए ABO का उपयोग किसी भी अनुमानी प्रतिबंधों और मान्यताओं की शुरूआत के साथ होता है। विशेष रूप से, साइकोडायग्नोस्टिक्स में ABO के उपयोग का एक उदाहरण है, जिसमें ABO के एक संस्करण का परीक्षण किया गया था, जो वास्तव में k निकटतम पड़ोसी पद्धति के समतुल्य है।

निर्णायक नियम सामूहिक

पैटर्न पहचान विधियों की समीक्षा के अंत में, आइए एक और दृष्टिकोण पर ध्यान दें। ये निर्णय नियमों (सीआरसी) की तथाकथित टीम हैं।

चूंकि अलग-अलग मान्यता एल्गोरिदम वस्तुओं के एक ही नमूने पर अलग-अलग व्यवहार करते हैं, स्वाभाविक रूप से एक सिंथेटिक निर्णय नियम का सवाल उठता है जो अनुकूल रूप से इन एल्गोरिदम की ताकत का उपयोग करता है। सिंथेटिक निर्णय नियम दो-स्तरीय मान्यता योजना का उपयोग करता है। पहले स्तर पर, निजी मान्यता एल्गोरिदम काम करते हैं, जिसके परिणाम संश्लेषण ब्लॉक में दूसरे स्तर पर संयुक्त होते हैं। इस तरह के संयोजन के सबसे आम तरीके एक विशेष एल्गोरिथम की क्षमता के क्षेत्रों के आवंटन पर आधारित होते हैं। क्षमता के क्षेत्रों को खोजने का सबसे सरल तरीका एक विशेष विज्ञान के पेशेवर विचारों के आधार पर सुविधाओं के स्थान को प्राथमिक रूप से विभाजित करना है (उदाहरण के लिए, किसी विशेषता के अनुसार नमूने का स्तरीकरण)। फिर, प्रत्येक चयनित क्षेत्र के लिए, अपना स्वयं का पहचान एल्गोरिथम बनाया जाता है। एक अन्य विधि पहचानने योग्य वस्तुओं के पड़ोस के रूप में फीचर स्पेस के स्थानीय क्षेत्रों को निर्धारित करने के लिए औपचारिक विश्लेषण के उपयोग पर आधारित है, जिसके लिए किसी विशेष मान्यता एल्गोरिदम की सफलता सिद्ध हुई है।

एक संश्लेषण ब्लॉक के निर्माण के लिए सबसे सामान्य दृष्टिकोण आंशिक एल्गोरिदम के परिणामी संकेतकों को एक नए सामान्यीकृत निर्णय नियम के निर्माण के लिए प्रारंभिक सुविधाओं के रूप में मानता है। इस मामले में, पैटर्न मान्यता में गहन और विस्तारित दिशाओं के उपरोक्त सभी तरीकों का उपयोग किया जा सकता है। निर्णय नियमों का एक सेट बनाने की समस्या को हल करने के लिए प्रभावी "कोरा" प्रकार के तार्किक एल्गोरिदम और अनुमानों की गणना के लिए एल्गोरिदम (एबीओ) हैं, जो तथाकथित बीजगणितीय दृष्टिकोण का आधार बनाते हैं, जो अनुसंधान और एक रचनात्मक विवरण प्रदान करता है। मान्यता एल्गोरिदम, जिसके भीतर सभी मौजूदा प्रकार के एल्गोरिदम फिट होते हैं।

पैटर्न पहचान विधियों का तुलनात्मक विश्लेषण

आइए ऊपर वर्णित पैटर्न पहचान विधियों की तुलना करें और जटिल प्रणालियों के अनुकूली स्वचालित नियंत्रण प्रणालियों के लिए एसडीए मॉडल के लिए खंड 3.3.3 में तैयार की गई आवश्यकताओं के लिए उनकी पर्याप्तता की डिग्री का मूल्यांकन करें।

आकस्मिक दिशा के तरीकों के समूह से वास्तविक समस्याओं को हल करने के लिए, निर्णायक कार्यों के रूप में प्रस्तावों के आधार पर पैरामीट्रिक तरीके और तरीके व्यावहारिक मूल्य के हैं। संकेतकों के निर्माण के लिए पैरामीट्रिक विधियां पारंपरिक पद्धति का आधार बनाती हैं। वास्तविक समस्याओं में इन विधियों का अनुप्रयोग डेटा संरचना पर मजबूत प्रतिबंध लगाने के साथ जुड़ा हुआ है, जो उनके मापदंडों के बहुत अनुमानित अनुमानों के साथ रैखिक निदान मॉडल की ओर ले जाता है। निर्णय कार्यों के रूप के बारे में मान्यताओं के आधार पर विधियों का उपयोग करते समय, शोधकर्ता को रैखिक मॉडल की ओर मुड़ने के लिए भी मजबूर किया जाता है। यह सुविधा स्थान के उच्च आयाम के कारण है, जो वास्तविक समस्याओं के लिए विशिष्ट है, जो बहुपद निर्णय समारोह की डिग्री में वृद्धि के साथ, इसके सदस्यों की संख्या में एक समस्याग्रस्त सहवर्ती वृद्धि के साथ भारी वृद्धि देता है। मान्यता की गुणवत्ता। इस प्रकार, वास्तविक समस्याओं के लिए आकस्मिक मान्यता विधियों के संभावित अनुप्रयोग के क्षेत्र को प्रोजेक्ट करके, हमें एक तस्वीर मिलती है जो रैखिक निदान मॉडल की अच्छी तरह से स्थापित पारंपरिक पद्धति से मेल खाती है।

रैखिक डायग्नोस्टिक मॉडल के गुण, जिसमें डायग्नोस्टिक इंडिकेटर को प्रारंभिक विशेषताओं के भारित योग द्वारा दर्शाया जाता है, का अच्छी तरह से अध्ययन किया जाता है। इन मॉडलों के परिणाम (उपयुक्त सामान्यीकरण के साथ) की व्याख्या की जा रही वस्तुओं से फीचर स्पेस में कुछ हाइपरप्लेन तक की दूरी के रूप में या समतुल्य रूप से, दी गई जगह में कुछ सीधी रेखा पर वस्तुओं के अनुमानों के रूप में की जाती है। इसलिए, रेखीय मॉडल केवल फीचर स्पेस क्षेत्रों के सरल ज्यामितीय विन्यास के लिए पर्याप्त हैं जिसमें विभिन्न डायग्नोस्टिक वर्गों की वस्तुओं को मैप किया जाता है। अधिक जटिल वितरणों के साथ, ये मॉडल मूलभूत रूप से प्रयोगात्मक डेटा संरचना की कई विशेषताओं को प्रतिबिंबित नहीं कर सकते हैं। साथ ही, ऐसी विशेषताएं मूल्यवान नैदानिक ​​​​जानकारी प्रदान कर सकती हैं।

साथ ही, सरल बहुआयामी संरचनाओं (विशेष रूप से, बहुआयामी सामान्य वितरण) की किसी वास्तविक समस्या में उपस्थिति को नियम के बजाय अपवाद के रूप में माना जाना चाहिए। अक्सर, डायग्नोस्टिक कक्षाएं जटिल बाहरी मानदंडों के आधार पर बनाई जाती हैं, जो फीचर स्पेस में इन वर्गों की ज्यामितीय विषमता को स्वचालित रूप से लागू करती हैं। यह "जीवन" मानदंडों के लिए विशेष रूप से सच है जो व्यवहार में सबसे अधिक बार सामने आते हैं। ऐसी परिस्थितियों में, रेखीय मॉडल का उपयोग प्रयोगात्मक जानकारी के केवल सबसे "असभ्य" पैटर्न को पकड़ता है।

प्रायोगिक जानकारी की संरचना के बारे में किसी भी धारणा के साथ विस्तृत तरीकों का उपयोग जुड़ा नहीं है, सिवाय इसके कि मान्यता प्राप्त वर्गों के भीतर वस्तुओं के एक या एक से अधिक समूह होने चाहिए जो कुछ हद तक समान हों, और विभिन्न वर्गों की वस्तुओं को कुछ में एक दूसरे से भिन्न होना चाहिए रास्ता। यह स्पष्ट है कि प्रशिक्षण नमूने के किसी भी परिमित आयाम के लिए (और यह अलग नहीं हो सकता), यह आवश्यकता हमेशा केवल इसलिए पूरी होती है क्योंकि वस्तुओं के बीच यादृच्छिक अंतर होते हैं। फीचर स्पेस में वस्तुओं की निकटता (दूरी) के विभिन्न उपायों का उपयोग समानता उपायों के रूप में किया जाता है। इसलिए, विस्तारित पैटर्न पहचान विधियों का प्रभावी उपयोग इस बात पर निर्भर करता है कि इन निकटता उपायों को कितनी अच्छी तरह परिभाषित किया गया है, साथ ही साथ प्रशिक्षण नमूने की कौन सी वस्तुएं (ज्ञात वर्गीकरण वाली वस्तुएं) नैदानिक ​​​​निजी मिसालों की भूमिका निभाती हैं। इन समस्याओं का सफल समाधान मान्यता दक्षता की सैद्धांतिक रूप से प्राप्त करने योग्य सीमाओं के निकट परिणाम देता है।

पैटर्न मान्यता के विस्तृत तरीकों के फायदे, सबसे पहले, उनके व्यावहारिक कार्यान्वयन की उच्च तकनीकी जटिलता से विरोध करते हैं। उच्च-आयामी फीचर रिक्त स्थान के लिए, निकटतम बिंदुओं के जोड़े खोजने का प्रतीत होता है सरल कार्य गंभीर समस्या में बदल जाता है। इसके अलावा, कई लेखक पहचानने योग्य वर्गों का प्रतिनिधित्व करने वाली वस्तुओं की पर्याप्त बड़ी संख्या को याद रखने की समस्या के रूप में ध्यान देते हैं।

अपने आप में, यह कोई समस्या नहीं है, लेकिन इसे एक समस्या के रूप में माना जाता है (उदाहरण के लिए, के निकटतम पड़ोसियों की विधि में) इस कारण से कि प्रत्येक वस्तु को पहचानने पर, प्रशिक्षण नमूने में सभी वस्तुओं की पूरी गणना होती है।

इसलिए, मान्यता प्रणाली के मॉडल को लागू करने की सलाह दी जाती है, जिसमें मान्यता के दौरान प्रशिक्षण नमूने की वस्तुओं की पूरी गणना की समस्या को हटा दिया जाता है, क्योंकि यह मान्यता वर्गों की सामान्यीकृत छवियों को बनाते समय केवल एक बार किया जाता है। मान्यता में ही, पहचानी गई वस्तु की तुलना केवल मान्यता वर्गों की सामान्यीकृत छवियों से की जाती है, जिनमें से संख्या निश्चित होती है और प्रशिक्षण नमूने के आयाम पर बिल्कुल निर्भर नहीं होती है। यह दृष्टिकोण आपको प्रशिक्षण नमूने के आयाम को तब तक बढ़ाने की अनुमति देता है जब तक सामान्यीकृत छवियों की आवश्यक उच्च गुणवत्ता प्राप्त नहीं हो जाती है, बिना किसी डर के कि इससे मान्यता समय में अस्वीकार्य वृद्धि हो सकती है (चूंकि इस मॉडल में मान्यता समय निर्भर नहीं करता है) प्रशिक्षण का आयाम बिल्कुल)। नमूने)।

व्यापक मान्यता विधियों को लागू करने की सैद्धांतिक समस्याएं सूचनात्मक सुविधाओं के समूहों की खोज की समस्याओं से संबंधित हैं, वस्तुओं की समानता और अंतर को मापने के लिए इष्टतम मैट्रिक्स खोजने और प्रयोगात्मक जानकारी की संरचना का विश्लेषण करने से संबंधित हैं। साथ ही, इन समस्याओं का सफल समाधान न केवल प्रभावी मान्यता एल्गोरिदम को डिजाइन करने की अनुमति देता है, बल्कि अनुभवजन्य तथ्यों के विस्तृत ज्ञान से उनकी संरचना के पैटर्न के गहन ज्ञान में संक्रमण भी करता है।

विस्तृत ज्ञान से गहन ज्ञान में संक्रमण उस चरण में होता है जब एक औपचारिक मान्यता एल्गोरिथम का निर्माण किया जा चुका होता है और इसकी प्रभावशीलता का प्रदर्शन किया जाता है। फिर उन तंत्रों का अध्ययन किया जाता है जिनके द्वारा प्राप्त दक्षता हासिल की जाती है। डेटा की ज्यामितीय संरचना के विश्लेषण से जुड़ा ऐसा अध्ययन, उदाहरण के लिए, इस निष्कर्ष पर ले जा सकता है कि यह एक विशेष निदान वर्ग का प्रतिनिधित्व करने वाली वस्तुओं को एक विशिष्ट प्रतिनिधि (प्रोटोटाइप) के साथ बदलने के लिए पर्याप्त है। जैसा कि ऊपर उल्लेख किया गया है, यह एक पारंपरिक रेखीय नैदानिक ​​पैमाना स्थापित करने के बराबर है। यह भी संभव है कि प्रत्येक डायग्नोस्टिक वर्ग को कई वस्तुओं के साथ बदलने के लिए पर्याप्त है जो कि कुछ उपवर्गों के विशिष्ट प्रतिनिधियों के रूप में सार्थक हैं, जो रैखिक तराजू के पंखे के निर्माण के बराबर है। अन्य विकल्प भी हैं, जिन पर नीचे चर्चा की जाएगी।

इस प्रकार, मान्यता विधियों की समीक्षा से पता चलता है कि पैटर्न मान्यता के कई अलग-अलग तरीकों को वर्तमान में सैद्धांतिक रूप से विकसित किया गया है। साहित्य उनका विस्तृत वर्गीकरण प्रदान करता है। हालाँकि, इनमें से अधिकांश विधियों के लिए, उनका सॉफ़्टवेयर कार्यान्वयन अनुपस्थित है, और यह बहुत स्वाभाविक है, कोई व्यक्ति स्वयं मान्यता विधियों की विशेषताओं द्वारा "पूर्वनिर्धारित" भी कह सकता है। इसका अंदाजा इस तथ्य से लगाया जा सकता है कि विशेष साहित्य और सूचना के अन्य स्रोतों में ऐसी प्रणालियों का बहुत कम उल्लेख है।

नतीजतन, वास्तविक (यानी, काफी महत्वपूर्ण) डेटा आयामों और वास्तविक आधुनिक कंप्यूटरों पर व्यावहारिक समस्याओं को हल करने के लिए कुछ सैद्धांतिक मान्यता विधियों की व्यावहारिक प्रयोज्यता का प्रश्न अपर्याप्त रूप से विकसित है।

उपरोक्त परिस्थिति को समझा जा सकता है यदि हम याद करें कि गणितीय मॉडल की जटिलता तेजी से प्रणाली के सॉफ्टवेयर कार्यान्वयन की जटिलता को बढ़ाती है और उसी हद तक इस संभावना को कम करती है कि यह प्रणाली वास्तव में काम करेगी। इसका मतलब यह है कि केवल काफी सरल और "पारदर्शी" गणितीय मॉडल पर आधारित सॉफ्टवेयर सिस्टम को ही बाजार में लागू किया जा सकता है। इसलिए, अपने सॉफ़्टवेयर उत्पाद की नकल करने में रुचि रखने वाला एक डेवलपर गणितीय मॉडल को विशुद्ध रूप से वैज्ञानिक दृष्टिकोण से नहीं, बल्कि एक व्यावहारिकतावादी के रूप में चुनने के मुद्दे पर आता है, जो सॉफ़्टवेयर कार्यान्वयन की संभावनाओं को ध्यान में रखता है। उनका मानना ​​है कि मॉडल जितना संभव हो उतना सरल होना चाहिए, यानी इसे कम लागत पर और बेहतर गुणवत्ता के साथ लागू किया जाना चाहिए, और इसे काम भी करना चाहिए (व्यावहारिक रूप से प्रभावी होना चाहिए)।

इस संबंध में, मान्यता प्रणाली में एक ही वर्ग से संबंधित वस्तुओं के सामान्य विवरण के लिए एक तंत्र को लागू करने का कार्य, अर्थात्। कॉम्पैक्ट सामान्यीकृत छवियों के निर्माण के लिए तंत्र। यह स्पष्ट है कि इस तरह के एक सामान्यीकरण तंत्र आयाम के संदर्भ में पहले से ज्ञात सामान्यीकृत छवियों के आधार पर आयाम के संदर्भ में किसी भी प्रशिक्षण नमूने को "संपीड़ित" करने की अनुमति देगा। यह हमें कई समस्याओं को सेट करने और हल करने की भी अनुमति देगा, जिन्हें प्रोटोटाइप विधि, k निकटतम पड़ोसियों की विधि और ABO के साथ तुलना जैसी पहचान विधियों में भी तैयार नहीं किया जा सकता है।

ये कार्य हैं:

  • सामान्यीकृत छवि के सूचना चित्र में सुविधाओं के सूचनात्मक योगदान का निर्धारण;
  • सामान्यीकृत छवियों का क्लस्टर-रचनात्मक विश्लेषण;
  • सुविधा के शब्दार्थ भार का निर्धारण;
  • सिमेंटिक क्लस्टर-सुविधाओं का रचनात्मक विश्लेषण;
  • एक दूसरे के साथ सामान्यीकृत वर्ग छवियों की एक सार्थक तुलना और एक दूसरे के साथ विशेषताएं (संज्ञानात्मक आरेख, मर्लिन आरेख सहित)।

जिस विधि ने इन समस्याओं के समाधान को प्राप्त करना संभव बनाया, वह अन्य प्रणालियों से इसके आधार पर परिप्रेक्ष्य प्रणाली को भी अलग करती है, जैसे कि संकलक दुभाषियों से भिन्न होते हैं, क्योंकि इस परिप्रेक्ष्य प्रणाली में सामान्यीकृत छवियों के निर्माण के कारण, मान्यता समय स्वतंत्र है प्रशिक्षण नमूने का आकार यह ज्ञात है कि यह इस निर्भरता का अस्तित्व है जो प्रशिक्षण नमूने के ऐसे आयामों पर k निकटतम पड़ोसी विधि, ABO और CRP जैसे तरीकों में मान्यता के लिए कंप्यूटर समय के व्यावहारिक रूप से अस्वीकार्य व्यय की ओर ले जाता है, जब कोई पर्याप्त बात कर सकता है आँकड़े।

मान्यता विधियों की एक संक्षिप्त समीक्षा के निष्कर्ष में, हम सारांश तालिका (तालिका 3.1) में उपरोक्त का सार प्रस्तुत करते हैं, जिसमें निम्नलिखित मापदंडों में पैटर्न मान्यता के विभिन्न तरीकों का संक्षिप्त विवरण है:

  • मान्यता विधियों का वर्गीकरण;
  • मान्यता विधियों के आवेदन के क्षेत्र;
  • मान्यता विधियों की सीमाओं का वर्गीकरण।
मान्यता विधियों का वर्गीकरण आवेदन क्षेत्र सीमाएं (नुकसान)
गहन पहचान के तरीके सुविधा मूल्यों (या समानता और वस्तुओं के बीच अंतर) के वितरण घनत्व के अनुमान के आधार पर तरीके ज्ञात वितरण के साथ समस्याएँ, आमतौर पर सामान्य, बड़े आँकड़े एकत्र करने की आवश्यकता मान्यता के दौरान संपूर्ण प्रशिक्षण सेट की गणना करने की आवश्यकता, प्रशिक्षण सेट और कलाकृतियों की गैर-प्रतिनिधित्व के प्रति उच्च संवेदनशीलता
निर्णय कार्यों के वर्ग के बारे में मान्यताओं पर आधारित तरीके कक्षाएं अच्छी तरह से वियोज्य होनी चाहिए, फीचर सिस्टम ऑर्थोनॉर्मल होना चाहिए निर्णय समारोह का रूप पहले से जाना जाना चाहिए। सुविधाओं के बीच सहसंबंधों के बारे में नए ज्ञान को ध्यान में रखना असंभव है
बूलियन तरीके तार्किक निर्णय नियमों (संयोजन) का चयन करते समय, एक पूर्ण गणन आवश्यक है। उच्च कम्प्यूटेशनल जटिलता
भाषाई (संरचनात्मक) तरीके फीचर स्पेस के छोटे आयाम की समस्याएं बयानों के एक निश्चित सेट (वस्तुओं का विवरण) से व्याकरण को पुनर्स्थापित करने (परिभाषित करने) का कार्य औपचारिक रूप देना मुश्किल है। अनसुलझी सैद्धांतिक समस्याएं
मान्यता के विस्तृत तरीके प्रोटोटाइप तुलना विधि फीचर स्पेस के छोटे आयाम की समस्याएं दूरी के उपायों (मेट्रिक्स) पर वर्गीकरण परिणामों की उच्च निर्भरता। अज्ञात इष्टतम मीट्रिक
k निकटतम पड़ोसी विधि दूरी के उपायों (मेट्रिक्स) पर वर्गीकरण परिणामों की उच्च निर्भरता। मान्यता के दौरान प्रशिक्षण नमूने की पूरी गणना की आवश्यकता। अभिकलनात्मक जटिलता
अंक (मतदान) एवीओ की गणना के लिए एल्गोरिदम वर्गों और सुविधाओं की संख्या के संदर्भ में छोटे आयाम की समस्याएं दूरी माप (मीट्रिक) पर वर्गीकरण परिणामों की निर्भरता। मान्यता के दौरान प्रशिक्षण नमूने की पूरी गणना की आवश्यकता। विधि की उच्च तकनीकी जटिलता
निर्णायक नियम सामूहिक (सीआरसी) वर्गों और सुविधाओं की संख्या के संदर्भ में छोटे आयाम की समस्याएं विधि की बहुत उच्च तकनीकी जटिलता, सैद्धांतिक समस्याओं की अनसुलझी संख्या, दोनों विशेष विधियों की क्षमता के क्षेत्रों का निर्धारण करने में, और विशेष विधियों में स्वयं

तालिका 3.1 - मान्यता विधियों के वर्गीकरण की सारांश तालिका, उनके आवेदन के क्षेत्रों और सीमाओं की तुलना

जटिल सिस्टम प्रबंधन के स्वचालन में पैटर्न की पहचान की भूमिका और स्थान

स्वचालित नियंत्रण प्रणाली में दो मुख्य भाग होते हैं: नियंत्रण वस्तु और नियंत्रण प्रणाली।

नियंत्रण प्रणाली निम्नलिखित कार्य करती है:

  • नियंत्रण वस्तु की स्थिति की पहचान;
  • नियंत्रण वस्तु और पर्यावरण की स्थिति को ध्यान में रखते हुए, प्रबंधन के लक्ष्यों के आधार पर एक नियंत्रण कार्रवाई का विकास;
  • नियंत्रण वस्तु पर नियंत्रण प्रभाव प्रदान करना।

पैटर्न की पहचान किसी वस्तु की स्थिति की पहचान से ज्यादा कुछ नहीं है।

इसलिए, नियंत्रण वस्तु की स्थिति की पहचान करने के स्तर पर पैटर्न मान्यता प्रणाली का उपयोग करने की संभावना काफी स्पष्ट और स्वाभाविक लगती है। हालाँकि, यह आवश्यक नहीं हो सकता है। इसलिए, यह सवाल उठता है कि किन मामलों में स्वचालित नियंत्रण प्रणाली में मान्यता प्रणाली का उपयोग करना उचित है और जिसमें यह नहीं है।

साहित्य के अनुसार, पहले से विकसित और आधुनिक स्वचालित नियंत्रण प्रणालियों में, नियंत्रण वस्तु की स्थिति की पहचान करने और नियंत्रण क्रियाओं को उत्पन्न करने के लिए उप-प्रणालियों में, "प्रत्यक्ष गिनती" के नियतात्मक गणितीय मॉडल का उपयोग किया जाता है, जो स्पष्ट रूप से और काफी सरल रूप से निर्धारित करते हैं कि क्या करना है नियंत्रण वस्तु के साथ करें यदि उसके पास कुछ बाहरी पैरामीटर हैं।

साथ ही, ये पैरामीटर नियंत्रण वस्तु के कुछ राज्यों से कैसे संबंधित हैं, यह सवाल उठाया या हल नहीं किया गया है। यह स्थिति उस दृष्टिकोण से मेल खाती है, जिसमें यह तथ्य शामिल है कि उनका एक-से-एक संबंध "डिफ़ॉल्ट रूप से" स्वीकार किया जाता है। इसलिए, शब्द: "नियंत्रण वस्तु के पैरामीटर" और "नियंत्रण वस्तु की स्थिति" को पर्यायवाची माना जाता है, और "नियंत्रण वस्तु की स्थिति" की अवधारणा को स्पष्ट रूप से पेश नहीं किया गया है। हालाँकि, यह स्पष्ट है कि, सामान्य स्थिति में, नियंत्रण वस्तु और उसकी स्थिति के देखे गए मापदंडों के बीच संबंध गतिशील और संभाव्य है।

इस प्रकार, पारंपरिक स्वचालित नियंत्रण प्रणालियाँ अनिवार्य रूप से पैरामीट्रिक नियंत्रण प्रणालियाँ हैं, अर्थात सिस्टम जो नियंत्रण वस्तु की स्थिति का प्रबंधन नहीं करते हैं, बल्कि केवल इसके अवलोकनीय मापदंडों का प्रबंधन करते हैं। नियंत्रण कार्रवाई पर निर्णय ऐसी प्रणालियों में लिया जाता है जैसे कि "नेत्रहीन", अर्थात। नियंत्रण वस्तु और पर्यावरण की उनकी वर्तमान स्थिति में समग्र छवि बनाए बिना, साथ ही साथ पर्यावरण के विकास की भविष्यवाणी किए बिना और उस पर कुछ नियंत्रण क्रियाओं पर नियंत्रण वस्तु की प्रतिक्रिया, पर्यावरण के अनुमानित प्रभाव के साथ-साथ कार्य करना .

इस पत्र में विकसित पदों से, आधुनिक अर्थों में "निर्णय लेने" शब्द शायद ही पारंपरिक स्वचालित नियंत्रण प्रणालियों पर लागू होता है। तथ्य यह है कि "निर्णय लेने", कम से कम, पर्यावरण में किसी वस्तु की समग्र दृष्टि को शामिल करता है, और न केवल उनकी वर्तमान स्थिति में, बल्कि गतिकी में भी, और एक दूसरे के साथ और नियंत्रण प्रणाली के साथ बातचीत में, इसमें इस संपूर्ण प्रणाली के विकास के लिए विभिन्न वैकल्पिक विकल्पों पर विचार करना शामिल है, साथ ही कुछ लक्ष्य मानदंडों के आधार पर इन विकल्पों की विविधता (कमी) को कम करना शामिल है। इनमें से कोई भी, जाहिर है, पारंपरिक एसीएस में नहीं है, या यह है, लेकिन एक सरलीकृत रूप में।

बेशक, पारंपरिक विधि पर्याप्त है और इसका अनुप्रयोग उन मामलों में काफी सही और न्यायसंगत है जहां नियंत्रण वस्तु वास्तव में एक स्थिर और कठोर रूप से निर्धारित प्रणाली है, और उस पर पर्यावरण के प्रभाव को उपेक्षित किया जा सकता है।

हालांकि, अन्य मामलों में यह विधि अप्रभावी है।

यदि नियंत्रण वस्तु गतिशील है, तो इसके नियंत्रण एल्गोरिदम के अंतर्निहित मॉडल जल्दी से अपर्याप्त हो जाते हैं, क्योंकि इनपुट और आउटपुट मापदंडों के बीच संबंध बदल जाता है, साथ ही आवश्यक मापदंडों का सेट भी बदल जाता है। संक्षेप में, इसका मतलब यह है कि पारंपरिक स्वचालित नियंत्रण प्रणालियां उस पर कमजोर नियंत्रण क्रियाओं के माध्यम से केवल संतुलन बिंदु के पास नियंत्रण वस्तु की स्थिति को नियंत्रित करने में सक्षम हैं, अर्थात। छोटी गड़बड़ी की विधि से। संतुलन की स्थिति से दूर, पारंपरिक दृष्टिकोण से, नियंत्रण वस्तु का व्यवहार अप्रत्याशित और बेकाबू दिखता है।

यदि नियंत्रण वस्तु के इनपुट और आउटपुट मापदंडों के बीच कोई स्पष्ट संबंध नहीं है (अर्थात, इनपुट मापदंडों और वस्तु की स्थिति के बीच), दूसरे शब्दों में, यदि इस संबंध में एक स्पष्ट संभाव्यता प्रकृति है, तो नियतात्मक मॉडल, में यह माना जाता है कि एक निश्चित पैरामीटर को मापने का नतीजा केवल संख्या है, प्रारंभ में लागू नहीं होता है। इसके अलावा, इस संबंध का रूप केवल अज्ञात हो सकता है, और फिर सबसे सामान्य धारणा से आगे बढ़ना आवश्यक है: कि यह संभाव्य है, या बिल्कुल भी परिभाषित नहीं है।

पारंपरिक सिद्धांतों पर निर्मित एक स्वचालित नियंत्रण प्रणाली केवल उन मापदंडों के आधार पर काम कर सकती है, जिनके संबंधों के पैटर्न पहले से ही ज्ञात हैं, गणितीय मॉडल में अध्ययन और परिलक्षित होते हैं, इस अध्ययन में स्वचालित नियंत्रण को डिजाइन करने के लिए इस तरह के तरीकों को विकसित करने का कार्य निर्धारित किया गया था। ऐसी प्रणालियाँ जो ऐसी प्रणालियाँ बनाने की अनुमति देंगी जो सबसे महत्वपूर्ण मापदंडों की पहचान और सेट कर सकें, और उनके और नियंत्रण वस्तु की अवस्थाओं के बीच संबंधों की प्रकृति का निर्धारण कर सकें।

इस मामले में, वास्तविक स्थिति में अधिक विकसित और पर्याप्त माप विधियों को लागू करना आवश्यक है:

  • वर्गीकरण या पैटर्न पहचान (एक प्रशिक्षण नमूने के आधार पर सीखना, मान्यता एल्गोरिदम की अनुकूलता, कक्षाओं के सेट की अनुकूलता और अध्ययन किए गए पैरामीटर, सबसे महत्वपूर्ण पैरामीटर का चयन और दिए गए अतिरेक को बनाए रखते हुए विवरण आयाम में कमी आदि);
  • सांख्यिकीय माप, जब एक निश्चित पैरामीटर को मापने का परिणाम एक एकल संख्या नहीं है, लेकिन एक संभाव्यता वितरण: एक सांख्यिकीय चर में परिवर्तन का अर्थ अपने आप में इसके मूल्य में परिवर्तन नहीं है, बल्कि संभाव्यता वितरण की विशेषताओं में परिवर्तन है। इसके मूल्य।

नतीजतन, पारंपरिक नियतात्मक दृष्टिकोण के आधार पर स्वचालित नियंत्रण प्रणाली व्यावहारिक रूप से जटिल गतिशील बहु-पैरामीटर कमजोर रूप से निर्धारित नियंत्रण वस्तुओं के साथ काम नहीं करती है, जैसे कि "गतिशील अर्थव्यवस्था में मैक्रो- और सूक्ष्म-सामाजिक-आर्थिक प्रणाली" संक्रमण काल", पदानुक्रमित अभिजात वर्ग और जातीय समूह, समाज और मतदाता, मानव शरीर विज्ञान और मानस, प्राकृतिक और कृत्रिम पारिस्थितिक तंत्र और कई अन्य।

यह बहुत महत्वपूर्ण है कि 80 के दशक के मध्य में, I.Prigozhin के स्कूल ने एक दृष्टिकोण विकसित किया, जिसके अनुसार किसी भी प्रणाली (एक व्यक्ति सहित) के विकास में, अवधि वैकल्पिक होती है, जिसके दौरान सिस्टम "ज्यादातर नियतात्मक" के रूप में व्यवहार करता है। या "ज्यादातर यादृच्छिक" के रूप में। स्वाभाविक रूप से, एक वास्तविक नियंत्रण प्रणाली को न केवल अपने इतिहास के "नियतात्मक" खंडों पर नियंत्रण वस्तु का प्रबंधन करना चाहिए, बल्कि उन बिंदुओं पर भी जब इसका आगे का व्यवहार अत्यधिक अनिश्चित हो जाता है। अकेले इसका मतलब यह है कि व्यवहार में सिस्टम के प्रबंधन के लिए दृष्टिकोण विकसित करना आवश्यक है जिसमें यादृच्छिकता का एक बड़ा तत्व है (या जिसे वर्तमान में गणितीय रूप से "यादृच्छिकता" के रूप में वर्णित किया गया है)।

इसलिए, आवश्यक कार्यात्मक लिंक के रूप में, जटिल गतिशील बहु-पैरामीटर कमजोर निर्धारक प्रणालियों का नियंत्रण प्रदान करने वाले होनहार स्वचालित नियंत्रण प्रणालियों की संरचना में स्पष्ट रूप से कृत्रिम बुद्धिमत्ता विधियों के आधार पर पर्यावरण और नियंत्रण वस्तु की स्थिति की पहचान करने और भविष्यवाणी करने के लिए सबसिस्टम शामिल होंगे। (मुख्य रूप से पैटर्न पहचान), निर्णय लेने और सूचना सिद्धांत का समर्थन करने के तरीके।

आइए एक नियंत्रण कार्रवाई पर निर्णय लेने के लिए छवि पहचान प्रणाली का उपयोग करने के मुद्दे पर संक्षेप में विचार करें (इस मुद्दे पर बाद में और अधिक विस्तार से चर्चा की जाएगी, क्योंकि यह इस कार्य के लिए महत्वपूर्ण है)। यदि हम लक्ष्य और नियंत्रण वस्तु की अन्य अवस्थाओं को पहचान वर्गों के रूप में लेते हैं, और इसे प्रभावित करने वाले कारकों को संकेतों के रूप में लेते हैं, तो पैटर्न मान्यता मॉडल में कारकों और राज्यों के बीच संबंध का एक उपाय बनाया जा सकता है। यह उन कारकों के बारे में जानकारी प्राप्त करने की अनुमति देता है जो नियंत्रण वस्तु की दी गई स्थिति के आधार पर इस स्थिति में इसके संक्रमण में योगदान करते हैं या इसमें बाधा डालते हैं, और इस आधार पर नियंत्रण कार्रवाई पर निर्णय लेते हैं।

कारकों को निम्नलिखित समूहों में विभाजित किया जा सकता है:

  • नियंत्रण वस्तु के प्रागितिहास की विशेषता;
  • नियंत्रण वस्तु की वर्तमान स्थिति को चिह्नित करना;
  • वातावरणीय कारक;
  • तकनीकी (प्रबंधित) कारक।

इस प्रकार, छवि पहचान प्रणाली का उपयोग स्वचालित नियंत्रण प्रणाली के हिस्से के रूप में किया जा सकता है: सबसिस्टम में नियंत्रण वस्तु की स्थिति की पहचान करने और नियंत्रण क्रियाओं को उत्पन्न करने के लिए।

यह तब उपयोगी होता है जब नियंत्रण वस्तु एक जटिल प्रणाली होती है।

स्वचालित नियंत्रण प्रणाली में नियंत्रण कार्रवाई पर निर्णय लेना

जटिल प्रणालियों द्वारा अनुकूली स्वचालित नियंत्रण प्रणालियों के संश्लेषण की समस्या का समाधान इस पत्र में पैटर्न मान्यता और निर्णय लेने के तरीकों के बीच कई और गहरी सादृश्यता को ध्यान में रखते हुए माना जाता है।

एक ओर, पैटर्न की पहचान का कार्य एक पहचानने योग्य वस्तु के एक निश्चित मान्यता वर्ग से संबंधित होने का निर्णय है।

दूसरी ओर, लेखक निर्णय लेने की समस्या को डिकोडिंग की उलटी समस्या या पैटर्न पहचान की उलटी समस्या के रूप में देखने का प्रस्ताव करते हैं (धारा 2.2.2 देखें)।

सूचना सिद्धांत के दृष्टिकोण से उन पर विचार करने पर पैटर्न मान्यता और निर्णय लेने के तरीकों में अंतर्निहित बुनियादी विचारों की समानता विशेष रूप से स्पष्ट हो जाती है।

निर्णय लेने के कार्यों की विविधता

एक लक्ष्य की प्राप्ति के रूप में निर्णय लेना

परिभाषा: निर्णय लेना ("पसंद") विकल्पों के एक सेट पर एक क्रिया है, जिसके परिणामस्वरूप विकल्पों का मूल सेट संकरा हो जाता है, अर्थात। यह कम हो गया है।

पसंद एक क्रिया है जो सभी गतिविधियों को उद्देश्यपूर्णता प्रदान करती है। यह पसंद के कार्यों के माध्यम से है कि सभी गतिविधियों को एक विशिष्ट लक्ष्य या परस्पर संबंधित लक्ष्यों के एक समूह के अधीनता का एहसास होता है।

इस प्रकार, पसंद का कार्य संभव होने के लिए, निम्नलिखित आवश्यक है:

  • विकल्प बनाने के लिए विकल्पों के एक सेट की पीढ़ी या खोज;
  • जिन लक्ष्यों को प्राप्त करने के लिए चुनाव किया गया है उनका निर्धारण;
  • एक दूसरे के साथ विकल्पों की तुलना करने के लिए एक विधि का विकास और अनुप्रयोग, अर्थात। कुछ मानदंडों के अनुसार प्रत्येक विकल्प के लिए वरीयता रेटिंग का निर्धारण, अप्रत्यक्ष रूप से यह आकलन करने की अनुमति देता है कि प्रत्येक विकल्प लक्ष्य को कैसे पूरा करता है।

निर्णय समर्थन के क्षेत्र में आधुनिक कार्य ने एक विशिष्ट स्थिति का खुलासा किया है, जिसमें इस तथ्य को समाहित किया गया है कि सर्वोत्तम (एक निश्चित अर्थ में) समाधान खोजने की पूर्ण औपचारिकता केवल अच्छी तरह से अध्ययन की गई, अपेक्षाकृत सरल समस्याओं के लिए संभव है, जबकि व्यवहार में, कमजोर रूप से संरचित समस्याएं अधिक आम हैं, जिनके लिए पूरी तरह से औपचारिक एल्गोरिदम विकसित नहीं किए गए हैं (विस्तृत गणना और परीक्षण और त्रुटि को छोड़कर)। हालांकि, अनुभवी, सक्षम और सक्षम पेशेवर अक्सर ऐसे विकल्प चुनते हैं जो काफी अच्छे साबित होते हैं। इसलिए, प्राकृतिक स्थितियों में निर्णय लेने के अभ्यास में वर्तमान प्रवृत्ति औपचारिक तरीकों और कंप्यूटर मॉडलिंग की क्षमताओं के साथ गैर-औपचारिक समस्याओं को हल करने के लिए किसी व्यक्ति की क्षमता को जोड़ना है: इंटरैक्टिव निर्णय समर्थन प्रणाली, विशेषज्ञ प्रणाली, अनुकूली मानव-मशीन स्वचालित नियंत्रण प्रणाली, तंत्रिका नेटवर्क और संज्ञानात्मक प्रणाली।

अनिश्चितता को दूर करने के रूप में निर्णय लेना (सूचना दृष्टिकोण)

सूचना प्राप्त करने की प्रक्रिया को एक संकेत प्राप्त करने के परिणामस्वरूप अनिश्चितता में कमी के रूप में माना जा सकता है, और अनिश्चितता को दूर करने की डिग्री के मात्रात्मक माप के रूप में सूचना की मात्रा।

लेकिन सेट से विकल्पों के कुछ उपसमुच्चय को चुनने के परिणामस्वरूप, यानी निर्णय लेने के परिणामस्वरूप वही होता है (अनिश्चितता में कमी)। इसका मतलब यह है कि प्रत्येक विकल्प, प्रत्येक निर्णय एक निश्चित मात्रा में जानकारी उत्पन्न करता है, और इसलिए इसे सूचना सिद्धांत के संदर्भ में वर्णित किया जा सकता है।

निर्णय लेने की समस्याओं का वर्गीकरण

निर्णय लेने के कार्यों की बहुलता इस तथ्य के कारण है कि जिस स्थिति में निर्णय लिया जाता है, उसके प्रत्येक घटक को गुणात्मक रूप से भिन्न विकल्पों में लागू किया जा सकता है।

यहाँ इनमें से कुछ विकल्प दिए गए हैं:

  • विकल्पों का समुच्चय, एक ओर, परिमित, गणनीय या नित्य हो सकता है, और दूसरी ओर, इसे बंद किया जा सकता है (अर्थात, पूरी तरह से ज्ञात) या खुला (अज्ञात तत्वों सहित);
  • विकल्पों का मूल्यांकन एक या अधिक मानदंडों के अनुसार किया जा सकता है, जो बदले में मात्रात्मक या गुणात्मक हो सकता है;
  • चयन मोड एकल (एक बार), या एकाधिक, दोहराव वाला हो सकता है, जिसमें चयन के परिणामों पर प्रतिक्रिया शामिल है, अर्थात। पिछले चुनावों के परिणामों को ध्यान में रखते हुए निर्णय लेने वाले एल्गोरिदम को सीखने की अनुमति देना;
  • प्रत्येक विकल्प को चुनने के परिणामों को पहले से सटीक रूप से जाना जा सकता है (निश्चितता के तहत विकल्प), एक संभाव्य प्रकृति होती है जब संभावित परिणामों की संभावनाएं पसंद किए जाने के बाद ज्ञात होती हैं (जोखिम के तहत विकल्प) या अज्ञात संभावनाओं के साथ एक अस्पष्ट परिणाम होता है (पसंद) अनिश्चितता के तहत);
  • पसंद के लिए जिम्मेदारी अनुपस्थित हो सकती है, व्यक्तिगत या समूह हो;
  • समूह पसंद में लक्ष्यों की निरंतरता की डिग्री पार्टियों के हितों (सहयोगी पसंद) के पूर्ण संयोग से उनके विपरीत (संघर्ष की स्थिति में पसंद) में भिन्न हो सकती है। मध्यवर्ती विकल्प भी संभव हैं: एक समझौता, एक गठबंधन, एक बढ़ता या लुप्त होता संघर्ष।

इन विकल्पों के विभिन्न संयोजन कई निर्णय लेने की समस्याओं को जन्म देते हैं जिनका अलग-अलग डिग्री तक अध्ययन किया गया है।

निर्णय लेने के तरीकों का वर्णन करने के लिए भाषाएँ

सामान्यता और पर्याप्तता की अलग-अलग डिग्री की विभिन्न भाषाओं में एक ही घटना के बारे में बात की जा सकती है। आज तक, पसंद का वर्णन करने के लिए तीन मुख्य भाषाएँ हैं।

सबसे सरल, सबसे विकसित और सबसे लोकप्रिय कसौटी भाषा है।

मानदंड भाषा

इस भाषा का नाम मूल धारणा से जुड़ा है कि प्रत्येक व्यक्तिगत विकल्प का मूल्यांकन कुछ विशिष्ट (एक) संख्या द्वारा किया जा सकता है, जिसके बाद विकल्पों की तुलना उनकी संबंधित संख्याओं की तुलना में कम हो जाती है।

मान लीजिए, उदाहरण के लिए, (X) विकल्पों का एक सेट है, और x इस सेट से संबंधित कुछ निश्चित विकल्प हैं: x∈X। तब यह माना जाता है कि सभी x के लिए एक फलन q(x) दिया जा सकता है, जिसे एक कसौटी (गुणवत्ता मानदंड, उद्देश्य फलन, वरीयता फलन, उपयोगिता फलन, आदि) कहा जाता है, जिसका गुण है कि यदि वैकल्पिक x 1 है x 2 के लिए बेहतर (निरूपित: x 1 > x 2), फिर q (x 1) > q (x 2)।

इस मामले में, कसौटी समारोह के उच्चतम मूल्य के साथ एक विकल्प खोजने के लिए विकल्प कम हो जाता है।

हालाँकि, व्यवहार में, विकल्पों की वरीयता की डिग्री की तुलना करने के लिए केवल एक मानदंड का उपयोग एक अनुचित सरलीकरण निकला, क्योंकि विकल्पों के अधिक विस्तृत विचार से उन्हें एक के अनुसार नहीं, बल्कि कई के अनुसार मूल्यांकन करने की आवश्यकता होती है। मानदंड जो भिन्न प्रकृति के हो सकते हैं और गुणात्मक रूप से एक दूसरे से भिन्न हो सकते हैं।

उदाहरण के लिए, जब कुछ प्रकार के मार्गों पर यात्रियों और ऑपरेटिंग संगठन के लिए सबसे स्वीकार्य प्रकार के विमान का चयन करते हैं, तो मानदंडों के कई समूहों के अनुसार एक साथ तुलना की जाती है: तकनीकी, तकनीकी, आर्थिक, सामाजिक, एर्गोनोमिक, आदि।

बहुमापदंड समस्याओं का कोई विशिष्ट सामान्य समाधान नहीं होता है। इसलिए, एक बहुमानदंड समस्या को एक विशेष रूप देने के लिए कई तरीके प्रस्तावित हैं जो एक सामान्य समाधान की अनुमति देता है। स्वाभाविक रूप से, ये समाधान आम तौर पर अलग-अलग तरीकों के लिए अलग-अलग होते हैं। इसलिए, बहु-मापदंडों की समस्या को हल करने में शायद मुख्य बात इस प्रकार के निर्माण का औचित्य है।

बहुमानदंड चयन समस्या को सरल करने के लिए विभिन्न विकल्पों का उपयोग किया जाता है। आइए उनमें से कुछ को सूचीबद्ध करें।

  1. सशर्त अधिकतमकरण (अभिन्न मानदंड का वैश्विक चरम नहीं पाया जाता है, लेकिन मुख्य मानदंड का स्थानीय चरम)।
  2. दिए गए गुणों के साथ एक विकल्प खोजें।
  3. परेटो सेट ढूँढना।
  4. एक अभिन्न मानदंड की शुरुआत करके एक बहु-मानदंड समस्या को एकल-मानदंड में कम करना।

आइए एक बहु-मापदंड समस्या को एकल-मानदंड में कम करने की विधि के औपचारिक सूत्रीकरण पर अधिक विस्तार से विचार करें।

हम सदिश तर्क के अदिश फलन के रूप में समाकल कसौटी q 0 (x) का परिचय देते हैं:

क्यू 0 (एक्स) = क्यू 0 ((क्यू 1 (एक्स), क्यू 2 (एक्स), ..., क्यू एन (एक्स))।

अभिन्न कसौटी q 0 द्वारा विकल्पों को क्रमबद्ध करना संभव बनाता है, जिससे सबसे अच्छा (इस कसौटी के अर्थ में) पर प्रकाश डाला जाता है। फ़ंक्शन q 0 का रूप इस बात से निर्धारित होता है कि हम अभिन्न मानदंड के लिए प्रत्येक मानदंड के योगदान की विशेष रूप से कल्पना कैसे करते हैं। आमतौर पर योगात्मक और गुणात्मक कार्यों का उपयोग किया जाता है:

क्ष 0 = ∑a मैं ⋅q मैं / एस मैं

1 - q 0 = ∏(1 - b i ⋅q i /s i)

गुणांक मैं प्रदान करता हूं:

  1. आयामहीनता या संख्या a i ⋅q i /s i का एकल आयाम (विभिन्न विशेष मानदंडों के अलग-अलग आयाम हो सकते हैं, और फिर उन पर अंकगणितीय संचालन करना और उन्हें एक अभिन्न मानदंड में कम करना असंभव है)।
  2. सामान्यीकरण, अर्थात्। शर्त का प्रावधान: b i ⋅q i /s i<1.

गुणांक a i और b i विशेष मानदंड q i के अभिन्न मानदंड के सापेक्ष योगदान को दर्शाते हैं।

इसलिए, एक बहु-मापदंड सेटिंग में, विकल्पों में से किसी एक को चुनने पर निर्णय लेने की समस्या अभिन्न मानदंड को अधिकतम करने के लिए कम हो जाती है:

x * = तर्क अधिकतम (क्यू 0 (क्यू 1 (एक्स), क्यू 2 (एक्स), ..., क्यू एन (एक्स)))

निर्णय लेने की समस्या के बहु-मापदंडों के निर्माण में मुख्य समस्या यह है कि गुणांक a i और b i के ऐसे विश्लेषणात्मक रूप को खोजना आवश्यक है, जो मॉडल के निम्नलिखित गुण प्रदान करेगा:

  • विषय क्षेत्र की पर्याप्तता और विशेषज्ञों के दृष्टिकोण का उच्च स्तर;
  • अभिन्न कसौटी को अधिकतम करने में न्यूनतम कम्प्यूटेशनल कठिनाइयाँ, यानी विभिन्न विकल्पों के लिए इसकी गणना;
  • प्रारंभिक डेटा के छोटे गड़बड़ी से अभिन्न मानदंड को अधिकतम करने के परिणामों की स्थिरता।
  • समाधान की स्थिरता का अर्थ है कि प्रारंभिक डेटा में एक छोटे से परिवर्तन से अभिन्न मानदंड के मूल्य में एक छोटा परिवर्तन होना चाहिए, और तदनुसार, किए जा रहे निर्णय में एक छोटा सा परिवर्तन होना चाहिए। इस प्रकार, यदि प्रारंभिक डेटा व्यावहारिक रूप से समान हैं, तो निर्णय या तो समान या बहुत निकट होना चाहिए।

अनुक्रमिक बाइनरी चयन भाषा

द्विआधारी संबंधों की भाषा बहुमानदंडों की भाषा का एक सामान्यीकरण है और इस तथ्य पर आधारित है कि जब हम किसी विकल्प का मूल्यांकन करते हैं, तो यह मूल्यांकन हमेशा सापेक्ष होता है, अर्थात। स्पष्ट रूप से या अधिक बार अप्रत्यक्ष रूप से, अध्ययन के तहत सेट से या सामान्य आबादी से अन्य विकल्पों को तुलना के आधार या संदर्भ के फ्रेम के रूप में उपयोग किया जाता है। मानवीय सोच विरोधों (निर्माणों) की खोज और विश्लेषण पर आधारित है, इसलिए हमारे लिए दो विपरीत विकल्पों में से एक को चुनना हमेशा आसान होता है, बड़े और किसी भी तरह से अव्यवस्थित सेट से एक विकल्प नहीं।

इस प्रकार, इस भाषा की मुख्य मान्यताएँ निम्नलिखित हैं:

  • एक ही विकल्प का मूल्यांकन नहीं किया जाता है, अर्थात कसौटी समारोह पेश नहीं किया गया है;
  • विकल्पों की प्रत्येक जोड़ी के लिए, यह किसी तरह से स्थापित किया जा सकता है कि उनमें से एक दूसरे के लिए बेहतर है, या कि वे समकक्ष या अतुलनीय हैं;
  • विकल्पों की किसी भी जोड़ी में वरीयता संबंध पसंद के लिए प्रस्तुत अन्य विकल्पों पर निर्भर नहीं करता है।

द्विआधारी संबंधों को निर्दिष्ट करने के विभिन्न तरीके हैं: प्रत्यक्ष, मैट्रिक्स, वरीयता ग्राफ का उपयोग करना, अनुभागों की विधि आदि।

एक जोड़ी के विकल्पों के बीच संबंध तुल्यता, क्रम और प्रभुत्व की अवधारणाओं के माध्यम से व्यक्त किए जाते हैं।

पसंद कार्यों की सामान्यीकृत भाषा

पसंद कार्यों की भाषा सेट सिद्धांत पर आधारित है और किसी को तत्वों की गणना करने की आवश्यकता के बिना अलग-अलग विकल्पों के अनुरूप सेट के मैपिंग के साथ काम करने की अनुमति देता है। यह भाषा बहुत सामान्य है और संभावित रूप से किसी भी विकल्प का वर्णन करने की अनुमति देती है। हालांकि, सामान्यीकृत पसंद कार्यों का गणितीय उपकरण वर्तमान में केवल उन समस्याओं पर विकसित और परीक्षण किया जा रहा है जो पहले से ही मानदंड या द्विआधारी दृष्टिकोण का उपयोग करके हल किए जा चुके हैं।

समूह पसंद

सामूहिक निर्णय लेने में भाग लेने का अधिकार रखने वाले लोगों का एक समूह होने दें। मान लीजिए कि यह समूह विकल्पों के कुछ सेट पर विचार कर रहा है, और समूह का प्रत्येक सदस्य अपनी पसंद बनाता है। कार्य एक समाधान विकसित करना है जो एक निश्चित तरीके से व्यक्तिगत विकल्पों का समन्वय करता है और कुछ अर्थों में समूह की "सामान्य राय" व्यक्त करता है, अर्थात। एक समूह पसंद के रूप में लिया।

स्वाभाविक रूप से, अलग-अलग समूह निर्णय व्यक्तिगत निर्णयों के समन्वय के लिए विभिन्न सिद्धांतों के अनुरूप होंगे।

समूह पसंद में व्यक्तिगत निर्णयों के समन्वय के नियमों को मतदान नियम कहा जाता है। सबसे आम "बहुमत का नियम" है, जिसमें समूह निर्णय उस विकल्प द्वारा लिया जाता है जो सबसे अधिक वोट प्राप्त करता है।

यह समझा जाना चाहिए कि इस तरह का निर्णय केवल समूह में विभिन्न दृष्टिकोणों की व्यापकता को दर्शाता है, न कि वास्तव में इष्टतम विकल्प, जिसके लिए कोई भी मतदान नहीं कर सकता है। "सच्चाई मतदान से निर्धारित नहीं होती है।"

इसके अलावा, तथाकथित "मतदान विरोधाभास" भी हैं, जिनमें से सबसे प्रसिद्ध एरो का विरोधाभास है।

ये विरोधाभास मतदान प्रक्रिया की बहुत अप्रिय विशेषताओं का नेतृत्व कर सकते हैं, और कभी-कभी नेतृत्व करते हैं: उदाहरण के लिए, ऐसे मामले होते हैं जब समूह एक भी निर्णय नहीं ले सकता है (कोई कोरम नहीं है या हर कोई अपने स्वयं के अनूठे विकल्प के लिए वोट देता है, आदि) .), और कभी-कभी (मल्टीस्टेज वोटिंग में) अल्पसंख्यक बहुमत पर अपनी इच्छा थोप सकता है।

अनिश्चितता के तहत चुनाव

निश्चितता अनिश्चितता का एक विशेष मामला है, अर्थात्: यह शून्य के करीब की अनिश्चितता है।

आधुनिक विकल्प सिद्धांत में, यह माना जाता है कि निर्णय लेने की समस्याओं में अनिश्चितता के तीन मुख्य प्रकार हैं:

  1. निर्णय लेने के लिए प्रारंभिक डेटा की सूचनात्मक (सांख्यिकीय) अनिश्चितता।
  2. निर्णय लेने (पसंद) के परिणामों की अनिश्चितता।
  3. निर्णय लेने की प्रक्रिया के घटकों के विवरण में अस्पष्टता।

आइए उन पर क्रम से विचार करें।

प्रारंभिक डेटा में सूचनात्मक (सांख्यिकीय) अनिश्चितता

विषय क्षेत्र के बारे में प्राप्त आंकड़ों को बिल्कुल सटीक नहीं माना जा सकता है। इसके अलावा, यह स्पष्ट है कि ये डेटा हमारे लिए रुचिकर नहीं हैं, बल्कि केवल संकेतों के रूप में हैं, जो शायद इस बारे में कुछ जानकारी रखते हैं कि हम वास्तव में क्या रुचि रखते हैं। इस प्रकार, यह विचार करना अधिक यथार्थवादी है कि हम ऐसे डेटा से निपट रहे हैं जो न केवल शोर और गलत है, बल्कि अप्रत्यक्ष और संभवतः अपूर्ण भी है। इसके अलावा, ये डेटा अध्ययन के तहत पूरी (सामान्य) आबादी से संबंधित नहीं हैं, बल्कि इसका केवल एक निश्चित उपसमुच्चय है, जिसके बारे में हम वास्तव में डेटा एकत्र करने में सक्षम थे, लेकिन साथ ही हम पूरी आबादी के बारे में निष्कर्ष निकालना चाहते हैं, और हम इन निष्कर्षों की विश्वसनीयता की डिग्री भी जानना चाहते हैं।

इन शर्तों के तहत, सांख्यिकीय निर्णयों के सिद्धांत का उपयोग किया जाता है।

इस सिद्धांत में अनिश्चितता के दो मुख्य स्रोत हैं। सबसे पहले, यह ज्ञात नहीं है कि मूल डेटा किस वितरण का पालन करता है। दूसरे, यह ज्ञात नहीं है कि किस वितरण में सेट (सामान्य जनसंख्या) है जिसके बारे में हम इसके सबसेट से निष्कर्ष निकालना चाहते हैं जो प्रारंभिक डेटा बनाता है।

सांख्यिकीय प्रक्रियाएँ निर्णय लेने की प्रक्रियाएँ हैं जो इन दोनों प्रकार की अनिश्चितताओं को दूर करती हैं।

यह ध्यान दिया जाना चाहिए कि ऐसे कई कारण हैं जो सांख्यिकीय विधियों के गलत अनुप्रयोग की ओर ले जाते हैं:

  • सांख्यिकीय निष्कर्ष, किसी भी अन्य की तरह, हमेशा कुछ निश्चित विश्वसनीयता या निश्चितता रखते हैं। लेकिन, कई अन्य मामलों के विपरीत, सांख्यिकीय शोध के दौरान सांख्यिकीय निष्कर्षों की विश्वसनीयता ज्ञात और निर्धारित की जाती है;
  • सांख्यिकीय प्रक्रिया को लागू करने के परिणामस्वरूप प्राप्त समाधान की गुणवत्ता प्रारंभिक डेटा की गुणवत्ता पर निर्भर करती है;
  • डेटा जो सांख्यिकीय प्रकृति का नहीं है, उसे सांख्यिकीय प्रसंस्करण के अधीन नहीं किया जाना चाहिए;
  • अध्ययन के तहत जनसंख्या के बारे में प्राथमिक जानकारी के स्तर के अनुरूप सांख्यिकीय प्रक्रियाओं का उपयोग करना आवश्यक है (उदाहरण के लिए, आपको गैर-गाऊसी डेटा के विचरण के विश्लेषण के तरीकों को लागू नहीं करना चाहिए)। यदि मूल डेटा का वितरण अज्ञात है, तो उसे या तो इसे स्थापित करना होगा, या कई अलग-अलग तरीकों का उपयोग करना होगा और परिणामों की तुलना करनी होगी। यदि वे बहुत भिन्न हैं, तो यह उपयोग की जाने वाली कुछ प्रक्रियाओं की अनुपयुक्तता को इंगित करता है।

परिणामों की अनिश्चितता

जब एक या दूसरे विकल्प को चुनने के परिणाम विकल्प द्वारा ही विशिष्ट रूप से निर्धारित किए जाते हैं, तो हम एक विकल्प और उसके परिणामों के बीच अंतर नहीं कर सकते हैं, यह मानते हुए कि एक विकल्प चुनने पर, हम वास्तव में उसके परिणामों का चयन करते हैं।

हालांकि, वास्तविक व्यवहार में, किसी को अक्सर अधिक जटिल स्थिति से निपटना पड़ता है, जब एक या दूसरे विकल्प का चुनाव अस्पष्ट रूप से किए गए विकल्प के परिणामों को निर्धारित करता है।

विकल्पों के असतत सेट और उनकी पसंद के परिणामों के मामले में, बशर्ते कि संभावित परिणामों का सेट सभी विकल्पों के लिए सामान्य हो, हम मान सकते हैं कि परिणाम संभावनाओं के वितरण में अलग-अलग विकल्प एक-दूसरे से भिन्न होते हैं। ये संभाव्यता वितरण, सामान्य स्थिति में, विकल्पों की पसंद के परिणामों और वास्तव में इसके परिणामस्वरूप होने वाले परिणामों पर निर्भर हो सकते हैं। सबसे सरल मामले में, परिणाम समान रूप से होने की संभावना है। परिणामों में आमतौर पर लाभ या हानि का अर्थ होता है और इसकी मात्रा निर्धारित होती है।

यदि सभी विकल्पों के परिणाम समान हैं, तो चुनने के लिए कुछ नहीं है। यदि वे भिन्न हैं, तो उनके लिए कुछ मात्रात्मक अनुमानों को प्रस्तुत करके विकल्पों की तुलना की जा सकती है। गेम थ्योरी में विभिन्न प्रकार की समस्याएं विकल्पों की पसंद के परिणामस्वरूप नुकसान और लाभ की संख्यात्मक विशेषताओं के एक अलग विकल्प से जुड़ी हैं, विकल्प चुनने वाले दलों के बीच संघर्ष की विभिन्न डिग्री, आदि।

इस प्रकार की अनिश्चितता को अस्पष्ट अनिश्चितता मानें

कोई भी विकल्प समस्या विकल्पों के सेट का एक लक्ष्य संकुचन है। दोनों विकल्पों का औपचारिक विवरण (उनकी सूची ही, उनकी विशेषताओं या मापदंडों की सूची) और उनकी तुलना के लिए नियमों का विवरण (मानदंड, संबंध) हमेशा एक या दूसरे माप पैमाने के संदर्भ में दिए जाते हैं (भले ही जो क्या यह इस बारे में नहीं जानता)।

यह ज्ञात है कि सभी पैमाने धुंधले हैं, लेकिन अलग-अलग डिग्री के लिए। "धुंधलापन" शब्द तराजू की संपत्ति को संदर्भित करता है, जिसमें इस तथ्य को समाहित किया गया है कि दो विकल्प प्रस्तुत करना हमेशा संभव होता है जो अलग-अलग होते हैं, अर्थात। एक पैमाने में भिन्न और अप्रभेद्य, अर्थात समान हैं, दूसरे में - अधिक धुंधला। एक निश्चित पैमाने में जितने कम ग्रेडेशन होते हैं, उतने ही धुंधले होते हैं।

इस प्रकार, हम विकल्पों को स्पष्ट रूप से देख सकते हैं और साथ ही उन्हें अस्पष्ट रूप से वर्गीकृत कर सकते हैं, अर्थात अस्पष्ट रहें कि वे किस वर्ग से संबंधित हैं।

पहले से ही फजी स्थिति में निर्णय लेने पर अपने पहले काम में, बेलमैन और ज़ादेह ने इस विचार को सामने रखा कि लक्ष्यों और बाधाओं दोनों को विकल्पों के एक सेट पर फ़ज़ी (फ़ज़ी) सेट के रूप में प्रस्तुत किया जाना चाहिए।

अनुकूलन दृष्टिकोण की कुछ सीमाओं पर

उपरोक्त सभी चयन समस्याओं और निर्णय लेने की विधियों में, समस्या दी गई शर्तों के तहत प्रारंभिक सेट में सर्वश्रेष्ठ को खोजने की थी, अर्थात। एक निश्चित अर्थ में इष्टतम विकल्प।

इष्टतमता का विचार साइबरनेटिक्स का केंद्रीय विचार है और तकनीकी प्रणालियों के डिजाइन और संचालन के अभ्यास में मजबूती से प्रवेश कर गया है। साथ ही, इस विचार को सावधानी से व्यवहार करने की आवश्यकता होती है जब हम इसे जटिल, बड़े और कमजोर रूप से निर्धारित प्रणालियों के प्रबंधन के क्षेत्र में स्थानांतरित करने का प्रयास करते हैं, जैसे कि, उदाहरण के लिए, सामाजिक-आर्थिक प्रणाली।

इस निष्कर्ष के अच्छे कारण हैं। आइए उनमें से कुछ पर विचार करें:

  1. इष्टतम समाधान अक्सर अस्थिर हो जाता है, अर्थात। समस्या की स्थितियों में मामूली बदलाव, इनपुट डेटा या बाधाओं से महत्वपूर्ण रूप से भिन्न विकल्पों का चयन हो सकता है।
  2. अनुकूलन मॉडल केवल काफी सरल कार्यों के संकीर्ण वर्गों के लिए विकसित किए जाते हैं जो हमेशा पर्याप्त रूप से और व्यवस्थित रूप से वास्तविक नियंत्रण वस्तुओं को प्रतिबिंबित नहीं करते हैं। अक्सर, अनुकूलन विधियां कुछ बड़े और जटिल प्रणालियों के केवल काफी सरल और अच्छी तरह से वर्णित उप-प्रणालियों को अनुकूलित करना संभव बनाती हैं, अर्थात। केवल स्थानीय अनुकूलन की अनुमति दें। हालाँकि, यदि किसी बड़ी प्रणाली का प्रत्येक उपतंत्र बेहतर तरीके से काम करता है, तो इसका मतलब यह बिल्कुल नहीं है कि समग्र रूप से प्रणाली भी बेहतर तरीके से काम करेगी। इसलिए, एक सबसिस्टम का अनुकूलन आवश्यक रूप से उसके व्यवहार का नेतृत्व नहीं करता है, जो कि सिस्टम को समग्र रूप से अनुकूलित करते समय इसकी आवश्यकता होती है। इसके अलावा, कभी-कभी स्थानीय अनुकूलन पूरे सिस्टम के लिए नकारात्मक परिणाम पैदा कर सकता है। इसलिए, उप-प्रणालियों और समग्र रूप से प्रणाली का अनुकूलन करते समय, लक्ष्यों और उप-लक्ष्यों के वृक्ष और उनकी प्राथमिकता को निर्धारित करना आवश्यक है।
  3. अक्सर, कुछ गणितीय मॉडल के अनुसार अनुकूलन मानदंड को अधिकतम करना अनुकूलन का लक्ष्य माना जाता है, लेकिन वास्तव में लक्ष्य नियंत्रण वस्तु का अनुकूलन करना है। अनुकूलन मानदंड और गणितीय मॉडल हमेशा लक्ष्य से अप्रत्यक्ष रूप से संबंधित होते हैं, अर्थात। अधिक या कम पर्याप्त, लेकिन हमेशा अनुमानित।

इस प्रकार, इष्टतमता का विचार, जो कि पर्याप्त गणितीय औपचारिकता के लिए खुद को उधार देने वाली प्रणालियों के लिए अत्यंत उपयोगी है, को सावधानी के साथ जटिल प्रणालियों में स्थानांतरित किया जाना चाहिए। बेशक, गणितीय मॉडल जिन्हें कभी-कभी ऐसी प्रणालियों के लिए प्रस्तावित किया जा सकता है, को अनुकूलित किया जा सकता है। हालांकि, किसी को हमेशा इन मॉडलों के मजबूत सरलीकरण को ध्यान में रखना चाहिए, जो कि जटिल प्रणालियों के मामले में अब उपेक्षित नहीं किया जा सकता है, साथ ही यह तथ्य भी है कि जटिल प्रणालियों के मामले में इन मॉडलों की पर्याप्तता की डिग्री वास्तव में अज्ञात है। . इसलिए, यह ज्ञात नहीं है कि इस अनुकूलन का विशुद्ध रूप से व्यावहारिक महत्व क्या है। तकनीकी प्रणालियों में अनुकूलन की उच्च व्यावहारिकता को इस भ्रम को जन्म नहीं देना चाहिए कि यह जटिल प्रणालियों के अनुकूलन में उतना ही प्रभावी होगा। जटिल प्रणालियों का सार्थक गणितीय प्रतिरूपण बहुत कठिन, अनुमानित और गलत है। सिस्टम जितना अधिक जटिल होगा, इसके अनुकूलन के विचार के बारे में उतना ही सावधान रहना चाहिए।

इसलिए, जब जटिल, बड़े, कमजोर रूप से निर्धारित प्रणालियों के लिए नियंत्रण विधियों का विकास करते हैं, तो लेखक न केवल औपचारिक गणितीय दृष्टिकोण से चुने गए दृष्टिकोण की इष्टतमता पर विचार करते हैं, बल्कि लक्ष्य के लिए इसकी पर्याप्तता और इसकी प्रकृति को भी ध्यान में रखते हैं। नियंत्रण वस्तु।

विशेषज्ञ चयन के तरीके

जटिल प्रणालियों के अध्ययन में, अक्सर समस्याएं उत्पन्न होती हैं, जो विभिन्न कारणों से, वर्तमान में विकसित गणितीय उपकरण का उपयोग करके सख्ती से हल नहीं की जा सकती हैं। इन मामलों में, विशेषज्ञों (सिस्टम एनालिस्ट) की सेवाओं का सहारा लिया जाता है, जिनके अनुभव और अंतर्ज्ञान से समस्या की जटिलता को कम करने में मदद मिलती है।

हालाँकि, यह ध्यान में रखा जाना चाहिए कि विशेषज्ञ स्वयं अत्यधिक जटिल प्रणालियाँ हैं, और उनकी गतिविधियाँ कई बाहरी और आंतरिक स्थितियों पर भी निर्भर करती हैं। इसलिए, विशेषज्ञ मूल्यांकन के आयोजन के तरीकों में, विशेषज्ञों के काम के लिए अनुकूल बाहरी और मनोवैज्ञानिक परिस्थितियों के निर्माण पर बहुत ध्यान दिया जाता है।

निम्नलिखित कारक एक विशेषज्ञ के काम को प्रभावित करते हैं:

  • परीक्षा के परिणामों के उपयोग के लिए जिम्मेदारी;
  • यह जानना कि अन्य विशेषज्ञ शामिल हैं;
  • विशेषज्ञों के बीच सूचना संपर्क की उपलब्धता;
  • विशेषज्ञों के पारस्परिक संबंध (यदि उनके बीच सूचना संपर्क है);
  • मूल्यांकन के परिणामों में विशेषज्ञ की व्यक्तिगत रुचि;
  • विशेषज्ञों के व्यक्तिगत गुण (आत्मसम्मान, अनुरूपता, इच्छा, आदि)

विशेषज्ञों के बीच बातचीत या तो उनकी गतिविधि को उत्तेजित या बाधित कर सकती है। इसलिए, विभिन्न मामलों में, परीक्षा के विभिन्न तरीकों का उपयोग किया जाता है, जो एक दूसरे के साथ विशेषज्ञों की बातचीत की प्रकृति में भिन्न होते हैं: गुमनाम और खुले सर्वेक्षण और प्रश्नावली, बैठकें, चर्चाएँ, व्यापारिक खेल, विचार-मंथन आदि।

विशेषज्ञ राय के गणितीय प्रसंस्करण के विभिन्न तरीके हैं। विशेषज्ञों को एक या संकेतकों की प्रणाली द्वारा विभिन्न विकल्पों का मूल्यांकन करने के लिए कहा जाता है। इसके अलावा, उन्हें प्रत्येक संकेतक (इसके "वजन" या "योगदान") के महत्व की डिग्री का मूल्यांकन करने के लिए कहा जाता है। समूह के परिणामी राय के लिए उनमें से प्रत्येक के योगदान के अनुरूप विशेषज्ञों को स्वयं भी क्षमता का एक स्तर सौंपा गया है।

विशेषज्ञों के साथ काम करने का एक विकसित तरीका "डेल्फी" तरीका है। इस पद्धति का मुख्य विचार यह है कि आलोचना और तर्क का विशेषज्ञ पर लाभकारी प्रभाव पड़ता है, यदि उसका आत्मसम्मान प्रभावित नहीं होता है और ऐसी स्थितियाँ प्रदान की जाती हैं जो व्यक्तिगत टकराव को बाहर करती हैं।

इस बात पर जोर दिया जाना चाहिए कि विशेषज्ञ प्रणालियों और निर्णय समर्थन में विशेषज्ञ विधियों के उपयोग की प्रकृति में मूलभूत अंतर है। यदि पहले मामले में, निर्णय लेने के तरीकों को औपचारिक रूप देने के लिए विशेषज्ञों की आवश्यकता होती है, तो दूसरे में - केवल निर्णय ही, जैसे।

चूँकि विशेषज्ञ ठीक उन कार्यों के कार्यान्वयन में शामिल हैं जो वर्तमान में या तो स्वचालित प्रणालियों द्वारा प्रदान नहीं किए जाते हैं, या मनुष्यों की तुलना में खराब प्रदर्शन किए जाते हैं, स्वचालित प्रणालियों के विकास में एक आशाजनक दिशा इन कार्यों का अधिकतम स्वचालन है।

स्वचालित निर्णय समर्थन प्रणाली

एक व्यक्ति ने हमेशा निर्णय लेने में सहायकों का उपयोग किया है: वे दोनों केवल नियंत्रण वस्तु के बारे में जानकारी के प्रदाता थे, और सलाहकार (सलाहकार) जो निर्णय के विकल्प प्रदान करते हैं और उनके परिणामों का विश्लेषण करते हैं। निर्णय लेने वाले व्यक्ति ने उन्हें हमेशा एक निश्चित सूचना वातावरण में बनाया: एक सैन्य कमांडर के लिए, यह मुख्यालय है, रेक्टर के लिए, शैक्षणिक परिषद, मंत्री, कॉलेजियम के लिए।

हमारे समय में, पुनरावृत्त निर्णय मूल्यांकन और विशेष रूप से निर्णय समर्थन प्रणाली (DDS - निर्णय समर्थन प्रणाली) के लिए स्वचालित प्रणालियों के बिना निर्णय लेने की सूचना अवसंरचना अकल्पनीय है, अर्थात। स्वचालित प्रणालियाँ जो विशेष रूप से एक व्यक्ति को निर्णय लेने के लिए आवश्यक जानकारी तैयार करने के लिए डिज़ाइन की गई हैं। निर्णय समर्थन प्रणालियों का विकास, विशेष रूप से, लक्सेनबर्ग (ऑस्ट्रिया) में इंटरनेशनल इंस्टीट्यूट फॉर एप्लाइड सिस्टम्स एनालिसिस के तत्वावधान में किए गए एक अंतरराष्ट्रीय परियोजना के ढांचे के भीतर किया जाता है।

वास्तविक स्थितियों में पसंद के लिए कई कार्यों के प्रदर्शन की आवश्यकता होती है, जिनमें से कुछ एक व्यक्ति द्वारा और अन्य मशीन द्वारा अधिक कुशलता से किए जाते हैं। कमियों के एक साथ मुआवजे के साथ उनके लाभों का प्रभावी संयोजन स्वचालित निर्णय समर्थन प्रणालियों में सन्निहित है।

एक व्यक्ति अनिश्चितता की स्थिति में एक मशीन से बेहतर निर्णय लेता है, लेकिन सही निर्णय लेने के लिए उसे विषय क्षेत्र की विशेषता वाली पर्याप्त (पूर्ण और विश्वसनीय) जानकारी की भी आवश्यकता होती है। हालांकि, यह ज्ञात है कि एक व्यक्ति बड़ी मात्रा में "कच्ची" असंसाधित जानकारी के साथ अच्छी तरह से सामना नहीं करता है। इसलिए, निर्णय समर्थन में मशीन की भूमिका नियंत्रण वस्तु और अनियंत्रित कारकों (पर्यावरण) के बारे में जानकारी की प्रारंभिक तैयारी करने के लिए हो सकती है, कुछ निर्णय लेने के परिणामों को देखने में मदद करने के लिए, और यह सब जानकारी एक दृश्य में प्रस्तुत करने के लिए और सुविधाजनक तरीका।निर्णय लेने के लिए फार्म।

इस प्रकार, स्वचालित निर्णय समर्थन प्रणालियाँ किसी व्यक्ति की कमजोरियों की भरपाई करती हैं, उसे सूचना के नियमित प्रारंभिक प्रसंस्करण से मुक्त करती हैं, और उसे एक आरामदायक सूचना वातावरण प्रदान करती हैं जिसमें वह अपनी ताकत बेहतर ढंग से दिखा सकता है। ये प्रणालियाँ निर्णय निर्माता के कार्यों को स्वचालित करने पर केंद्रित नहीं हैं (और, परिणामस्वरूप, इन कार्यों को उनसे अलग करना, और इसलिए किए गए निर्णयों के लिए जिम्मेदारी, जो आमतौर पर अस्वीकार्य है), लेकिन उसे खोजने में सहायता प्रदान करने पर अच्छा समाधान।

मौजूदा पैटर्न पहचान विधियों का अवलोकन

एल.पी. पोपोवा , और के बारे में। Datiev

"पहचानने" की क्षमता को मनुष्य की मुख्य संपत्ति माना जाता है, वास्तव में, अन्य जीवित जीवों की तरह। पैटर्न मान्यता साइबरनेटिक्स का एक खंड है जो वस्तुओं, घटनाओं, प्रक्रियाओं, संकेतों, स्थितियों को वर्गीकृत करने और पहचानने के लिए सिद्धांतों और विधियों को विकसित करता है - वे सभी वस्तुएं जिन्हें कुछ विशेषताओं या गुणों के परिमित सेट द्वारा वर्णित किया जा सकता है जो किसी वस्तु की विशेषता हैं।

एक छवि किसी वस्तु का विवरण है। छवियों की एक विशिष्ट संपत्ति होती है, जो इस तथ्य में प्रकट होती है कि एक ही सेट से घटनाओं की एक सीमित संख्या के साथ परिचित होने से इसके प्रतिनिधियों की एक बड़ी संख्या को मनमाने ढंग से पहचानना संभव हो जाता है।

पैटर्न मान्यता के सिद्धांत में दो मुख्य दिशाएँ हैं:

    मनुष्य और अन्य जीवित जीवों के पास मान्यता की शक्तियों का अध्ययन;

    कुछ अनुप्रयोग क्षेत्रों में पैटर्न मान्यता की व्यक्तिगत समस्याओं को हल करने के लिए डिज़ाइन किए गए उपकरणों के निर्माण के लिए सिद्धांत और विधियों का विकास।

इसके अलावा, लेख दूसरी दिशा के विकास से संबंधित पैटर्न मान्यता प्रणालियों को लागू करने की समस्याओं, सिद्धांतों और विधियों का वर्णन करता है। लेख का दूसरा भाग पैटर्न मान्यता के तंत्रिका नेटवर्क विधियों पर चर्चा करता है, जिसे पैटर्न मान्यता सिद्धांत की पहली दिशा के लिए जिम्मेदार ठहराया जा सकता है।

छवि पहचान प्रणाली के निर्माण की समस्याएं

स्वचालित पैटर्न पहचान प्रणालियों के निर्माण में उत्पन्न होने वाले कार्यों को आमतौर पर कई मुख्य क्षेत्रों में वर्गीकृत किया जा सकता है। उनमें से पहला वस्तु को पहचानने के लिए माप के परिणामों के रूप में प्राप्त प्रारंभिक डेटा की प्रस्तुति से संबंधित है संवेदनशीलता की समस्या. प्रत्येक मापा मूल्य एक छवि या वस्तु की कुछ "विशेषता" है। उदाहरण के लिए, मान लीजिए कि छवियां अल्फ़ान्यूमेरिक वर्ण हैं। इस मामले में, एक मापने वाला रेटिना, जैसा कि चित्र 1 (ए) में दिखाया गया है, का सफलतापूर्वक उपयोग किया जा सकता है। संवेदक में यदि रेटिना में एन-तत्व होते हैं, तो माप परिणाम माप वेक्टर या छवि वेक्टर के रूप में प्रदर्शित किए जा सकते हैं ,

जहां प्रत्येक तत्व xi लेता है, उदाहरण के लिए, मान 1 यदि प्रतीक की छवि रेटिना के i-वें सेल से गुजरती है, और मान 0 अन्यथा।

चित्र पर विचार करें। 2 (बी)। इस मामले में, छवियां चर टी के निरंतर कार्य (ध्वनि संकेतों के प्रकार) हैं। यदि फ़ंक्शन मानों को असतत बिंदुओं t1,t2, ..., tn पर मापा जाता है, तो छवि वेक्टर x1= f(t1),x2=f(t2),... , xn = लेकर बनाया जा सकता है च (तमिलनाडु)।

चित्र 1. रेटिना को मापना

पैटर्न की पहचान की दूसरी समस्या प्राप्त प्रारंभिक डेटा से विशिष्ट विशेषताओं या गुणों के चयन और पैटर्न वैक्टर के आयाम में कमी से संबंधित है। इस समस्या को अक्सर एक समस्या के रूप में परिभाषित किया जाता है प्रीप्रोसेसिंग और फीचर चयन.

छवियों के एक वर्ग की विशेषताएं विशिष्ट गुण हैं जो किसी दिए गए वर्ग की सभी छवियों के लिए सामान्य हैं। अलग-अलग वर्गों के बीच अंतर को चिह्नित करने वाली विशेषताएं इंटरक्लास सुविधाओं के रूप में व्याख्या की जा सकती हैं। इंट्राक्लास विशेषताएँ जो विचाराधीन सभी वर्गों के लिए सामान्य हैं, मान्यता के दृष्टिकोण से उपयोगी जानकारी नहीं रखती हैं और इन्हें ध्यान में नहीं रखा जा सकता है। पहचान प्रणाली के निर्माण से जुड़े महत्वपूर्ण कार्यों में से एक सुविधाओं का चुनाव माना जाता है। यदि माप के परिणाम सभी वर्गों के लिए विशिष्ट विशेषताओं का एक पूरा सेट प्राप्त करना संभव बनाते हैं, तो पैटर्न की वास्तविक पहचान और वर्गीकरण से कोई विशेष कठिनाई नहीं होगी। स्वत: पहचान तब एक साधारण मिलान प्रक्रिया या टेबल लुकअप जैसी प्रक्रियाओं तक सीमित हो जाएगी। अधिकांश व्यावहारिक मान्यता समस्याओं में, हालांकि, विशिष्ट विशेषताओं का एक पूरा सेट निर्धारित करना असंभव नहीं तो अत्यंत कठिन है। मूल डेटा से, आमतौर पर कुछ विशिष्ट विशेषताओं को निकालना और स्वचालित पैटर्न पहचान की प्रक्रिया को सरल बनाने के लिए उनका उपयोग करना संभव है। विशेष रूप से, सूचना के नुकसान को कम करने वाले परिवर्तनों का उपयोग करके माप वैक्टर के आयाम को कम किया जा सकता है।

पैटर्न रिकग्निशन सिस्टम के निर्माण से जुड़ी तीसरी समस्या पहचान और वर्गीकरण के लिए आवश्यक इष्टतम निर्णय प्रक्रिया का पता लगाना है। पहचाने जाने वाले पैटर्न के बारे में एकत्र किए गए डेटा को पैटर्न स्पेस में बिंदुओं या माप वैक्टर द्वारा दर्शाया गया है, मशीन को यह पता लगाने दें कि यह डेटा किस वर्ग के पैटर्न से मेल खाता है। बता दें कि मशीन को W1, w2, ... ..., wm द्वारा दर्शाए गए M वर्गों के बीच अंतर करने के लिए डिज़ाइन किया गया है। इस मामले में, छवि स्थान को एम क्षेत्रों से युक्त माना जा सकता है, जिनमें से प्रत्येक में एक ही वर्ग की छवियों के अनुरूप बिंदु होते हैं। इस मामले में, मान्यता समस्या को पंजीकृत माप वैक्टर के आधार पर एम वर्गों को अलग करने वाले निर्णय क्षेत्रों की सीमाओं के निर्माण के रूप में माना जा सकता है। इन सीमाओं को परिभाषित करने दें, उदाहरण के लिए, निर्णय कार्यों d1(х),d2(x),..., dm(х) द्वारा। ये कार्य, जिन्हें विभेदक कार्य भी कहा जाता है, x की छवि के अदिश और एकल-मूल्यवान कार्य हैं। यदि di (x) > dj (x), तो x का प्रतिबिम्ब वर्ग w1 का है। दूसरे शब्दों में, यदि i-th डिसीजन फंक्शन di(x) का मूल्य सबसे अधिक है, तो निर्णय लेने की प्रक्रिया के कार्यान्वयन के आधार पर ऐसी स्वचालित वर्गीकरण योजना का एक सार्थक उदाहरण अंजीर में दिखाया गया है। 2 ("जीआर" योजना पर - निर्णायक कार्यों का जनरेटर)।

चित्रा 2. स्वचालित वर्गीकरण की योजना।

निर्णय कार्यों को कई तरीकों से प्राप्त किया जा सकता है। उन मामलों में जहां पहचाने जाने वाले पैटर्न के बारे में पूरी प्राथमिक जानकारी उपलब्ध है, निर्णय कार्यों को इस जानकारी के आधार पर सटीक रूप से निर्धारित किया जा सकता है। यदि पैटर्न के बारे में केवल गुणात्मक जानकारी उपलब्ध है, तो निर्णय कार्यों के स्वरूप के बारे में उचित अनुमान लगाया जा सकता है। बाद के मामले में, निर्णय क्षेत्रों की सीमाएं सही से महत्वपूर्ण रूप से विचलित हो सकती हैं, और इसलिए क्रमिक समायोजन की एक श्रृंखला के माध्यम से एक संतोषजनक परिणाम पर पहुंचने में सक्षम प्रणाली बनाना आवश्यक है।

वस्तुओं (छवियों) को स्वचालित पैटर्न पहचान प्रणाली का उपयोग करके पहचाना और वर्गीकृत किया जाना चाहिए, इसमें मापने योग्य विशेषताओं का एक सेट होना चाहिए। जब छवियों के एक पूरे समूह के लिए संबंधित मापों के परिणाम समान होते हैं, तो यह माना जाता है कि ये वस्तुएं एक ही वर्ग की हैं। पैटर्न पहचान प्रणाली का उद्देश्य, एकत्रित जानकारी के आधार पर, पहचानने योग्य वस्तुओं के लिए मापी गई विशेषताओं के समान वस्तुओं का एक वर्ग निर्धारित करना है। मान्यता की शुद्धता मापी गई विशेषताओं में निहित विशिष्ट जानकारी की मात्रा और इस जानकारी का उपयोग करने की दक्षता पर निर्भर करती है।

      पैटर्न पहचान प्रणाली को लागू करने के लिए बुनियादी तरीके

पैटर्न की पहचान वास्तविक या आदर्श दुनिया की वस्तुओं के संख्यात्मक या प्रतीकात्मक प्रतिनिधित्व पर औपचारिक संचालन को बनाने और लागू करने का कार्य है, जिसके परिणाम इन वस्तुओं के बीच समानता संबंधों को दर्शाते हैं। तुल्यता संबंध मूल्यांकित वस्तुओं के संबंध को कुछ वर्गों से संबंधित व्यक्त करते हैं, जिन्हें स्वतंत्र सिमेंटिक इकाइयां माना जाता है।

मान्यता एल्गोरिदम का निर्माण करते समय, समतुल्यता वर्ग एक शोधकर्ता द्वारा निर्धारित किया जा सकता है जो अपने स्वयं के सार्थक विचारों का उपयोग करता है या समस्या के समाधान के संदर्भ में समानता और वस्तुओं के अंतर के बारे में बाहरी अतिरिक्त जानकारी का उपयोग करता है। तब कोई "गुरु के साथ विवेकपूर्ण" होने की बात करता है। अन्यथा, अर्थात् जब एक स्वचालित प्रणाली बाहरी प्रशिक्षण जानकारी को शामिल किए बिना एक वर्गीकरण समस्या को हल करती है, तो कोई स्वत: वर्गीकरण या "अप्रबंधित मान्यता" की बात करता है। अधिकांश पैटर्न पहचान एल्गोरिदम को बहुत महत्वपूर्ण कंप्यूटिंग शक्ति की आवश्यकता होती है, जो केवल उच्च-प्रदर्शन कंप्यूटर प्रौद्योगिकी द्वारा प्रदान की जा सकती है।

विभिन्न लेखक (यू.एल. बरबाश, वी.आई. वसीलीव, ए.एल. गोरेलिक, वी.ए. स्क्रीपकिन, आर. डूडा, पी. हार्ट, एल.टी. कुज़िन, एफ.आई. पेरेगुडोव, एफ.पी. तारासेंको, टेम्निकोव एफ.ई., अफोनिन वी.ए., दिमित्रिज वी.आई., जे. तू, आर. गोंजालेज, पी. विंस्टन, के. फू, वाई.जेड. त्सिपकिन और अन्य) पद्धति पैटर्न पहचान की एक अलग टाइपोलॉजी देते हैं। कुछ लेखक पैरामीट्रिक, गैर-पैरामीट्रिक और अनुमानी विधियों के बीच अंतर करते हैं, जबकि अन्य इस क्षेत्र में ऐतिहासिक विद्यालयों और प्रवृत्तियों के आधार पर विधियों के समूहों को अलग करते हैं।

साथ ही, प्रसिद्ध टाइपोलॉजी एक बहुत ही महत्वपूर्ण विशेषता को ध्यान में नहीं रखती है, जो किसी औपचारिक पैटर्न पहचान एल्गोरिदम का उपयोग करके विषय क्षेत्र के बारे में ज्ञान का प्रतिनिधित्व करने के तरीके की विशिष्टता को दर्शाती है। डीए पोस्पेलोव ज्ञान का प्रतिनिधित्व करने के दो मुख्य तरीकों की पहचान करता है:

    गहन प्रतिनिधित्व - विशेषताओं (विशेषताओं) के बीच संबंधों के आरेख के रूप में।

    विस्तृत प्रतिनिधित्व - विशिष्ट तथ्यों (वस्तुओं, उदाहरणों) की सहायता से।

यह ध्यान दिया जाना चाहिए कि मान्यता विधियों के इन दो समूहों का अस्तित्व: जो सुविधाओं के साथ काम कर रहे हैं और जो वस्तुओं के साथ काम कर रहे हैं, वे बहुत ही स्वाभाविक हैं। इस दृष्टिकोण से, इनमें से कोई भी विधि, दूसरे से अलग से ली गई, विषय क्षेत्र का पर्याप्त प्रतिबिंब बनाना संभव नहीं बनाती है। इन विधियों के बीच एन। बोह्र के अर्थ में पूरकता का संबंध है, इसलिए, होनहार मान्यता प्रणालियों को इन दोनों विधियों के कार्यान्वयन को प्रदान करना चाहिए, न कि उनमें से किसी एक को।

इस प्रकार, डीए पोस्पेलोव द्वारा प्रस्तावित मान्यता विधियों का वर्गीकरण उन मौलिक कानूनों पर आधारित है जो सामान्य रूप से अनुभूति के मानवीय तरीके को रेखांकित करते हैं, जो इसे अन्य वर्गीकरणों की तुलना में एक बहुत ही विशेष (विशेषाधिकार प्राप्त) स्थिति में रखता है, जो इस पृष्ठभूमि के खिलाफ दिखता है। अधिक हल्का और कृत्रिम।

गहन तरीके

आकस्मिक तरीकों की एक विशिष्ट विशेषता यह है कि वे पैटर्न पहचान एल्गोरिदम के निर्माण और अनुप्रयोग में संचालन के तत्वों के रूप में सुविधाओं और उनके संबंधों की विभिन्न विशेषताओं का उपयोग करते हैं। ऐसे तत्व अलग-अलग मान या फ़ीचर वैल्यू के अंतराल, औसत मान और विचरण, फ़ीचर रिलेशनशिप मेट्रिसेस आदि हो सकते हैं, जिन पर क्रियाएँ की जाती हैं, जिन्हें विश्लेषणात्मक या रचनात्मक रूप में व्यक्त किया जाता है। इसी समय, इन विधियों में वस्तुओं को अभिन्न सूचना इकाइयों के रूप में नहीं माना जाता है, लेकिन उनकी विशेषताओं की बातचीत और व्यवहार का आकलन करने के लिए संकेतक के रूप में कार्य करता है।

आकस्मिक पैटर्न मान्यता विधियों का समूह व्यापक है, और उपवर्गों में इसका विभाजन कुछ हद तक मनमाना है:

- सुविधा मूल्यों के वितरण घनत्व के अनुमान के आधार पर तरीके

- निर्णय कार्यों के वर्ग के बारे में धारणाओं पर आधारित तरीके

- तार्किक तरीके

- भाषाई (संरचनात्मक) तरीके।

फीचर वैल्यू के वितरण घनत्व के अनुमान के आधार पर तरीके।इन पैटर्न मान्यता विधियों को सांख्यिकीय निर्णयों के शास्त्रीय सिद्धांत से उधार लिया गया है, जिसमें अध्ययन की वस्तुओं को कुछ कानून के अनुसार फीचर स्पेस में वितरित बहुआयामी यादृच्छिक चर की प्राप्ति के रूप में माना जाता है। वे एक बायेसियन निर्णय लेने की योजना पर आधारित हैं जो एक विशेष पहचानने योग्य वर्ग और फीचर वेक्टर मूल्यों के सशर्त वितरण घनत्व से संबंधित वस्तुओं की प्राथमिक संभावनाओं के लिए अपील करता है। बहुआयामी सुविधा स्थान के विभिन्न क्षेत्रों में संभावना अनुपात निर्धारित करने के लिए इन विधियों को कम किया जाता है।

सुविधा मूल्यों के वितरण घनत्व के आकलन के आधार पर तरीकों का समूह सीधे भेदभावपूर्ण विश्लेषण के तरीकों से संबंधित है। निर्णय लेने के लिए बायेसियन दृष्टिकोण आधुनिक आँकड़ों में सबसे विकसित तथाकथित पैरामीट्रिक विधियों में से एक है, जिसके लिए वितरण कानून (इस मामले में, सामान्य कानून) की विश्लेषणात्मक अभिव्यक्ति को जाना जाता है, और केवल एक मापदंडों की छोटी संख्या (मतलब वैक्टर और सहप्रसरण मैट्रिसेस) का अनुमान लगाने की आवश्यकता है।

इस समूह में स्वतंत्र विशेषताओं के लिए संभावना अनुपात की गणना करने की विधि भी शामिल है। यह विधि, सुविधाओं की स्वतंत्रता की धारणा के अपवाद के साथ (जो वास्तव में लगभग कभी पूरी नहीं होती है), वितरण कानून के कार्यात्मक रूप के ज्ञान की आवश्यकता नहीं होती है। इसे गैर-पैरामीट्रिक विधियों के लिए जिम्मेदार ठहराया जा सकता है।

वितरण घनत्व वक्र का आकार अज्ञात होने पर और इसकी प्रकृति के बारे में बिल्कुल भी धारणा नहीं बनाई जा सकती है, तब उपयोग किए जाने वाले अन्य गैर-पैरामीट्रिक तरीके एक विशेष स्थान पर कब्जा कर लेते हैं। इनमें बहुआयामी हिस्टोग्राम की प्रसिद्ध विधि, "के-निकटतम पड़ोसी" विधि, यूक्लिडियन दूरी विधि, संभावित कार्यों की विधि आदि शामिल हैं, जिसका सामान्यीकरण "पारजेन अनुमान" नामक विधि है। ये विधियाँ औपचारिक रूप से वस्तुओं के साथ अभिन्न संरचनाओं के रूप में काम करती हैं, लेकिन मान्यता कार्य के प्रकार के आधार पर, वे गहन और विस्तारित हाइपोस्टेसिस दोनों में कार्य कर सकती हैं।

गैर-पैरामीट्रिक विधियाँ दिए गए बहुआयामी संस्करणों में गिरने वाली वस्तुओं की सापेक्ष संख्या का विश्लेषण करती हैं और प्रशिक्षण नमूने की वस्तुओं और मान्यता प्राप्त वस्तुओं के बीच विभिन्न दूरी के कार्यों का उपयोग करती हैं। मात्रात्मक विशेषताओं के लिए, जब उनकी संख्या नमूना आकार से बहुत कम होती है, तो वस्तुओं के साथ संचालन सशर्त संभावनाओं के स्थानीय वितरण घनत्व का अनुमान लगाने में एक मध्यवर्ती भूमिका निभाते हैं, और वस्तुएं स्वतंत्र सूचना इकाइयों का शब्दार्थ भार नहीं उठाती हैं। उसी समय, जब सुविधाओं की संख्या अध्ययन के तहत वस्तुओं की संख्या के अनुरूप या अधिक होती है, और विशेषताएं गुणात्मक या द्विभाजित प्रकृति की होती हैं, तो संभाव्यता वितरण घनत्व के किसी भी स्थानीय अनुमान की कोई बात नहीं हो सकती है। इस मामले में, इन गैर-पैरामीट्रिक विधियों में वस्तुओं को स्वतंत्र सूचना इकाइयों (समग्र अनुभवजन्य तथ्यों) के रूप में माना जाता है और ये विधियां अध्ययन के तहत वस्तुओं की समानता और अंतर के आकलन का अर्थ प्राप्त करती हैं।

इस प्रकार, समस्या की स्थितियों के आधार पर, गैर-पैरामीट्रिक विधियों के समान तकनीकी संचालन, सुविधा मूल्यों की संभाव्यता वितरण घनत्व के स्थानीय अनुमान, या समानता और वस्तुओं के अंतर का अनुमान लगाते हैं।

ज्ञान के आकस्मिक प्रतिनिधित्व के संदर्भ में, संभाव्यता वितरण घनत्व के अनुमान के रूप में, गैर-पैरामीट्रिक विधियों का पहला पक्ष यहां माना जाता है। कई लेखक ध्यान देते हैं कि पारजेन अनुमान जैसे गैर पैरामीट्रिक तरीके व्यवहार में अच्छी तरह से काम करते हैं। इन तरीकों को लागू करने में मुख्य कठिनाइयाँ स्थानीय संभाव्यता वितरण घनत्व और प्रशिक्षण नमूने की गैर-प्रतिनिधित्व के प्रति उच्च संवेदनशीलता के अनुमानों की गणना करने के लिए संपूर्ण प्रशिक्षण नमूने को याद रखने की आवश्यकता है।

निर्णय कार्यों के वर्ग के बारे में मान्यताओं पर आधारित तरीके।विधियों के इस समूह में, निर्णय फलन का सामान्य रूप ज्ञात माना जाता है और इसकी गुणवत्ता कार्यात्मक दी जाती है। इस कार्यात्मक के आधार पर, प्रशिक्षण अनुक्रम के लिए निर्णय समारोह का सर्वोत्तम सन्निकटन मांगा जाता है। सबसे आम रैखिक और सामान्यीकृत गैर-रैखिक बहुपदों के रूप में निर्णय कार्यों का प्रतिनिधित्व है। निर्णय नियम की गुणवत्ता कार्यात्मक आमतौर पर वर्गीकरण त्रुटि से जुड़ी होती है।

निर्णय कार्यों के वर्ग के बारे में मान्यताओं के आधार पर विधियों का मुख्य लाभ एक चरम खोजने की समस्या के रूप में मान्यता समस्या के गणितीय सूत्रीकरण की स्पष्टता है। इस समस्या का समाधान अक्सर किसी प्रकार के ग्रेडिएंट एल्गोरिदम का उपयोग करके प्राप्त किया जाता है। इस समूह के तरीकों की विविधता को उपयोग किए गए निर्णय नियम गुणवत्ता कार्यों और चरम खोज एल्गोरिदम की विस्तृत श्रृंखला द्वारा समझाया गया है। सुविचारित एल्गोरिदम का एक सामान्यीकरण, जिसमें विशेष रूप से, न्यूटन का एल्गोरिथ्म, परसेप्ट्रॉन-प्रकार के एल्गोरिदम आदि शामिल हैं, स्टोकेस्टिक सन्निकटन की विधि है। पैरामीट्रिक मान्यता विधियों के विपरीत, तरीकों के इस समूह की सफलता अनुभवजन्य वास्तविकता के साथ फीचर स्पेस में वस्तुओं के वितरण के नियमों के बारे में सैद्धांतिक विचारों के बेमेल पर निर्भर नहीं करती है। सभी ऑपरेशन एक मुख्य लक्ष्य के अधीन हैं - निर्णय नियम के कार्यात्मक गुणवत्ता की चरम सीमा का पता लगाना। इसी समय, पैरामीट्रिक और विचारित विधियों के परिणाम समान हो सकते हैं। जैसा कि ऊपर दिखाया गया है, समान सहप्रसरण मैट्रिसेस के साथ विभिन्न वर्गों में वस्तुओं के सामान्य वितरण के मामले के लिए पैरामीट्रिक तरीके रैखिक निर्णय कार्यों की ओर ले जाते हैं। हम यह भी ध्यान देते हैं कि रैखिक डायग्नोस्टिक मॉडल में सूचनात्मक सुविधाओं का चयन करने के लिए एल्गोरिदम को एक चरम सीमा की खोज के लिए ग्रेडियेंट एल्गोरिदम के विशेष रूपों के रूप में व्याख्या किया जा सकता है।

विशेष रूप से रैखिक निर्णय नियमों के समूह में एक चरम सीमा खोजने के लिए ग्रेडिएंट एल्गोरिदम की संभावनाओं का अच्छी तरह से अध्ययन किया गया है। इन एल्गोरिदम का अभिसरण केवल उस स्थिति के लिए सिद्ध किया गया है जब कॉम्पैक्ट ज्यामितीय संरचनाओं द्वारा फीचर स्पेस में वस्तुओं के पहचानने योग्य वर्गों को प्रदर्शित किया जाता है। हालांकि, निर्णय नियम की पर्याप्त गुणवत्ता प्राप्त करने की इच्छा अक्सर एल्गोरिदम की सहायता से संतुष्ट हो सकती है, जिनके पास वैश्विक चरम पर समाधान के अभिसरण का कठोर गणितीय प्रमाण नहीं है।

इस तरह के एल्गोरिदम में विकासवादी मॉडलिंग की दिशा का प्रतिनिधित्व करने वाली अनुमानी प्रोग्रामिंग प्रक्रियाओं का एक बड़ा समूह शामिल है। विकासवादी मॉडलिंग प्रकृति से उधार ली गई एक बायोनिक पद्धति है। यह विकास के ज्ञात तंत्रों के उपयोग पर आधारित है ताकि किसी जटिल वस्तु के अर्थपूर्ण मॉडलिंग की प्रक्रिया को उसके विकास के फेनोमेनोलॉजिकल मॉडलिंग के साथ बदल दिया जा सके।

पैटर्न मान्यता में विकासवादी मॉडलिंग का एक प्रसिद्ध प्रतिनिधि तर्कों के समूह लेखांकन (एमजीयूए) की विधि है। GMDH स्व-संगठन के सिद्धांत पर आधारित है, और GMDH एल्गोरिदम बड़े पैमाने पर चयन की योजना को पुन: पेश करता है। GMDH एल्गोरिदम में, एक सामान्यीकृत बहुपद के सदस्यों को एक विशेष तरीके से संश्लेषित और चुना जाता है, जिसे अक्सर कोलमोगोरोव-गैबोर बहुपद कहा जाता है। यह संश्लेषण और चयन बढ़ती जटिलता के साथ किया जाता है, और पहले से भविष्यवाणी करना असंभव है कि सामान्यीकृत बहुपद का अंतिम रूप क्या होगा। सबसे पहले, प्रारंभिक विशेषताओं के सरल जोड़ीदार संयोजनों पर आमतौर पर विचार किया जाता है, जिसमें से निर्णायक कार्यों के समीकरणों की रचना की जाती है, एक नियम के रूप में, दूसरे क्रम से अधिक नहीं। प्रत्येक समीकरण का एक स्वतंत्र निर्णय समारोह के रूप में विश्लेषण किया जाता है, और रचित समीकरणों के मापदंडों के मान एक तरह से या किसी अन्य प्रशिक्षण नमूने से पाए जाते हैं। फिर, निर्णय कार्यों के परिणामी सेट से, कुछ अर्थों में सर्वश्रेष्ठ का एक हिस्सा चुना जाता है। व्यक्तिगत निर्णय कार्यों की गुणवत्ता को नियंत्रण (परीक्षण) नमूने पर जांचा जाता है, जिसे कभी-कभी बाहरी जोड़ का सिद्धांत कहा जाता है। चयनित आंशिक निर्णय कार्यों को मध्यवर्ती चर के रूप में नीचे माना जाता है जो नए निर्णय कार्यों आदि के समान संश्लेषण के लिए प्रारंभिक तर्क के रूप में कार्य करते हैं। इस तरह के एक पदानुक्रमित संश्लेषण की प्रक्रिया तब तक जारी रहती है जब तक कि निर्णय समारोह गुणवत्ता मानदंड के चरम पर नहीं पहुंच जाता, जो व्यवहार में मूल सुविधाओं के संबंध में बहुपद के सदस्यों के क्रम को और बढ़ाने की कोशिश करते समय इस गुणवत्ता की गिरावट में खुद को प्रकट करता है।

जीएमडीएच में अंतर्निहित स्व-संगठन सिद्धांत को हेयुरिस्टिक स्व-संगठन कहा जाता है, क्योंकि पूरी प्रक्रिया ह्यूरिस्टिक रूप से चुने गए बाहरी परिवर्धन की शुरूआत पर आधारित है। निर्णय का परिणाम काफी हद तक इन अनुमानों पर निर्भर कर सकता है। परिणामी डायग्नोस्टिक मॉडल इस बात पर निर्भर करता है कि वस्तुओं को प्रशिक्षण और परीक्षण नमूनों में कैसे विभाजित किया जाता है, मान्यता गुणवत्ता मानदंड कैसे निर्धारित किया जाता है, अगली चयन पंक्ति में कितने चर छोड़े जाते हैं, आदि।

GMDH एल्गोरिदम की ये विशेषताएं विकासवादी मॉडलिंग के अन्य दृष्टिकोणों की भी विशेषता हैं। लेकिन हम यहां विचाराधीन विधियों के एक और पहलू पर ध्यान देते हैं। यह उनका सामग्री सार है। निर्णय कार्यों (विकासवादी और ढाल) के वर्ग के बारे में धारणाओं के आधार पर विधियों का उपयोग करना, उच्च जटिलता के नैदानिक ​​​​मॉडल बनाना और व्यावहारिक रूप से स्वीकार्य परिणाम प्राप्त करना संभव है। साथ ही, इस मामले में व्यावहारिक लक्ष्यों की उपलब्धि पहचानने योग्य वस्तुओं की प्रकृति के बारे में नए ज्ञान के निष्कर्षण के साथ नहीं है। इस ज्ञान को निकालने की संभावना, विशेष रूप से विशेषताओं (विशेषताओं) की बातचीत के तंत्र के बारे में ज्ञान, मौलिक रूप से इस तरह की बातचीत की दी गई संरचना द्वारा सीमित है, जो निर्णायक कार्यों के चुने हुए रूप में तय की गई है। इसलिए, एक विशेष डायग्नोस्टिक मॉडल के निर्माण के बाद जो अधिकतम कहा जा सकता है, वह सुविधाओं के संयोजन और खुद उन विशेषताओं को सूचीबद्ध करना है जो परिणामी मॉडल में शामिल हैं। लेकिन अध्ययन के तहत वस्तुओं के वितरण की प्रकृति और संरचना को प्रतिबिंबित करने वाले संयोजनों का अर्थ अक्सर इस दृष्टिकोण के ढांचे के भीतर अनदेखा रहता है।

बूलियन तरीके. पैटर्न की पहचान के तार्किक तरीके तार्किक बीजगणित के उपकरण पर आधारित हैं और न केवल व्यक्तिगत सुविधाओं में निहित जानकारी के साथ काम करने की अनुमति देते हैं, बल्कि सुविधा मूल्यों के संयोजन में भी। इन विधियों में किसी भी विशेषता के मान को प्रारंभिक घटनाएँ माना जाता है।

सबसे सामान्य रूप में, तार्किक तरीकों को प्रशिक्षण नमूने में तार्किक पैटर्न की एक तरह की खोज और तार्किक निर्णय नियमों की एक निश्चित प्रणाली के गठन के रूप में वर्णित किया जा सकता है (उदाहरण के लिए, प्राथमिक घटनाओं के संयोजन के रूप में), इनमें से प्रत्येक जिसका अपना भार होता है। तार्किक तरीकों का समूह विविध है और इसमें अलग-अलग जटिलता और विश्लेषण की गहराई के तरीके शामिल हैं। द्विबीजपत्री (बूलियन) विशेषताओं के लिए, तथाकथित ट्री-लाइक क्लासिफायर, डेड-एंड टेस्ट विधि, कोरा एल्गोरिथम और अन्य लोकप्रिय हैं। अधिक जटिल विधियाँ डीएस मिल की आगमनात्मक विधियों की औपचारिकता पर आधारित हैं। एक अर्ध-स्वयंसिद्ध सिद्धांत का निर्माण करके औपचारिकता की जाती है और चर-लंबाई वाले टुपल्स पर क्वांटिफायर के साथ बहु-क्रमबद्ध बहु-मूल्यवान तर्क पर आधारित है।

कोरा एल्गोरिथम, पैटर्न पहचान के अन्य तार्किक तरीकों की तरह, काफी श्रमसाध्य है, क्योंकि संयुग्मन का चयन करते समय एक पूर्ण गणना आवश्यक है। इसलिए, तार्किक तरीकों को लागू करते समय, कम्प्यूटेशनल प्रक्रिया के कुशल संगठन पर उच्च आवश्यकताएं रखी जाती हैं, और ये विधियां फीचर स्पेस के अपेक्षाकृत छोटे आयामों और केवल शक्तिशाली कंप्यूटरों पर ही काम करती हैं।

भाषाई (वाक्यविन्यास या संरचनात्मक) तरीके।पैटर्न मान्यता के भाषाई तरीके विशेष व्याकरण के उपयोग पर आधारित होते हैं जो भाषा उत्पन्न करते हैं, जिसके साथ पहचानने योग्य वस्तुओं के गुणों का एक सेट वर्णित किया जा सकता है। व्याकरण इन गैर-व्युत्पन्न तत्वों से वस्तुओं के निर्माण के नियमों को संदर्भित करता है।

यदि छवियों का वर्णन गैर-व्युत्पन्न तत्वों (उप-छवियों) और उनके संबंधों की सहायता से किया जाता है, तो गुणों की समानता के सिद्धांत का उपयोग करके स्वचालित पहचान प्रणाली बनाने के लिए एक भाषाई या वाक्य-विन्यास दृष्टिकोण का उपयोग किया जाता है। किसी भाषा की सिंटैक्टिक संरचना के समान सबइमेज की पदानुक्रमित संरचना का उपयोग करके एक छवि का वर्णन किया जा सकता है। यह परिस्थिति पैटर्न पहचान की समस्याओं को हल करने में औपचारिक भाषाओं के सिद्धांत को लागू करना संभव बनाती है। यह माना जाता है कि छवियों के व्याकरण में चर, गैर-व्युत्पन्न तत्व और प्रतिस्थापन नियम नामक तत्वों के परिमित सेट होते हैं। प्रतिस्थापन नियमों की प्रकृति व्याकरण के प्रकार को निर्धारित करती है। सबसे अधिक अध्ययन किए जाने वाले व्याकरणों में नियमित, संदर्भ-मुक्त और प्रत्यक्ष घटकों के व्याकरण हैं। इस दृष्टिकोण के प्रमुख बिंदु छवि के गैर-व्युत्पन्न तत्वों का विकल्प हैं, इन तत्वों का मिलन और उन्हें छवियों के व्याकरण में जोड़ने वाले संबंध, और अंत में, इसी में विश्लेषण और मान्यता की प्रक्रियाओं का कार्यान्वयन भाषा। छवियों के साथ काम करते समय यह दृष्टिकोण विशेष रूप से उपयोगी होता है जिसे या तो संख्यात्मक माप द्वारा वर्णित नहीं किया जा सकता है, या इतना जटिल है कि उनकी स्थानीय विशेषताओं की पहचान नहीं की जा सकती है और वस्तुओं के वैश्विक गुणों को संदर्भित करना पड़ता है।

उदाहरण के लिए, ई.ए. बुटाकोव, वी.आई. ओस्ट्रोव्स्की, आई. एल. फादेव एक भाषाई दृष्टिकोण का उपयोग करते हुए छवि प्रसंस्करण (छवि 3) के लिए निम्नलिखित प्रणाली संरचना का प्रस्ताव करते हैं, जहां प्रत्येक कार्यात्मक ब्लॉक एक सॉफ्टवेयर (माइक्रोप्रोग्राम) कॉम्प्लेक्स (मॉड्यूल) है जो संबंधित कार्यों को लागू करता है।

चित्रा 3. पहचानकर्ता का संरचनात्मक आरेख

छवि विश्लेषण की समस्या के लिए गणितीय भाषाविज्ञान के तरीकों को लागू करने का प्रयास एक औपचारिक भाषा की एक-आयामी श्रृंखला पर द्वि-आयामी छवि संरचना के मानचित्रण से संबंधित कई समस्याओं को हल करने की आवश्यकता को जन्म देता है।

विस्तार के तरीके

इस समूह के तरीकों में, आकस्मिक दिशा के विपरीत, अध्ययन की गई प्रत्येक वस्तु को अधिक या कम हद तक एक स्वतंत्र निदान मूल्य दिया जाता है। उनके मूल में, ये विधियां नैदानिक ​​​​दृष्टिकोण के करीब हैं, जो लोगों को एक या दूसरे संकेतक के अनुसार रैंक की गई वस्तुओं की श्रृंखला के रूप में नहीं, बल्कि अभिन्न प्रणालियों के रूप में मानती हैं, जिनमें से प्रत्येक व्यक्तिगत है और एक विशेष नैदानिक ​​​​मूल्य है। अध्ययन की वस्तुओं के लिए इस तरह का सावधानीपूर्वक रवैया किसी को प्रत्येक व्यक्तिगत वस्तु के बारे में जानकारी को बाहर करने या खोने की अनुमति नहीं देता है, जो तब होता है जब गहन दिशा के तरीकों को लागू करते हैं, वस्तुओं का उपयोग केवल उनकी विशेषताओं के व्यवहार के पैटर्न का पता लगाने और ठीक करने के लिए करते हैं।

चर्चा की गई विधियों का उपयोग करके पैटर्न की पहचान में मुख्य संचालन वस्तुओं की समानता और अंतर को निर्धारित करने के संचालन हैं। तरीकों के निर्दिष्ट समूह में वस्तुएं नैदानिक ​​मिसाल की भूमिका निभाती हैं। साथ ही, किसी विशेष कार्य की शर्तों के आधार पर, एक व्यक्तिगत मिसाल की भूमिका व्यापक सीमाओं के भीतर भिन्न हो सकती है: मान्यता प्रक्रिया में मुख्य और परिभाषित से बहुत अप्रत्यक्ष भागीदारी तक। बदले में, समस्या की स्थितियों को एक सफल समाधान के लिए अलग-अलग नैदानिक ​​मिसालों की भागीदारी की आवश्यकता हो सकती है: प्रत्येक पहचानने योग्य वर्ग में एक से लेकर पूर्ण नमूना आकार तक, साथ ही समानता और अंतर के उपायों की गणना करने के विभिन्न तरीके वस्तुओं। ये आवश्यकताएँ उपवर्गों में विस्तारित विधियों के आगे के विभाजन की व्याख्या करती हैं:

    प्रोटोटाइप तुलना विधि;

    के-निकटतम पड़ोसी विधि;

    निर्णय नियमों की टीमें।

प्रोटोटाइप तुलना विधि।यह सबसे सरल विस्तृत पहचान विधि है। इसका उपयोग किया जाता है, उदाहरण के लिए, जब मान्यता प्राप्त वर्गों को कॉम्पैक्ट ज्यामितीय समूहों में फीचर स्पेस में प्रदर्शित किया जाता है। इस मामले में, वर्ग के ज्यामितीय समूहन का केंद्र (या केंद्र के निकटतम वस्तु) को आमतौर पर प्रोटोटाइप बिंदु के रूप में चुना जाता है।

किसी अज्ञात वस्तु को वर्गीकृत करने के लिए, उसके निकटतम प्रोटोटाइप का पता लगाया जाता है, और वस्तु उसी वर्ग की होती है, जो इस प्रोटोटाइप के रूप में होती है। जाहिर है, इस पद्धति में कोई सामान्यीकृत वर्ग छवि नहीं बनती है।

निकटता के माप के रूप में विभिन्न प्रकार की दूरियों का उपयोग किया जा सकता है। अक्सर द्विबीजपत्री विशेषताओं के लिए, हैमिंग दूरी का उपयोग किया जाता है, जो इस मामले में यूक्लिडियन दूरी के वर्ग के बराबर है। इस मामले में, वस्तुओं को वर्गीकृत करने का निर्णय नियम एक रैखिक निर्णय समारोह के बराबर है।

इस तथ्य पर विशेष रूप से ध्यान दिया जाना चाहिए। यह डेटा संरचना के बारे में जानकारी के प्रोटोटाइप और सांकेतिक प्रतिनिधित्व के बीच संबंध को स्पष्ट रूप से प्रदर्शित करता है। उपरोक्त प्रतिनिधित्व का उपयोग करना, उदाहरण के लिए, किसी भी पारंपरिक मापने के पैमाने, जो द्विबीजपत्री विशेषताओं के मूल्यों का एक रैखिक कार्य है, को एक काल्पनिक निदान प्रोटोटाइप के रूप में माना जा सकता है। बदले में, यदि मान्यता प्राप्त वर्गों की स्थानिक संरचना का विश्लेषण हमें यह निष्कर्ष निकालने की अनुमति देता है कि वे ज्यामितीय रूप से कॉम्पैक्ट हैं, तो इनमें से प्रत्येक वर्ग को एक प्रोटोटाइप के साथ बदलने के लिए पर्याप्त है, जो वास्तव में एक रैखिक निदान मॉडल के बराबर है।

व्यवहार में, ज़ाहिर है, स्थिति अक्सर वर्णित आदर्श उदाहरण से भिन्न होती है। एक शोधकर्ता जो डायग्नोस्टिक कक्षाओं के प्रोटोटाइप के साथ तुलना के आधार पर मान्यता पद्धति को लागू करने का इरादा रखता है, उसे कठिन समस्याओं का सामना करना पड़ता है। यह, सबसे पहले, एक निकटता माप (मीट्रिक) का विकल्प है, जो वस्तुओं के वितरण के स्थानिक विन्यास को महत्वपूर्ण रूप से बदल सकता है। और, दूसरी बात, एक स्वतंत्र समस्या प्रायोगिक डेटा की बहुआयामी संरचनाओं का विश्लेषण है। ये दोनों समस्याएं विशेष रूप से फ़ीचर स्पेस के उच्च आयाम की स्थितियों में शोधकर्ता के लिए तीव्र हैं, जो वास्तविक समस्याओं के लिए विशिष्ट है।

के-निकटतम पड़ोसियों की विधि।विवेचक विश्लेषण समस्याओं को हल करने के लिए k-निकटतम पड़ोसी विधि पहली बार 1952 में प्रस्तावित की गई थी। यह इस प्रकार है।

किसी अज्ञात वस्तु को वर्गीकृत करते समय, फीचर स्पेस (निकटतम पड़ोसी) में ज्यामितीय रूप से इसके निकटतम अन्य वस्तुओं की एक दी गई संख्या (k) पहले से ही पहचानने योग्य वर्गों से संबंधित होती है। एक विशेष डायग्नोस्टिक वर्ग को एक अज्ञात वस्तु सौंपने का निर्णय उसके निकटतम पड़ोसियों की इस ज्ञात सदस्यता के बारे में जानकारी का विश्लेषण करके किया जाता है, उदाहरण के लिए, एक साधारण मतगणना का उपयोग करके।

प्रारंभ में, k-निकटतम पड़ोसी विधि को संभावना अनुपात का अनुमान लगाने के लिए एक गैर-पैरामीट्रिक विधि के रूप में माना जाता था। इस पद्धति के लिए, इष्टतम बायेसियन क्लासिफायरियर की तुलना में इसकी प्रभावशीलता के सैद्धांतिक अनुमान प्राप्त किए जाते हैं। यह साबित हो गया है कि k-निकटतम पड़ोसी विधि के लिए स्पर्शोन्मुख त्रुटि संभावनाएँ बेयस नियम की त्रुटियों से दो गुना से अधिक नहीं है।

जैसा कि ऊपर उल्लेख किया गया है, वास्तविक समस्याओं में अक्सर उन वस्तुओं के साथ काम करना आवश्यक होता है जिन्हें बड़ी संख्या में गुणात्मक (द्विभाजित) विशेषताओं द्वारा वर्णित किया जाता है। साथ ही, फीचर स्पेस का आयाम अध्ययन के तहत नमूने की मात्रा के अनुरूप या उससे अधिक है। ऐसी परिस्थितियों में, प्रशिक्षण नमूने की प्रत्येक वस्तु को एक अलग रैखिक क्लासिफायरियर के रूप में व्याख्या करना सुविधाजनक है। फिर यह या वह डायग्नोस्टिक वर्ग एक प्रोटोटाइप द्वारा नहीं, बल्कि रैखिक क्लासिफायर के एक सेट द्वारा दर्शाया गया है। रेखीय क्लासिफायरियरों की संयुक्त अंतःक्रिया के परिणामस्वरूप एक टुकड़े की रेखीय सतह होती है जो फीचर स्पेस में पहचानने योग्य वर्गों को अलग करती है। हाइपरप्लेन के टुकड़ों से मिलकर विभाजित सतह का प्रकार भिन्न हो सकता है और वर्गीकृत समुच्चय की सापेक्ष स्थिति पर निर्भर करता है।

के-निकटतम पड़ोसी वर्गीकरण तंत्र की एक अन्य व्याख्या का भी उपयोग किया जा सकता है। यह मूल सुविधा स्थान के साथ कुछ परिवर्तन द्वारा अमूर्त या संबंधित कुछ अव्यक्त चर के अस्तित्व के विचार पर आधारित है। यदि अव्यक्त चर के स्थान में वस्तुओं के बीच की दूरी प्रारंभिक सुविधाओं के स्थान के समान है, और इन चरों की संख्या वस्तुओं की संख्या से बहुत कम है, तो k-निकटतम पड़ोसियों की विधि की व्याख्या पर विचार किया जा सकता है सशर्त संभाव्यता वितरण घनत्व के गैर-पैरामीट्रिक अनुमानों की तुलना करने के दृष्टिकोण से। यहां प्रस्तुत अव्यक्त चर की अवधारणा प्रकृति में वास्तविक आयामीता की अवधारणा और विभिन्न आयामी कमी विधियों में उपयोग किए जाने वाले अन्य अभ्यावेदन के करीब है।

पैटर्न पहचान के लिए के-निकटतम पड़ोसी पद्धति का उपयोग करते समय, शोधकर्ता को निदान की गई वस्तुओं की निकटता निर्धारित करने के लिए मीट्रिक चुनने की कठिन समस्या को हल करना पड़ता है। फ़ीचर स्पेस के उच्च आयाम की स्थितियों में यह समस्या इस पद्धति की पर्याप्त जटिलता के कारण अत्यंत बढ़ जाती है, जो उच्च-प्रदर्शन वाले कंप्यूटरों के लिए भी महत्वपूर्ण हो जाती है। इसलिए, यहां, प्रोटोटाइप तुलना पद्धति की तरह, नैदानिक ​​​​वर्गों का प्रतिनिधित्व करने वाली वस्तुओं की संख्या को कम करने के लिए प्रयोगात्मक डेटा की बहुआयामी संरचना का विश्लेषण करने की रचनात्मक समस्या को हल करना आवश्यक है।

ग्रेड (मतदान) की गणना के लिए एल्गोरिदम।मूल्यांकन एल्गोरिदम (एबीओ) के संचालन का सिद्धांत प्राथमिकता (समानता स्कोर) की गणना करना है जो मान्यता प्राप्त और संदर्भ वस्तुओं की "निकटता" की विशेषता है, जो फीचर एन्सेम्बल की प्रणाली के अनुसार है, जो किसी दिए गए सेट के सबसेट की प्रणाली है। सुविधाओं का।

पहले से विचार किए गए सभी तरीकों के विपरीत, अनुमानों की गणना के लिए एल्गोरिदम मूल रूप से नए तरीके से वस्तु विवरण के साथ काम करते हैं। इन एल्गोरिदम के लिए, फीचर स्पेस के बहुत अलग उप-स्थानों में ऑब्जेक्ट एक साथ मौजूद हैं। ABO वर्ग अपने तार्किक निष्कर्ष पर सुविधाओं का उपयोग करने का विचार लाता है: चूंकि यह हमेशा ज्ञात नहीं होता है कि सुविधाओं का कौन सा संयोजन सबसे अधिक जानकारीपूर्ण है, ABO में वस्तुओं की समानता की डिग्री की गणना सभी संभव या कुछ विशेषताओं के संयोजनों की तुलना करके की जाती है। वस्तुओं के विवरण में शामिल।

निर्णय नियमों की टीमें।निर्णय नियम दो-स्तरीय मान्यता योजना का उपयोग करता है। पहले स्तर पर, निजी मान्यता एल्गोरिदम काम करते हैं, जिसके परिणाम संश्लेषण ब्लॉक में दूसरे स्तर पर संयुक्त होते हैं। इस तरह के संयोजन के सबसे आम तरीके एक विशेष एल्गोरिथम की क्षमता के क्षेत्रों के आवंटन पर आधारित होते हैं। क्षमता के क्षेत्रों को खोजने का सबसे सरल तरीका एक विशेष विज्ञान के पेशेवर विचारों के आधार पर फीचर स्पेस को प्राथमिक रूप से विभाजित करना है (उदाहरण के लिए, कुछ फीचर के अनुसार नमूने का स्तरीकरण)। फिर, प्रत्येक चयनित क्षेत्र के लिए, अपना स्वयं का पहचान एल्गोरिथम बनाया जाता है। एक अन्य विधि पहचानने योग्य वस्तुओं के पड़ोस के रूप में फीचर स्पेस के स्थानीय क्षेत्रों को निर्धारित करने के लिए औपचारिक विश्लेषण के उपयोग पर आधारित है, जिसके लिए किसी विशेष मान्यता एल्गोरिदम की सफलता सिद्ध हुई है।

एक संश्लेषण ब्लॉक के निर्माण के लिए सबसे सामान्य दृष्टिकोण आंशिक एल्गोरिदम के परिणामी संकेतकों को एक नए सामान्यीकृत निर्णय नियम के निर्माण के लिए प्रारंभिक सुविधाओं के रूप में मानता है। इस मामले में, पैटर्न मान्यता में गहन और विस्तारित दिशाओं के उपरोक्त सभी तरीकों का उपयोग किया जा सकता है। निर्णय नियमों का एक सेट बनाने की समस्या को हल करने के लिए प्रभावी "कोरा" प्रकार के तार्किक एल्गोरिदम और अनुमानों की गणना के लिए एल्गोरिदम (एबीओ) हैं, जो तथाकथित बीजगणितीय दृष्टिकोण का आधार हैं, जो अनुसंधान और एक रचनात्मक विवरण प्रदान करता है। मान्यता एल्गोरिदम, जिसके भीतर सभी मौजूदा प्रकार के एल्गोरिदम फिट होते हैं।

तंत्रिका नेटवर्क के तरीके

तंत्रिका नेटवर्क विधियाँ विभिन्न प्रकार के तंत्रिका नेटवर्क (एनएन) के उपयोग पर आधारित विधियाँ हैं। पैटर्न और छवि पहचान के लिए विभिन्न एनएन के आवेदन के मुख्य क्षेत्र:

    दी गई छवियों की प्रमुख विशेषताओं या विशेषताओं को निकालने के लिए आवेदन,

    छवियों का वर्गीकरण स्वयं या उनसे पहले से निकाली गई विशेषताएँ (पहले मामले में, प्रमुख विशेषताओं का निष्कर्षण नेटवर्क के भीतर होता है),

    अनुकूलन समस्याओं का समाधान।

बहुपरत तंत्रिका नेटवर्क।एक बहुपरत तंत्रिका नेटवर्क (MNN) की वास्तुकला में क्रमिक रूप से जुड़ी हुई परतें होती हैं, जहाँ प्रत्येक परत का न्यूरॉन अपने इनपुट के साथ पिछली परत के सभी न्यूरॉन्स और अगले के आउटपुट से जुड़ा होता है।

एकल-परत एनएन (जिसे ऑटो-एसोसिएटिव मेमोरी कहा जाता है) का सबसे सरल अनुप्रयोग फ़ीड छवियों के पुनर्निर्माण के लिए नेटवर्क को प्रशिक्षित करना है। इनपुट के लिए एक परीक्षण छवि खिलाकर और पुनर्निर्मित छवि की गुणवत्ता की गणना करके, कोई अनुमान लगा सकता है कि नेटवर्क ने इनपुट छवि को कितनी अच्छी तरह पहचाना है। इस पद्धति का सकारात्मक गुण यह है कि नेटवर्क विकृत और शोर वाली छवियों को पुनर्प्राप्त कर सकता है, लेकिन यह अधिक गंभीर उद्देश्यों के लिए उपयुक्त नहीं है।

MNN का उपयोग छवियों के प्रत्यक्ष वर्गीकरण के लिए भी किया जाता है - इनपुट या तो किसी न किसी रूप में छवि है, या छवि की पहले से निकाली गई प्रमुख विशेषताओं का एक सेट है, आउटपुट पर, अधिकतम गतिविधि वाला न्यूरॉन मान्यता प्राप्त वर्ग (चित्र) से संबंधित है। 4). यदि यह गतिविधि एक निश्चित सीमा से नीचे है, तो यह माना जाता है कि सबमिट की गई छवि किसी ज्ञात वर्ग से संबंधित नहीं है। सीखने की प्रक्रिया एक निश्चित वर्ग से संबंधित इनपुट छवियों के पत्राचार को स्थापित करती है। इसे पर्यवेक्षित शिक्षण कहा जाता है। यह दृष्टिकोण लोगों के एक छोटे समूह के लिए अभिगम नियंत्रण कार्यों के लिए अच्छा है। यह दृष्टिकोण नेटवर्क द्वारा स्वयं छवियों की प्रत्यक्ष तुलना प्रदान करता है, लेकिन कक्षाओं की संख्या में वृद्धि के साथ, प्रशिक्षण और नेटवर्क संचालन का समय तेजी से बढ़ता है। इसलिए, एक बड़े डेटाबेस में एक समान व्यक्ति की खोज करने जैसे कार्यों के लिए, इसमें प्रमुख विशेषताओं के एक कॉम्पैक्ट सेट को निकालने की आवश्यकता होती है जिससे खोज की जा सके।

संपूर्ण छवि की आवृत्ति विशेषताओं का उपयोग करते हुए एक वर्गीकरण दृष्टिकोण में वर्णित है। मल्टीवैल्यूड न्यूरॉन्स पर आधारित सिंगल-लेयर एनएस का उपयोग किया गया था।

बी छवि वर्गीकरण के लिए एनएन का उपयोग दिखाता है, जब नेटवर्क इनपुट प्रमुख घटकों की विधि द्वारा छवि अपघटन के परिणाम प्राप्त करता है।

शास्त्रीय मनसे में, इंटरलेयर न्यूरल कनेक्शन पूरी तरह से जुड़े हुए हैं, और छवि को एक आयामी वेक्टर के रूप में दर्शाया गया है, हालांकि यह द्वि-आयामी है। दृढ़ तंत्रिका नेटवर्क की वास्तुकला का उद्देश्य इन कमियों को दूर करना है। इसने स्थानीय रिसेप्टर क्षेत्रों (न्यूरॉन्स की स्थानीय द्वि-आयामी कनेक्टिविटी प्रदान करना), सामान्य भार (छवि में कहीं भी कुछ सुविधाओं का पता लगाने प्रदान करना), और स्थानिक सबमप्लिंग (स्थानिक सबसैंपलिंग) के साथ पदानुक्रमित संगठन का उपयोग किया। संवादात्मक एनएन (सीएनएन) पैमाने में परिवर्तन, विस्थापन, घुमाव, विकृतियों के लिए आंशिक प्रतिरोध प्रदान करता है।

MNS का उपयोग एक निश्चित प्रकार की वस्तुओं का पता लगाने के लिए भी किया जाता है। इस तथ्य के अलावा कि कोई भी प्रशिक्षित MNS कुछ हद तक छवियों को "अपनी" कक्षाओं से संबंधित निर्धारित कर सकता है, इसे विशेष रूप से कुछ वर्गों का पता लगाने के लिए विशेष रूप से प्रशिक्षित किया जा सकता है। इस मामले में, आउटपुट वर्ग वे वर्ग होंगे जो दिए गए छवि प्रकार से संबंधित हैं और नहीं हैं। इनपुट छवि में चेहरे की छवि का पता लगाने के लिए एक तंत्रिका नेटवर्क डिटेक्टर का उपयोग किया गया था। छवि को 20x20 पिक्सेल की एक विंडो के साथ स्कैन किया गया था, जिसे नेटवर्क के इनपुट को फीड किया गया था, जो यह तय करता है कि दिया गया क्षेत्र चेहरों के वर्ग से संबंधित है या नहीं। प्रशिक्षण सकारात्मक उदाहरण (चेहरे की विभिन्न छवियां) और नकारात्मक उदाहरण (छवियां जो चेहरे नहीं हैं) दोनों का उपयोग करके किया गया था। पता लगाने की विश्वसनीयता में सुधार करने के लिए, विभिन्न प्रारंभिक भारों के साथ प्रशिक्षित NNs की एक टीम का उपयोग किया गया था, जिसके परिणामस्वरूप NNs ने विभिन्न तरीकों से गलतियाँ कीं, और अंतिम निर्णय पूरी टीम के मतदान द्वारा किया गया।

चित्र 5. प्रमुख घटक (आइजेनफेस) और छवि का प्रमुख घटकों में अपघटन

एनएन का उपयोग छवि की प्रमुख विशेषताओं को निकालने के लिए भी किया जाता है, जिसका उपयोग बाद के वर्गीकरण के लिए किया जाता है। में, प्रमुख घटक विश्लेषण पद्धति के तंत्रिका नेटवर्क कार्यान्वयन के लिए एक विधि दिखाई गई है। प्रमुख घटक विश्लेषण पद्धति का सार अधिकतम सजावटी गुणांक प्राप्त करना है जो इनपुट पैटर्न की विशेषता है। इन गुणांकों को प्रमुख घटक कहा जाता है और सांख्यिकीय छवि संपीड़न के लिए उपयोग किया जाता है, जिसमें संपूर्ण छवि का प्रतिनिधित्व करने के लिए गुणांक की एक छोटी संख्या का उपयोग किया जाता है। एक छिपी हुई परत के साथ एक एनएन जिसमें एन न्यूरॉन्स होते हैं (जो छवि आयाम से बहुत छोटा है), आउटपुट पर इनपुट छवि को पुनर्स्थापित करने के लिए त्रुटि बैकप्रोपैजेशन की विधि द्वारा प्रशिक्षित, आउटपुट पर पहले एन प्रमुख घटकों के गुणांक उत्पन्न करता है छिपे हुए न्यूरॉन्स, जिनका उपयोग तुलना के लिए किया जाता है। आमतौर पर, 10 से 200 प्रमुख घटकों का उपयोग किया जाता है। जैसे-जैसे घटक संख्या बढ़ती है, इसकी प्रतिनिधित्व क्षमता बहुत कम हो जाती है, और बड़ी संख्या वाले घटकों का उपयोग करने का कोई मतलब नहीं होता है। तंत्रिका तत्वों के गैर-रेखीय सक्रियण कार्यों का उपयोग करते समय, प्रमुख घटकों में एक गैर-रैखिक अपघटन संभव है। गैर-रैखिकता आपको इनपुट डेटा में विविधताओं को अधिक सटीक रूप से प्रतिबिंबित करने की अनुमति देती है। चेहरे की छवियों के अपघटन के लिए प्रमुख घटक विश्लेषण को लागू करते हुए, हम मुख्य घटक प्राप्त करते हैं, जिन्हें उचित चेहरे कहा जाता है, जिसमें एक उपयोगी गुण भी होता है - ऐसे घटक होते हैं जो मुख्य रूप से लिंग, जाति, भावनाओं जैसी आवश्यक चेहरे की विशेषताओं को दर्शाते हैं। जब बहाल किया जाता है, तो घटकों में चेहरे की तरह उपस्थिति होती है, जिसमें पूर्व चेहरे के सबसे सामान्य आकार को दर्शाता है, बाद वाला चेहरों के बीच विभिन्न छोटे अंतरों का प्रतिनिधित्व करता है (चित्र 5)। बड़े डेटाबेस में समान चेहरे की छवियों को खोजने के लिए यह विधि अच्छी तरह से लागू होती है। एनएस की मदद से प्रमुख घटकों के आयाम को और कम करने की संभावना भी दिखाई गई है। इनपुट छवि के पुनर्निर्माण की गुणवत्ता का मूल्यांकन करके, कोई बहुत सटीक रूप से यह निर्धारित कर सकता है कि क्या यह चेहरों के वर्ग से संबंधित है।

उच्च क्रम के तंत्रिका नेटवर्क।हाई-ऑर्डर न्यूरल नेटवर्क (एचएनएन) एमएनएन से भिन्न होते हैं जिसमें उनके पास केवल एक परत होती है, लेकिन न्यूरॉन्स के इनपुट भी उच्च-क्रम की शर्तों को प्राप्त करते हैं, जो इनपुट वेक्टर के दो या दो से अधिक घटकों के उत्पाद हैं। इस तरह के नेटवर्क जटिल अलग करने वाली सतह भी बना सकते हैं।

हॉपफील्ड तंत्रिका नेटवर्क।हॉपफील्ड एनएन (एचएसएच) सिंगल-लेयर है और पूरी तरह से जुड़ा हुआ है (न्यूरॉन्स का खुद से कोई कनेक्शन नहीं है), इसके आउटपुट इनपुट से जुड़े हैं। एमएनएस के विपरीत, एनएसएच आरामदेह है, अर्थात। प्रारंभिक अवस्था में सेट किया जा रहा है, यह तब तक कार्य करता है जब तक यह एक स्थिर स्थिति तक नहीं पहुँच जाता है, जो इसका आउटपुट मूल्य होगा। अनुकूलन समस्याओं के संबंध में वैश्विक न्यूनतम खोजने के लिए, NSH के स्टोकेस्टिक संशोधनों का उपयोग किया जाता है।

एक साहचर्य स्मृति के रूप में NSH का उपयोग आपको उन छवियों को सटीक रूप से पुनर्स्थापित करने की अनुमति देता है जिनके लिए नेटवर्क को प्रशिक्षित किया गया है जब एक विकृत छवि को इनपुट में फीड किया जाता है। इस मामले में, नेटवर्क निकटतम (स्थानीय न्यूनतम ऊर्जा के अर्थ में) छवि को "याद" करेगा, और इस प्रकार इसे पहचान लेगा। इस तरह की कार्यप्रणाली को ऊपर वर्णित ऑटो-एसोसिएटिव मेमोरी के अनुक्रमिक अनुप्रयोग के रूप में भी माना जा सकता है। ऑटो-एसोसिएटिव मेमोरी के विपरीत, एनएसएच छवि को पूरी तरह सटीक रूप से पुनर्स्थापित करेगा। कम से कम हस्तक्षेप से बचने और नेटवर्क क्षमता बढ़ाने के लिए, विभिन्न विधियों का उपयोग किया जाता है।

कोहोनेन स्व-संगठित तंत्रिका नेटवर्क।कोहोनेन स्व-संगठित तंत्रिका नेटवर्क (एसएनएनसी) इनपुट छवि स्थान के सामयिक क्रम प्रदान करते हैं। वे इनपुट एन-डायमेंशनल स्पेस को आउटपुट एम-डायमेंशनल, एम में टोपोलॉजिकल रूप से निरंतर मैपिंग की अनुमति देते हैं<

कॉग्निट्रॉन।इसकी वास्तुकला में कॉग्निट्रॉन विज़ुअल कॉर्टेक्स की संरचना के समान है, इसमें एक पदानुक्रमित बहुपरत संगठन है, जिसमें परतों के बीच न्यूरॉन्स केवल स्थानीय रूप से जुड़े होते हैं। प्रतिस्पर्धी शिक्षा (शिक्षक के बिना) द्वारा प्रशिक्षित। मस्तिष्क की प्रत्येक परत सामान्यीकरण के विभिन्न स्तरों को लागू करती है; इनपुट परत सरल पैटर्न के प्रति संवेदनशील होती है, जैसे कि रेखाएँ, और दृश्य क्षेत्र के कुछ क्षेत्रों में उनका अभिविन्यास, जबकि अन्य परतों की प्रतिक्रिया अधिक जटिल, अमूर्त और पैटर्न की स्थिति से स्वतंत्र होती है। दृश्य कॉर्टेक्स के संगठन को मॉडलिंग करके कॉग्निट्रॉन में इसी तरह के कार्यों को लागू किया जाता है।

नियोकॉग्निट्रोन कॉग्निट्रोन विचार का एक और विकास है और अधिक सटीक रूप से दृश्य प्रणाली की संरचना को दर्शाता है, आपको उनके परिवर्तनों, घुमावों, विकृतियों और पैमाने परिवर्तनों की परवाह किए बिना छवियों को पहचानने की अनुमति देता है।

कॉग्निट्रॉन एक शक्तिशाली छवि पहचान उपकरण है, हालांकि, इसके लिए उच्च कम्प्यूटेशनल लागत की आवश्यकता होती है, जो वर्तमान में अप्राप्य हैं।

विचारित तंत्रिका नेटवर्क विधियाँ तेज़ और विश्वसनीय छवि पहचान प्रदान करती हैं, लेकिन इन विधियों का उपयोग करते समय, त्रि-आयामी वस्तुओं की पहचान में समस्याएँ उत्पन्न होती हैं। हालाँकि, इस दृष्टिकोण के कई फायदे हैं।

      निष्कर्ष

वर्तमान में, विभिन्न लागू समस्याओं के लिए काफी बड़ी संख्या में स्वचालित पैटर्न पहचान प्रणालियाँ हैं।

मौलिक वैज्ञानिक दिशा के रूप में औपचारिक तरीकों से पैटर्न की पहचान अटूट है।

छवि प्रसंस्करण के गणितीय तरीकों में व्यापक अनुप्रयोग हैं: विज्ञान, प्रौद्योगिकी, चिकित्सा, सामाजिक क्षेत्र। भविष्य में मानव जीवन में पैटर्न की पहचान की भूमिका और भी बढ़ जाएगी।

तंत्रिका नेटवर्क विधियाँ तेज़ और विश्वसनीय छवि पहचान प्रदान करती हैं। इस दृष्टिकोण के कई फायदे हैं और यह सबसे आशाजनक में से एक है।

साहित्य

    डी.वी. ब्रिलुक, वी.वी. Starovoytov। छवि पहचान के तंत्रिका नेटवर्क के तरीके // /

    कुज़िन एल.टी. साइबरनेटिक्स के फंडामेंटल: साइबरनेटिक मॉडल के फंडामेंटल। टी.2. - एम .: एनर्जी, 1979. - 584 पी।

    पेरेगुडोव एफ.आई., तारासेंको एफ.पी. सिस्टम विश्लेषण का परिचय: पाठ्यपुस्तक। - एम।: हायर स्कूल, 1997. - 389s।

    टेम्निकोव एफ.ई., अफोनिन वी.ए., दिमित्रिज वी.आई. सूचना प्रौद्योगिकी की सैद्धांतिक नींव। - एम .: एनर्जी, 1979. - 511 एस।

    तू जे।, गोंजालेज आर। पैटर्न रिकॉग्निशन के सिद्धांत। / प्रति। अंग्रेज़ी से। - एम .: मीर, 1978. - 410s।

    विंस्टन पी। कृत्रिम बुद्धि। / प्रति। अंग्रेज़ी से। - एम .: मीर, 1980. - 520s।

    पैटर्न मान्यता में फू के। संरचनात्मक तरीके: अंग्रेजी से अनुवादित। - एम .: मीर, 1977. - 320s।

    त्सिपकिन हां.जेड। पहचान के सूचना सिद्धांत के मूल सिद्धांत। - एम .: नौका, 1984. - 520s।

    पोस्पेलोव जी.एस. आर्टिफिशियल इंटेलिजेंस नई सूचना प्रौद्योगिकी का आधार है। - एम .: नौका, 1988. - 280s।

    यू. लिफ़्शिट्स, पैटर्न पहचान के सांख्यिकीय तरीके ///आधुनिक/07आधुनिक नोट.पीडीएफ

    बोह्र एन। परमाणु भौतिकी और मानव ज्ञान। / अंग्रेजी से अनुवाद। - एम .: मीर, 1961. - 151s।

    बुटाकोव ई.ए., ओस्ट्रोवस्की वी.आई., फादेव आई.एल. एक कंप्यूटर पर इमेज प्रोसेसिंग। 1987.-236s।

    डूडा आर., हार्ट पी. पैटर्न पहचान और दृश्य विश्लेषण। / अंग्रेजी से अनुवाद। - एम .: मीर, 1978. - 510s।

    ड्यूक वी.ए. कंप्यूटर साइकोडायग्नोस्टिक्स। - सेंट पीटर्सबर्ग: ब्रदरहुड, 1994. - 365 पी।

    एज़ेनबर्ग आई. एन., एज़ेनबर्ग एन. एन. और क्रिवोशेव जी. ए. बहु-मूल्यवान और सार्वभौमिक बाइनरी न्यूरॉन्स: लर्निंग एल्गोरिदम, एप्लीकेशन टू इमेज प्रोसेसिंग एंड रिकॉग्निशन। आर्टिफिशियल इंटेलिजेंस में लेक्चर नोट्स - मशीन लर्निंग एंड डेटा माइनिंग इन पैटर्न रिकग्निशन, 1999, पीपी। 21-35।

    रंगनाथ एस और अरुण के। चेहरे की पहचान परिवर्तन सुविधाओं और तंत्रिका नेटवर्क का उपयोग कर। पैटर्न रिकग्निशन 1997, वॉल्यूम। 30, पीपी। 1615-1622।

    गोलोव्को वी. ए. न्यूरोइंटेलिजेंस: सिद्धांत और अनुप्रयोग। पुस्तक 1. प्रत्यक्ष और प्रतिक्रिया के साथ तंत्रिका नेटवर्क का संगठन और प्रशिक्षण - ब्रेस्ट: बीपीआई, 1999, - 260।

    वेटर टी. और पोगियो टी. लीनियर ऑब्जेक्ट क्लासेस एंड इमेज सिंथेसिस फ्रॉम ए सिंगल उदाहरण इमेज। पैटर्न विश्लेषण और मशीन इंटेलिजेंस 1997, वॉल्यूम पर आईईईई लेनदेन। 19, पीपी। 733-742।

    गोलोव्को वी. ए. न्यूरोइंटेलिजेंस: सिद्धांत और अनुप्रयोग। पुस्तक 2। स्व-संगठन, दोष सहिष्णुता और तंत्रिका नेटवर्क का उपयोग - ब्रेस्ट: बीपीआई, 1999, - 228।

    लॉरेंस एस।, जाइल्स सीएल, त्सोई एसी और बैक ए। डी। फेस रिकॉग्निशन: ए कनवॉल्यूशनल न्यूरल नेटवर्क एप्रोच। तंत्रिका नेटवर्क पर IEEE लेनदेन, तंत्रिका नेटवर्क और पैटर्न पहचान पर विशेष अंक, पीपी। 1-24।

    वासरमैन एफ। न्यूरोकंप्यूटर प्रौद्योगिकी: सिद्धांत और व्यवहार, 1992 - 184p।

    राउली एच.ए., बलूजा एस. और कनाडे टी. न्यूरल नेटवर्क-बेस्ड फेस डिटेक्शन। पैटर्न विश्लेषण और मशीन इंटेलिजेंस 1998, वॉल्यूम पर आईईईई लेनदेन। 20, पीपी। 23-37।

    वैलेन्टिन डी।, अब्दी एच।, ओ "टूल ए। जे। और कॉटरेल जी। डब्ल्यू। फेस प्रोसेसिंग के कनेक्शनिस्ट मॉडल: एक सर्वेक्षण। इन: पैटर्न रिकॉग्निशन 1994, वॉल्यूम 27, पीपी। 1209-1230।

    दस्तावेज़

    वे एल्गोरिदम बनाते हैं मान्यताइमेजिस. तरीकोंमान्यताइमेजिसजैसा ऊपर बताया गया है ... वास्तविकता नहीं है मौजूद"सामान्य रूप से पारिस्थितिक तंत्र" और अस्तित्वकेवल कुछ ... इस विस्तृत से निष्कर्ष समीक्षातरीकोंमान्यताहमने प्रस्तुत किया...

  1. दृश्य पहचान की विशेषताओं को ध्यान में रखते हुए, चेहरे की छवियों के आधार पर लोगों की पहचान करने के तरीकों का अवलोकन

    समीक्षा

    ... मान्यतानिम्न-विपरीत वस्तुओं वाले व्यक्ति द्वारा, सहित। व्यक्तियों। लाया समीक्षासामान्य तरीकों ... मौजूदपूरी लाइन तरीकों ... रास्ता, अध्ययन के परिणामस्वरूप, के विकास के लिए एक मंच तरीकामान्यता ...

  2. Imeni Glazkova Valentina Vladimirovna अनुसंधान और बहु-विषयक हाइपरटेक्स्ट दस्तावेजों के वर्गीकरण के लिए सॉफ़्टवेयर उपकरणों के निर्माण के तरीकों का विकास विशेषता 05

    निबंध सार

    हाइपरटेक्स्ट दस्तावेज़। अध्याय शामिल है समीक्षामौजूदातरीकोंविचाराधीन समस्या का समाधान, विवरण ... कम से कम प्रासंगिक वर्गों को काटकर // गणितीय तरीकोंमान्यताइमेजिस: 13वां अखिल रूसी सम्मेलन। लेनिनग्राद क्षेत्र...

  3. स्लाइड 0 आनुवंशिक ग्रंथों के विश्लेषण और प्रसंस्करण से संबंधित जैव सूचना विज्ञान के कार्यों का अवलोकन

    भाषण

    डीएनए और प्रोटीन अनुक्रम। समीक्षाकार्यों के रूप में जैव सूचना विज्ञान के कार्य ... संकेतों को आधुनिक उपयोग की आवश्यकता होती है तरीकोंमान्यताइमेजिस, सांख्यिकीय दृष्टिकोण और ... कम जीन घनत्व के साथ। मौजूदाजीन भविष्यवाणी कार्यक्रम नहीं...

आदि वस्तुएं जो कुछ गुणों और विशेषताओं के एक सीमित सेट द्वारा विशेषता होती हैं। ऐसे कार्य अक्सर हल हो जाते हैं, उदाहरण के लिए, ट्रैफिक लाइट पर सड़क पार करते समय या गाड़ी चलाते समय। जलती हुई ट्रैफिक लाइट के रंग को पहचानने और सड़क के नियमों को जानने से आप सड़क पार करने या न करने के बारे में सही निर्णय ले सकते हैं।

इस तरह की मान्यता की आवश्यकता विभिन्न क्षेत्रों में उत्पन्न होती है - सैन्य मामलों और सुरक्षा प्रणालियों से लेकर एनालॉग सिग्नल के डिजिटलीकरण तक।

छवि पहचान की समस्या ने सूचना अधिभार की स्थितियों में एक उत्कृष्ट महत्व प्राप्त कर लिया है, जब कोई व्यक्ति उसके पास आने वाले संदेशों की रैखिक-अनुक्रमिक समझ का सामना नहीं कर सकता है, जिसके परिणामस्वरूप उसका मस्तिष्क धारणा और सोच की एकरूपता के मोड में बदल जाता है। , जिसकी ऐसी मान्यता विशेषता है।

इसलिए, यह कोई संयोग नहीं है कि कृत्रिम बुद्धिमत्ता के निर्माण और तकनीकी प्रणालियों के निर्माण के संबंध में अंतःविषय अनुसंधान के क्षेत्र में छवि पहचान की समस्या सामने आई। पैटर्न मान्यताअधिक से अधिक ध्यान आकर्षित कर रहा है।

विश्वकोश यूट्यूब

    1 / 4

    पैटर्न पहचान का परिचय

    आर.वी. शमीन। व्याख्यान संख्या 6 हॉपफील्ड और हैमिंग नेटवर्क पैटर्न पहचान समस्याओं में

    [डीडीएसएच-2016]: तंत्रिका नेटवर्क और आधुनिक कंप्यूटर दृष्टि

    व्याख्यान 9. घातीय चौरसाई। पैटर्न पहचान: kth निकटतम पड़ोसी विधि

    उपशीर्षक

पैटर्न पहचान में दिशाएँ

दो मुख्य दिशाएँ हैं:

  • जीवित प्राणियों द्वारा धारण की गई पहचान क्षमताओं का अध्ययन, उन्हें समझाना और उनका प्रतिरूपण करना;
  • लागू उद्देश्यों के लिए व्यक्तिगत समस्याओं को हल करने के लिए डिज़ाइन किए गए उपकरणों के निर्माण के लिए सिद्धांत और विधियों का विकास।

समस्या का औपचारिक विवरण

पैटर्न की पहचान गैर-आवश्यक डेटा के कुल द्रव्यमान से इन डेटा को चिह्नित करने वाली आवश्यक विशेषताओं को उजागर करके एक निश्चित वर्ग को प्रारंभिक डेटा का असाइनमेंट है।

मान्यता संबंधी समस्याओं को सेट करते समय, वे एक गणितीय भाषा का उपयोग करने की कोशिश करते हैं - कृत्रिम तंत्रिका नेटवर्क के सिद्धांत के विपरीत, जहां आधार प्रयोग के माध्यम से परिणाम प्राप्त करना है - प्रयोग को तार्किक तर्क और गणितीय प्रमाणों के साथ बदलने के लिए।

पैटर्न पहचान की समस्या का शास्त्रीय कथन: वस्तुओं का एक सेट दिया गया। उन्हें वर्गीकृत करने की आवश्यकता है। एक सेट को सबसेट द्वारा दर्शाया जाता है, जिसे क्लास कहा जाता है। दिए गए: वर्गों के बारे में जानकारी, पूरे सेट का विवरण और किसी विशेष वर्ग से संबंधित किसी वस्तु के बारे में जानकारी का विवरण अज्ञात है। वर्गों के बारे में उपलब्ध जानकारी और वस्तु के विवरण के अनुसार यह निर्धारित करना आवश्यक है कि यह वस्तु किस वर्ग की है।

अक्सर, मोनोक्रोम छवियों को पैटर्न पहचान समस्याओं में माना जाता है, जो एक छवि को विमान पर एक फ़ंक्शन के रूप में मानना ​​संभव बनाता है। यदि हम एक समतल पर स्थित बिंदु पर विचार करते हैं टी (\displaystyle टी), जहां फ़ंक्शन छवि के प्रत्येक बिंदु पर अपनी विशेषता - चमक, पारदर्शिता, ऑप्टिकल घनत्व व्यक्त करता है, तो ऐसा फ़ंक्शन छवि का औपचारिक रिकॉर्ड होता है।

सभी संभावित कार्यों का सेट f (x , y) (\displaystyle f(x, y))सतह पर टी (\displaystyle टी)- सभी छवियों के सेट का एक मॉडल है एक्स (\displaystyle X). अवधारणा का परिचय समानताछवियों के बीच, आप पहचान का कार्य निर्धारित कर सकते हैं। इस तरह की सेटिंग का विशिष्ट रूप दृढ़ता से एक या दूसरे दृष्टिकोण के अनुसार मान्यता के बाद के चरणों पर निर्भर करता है।

ग्राफिक छवियों की पहचान के कुछ तरीके

ऑप्टिकल छवि पहचान के लिए, आप विभिन्न कोणों, पैमानों, ऑफ़सेट आदि पर किसी वस्तु की उपस्थिति पर पुनरावृति की विधि को लागू कर सकते हैं। अक्षरों के लिए, आपको फ़ॉन्ट, फ़ॉन्ट गुणों आदि पर पुनरावृति करने की आवश्यकता होती है।

दूसरा दृष्टिकोण वस्तु की रूपरेखा का पता लगाना और उसके गुणों (कनेक्टिविटी, कोनों की उपस्थिति, आदि) की जांच करना है।

एक अन्य दृष्टिकोण कृत्रिम तंत्रिका नेटवर्क का उपयोग करना है। इस पद्धति के लिए या तो बड़ी संख्या में मान्यता कार्य (सही उत्तरों के साथ) के उदाहरणों की आवश्यकता होती है, या एक विशेष तंत्रिका नेटवर्क संरचना होती है जो इस कार्य की बारीकियों को ध्यान में रखती है।

परसेप्ट्रॉन पैटर्न पहचान की एक विधि के रूप में

एफ। रोसेनब्लैट, एक मस्तिष्क मॉडल की अवधारणा का परिचय देते हुए, जिसका कार्य यह दिखाना है कि किसी भौतिक प्रणाली में मनोवैज्ञानिक घटनाएं कैसे उत्पन्न हो सकती हैं, जिसकी संरचना और कार्यात्मक गुण ज्ञात हैं, भेदभाव पर सबसे सरल प्रयोगों का वर्णन किया। ये प्रयोग पूरी तरह से पैटर्न पहचान विधियों से संबंधित हैं, लेकिन इसमें भिन्नता है कि समाधान एल्गोरिथ्म नियतात्मक नहीं है।

सबसे सरल प्रयोग, जिसके आधार पर एक निश्चित प्रणाली के बारे में मनोवैज्ञानिक रूप से महत्वपूर्ण जानकारी प्राप्त करना संभव है, इस तथ्य पर निर्भर करता है कि मॉडल को दो अलग-अलग उत्तेजनाओं के साथ प्रस्तुत किया जाता है और उन्हें अलग-अलग तरीकों से प्रतिक्रिया देने की आवश्यकता होती है। इस तरह के एक प्रयोग का उद्देश्य प्रयोगकर्ता से हस्तक्षेप की अनुपस्थिति में सिस्टम द्वारा उनके सहज भेदभाव की संभावना का अध्ययन करना हो सकता है, या इसके विपरीत, जबरन भेदभाव का अध्ययन करना, जिसमें प्रयोगकर्ता प्रणाली को लागू करने के लिए सिखाने की कोशिश करता है। आवश्यक वर्गीकरण।

एक सीखने के प्रयोग में, परसेप्ट्रॉन को आमतौर पर छवियों के एक निश्चित अनुक्रम के साथ प्रस्तुत किया जाता है, जिसमें प्रत्येक वर्ग के प्रतिनिधियों को प्रतिष्ठित किया जाता है। कुछ स्मृति संशोधन नियम के अनुसार, प्रतिक्रिया का सही विकल्प प्रबल होता है। फिर परसेप्ट्रॉन को नियंत्रण उत्तेजना प्रस्तुत की जाती है और इस वर्ग की उत्तेजनाओं के लिए सही प्रतिक्रिया प्राप्त करने की संभावना निर्धारित की जाती है। इस बात पर निर्भर करते हुए कि चयनित नियंत्रण उत्तेजना प्रशिक्षण क्रम में उपयोग की गई छवियों में से एक से मेल खाती है या नहीं, अलग-अलग परिणाम प्राप्त होते हैं:

  1. यदि नियंत्रण उत्तेजना किसी भी सीखने की उत्तेजना के साथ मेल नहीं खाती है, तो प्रयोग न केवल जुड़ा हुआ है शुद्ध भेदभाव, लेकिन इसमें तत्व भी शामिल हैं सामान्यीकरण.
  2. यदि नियंत्रण उत्तेजना संवेदी तत्वों के एक निश्चित समूह को उत्तेजित करती है जो उन तत्वों से पूरी तरह से अलग हैं जो उसी वर्ग के पहले प्रस्तुत उत्तेजनाओं के प्रभाव में सक्रिय थे, तो प्रयोग एक जांच है। शुद्ध सामान्यीकरण.

परसेप्ट्रॉन में शुद्ध सामान्यीकरण की क्षमता नहीं होती है, लेकिन वे भेदभाव के प्रयोगों में काफी संतोषजनक ढंग से काम करते हैं, खासकर अगर नियंत्रण उत्तेजना उन पैटर्नों में से एक के साथ पर्याप्त रूप से मेल खाती है जिसके बारे में परसेप्ट्रॉन ने पहले ही कुछ अनुभव जमा कर लिया है।

पैटर्न पहचान समस्याओं के उदाहरण

  • बारकोड पहचान
  • लाइसेंस प्लेट पहचान
  • छवि पहचान
  • पृथ्वी की पपड़ी के स्थानीय क्षेत्रों की पहचान जिसमें निक्षेप स्थित हैं