कंप्यूटर फिलोलॉजी। एक अनुप्रयुक्त भाषाई अनुशासन के रूप में कम्प्यूटेशनल भाषाविज्ञान

भाषाविज्ञान (अक्षांश से। लिंगुआ -
भाषा), भाषाविज्ञान, भाषाविज्ञान - विज्ञान,
भाषाओं का अध्ययन।
यह प्राकृतिक विज्ञान है मानव भाषाआम तौर पर
और दुनिया की सभी भाषाओं के बारे में उनकी
व्यक्तिगत प्रतिनिधि।
पर व्यापक अर्थशब्द, भाषाविज्ञान
वैज्ञानिक और व्यावहारिक में विभाजित। अक्सर
सिर्फ भाषाविज्ञान से मतलब ठीक है
वैज्ञानिक भाषाविज्ञान। यह लाक्षणिकता का हिस्सा है
संकेतों का विज्ञान।
भाषाविज्ञान पेशेवर रूप से भाषाविदों द्वारा अभ्यास किया जाता है।

भाषाविज्ञान और सूचना विज्ञान।
ज़िन्दगी में आधुनिक समाज महत्वपूर्ण भूमिकास्वचालित खेलें
सूचान प्रौद्योगिकी। लेकिन विकास सूचान प्रौद्योगिकीचल रहा है
बहुत असमान: अगर आधुनिक स्तर कंप्यूटर विज्ञानतथा
संचार के साधन अद्भुत हैं, तो सिमेंटिक प्रोसेसिंग के क्षेत्र में
सूचना सफलता बहुत अधिक मामूली है। ये सफलताएं मुख्य रूप से निर्भर करती हैं
प्रक्रियाओं के अध्ययन में प्रगति मानवीय सोच, भाषण की प्रक्रिया
लोगों के बीच संचार और कंप्यूटर पर इन प्रक्रियाओं का अनुकरण करने की क्षमता। और यह अत्यधिक जटिलता का कार्य है हम बात कर रहे हेहोनहार के निर्माण पर
सूचना प्रौद्योगिकी, फिर पाठ की स्वचालित प्रसंस्करण की समस्याएं
प्राकृतिक भाषाओं में प्रस्तुत जानकारी सामने आती है।
यह इस तथ्य से निर्धारित होता है कि किसी व्यक्ति की सोच उसकी भाषा से निकटता से जुड़ी हुई है। अधिक
इसके अलावा, प्राकृतिक भाषा सोच का एक उपकरण है। वह भी है
लोगों के बीच संचार का सार्वभौमिक साधन - धारणा का साधन,
सूचना का संचय, भंडारण, प्रसंस्करण और प्रसारण।
उपयोग की समस्याएं प्राकृतिक भाषास्वचालित में
सूचना प्रसंस्करण कम्प्यूटेशनल भाषाविज्ञान का विज्ञान है। यह विज्ञान
अपेक्षाकृत हाल ही में उभरा - अर्द्धशतक और साठ के दशक के मोड़ पर
पिछली सदी। सबसे पहले, इसके गठन के दौरान, इसके विभिन्न प्रकार थे
शीर्षक: गणितीय भाषाविज्ञान, कम्प्यूटेशनल भाषाविज्ञान, इंजीनियरिंग
भाषाविज्ञान। लेकिन अस्सी के दशक की शुरुआत में यह नाम उससे चिपक गया
कंप्यूटर भाषाविज्ञान।

अभिकलनात्मक भाषाविज्ञानसमस्या समाधान से संबंधित ज्ञान का क्षेत्र है
प्राकृतिक भाषा में प्रस्तुत सूचना का स्वत: प्रसंस्करण।
केंद्रीय वैज्ञानिक समस्याएंकम्प्यूटेशनल भाषाविज्ञान एक समस्या है
ग्रंथों के अर्थ को समझने की प्रक्रिया को मॉडलिंग करना (पाठ से में संक्रमण)
इसके अर्थ का औपचारिक प्रतिनिधित्व) और भाषण संश्लेषण की समस्या (से संक्रमण .)
प्राकृतिक भाषा ग्रंथों के अर्थ का औपचारिक प्रतिनिधित्व)। ये समस्याएं
कई लागू समस्याओं को हल करते समय उत्पन्न होती हैं:
1) कंप्यूटर में टेक्स्ट दर्ज करते समय त्रुटियों का स्वत: पता लगाना और सुधार करना,
2) स्वचालित विश्लेषण और संश्लेषण मौखिक भाषण,
3) स्वचालित अनुवादएक भाषा से दूसरी भाषा में पाठ,
4) एक प्राकृतिक भाषा में कंप्यूटर के साथ संचार,
5) पाठ दस्तावेजों का स्वत: वर्गीकरण और अनुक्रमण, उनका
स्वचालित संक्षेपण, पूर्ण-पाठ डेटाबेस में दस्तावेज़ों की खोज करें।
कम्प्यूटेशनल भाषाविज्ञान के क्षेत्र में पिछली आधी सदी में,
महत्वपूर्ण वैज्ञानिक और व्यावहारिक परिणाम: मशीन की प्रणाली
एक प्राकृतिक भाषा से दूसरी भाषा में ग्रंथों का अनुवाद, स्वचालित
ग्रंथों में जानकारी के लिए खोज, स्वचालित विश्लेषण और मौखिक भाषण के संश्लेषण के लिए सिस्टम और
बहुत सारे अन्य। लेकिन निराशाएँ भी थीं। उदाहरण के लिए, मशीनी अनुवाद की समस्या
एक भाषा से दूसरी भाषा में पाठ जितना सोचा गया था उससे कहीं अधिक कठिन निकला
मशीनी अनुवाद के अग्रदूत और उनके उत्तराधिकारी। के बारे में भी यही कहा जा सकता है
ग्रंथों में जानकारी के लिए स्वचालित खोज और मौखिक विश्लेषण और संश्लेषण के कार्य के बारे में
भाषण। वैज्ञानिकों और इंजीनियरों को स्पष्ट रूप से अभी भी कड़ी मेहनत करनी होगी
वांछित परिणाम प्राप्त करें।

प्राकृतिक भाषा प्रसंस्करण (इंग्लैंड। प्राकृतिक भाषा प्रसंस्करण; वाक्य-विन्यास,
रूपात्मक, अर्थ विश्लेषणमूलपाठ)। इसमें यह भी शामिल है:
कॉर्पस भाषाविज्ञान, इलेक्ट्रॉनिक टेक्स्ट कॉरपोरेशन का निर्माण और उपयोग
सृष्टि इलेक्ट्रॉनिक शब्दकोश, थिसॉरी, ऑन्कोलॉजी। उदाहरण के लिए, लिंगवो। शब्दकोशों
उदाहरण के लिए, स्वचालित अनुवाद, वर्तनी जाँच के लिए उपयोग किया जाता है।
ग्रंथों का स्वचालित अनुवाद। रूसी अनुवादकों में लोकप्रिय
प्रोम है। मुक्त के बीच जाना जाता है गूगल अनुवादकअनुवाद करना
पाठ से तथ्यों का स्वत: निष्कर्षण (सूचना का निष्कर्षण) (अंग्रेजी तथ्य .)
निष्कर्षण, पाठ खनन)
ऑटो-एब्सट्रैक्टिंग (अंग्रेजी स्वचालित टेक्स्ट सारांश)। यह सुविधा सक्षम है
उदाहरण के लिए, माइक्रोसॉफ्ट वर्ड में।
ज्ञान प्रबंधन प्रणाली का निर्माण। विशेषज्ञ प्रणाली देखें
प्रश्न-उत्तर प्रणाली का निर्माण (अंग्रेजी प्रश्न उत्तर प्रणाली)।
ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर)। उदाहरण के लिए, फाइनरीडर
स्वचालित भाषण पहचान (एएसआर)। सशुल्क और निःशुल्क सॉफ़्टवेयर हैं
स्वचालित भाषण संश्लेषण

टिमोफीवा मारिया किरिलोवना
चिकित्सक भाषाविज्ञान विज्ञान, पुराना शोधकर्तागणित संस्थान की तार्किक प्रणालियों की प्रयोगशाला। एस.एल. सोबोलेवा एसबी आरएएस, मौलिक और अनुप्रयुक्त भाषाविज्ञान विभाग के प्रमुख, नोवोसिबिर्स्क स्टेट यूनिवर्सिटी के मानविकी संस्थान। गणितीय भाषाविज्ञान विभाग से स्नातक मानवता का कर्मचारीवर्गनोवोसिबिर्स्क स्टेट यूनिवर्सिटी.
अनुसंधान के हित: भाषाविज्ञान की दार्शनिक और पद्धतिगत नींव, तार्किक समस्याएंप्राकृतिक भाषा के शब्दार्थ और व्यावहारिकता, कार्यात्मक गणितीय मॉडलप्राकृतिक भाषा, प्राकृतिक और औपचारिक भाषाएँ।

स्टुकचेव एलेक्सी इलिच
भौतिक और गणितीय विज्ञान के उम्मीदवार, गणित संस्थान में एसोसिएट प्रोफेसर, सीनियर रिसर्च फेलो। एस.एल. सोबोलेवा एसबी आरएएस, एसोसिएट प्रोफेसर, असतत गणित और सूचना विज्ञान विभाग, यांत्रिकी और गणित के संकाय, एनएसयू, एसोसिएट प्रोफेसर, मौलिक और अनुप्रयुक्त भाषाविज्ञान विभाग, मानविकी संस्थान, एनएसयू
वैज्ञानिक हितों का क्षेत्र: गणितीय तर्क, संगणनीयता सिद्धांत (सामान्यीकृत संगणनीयता, स्वीकार्य सेटों में संगणनीयता, एचएफ-कम्प्यूटेबिलिटी), मॉडल सिद्धांत ( रचनात्मक मॉडल, सिस्टम का प्रभावी प्रतिनिधित्व, प्रतिनिधित्व की डिग्री), गणना योग्य विश्लेषण। गणितीय भाषाविज्ञानकीवर्ड: औपचारिक शब्दार्थ, मोंटागु शब्दार्थ, वितरणात्मक शब्दार्थ।

बरखनिन व्लादिमीर बोरिसोविच
प्रयोगशाला के प्रमुख शोधकर्ता सूचना संसाधनसंस्था कंप्यूटिंग प्रौद्योगिकियांएसबी आरएएस, विभाग के प्रोफेसर गणितीय मॉडलिंगयांत्रिकी और गणित के संकाय, एनएसयू, सूचना विज्ञान प्रणाली विभाग के प्रोफेसर और सामान्य सूचना विज्ञानसूचना प्रौद्योगिकी संकाय, नोवोसिबिर्स्क राज्य विश्वविद्यालय।
अनुसंधान के हित: वितरित के मॉडल का निर्माण जानकारी के सिस्टम, अर्ध-संरचित पाठ दस्तावेज़ों के प्रसंस्करण के लिए एल्गोरिदम का निर्माण, स्वचालन जटिल विश्लेषणकाव्य ग्रंथ, सूचना विज्ञान के पद्धति संबंधी मुद्दे।

ब्रुचेस ऐलेना पावलोवना
इंस्टिट्यूट ऑफ़ इंफॉर्मेटिक्स सिस्टम्स के स्नातकोत्तर छात्र के नाम पर रखा गया है। एपी एर्शोवा एसबी आरएएस, नोवोसिबिर्स्क स्टेट यूनिवर्सिटी के मानविकी संस्थान के मौलिक और अनुप्रयुक्त भाषाविज्ञान विभाग के सहायक, "ऑनपॉजिटिव" कंपनी में कम्प्यूटेशनल भाषाविद्।
अनुसंधान के हित: प्राकृतिक भाषा प्रसंस्करण, मशीन लर्निंग, कृत्रिम होशियारी।

पावलोवस्की एवगेनी निकोलाइविच
भौतिक और गणितीय विज्ञान के उम्मीदवार, नोवोसिबिर्स्क क्षेत्र की सरकार के तहत युवा वैज्ञानिकों और विशेषज्ञों की परिषद के सदस्य, नोवोसिबिर्स्क अकादमी के टेक्नोपार्क के विशेषज्ञ परिषद के सदस्य, डेटा विज्ञान पर साइबेरियाई संगोष्ठी की आयोजन समिति के अध्यक्ष और इंजीनियरिंग सम्मेलन।
व्यावसायिक लक्ष्य: बड़ी डेटा परियोजनाओं में व्यावसायिक आवश्यकताओं को औपचारिक रूप देने के लिए दृष्टिकोणों का व्यवस्थितकरण।

पलचुनोव दिमित्री एवगेनिविच
गणित संस्थान के प्रमुख शोधकर्ता। एस एल सोबोलेवा एसबी आरएएस, सामान्य सूचना विज्ञान विभाग के प्रमुख, एनएसयू, विभाग के प्रमुख "असतत गणित और सूचना विज्ञान संस्थान", यांत्रिकी और गणित के संकाय, एनएसयू।
अनुसंधान के हित: विशिष्ट आदर्शों (आई-बीजगणित) के साथ बूलियन बीजगणित के अध्ययन पर मौलिक परिणाम प्राप्त होते हैं।

स्विरिडेंको दिमित्री इवानोविच
रूसी विज्ञान अकादमी और नोवोसिबिर्स्क स्टेट यूनिवर्सिटी के साइबेरियाई शाखा के गणित संस्थान के कर्मचारी, व्यवसायी, आयोजक और सूचना, संचार और डिजिटल प्रौद्योगिकियों के क्षेत्र में काम करने वाली उच्च तकनीक कंपनियों के सह-मालिक। रूसी विज्ञान फाउंडेशन से अनुदान द्वारा वित्त पोषित सिमेंटिक मॉडलिंग पर शोध में भाग लेता है।
अनुसंधान के हित: दर्शन, कार्यप्रणाली, अनुप्रयुक्त गणितीय तर्क। अवधारणा के लेखक और गणितीय सिद्धांतसिमेंटिक मॉडलिंग, पिछली शताब्दी के 80 के दशक में रूसी विज्ञान अकादमी के शिक्षाविदों एस.एस. गोंचारोव और यू.एल. एर्शोव के साथ संयुक्त रूप से सामने रखा। वर्तमान में, वह इस अवधारणा की कार्यप्रणाली और गणितीय सिद्धांत को सक्रिय रूप से विकसित करना जारी रखता है, और इस अवधारणा के अनुप्रयोगों में भी लगा हुआ है। विभिन्न क्षेत्र. TRIZ और अन्य क्षेत्रों के संबंध में सिमेंटिक मॉडलिंग के विचारों को लागू करते हुए, एक कार्यप्रणाली, गणितीय सिद्धांत और सिमेंटिक स्मार्ट सौदों और अनुबंधों की भाषा के निर्माण पर काम करता है।

सावोस्त्यानोव अलेक्जेंडर निकोलाइविच
रिसर्च इंस्टीट्यूट ऑफ फिजियोलॉजी के डिफरेंशियल साइकोफिजियोलॉजी की प्रयोगशाला में अग्रणी शोधकर्ता और मौलिक चिकित्सा, रूसी विज्ञान अकादमी के साइबेरियन शाखा के साइटोलॉजी और जेनेटिक्स संस्थान के मनोवैज्ञानिक आनुवंशिकी के प्रयोगशाला के प्रमुख, नोवोसिबिर्स्क राज्य विश्वविद्यालय के सूचना प्रौद्योगिकी संकाय के सामान्य सूचना विज्ञान विभाग के प्रोफेसर, मौलिक विभाग के प्रोफेसर और अनुप्रयुक्त भाषाविज्ञान मानवीय संस्थानएनएसयू।
वैज्ञानिक रुचियांकीवर्ड: न्यूरोफिज़ियोलॉजी, साइकोजेनेटिक्स, न्यूरोलिंग्विस्टिक्स, जैविक संकेतों के कंप्यूटर प्रसंस्करण के तरीके। अनुसंधान का उद्देश्य सामाजिक और के आधार पर, मनुष्यों में भावात्मक विकृति के उद्भव और विकास के लिए जोखिम कारकों की पहचान करना है वातावरण की परिस्थितियाँमहत्वपूर्ण गतिविधि। अनुसंधान के हिस्से के रूप में, रूस के विभिन्न क्षेत्रों में अभियान चलाए जाते हैं ( नोवोसिबिर्स्क क्षेत्र, टायवा, याकूतिया, अल्ताई गणराज्य) और पडौसी देश(मंगोलिया, चीन) इकट्ठा करने के लिए जैविक सामग्रीऔर विभिन्न में ईईजी रिकॉर्ड का संग्रह प्रयोगात्मक शर्तों. अनुसंधान का उद्देश्य नैदानिक ​​​​प्रणालियों का निर्माण करना है जो बढ़े हुए तनाव की स्थिति में मानव व्यवहार के भावनात्मक विनियमन के उल्लंघन के जोखिम का आकलन करने की अनुमति देता है।

कंप्यूटर भाषाविज्ञान (अंग्रेजी कम्प्यूटेशनल भाषाविज्ञान से ट्रेसिंग पेपर), अनुप्रयुक्त भाषाविज्ञान के क्षेत्रों में से एक, जिसमें भाषा का अध्ययन करना और कुछ स्थितियों, स्थितियों और में भाषा के कामकाज का मॉडल तैयार करना है। समस्या क्षेत्रविकसित और प्रयुक्त कंप्यूटर प्रोग्राम, डेटा को व्यवस्थित और संसाधित करने के लिए कंप्यूटर प्रौद्योगिकियां। दूसरी ओर, यह भाषाविज्ञान और संबंधित विषयों में कंप्यूटर भाषा मॉडल के अनुप्रयोग का क्षेत्र है। एक विशेष की तरह वैज्ञानिक दिशाकम्प्यूटेशनल भाषाविज्ञान ने आकार लिया यूरोपीय अध्ययन 1960 के दशक में। क्यों कि अंग्रेजी विशेषणकम्प्यूटेशनल का अनुवाद "कम्प्यूटेशनल" के रूप में भी किया जा सकता है, शब्द "कम्प्यूटेशनल भाषाविज्ञान" भी साहित्य में पाया जाता है, हालांकि, में घरेलू विज्ञानउसे और मिलता है संकीर्ण अर्थ"मात्रात्मक भाषाविज्ञान" की अवधारणा के निकट।

अक्सर, कम्प्यूटेशनल भाषाविज्ञान "मात्रात्मक भाषाविज्ञान" शब्द को संदर्भित करता है, जो एक अंतःविषय दिशा की विशेषता है एप्लाइड रिसर्च, जहां भाषा और भाषण के अध्ययन के लिए मात्रात्मक या सांख्यिकीय विश्लेषण विधियों का उपयोग मुख्य उपकरण के रूप में किया जाता है। कभी-कभी मात्रात्मक (या मात्रात्मक) भाषाविज्ञान संयोजक भाषाविज्ञान का विरोध करता है। उत्तरार्द्ध में, प्रमुख भूमिका एक "गैर-मात्रात्मक" गणितीय उपकरण द्वारा कब्जा कर लिया जाता है - सेट सिद्धांत, गणितीय तर्क, एल्गोरिदम का सिद्धांत, आदि। सैद्धांतिक बिंदुउपयोग देखें सांख्यिकीय पद्धतियांभाषाविज्ञान में आपको पूरक करने की अनुमति मिलती है संरचनात्मक मॉडलएक संभाव्य घटक के साथ भाषा, अर्थात्, एक सैद्धांतिक संरचनात्मक-संभाव्य मॉडल बनाने के लिए जिसमें एक महत्वपूर्ण व्याख्यात्मक क्षमता है। पर आवेदन क्षेत्रमात्रात्मक भाषाविज्ञान का प्रतिनिधित्व किया जाता है, सबसे पहले, भाषा के कामकाज की भाषाई निगरानी के लिए उपयोग किए जाने वाले इस मॉडल के टुकड़ों का उपयोग करके, एन्कोडेड टेक्स्ट को डिकोड करना, टेक्स्ट के प्राधिकरण / एट्रिब्यूशन आदि का उपयोग किया जाता है।

शब्द "कम्प्यूटेशनल भाषाविज्ञान" और इस क्षेत्र की समस्याएं अक्सर संचार के मॉडलिंग से जुड़ी होती हैं, और सबसे ऊपर - एक प्राकृतिक या सीमित प्राकृतिक भाषा में कंप्यूटर के साथ मानव संपर्क के प्रावधान के साथ (इसके लिए, विशेष प्रणालीप्राकृतिक भाषा प्रसंस्करण), साथ ही सूचना पुनर्प्राप्ति प्रणाली (IPS) के सिद्धांत और व्यवहार के साथ। किसी व्यक्ति और कंप्यूटर के बीच प्राकृतिक भाषा में संचार सुनिश्चित करना कभी-कभी "प्राकृतिक भाषा प्रसंस्करण" शब्द से निरूपित होता है। अंग्रेजी भाषा केशब्द प्राकृतिक भाषा प्रसंस्करण)। कम्प्यूटेशनल भाषाविज्ञान की यह दिशा 1960 के दशक के अंत में विदेशों में उत्पन्न हुई और कृत्रिम बुद्धिमत्ता (आर। शेंक, एम। लेबोविट्स, टी। विनोग्राद, आदि द्वारा काम करता है) नामक वैज्ञानिक और तकनीकी अनुशासन के भीतर विकसित हुई। इसके अर्थ में, "प्राकृतिक भाषा प्रसंस्करण" वाक्यांश में उन सभी क्षेत्रों को शामिल किया जाना चाहिए जिनमें भाषा डेटा को संसाधित करने के लिए कंप्यूटर का उपयोग किया जाता है। व्यवहार में, हालांकि, शब्द की एक संकीर्ण समझ तय हो गई है - विधियों, प्रौद्योगिकियों और विशिष्ट प्रणालियों का विकास जो किसी व्यक्ति और कंप्यूटर के बीच प्राकृतिक या सीमित प्राकृतिक भाषा में संचार सुनिश्चित करते हैं।

कम्प्यूटेशनल भाषाविज्ञान, कुछ हद तक, हाइपरटेक्स्ट सिस्टम बनाने के क्षेत्र में कार्यों को शामिल कर सकता है, जिसे माना जाता है विशेष तरीकापाठ संगठन और यहां तक ​​कि कैसे मौलिक रूप से नया प्रकारपाठ, मुद्रण की गुटेनबर्ग परंपरा में गठित सामान्य पाठ के कई गुणों के विरोध में (गुटेनबर्ग देखें)।

कम्प्यूटेशनल भाषाविज्ञान में स्वचालित अनुवाद भी शामिल है।

कम्प्यूटेशनल भाषाविज्ञान के ढांचे के भीतर, एक अपेक्षाकृत नई दिशा सामने आई है, जो 1980 और 90 के दशक से सक्रिय रूप से विकसित हो रही है - कॉर्पस भाषाविज्ञान, जहां सामान्य सिद्धांतआधुनिक का उपयोग करते हुए भाषाई डेटा निगम (विशेष रूप से, पाठ निगम) का निर्माण कंप्यूटर तकनीक. टेक्स्ट कॉर्पोरा विशेष रूप से चयनित पुस्तकों, पत्रिकाओं, समाचार पत्रों आदि के संग्रह हैं, जिन्हें मशीन मीडिया में स्थानांतरित किया जाता है और स्वचालित प्रसंस्करण के लिए अभिप्रेत है। डब्ल्यू. फ्रांसिस के निर्देशन में 1962-63 में ब्राउन यूनिवर्सिटी (तथाकथित ब्राउन कॉर्पस) में अमेरिकी अंग्रेजी के लिए ग्रंथों के पहले संग्रह में से एक बनाया गया था। रूस में, 2000 के दशक की शुरुआत से, रूसी विज्ञान अकादमी के वी। वी। विनोग्रादोव के नाम पर रूसी भाषा संस्थान विकसित हो रहा है। राष्ट्रीय कोररूसी भाषा का, जिसमें लगभग 100 मिलियन शब्द उपयोगों की मात्रा के साथ रूसी भाषा के ग्रंथों का एक प्रतिनिधि नमूना शामिल है। डेटा कॉर्पोरा के वास्तविक निर्माण के अलावा, कॉर्पस भाषाविज्ञान टेक्स्ट कॉर्पोरा से विभिन्न जानकारी निकालने के लिए डिज़ाइन किए गए कंप्यूटर टूल (कंप्यूटर प्रोग्राम) के निर्माण में लगा हुआ है। उपयोगकर्ता के दृष्टिकोण से, टेक्स्ट कॉर्पोरा पर प्रतिनिधित्व (प्रतिनिधित्व), पूर्णता और अर्थव्यवस्था की आवश्यकताएं लगाई जाती हैं।

कम्प्यूटेशनल भाषाविज्ञान रूस और विदेशों दोनों में सक्रिय रूप से विकसित हो रहा है। इस क्षेत्र में प्रकाशनों का प्रवाह बहुत अधिक है। के अलावा विषयगत संग्रहसंयुक्त राज्य अमेरिका में 1984 के बाद से कम्प्यूटेशनल भाषाविज्ञान पत्रिका त्रैमासिक प्रकाशित हुई है। महान संगठनात्मक और वैज्ञानिकों का कामएसोसिएशन फॉर कम्प्यूटेशनल लिंग्विस्टिक्स द्वारा संचालित किया जाता है, जिसकी दुनिया भर में क्षेत्रीय संरचनाएं हैं (विशेष रूप से, यूरोपीय शाखा)। हर दो साल में अंतरराष्ट्रीय सम्मेलन होते हैं कॉलिनट (2008 में यह सम्मेलन मैनचेस्टर में आयोजित किया गया था)। रूसी अनुसंधान संस्थान आर्टिफिशियल इंटेलिजेंस द्वारा आयोजित वार्षिक अंतर्राष्ट्रीय सम्मेलन "डायलॉग" में कम्प्यूटेशनल भाषाविज्ञान की मुख्य दिशाओं पर भी चर्चा की जाती है। दर्शनशास्त्र के संकायमॉस्को स्टेट यूनिवर्सिटी, यांडेक्स और कई अन्य संगठन। प्रासंगिक मुद्दों को भी व्यापक रूप से प्रस्तुत किया जाता है अंतरराष्ट्रीय सम्मेलनविभिन्न स्तरों की कृत्रिम बुद्धि पर।

लिट।: ज्वेगिनत्सेव वी। ए। सैद्धांतिक और अनुप्रयुक्त भाषाविज्ञान। एम।, 1968; Piotrovsky R. G., Bektaev K. B., Piotrovskaya A. A. गणितीय भाषाविज्ञान। एम।, 1977; गोरोडेत्स्की बी यू। वास्तविक समस्याएंअनुप्रयुक्त भाषाविज्ञान // विदेशी भाषाविज्ञान में नया। एम।, 1983। अंक। 12; किब्रिक ए.ई. अनुप्रयुक्त भाषाविज्ञान // किब्रिक ए.ई. भाषाविज्ञान के सामान्य और अनुप्रयुक्त मुद्दों पर निबंध। एम।, 1992; कैनेडी जी। कॉर्पस भाषाविज्ञान का परिचय। एल।, 1998; बोल्शकोव I.A., Gelbukh A. कम्प्यूटेशनल भाषाविज्ञान: मॉडल, संसाधन, अनुप्रयोग। मेख।, 2004; रूसी भाषा का राष्ट्रीय कोष: 2003-2005। एम।, 2005; बारानोव ए। एन। लागू भाषाविज्ञान का परिचय। तीसरा संस्करण। एम।, 2007; कम्प्यूटेशनल भाषाविज्ञान और बुद्धिमान प्रौद्योगिकियां। एम।, 2008। अंक। 7.

परिचय

कम्प्यूटेशनल भाषाविज्ञान क्या है?

कंप्यूटर भाषाविज्ञान , अनुप्रयुक्त भाषाविज्ञान में एक दिशा, कंप्यूटर टूल्स के उपयोग पर केंद्रित - प्रोग्राम, डेटा को व्यवस्थित और संसाधित करने के लिए कंप्यूटर प्रौद्योगिकियां - कुछ स्थितियों, स्थितियों, समस्या क्षेत्रों आदि में किसी भाषा के कामकाज के मॉडलिंग के लिए, साथ ही साथ संपूर्ण क्षेत्र भाषा विज्ञान और संबंधित विषयों में कंप्यूटर भाषा मॉडल की। दरअसल, केवल . में अंतिम मामलाऔर के बारे में बात कर रहे हैं अनुप्रयुक्त भाषा शास्त्रसख्त अर्थों में, चूंकि किसी भाषा के कंप्यूटर मॉडलिंग को भाषा विज्ञान की समस्याओं को हल करने के लिए कंप्यूटर विज्ञान और प्रोग्रामिंग सिद्धांत के अनुप्रयोग के क्षेत्र के रूप में भी माना जा सकता है। व्यवहार में, हालांकि, भाषाविज्ञान में कंप्यूटर के उपयोग से संबंधित लगभग हर चीज को कम्प्यूटेशनल भाषाविज्ञान कहा जाता है।

एक विशेष वैज्ञानिक दिशा के रूप में, कम्प्यूटेशनल भाषाविज्ञान ने 1960 के दशक में आकार लिया। रूसी शब्द "कम्प्यूटेशनल भाषाविज्ञान" अंग्रेजी कम्प्यूटेशनल भाषाविज्ञान से एक ट्रेसिंग-पेपर है। चूंकि रूसी में विशेषण कम्प्यूटेशनल का अनुवाद "कम्प्यूटेशनल" के रूप में भी किया जा सकता है, शब्द "कम्प्यूटेशनल भाषाविज्ञान" भी साहित्य में पाया जाता है, लेकिन रूसी विज्ञान में यह "मात्रात्मक भाषाविज्ञान" की अवधारणा के निकट एक संकुचित अर्थ प्राप्त करता है। इस क्षेत्र में प्रकाशनों का प्रवाह बहुत अधिक है। विषयगत संग्रह के अलावा, कम्प्यूटेशनल भाषाविज्ञान पत्रिका संयुक्त राज्य अमेरिका में त्रैमासिक रूप से प्रकाशित होती है। कम्प्यूटेशनल भाषाविज्ञान एसोसिएशन द्वारा एक बड़ा संगठनात्मक और वैज्ञानिक कार्य किया जाता है, जिसमें क्षेत्रीय संरचनाएं होती हैं (विशेष रूप से, यूरोपीय शाखा)। हर दो साल में कम्प्यूटेशनल भाषाविज्ञान - कॉलिंग पर अंतर्राष्ट्रीय सम्मेलन होते हैं। कृत्रिम बुद्धि पर विभिन्न सम्मेलनों में भी प्रासंगिक मुद्दों का व्यापक रूप से प्रतिनिधित्व किया जाता है।

कार्य

अभिकलनात्मक भाषाविज्ञान भाषा गतिविधि के कंप्यूटर मॉडलिंग की वास्तविक भाषाई समस्याओं को लेता है। इसका कार्य विश्लेषण और संश्लेषण के लिए अधिक सटीक और अधिक संपूर्ण भाषाई मॉडल और अधिक उन्नत एल्गोरिदम का निर्माण करना है।

मुख्य दिशाएँ हैं:

1) मानव-कंप्यूटर संपर्क: नियंत्रण - प्रोग्रामिंग भाषाएं, सूचना हस्तांतरण - इंटरफ़ेस।

2) ग्रंथों के साथ कार्य करना: अनुक्रमण, विश्लेषण और वर्गीकरण, स्वचालित संपादन (त्रुटि सुधार), ज्ञान का पता लगाना, मशीनी अनुवाद।

कहानी

डेटाबेस तक पहुँचने के लिए अंग्रेजी भाषा के एक सबसेट की एक सरल पीढ़ी 70 के दशक में बनाई गई प्रारंभिक अमेरिकी प्रणाली LIFER (लैंग्वेज इंटरफेस फैसिलिटी विच एलीप्सिस एंड रिकर्सन) द्वारा प्रदान की गई थी। इसके बाद, कंप्यूटर बाजार में अन्य, अधिक लचीली प्रणालियाँ दिखाई दीं, जो कंप्यूटर के साथ एक सीमित प्राकृतिक भाषा इंटरफ़ेस प्रदान करती हैं।

1980 के दशक में, संयुक्त राज्य अमेरिका में डेटाबेस और विशेषज्ञ प्रणालियों के साथ प्राकृतिक भाषा इंटरफेस के विकास और बिक्री में लगी कई कंपनियों का गठन किया गया था। 1985 में Semantec Corporation ने ऐसा प्रश्नोत्तर सॉफ्टवेयर पैकेज प्रस्तुत किया, कार्नेगी समूह ने एक समान LanguageCraft पैकेज की पेशकश की।

स्वचालित अनुवाद प्रणाली बनाने के लिए सक्रिय कार्य चल रहा है। अमेरिकी वायु सेना द्वारा कमीशन डी. टॉम के निर्देशन में विकसित SYSTRAN स्वचालित अनुवाद प्रणाली व्यापक हो गई है। 1974 - 1975 के दौरान। इस प्रणाली का उपयोग नासा एयरोस्पेस एसोसिएशन द्वारा अपोलो-सोयुज परियोजना के दस्तावेजों का अनुवाद करने के लिए किया गया था। आजकल, वह कई भाषाओं से सालाना लगभग 100,000 पृष्ठों का अनुवाद करती है।

यूरोप में, कंप्यूटर अनुवाद प्रणालियों के निर्माण पर काम यूरोपीय सूचना नेटवर्क (यूरोनेट डायना) के गठन से प्रेरित था। 1982 में, यूरोपीय आर्थिक समुदाय ने यूरोपीय यूरोट्रा कार्यक्रम के निर्माण की घोषणा की, जिसका उद्देश्य एक प्रणाली विकसित करना है कंप्यूटर अनुवादसभी के लिए यूरोपीय भाषाएं. प्रारंभ में, परियोजना का अनुमान $ 12 मिलियन था; 1987 में, विशेषज्ञों ने इस परियोजना की कुल लागत $160 मिलियन से अधिक निर्धारित की।

जापान में, कम्प्यूटेशनल भाषाविज्ञान अनुसंधान 1981 में शुरू किए गए एक राष्ट्रव्यापी पांचवीं पीढ़ी के कंप्यूटर प्रोग्राम के आसपास केंद्रित है।

प्राकृतिक भाषा में मानव-मशीन इंटरफेस बनाने के लिए कई सैन्य परियोजनाएं हैं। संयुक्त राज्य अमेरिका में, उन्हें मुख्य रूप से सामरिक कंप्यूटर पहल के हिस्से के रूप में चलाया जाता है, जो 1983 में रक्षा विभाग द्वारा अपनाया गया दस साल का कार्यक्रम है। इसका लक्ष्य क्रम में "बुद्धिमान" हथियारों और सैन्य प्रणालियों की एक नई पीढ़ी बनाना है। संयुक्त राज्य अमेरिका की दीर्घकालिक तकनीकी श्रेष्ठता सुनिश्चित करने के लिए।

स्वाभाविक रूप से, कृत्रिम बुद्धि विशेषज्ञ, जो कंप्यूटर और प्रोग्रामिंग भाषाओं में अच्छी तरह से वाकिफ हैं, अपने तरीकों से भाषा को समझने की समस्या को हल करने के लिए ऊर्जावान रूप से तैयार हैं। प्राकृतिक भाषा एल्गोरिदम की खोज की गई थी। बहुत ही संकीर्ण विशेष क्षेत्रों के लिए जटिल भाषा समझ कार्यक्रम बनाए गए, आंशिक मशीन अनुवाद कार्यक्रम लागू किए गए, और कई अन्य। लेकिन भाषा को समझने की समस्या को हल करने में कोई निर्णायक प्रगति नहीं हुई। भाषा और मनुष्य इतने जुड़े हुए हैं कि वैज्ञानिकों को दुनिया को मनुष्य द्वारा समझने की समस्या से जूझना पड़ा। और यह दर्शन का क्षेत्र है।

भाषाविज्ञान की बुनियादी अवधारणाएं

शब्द "कम्प्यूटेशनल भाषाविज्ञान" आमतौर पर कंप्यूटर टूल्स का उपयोग करने के एक विस्तृत क्षेत्र को संदर्भित करता है - प्रोग्राम, डेटा को व्यवस्थित और संसाधित करने के लिए कंप्यूटर प्रौद्योगिकियां - कुछ स्थितियों, स्थितियों, समस्या क्षेत्रों, साथ ही दायरे में किसी भाषा के कामकाज को मॉडल करने के लिए। कंप्यूटर भाषा मॉडल के केवल भाषाविज्ञान में, बल्कि संबंधित विषयों में भी। दरअसल, केवल बाद के मामले में हम सख्त अर्थों में व्यावहारिक भाषाविज्ञान के बारे में बात कर रहे हैं, क्योंकि कंप्यूटर भाषा मॉडलिंग को भाषाविज्ञान के क्षेत्र में प्रोग्रामिंग सिद्धांत (कंप्यूटर विज्ञान) के अनुप्रयोग के क्षेत्र के रूप में भी माना जा सकता है। फिर भी, सामान्य अभ्यास ऐसा है कि कम्प्यूटेशनल भाषाविज्ञान का दायरा भाषाविज्ञान में कंप्यूटर के उपयोग से संबंधित लगभग सभी चीजों को शामिल करता है: "कम्प्यूटेशनल भाषाविज्ञान" शब्द विभिन्न प्रकार के वैज्ञानिक और व्यावहारिक कार्यइन समस्याओं को हल करने के तरीकों को सीमित किए बिना भाषा से जुड़े।

कम्प्यूटेशनल भाषाविज्ञान का संस्थागत पहलू. एक विशेष वैज्ञानिक दिशा के रूप में, कम्प्यूटेशनल भाषाविज्ञान ने 60 के दशक में आकार लिया। इस क्षेत्र में प्रकाशनों का प्रवाह बहुत अधिक है। विषयगत संग्रह के अलावा, संयुक्त राज्य अमेरिका में कम्प्यूटेशनल भाषाविज्ञान पत्रिका त्रैमासिक प्रकाशित होती है। कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन द्वारा एक बड़ा संगठनात्मक और वैज्ञानिक कार्य किया जाता है, जिसमें दुनिया भर में क्षेत्रीय संरचनाएं हैं (विशेष रूप से, यूरोपीय शाखा)। हर दो साल में कम्प्यूटेशनल भाषाविज्ञान - कोलिंग पर अंतर्राष्ट्रीय सम्मेलन होते हैं। विभिन्न स्तरों पर कृत्रिम बुद्धिमत्ता पर अंतर्राष्ट्रीय सम्मेलनों में प्रासंगिक मुद्दों का भी व्यापक रूप से प्रतिनिधित्व किया जाता है।

कम्प्यूटेशनल भाषाविज्ञान का संज्ञानात्मक टूलकिट

एक विशेष के रूप में कम्प्यूटेशनल भाषाविज्ञान अनुप्रयुक्त अनुशासनउपकरण द्वारा मुख्य रूप से बाहर खड़ा है - अर्थात उपयोग द्वारा कंप्यूटर सुविधाएंभाषा डेटा का प्रसंस्करण। चूंकि कंप्यूटर प्रोग्राम जो किसी भाषा के कामकाज के कुछ पहलुओं को मॉडल करते हैं, वे विभिन्न प्रोग्रामिंग टूल का उपयोग कर सकते हैं, ऐसा लगता है कि एक सामान्य धातुभाषा के बारे में बात करने की कोई आवश्यकता नहीं है। हालाँकि, ऐसा नहीं है। सामान्य सिद्धांत हैं कंप्यूटर सिमुलेशनसोच, जो एक तरह से या किसी अन्य में महसूस की जाती है कंप्यूटर मॉडल. यह भाषा में विकसित ज्ञान के सिद्धांत पर आधारित है कृत्रिम होशियारीऔर संज्ञानात्मक विज्ञान की एक महत्वपूर्ण शाखा का गठन।

ज्ञान के सिद्धांत की मुख्य थीसिस में कहा गया है कि सोच ज्ञान को संसाधित करने और उत्पन्न करने की एक प्रक्रिया है। "ज्ञान" या "ज्ञान" को एक अपरिभाषित श्रेणी माना जाता है। ज्ञान को संसाधित करने वाला "प्रोसेसर" है संज्ञानात्मक प्रणालीव्यक्ति। ज्ञानमीमांसा और संज्ञानात्मक विज्ञान में, दो मुख्य प्रकार के ज्ञान प्रतिष्ठित हैं - घोषणात्मक ("क्या जानना") और प्रक्रियात्मक ("जानना कैसे"))। घोषणात्मक ज्ञान आमतौर पर प्रस्तावों के एक सेट के रूप में प्रस्तुत किया जाता है, किसी चीज के बारे में बयान। एक विशिष्ट उदाहरणघोषणात्मक ज्ञान को सामान्य शब्दों में व्याख्या माना जा सकता है व्याख्यात्मक शब्दकोश. उदाहरण के लिए, एक कप] - "एक छोटा गोल पीने का बर्तन, आमतौर पर एक हैंडल के साथ, चीनी मिट्टी के बरतन, फ़ाइनेस, आदि से बना होता है।"। घोषणात्मक ज्ञान "सच्चे-झूठे" के संदर्भ में सत्यापन प्रक्रिया के लिए उधार देता है। प्रक्रियात्मक ज्ञान को संचालन, किए जाने वाले कार्यों के अनुक्रम (सूची) के रूप में प्रस्तुत किया जाता है। यह मेरे जैसा है सामान्य निर्देशकिसी दिए गए स्थिति में कार्यों के बारे में। प्रक्रियात्मक ज्ञान का एक विशिष्ट उदाहरण घरेलू उपकरणों के उपयोग के लिए निर्देश है।

घोषणात्मक ज्ञान के विपरीत, प्रक्रियात्मक ज्ञान को सत्य या असत्य के रूप में सत्यापित नहीं किया जा सकता है। उनका मूल्यांकन केवल एल्गोरिथम की सफलता या विफलता से किया जा सकता है।

कम्प्यूटेशनल भाषाविज्ञान के संज्ञानात्मक टूलकिट की अधिकांश अवधारणाएं समानार्थी हैं: वे एक साथ मानव संज्ञानात्मक प्रणाली की कुछ वास्तविक संस्थाओं और कुछ धातुओं में इन संस्थाओं का प्रतिनिधित्व करने के तरीकों को नामित करते हैं। दूसरे शब्दों में, धातुभाषा के तत्वों का एक औपचारिक और वाद्य पहलू होता है। औपचारिक रूप से, घोषणात्मक और प्रक्रियात्मक ज्ञान का पृथक्करण किससे मेल खाता है अलग - अलग प्रकारमानव संज्ञानात्मक प्रणाली का ज्ञान। तो, के बारे में ज्ञान विशिष्ट विषय, वास्तविकता की वस्तुएं मुख्य रूप से घोषणात्मक होती हैं, और किसी व्यक्ति की चलने, दौड़ने, कार चलाने की कार्यात्मक क्षमता को संज्ञानात्मक प्रणाली में प्रक्रियात्मक ज्ञान के रूप में महसूस किया जाता है। यंत्रवत्, ज्ञान (ऑटोलॉजिकल रूप से प्रक्रियात्मक और घोषणात्मक दोनों) को विवरण, विवरण और एक एल्गोरिथम के रूप में एक निर्देश के रूप में दर्शाया जा सकता है। दूसरे शब्दों में, वास्तविकता "तालिका" की वस्तु के बारे में औपचारिक रूप से घोषणात्मक ज्ञान को प्रक्रियात्मक रूप से निर्देशों के एक सेट के रूप में, इसके निर्माण के लिए एल्गोरिदम, असेंबली (= प्रक्रियात्मक ज्ञान का रचनात्मक पहलू) या इसके सामान्य उपयोग के लिए एल्गोरिदम के रूप में प्रस्तुत किया जा सकता है (= कार्यात्मक पहलूप्रक्रियात्मक ज्ञान)। पहले मामले में, यह नौसिखिए बढ़ई के लिए एक मार्गदर्शक हो सकता है, और दूसरे में, एक कार्यालय डेस्क की संभावनाओं का विवरण। इसका विलोम भी सत्य है: औपचारिक रूप से प्रक्रियात्मक ज्ञान को घोषणात्मक रूप से दर्शाया जा सकता है।

इसके लिए एक अलग चर्चा की आवश्यकता है कि क्या किसी औपचारिक रूप से घोषणात्मक ज्ञान को प्रक्रियात्मक, और किसी भी औपचारिक रूप से प्रक्रियात्मक - घोषणात्मक के रूप में दर्शाया जा सकता है। शोधकर्ता इस बात से सहमत हैं कि किसी भी घोषणात्मक ज्ञान को सिद्धांत रूप में प्रक्रियात्मक रूप से दर्शाया जा सकता है, हालांकि यह एक संज्ञानात्मक प्रणाली के लिए बहुत ही गैर-आर्थिक हो सकता है। रिवर्स शायद ही सच है। तथ्य यह है कि घोषणात्मक ज्ञान बहुत अधिक स्पष्ट है, प्रक्रियात्मक ज्ञान की तुलना में किसी व्यक्ति को समझना आसान है। घोषणात्मक ज्ञान के विपरीत, प्रक्रियात्मक ज्ञान मुख्य रूप से निहित है। इसलिए, भाषिक क्षमता, प्रक्रियात्मक ज्ञान होने के कारण, एक व्यक्ति से छिपा हुआ है, उसके द्वारा महसूस नहीं किया जाता है। भाषा के कामकाज के तंत्र की खोज करने का प्रयास शिथिलता की ओर ले जाता है। उदाहरण के लिए, शाब्दिक शब्दार्थ के क्षेत्र में विशेषज्ञ जानते हैं कि शब्द सामग्री योजना का अध्ययन करने के लिए आवश्यक दीर्घकालिक शब्दार्थ आत्मनिरीक्षण इस तथ्य की ओर जाता है कि शोधकर्ता आंशिक रूप से सही और के बीच अंतर करने की क्षमता खो देता है। दुरुपयोगविश्लेषित शब्द। अन्य उदाहरणों का हवाला दिया जा सकता है। ज्ञात हो कि यांत्रिकी की दृष्टि से मानव शरीर है जटिल सिस्टमदो परस्पर क्रिया करने वाले पेंडुलम।

ज्ञान सिद्धांत में, ज्ञान का अध्ययन और प्रतिनिधित्व किया जाता है विभिन्न संरचनाएंज्ञान - फ्रेम, परिदृश्य, योजनाएँ। एम. मिन्स्की के अनुसार, "एक फ्रेम एक डेटा संरचना है जिसे एक रूढ़िवादी स्थिति का प्रतिनिधित्व करने के लिए डिज़ाइन किया गया है" [मिन्स्की 1978, पृष्ठ 254]। अधिक विस्तार से, हम कह सकते हैं कि फ्रेम एक विशिष्ट रूप से एकीकृत स्थिति के बारे में ज्ञान के घोषणात्मक प्रतिनिधित्व के लिए एक वैचारिक संरचना है जिसमें कुछ शब्दार्थ संबंधों से जुड़े स्लॉट होते हैं। चित्रण के प्रयोजनों के लिए, एक फ्रेम को अक्सर एक तालिका के रूप में दर्शाया जाता है, जिसकी पंक्तियाँ स्लॉट बनाती हैं। प्रत्येक स्लॉट का अपना नाम और सामग्री होती है (तालिका 1 देखें)।

तालिका एक

तालिका दृश्य में "तालिका" फ़्रेम का टुकड़ा

निर्भर करना विशिष्ट कार्यफ्रेम संरचना काफी अधिक जटिल हो सकती है; एक फ्रेम में नेस्टेड सबफ्रेम और अन्य फ्रेम के संदर्भ शामिल हो सकते हैं।

एक तालिका के बजाय, प्रतिनिधित्व का एक विधेय रूप अक्सर उपयोग किया जाता है। इस मामले में, फ्रेम एक विधेय या तर्कों के साथ एक फ़ंक्शन के रूप में होता है। एक फ्रेम का प्रतिनिधित्व करने के अन्य तरीके हैं। उदाहरण के लिए, इसे एक टपल के रूप में दर्शाया जा सकता है निम्नलिखित प्रकार: ((फ्रेम नाम) (स्लॉट नाम)) (स्लॉट मान,),..., (स्लॉट नाम n) (स्लॉट मान n))।

आमतौर पर, ज्ञान प्रतिनिधित्व भाषाओं में फ्रेम का यह रूप होता है।

कम्प्यूटेशनल भाषाविज्ञान की अन्य संज्ञानात्मक श्रेणियों की तरह, एक फ्रेम की अवधारणा समानार्थी है। ऑन्कोलॉजिकल रूप से, यह मानव संज्ञानात्मक प्रणाली का एक हिस्सा है, और इस अर्थ में, फ्रेम की तुलना गेस्टाल्ट, प्रोटोटाइप, स्टीरियोटाइप, स्कीम जैसी अवधारणाओं से की जा सकती है। संज्ञानात्मक मनोविज्ञान में, इन श्रेणियों को एक ऑन्कोलॉजिकल दृष्टिकोण से ठीक माना जाता है। तो, डी। नॉर्मन मानव संज्ञानात्मक प्रणाली में ज्ञान के अस्तित्व और संगठन के दो मुख्य तरीकों को अलग करता है - अर्थ नेटवर्क और योजनाएं। "योजनाएं," वे लिखते हैं, "ज्ञान के व्यक्तिगत, स्व-निहित इकाइयों का प्रतिनिधित्व करने के लिए एकत्रित ज्ञान के संगठित पैकेट हैं। सैम के लिए मेरी स्कीमा में वह जानकारी हो सकती है जो उसका वर्णन करती है भौतिक विशेषताऐं, इसकी गतिविधि और व्यक्तिगत खासियतें. यह स्कीमा अन्य स्कीमाओं से संबंधित है जो इसके अन्य पहलुओं का वर्णन करते हैं" [नॉर्मन 1998, पृष्ठ 359]। यदि हम फ्रेम श्रेणी के सहायक पक्ष को लेते हैं, तो यह ज्ञान के घोषणात्मक प्रतिनिधित्व के लिए एक संरचना है। मौजूदा एआई सिस्टम में, फ्रेम कर सकते हैं जटिल संरचनाएंज्ञान; फ्रेम सिस्टम पदानुक्रम की अनुमति देता है - एक फ्रेम दूसरे फ्रेम का हिस्सा हो सकता है।

सामग्री के संदर्भ में, फ्रेम की अवधारणा व्याख्या की श्रेणी के बहुत करीब है। दरअसल, एक स्लॉट वैलेंस का एक एनालॉग है, एक स्लॉट को भरना एक एक्टेंट का एक एनालॉग है। उनके बीच मुख्य अंतर यह है कि व्याख्या में शब्द की सामग्री की योजना के बारे में केवल भाषाई रूप से प्रासंगिक जानकारी होती है, और फ्रेम, सबसे पहले, शब्द से जरूरी नहीं है, और दूसरी बात, किसी दिए गए समस्या से संबंधित सभी जानकारी शामिल है स्थिति, जिसमें बहिर्भाषिक (दुनिया का ज्ञान) शामिल है 3)।

एक परिदृश्य एक रूढ़िबद्ध स्थिति या व्यवहार के बारे में ज्ञान के प्रक्रियात्मक प्रतिनिधित्व के लिए एक वैचारिक ढांचा है। स्क्रिप्ट तत्व एक एल्गोरिथम या निर्देश के चरण हैं। लोग आमतौर पर "रेस्तरां परिदृश्य", "खरीद परिदृश्य" आदि के बारे में बात करते हैं।

प्रारंभ में फ्रेम का उपयोग प्रक्रियात्मक प्रस्तुति के लिए भी किया जाता था (cf. शब्द "प्रक्रियात्मक फ्रेम"), लेकिन शब्द "परिदृश्य" अब इस अर्थ में अधिक सामान्यतः उपयोग किया जाता है। एक परिदृश्य को न केवल एक एल्गोरिथ्म के रूप में, बल्कि एक नेटवर्क के रूप में भी दर्शाया जा सकता है, जिसके कोने कुछ स्थितियों के अनुरूप होते हैं, और आर्क स्थितियों के बीच कनेक्शन के अनुरूप होते हैं। एक परिदृश्य की अवधारणा के साथ, कुछ शोधकर्ता बुद्धि के कंप्यूटर मॉडलिंग के लिए एक स्क्रिप्ट की श्रेणी का उपयोग करते हैं। आर। शेंक के अनुसार, एक स्क्रिप्ट कुछ आम तौर पर स्वीकृत, प्रसिद्ध अनुक्रम है करणीय संबंध. उदाहरण के लिए, संवाद को समझना

सड़क पर बाल्टी की तरह बरसता है।

आपको अभी भी स्टोर पर जाना है: घर में कुछ भी नहीं है - कल मेहमानों ने सब कुछ साफ कर दिया।

"if ." जैसे गैर-स्पष्ट अर्थ संबंधी लिंक पर आधारित है बारिश हो रही है, बाहर जाना अवांछनीय है, क्योंकि आप बीमार हो सकते हैं।" ये कनेक्शन एक स्क्रिप्ट बनाते हैं, जिसका उपयोग देशी वक्ताओं द्वारा एक-दूसरे के मौखिक और गैर-मौखिक व्यवहार को समझने के लिए किया जाता है।

एक विशिष्ट समस्या स्थिति के लिए परिदृश्य को लागू करने के परिणामस्वरूप, a योजना) ब्लूप्रिंट का उपयोग के बारे में ज्ञान का प्रक्रियात्मक रूप से प्रतिनिधित्व करने के लिए किया जाता है संभावित क्रियाएंउपलब्धि के लिए अग्रणी खास वज़ह. एक योजना एक लक्ष्य को क्रियाओं के अनुक्रम से संबंधित करती है।

पर सामान्य मामलायोजना में प्रक्रियाओं का एक क्रम शामिल है जो सिस्टम की प्रारंभिक स्थिति को अंतिम स्थिति में स्थानांतरित करता है और एक विशिष्ट उप-लक्ष्य और लक्ष्य की उपलब्धि की ओर ले जाता है। एआई सिस्टम में, योजना संबंधित मॉड्यूल की योजना या नियोजन गतिविधि के परिणामस्वरूप उत्पन्न होती है - नियोजन मॉड्यूल। नियोजन प्रक्रिया एक समस्या की स्थिति को हल करने के लिए परीक्षण प्रक्रियाओं द्वारा सक्रिय एक या अधिक परिदृश्यों से डेटा के अनुकूलन पर आधारित हो सकती है। योजना का निष्पादन एक कार्यकारी मॉड्यूल द्वारा किया जाता है जो संज्ञानात्मक प्रक्रियाओं को नियंत्रित करता है और शारीरिक क्रियाएंसिस्टम प्राथमिक मामले में, योजना बौद्धिक प्रणालीसंचालन का एक सरल अनुक्रम है; अधिक जटिल संस्करणों में, योजना एक विशिष्ट विषय, उसके संसाधनों, क्षमताओं, लक्ष्यों, विस्तृत जानकारीसमस्याग्रस्त स्थिति के बारे में, आदि। योजना का उद्भव दुनिया के मॉडल के बीच संचार की प्रक्रिया में होता है, जिसका एक हिस्सा परिदृश्यों, योजना मॉड्यूल और कार्यकारी मॉड्यूल द्वारा बनता है।

एक स्क्रिप्ट के विपरीत, एक योजना के बारे में है विशिष्ट स्थिति, एक विशिष्ट कलाकार और एक विशिष्ट लक्ष्य की उपलब्धि का पीछा करता है। योजना का चुनाव ठेकेदार के संसाधनों द्वारा नियंत्रित होता है। योजना व्यवहार्यता - आवश्यक शर्तसंज्ञानात्मक प्रणाली में इसकी पीढ़ी, और संतुष्टि की विशेषता परिदृश्य के लिए अनुपयुक्त है।

दूसरा महत्वपूर्ण अवधारणा- दुनिया का मॉडल। दुनिया के मॉडल को आमतौर पर एक निश्चित तरीके से आयोजित दुनिया के बारे में ज्ञान के एक सेट के रूप में समझा जाता है, जो एक संज्ञानात्मक प्रणाली या उसके कंप्यूटर मॉडल में निहित है। कुछ और में सामान्य दृष्टि सेदुनिया के मॉडल को संज्ञानात्मक प्रणाली के एक हिस्से के रूप में कहा जाता है जो दुनिया की संरचना, उसके पैटर्न आदि के बारे में ज्ञान संग्रहीत करता है। दूसरे अर्थ में, दुनिया का मॉडल पाठ को समझने के परिणामों से जुड़ा है या, अधिक व्यापक रूप से, प्रवचन। प्रवचन को समझने की प्रक्रिया में, इसके मानसिक मॉडल का निर्माण किया जाता है, जो पाठ की सामग्री की योजना और इस विषय में निहित दुनिया के बारे में ज्ञान के बीच बातचीत का परिणाम है [जॉनसन-लेयर्ड 1988, पृष्ठ 237 एट सेक।]। पहली और दूसरी समझ अक्सर संयुक्त होती हैं। यह संज्ञानात्मक भाषाविज्ञान और संज्ञानात्मक विज्ञान के भीतर काम करने वाले भाषाई शोधकर्ताओं के लिए विशिष्ट है।

फ्रेम की श्रेणी से निकटता से संबंधित एक दृश्य की अवधारणा है। दृश्य श्रेणी का उपयोग मुख्य रूप से साहित्य में वास्तविक के घोषणात्मक प्रतिनिधित्व के लिए वैचारिक संरचना के पदनाम के रूप में किया जाता है भाषण अधिनियमऔर समर्पित भाषा का अर्थ है(टोकन, वाक्यात्मक निर्माण, व्याकरणिक श्रेणियांआदि) स्थितियाँ और उनके भाग 5)। भाषाई रूपों से जुड़े होने के कारण, दृश्य अक्सर अद्यतन किया जाता है निश्चित शब्दया अभिव्यक्ति। कथानक व्याकरण में (नीचे देखें), एक दृश्य एक प्रकरण या कथा के भाग के रूप में प्रकट होता है। विशिष्ट उदाहरणदृश्य - क्यूब्स का एक सेट जिसके साथ एआई सिस्टम काम करता है, कहानी में दृश्य और कार्रवाई में भाग लेने वाले आदि। आर्टिफिशियल इंटेलिजेंस में, इमेज रिकग्निशन सिस्टम के साथ-साथ अनुसंधान-उन्मुख कार्यक्रमों (विश्लेषण, विवरण) में दृश्यों का उपयोग किया जाता है। समस्या की स्थिति. एक दृश्य की अवधारणा सैद्धांतिक भाषाविज्ञान में व्यापक हो गई है, साथ ही तर्क में, विशेष रूप से स्थितिजन्य शब्दार्थ में, जिसमें अर्थ शाब्दिक इकाईसीधे दृश्य से जुड़ता है।