सार्वभौमिक भाषा मॉड्यूल। छात्र स्वायत्तता विकसित करने के लिए मॉड्यूलर विदेशी भाषा शिक्षण का उपयोग करना

आधुनिक तकनीकों में से एक जो शिक्षा के प्रतिमान को बदलने की समस्या को हल करने की अनुमति देती है, वह है मॉड्यूलर शिक्षा, क्योंकि यह शैक्षणिक प्रक्रिया के निर्माण के लिए एक सक्रिय, सक्रिय, लचीले दृष्टिकोण की स्थिति पर आधारित है।

80 के दशक के अंत में - XX सदी के शुरुआती 90 के दशक में, तकनीकी विज्ञान के क्षेत्र से एक नया शब्द "फट" शैक्षणिक विज्ञान में, अर्थात् "मॉड्यूल"। मापांक (अक्षांश से। मापांक-"छोटा उपाय") - एक अभिन्न अंग, अलग करने योग्य या कम से कम मानसिक रूप से सामान्य से अलग। मॉड्यूलर आमतौर पर स्पष्ट रूप से परिभाषित भागों से युक्त एक चीज़ कहा जाता है, जिसे अक्सर पूरी चीज़ को नष्ट किए बिना हटाया या जोड़ा जा सकता है।

शिक्षा प्रणाली में मॉड्यूलर लर्निंग के लाभों के बारे में बहुत कुछ लिखा और बोला गया है। मॉड्यूलर लर्निंग - शैक्षिक जानकारी के ब्लॉक-मॉड्यूलर प्रस्तुति के आधार पर शैक्षिक प्रक्रिया को व्यवस्थित करने की एक विधि।

मॉड्यूलर प्रशिक्षण का सार यह है कि प्रशिक्षण की सामग्री को स्वायत्त संगठनात्मक और कार्यप्रणाली ब्लॉकों में संरचित किया जाता है - मॉड्यूल, जिसकी सामग्री और मात्रा छात्रों के उपदेशात्मक लक्ष्यों, प्रोफ़ाइल और स्तर के भेदभाव, छात्रों की इच्छाओं के आधार पर भिन्न हो सकती है। प्रशिक्षण पाठ्यक्रम के साथ आंदोलन का व्यक्तिगत प्रक्षेपवक्र। मॉड्यूल अनिवार्य और वैकल्पिक हो सकते हैं। मॉड्यूल स्वयं बनते हैं: विशेषता में पाठ्यक्रम की संरचनात्मक इकाई के रूप में; एक संगठनात्मक और पद्धतिगत अंतःविषय संरचना के रूप में, विभिन्न विषयों के वर्गों के एक सेट के रूप में, विषयगत आधार से एकजुट; या एक अकादमिक अनुशासन के ढांचे के भीतर एक संगठनात्मक और पद्धतिगत संरचनात्मक इकाई के रूप में। मॉड्यूलर प्रशिक्षण का एक आवश्यक तत्व आमतौर पर ज्ञान का आकलन करने के लिए एक रेटिंग प्रणाली है, जिसमें प्रत्येक मॉड्यूल के अध्ययन के परिणामों के आधार पर छात्रों की प्रगति का स्कोरिंग शामिल है।

शैक्षणिक विज्ञान में, मॉड्यूल को पूरे सिस्टम का एक महत्वपूर्ण हिस्सा माना जाता है, जिसके ज्ञान के बिना डिडक्टिक सिस्टम काम नहीं करता है। इसकी सामग्री के संदर्भ में, यह एक पूर्ण, तार्किक रूप से पूर्ण ब्लॉक है।

मॉड्यूलर शिक्षा, आंशिक रूप से इंग्लैंड और स्वीडन के स्कूलों में उपयोग की जाती है, प्रतिरूपकता के नियमों के अनुसार बनाई गई है, जब शैक्षिक सामग्री का डिज़ाइन यह सुनिश्चित करता है कि प्रत्येक छात्र निर्धारित उपदेशात्मक कार्यों को प्राप्त करता है, मॉड्यूल में सामग्री की पूर्णता और एकीकरण है विभिन्न प्रकार और शिक्षा के रूपों के। इस तरह के प्रशिक्षण के परिणामस्वरूप प्राप्त सकारात्मक प्रभाव इसकी गतिशीलता से जुड़ा है, जिसमें तत्वों और मॉड्यूल की सामग्री की परिवर्तनशीलता शामिल है। इस प्रशिक्षण के लक्ष्यों को गतिविधि के तरीकों और क्रिया के तरीकों के संदर्भ में तैयार किया जाता है, जिन्हें अनुभूति के चक्रों और अन्य प्रकार की गतिविधि के चक्रों में विभाजित किया जाता है। मॉड्यूलर लर्निंग को एक समस्याग्रस्त दृष्टिकोण, सीखने के लिए छात्र के रचनात्मक दृष्टिकोण से अलग किया जाता है। इसका लचीलापन ज्ञान के स्तर, जरूरतों और शिक्षार्थी की सीखने की गतिविधि की व्यक्तिगत गति को निर्धारित करने के लिए बार-बार दोहराए गए निदान के आधार पर सीखने के भेदभाव और वैयक्तिकरण से जुड़ा हुआ है।

मॉड्यूलर लर्निंग के मार्गदर्शक सिद्धांतों में शामिल हैं:

  • 1) प्रतिरूपकता के सिद्धांत;
  • 2) प्रशिक्षण की सामग्री को अलग-अलग तत्वों में संरचित करना;
  • 3) गतिशीलता;
  • 4) गतिविधियाँ;
  • 5) लचीलापन;
  • 6) सचेत परिप्रेक्ष्य;
  • 7) पद्धति संबंधी सलाह और समता की बहुमुखी प्रतिभा।

मॉड्यूलरिटी का सिद्धांत ब्लॉक-मॉड्यूल के रूप में शैक्षिक सामग्री की निर्माण इकाइयों की पूर्णता और पूर्णता, पूर्णता और स्थिरता को मानता है, जिसके भीतर शैक्षिक सामग्री को शैक्षिक तत्वों की एक प्रणाली के रूप में संरचित किया जाता है। ब्लॉक-मॉड्यूल से, तत्वों के रूप में, विषय पर एक प्रशिक्षण पाठ्यक्रम का निर्माण किया जाता है। ब्लॉक-मॉड्यूल के अंदर के तत्व विनिमेय और जंगम हैं। शैक्षिक सामग्री का विकास शैक्षिक गतिविधियों के एक पूर्ण चक्र की प्रक्रिया में होता है।

यह मॉड्यूल है जो एक प्रशिक्षण कार्यक्रम के रूप में कार्य कर सकता है, सामग्री में व्यक्तिगत, शिक्षण विधियों, स्वतंत्रता का स्तर, छात्र की शैक्षिक और संज्ञानात्मक गतिविधि की गति। मॉड्यूलर लर्निंग की आवश्यक विशेषताओं में अन्य शिक्षण प्रणालियों से इसका अंतर है।

सबसे पहले, प्रशिक्षण की सामग्री को पूर्ण स्वतंत्र परिसरों (सूचना ब्लॉक) में प्रस्तुत किया जाता है, जिसे लक्ष्य के अनुसार आत्मसात किया जाता है। उपदेशात्मक लक्ष्य छात्र के लिए बनता है और इसमें न केवल अध्ययन की गई सामग्री की मात्रा का संकेत होता है, बल्कि इसके आत्मसात का स्तर भी होता है। इसके अलावा, प्रत्येक छात्र को शिक्षक से लिखित सलाह मिलती है कि कैसे अधिक तर्कसंगत तरीके से कार्य किया जाए, आवश्यक शैक्षिक सामग्री कहां से प्राप्त की जाए।

दूसरे, शिक्षक और छात्र के बीच संचार का रूप बदल रहा है। यह मॉड्यूल और प्लस व्यक्तिगत व्यक्तिगत संचार के माध्यम से किया जाता है। यह ऐसे मॉड्यूल हैं जो सीखने को विषय में स्थानांतरित करना संभव बनाते हैं - व्यक्तिपरक आधार। संबंध समता बन जाते हैं, शिक्षक और छात्र के बीच समान हो जाते हैं।

तीसरा, छात्र स्वतंत्र रूप से अधिकतम समय काम करता है, लक्ष्य-निर्धारण, आत्म-नियोजन, आत्म-संगठन, आत्म-नियंत्रण और आत्म-सम्मान सीखता है।

यू.बी. कुज़्मेनकोवा एक मॉड्यूल को एक स्व-निहित मिनी-कोर्स के रूप में परिभाषित करता है और मानता है कि यह पाठ्यक्रम (किसी भी अन्य की तरह) दिए गए लक्ष्यों, उनके कार्यान्वयन के तरीकों और प्राप्त परिणामों के सत्यापन के अनुसार बनाया गया है। यू.बी. के अनुसार Kuzmenkova को सीमित संख्या में विशिष्ट कार्यों को निर्धारित करने की आवश्यकता है जो अध्ययन समय की सीमित अवधि में वास्तविक रूप से व्यवहार्य हैं। ऐसा करने के लिए, चिह्नित कोर (किसी भी कार्यक्रम के लिए) घटकों के अनुसार कई अल्पकालिक और घूर्णन मॉड्यूल बनाना सुविधाजनक है - विषयगत अभिविन्यास और लक्ष्य अभिविन्यास - और उन्हें क्रमिक रूप से और / या समानांतर में सामान्य के ढांचे के भीतर बनाना पाठ्यक्रम। प्रस्तावित दृष्टिकोण की विशेषताओं में से एक भेदभाव की संभावना है, जिससे चयनित लक्ष्य सेटिंग्स के बीच स्पष्ट रूप से अंतर करना संभव हो जाता है; उसी समय, जैसा कि अभ्यास से पता चलता है, मॉड्यूल को भाषा और भाषण मॉड्यूल में उप-विभाजित करना काफी सुविधाजनक है। यह भेदभाव ध्यान केंद्रित करने के सिद्धांत पर आधारित है, जिसके अनुसार शैक्षिक सामग्री का विकास, विशेष रूप से अपरिचित, कठिनाइयों को अलग करने और उन्हें एक-एक करके दूर करने पर अधिक प्रभावी हो जाता है। (11, 21-28)

इसके अनुसार, भाषा मॉड्यूल को संकलित करते समय, भाषा के एक पहलू के अध्ययन से संबंधित एक विशिष्ट विषय (या विषयों का एक विशिष्ट अनुक्रम) में महारत हासिल करने पर ध्यान केंद्रित करना चाहिए - उदाहरण के लिए, ध्वन्यात्मकता, व्याकरण के संबंधित अनुभाग से या शब्दावली, भाषण मॉड्यूल को संकलित करते समय मुख्य कार्य के रूप में मानता है कि एक प्रकार के आरडी (या दो संबंधित - ग्रहणशील और प्रजनन) के ढांचे के भीतर किसी भी कौशल और क्षमताओं में महारत हासिल करना है।

शैक्षिक प्रक्रिया के आयोजन के मॉड्यूलर सिद्धांत के आधुनिक अध्ययन मॉड्यूल की संरचना में तीन मुख्य ब्लॉकों को अलग करते हैं: एक ब्लॉक जिसमें अध्ययन की जाने वाली सामग्री, व्यावहारिक और नियंत्रण ब्लॉक होते हैं।

एल.एन. और मुझे। कुज़नेत्सोव निम्नलिखित मॉड्यूल संरचना का प्रस्ताव करते हैं:

लक्ष्य ब्लॉक (मॉड्यूल का अध्ययन करने का उपदेशात्मक लक्ष्य, लक्ष्य को महसूस करने वाले व्यक्तित्व-उन्मुख कार्य)।

ब्लॉक अपडेट करें (अद्यतन करने के लिए विषय, अभ्यास, परीक्षण और अन्य स्वतंत्र कार्य का अध्ययन करने के लिए आवश्यक बुनियादी ज्ञान और कार्रवाई के तरीकों की एक सूची

बुनियादी ज्ञान)।

समस्या ब्लॉक (समस्या स्थितियां जो छात्रों के लिए व्यक्तिगत रूप से महत्वपूर्ण हैं, विषय के लिए भावनात्मक रूप से समृद्ध सामग्री)।

ब्लॉक फंड (उपकरण और उपदेशात्मक सामग्री (लगातार अद्यतन), पद्धतिगत खोज)।

सैद्धांतिक खंड (विषय ज्ञान और कार्रवाई के तरीकों की एक सूची, विचारों, सिद्धांतों, पैटर्न, विधियों को व्यवस्थित करना, कार्रवाई के तरीकों को सामान्य बनाना, सामग्री की प्रस्तुति और विषय की संरचना को समर्थन (विषय में अभिविन्यास) के रूप में प्रस्तुत करना।

आवेदन ब्लॉक (परिवर्तनीय पुनरावृत्ति और समेकन के लिए बहु-स्तरीय कार्यों की एक प्रणाली)।

सामान्यीकरण ब्लॉक (संक्षिप्त सामान्यीकरण के लिए उपदेशात्मक सामग्री, शैक्षिक सामग्री का व्यवस्थितकरण, प्रतिबिंब)।

अवकाश ब्लॉक (बढ़ी हुई जटिलता की प्रशिक्षण सामग्री)।

"बाहर निकलें" ब्लॉक करें (परीक्षण, परीक्षण, शैक्षिक सम्मेलनों में रिपोर्ट, गृहकार्य के लिए उपदेशात्मक सामग्री)।

तालिका 2. भाषा मॉड्यूल का संभावित निर्माण

प्रशिक्षण के उद्देश्यों में कौशल और क्षमताओं का जटिल विकास शामिल हो सकता है, और चुने हुए विषय पर काम करते समय, आप विभिन्न प्रकार के पढ़ने / सुनने, भूमिका निभाने वाले खेल, प्रस्तुतीकरण, रिपोर्ट लिखने, निबंध लिखने आदि का उपयोग कर सकते हैं - लेकिन शाब्दिक कौशल के प्रमुख विकास पर जोर देने के बिना असफल। शब्दावली (न्यूनतम शब्दकोश के माध्यम से विनियमित मात्रा में) चुने हुए क्षेत्र में संचार कौशल विकसित करने के दौरान - विभिन्न प्रकार की सशर्त संचार स्थितियों में अच्छी तरह से अवशोषित होती है।

यदि, हालांकि, छात्रों के पास ध्वन्यात्मकता या व्याकरण के विशिष्ट वर्गों का अध्ययन करने के लिए बुनियादी पाठ्यक्रम में पर्याप्त समय नहीं है, तो इसी तरह एक संकीर्ण विषय के भीतर आवश्यक कौशल में महारत हासिल करने पर केंद्रित एक मॉड्यूल का निर्माण करना संभव है। उदाहरण के लिए, "जर्मन स्वरों के उच्चारण में सुधार" या "तनावपूर्ण क्रिया रूपों के उपयोग का सुधार" (बाद के मामले में, एक अच्छा उदाहरण प्रशिक्षण अभ्यास से संदर्भ में व्याकरण का अध्ययन करने के लिए जोर का स्थानांतरण है)। साथ ही, पहले से ज्ञात शब्दावली सामग्री के आधार पर भाषण कौशल को व्यापक रूप से विकसित करना संभव है। हालाँकि, प्राथमिकता व्याकरण या ध्वन्यात्मकता पर सामग्री के साथ काम पर केंद्रित होगी।

तालिका 3 के आधार पर लक्ष्य सेटिंग्स का चयन करते हुए, विभिन्न संकीर्ण विषयगत मॉड्यूल की रचना करना संभव है।

तालिका 3. भाषा के पहलुओं पर आवश्यक ज्ञान का विकास

यह ध्यान दिया जाना चाहिए कि मिनी-पाठ्यक्रमों की अवधि और आवृत्ति परिवर्तनशील हैं और मॉड्यूल आवश्यक रूप से एक संपूर्ण पाठ नहीं है, यह आधा पाठ, या इसका कुछ भाग, या लंबी अवधि के विषयगत रूप से संगठित पाठों की एक श्रृंखला हो सकती है। कार्यक्रम को संकलित करते समय, उन्हें विविध किया जा सकता है और विभिन्न संयोजनों में उपयोग किया जा सकता है: वैकल्पिक पाठ्यक्रमों के कार्यक्रम के भीतर दो अलग-अलग भाषा मॉड्यूल पूरे पहली तिमाही में फैलाए जा सकते हैं, और एक पाठ के भीतर समानांतर में पंक्तिबद्ध किया जा सकता है (10 मिनट - ध्वन्यात्मक, बाकी व्याकरणिक समय का), और लेक्सिकल मॉड्यूल दूसरी तिमाही से शुरू हो सकता है, या अन्यथा। मॉड्यूल शुरू करने का विकल्प और क्रम छात्रों की विशिष्ट आवश्यकताओं द्वारा निर्धारित किया जाता है। यह महत्वपूर्ण है कि नियोजन के दृष्टिकोण से, मुख्य आवश्यकता कक्षाओं के संगठन के लिए एक व्यवस्थित दृष्टिकोण है (उनकी चक्रीयता, निरंतरता, पुनरावृत्ति और, तदनुसार, नियमित रिपोर्टिंग), अन्यथा ये सभी मॉड्यूलर नवाचार अराजक हो जाएंगे। .

व्याकरण पढ़ाने के लिए मॉड्यूल विकसित करना सबसे सुविधाजनक है, क्योंकि यह व्याकरण है जो सीखने में सबसे बड़ी कठिनाइयों का कारण बनता है, यह व्याकरण की अज्ञानता के कारण है कि छात्र मौखिक और लिखित भाषण में कई गलतियाँ करते हैं, इसलिए हम भाषा के इस पहलू पर अधिक विस्तार से ध्यान देंगे।

व्याकरण शब्दों को बदलने और वाक्यों में शब्दों के संयोजन के नियमों का एक संग्रह है। यह मानवीय विचारों को भौतिक भाषा के खोल में बांधना संभव बनाता है। व्याकरण को वाणी से अलग नहीं किया जा सकता है, व्याकरण के बिना, किसी भी प्रकार की वाणी की महारत की कल्पना नहीं की जा सकती है, क्योंकि यह शब्दावली और ध्वनि रचना के साथ-साथ भाषण का भौतिक आधार है। व्याकरण की एक विशेषता यह है कि, विशेष और ठोस से अमूर्त, यह सामान्य लेता है जो शब्दों के परिवर्तन और वाक्यों में उनके संयोजन को रेखांकित करता है और उससे व्याकरणिक नियम बनाता है।

ऊपर से यह इस प्रकार है कि व्याकरण का बहुत व्यावहारिक महत्व है। इसलिए चल रहे प्रयोग में व्याकरण पढ़ाने के लिए एक मॉड्यूल पर विचार किया जाएगा।

इस प्रकार, विभिन्न मॉड्यूल का उपयोग करके, अंतर-विषय और अंतर-विषय संचार को सफलतापूर्वक लागू करना, शैक्षिक सामग्री को एकीकृत करना, इसे शैक्षिक सामग्री को अलग करने की आवश्यकता के साथ प्रमुख शैक्षणिक विषय की सामग्री के तर्क में बनाना संभव है।

हमारी साइट पसंद आई? आपके रेपोस्ट और रेटिंग हमारे लिए सबसे अच्छी प्रशंसा हैं!

मध्यम गैरीसन भवन जो आपको गैरीसन संसाधनों के लिए क्राफ्टिंग अभिकर्मकों का आदान-प्रदान करने की अनुमति देता है और इसके विपरीत। इसके अलावा, यह गुटों (गठबंधन) और (गिरोह) तक पहुंच खोलता है। आपको नीलामी का उपयोग करने की अनुमति देता है।

हम एडऑन का उपयोग करने की सलाह देते हैं। मास्टर प्लान- इस समय गैरीसन के प्रबंधन के लिए यह सबसे अच्छा ऐडऑन है। ऐडऑन को ढूंढा और डाउनलोड किया जा सकता है। सुविधाजनक मिशन प्रबंधन के लिए, हम एडऑन का उपयोग करने की सलाह देते हैं गैरीसन मिशन प्रबंधक. आप इसे ढूंढ और डाउनलोड कर सकते हैं।

1 अवलोकन

2. ट्रेडिंग शॉप तक पहुंच कैसे खोलें?

इस खंड में, हम आपको बताएंगे कि स्तर 1, 2 और 3 की दुकान तक कैसे पहुंचें।

2.1. ट्रेडिंग पोस्ट स्तर 1

प्रथम स्तर की दुकान टाउन हॉल के निर्माण के तुरंत बाद उपलब्ध होगी।

2.2. गैरीसन ब्लूप्रिंट: ट्रेडिंग पोस्ट लेवल 2

गैरीसन ब्लूप्रिंट: ट्रेडिंग पोस्ट, लेवल 2 को 98 के स्तर पर या स्पियर्स ऑफ अराक में एक चौकी के निर्माण के बाद खरीदा जा सकता है। चौकी स्थापना नोट्स के लिए इसकी कीमत 1000 ग्राम या एक्सचेंज है। नोट्स दो बार प्राप्त किए जा सकते हैं: पहली बार - गोरग्रोंड में quests के दौरान, दूसरा - स्पियर्स ऑफ अरक में quests के दौरान, इस प्रकार कुछ सोने की बचत होती है। होर्डे और एलायंस के लिए व्यापारियों का स्थान नीचे दिया गया है।

2.3. गैरीसन ब्लूप्रिंट: ट्रेडिंग पोस्ट लेवल 3

गैरीसन ब्लूप्रिंट: ट्रेडिंग पोस्ट लेवल 3 सैवेज फ्रेंड्स (एलायंस) या सैवेज फ्रेंड्स (होर्डे) की उपलब्धि से एक इनाम है, 5 में से 3 ड्रेनेर गुटों के साथ: (एलायंस), (होर्डे), (एलायंस), (होर्डे) , (गठबंधन), (गिरोह)। उपलब्धि खाते पर सभी पात्रों द्वारा साझा की जाती है।

उपलब्धि को पूरा करने के बाद, आपको यह उम्मीद नहीं करनी चाहिए कि आपके बैग में ब्लूप्रिंट जादुई रूप से दिखाई देगा। Spartz Boltwhack (Aliance) या Rezlak (Horde) पर जाएं और इसे 1000g में खरीदें।

3. एक्सचेंज

पहली बार दुकान पर जाने पर, आपको एक खोज (एलायंस) या ए लिटिल ट्रिक्स (होर्डे) प्राप्त होगी। खोज पूरी करने के बाद, आप व्यापारी तक पहुँच प्राप्त करेंगे। वह ड्रेनेर क्राफ्टिंग अभिकर्मकों को बेचता है: अयस्क, घास, मांस, मछली पट्टिका, फर, चमड़ा, और करामाती धूल। 5 इकाइयों के लिए मूल्य अभिकर्मक 20 से 50x गैरीसन संसाधनों तक होता है (कीमतें हमेशा गिरोह और गठबंधन के लिए भिन्न होती हैं)।

4. आदेश

ट्रेडिंग पोस्ट में दैनिक आदेश आपको गैरीसन संसाधनों के लिए अभिकर्मकों का आदान-प्रदान करने की अनुमति देते हैं। विनिमय दर - 20 संसाधनों के लिए 5 अभिकर्मक।

5. नीलामी

पहली बार जब आप दूसरे स्तर की दुकान पर जाते हैं, तो आप प्राचीन व्यापारिक तंत्र से खोज कर सकते हैं: (गठबंधन) या (होर्डे)। आपको 5 भाग प्राप्त होंगे, जिनमें से प्रत्येक को विभिन्न मदों के साथ जोड़ा जाना चाहिए:

  • रहस्यमय क्रिस्टल मॉड्यूल को 4 अभिकर्मकों की आवश्यकता होती है, जो छापे या गैरीसन हमलों में भीड़ और मालिकों से प्राप्त किए जा सकते हैं:
  • नीलामी प्रबंधन मॉड्यूल के लिए 3 अभिकर्मकों की आवश्यकता होती है, जिन्हें काल कोठरी में भीड़ और मालिकों से प्राप्त किया जा सकता है:

ETAP-3 एक बहुक्रियाशील प्राकृतिक भाषा पाठ संसाधन प्रणाली है जिसे 1980 के दशक से विकसित किया गया है। रूसी विज्ञान अकादमी के सूचना प्रसारण समस्याओं के संस्थान में रूसी भाषाविदों, गणितज्ञों और प्रोग्रामर का एक समूह। ETAP-3 प्रणाली "अर्थ पाठ" सिद्धांत पर आधारित है, जिसे I.A द्वारा विकसित किया गया है। मेलचुक, और यू.डी. द्वारा विकसित भाषा का अभिन्न सिद्धांत। अप्रेसियन।

STAGE-3 एक विशिष्ट अनुप्रयोग लक्ष्य प्राप्त करने के उद्देश्य से एक व्यावसायिक विकास नहीं है। हमारा मुख्य कार्य प्राकृतिक भाषा का भाषाई मॉडलिंग और ऐसे मॉडलों का कंप्यूटर कार्यान्वयन है। यह ऐसे मॉडल बनाने की हमारी इच्छा की व्याख्या करता है जो भाषाई दृष्टिकोण से यथासंभव पर्याप्त हों। अक्सर, व्यापक भाषाई जानकारी सिस्टम में दर्ज की जाती है, भले ही कंप्यूटर टेक्स्ट प्रोसेसिंग की दक्षता में सुधार करना आवश्यक हो या नहीं। विशेष रूप से, हम प्रत्येक वाक्य के लिए भाषाई रूप से सही वाक्य-विन्यास संरचना प्राप्त करने का प्रयास करते हैं, इसलिए नहीं कि अन्यथा वाक्य का किसी अन्य भाषा में सही अनुवाद नहीं किया जाएगा, बल्कि केवल इसलिए कि यह प्राकृतिक भाषा वाक्यविन्यास मॉडलिंग के कार्य के लिए आवश्यक है। हालाँकि, हम आश्वस्त हैं कि, अंतिम विश्लेषण में, भाषाई जानकारी की सैद्धांतिक पर्याप्तता और पूर्णता विशुद्ध रूप से व्यावहारिक दृष्टिकोण से भुगतान करती है।

सभी STAGE-3 अनुप्रयोग मूल 3-मूल्यवान तर्क प्रणाली और विस्तृत औपचारिक भाषाई विवरण भाषा FORET का उपयोग करते हैं (अप्रेसियन एट अल। 1992a, Apresjan देखें) और अन्य. 1992बी)।

2. चरण-3: मॉड्यूल, गुण, वास्तुकला, कार्यान्वयन

2.1.मॉड्यूल

ETAP-3 प्रणाली में निम्नलिखित मुख्य मॉड्यूल शामिल हैं:

  • उच्च गुणवत्ता मशीन अनुवाद प्रणाली
  • यूनिवर्सल नेटवर्क लैंग्वेज (यूएनएल) के आधार पर रूसी पाठ उत्पन्न करने के लिए मॉड्यूल
  • डेटाबेस के लिए प्राकृतिक भाषा इंटरफ़ेस
  • वाक्यों के पर्यायवाची व्याख्या की प्रणाली
  • सिंटैक्स त्रुटि सुधारक
  • कंप्यूटर से सहायता प्राप्त भाषा सीखने की प्रणाली
  • टेक्स्ट कॉर्पस के सिंटैक्टिक मार्कअप के लिए कार्यस्थल।

नीचे हम संक्षेप में इन सभी मॉड्यूल की विशेषता बताएंगे, और हम उनमें से एक - यूएनएल मॉड्यूल - पर अधिक विस्तार से ध्यान देंगे।

2.1.1. ETAP-3 मशीनी अनुवाद प्रणाली

ETAP-3 का मुख्य मॉड्यूल एक मशीनी अनुवाद (MT) प्रणाली है जो पाँच जोड़ी भाषाओं की सेवा करता है। अनुवाद प्रणालियाँ (1) अंग्रेज़ी से रूसी, (2) रूसी से अंग्रेज़ी, (3) रूसी से कोरियाई, (4) रूसी से फ़्रेंच, और (5) रूसी से जर्मन के लिए उपलब्ध हैं।

आज तक, पहले दो प्रणालियों को सबसे अधिक विस्तार से विकसित किया गया है। अंग्रेजी से रूसी और रूसी से अंग्रेजी में अनुवाद प्रणाली, जिसे एकल द्विदिश मॉड्यूल के रूप में माना जा सकता है, को वास्तविक ग्रंथों, मुख्य रूप से वैज्ञानिक और तकनीकी विषयों का अनुवाद करने के लिए डिज़ाइन किया गया है। कंप्यूटर विज्ञान, इलेक्ट्रिकल इंजीनियरिंग, अर्थशास्त्र और राजनीति पर ग्रंथों के लिए सर्वोत्तम परिणाम प्राप्त हुए, क्योंकि सिस्टम की कामकाजी भाषाओं के संयोजन शब्दकोश (प्रत्येक में लगभग 50,000 प्रविष्टियां हैं) मुख्य रूप से इन विषय क्षेत्रों की शब्दावली पर केंद्रित हैं। हालाँकि, ETAP-3 रोज़मर्रा के विषयों पर ग्रंथों के साथ भी मुकाबला करता है, क्योंकि हाल ही में शब्दकोशों को रोज़मर्रा की शब्दावली के साथ महत्वपूर्ण रूप से भर दिया गया है। कॉम्बिनेटरियल डिक्शनरी में प्रत्येक लेक्सेम के लिए, इसकी वाक्य-विन्यास, शब्द-निर्माण, शब्दार्थ और शब्द-निर्माण की विशेषताएं, इसका प्रबंधन मॉडल, साथ ही इस लेक्सेम के साथ सेट वाक्यांशों के बारे में जानकारी दी गई है।

इसके अलावा, एक रूसी रूपात्मक शब्दकोश (100,000 शब्दकोश प्रविष्टियाँ) है, जो विशुद्ध रूप से रूपात्मक जानकारी के अलावा, लेक्सेम और इसके अनुमानित अनुवाद समकक्ष के बारे में बुनियादी वाक्यात्मक जानकारी शामिल है। अंग्रेजी रूपात्मक शब्दकोश में समान संरचना (60,000 प्रविष्टियाँ) हैं। यह प्रणाली STAGE-3 के डेवलपर्स द्वारा संकलित अंग्रेजी और रूसी भाषाओं के व्यापक व्याकरणिक विवरण पर आधारित है।

भाषाओं के अन्य जोड़े के लिए, अनुवाद प्रणालियाँ प्रोटोटाइप के स्तर पर मौजूद हैं।

यदि STAGE-3 को एक समानार्थी वाक्य प्राप्त होता है और सिस्टम इस समानार्थी शब्द को हल नहीं कर सकता है, तो आउटपुट पर कई अनुवाद विकल्प पेश किए जाते हैं। अन्य सभी मामलों में, सिस्टम एक सबसे प्रशंसनीय वाक्य रचना संरचना और एक सबसे संभावित अनुवाद उत्पन्न करता है। यदि सिस्टम का उपयोगकर्ता सभी संभव अनुवाद प्राप्त करना चाहता है, तो वह उपयुक्त विकल्प का चयन कर सकता है, और सिस्टम अनसुलझे समरूपता के सभी मामलों को "याद" करेगा और उनके लिए स्वीकार्य शाब्दिक सामग्री के साथ वाक्य की सभी संभावित वाक्य रचनाएं देगा। आइए एक वास्तविक उदाहरण पर विचार करें। वाक्य उन्होंने एक सामान्य टिप्पणी की कि ..."सभी अनुवाद विकल्पों" के विकल्प के साथ, इसका रूसी में दो तरह से अनुवाद किया गया था, जो वाक्यात्मक संरचनाओं और शब्दावली की पसंद दोनों में भिन्न है: (ए) उन्होंने एक सामान्य टिप्पणी की कि ...और बी) उन्होंने जनरल को यह बताने के लिए मजबूर किया कि

2.1.2. डेटाबेस के लिए प्राकृतिक भाषा इंटरफ़ेस

ETAP-3 प्रणाली का यह मॉड्यूल प्राकृतिक भाषा (अंग्रेजी या रूसी) में मुक्त रूप में दिए गए प्रश्नों को SQL क्वेरी भाषा अभिव्यक्तियों में अनुवाद करता है। मॉड्यूल एसक्यूएल से प्राकृतिक भाषा में भी अनुवाद करता है। मॉड्यूल विशेष रूप से इस उद्देश्य के लिए विकसित एक सिमेंटिक घटक पर आधारित है, जो गहरी वाक्य रचनात्मक संरचना को औपचारिक अर्थपूर्ण प्रतिनिधित्व में अनुवाद करता है, जिससे कोई आसानी से SQL भाषा में प्रतिनिधित्व पर स्विच कर सकता है।

2.1.3. पर्यायवाची व्याख्या की प्रणाली

इस मॉड्यूल को रूसी और अंग्रेजी वाक्यों के विभिन्न पर्यायवाची और अर्ध-समानार्थी पैराफ्रेश प्राप्त करने के लिए भाषाई प्रयोग करने के लिए डिज़ाइन किया गया है। प्रणाली शाब्दिक कार्यों के तंत्र पर आधारित है, जो "अर्थ पाठ" सिद्धांत के सबसे महत्वपूर्ण नवाचारों में से एक है। पर्यायवाची पैराफ्रेशिंग मॉड्यूल के परिणाम को निम्नलिखित उदाहरण द्वारा दर्शाया जा सकता है:

(1) निर्देशक ने जॉन को एक रिपोर्ट लिखने का आदेश दिया - निर्देशक ने जॉन को एक रिपोर्ट लिखने का आदेश दिया - जॉन को निर्देशक ने एक रिपोर्ट लिखने का आदेश दिया - जॉन को निर्देशक से एक रिपोर्ट लिखने का आदेश मिला।

भाषाई अनुसंधान का यह क्षेत्र बहुत आशाजनक प्रतीत होता है, क्योंकि इसमें विभिन्न प्रकार के अनुप्रयोग हो सकते हैं, उदाहरण के लिए, देशी और विदेशी भाषाओं को पढ़ाने में, ऑथरिंग सिस्टम और टेक्स्ट प्लानिंग सिस्टम में।

2.1.4. सिंटैक्स त्रुटि सुधारक

यह मॉड्यूल रूसी में ग्रंथों को संसाधित करने के लिए डिज़ाइन किया गया है। इसका उद्देश्य व्याकरणिक समझौते के साथ-साथ केस मैनेजमेंट में विभिन्न प्रकार की त्रुटियों को खोजना और ठीक करना है।

2.1.5 कंप्यूटर भाषा शिक्षण प्रणाली

यह मॉड्यूल एक स्टैंड-अलोन सॉफ्टवेयर एप्लिकेशन है, अर्थात् संवाद के रूप में एक कंप्यूटर गेम। रूसी, अंग्रेजी और जर्मन को विदेशी भाषा के रूप में पढ़ाते समय इस कार्यक्रम का उपयोग किया जा सकता है। खेल उन लोगों के लिए अभिप्रेत है जो पहले से ही भाषा में अच्छी तरह से महारत हासिल कर चुके हैं, लेकिन अपनी शब्दावली का विस्तार करना चाहते हैं, मुख्य रूप से सेट वाक्यांशों और पैराफ्रेशिंग के माध्यम से। प्रणाली शाब्दिक कार्यों के तंत्र पर आधारित है। कार्यक्रम का उपयोग उपरोक्त भाषाओं के मूल वक्ताओं द्वारा भी सफलतापूर्वक किया जा सकता है जो अपनी शब्दावली को समृद्ध करना चाहते हैं (उदाहरण के लिए, पत्रकार, शिक्षक और यहां तक ​​​​कि राजनेता)।

2.1.6. टेक्स्ट कॉर्पस के सिंटैक्टिक मार्कअप के लिए कार्यस्थल।

यह नया विकसित मॉड्यूल ETAP-3 शब्दकोशों के साथ-साथ सिस्टम के रूपात्मक और पार्सिंग विश्लेषक का उपयोग करता है, रूसी ग्रंथों के पहले वाक्यात्मक रूप से चिह्नित कॉर्पस का निर्माण करने के लिए। यह एक मिश्रित अनुप्रयोग है: स्वचालित विश्लेषण से उत्पन्न वृक्ष संरचना को तब मानव द्वारा सुविधाजनक ग्राफिकल टूल का उपयोग करके संपादित किया जाता है।

2.2. प्रणाली के मुख्य गुण

संपूर्ण और इसके व्यक्तिगत मॉड्यूल के रूप में ETAP-3 प्रणाली की मुख्य विशेषताओं में, निम्नलिखित पर ध्यान दिया जा सकता है:

  • एल्गोरिथम की मूल इकाई के रूप में नियमों का उपयोग करना
  • स्तरीय दृष्टिकोण
  • स्थानांतरण चरण के माध्यम से अनुवाद
  • निर्भरता सिंटैक्स ट्री का उपयोग करना
  • लेक्सिकलवादी दृष्टिकोण
  • अनुवाद विकल्प प्राप्त करने की क्षमता
  • भाषाई संसाधनों के विविध उपयोग की संभावना

ETAP-3 के वर्तमान संस्करण में, सभी मॉड्यूल केवल नियम-आधारित एल्गोरिदम का उपयोग करते हैं। हालांकि, हाल के कई प्रयोगों में, एमटी मॉड्यूल को अनुवाद मेमोरी (अनुवाद मेमोरी) तक पहुंच के आधार पर एक घटक के साथ पूरक किया गया था। , और एक सांख्यिकीय घटक जो अर्ध-स्वचालित रूप से द्विभाषी टेक्स्ट कॉर्पोरा से अनुवाद समकक्षों को निकालता है (देखें Iomdin & Streiter 1999)।

कई अन्य प्राकृतिक भाषा पाठ प्रसंस्करण प्रणालियों की तरह, ETAP-3 को एक स्तरित दृष्टिकोण की विशेषता है। प्रसंस्करण के दौरान, प्रत्येक वाक्य कई चरणों से गुजरता है और प्रत्येक चरण में इसे एक निश्चित संरचना के रूप में प्रस्तुत किया जाता है: 1) रूपात्मक, 2) वाक्यात्मक, और 3) सामान्यीकृत (या गहरा-वाक्यविन्यास)। वास्तविक अनुवाद (स्थानांतरण) एक सामान्यीकृत वाक्य रचना के स्तर पर किया जाता है, अर्थात। अंग्रेजी सामान्यीकृत संरचनाएं संबंधित रूसी सामान्यीकृत संरचनाओं में परिवर्तित हो जाती हैं और इसके विपरीत।

ETAP-3 को अधिकांश समान प्रणालियों से अलग करता है वाक्य की संरचना का प्रतिनिधित्व करने के लिए वाक्यात्मक निर्भरता पेड़ों का उपयोग (दुनिया भर में अधिकांश प्राकृतिक भाषा पाठ प्रसंस्करण प्रणाली प्रत्यक्ष घटकों की संरचनाओं का उपयोग करती है)।

STAGE-3 को एक शब्दावलीवादी दृष्टिकोण की विशेषता है जिसमें शब्दकोश में दर्ज की गई जानकारी को व्याकरण में दर्ज की गई जानकारी के रूप में महत्वपूर्ण माना जाता है। तदनुसार, ETAP-3 शब्दकोशों में अन्य समान प्रणालियों में प्रयुक्त शब्दकोशों की तुलना में काफी अधिक जानकारी होती है। ETAP-3 की डिक्शनरी प्रविष्टि में लेक्सेम के नाम के अलावा, लेक्सेम की वाक्यात्मक और अर्थ संबंधी विशेषताओं के बारे में जानकारी, इसका प्रबंधन मॉडल, अनुवाद समकक्ष, विभिन्न नियम, साथ ही साथ शाब्दिक कार्यों के मूल्य शामिल हैं। , जिसका कीवर्ड यह लेक्सेम है। वाक्यात्मक संकेतशब्द कुछ वाक्यात्मक निर्माणों में कार्य करने की उसकी क्षमता या अक्षमता को दर्शाते हैं। एक शब्द को 200 से अधिक विशेषताओं वाली सामान्य सूची से कई वाक्यात्मक विशेषताएं सौंपी जा सकती हैं। सिमेंटिक फीचर्सएक वाक्य में शब्दों के बीच शब्दार्थ समझौते की जाँच करने की आवश्यकता है। प्रबंधन मॉडलशब्द में दिए गए शब्द के अभिनयकर्ताओं की सतही अभिव्यक्ति के बारे में जानकारी होती है (उदाहरण के लिए, शब्द एक या किसी अन्य पूर्वसर्ग या संयोजन, या किसी नाम के एक या दूसरे मामले के रूप को नियंत्रित कर सकता है)। शब्दकोश प्रविष्टि का सबसे महत्वपूर्ण घटक हैं विनियम। STAGE-3 के सभी नियम व्याकरण और शब्दावली के बीच वितरित किए गए हैं। व्याकरण के नियम अधिक सामान्य होते हैं और शब्दों के व्यापक वर्गों पर लागू होते हैं, जबकि शब्दकोश प्रविष्टियों (सीधे या संदर्भ द्वारा) में संदर्भित नियम शब्दों के छोटे समूहों या व्यक्तिगत शब्दों पर भी लागू होते हैं। नियमों का ऐसा संगठन यह सुनिश्चित करता है कि प्रत्येक व्यक्तिगत प्रस्ताव को संसाधित करने के लिए सिस्टम स्वचालित रूप से कॉन्फ़िगर किया गया है। अनुवाद प्रक्रिया के दौरान, केवल वे नियम सक्रिय होते हैं, जिनका संदर्भ वाक्य में निहित शब्दों की शब्दकोश प्रविष्टियों में स्पष्ट रूप से निहित होता है।

एक उदाहरण के रूप में, हम अंग्रेजी शब्द की शब्दकोश प्रविष्टि का एक अंश प्रस्तुत करते हैं मोका:

SYNT: काउंट, प्रेडो, प्रेडिटे

देस: "तथ्य", "सार"

डी1.1: का,"व्यक्ति"

डी2.1: का,"तथ्य"

डी2.2: TO2

डी2.3: वह1

SYN1: अवसर

मैगन: GOOD1/FAIR1/उत्कृष्ट

प्रतिमान: थोड़ा/पतला/गरीब/थोड़ा1/छोटा

OPER1: है / स्टैंड1

असली 1-एम: लेना

ANTIREAL1-M: मिस1

INCEPOPER1: प्राप्त

FINOPER1: खोना

CAUSFUNC1: देना /देना

ट्रांस: मोका/ हो रहा

आर: कम्पोज / मॉडिफ / पॉस

1.1 डीईपी-लेक्सा (एक्स, जेड, प्रेपोस, बीवाई1)

1 ज़मरूज़: जेड (पीओ 1)

2 ज़मरूज़: एक्स (यादृच्छिक)

1 ज़मरूज़: जेड (रैंडम)

TRAF:RA-EXPANS.16

TRAF:RA-EXPANS.22

ETAP-3 प्रणाली विकसित करते समय, हमने इसके घटकों को इस तरह से बनाने की कोशिश की कि उनका उपयोग विभिन्न उद्देश्यों के लिए किया जा सके। विशेष रूप से, सिस्टम के मुख्य व्याकरणिक और शब्दावली संसाधनों का उपयोग इसके सभी मॉड्यूल में किया जाता है। उदाहरण के लिए, रूसी से अंग्रेजी में अनुवाद करते समय रूसी शब्दकोशों का उपयोग विश्लेषण चरण में किया जाता है और संश्लेषण चरण में अंग्रेजी से रूसी में अनुवाद करते समय; वही शब्दकोश एमपी मॉड्यूल में, पैराफ्रेशिंग सिस्टम में, वाक्यात्मक रूप से चिह्नित कॉर्पस आदि में उपयोग किए जाते हैं। इसके अलावा, सिस्टम के कुछ संसाधनों को इससे "अलगाव" किया जा सकता है और ग्राहक की आवश्यकताओं के आधार पर परिष्कृत होने के बाद, विभिन्न प्रसंस्करण प्रणालियों में स्वाभाविक रूप से इस्तेमाल किया जा सकता है - भाषा ग्रंथ।

2.3 ETAP-3 प्रणाली की सामान्य संरचना

ETAP-3 प्रणाली के कामकाज का एक सामान्य विचार देने के लिए, हम MP मॉड्यूल (योजना 1) का सामान्य एल्गोरिथ्म प्रस्तुत करते हैं। अन्य सभी मॉड्यूल, एक निश्चित आरक्षण के साथ, इस एक के डेरिवेटिव के रूप में माने जा सकते हैं।

चरण -3 प्रणाली का मशीन अनुवाद मॉड्यूल

(वास्तुकला)

2.4. कार्यान्वयन

ETAP-3 सिस्टम एक माइक्रोवैक्स कंप्यूटर (VMS ऑपरेटिंग सिस्टम) पर लागू किया गया था। हाल ही में, विंडोज एनटी 4.0 के तहत व्यक्तिगत कंप्यूटरों पर ईटीएपी -3 के साथ काम करने के लिए नया सॉफ्टवेयर बनाया गया है, जो लेक्सिकोग्राफर को कई अतिरिक्त टूल का उपयोग करने और शब्दकोशों को अधिक कुशलता से बनाए रखने और संपादित करने की अनुमति देता है।

3. यूएनएल भाषा के लिए इंटरफेस

3.1 पृष्ठभूमि और लक्ष्य

यूएनएल मॉड्यूल एक बहुत ही महत्वाकांक्षी लक्ष्य के साथ एक विशाल अंतरराष्ट्रीय परियोजना के हिस्से के रूप में विकसित किया जा रहा है: कम से कम भाग में, इंटरनेट उपयोगकर्ताओं को अलग करने वाली भाषा बाधा को दूर करने के लिए। इस तथ्य के बावजूद कि इंटरनेट के आगमन के साथ, लोगों के बीच अस्थायी और स्थानिक बाधाएं व्यावहारिक रूप से गायब हो गई हैं, इंटरनेट उपयोगकर्ताओं को भाषा की बाधा से अलग करना जारी है। यह, जाहिरा तौर पर, सूचना समाज में सफल अंतरराष्ट्रीय और पारस्परिक संचार के लिए मुख्य बाधा है। इंटरनेट उपयोगकर्ताओं द्वारा बोली जाने वाली भाषाओं की विविधता को मानव जाति की गंभीर समस्याओं में से एक माना गया है। किसी भी मामले में, यह इस तथ्य से प्रमाणित होता है कि परियोजना, जिसका उद्देश्य इस समस्या को हल करना है, संयुक्त राष्ट्र के तत्वावधान में किया जाता है और संयुक्त राष्ट्र विश्वविद्यालय में उन्नत अध्ययन संस्थान द्वारा समन्वित किया जाता है।

परियोजना की स्थापना 1996 में हुई थी। वर्तमान में, ब्राजील, जर्मनी, भारत, इंडोनेशिया, जॉर्डन, स्पेन, इटली, चीन, लातविया, मंगोलिया, रूस, थाईलैंड, फ्रांस और जापान के 15 विश्वविद्यालय और अनुसंधान संस्थान परियोजना में भाग ले रहे हैं।

यह उम्मीद की जाती है कि आने वाले वर्षों में अन्य देशों की टीमें इस परियोजना में शामिल होंगी, ताकि अंततः संयुक्त राष्ट्र के सभी सदस्य देशों की आधिकारिक भाषाओं को कवर करने की योजना बनाई जाए।

परियोजना का विचार इस प्रकार है। एक सार्वभौमिक मध्यस्थ भाषा प्रस्तावित है जो प्राकृतिक भाषा के पाठों द्वारा व्यक्त की जाने वाली सभी आवश्यक जानकारी को व्यक्त करने के लिए पर्याप्त शक्तिशाली है। यह भाषा एच. उचिडा (संयुक्त राष्ट्र विश्वविद्यालय) द्वारा प्रस्तावित यूनिवर्सल नेटवर्किंग लैंग्वेज (यूएनएल) है। प्रत्येक प्राकृतिक भाषा के लिए, दो प्रणालियों को विकसित करने का प्रस्ताव है: एक "डीकनवर्टर" जो यूएनएल भाषा से किसी दी गई भाषा में ग्रंथों का अनुवाद करेगा, और एक "एनकनवर्टर" जो किसी दी गई भाषा में ग्रंथों को यूएनएल भाषा अभिव्यक्तियों में परिवर्तित करेगा। इस बात पर जोर दिया जाना चाहिए कि UNL टेक्स्ट जनरेशन पूरी तरह से स्वचालित नहीं होगा। इस प्रक्रिया को कंप्यूटर और मानव (संपादक) के बीच संवाद के रूप में नियोजित किया गया है।

इस प्रकार, यह परियोजना मूल रूप से पारंपरिक मशीनी अनुवाद से अलग है। सबसे पहले, विभिन्न प्राकृतिक भाषाओं में ग्रंथ बनाने के लिए इनपुट UNL संरचना है, जिसकी गुणवत्ता पाठ विश्लेषण प्रक्रियाओं की अपूर्णता पर निर्भर नहीं करती है। इंटरैक्टिव UNL बिल्डिंग के दौरान संरचना संपादक स्वचालित कनवर्टर के परिणामों की समीक्षा करेगा, त्रुटियों को ठीक करेगा और शेष अस्पष्टता को हल करेगा। संपादक तब डीकनवर्टर चला सकता है और जो संपादित किया है उसका अनुवाद कर सकता हैयूएनएल अपने काम की जांच करने के लिए अपनी मूल भाषा में अभिव्यक्ति करें और यदि आवश्यक हो तो अभिव्यक्ति में और बदलाव करें।

UNL प्रणाली का एक और महत्वपूर्ण अंतर मशीनी अनुवाद से इस तथ्य में निहित है कि भाषा में अभिव्यक्तियाँ UNL को उन प्राकृतिक भाषाओं की परवाह किए बिना उत्पन्न और संग्रहीत किया जा सकता है जिनमें इन ग्रंथों का अनुवाद किया जाएगा। UNL को किसी मूल्य का प्रतिनिधित्व करने का एक सामान्य तरीका माना जा सकता है। यूएनएल पाठ को स्वचालित रूप से संसाधित करने के लिए, उदाहरण के लिए, इसे अनुक्रमित करने, इसे खोजने, या इससे जानकारी निकालने के लिए, इस पाठ का प्राकृतिक भाषा में अनुवाद करना आवश्यक नहीं है। उत्तरार्द्ध केवल तभी आवश्यक है जब कोई व्यक्ति पाठ के साथ काम करेगा।

प्रत्येक प्राकृतिक भाषा के लिए एक कन्वर्टर और एक डिकॉन्वेंटर एक भाषा सर्वर बनाते हैं जिसे इंटरनेट पर होस्ट करने की योजना है। सभी भाषा सर्वर एक यूएनएल नेटवर्क से जुड़े होंगे, जो इंटरनेट उपयोगकर्ता को यूएनएल से किसी भी दस्तावेज़ को अपनी भाषा में अनुवाद करने की अनुमति देगा, साथ ही उन पाठों को यूएनएल में अनुवादित करेगा जिन्हें वह सार्वजनिक रूप से उपलब्ध कराना चाहता है।

3.2 यूएनएल भाषा

इस लेख में, हम यूएनएल भाषा का विस्तार से वर्णन नहीं कर पाएंगे, क्योंकि यह विषय एक अलग लेख के योग्य है, जो संभवतः भाषा के निर्माता डॉ. हिरोशी उचिदा द्वारा लिखा जाएगा। हम केवल UNL भाषा की उन विशेषताओं पर ध्यान देंगे जो आगे की प्रस्तुति के लिए महत्वपूर्ण होंगी। संपूर्ण UNL भाषा विनिर्देश यहां स्थित है http://www.unl.ias.unu.edu/।

यूएनएल एक कंप्यूटर भाषा है जिसे इस तरह से सूचना का प्रतिनिधित्व करने के लिए डिज़ाइन किया गया है कि इस जानकारी वाले ग्रंथों को विभिन्न प्रकार की भाषाओं में उत्पन्न करना संभव होगा। एक यूएनएल अभिव्यक्ति एक प्राकृतिक भाषा वाक्य के अनुरूप एक निर्देशित हाइपरग्राफ है। ग्राफ़ आर्क्स सिमेंटिक संबंधों को दर्शाते हैं, उदाहरण के लिए, प्रतिनिधि(अभिनेता)वस्तु(एक वस्तु),समय(समय),स्थान(स्थान),वाद्य यंत्र(औजार),तरीका(कार्य प्रणाली)और अन्य। ग्राफ के नोड्स में तथाकथित यूनिवर्सल वर्ड्स (सीएस) हैं जो अवधारणाओं, या सीएस के समूहों को दर्शाते हैं। नोड्स को विशेषताओं के साथ प्रदान किया जा सकता है। विशेषताओं में दिए गए वाक्य में नोड के उपयोग के बारे में अतिरिक्त जानकारी होती है, उदाहरण के लिए, @अनिवार्य, @जेनेरिक, @भविष्य, @ दायित्व.

प्रत्येक यूएस कुछ अंग्रेजी शब्द से मेल खाता है। कुछ शब्दों में अर्थ सीमांकक होते हैं जो इन शब्दों के अर्थ को स्पष्ट करते हैं। ज्यादातर मामलों में, सीमांकक ज्ञान के आधार में अवधारणा के स्थान को इंगित करते हैं। यह निम्न प्रकार से किया जाता है। तरह का सार्वभौमिक शब्द ए (आईसीएल>बी)'ए श्रेणी बी से संबंधित है' के रूप में व्याख्या की गई। उदाहरण के लिए, यूएस प्रशिक्षकबिना किसी सीमांकक के अंग्रेजी शब्द के समान अर्थ हैं प्रशिक्षकआम तौर पर। किसी शब्द के अर्थ को स्पष्ट करने के लिए सीमांकक का उपयोग किया जाता है। हाँ, अभिव्यक्ति कोच (आईसीएल>परिवहन)'कोच' के रूप में समझा जाना चाहिए परिवहन के साधन के रूप में, अर्थात् बस; अभिव्यक्ति कोच (आईसीएल>मानव)व्याख्या है'प्रशिक्षक एक आदमी की तरह, अर्थात् ट्रेनर, और अभिव्यक्ति कोच (आईसीएल>डू)- व्याख्या 'प्रशिक्षक एक प्रकार की क्रिया के रूप में', अर्थात् एक क्रिया रेल गाडी. दूसरे शब्दों में, लिमिटर्स का उपकरण अमेरिका को एक अंग्रेजी शब्द के रूप में प्रस्तुत करना संभव बनाता है, जिसे ठीक एक अर्थ में लिया गया है। इसके अलावा, सीमांकक आपको उन अवधारणाओं को पेश करने की अनुमति देते हैं जिनके लिए अंग्रेजी भाषा में कोई एकल-शब्द पदनाम नहीं हैं। उदाहरण के लिए, रूसी में आंदोलन की क्रियाओं का एक व्यापक समूह है, जिसके अर्थ में आंदोलन की विधि या साधन का संकेत शामिल है: में उड़ें, तैरना, रेंगना, दौड़नाऔर अन्य इस समूह की क्रियाओं के लिए कोई एक-शब्द अंग्रेजी पत्राचार नहीं है। हालाँकि, अंग्रेजी शब्दों के आधार पर, एक ES बनाना संभव है जो अर्थ में उनके करीब हो, उदाहरण के लिए, आओ (मिले> जहाज)का अर्थ है 'आने के लिए, वाहन एक जहाज होने के नाते'।

आइए हम अंग्रेजी वाक्य के अनुरूप UNL भाषा में एक अभिव्यक्ति का उदाहरण दें

(2) हालाँकि, भाषा के अंतर हमारे समाज में सूचना के सुचारू प्रवाह में एक बाधा हैं।

प्रत्येक UNL लाइन संरचना रूप की अभिव्यक्ति है संबंध (RS1, RS2)।सरलता के लिए, सार्वभौम शब्दों के सिमेंटिक डिलीमीटर को छोड़ दिया जाता है।

आओज ( [ईमेल संरक्षित]@[ईमेल संरक्षित]@हालांकि, [ईमेल संरक्षित])

मॉड ( [ईमेल संरक्षित]@[ईमेल संरक्षित]@हालांकि, [ईमेल संरक्षित])

मॉड ( [ईमेल संरक्षित], भाषा: हिन्दी)

aoj (चिकनी, [ईमेल संरक्षित])

मॉड ( [ईमेल संरक्षित], जानकारी)

एससीएन ( [ईमेल संरक्षित], समाज)

स्थिति (समाज, हम)

3.3. ETAP-3 प्रणाली में UNL से रूसी में अनुवाद

जैसा कि पहले ही खंड 1 में उल्लेख किया गया है, ETAP-3 एक स्थानांतरण प्रणाली है, और वास्तविक अनुवाद सामान्यीकृत वाक्य-रचना संरचना (NormSS) के चरण में किया जाता है। इस स्तर पर, रूसी भाषा और यूएनएल के बीच एक पत्राचार स्थापित करना सबसे सुविधाजनक है, क्योंकि यूएनएल भाषा और सामान्यीकृत वाक्य रचनात्मक संरचनाओं के भाव कई समानताएं दिखाते हैं। यहाँ सबसे महत्वपूर्ण हैं:

  1. UNL भाषा के भाव और NormSS दोनों एक वाक्य की सतह और शब्दार्थ निरूपण के बीच एक मध्यवर्ती स्थिति पर कब्जा कर लेते हैं और लगभग तथाकथित गहरे-वाक्यिक स्तर के अनुरूप होते हैं। इस स्तर पर, शाब्दिक इकाइयों का अर्थ आदिम में विघटित नहीं होता है, और सभी भाषाओं के लिए शाब्दिक इकाइयों के बीच संबंध समान होते हैं;
  2. UNL और NormSS दोनों ही भावों में, नोड्स वाक्यात्मक श्रेणियों के बजाय टर्मिनल तत्व (लेक्सिकल इकाइयाँ) हैं;
  3. नोड्स में अतिरिक्त विशेषताएं (विशेषताएं) होती हैं;
  4. UNL और NormSS दोनों भावों में, आर्क निर्देशित निर्भरताएँ हैं।

इसी समय, UNL और NormSS अभिव्यक्तियों के बीच महत्वपूर्ण अंतर हैं:

  1. नॉर्मएसएस में, सभी नोड्स लेक्सिकल इकाइयां हैं, और यूएनएल में, एक नोड एक सबग्राफ हो सकता है।
  2. नॉर्मएसएस में, एक नोड हमेशा एक शब्द मान से मेल खाता है, और एसएस मान संबंधित अंग्रेजी शब्द के मूल्य से व्यापक या संकुचित हो सकता है:

2.1. CSS का मान एक ही बार में एक शब्द के कई मानों के अनुरूप हो सकता है (ऊपर देखें)।

2.2. वे एक मुक्त वाक्यांश से मेल खा सकते हैं (उदाहरण के लिए, कंप्यूटर आधारितया उच्च गुणवत्ता).

2.3. वे शब्द के किसी रूप के अनुरूप हो सकते हैं (उदाहरण के लिए, शब्द श्रेष्ठएक शब्द रूप है अच्छाया कुंआ).

2.4. वे एक ऐसी अवधारणा को निरूपित कर सकते हैं जिसके लिए अंग्रेजी में कोई प्रत्यक्ष समकक्ष नहीं है।

  1. नॉर्मएसएस सभी जुड़े हुए ग्राफों में सबसे सरल है, अर्थात् एक पेड़, जबकि एक यूएनएल अभिव्यक्ति एक हाइपरग्राफ है।
  2. UNL में, आर्क लूप बना सकते हैं और अलग-अलग सबग्राफ को लिंक कर सकते हैं।
  3. नॉर्मएसएस में नोड्स विशुद्ध रूप से वाक्यात्मक संबंधों से जुड़े होते हैं जिनका कोई अर्थ नहीं होता है, जबकि यूएनएल में संबंध अर्थपूर्ण भूमिकाओं को दर्शाते हैं।
  4. नॉर्मएसएस में गुण व्याकरणिक विशेषताओं के अनुरूप होते हैं, जबकि कई यूएनएल विशेषताओं का अर्थ अंग्रेजी और रूसी (उदाहरण के लिए, मोडल क्रिया) दोनों में शाब्दिक माध्यमों से व्यक्त किया जाता है।
  5. NormSS में वाक्य में शब्दों के क्रम के बारे में जानकारी होती है, और ऐसी जानकारी UNL अभिव्यक्ति में अनुपस्थित होती है।

मानदंड प्रस्ताव (2) इस प्रकार है:


  1. यूएनएल अभिव्यक्ति से मध्यवर्ती प्रतिनिधित्व (आईआर) में संक्रमण
  2. पीपी से रूसी नॉर्मएसएस (नॉर्मएसएसआर) में संक्रमण।
  3. नॉर्मएसएसआर के लिए रूसी प्रस्ताव का संश्लेषण।

इन चरणों में से पहला UNL . के बीच का इंटरफ़ेस है और ETAP-3 प्रणाली, और बाकी ETAP-3 प्रणाली के अंग्रेजी-रूसी मॉड्यूल के मानक माध्यमों द्वारा किए जाते हैं।

यूएनएल से रूसी में अनुवाद एल्गोरिथ्म को योजना 3 में दिखाया गया है।

ऊपर से निम्नानुसार है, UNL भाषा में एक अभिव्यक्ति से नॉर्मएसएस में संक्रमण को निम्नलिखित पांच कार्यों को हल करना चाहिए:

  1. जहां भी संभव हो सभी सीएल को अंग्रेजी शब्दों से बदलें। अंग्रेजी शब्दकोश का जिक्र करते समय रूसी लेक्सेम अंग्रेजी-रूसी अनुवाद के चरण में दिखाई देंगे। यदि आरएस के लिए कोई अंग्रेजी समकक्ष नहीं मिला है, तो इस आरएस का मूल्य अन्य माध्यमों से व्यक्त किया जाना चाहिए।
  2. UNL वाक्यात्मक संबंधों का ETAP-3 वाक्य-विन्यास संबंधों में अनुवाद करें, या तो सीधे या शाब्दिक माध्यम से।
  3. UNL भाषा विशेषताओं का STAGE-3 व्याकरणिक विशेषताओं में अनुवाद करें, या तो सीधे या शाब्दिक साधनों का उपयोग करके।
  4. UNL ग्राफ को एक निर्भरता ट्री में बदलें।
  5. वाक्य में शब्द क्रम निर्धारित करें।

पहला और (आंशिक रूप से) दूसरा कार्य UNL शब्दकोशों - अंग्रेजी और अंग्रेजी संयोजन की मदद से हल किया जाता है। अन्य सभी कार्यों के लिए औपचारिक-तार्किक FORET भाषा में लिखे गए नियम जिम्मेदार होते हैं।

इस प्रकार, इन सभी कार्यों को या तो शब्दकोशों की सहायता से या नियमों की सहायता से हल किया जाता है। सार्वभौमिकता की डिग्री के आधार पर नियमों को तीन वर्गों में विभाजित किया गया है: सामान्य, स्टैंसिल और शब्दावली नियम प्रतिष्ठित हैं। किसी भी प्रस्ताव पर कार्रवाई होने पर सामान्य नियम सक्रिय किए जा सकते हैं। अन्य दो प्रकार के नियम तभी लागू होते हैं जब संसाधित किए जा रहे वाक्य में कोई ऐसा शब्द हो जिसमें किसी नियम (टेम्पलेट नियम के मामले में) या स्वयं नियम (शब्दकोश नियम के मामले में) का संदर्भ हो। नियमों का ऐसा संगठन स्वचालित सिस्टम ट्यूनिंग सुनिश्चित करता है: केवल वे नियम सक्रिय होते हैं जो किसी विशेष ऑफ़र को संसाधित करने के लिए आवश्यक होते हैं।

3.4. मामलों की वर्तमान स्थिति और भविष्य के लिए योजनाएं

UNL से रूसी अनुवाद मॉड्यूल का एक प्रयोगात्मक संस्करण http://proling.iitp.ru/Deco पर उपलब्ध है। 2000 की गर्मियों तक, हम मॉड्यूल को सामान्य उपयोग के लिए उपलब्ध कराने की योजना बना रहे हैं। हमारा अगला काम एक इंटरैक्टिव एनकनवर्टर बनाना है।

जैसा कि योजना 3 से स्पष्ट है, UNL और उन संरचनाओं के बीच का इंटरफ़ेस जिसके साथ ETAP-3 मशीन अनुवाद मॉड्यूल काम करता है, अंग्रेजी नॉर्मएसएस के स्तर पर किया जाता है। वही आरेख दिखाता है कि मूल UNL . का अंग्रेजी अनुवाद अभिव्यक्ति ऐसी वास्तुकला का एक प्राकृतिक उपोत्पाद है। ऐसा करने के लिए, संश्लेषण के लिए अंग्रेजी नॉर्मएसएस भेजने के लिए पर्याप्त है। इस दिशा में कई सफल प्रयोग पहले ही किए जा चुके हैं।

साहित्य

यू.डी. अप्रेसियन, आई.एम. बोगुस्लाव्स्की, एल.एल और आदि। (1992 एक ) जटिल सूचना प्रणाली के लिए भाषाई प्रोसेसर। विज्ञान, 256 पी।एम।

जू. डी. अप्रेजन, आई. एम. बोगुस्लाव्स्की, एल. एल. इओमदीन एटअली. (1992बी) ETAP-2: मशीन ट्रांसलेशन सिस्टम की भाषाविज्ञान। // मेटा, वॉल्यूम। 37, नंबर 1, पीपी। 97-112.

इगोर बोगुस्लाव्स्की (1995)। एक द्वि-दिशात्मक रूसी-से-अंग्रेज़ी मशीन अनुवाद प्रणाली (ETAP-3)। // मशीन ट्रांसलेशन समिट वी. लक्जमबर्ग की कार्यवाही।

लियोनिद इओमडिन और ओलिवर स्ट्रीटर। (1999)। पैरेलल कॉर्पोरा से सीखना: मशीनी अनुवाद में प्रयोग। // डायलॉग"99: कम्प्यूटेशनल भाषाविज्ञान और इसके अनुप्रयोग अंतर्राष्ट्रीय कार्यशाला। तरुसा, रूस, जून 1999। खंड 2, पीपी। 79-88।

जिस अध्ययन के लिए यह लेख समर्पित है, वह रूसी फाउंडेशन फॉर बेसिक रिसर्च (अनुदान संख्या 99-06-80277) से आंशिक वित्तीय सहायता के साथ किया गया था।