पाठों के लिए कंप्यूटर शब्दकोश और मशीनी अनुवाद प्रणालियाँ। विषय पर पाठ की रूपरेखा: पाठ एमडीके "पाठ और कंप्यूटर शब्दकोशों के लिए मशीनी अनुवाद प्रणाली"

पाठों के लिए कंप्यूटर शब्दकोश और मशीनी अनुवाद प्रणालियाँ

कंप्यूटर शब्दकोश.एक भाषा से दूसरी भाषा में अनुवाद करने के लिए शब्दकोश आवश्यक हैं। सैकड़ों भाषाओं (अंग्रेजी-रूसी, जर्मन-फ़्रेंच, आदि) के बीच अनुवाद के लिए हजारों शब्दकोश हैं, और उनमें से प्रत्येक में हजारों शब्द हो सकते हैं। कागजी रूप में शब्दकोष सैकड़ों पन्नों की एक मोटी किताब है, जिसमें सही शब्द खोजना काफी लंबी और श्रमसाध्य प्रक्रिया है।

कंप्यूटर शब्दकोशों में सैकड़ों हजारों शब्दों और वाक्यांशों का विभिन्न भाषाओं में अनुवाद हो सकता है, और उपयोगकर्ता को अतिरिक्त क्षमताएं भी प्रदान की जा सकती हैं। सबसे पहले, कंप्यूटर शब्दकोश बहुभाषी हो सकते हैं - जिससे उपयोगकर्ता को भाषाएं और अनुवाद की दिशा (उदाहरण के लिए, अंग्रेजी-रूसी, स्पेनिश-रूसी, आदि) चुनने का अवसर मिलता है।

दूसरे, कंप्यूटर शब्दकोशों में आमतौर पर उपयोग किए जाने वाले शब्दों के मुख्य शब्दकोश के अलावा, ज्ञान के क्षेत्रों (प्रौद्योगिकी, चिकित्सा, कंप्यूटर विज्ञान, आदि) में दर्जनों विशिष्ट शब्दकोश शामिल हो सकते हैं।

तीसरा, कंप्यूटर शब्दकोश शब्दकोश प्रविष्टियों के लिए त्वरित खोज प्रदान करते हैं: "त्वरित टाइपिंग", जब किसी शब्द को टाइप करने की प्रक्रिया में समान शब्दों की एक सूची दिखाई देती है; बुकमार्क के माध्यम से अक्सर उपयोग किए जाने वाले शब्दों तक पहुंच; वाक्यांश आदि दर्ज करने की क्षमता

चौथा, कंप्यूटर शब्दकोश मल्टीमीडिया हो सकते हैं, यानी वे उपयोगकर्ता को देशी वक्ताओं द्वारा प्रस्तुत शब्दों को सुनने का अवसर प्रदान कर सकते हैं।

कंप्यूटर अनुवाद प्रणाली.दुनिया के वैश्वीकरण की प्रक्रिया के कारण दुनिया के विभिन्न देशों में स्थित और अलग-अलग भाषाएं बोलने वाले लोगों और संगठनों के बीच दस्तावेजों के लगातार आदान-प्रदान की आवश्यकता होती है।

इन शर्तों के तहत, पारंपरिक "मैनुअल" अनुवाद तकनीक का उपयोग अंतरजातीय संपर्कों के विकास को धीमा कर देता है। बहु-पृष्ठ दस्तावेज़ों का मैन्युअल रूप से अनुवाद करने के लिए अनुवादकों को लंबे समय और उच्च वेतन की आवश्यकता होती है। ई-मेल द्वारा प्राप्त पत्र या ब्राउज़र में देखे गए वेब पेज का अनुवाद तत्काल किया जाना चाहिए, और अनुवादक को आमंत्रित करने का कोई समय नहीं है।

कंप्यूटर-सहायता प्राप्त अनुवाद प्रणालियाँ इन समस्याओं का समाधान कर सकती हैं। एक ओर, वे उच्च गति (प्रति सेकंड एक पृष्ठ) पर बहु-पृष्ठ दस्तावेज़ों का अनुवाद करने में सक्षम हैं, और दूसरी ओर, वास्तविक समय में तुरंत वेब पेजों का अनुवाद करने में सक्षम हैं।

कंप्यूटर अनुवाद प्रणालियाँ औपचारिक "ज्ञान" के आधार पर ग्रंथों का अनुवाद करती हैं: भाषा वाक्यविन्यास (वाक्य निर्माण के नियम), शब्द निर्माण नियम और शब्दकोशों का उपयोग। एक अनुवादक प्रोग्राम पहले एक भाषा के पाठ का विश्लेषण करता है और फिर इस पाठ का दूसरी भाषा में निर्माण करता है।

आधुनिक कंप्यूटर अनुवाद प्रणालियाँ तकनीकी दस्तावेज़ीकरण, व्यावसायिक पत्राचार और अन्य विशिष्ट ग्रंथों का पर्याप्त गुणवत्ता के साथ अनुवाद करना संभव बनाती हैं। हालाँकि, वे कला के कार्यों के अनुवाद के लिए लागू नहीं हैं, क्योंकि वे रूपकों, रूपकों और मानव कलात्मक रचनात्मकता के अन्य तत्वों का पर्याप्त रूप से अनुवाद करने में सक्षम नहीं हैं।

प्रश्नों पर नियंत्रण रखें

    1. पारंपरिक पेपर शब्दकोशों की तुलना में कंप्यूटर शब्दकोशों के क्या फायदे हैं?
    2. किन मामलों में कंप्यूटर अनुवाद प्रणाली का उपयोग करना उचित है?

ऑप्टिकल दस्तावेज़ पहचान प्रणाली

ऑप्टिकल कैरेक्टर रिकग्निशन सिस्टम।ऑप्टिकल कैरेक्टर रिकग्निशन सिस्टम का उपयोग पुस्तकों और दस्तावेजों को डिजिटल कंप्यूटर प्रारूप में परिवर्तित करके इलेक्ट्रॉनिक पुस्तकालय और अभिलेखागार बनाने के लिए किया जाता है।

सबसे पहले, एक स्कैनर का उपयोग करके, आपको ग्राफिक प्रारूप में पाठ के एक पृष्ठ की एक छवि प्राप्त करने की आवश्यकता है। इसके बाद, टेक्स्ट प्रारूप में एक दस्तावेज़ प्राप्त करने के लिए, टेक्स्ट पहचान करना आवश्यक है, यानी ग्राफिक छवि के तत्वों को टेक्स्ट वर्णों के अनुक्रम में परिवर्तित करना आवश्यक है।

ऑप्टिकल कैरेक्टर रिकग्निशन सिस्टम पहले पृष्ठ पर पाठ की संरचना निर्धारित करते हैं और इसे अलग-अलग क्षेत्रों में विभाजित करते हैं: कॉलम, टेबल, छवियां इत्यादि। इसके बाद, पृष्ठ की ग्राफिक छवि के चयनित पाठ टुकड़े अलग-अलग पात्रों की छवियों में विभाजित होते हैं।

टाइपोग्राफिक गुणवत्ता (उचित रूप से बड़े फ़ॉन्ट, कोई खराब मुद्रित अक्षर या सुधार) के स्कैन किए गए दस्तावेज़ों के लिए, बिटमैप पैटर्न के साथ तुलना करके चरित्र पहचान की जाती है।

प्रत्येक वर्ण की रेखापुंज छवि क्रमिक रूप से ऑप्टिकल पहचान प्रणाली की मेमोरी में संग्रहीत रेखापुंज वर्ण टेम्पलेट्स पर आरोपित होती है। पहचान का परिणाम वह चरित्र है जिसका पैटर्न छवि से सबसे अधिक मेल खाता है (चित्र 3.16)।

कम मुद्रण गुणवत्ता (टाइप किए गए पाठ, फैक्स, आदि) वाले दस्तावेज़ों को पहचानते समय, वेक्टर वर्ण पहचान विधि का उपयोग किया जाता है। मान्यता प्राप्त प्रतीक छवि में, ज्यामितीय आदिम (खंड, वृत्त, आदि) की पहचान की जाती है और वेक्टर प्रतीक टेम्पलेट्स के साथ तुलना की जाती है। परिणामस्वरूप, प्रतीक का चयन किया जाता है जिसके लिए सभी ज्यामितीय आदिमों की समग्रता और उनका स्थान मान्यता प्राप्त प्रतीक से सबसे अधिक मेल खाता है (चित्र 3.17)।

ऑप्टिकल कैरेक्टर रिकग्निशन सिस्टम "स्व-शिक्षण" हैं (प्रत्येक विशिष्ट दस्तावेज़ के लिए वे कैरेक्टर पैटर्न का एक उपयुक्त सेट बनाते हैं), और इसलिए बहु-पृष्ठ दस्तावेज़ की पहचान की गति और गुणवत्ता धीरे-धीरे बढ़ रही है।

1990 में एप्पल के पहले न्यूटन पॉकेट कंप्यूटर के आगमन के साथ, लिखावट पहचान प्रणाली का निर्माण शुरू हुआ। ऐसे सिस्टम पॉकेट कंप्यूटर की स्क्रीन पर लिखे गए टेक्स्ट को एक विशेष पेन से टेक्स्ट-आधारित कंप्यूटर दस्तावेज़ में बदल देते हैं।

ऑप्टिकल आकार पहचान प्रणाली।जब बड़ी संख्या में लोग दस्तावेज़ भरते हैं (उदाहरण के लिए, जब एक स्कूल स्नातक एकीकृत राज्य परीक्षा (USE) देता है), तो खाली फ़ील्ड वाले फॉर्म का उपयोग किया जाता है। डेटा को फ़ील्ड में बड़े अक्षरों में हाथ से दर्ज किया जाता है। फिर इस डेटा को ऑप्टिकल आकार पहचान प्रणालियों का उपयोग करके पहचाना जाता है और कंप्यूटर डेटाबेस में दर्ज किया जाता है।

कठिनाई यह है कि आपको हस्तलिखित अक्षरों को पहचानने की आवश्यकता है, जो व्यक्ति-दर-व्यक्ति में काफी भिन्न होते हैं। इसके अलावा, ऐसी प्रणालियों को यह निर्धारित करने में सक्षम होना चाहिए कि मान्यता प्राप्त पाठ किस क्षेत्र से संबंधित है।

प्रश्नों पर नियंत्रण रखें

    1. रैस्टर और वेक्टर विधियों का उपयोग करते समय टेक्स्ट पहचान तकनीक में क्या अंतर हैं?

क्रमांक 8. पाठ्य सूचना की कोडिंग।

नंबर 9. टेम्पलेट के आधार पर बिजनेस कार्ड बनाएं।

नंबर 10. दस्तावेज़ पृष्ठ पैरामीटर सेट करना, शीर्षलेख और पादलेख और पृष्ठ संख्याएँ सम्मिलित करना।

क्रमांक 11. दस्तावेज़ में सूत्र सम्मिलित करना।

क्रमांक 12. वर्णों और अनुच्छेदों का स्वरूपण।

#13: सूचियाँ बनाना और स्वरूपित करना.

#14: शीर्षकों वाले दस्तावेज़ में विषय-सूची सम्मिलित करना।

संख्या 15. किसी दस्तावेज़ में एक तालिका सम्मिलित करना, उसे फ़ॉर्मेट करना और उसमें डेटा भरना।

क्रमांक 16. हाइपरटेक्स्ट दस्तावेज़ बनाना।

क्रमांक 17. कंप्यूटर शब्दकोश का उपयोग करके पाठ का अनुवाद।

नंबर 18. एक पेपर टेक्स्ट दस्तावेज़ को स्कैन करना और पहचानना।

इसके साथ ही नई सूचना प्रौद्योगिकियों के व्यापक उपयोग के साथ, "सूचना प्रणाली" (आईएस) की अवधारणा सामने आई। सूचना प्रणाली वस्तु के बारे में जानकारी एकत्र करती है, संचारित करती है और संसाधित करती है, विभिन्न स्तरों पर श्रमिकों को प्रबंधन कार्य को लागू करने के लिए जानकारी प्रदान करती है।

कंप्यूटर कानूनी संदर्भ प्रणाली (एसपीएस) ऐसे डेटाबेस हैं जिनमें जनसंपर्क के सबसे महत्वपूर्ण क्षेत्रों को विनियमित करने वाले मानक दस्तावेज़ शामिल हैं। संदर्भ और कानूनी प्रणालियाँ जो आज मौजूद हैं, एक निश्चित राज्य पंजीकरण और प्रमाणीकरण पारित करने के बाद, संभावित लोगों के लिए काफी सुलभ हो जाती हैंहमारे उपयोगकर्ताओं (कानूनी या प्राकृतिक व्यक्ति) के पास एटीपी की सामग्री का हवाला देकर, कानूनी ज्ञान के क्षेत्र में मौजूदा अंतराल को खत्म करने का अवसर है।

20वीं सदी के मध्य में. सभी विकसित देशों में कानूनी जानकारी का तेजी से विकास शुरू हुआ। विधायी और अन्य नियामक कानूनी कृत्यों की संख्या सैकड़ों हजारों तक पहुंच जाती है, जिससे सूचना संकट पैदा होता है। प्रारंभ में, यह माना जाता था कि एसपीएस सूचना के साथ काम करते समय केवल अतिरिक्त सुविधा पैदा करता है, और उनके उपयोग के बिना ऐसा करना काफी संभव है। हालाँकि, जब सभी रूसी कानूनों में बड़े पैमाने पर संशोधन और पुनर्गठन शुरू हुआ, तो नए अपनाए गए नियमों के विशाल प्रवाह पर नज़र रखना असंभव हो गया। इसलिए, 1994 के मध्य तक, कानूनी सॉफ्टवेयर पैकेजों के संभावित खरीदारों की संख्या में काफी वृद्धि हुई थी।

जानकारी प्राप्त करने के पारंपरिक तरीके, उदाहरण के लिए, पत्रिकाओं या अन्य मुद्रित स्रोतों का उपयोग, सभी इच्छुक पार्टियों के लिए कानूनी समर्थन की समस्या को हल करने में सक्षम नहीं थे। कंप्यूटर कानूनी जानकारी एकत्र करने, संग्रहीत करने और जारी करने का एक अद्भुत साधन था।

आज, अधिकांश पेशेवर वकील सबसे संपूर्ण संदर्भ, सूचना और कानूनी जानकारी प्राप्त करने के अवसर में रुचि रखते हैं। व्यवसाय की त्वरित गति और नई आर्थिक परिस्थितियों के लिए कंप्यूटर कानूनी संदर्भ प्रणालियों के निर्माण की आवश्यकता थी, जो कानूनी डेटाबेस हैं।

कानूनी संदर्भ प्रणालियों का मुख्य कार्य कंप्यूटर प्रशिक्षण के विभिन्न स्तरों वाले अधिकतम संख्या में उपयोगकर्ताओं तक विश्वसनीय कानूनी जानकारी पहुंचाना है। इसके अलावा, सिस्टम को डेटाबेस के निरंतर अद्यतन द्वारा सुनिश्चित किया जाना चाहिए।

कंप्यूटर कानूनी संदर्भ प्रणालियों में कई महत्वपूर्ण गुण होते हैं जो नियामक जानकारी के साथ काम करते समय उन्हें व्यावहारिक रूप से अपरिहार्य बनाते हैं।

सबसे पहले, यह पाठ्य जानकारी के विशाल सरणियों के साथ काम करने की क्षमता है - डेटाबेस में जानकारी की मात्रा व्यावहारिक रूप से असीमित है, यह इसमें कई दर्जन दस्तावेज़ जोड़कर इसे दैनिक रूप से अपडेट करने की अनुमति देता है, साथ ही साथ अभिलेखीय दस्तावेजों आदि के डेटाबेस को संग्रहीत करता है। .

दूसरे, एटीपी में विशेष खोज सॉफ़्टवेयर टूल का उपयोग संपूर्ण सूचना आधार पर वास्तविक समय में खोज करने की अनुमति देता है।

तीसरा लाभ यह है कि एटीपी की दूरसंचार साधनों का उपयोग करके काम करने की क्षमता, यानी। ईमेल या वैश्विक नेटवर्क का उपयोग करने से आप सूचना डेटाबेस को अपडेट कर सकते हैं, और साथ ही उपयोगकर्ता के कंप्यूटर पर डिस्क स्थान बर्बाद नहीं करते हैं। हालाँकि, यह ध्यान दिया जाना चाहिए कि स्थानीय डेटाबेस के साथ एटीपी के संशोधन अब तक की सबसे बड़ी मांग हैं।

कानूनी जानकारी एक ही स्रोत से प्राप्त नहीं की जा सकती, जिसके परिणामस्वरूप क्षेत्र से जानकारी एकत्र करने की आवश्यकता होती है। इस संबंध में, एक राष्ट्रव्यापी कानूनी सूचना प्रणाली के निर्माण में, गैर-राज्य कंप्यूटर फर्म और कंपनियां जो कानूनी जानकारी के इलेक्ट्रॉनिक संस्करण बाजार में जारी करती हैं, तेजी से महत्वपूर्ण भूमिका निभा रही हैं।

कानूनी कंप्यूटर सिस्टम की एक विस्तृत श्रृंखला रूसी व्यापार सॉफ्टवेयर बाजार में एक अनोखी घटना है।

कानून प्रवर्तन अधिकारियों को अद्यतन, पूर्ण और विश्वसनीय विधायी जानकारी, नियामक दस्तावेजों में किए गए परिवर्तनों और परिवर्धन के बारे में जानकारी प्रदान करना सर्वोच्च प्राथमिकताओं में से एक है। हालाँकि, हर दिन, अकेले उच्चतम राज्य अधिकारियों द्वारा औसतन कई दर्जन मानक अधिनियम अपनाए जाते हैं। इसके अलावा, प्रभावी कार्य के लिए अक्सर रूसी संघ के घटक संस्थाओं द्वारा अपनाए गए नियमों के साथ-साथ विभागीय दस्तावेजों की उपस्थिति की आवश्यकता होती है।

वर्तमान में, कानूनी संदर्भ प्रणाली बनाने वाली कंपनियों के बीच प्रतिस्पर्धा बढ़ रही है, और उपयोगकर्ता की मांग बढ़ रही है। यदि हाल ही में केवल सही दस्तावेज़ ढूंढना ही पर्याप्त था, तो आज दस्तावेज़ों के बीच सभी संभावित कनेक्शनों का पता लगाना, स्पष्टीकरण प्राप्त करना, रुचि के विषय पर समीक्षा तैयार करना और अपना स्वयं का उपयोगकर्ता डेटाबेस बनाना अक्सर आवश्यक होता है। सूचना आधार काफी विशाल होते हैं और इनमें अक्सर अद्वितीय दस्तावेज़ होते हैं; हालाँकि, डेटाबेस अपडेट, सिस्टम रखरखाव आदि के समर्थन के लिए प्रभावी चैनलों की कमी के कारण ऐसे सिस्टम के साथ बड़े पैमाने पर उपयोगकर्ता का काम मुश्किल होता है। इसलिए, "कंसल्टेंट प्लस", "गारंट", "कोडेक्स" जैसे वाणिज्यिक एसपीएस को उपयोगकर्ताओं से व्यापक मान्यता मिली है।

आप निम्नलिखित मानदंडों का उपयोग करके संदर्भ कानूनी प्रणालियों की तुलना और मूल्यांकन कर सकते हैं:

  • मूल दस्तावेजों की प्रामाणिकता की डिग्री
  • दस्तावेज़ों का कानूनी प्रसंस्करण
  • सूचना बैंक की मात्रा; उपयोगकर्ता आधार बनाना
  • डेटाबेस में दस्तावेज़ खोजने की गति
  • सूचना की प्रासंगिकता और दस्तावेजों की शीघ्र प्राप्ति
  • डेटाबेस तक दूरस्थ पहुँच की संभावना

इस प्रकार, कानूनी संदर्भ प्रणाली, कानूनी जानकारी के वाहक होने के नाते, कानूनी निरक्षरता को खत्म करना संभव बनाती है, विशेषज्ञों (वकीलों, लेखाकारों, प्रबंधकों) के काम को आसान बनाती है, कानूनी मुद्दों को हल करते समय उनकी उत्पादकता में काफी वृद्धि करती है। इन समस्याओं का समाधान कानूनी वास्तविकता में बदलाव, उसके सुधार और वैधता की स्थिति को महत्वपूर्ण रूप से प्रभावित करता है।

नॉलेज बेस में अपना अच्छा काम भेजना आसान है। नीचे दिए गए फॉर्म का उपयोग करें

छात्र, स्नातक छात्र, युवा वैज्ञानिक जो अपने अध्ययन और कार्य में ज्ञान आधार का उपयोग करते हैं, आपके बहुत आभारी होंगे।

प्रकाशित किया गया http://www.allbest.ru/

परिचय

1. कंप्यूटर शब्दकोश

2. कंप्यूटर अनुवाद प्रणाली

3. मशीनी अनुवाद प्रणाली

4 . ऑनलाइन अनुवादक

निष्कर्ष

ग्रन्थसूची

परिचय

आधुनिक कंप्यूटर अनुवाद प्रणालियाँ तकनीकी दस्तावेज़ीकरण, व्यावसायिक पत्राचार और अन्य विशिष्ट ग्रंथों का स्वीकार्य गुणवत्ता के साथ अनुवाद करना संभव बनाती हैं। लेकिन इन प्रणालियों पर पूरी तरह भरोसा नहीं किया जा सकता। वे शब्दार्थ और शैलीगत त्रुटियाँ करते हैं और उदाहरण के लिए, कला के कार्यों का अनुवाद करने के लिए लागू नहीं होते हैं, क्योंकि वे रूपकों, रूपकों और मानव कलात्मक रचनात्मकता के अन्य तत्वों आदि का पर्याप्त रूप से अनुवाद करने में सक्षम नहीं हैं।

मशीनी अनुवाद परिणामों को बेहतर बनाने के तरीके हैं:

1. अनुवाद शुरू करने से पहले, आपको पाठ का प्रकार निर्धारित करना होगा, अर्थात यह मानव जीवन के किस क्षेत्र (अर्थशास्त्र, खेल, विज्ञान, आदि) का प्रतिनिधित्व करता है। आख़िरकार, प्रत्येक क्षेत्र की अपनी बारीकियाँ और शर्तें होती हैं।

2. अक्सर गलत अनुवाद का कारण अनुवादित पाठ में टाइप त्रुटियां होती हैं। यह बात मान्यताप्राप्त ग्रंथों पर भी लागू होती है. त्रुटियों वाले शब्दों को अनुवादकों द्वारा अपरिचित के रूप में चिह्नित किया जाता है, क्योंकि वे इस रूप में शब्दकोशों में नहीं हैं। यदि विराम चिह्नों में त्रुटियाँ हैं तो यह और भी बुरा है - एक गलत तरीके से रखा गया अल्पविराम पूरे वाक्य के अनुवाद को विकृत कर सकता है।

3. पाठ अंशों के साथ कार्य करें। कभी भी पूरे पाठ का एक साथ अनुवाद न करें। हमेशा ऐसे शब्द होंगे जो शब्दकोश में नहीं हैं और जिनका सिस्टम गलत अनुवाद करता है।

अनुवादक कार्यक्रमों की सहायता से, आप तकनीकी दस्तावेज़ीकरण, व्यावसायिक पत्राचार और "सूखी" भाषा में लिखी गई अन्य पाठ्य सामग्री का सफलतापूर्वक अनुवाद कर सकते हैं। भावनात्मक रूप से ओत-प्रोत, अतिशयोक्ति, रूपकों आदि से भरपूर साहित्यिक ग्रंथों का अनुवाद केवल एक इंसान ही पूरी तरह से कर सकता है।

अनुवादक कार्यक्रम:

-आज हर किसी के लिए हवा की तरह कम से कम एक विदेशी भाषा का ज्ञान आवश्यक है। विशेष रूप से उपयोगकर्ताओं के लिए: अफसोस, कंप्यूटर पर काम करते समय अंग्रेजी भाषा का सामना करने से बचना असंभव है।

- आपके कंप्यूटर पर स्थापित विशिष्ट अनुवादक प्रोग्राम मदद कर सकते हैं।

शब्दकोश प्रत्येक बुद्धिमान व्यक्ति के पुस्तकालय का एक अभिन्न अंग है। इनका उपयोग सबसे जिज्ञासु बच्चों द्वारा भी किया जाता है। और शिक्षकों और प्रशिक्षकों का कहना है कि "कुछ नहीं करने के लिए" एक शब्दकोश उल्टी करना एक बहुत ही उपयोगी चीज है। न तो कोई छात्र, न स्कूली बच्चा, न ही कोई वैज्ञानिक उनके बिना कुछ नहीं कर सकता। विभिन्न क्षेत्रों के विशेषज्ञ अक्सर हजारों विषयों पर शब्दकोश देखते हैं। यहां तक ​​कि बहुत अच्छे अनुवादक भी काम से पहले कई शब्दकोश मेज पर रख देते हैं।

कंप्यूटर शब्दकोश अनुवाद इंटरनेट

1 . कंप्यूटर शब्दकोश

कंप्यूटर शब्दकोश. एक भाषा से दूसरी भाषा में अनुवाद करने के लिए शब्दकोश आवश्यक हैं। पहला शब्दकोश लगभग 5 हजार साल पहले सुमेर में बनाया गया था और मिट्टी की गोलियाँ थीं जो दो भागों में विभाजित थीं। एक भाग में सुमेरियन भाषा में एक शब्द लिखा था, और दूसरे में - किसी अन्य भाषा में समान अर्थ वाला एक शब्द, कभी-कभी संक्षिप्त स्पष्टीकरण के साथ।

शब्दकोश और ई-पुस्तकें आपस में बहुत जुड़ी हुई हैं - हाल ही में एक कंप्यूटर शब्दकोश ने खोजे गए शब्द को स्वतंत्र रूप से खोजना, खोजना और उच्चारण करना सीख लिया है। कभी-कभी यह परिवार के अन्य सदस्यों के लिए विदेश से किसी मित्र के ई-मेल, या उपकरण के लिए किसी निर्देश का अनुवाद करते समय उपयोगी होगा।

आधुनिक शब्दकोश इसी सिद्धांत पर बने हैं। वर्तमान में, सैकड़ों भाषाओं (अंग्रेजी-रूसी, जर्मन-फ़्रेंच, आदि) के बीच अनुवाद के लिए हजारों शब्दकोश हैं, जिनमें से प्रत्येक में दसियों हज़ार शब्द हो सकते हैं। कागजी संस्करण में, शब्दकोश सैकड़ों पृष्ठों की एक मोटी किताब है, जिसमें सही शब्द की खोज एक श्रम-गहन प्रक्रिया है।

कंप्यूटर शब्दकोशों में सैकड़ों हजारों शब्दों और वाक्यांशों का विभिन्न भाषाओं में अनुवाद हो सकता है, और उपयोगकर्ता को अतिरिक्त क्षमताएं भी प्रदान की जा सकती हैं:

§ *ऐसे बहुभाषी कंप्यूटर शब्दकोश हैं जो उपयोगकर्ता को भाषाओं और अनुवाद की दिशा (उदाहरण के लिए, अंग्रेजी-रूसी, स्पेनिश-रूसी, आदि) का चयन करने की अनुमति देते हैं;

§ *कंप्यूटर शब्दकोशों में, आमतौर पर उपयोग किए जाने वाले शब्दों के मुख्य शब्दकोश के अलावा, ज्ञान के क्षेत्रों (प्रौद्योगिकी, चिकित्सा, कंप्यूटर विज्ञान, आदि) में दर्जनों विशिष्ट शब्दकोश शामिल हो सकते हैं;

§ *कंप्यूटर शब्दकोश शब्दकोश प्रविष्टियों के लिए त्वरित खोज प्रदान करते हैं: "तेज़ टाइपिंग", जब किसी शब्द को टाइप करने की प्रक्रिया में समान शब्दों की एक सूची दिखाई देती है; बुकमार्क के माध्यम से अक्सर उपयोग किए जाने वाले शब्दों तक पहुंच; वाक्यांश आदि दर्ज करने की क्षमता;

§ कंप्यूटर शब्दकोश मल्टीमीडिया हो सकते हैं, यानी, उपयोगकर्ता को देशी वक्ताओं द्वारा प्रस्तुत शब्दों को सुनने का अवसर प्रदान करते हैं;

* इंटरनेट पर ऑनलाइन कंप्यूटर शब्दकोश विषयगत शब्दकोश और अनुवाद की दिशा का विकल्प प्रदान करते हैं।

कंप्यूटर शब्दकोशों की अतिरिक्त विशेषताएँ

· पहले तो, कंप्यूटर शब्दकोश बहुभाषी हो सकते हैं, क्योंकि वे उपयोगकर्ता को भाषाएं और अनुवाद की दिशा (उदाहरण के लिए, अंग्रेजी-रूसी, स्पेनिश-रूसी, और इसी तरह) चुनने का अवसर देते हैं।

· दूसरे, कंप्यूटर शब्दकोशों में, आमतौर पर उपयोग किए जाने वाले शब्दों के मुख्य शब्दकोश के अलावा, ज्ञान के क्षेत्रों (प्रौद्योगिकी, चिकित्सा, कंप्यूटर विज्ञान, आदि) में दर्जनों विशिष्ट शब्दकोश शामिल हो सकते हैं।

· तीसरा, कंप्यूटर शब्दकोश शब्दकोश प्रविष्टियों के लिए त्वरित खोज प्रदान करते हैं: "तेज़ टाइपिंग", जब किसी शब्द को टाइप करने की प्रक्रिया में समान शब्दों की एक सूची दिखाई देती है; बुकमार्क के माध्यम से अक्सर उपयोग किए जाने वाले शब्दों तक पहुंच; वाक्यांश आदि दर्ज करने की क्षमता

· चौथी, कंप्यूटर शब्दकोश मल्टीमीडिया हो सकते हैं, अर्थात, वे उपयोगकर्ता को देशी वक्ताओं द्वारा प्रस्तुत शब्दों को सुनने का अवसर प्रदान करते हैं।

2 . कंप्यूटर अनुवाद प्रणाली

हमारी दुनिया के वर्तमान वैश्वीकरण के कारण दुनिया के विभिन्न देशों में स्थित और विभिन्न भाषाएँ बोलने वाले लोगों और संगठनों के बीच दस्तावेजों के आदान-प्रदान की आवश्यकता पैदा हो गई है।

इन शर्तों के तहत, पारंपरिक "मैनुअल" अनुवाद तकनीक का उपयोग अंतरजातीय संपर्कों के विकास को धीमा कर देता है। बहु-पृष्ठ दस्तावेज़ों का मैन्युअल रूप से अनुवाद करने में लंबा समय लगता है। ई-मेल द्वारा प्राप्त पत्र या ब्राउज़र में देखे गए वेब पेज का अनुवाद "यहाँ और अभी" किया जाना चाहिए और अनुवादक को आमंत्रित करने का कोई अवसर या समय नहीं है।

कंप्यूटर-सहायता प्राप्त अनुवाद प्रणालियाँ इन समस्याओं का समाधान कर सकती हैं। एक ओर, वे उच्च गति (प्रति सेकंड एक पृष्ठ) पर बहु-पृष्ठ दस्तावेज़ों का अनुवाद करने में सक्षम हैं, और दूसरी ओर, वास्तविक समय में तुरंत वेब पेजों का अनुवाद करने में सक्षम हैं।

कंप्यूटर अनुवाद प्रणालियाँ भाषा के औपचारिक "ज्ञान" के आधार पर पाठ का अनुवाद करती हैं: भाषा वाक्यविन्यास (वाक्य निर्माण के नियम), शब्द निर्माण नियम और शब्दकोशों का उपयोग। एक अनुवादक प्रोग्राम पहले एक भाषा के पाठ का विश्लेषण करता है और फिर इस पाठ का दूसरी भाषा में निर्माण करता है।

इंटरनेट पर ऑनलाइन कंप्यूटर अनुवादक विषयगत शब्दकोश और अनुवाद की दिशा का विकल्प प्रदान करते हैं। वे आपको मूल स्वरूपण, साथ ही ईमेल को बनाए रखते हुए, अनुवाद विंडो में टाइप किए गए या क्लिपबोर्ड, हाइपरलिंक सहित वेब पेजों से कॉपी किए गए किसी भी पाठ का अनुवाद करने की अनुमति देते हैं।

इस प्रकार के शब्दकोश का अभूतपूर्व लाभ इसकी कीमत और सुविधा है: वे सीडी से फ्लैश ड्राइव तक लगभग किसी भी माध्यम पर फिट होते हैं।

टेक्स्ट दस्तावेज़ों का अनुवाद करने के लिए अनुवादक प्रोग्राम का उपयोग किया जाता है। वे भाषा के औपचारिक ज्ञान पर आधारित हैं - शब्द निर्माण के नियम और वाक्य निर्माण के नियम।

3. मशीनी अनुवाद प्रणाली

· मशीनी अनुवाद प्रणालियाँ आपको बहु-पृष्ठ दस्तावेज़ीकरण के त्वरित अनुवाद की समस्याओं को हल करने की अनुमति देती हैं।

· वे, एक ओर, उच्च गति (प्रति सेकंड एक पृष्ठ) पर बहु-पृष्ठ दस्तावेज़ों का अनुवाद करने में सक्षम हैं और दूसरी ओर, वास्तविक समय में तुरंत वेब पेजों का अनुवाद करने में सक्षम हैं। PROMT और सुकरात को रूसी मशीनी अनुवाद प्रणालियों में सर्वश्रेष्ठ माना जाता है।

मशीनी अनुवाद प्रणालियों के अनुप्रयोग का दायरा

· मशीनी अनुवाद प्रणालियाँ भाषा के औपचारिक "ज्ञान" (भाषा वाक्यविन्यास - वाक्य निर्माण के नियम, शब्द निर्माण के नियम) और शब्दकोशों के उपयोग के आधार पर ग्रंथों का अनुवाद करती हैं। एक अनुवादक प्रोग्राम पहले एक भाषा के पाठ का विश्लेषण करता है और फिर इस पाठ का दूसरी भाषा में निर्माण करता है।

· आधुनिक मशीनी अनुवाद प्रणालियाँ तकनीकी दस्तावेज़ीकरण, व्यावसायिक पत्राचार और अन्य विशिष्ट ग्रंथों का पर्याप्त गुणवत्ता के साथ अनुवाद करना संभव बनाती हैं। हालाँकि, वे कला के कार्यों के अनुवाद के लिए लागू नहीं हैं, क्योंकि वे रूपकों, रूपकों और मानव कलात्मक रचनात्मकता के अन्य तत्वों का पर्याप्त रूप से अनुवाद करने में सक्षम नहीं हैं।

मशीन अनुवादक सेटिंग्स को चार बुनियादी आवश्यकताओं को पूरा करना होगा:

· क्षमता

· लचीलापन

· रफ़्तार

· शुद्धता

दक्षता शब्दावली और विषयगत अनुभागों के निरंतर अद्यतन की संभावना में निहित है।

लचीलापन एक विशिष्ट विषय क्षेत्र के लिए डिज़ाइन किया गया है।

गति - कागज से पाठ जानकारी को स्वचालित रूप से दर्ज करने और संसाधित करने की क्षमता। ऐसी ही एक प्रणाली (ओसीआर-सिस्टम) हर दिन दस से अधिक अनुभवी टाइपिस्टों को हटा देती है।

सटीकता साक्षरता और अनुवादित पाठ के अर्थ को लक्ष्य भाषा में पर्याप्त रूप से स्थानांतरित करने में निहित है।

अनुवादक कार्यक्रमों की सहायता से, आप तकनीकी दस्तावेज़ीकरण, व्यावसायिक पत्राचार और "सूखी" भाषा में लिखी गई अन्य पाठ्य सामग्री का सफलतापूर्वक अनुवाद कर सकते हैं। भावनात्मक रूप से ओत-प्रोत, अतिशयोक्ति, रूपकों आदि से भरपूर साहित्यिक ग्रंथों का अनुवाद केवल एक इंसान ही पूरी तरह से कर सकता है। अनुवादक कार्यक्रम पहले स्रोत भाषा में पाठ का विश्लेषण करता है, और फिर उस भाषा में इस पाठ का निर्माण करता है जिसमें इसका अनुवाद करने की आवश्यकता होती है।

4 . ऑनलाइन अनुवादक

इसके अलावा, वर्ल्ड वाइड वेब के विकास के साथ, तथाकथित ऑनलाइन शब्दकोश (अंग्रेजी ऑन-लाइन - वास्तविक समय में) या अनुवादक बनाए गए हैं और काम कर रहे हैं।

ऑनलाइन पाठ अनुवादक निम्नलिखित भाषाओं के लिए अनुवाद निर्देशों का समर्थन करता है:

· यूक्रेनी

· रूसी

· अंग्रेज़ी

· पोलिश

· जर्मन

· लातवियाई

· फ़्रेंच

पाठ दर्ज करना और अनुवाद दिशा का चयन करना.

स्रोत पाठ को शीर्ष विंडो में मुद्रित या कॉपी किया जाना चाहिए और ड्रॉप-डाउन मेनू से अनुवाद दिशा का चयन करना चाहिए। उदाहरण के लिए, रूसी-यूक्रेनी अनुवाद के लिए, आपको शीर्ष विंडो में रूसी में पाठ दर्ज करना होगा और ड्रॉप-डाउन मेनू से "रूसी", फिर "यूक्रेनी" का चयन करना होगा। इसके बाद आपको ट्रांसलेट बटन दबाना होगा

विशिष्ट शब्दकोश

यदि अनुवाद के लिए स्रोत पाठ किसी विशिष्ट उद्योग से संबंधित है, तो ड्रॉप-डाउन सूची से किसी विशेष शब्दकोश का विषय चुनें, उदाहरण के लिए, व्यवसाय, इंटरनेट, कानून, संगीत और अन्य। डिफ़ॉल्ट रूप से, सामान्य शब्दावली शब्दकोश का उपयोग किया जाता है।

वर्तनी जांच

अनुवाद की गुणवत्ता स्रोत पाठ की सही वर्तनी पर निर्भर करती है। हम वर्तनी जांचकर्ता का उपयोग करने की अनुशंसा करते हैं। वर्तनी जांचकर्ता यूक्रेनी, रूसी और अंग्रेजी भाषाओं के लिए काम करता है।

लिप्यंतरण

किसी ऐसे पते वाले के साथ पत्राचार करते समय जिसके पास सिरिलिक वर्णमाला स्थापित नहीं है, आप लिप्यंतरण का उपयोग कर सकते हैं। लिप्यंतरण रूसी और यूक्रेनी भाषाओं का समर्थन करता है, और लैटिन से सिरिलिक और सिरिलिक से लैटिन दोनों में लिप्यंतरण करता है।

वर्चुअल कीबोर्ड

यदि आवश्यक लेआउट आपके कंप्यूटर पर नहीं है, तो वर्चुअल कीबोर्ड का उपयोग करें। वर्चुअल कीबोर्ड रूसी, यूक्रेनी, अंग्रेजी, जर्मन, फ्रेंच, स्पेनिश और इतालवी के लिए पेश किया गया है।

निष्कर्ष

सबसे महत्वपूर्ण:

§ आधुनिक कंप्यूटरों की बड़ी मात्रा में जानकारी संग्रहीत करने और उनमें त्वरित खोज करने की क्षमताएं कंप्यूटर शब्दकोशों और अनुवादक कार्यक्रमों के विकास का आधार बनती हैं। कंप्यूटर शब्दकोश व्यक्तिगत शब्दों और वाक्यांशों का अनुवाद करते हैं। टेक्स्ट दस्तावेज़ों का अनुवाद करने के लिए अनुवादक प्रोग्राम का उपयोग किया जाता है।

§ आधुनिक कंप्यूटरों की बड़ी मात्रा में डेटा संग्रहीत करने और उनमें त्वरित खोज करने की क्षमताएं कंप्यूटर शब्दकोशों और अनुवादक कार्यक्रमों के विकास का आधार बनती हैं।

§ कई सौ पृष्ठों वाले एक नियमित शब्दकोश में, सही शब्द ढूंढना एक लंबी और श्रम-गहन प्रक्रिया है। कंप्यूटर शब्दकोश शब्दकोश प्रविष्टियों के लिए त्वरित खोज प्रदान करते हैं। कई शब्दकोश उपयोगकर्ताओं को देशी वक्ताओं द्वारा बोले गए शब्दों को सुनने का अवसर प्रदान करते हैं।

§ कंप्यूटर शब्दकोश (रूसी-अंग्रेजी और अंग्रेजी-रूसी, रूसी-फ़्रेंच, रूसी-जर्मन, आदि) कंप्यूटर पर स्वतंत्र प्रोग्राम के रूप में स्थापित किए जा सकते हैं, वर्ड प्रोसेसर में निर्मित होते हैं, और इंटरनेट पर ऑनलाइन मौजूद होते हैं।

§ कंप्यूटर शब्दकोश अलग-अलग शब्दों और वाक्यांशों का अनुवाद करते हैं। टेक्स्ट दस्तावेज़ों का अनुवाद करने के लिए अनुवादक प्रोग्राम का उपयोग किया जाता है। वे भाषा के औपचारिक ज्ञान पर आधारित हैं - शब्द निर्माण के नियम और वाक्य निर्माण के नियम। अनुवादक कार्यक्रम पहले स्रोत भाषा में पाठ का विश्लेषण करता है, और फिर उस भाषा में इस पाठ का निर्माण करता है जिसमें इसका अनुवाद करने की आवश्यकता होती है।

ग्रन्थसूची

1. विषय पर पाठ: "कंप्यूटर अनुवाद", मालाखोवा एन.पी., युज़्नोगोर्स्क।

2. वासिलिव। A. दुभाषिया के स्थान पर कंप्यूटर // पनडुब्बी। - नंबर 6.

3. PROMT इंटरनेट पाठ अनुवाद प्रणाली। उपयोगकर्ता गाइड। -- सेंट पीटर्सबर्ग: PROMT।

4. Translate.meta.ua

Allbest.ru पर पोस्ट किया गया

...

समान दस्तावेज़

    स्वचालित अनुवाद का इतिहास. आधुनिक कंप्यूटर अनुवाद कार्यक्रम. मशीनी अनुवाद के उपयोग के क्षेत्र. मशीनी अनुवाद में मानव-कंप्यूटर संपर्क के संगठन के रूप। मशीनी अनुवाद का अंतर-संपादन और पश्च-संपादन।

    कोर्स वर्क, 06/19/2015 जोड़ा गया

    विशिष्ट अनुवाद कार्यक्रम. कंप्यूटर शब्दकोशों की संभावनाएँ. बहु-पृष्ठ दस्तावेज़ों के अनुवाद की समस्याएँ। वे सिद्धांत जिन पर कंप्यूटर शब्दकोश बनाए जाते हैं। कंप्यूटर अनुवादकों का उपयोग करके किन पाठों का अनुवाद करना अनुपयुक्त है।

    प्रस्तुतिकरण, 11/13/2010 को जोड़ा गया

    आधुनिक मशीनी अनुवाद प्रौद्योगिकियों का अध्ययन। अनुवाद प्रणालियों के वर्गीकरण का अध्ययन। इलेक्ट्रॉनिक शब्दकोश के साथ काम करने की विशेषताओं की विशेषताएं। गूगल भाषा उपकरण. वर्तनी और व्याकरण, पाठ संपादकों की जाँच के लिए कार्यक्रम।

    सार, 11/02/2014 को जोड़ा गया

    उत्पत्ति का इतिहास, मशीनी अनुवाद का विकास। संचारी तुल्यता के लिए बुनियादी आवश्यकताएँ। मशीनी अनुवाद प्रणाली में औपचारिक संचालन का क्रम, इसकी विकास अवधारणाएँ। कार्यालय के लिए अनुवादक. इलेक्ट्रॉनिक शब्दकोशों के लाभ.

    प्रस्तुति, 10/22/2013 को जोड़ा गया

    कृत्रिम बुद्धिमत्ता प्रणालियों के एक वर्ग के रूप में मशीनी अनुवाद प्रौद्योगिकी का विश्व इतिहास। ऑनलाइन अनुवादक कार्यक्रमों का वर्गीकरण, नियंत्रित इनपुट भाषा फ़ंक्शन के लिए समर्थन। बहुभाषी इंटरनेट ब्राउज़र और इलेक्ट्रॉनिक शब्दकोशों की सूची।

    परीक्षण, 02/03/2011 को जोड़ा गया

    कंप्यूटर प्रशिक्षण प्रणाली. शिक्षा के लिए नई सूचना प्रौद्योगिकी के सिद्धांत। प्रशिक्षण कार्यक्रमों के प्रकार. सीखने को गहन बनाना। कंप्यूटर परीक्षण. कंप्यूटर-सहायता प्राप्त शिक्षण में उन्नत अनुसंधान। इंटरनेट प्रौद्योगिकियाँ, मल्टीमीडिया।

    परीक्षण, 09/10/2008 को जोड़ा गया

    स्वचालित अनुवाद कार्यक्रम: इलेक्ट्रॉनिक शब्दकोश, उपकरण अनुप्रयोग, अनुवाद मेमोरी प्रणाली, संपादन सॉफ्टवेयर। व्यावहारिक गतिविधियों में कैट कार्यक्रमों के उपयोग का विश्लेषण। Wordfast और Promt अनुवादकों का उपयोग करके अनुवाद।

    पाठ्यक्रम कार्य, 11/10/2011 जोड़ा गया

    स्थितीय संख्या प्रणालियों में पूर्णांक. बाइनरी सिस्टम के नुकसान. एल्गोरिदम, डेटा संरचनाओं का विकास। सी प्रोग्रामिंग भाषा में विभिन्न संख्या प्रणालियों में अनुवाद एल्गोरिदम का सॉफ्टवेयर कार्यान्वयन। सॉफ्टवेयर परीक्षण।

    कोर्स वर्क, 01/03/2015 जोड़ा गया

    अनुवाद एक भाषा में स्रोत पाठ के आधार पर दूसरी भाषा में संप्रेषणीय रूप से समकक्ष पाठ, उसकी तुल्यता सुनिश्चित करने की आवश्यकताओं के निर्माण की प्रक्रिया है। मशीनी अनुवाद प्रौद्योगिकियाँ; ट्रांसलेशन मेमोरी सिस्टम की विशेषताएं.

    प्रस्तुति, 01/06/2014 को जोड़ा गया

    एक कंप्यूटर प्रोग्राम, एक कंप्यूटर नियंत्रण उपकरण द्वारा निष्पादित किए जाने वाले निर्देशों के अनुक्रम के रूप में। कंप्यूटर गेम ग्रंथों के लिए अनुवाद मानकों का विश्लेषण। आईटी अनुवाद की विशेषताओं पर विचार, घोर त्रुटियों के उदाहरण।

वर्तमान में, तीन प्रकार की मशीनी अनुवाद प्रणालियाँ हैं:

व्याकरणिक नियमों पर आधारित प्रणालियाँ (नियम-आधारित मशीन अनुवाद, आरबीएमटी);

सांख्यिकीय प्रणालियाँ (सांख्यिकीय मशीन अनुवाद, एसएमटी);

हाइब्रिड सिस्टम;

व्याकरणिक नियमों पर आधारित प्रणालियाँ अनुवाद प्रक्रिया में उपयोग किए जाने वाले पाठ का विश्लेषण करती हैं। अनुवाद किसी दिए गए भाषा युग्म के लिए अंतर्निहित शब्दकोशों के साथ-साथ दोनों भाषाओं के शब्दार्थ, रूपात्मक, वाक्य-विन्यास पैटर्न को कवर करने वाले व्याकरणों के आधार पर किया जाता है। इस सभी डेटा के आधार पर, स्रोत पाठ को क्रमिक रूप से, वाक्य दर वाक्य, आवश्यक भाषा में पाठ में परिवर्तित किया जाता है। ऐसी प्रणालियों के संचालन का मूल सिद्धांत स्रोत और लक्ष्य पाठ की संरचनाओं के बीच संबंध है।

व्याकरणिक नियमों पर आधारित प्रणालियों को अक्सर तीन और उपसमूहों में विभाजित किया जाता है - शब्द-दर-शब्द अनुवाद प्रणाली, स्थानांतरण प्रणाली और अंतरभाषा प्रणाली।

व्याकरणिक नियमों पर आधारित प्रणालियों के लाभ व्याकरणिक और वाक्यात्मक सटीकता, परिणाम की स्थिरता और एक विशिष्ट विषय क्षेत्र के लिए अनुकूलित करने की क्षमता हैं। व्याकरणिक नियमों पर आधारित प्रणालियों के नुकसान में भाषाई डेटाबेस बनाने, बनाए रखने और अद्यतन करने की आवश्यकता, ऐसी प्रणाली बनाने की जटिलता, साथ ही इसकी उच्च लागत शामिल है।

सांख्यिकीय प्रणालियाँ अपने कार्य में सांख्यिकीय विश्लेषण का उपयोग करती हैं। एक द्विभाषी पाठ कोष को सिस्टम में लोड किया जाता है (जिसमें स्रोत भाषा में बड़ी मात्रा में पाठ और आवश्यक भाषा में इसका "मैनुअल" अनुवाद होता है), जिसके बाद सिस्टम अंतरभाषी पत्राचार, वाक्यात्मक संरचनाओं आदि के आंकड़ों का विश्लेषण करता है। स्व-शिक्षा है - अनुवाद विकल्प चुनते समय, यह पहले प्राप्त आँकड़ों के आधार पर निर्भर करता है। किसी भाषा युग्म के भीतर शब्दकोश जितना बड़ा होगा और उसे जितना अधिक सटीकता से संकलित किया जाएगा, सांख्यिकीय मशीनी अनुवाद का परिणाम उतना ही बेहतर होगा। प्रत्येक नए अनुवादित पाठ के साथ, बाद के अनुवादों की गुणवत्ता में सुधार होता है।

सांख्यिकीय प्रणालियाँ शीघ्र स्थापित होती हैं और नए अनुवाद क्षेत्र जोड़ना आसान होता है। कमियों में, सबसे महत्वपूर्ण कई व्याकरण संबंधी त्रुटियों की उपस्थिति और अनुवाद की अस्थिरता है।

हाइब्रिड प्रणालियाँ पहले वर्णित दृष्टिकोणों को जोड़ती हैं। यह उम्मीद की जाती है कि हाइब्रिड मशीन अनुवाद प्रणालियाँ सांख्यिकीय और नियम-आधारित प्रणालियों के सभी लाभों को संयोजित करेंगी।

1.3 मशीनी अनुवाद प्रणालियों का वर्गीकरण

मशीनी अनुवाद प्रणालियाँ ऐसे प्रोग्राम हैं जो पूरी तरह से स्वचालित अनुवाद करते हैं। कार्यक्रम का मुख्य मानदंड अनुवाद की गुणवत्ता है। इसके अलावा, उपयोगकर्ता के लिए महत्वपूर्ण बिंदु इंटरफ़ेस की सुविधा, अन्य दस्तावेज़ प्रसंस्करण उपकरणों के साथ कार्यक्रम के एकीकरण में आसानी, विषयों की पसंद और एक शब्दकोश पुनःपूर्ति उपयोगिता हैं। इंटरनेट के आगमन के साथ, प्रमुख मशीन अनुवाद विक्रेताओं ने अपने उत्पादों में वेब इंटरफेस को शामिल किया, जबकि अन्य सॉफ्टवेयर और ई-मेल के साथ उनका एकीकरण सुनिश्चित किया, जिससे वेब पेजों, इलेक्ट्रॉनिक पत्राचार और ऑनलाइन वार्तालाप सत्रों के अनुवाद के लिए एमटी इंजन के उपयोग की अनुमति मिली। .

कंप्यूसर्व के विदेशी भाषा फोरम के नए सदस्य अक्सर पूछते हैं कि क्या कोई उचित मूल्य पर अच्छे मशीनी अनुवाद कार्यक्रम की सिफारिश कर सकता है।

इस प्रश्न का उत्तर सदैव "नहीं" है। उत्तर देने वाले व्यक्ति के आधार पर, उत्तर में दो मुख्य तर्क हो सकते हैं: या तो यह कि मशीनें अनुवाद नहीं कर सकतीं, या यह कि मशीनी अनुवाद बहुत महंगा है।

ये दोनों तर्क कुछ हद तक सही हैं। हालाँकि, इसका उत्तर इतना सरल नहीं है। मशीनी अनुवाद (एमटी) की समस्या का अध्ययन करते समय इस समस्या के विभिन्न उपविभागों पर अलग से विचार करना आवश्यक है। निम्नलिखित प्रभाग 1990 के अंतर्राष्ट्रीय तकनीकी संचार सम्मेलन में दिए गए लैरी चिल्ड्स के व्याख्यानों पर आधारित है:

पूरी तरह से स्वचालित अनुवाद;

मानव भागीदारी के साथ स्वचालित मशीन अनुवाद;

कंप्यूटर का उपयोग करने वाले व्यक्ति द्वारा किया गया अनुवाद।

पूरी तरह से स्वचालित मशीनी अनुवाद। जब अधिकांश लोग मशीनी अनुवाद के बारे में बात करते हैं तो उनका अभिप्राय इस प्रकार के मशीनी अनुवाद से होता है। यहां अर्थ सरल है: एक भाषा में पाठ को कंप्यूटर में दर्ज किया जाता है, इस पाठ को संसाधित किया जाता है और कंप्यूटर उसी पाठ को दूसरी भाषा में प्रदर्शित करता है। दुर्भाग्य से, इस प्रकार के स्वचालित अनुवाद के कार्यान्वयन में कुछ बाधाएँ आती हैं जिन्हें अभी भी दूर करने की आवश्यकता है।

मुख्य समस्या भाषा की जटिलता ही है। उदाहरण के लिए, "कर सकते हैं" शब्द का अर्थ लें। मोडल सहायक क्रिया के मूल अर्थ के अलावा, "कैन" शब्द के संज्ञा के रूप में कई औपचारिक और कठबोली अर्थ हैं: "कैन", "शौचालय", "जेल"। इसके अलावा, इस शब्द का एक पुरातन अर्थ है - "जानना या समझना।" यह मानते हुए कि आउटपुट भाषा में इनमें से प्रत्येक अर्थ के लिए एक अलग शब्द है, कंप्यूटर उनके बीच अंतर कैसे कर सकता है?

जैसा कि यह पता चला है, अनुवाद कार्यक्रमों के विकास में कुछ प्रगति हुई है जो संदर्भ के आधार पर अर्थ को अलग करते हैं। हाल के अध्ययन पाठों का विश्लेषण करते समय संभाव्यता सिद्धांतों पर अधिक निर्भर करते हैं। हालाँकि, व्यापक विषयवस्तु वाले ग्रंथों का पूर्णतः स्वचालित मशीनी अनुवाद अभी भी एक असंभव कार्य है।

मानव भागीदारी के साथ स्वचालित मशीन अनुवाद। इस प्रकार का मशीनी अनुवाद अब पूरी तरह संभव है। जब हम मानव-सहायता प्राप्त मशीनी अनुवाद के बारे में बात करते हैं, तो हमारा मतलब आमतौर पर कंप्यूटर द्वारा संसाधित होने से पहले और बाद में पाठ को संपादित करना होता है। मानव अनुवादक पाठों को बदलते हैं ताकि वे मशीनों की समझ में आ सकें। कंप्यूटर द्वारा अनुवाद करने के बाद, मनुष्य फिर से रफ मशीनी अनुवाद को संपादित करते हैं, जिससे आउटपुट भाषा में पाठ सही हो जाता है। इस संचालन प्रक्रिया के अलावा, ऐसे एमटी सिस्टम हैं जिनमें अनुवाद के दौरान कंप्यूटर को विशेष रूप से जटिल या अस्पष्ट संरचनाओं का अनुवाद करने में मदद करने के लिए मानव अनुवादक की निरंतर उपस्थिति की आवश्यकता होती है।

मानव-सहायता प्राप्त मशीनी अनुवाद सीमित शब्दावली और संकीर्ण रूप से सीमित विषय-वस्तु वाले पाठों पर अधिक हद तक लागू होता है।

मानव-सहायता प्राप्त मशीनी अनुवाद का उपयोग करने की लागत-प्रभावशीलता अभी भी एक विवादास्पद मुद्दा है। प्रोग्राम स्वयं आमतौर पर काफी महंगे होते हैं, और उनमें से कुछ को चलाने के लिए विशेष उपकरण की आवश्यकता होती है। संपादन से पहले और बाद में सीखने की आवश्यकता होती है, और यह कोई सुखद काम नहीं है। वर्ड डेटाबेस बनाना और बनाए रखना एक श्रम-गहन प्रक्रिया है और इसके लिए अक्सर विशेष कौशल की आवश्यकता होती है। हालाँकि, एक अच्छी तरह से परिभाषित विषय क्षेत्र में बड़ी मात्रा में पाठ का अनुवाद करने वाले संगठन के लिए, मानव-सहायता प्राप्त मशीन अनुवाद पारंपरिक मानव अनुवाद के लिए काफी लागत प्रभावी विकल्प हो सकता है।

कंप्यूटर का उपयोग करने वाले व्यक्ति द्वारा किया गया अनुवाद। इस दृष्टिकोण में, मानव अनुवादक को अनुवाद प्रक्रिया के केंद्र में रखा जाता है, जबकि कंप्यूटर प्रोग्राम को एक उपकरण माना जाता है जो अनुवाद प्रक्रिया को अधिक कुशल और अनुवाद को सटीक बनाता है। ये सामान्य इलेक्ट्रॉनिक शब्दकोश हैं जो आवश्यक शब्द का अनुवाद प्रदान करते हैं, वांछित विकल्प और अनुवादित पाठ के अर्थ को चुनने की जिम्मेदारी व्यक्ति पर डालते हैं। ऐसे शब्दकोश अनुवाद प्रक्रिया को बहुत सुविधाजनक बनाते हैं, लेकिन इसके लिए उपयोगकर्ता को भाषा का एक निश्चित ज्ञान होना और इसके कार्यान्वयन पर समय व्यतीत करना आवश्यक है। और फिर भी अनुवाद प्रक्रिया अपने आप में काफी तेज और आसान है।

अनुवादक को उसके काम में मदद करने वाली प्रणालियों में, सबसे महत्वपूर्ण स्थान तथाकथित ट्रांसलेशन मेमोरी (टीएम) सिस्टम का है। टीएम सिस्टम मूल भाषा में समतुल्य पाठ खंडों के डेटाबेस जोड़े को जमा करने के लिए एक इंटरैक्टिव उपकरण है और उनकी बाद की खोज और संपादन की संभावना के साथ अनुवाद। इन सॉफ़्टवेयर उत्पादों का उद्देश्य अत्यधिक बुद्धिमान सूचना प्रौद्योगिकियों का उपयोग करना नहीं है, बल्कि, इसके विपरीत, अनुवादक की रचनात्मक क्षमता के उपयोग पर आधारित हैं। कार्य की प्रक्रिया में, अनुवादक स्वयं एक डेटाबेस बनाता है (या इसे अन्य अनुवादकों से या ग्राहक से प्राप्त करता है), और इसमें जितनी अधिक इकाइयाँ होंगी, इसके उपयोग पर रिटर्न उतना ही अधिक होगा।

यहां सबसे प्रसिद्ध टीएम सिस्टम की सूची दी गई है:

स्विस कंपनी स्टार से पारगमन,

ट्रेडोस (यूएसए),

आईबीएम से अनुवाद प्रबंधक,

फ्रांसीसी कंपनी LANT से यूरोलैंग ऑप्टिमाइज़र,

एटीआरआईएल (यूएसए) से डेजावु,

वर्डफिशर (हंगरी)।

टीएम प्रणालियाँ समान पाठ अंशों के बार-बार अनुवाद को समाप्त करना संभव बनाती हैं। एक खंड का अनुवाद अनुवादक द्वारा केवल एक बार किया जाता है, और फिर प्रत्येक बाद के खंड को डेटाबेस के साथ मिलान (पूर्ण या अस्पष्ट) के लिए जांचा जाता है, और यदि एक समान या समान खंड पाया जाता है, तो इसे अनुवाद विकल्प के रूप में पेश किया जाता है। .

वर्तमान में, टीएम सिस्टम में सुधार के लिए विकास कार्य चल रहे हैं। उदाहरण के लिए, स्टार के ट्रांजिट सिस्टम का मूल तंत्रिका नेटवर्क प्रौद्योगिकी के आधार पर कार्यान्वित किया जाता है।

टीएम प्रणालियों की विस्तृत श्रृंखला के बावजूद, वे कई सामान्य विशेषताएं साझा करते हैं:

संरेखण समारोह. टीएम सिस्टम के फायदों में से एक किसी दिए गए विषय पर पहले से ही अनुवादित सामग्री का उपयोग करने की क्षमता है। टीएम डेटाबेस मूल और अनुवाद फ़ाइलों की खंड-दर-खंड तुलना द्वारा प्राप्त किया जा सकता है।

आयात और निर्यात फ़िल्टर की उपलब्धता। यह संपत्ति विभिन्न प्रकार के वर्ड प्रोसेसर और प्रकाशन प्रणालियों के साथ टीएम सिस्टम की अनुकूलता सुनिश्चित करती है और अनुवादक को ग्राहक से सापेक्ष स्वतंत्रता देती है।

अस्पष्ट या पूर्ण मिलान खोजने के लिए एक तंत्र। यह वह तंत्र है जो टीएम सिस्टम के मुख्य लाभ का प्रतिनिधित्व करता है। यदि, किसी पाठ का अनुवाद करते समय, सिस्टम को एक ऐसा खंड मिलता है जो पहले अनुवादित खंड के समान या उसके करीब है, तो पहले से ही अनुवादित खंड अनुवादक को वर्तमान खंड का अनुवाद करने के विकल्प के रूप में पेश किया जाता है, जिसे ठीक किया जा सकता है। फ़ज़ी मिलान की डिग्री उपयोगकर्ता द्वारा निर्दिष्ट की जाती है।

विषयगत शब्दकोशों के लिए समर्थन. यह सुविधा अनुवादक को शब्दावली से जुड़े रहने में मदद करती है। एक नियम के रूप में, यदि किसी विषयगत शब्दकोश से कोई शब्द या वाक्यांश अनुवादित खंड में आता है, तो उसे रंग में हाइलाइट किया जाता है और उसके अनुवाद का सुझाव दिया जाता है, जिसे स्वचालित रूप से अनुवादित पाठ में डाला जा सकता है।

पाठ के टुकड़े खोजने के लिए उपकरण. अनुवाद संपादित करते समय यह उपकरण बहुत सुविधाजनक है। यदि कार्य प्रक्रिया के दौरान पाठ के किसी टुकड़े के लिए अधिक सफल अनुवाद विकल्प पाया जाता है, तो यह टुकड़ा सभी टीएम खंडों में पाया जा सकता है, जिसके बाद टीएम खंडों में क्रमिक रूप से आवश्यक परिवर्तन किए जाते हैं।

बेशक, किसी भी सॉफ्टवेयर उत्पाद की तरह, टीएम सिस्टम के भी अपने फायदे और नुकसान हैं, और उनके आवेदन का दायरा भी है। हालाँकि, टीएम सिस्टम के संबंध में, मुख्य नुकसान उनकी उच्च लागत है।

उपयोगकर्ता मैनुअल, संचालन निर्देश, डिज़ाइन और व्यावसायिक दस्तावेज़ीकरण, उत्पाद कैटलॉग और बड़ी संख्या में मिलान वाले अन्य समान दस्तावेज़ जैसे दस्तावेज़ों का अनुवाद करते समय टीएम सिस्टम का उपयोग करना विशेष रूप से सुविधाजनक है।