एक विदेशी भाषा से प्राथमिक दस्तावेजों का अनुवाद। विषय पर पाठ की रूपरेखा: एमडीके पाठ "मशीन अनुवाद प्रणाली और कंप्यूटर शब्दकोश"

विषय: “कंप्यूटर अनुवादक। पाठ पहचान प्रणाली।

पाठ मकसद:

    छात्रों को कंप्यूटर शब्दकोशों और मशीनी अनुवाद प्रणालियों की समझ हासिल करने में मदद करने के लिए, इन कार्यक्रमों की क्षमताओं से परिचित होने के लिए, इन कार्यक्रमों का उपयोग करने का तरीका सिखाने के लिए। छात्रों को ओसीआर - टेक्स्ट रिकग्निशन प्रोग्राम की समझ हासिल करने में मदद करें, प्रोग्राम के डेटा की क्षमताओं से परिचित हों, स्कैन किए गए टेक्स्ट को पहचानना सिखाएं, वर्ड में ट्रांसफर और एडिट करें। छात्रों की सूचना संस्कृति, ध्यान, सटीकता, अनुशासन, दृढ़ता की शिक्षा। संज्ञानात्मक रुचियों का विकास, कंप्यूटर कौशल, आत्म-नियंत्रण, नोट्स लेने की क्षमता।

उपकरण:
बोर्ड, कंप्यूटर, कंप्यूटर प्रस्तुति।

शिक्षण योजना:

1) संगठनात्मक क्षण। (1 मिनट)

2) ज्ञान की प्राप्ति। (5 मिनट)

3) सैद्धांतिक भाग। (10 मिनटों)

4) व्यावहारिक भाग। (15 मिनटों)

5) गृहकार्य (2 मिनट)

6) छात्रों के प्रश्न। (5 मिनट)

7) पाठ का परिणाम। (दो मिनट)

कक्षाओं के दौरान:

I. संगठनात्मक क्षण।

अभिवादन, उपस्थित लोगों की जाँच करना। पाठ की व्याख्या।

द्वितीय. ज्ञान अद्यतन।

जैसा कि आप देख सकते हैं, किसी भी मुद्रित पाठ की इलेक्ट्रॉनिक, संपादित करने के लिए तैयार प्रतिलिपि प्राप्त करने के लिए, OCR प्रोग्राम को कई अलग-अलग कार्यों की "श्रृंखला" करने की आवश्यकता होती है।

सबसे पहले आपको पृष्ठ पर टेक्स्ट की संरचना को पहचानने की आवश्यकता है: कॉलम, टेबल, इमेज आदि का चयन करें। इसके बाद, पृष्ठ की ग्राफिक छवि के चयनित पाठ अंशों को पाठ में परिवर्तित किया जाना चाहिए।

यदि स्रोत दस्तावेज़ में टंकण गुणवत्ता (काफी बड़ा फ़ॉन्ट, कोई खराब मुद्रित वर्ण या सुधार नहीं) है, तो पहचान समस्या को रास्टर टेम्पलेट के साथ तुलना करके हल किया जाता है। सबसे पहले, पेज के बिटमैप को अलग-अलग कैरेक्टर इमेज में विभाजित किया जाता है। फिर उनमें से प्रत्येक को सिस्टम मेमोरी में उपलब्ध प्रतीक टेम्प्लेट पर क्रमिक रूप से आरोपित किया जाता है, और इनपुट छवि से भिन्न कम से कम अंक वाले टेम्प्लेट का चयन किया जाता है।

कम प्रिंट गुणवत्ता (टाइप किए गए पाठ, फैक्स, और इसी तरह) वाले दस्तावेजों को पहचानते समय, चरित्र पहचान की विधि का उपयोग उनमें कुछ संरचनात्मक तत्वों (खंड, अंगूठियां, चाप, आदि) की उपस्थिति से किया जाता है।

किसी भी प्रतीक को पैरामीटर मानों के एक सेट के माध्यम से वर्णित किया जा सकता है जो उसके तत्वों की सापेक्ष स्थिति निर्धारित करता है। उदाहरण के लिए, अक्षर "H" और अक्षर "I" में तीन खंड होते हैं, जिनमें से दो एक दूसरे के समानांतर होते हैं, और तीसरा इन खंडों को जोड़ता है। इन अक्षरों के बीच का अंतर उन कोणों के आकार में है जो तीसरा खंड अन्य दो के साथ बनता है।

संरचनात्मक विधि द्वारा पहचानते समय, विकृत प्रतीकात्मक छवि में विशेषता विवरण प्रतिष्ठित होते हैं और प्रतीकों के संरचनात्मक पैटर्न के साथ तुलना की जाती है। नतीजतन, प्रतीक का चयन किया जाता है जिसके लिए सभी संरचनात्मक तत्वों की समग्रता और उनकी व्यवस्था सबसे अधिक मान्यता प्राप्त प्रतीक से मेल खाती है।

सबसे आम ऑप्टिकल कैरेक्टर रिकग्निशन सिस्टम, जैसे कि ABBYY FineReader और CuneiForm Cognitive से, रेखापुंज और संरचित पहचान विधियों दोनों का उपयोग करते हैं। इसके अलावा, ये सिस्टम "सेल्फ-लर्निंग" हैं (प्रत्येक विशिष्ट दस्तावेज़ के लिए, वे चरित्र टेम्पलेट्स का एक उपयुक्त सेट बनाते हैं) और इसलिए बहु-पृष्ठ दस्तावेज़ की पहचान की गति और गुणवत्ता धीरे-धीरे बढ़ रही है।

आप टेक्स्ट रिकग्निशन सॉफ्टवेयर को अलग से खरीद सकते हैं या अपने द्वारा खरीदे गए स्कैनर के साथ मुफ्त में प्राप्त कर सकते हैं।

शायद सबसे प्रसिद्ध OCR सॉफ्टवेयर ABBYY's FineReader है। यह वह कार्यक्रम है जिसे मान्यता प्रणालियों की बात करते समय सबसे अधिक बार याद किया जाता है।

फाइनरीडर आपको बिना किसी पूर्व प्रशिक्षण के लगभग किसी भी फ़ॉन्ट में टाइप किए गए टेक्स्ट को पहचानने की अनुमति देता है। फाइनरीडर कार्यक्रम की एक विशेषता उच्च पहचान सटीकता और प्रिंट दोषों के प्रति कम संवेदनशीलता है, जिसे "समग्र उद्देश्यपूर्ण अनुकूली पहचान" तकनीक के उपयोग के माध्यम से प्राप्त किया जाता है।

फ़ाइनरीडर में अतिरिक्त सुविधाओं का एक टन है जिसकी औसत उपयोगकर्ता को आवश्यकता नहीं हो सकती है, लेकिन खरीदारों के कुछ समूहों को प्रभावित करेगा। तो, फ़ाइनरीडर के ट्रम्प कार्डों में से एक अविश्वसनीय संख्या में मान्यता प्राप्त भाषाओं के लिए समर्थन है - 176, जिसके बीच आपको विदेशी और प्राचीन भाषाएं, और यहां तक ​​​​कि लोकप्रिय प्रोग्रामिंग भाषाएं भी मिलेंगी।

लेकिन सभी सुविधाओं को कार्यक्रम के सबसे सरल संशोधन में शामिल नहीं किया गया है, जिसे आप स्कैनर के साथ मुफ्त में प्राप्त कर सकते हैं। बैच स्कैनिंग, तालिकाओं और छवियों का सक्षम प्रसंस्करण - इस सब के लिए यह कार्यक्रम का एक पेशेवर संस्करण खरीदने लायक है।

फाइनरीडर के सभी संस्करण, सबसे सरल से सबसे शक्तिशाली तक, एक उपयोगकर्ता के अनुकूल इंटरफेस साझा करते हैं। पहचान प्रक्रिया शुरू करने के लिए, आपको बस दस्तावेज़ को स्कैनर में रखना होगा और प्रोग्राम टूलबार पर एकमात्र बटन (स्कैन और रीड विजार्ड) को दबाना होगा। आगे के सभी ऑपरेशन - स्कैनिंग, छवि को "ब्लॉक" में विभाजित करना और अंत में, कार्यक्रम की वास्तविक पहचान स्वचालित रूप से होगी। उपयोगकर्ता को केवल वांछित स्कैनिंग पैरामीटर सेट करने की आवश्यकता होगी।

मान्यता की गुणवत्ता काफी हद तक इस बात पर निर्भर करती है कि स्कैनिंग के दौरान छवि कितनी अच्छी है। छवि गुणवत्ता को मूल स्कैन पैरामीटर सेट करके नियंत्रित किया जाता है: छवि प्रकार, रिज़ॉल्यूशन और चमक।

पहचान प्रणाली के लिए ग्रे में स्कैनिंग इष्टतम मोड है। ग्रे मोड में स्कैनिंग के मामले में, चमक का स्वचालित चयन किया जाता है। यदि आप चाहते हैं कि दस्तावेज़ में निहित रंग तत्व (चित्र, अक्षर और पृष्ठभूमि रंग) रंग संरक्षण के साथ इलेक्ट्रॉनिक दस्तावेज़ में स्थानांतरित किए जाएं, तो आपको रंग छवि प्रकार का चयन करना होगा। अन्यथा, धूसर छवि प्रकार का उपयोग करें.

साधारण टेक्स्ट के लिए इष्टतम रिज़ॉल्यूशन 300 डीपीआई और 400-600 डीपीआई छोटे प्रिंट (9 या उससे कम अंक) में टेक्स्ट के लिए है।

एक बार पृष्ठ की पहचान पूरी हो जाने के बाद, फ़ाइनरीडर उपयोगकर्ता को एक विकल्प प्रदान करेगा: आगे स्कैन करें और पहचानें (बहु-पृष्ठ दस्तावेज़ के लिए) या परिणामी पाठ को कई लोकप्रिय प्रारूपों में से एक में सहेजें - Microsoft Office दस्तावेज़ों से HTML या PDF में। हालाँकि, आप दस्तावेज़ को तुरंत वर्ड या एक्सेल में स्थानांतरित कर सकते हैं, और पहले से ही सभी मान्यता दोषों को ठीक कर सकते हैं (इसके बिना करना असंभव है)। साथ ही, फ़ाइनरीडर दस्तावेज़ स्वरूपण और उसके ग्राफिक डिज़ाइन की सभी विशेषताओं को पूरी तरह से सुरक्षित रखता है।

    हमें टेक्स्ट रिकग्निशन प्रोग्राम की आवश्यकता क्यों है? टेक्स्ट रिकग्निशन कैसे किया जाता है? आप कौन से पाठ पहचान कार्यक्रम जानते हैं? उन्होंने क्या उपयोग किया? पाठ, छवियों को स्कैन करने के लिए कौन सा संकल्प इष्टतम है?

III. व्यावहारिक भाग।
1. टेक्स्ट ट्रांसलेटर के साथ काम करना (कार्ड द्वारा)
2. अब आइए ABBYY FineReader के साथ काम करने का अभ्यास करें। हम प्रोग्राम के सरलीकृत संस्करण का उपयोग करेंगे जो स्कैनर के साथ आता है।

चतुर्थ। गृहकार्य
जानें कि स्वचालित पाठ अनुवाद कार्यक्रम क्या हैं, इन कार्यक्रमों के साथ काम करने में सक्षम हों। अतिरिक्त कार्य: इंटरनेट से कनेक्ट करें और पाठ का अनुवाद करने के लिए किसी भी ऑनलाइन अनुवादक का उपयोग करें।
जानें कि टेक्स्ट रिकग्निशन प्रोग्राम क्या हैं, इन प्रोग्राम्स के साथ काम करने में सक्षम हों। अतिरिक्त कार्य: घर पर ओसीआर कार्यक्रम स्थापित करें और किसी भी विषय पर निबंध तैयार करें। ओसीआर में टेक्स्ट को पहचानें, वर्ड में एडिट और फॉर्मेट करें।

वी. छात्रों के प्रश्न।
छात्रों के सवालों के जवाब।

VI. पाठ का सारांश।
पाठ को सारांशित करना। ग्रेडिंग।

पाठ में, हम ग्रंथों के लिए कंप्यूटर अनुवाद कार्यक्रमों से परिचित हुए, अनुवादक कार्यक्रम का उपयोग करके शब्दों और पाठ का अनुवाद करना सीखा।

पाठ में, हम ओसीआर कार्यक्रमों से परिचित हुए, ABBYY FineReader 5.0 का उपयोग करके स्कैन की गई छवि को पहचानना सीखा।

20 अप्रैल, 2012 के रूसी संघ के वित्त मंत्रालय के पत्र संख्या 03-03-06/1/202 बताते हैं कि विदेशी व्यापार यात्राओं पर दस्तावेजों का अनुवाद कंपनी के किसी भी कर्मचारी द्वारा किया जा सकता है, और जरूरी नहीं कि एक पेशेवर अनुवादक द्वारा। . क्या ये स्पष्टीकरण किसी विदेशी भाषा के किसी प्राथमिक दस्तावेज़ पर लागू होते हैं? दस्तावेज़ों का अनुवाद करने में सक्षम होने के लिए कंपनी के एक सामान्य कर्मचारी (विदेशी भाषा के अपने ज्ञान को छोड़कर) से क्या आवश्यक है? इसे कैसे फ्रेम किया जाना चाहिए? "पंक्ति-दर-पंक्ति अनुवाद" वाक्यांश का क्या अर्थ है? क्या ऑडिट के दौरान विवादों के मामले में कर निरीक्षकों को अनुवादित दस्तावेज़ों के नोटरीकरण या पेशेवर अनुवादक द्वारा प्रमाणीकरण की आवश्यकता हो सकती है?

ऑडिट एंड कंसल्टिंग ग्रुप के लीड ऑडिटर कोंगोव अर्टुख ने जवाब दिया बैंको, www.bankoaudit.ru

रूसी संघ के वित्त मंत्रालय के पत्र दिनांक 20 अप्रैल 2012 संख्या 03-03-06 / 1/202 ने एक विशिष्ट प्रश्न का उत्तर दिया, हालांकि, इसके स्पष्टीकरण में न केवल विदेशी व्यापार यात्राओं पर दस्तावेज, बल्कि सामान्य प्राथमिक लेखांकन में चिंता है। विदेशी भाषाओं में तैयार किए गए दस्तावेज।

इस तरह के प्राथमिक लेखांकन दस्तावेज हो सकते हैं: एक कार्गो सीमा शुल्क घोषणा (माल के लिए घोषणा), अंतर्राष्ट्रीय परिवहन दस्तावेज - वाहक को माल के हस्तांतरण की पुष्टि करने वाले मार्ग बिल (अंतर्राष्ट्रीय हवाई, सड़क, रेलवे मार्ग बिल, लदान के बिल), वाणिज्यिक चालान, स्वीकृति प्रमाण पत्र - प्रदर्शन किए गए कार्यों (सेवाओं) का हस्तांतरण, एक विदेशी राज्य में लागू व्यापार कारोबार के रीति-रिवाजों के अनुसार तैयार किए गए अन्य दस्तावेज।

रूस के वित्त मंत्रालय ने पहले एक विदेशी भाषा में तैयार किए गए दस्तावेजों के अनुवाद के मुद्दे पर यह दृष्टिकोण व्यक्त किया: रूसी संघ के वित्त मंत्रालय के पत्र दिनांक 03.22.10 नंबर 03-03-06 / 1/168 , दिनांक 03.26. 03.11.09 संख्या 03-03-06/1/72, दिनांक 14.09. 09 नंबर 03-03-05/170, दिनांक 16 फरवरी, 2009 नंबर 03-03-05/23।

पैरा 3 के अनुसार, रूसी संघ में लेखांकन और वित्तीय रिपोर्टिंग पर विनियम के खंड 9, 29 जुलाई, 1998 नंबर 34n के रूसी संघ के वित्त मंत्रालय के आदेश द्वारा अनुमोदित, प्राथमिक लेखा दस्तावेज अन्य भाषाओं में तैयार किए गए हैं। रूसी में लाइन-दर-लाइन अनुवाद होना चाहिए।

विधायी रूप से, रूसी में अनुवादित दस्तावेजों के प्रसंस्करण की प्रक्रिया विनियमित नहीं है।

यदि अनुवाद संगठन के किसी विशेषज्ञ द्वारा किया जाता है, तो एक आदेश (एक अन्य आंतरिक दस्तावेज) को उन व्यक्तियों के सर्कल को स्थापित करना चाहिए जिनके पास प्राथमिक लेखा दस्तावेजों का रूसी में अनुवाद करने का अधिकार है, और उनके नौकरी विवरण में संकेतित अनुवाद जिम्मेदारियों को ठीक करना चाहिए।

इस मामले में, दस्तावेज़ का अनुवाद या तो दस्तावेज़ की एक फोटोकॉपी (पंक्ति दर पंक्ति), या अलग से बनाई गई शीट पर किया जाना चाहिए, जिसमें अनुवाद किए जा रहे दस्तावेज़ की मूल पंक्तियों को उनके अनुवाद के साथ वैकल्पिक किया जाना चाहिए।

दस्तावेज़ के अनुवादित पाठ को अनुवाद करने वाले व्यक्ति के हस्ताक्षर के साथ चिपकाने की सलाह दी जाती है।

"लाइन-बाय-लाइन ट्रांसफर" के लिए, यह ध्यान दिया जाना चाहिए कि लेखांकन और कर लेखांकन के उद्देश्यों के लिए खर्चों को पहचानने के लिए, ऑपरेशन की सामग्री को समझने और मात्रात्मक और मूल्य के संदर्भ में इसके मूल्य का मूल्यांकन करने के लिए आवश्यक विवरण। अनुवाद किया जाना चाहिए। ऐसी सूचना का अनुवाद जो बार-बार हो या जो खर्च किए गए व्यय का समर्थन करने के लिए आवश्यक न हो, की आवश्यकता नहीं है।

उदाहरण के लिए, यदि कोई संगठन विदेशी आर्थिक गतिविधियों को अंजाम देने की प्रक्रिया में मानक दस्तावेजों का उपयोग करता है, तो इस मामले में यह रूसी में मानक रूप के निरंतर विवरण का एक बार अनुवाद करने के लिए पर्याप्त है, और उसके बाद ही दस्तावेज़ के बदलते संकेतकों का अनुवाद करें ( रूसी संघ के वित्त मंत्रालय का पत्र दिनांक 03.11.09 नंबर 03-03-¬ 06/1/725)।

एक विदेशी भाषा में हवाई टिकट और अन्य परिवहन दस्तावेजों के लिए, जानकारी का अनुवाद जो खर्च किए गए खर्चों की पुष्टि के लिए आवश्यक नहीं है (उदाहरण के लिए, किराया लागू करने की शर्तें, हवाई परिवहन नियम, सामान की ढुलाई के नियम, अन्य जानकारी) है आवश्यक नहीं (रूसी संघ के वित्त मंत्रालय का पत्र दिनांक 03.22.10 संख्या 03- 03-06/1/168)।

कुछ मामलों में, किसी विदेशी भाषा में तैयार किए गए दस्तावेजों के अनुवाद की आवश्यकता नहीं होती है।

इस प्रकार, एकीकृत अंतर्राष्ट्रीय रूप वाले दस्तावेजों के लाइन-बाय-लाइन अनुवाद की आवश्यकता नहीं है, विशेष रूप से, यात्री हवाई परिवहन अनुबंधों को प्रमाणित करने के लिए उपयोग किए जाने वाले हवाई टिकट (रूस के वित्त मंत्रालय और 26 अप्रैल को संघीय कर सेवा का संयुक्त पत्र) 2010 नंबर एसएसएस-37-3 / [ईमेल संरक्षित]).

ऑडिट के दौरान विवादों की स्थिति में कर निरीक्षकों को अनुवादित दस्तावेजों के नोटरीकरण की आवश्यकता नहीं होती है।

टैक्स ऑडिट के दौरान दस्तावेजों की मांग कला द्वारा विनियमित होती है। रूसी संघ के टैक्स कोड के 93। अनुच्छेद 93 के खंड 2 के पैराग्राफ 2 के अनुसार: "कागज पर दस्तावेज चेक किए जा रहे व्यक्ति द्वारा प्रमाणित प्रतियों के रूप में प्रस्तुत किए जाते हैं। इसे कर प्राधिकरण (आधिकारिक) को प्रस्तुत दस्तावेजों की प्रतियों के नोटरीकरण की आवश्यकता नहीं है, जब तक कि अन्यथा रूसी संघ के कानून द्वारा प्रदान नहीं किया जाता है।

त्रुटि पाठ के साथ खंड का चयन करें और Ctrl+Enter दबाएं

वर्तमान में, मशीनी अनुवाद प्रणाली तीन प्रकार की होती है:

व्याकरण संबंधी नियमों पर आधारित प्रणालियाँ (नियम-आधारित मशीनी अनुवाद, आरबीएमटी);

सांख्यिकीय प्रणाली (सांख्यिकीय मशीन अनुवाद, श्रीमती);

हाइब्रिड सिस्टम;

व्याकरण-आधारित प्रणालियाँ उस पाठ का विश्लेषण करती हैं जो अनुवाद प्रक्रिया में उपयोग किया जाता है। अनुवाद किसी दिए गए भाषा जोड़े के लिए अंतर्निहित शब्दकोशों के साथ-साथ दोनों भाषाओं के शब्दार्थ, रूपात्मक, वाक्य-विन्यास पैटर्न को कवर करने वाले व्याकरण के आधार पर किया जाता है। इन सभी आंकड़ों के आधार पर, स्रोत पाठ क्रमिक रूप से, वाक्य दर वाक्य, आवश्यक भाषा में पाठ में परिवर्तित किया जाता है। ऐसी प्रणालियों के संचालन का मूल सिद्धांत स्रोत और अंतिम ग्रंथों की संरचनाओं के बीच संबंध है।

व्याकरण संबंधी नियमों पर आधारित प्रणालियों को अक्सर तीन और उपसमूहों में विभाजित किया जाता है - शब्द-दर-शब्द अनुवाद प्रणाली, स्थानांतरण प्रणाली और अंतरभाषा प्रणाली।

व्याकरणिक नियमों पर आधारित प्रणालियों के लाभ व्याकरणिक और वाक्यात्मक सटीकता, परिणाम की स्थिरता और एक विशिष्ट विषय क्षेत्र में समायोजित करने की क्षमता है। व्याकरण के नियमों पर आधारित प्रणालियों के नुकसान में भाषाई डेटाबेस बनाने, बनाए रखने और अद्यतन करने की आवश्यकता, ऐसी प्रणाली बनाने की जटिलता, साथ ही इसकी उच्च लागत शामिल है।

सांख्यिकीय प्रणालियाँ अपने काम में सांख्यिकीय विश्लेषण का उपयोग करती हैं। ग्रंथों का एक द्विभाषी संग्रह प्रणाली में लोड किया जाता है (जिसमें स्रोत भाषा में बड़ी मात्रा में पाठ और आवश्यक भाषा में इसका "मैनुअल" अनुवाद होता है), जिसके बाद सिस्टम इंटरलिंगुअल पत्राचार, वाक्य-विन्यास निर्माण आदि के आंकड़ों का विश्लेषण करता है। प्रणाली स्व-शिक्षण है - अनुवाद विकल्प चुनते समय, यह पिछले आंकड़ों पर निर्भर करता है। किसी भाषा युग्म में शब्दावली जितनी बड़ी होगी और वह जितनी सटीक होगी, सांख्यिकीय मशीनी अनुवाद का परिणाम उतना ही बेहतर होगा। प्रत्येक नए अनुवादित पाठ के साथ, बाद के अनुवादों की गुणवत्ता में सुधार होता है।

सांख्यिकीय प्रणालियां त्वरित रूप से स्थापित होती हैं और नई अनुवाद दिशाएं जोड़ने में आसान होती हैं। कमियों में, सबसे महत्वपूर्ण कई व्याकरण संबंधी त्रुटियों की उपस्थिति और अनुवाद की अस्थिरता है।

हाइब्रिड सिस्टम पहले वर्णित दृष्टिकोणों को जोड़ते हैं। यह उम्मीद की जाती है कि हाइब्रिड मशीन ट्रांसलेशन सिस्टम सांख्यिकीय प्रणालियों और नियम-आधारित प्रणालियों के सभी लाभों को मिला देगा।

1.3 मशीनी अनुवाद प्रणालियों का वर्गीकरण

मशीनी अनुवाद प्रणाली ऐसे प्रोग्राम हैं जो पूरी तरह से स्वचालित अनुवाद करते हैं। कार्यक्रम का मुख्य मानदंड अनुवाद की गुणवत्ता है। इसके अलावा, उपयोगकर्ता के लिए महत्वपूर्ण बिंदु इंटरफ़ेस की सुविधा, अन्य दस्तावेज़ प्रसंस्करण उपकरणों के साथ कार्यक्रम को एकीकृत करने में आसानी, विषयों की पसंद और शब्दकोश पुनःपूर्ति उपयोगिता हैं। इंटरनेट के आगमन के साथ, प्रमुख मशीन अनुवाद विक्रेताओं ने अपने उत्पादों में वेब इंटरफेस को शामिल किया है, जबकि उन्हें अन्य सॉफ्टवेयर और ईमेल के साथ एकीकृत किया है, जिससे एमटी को वेब पेजों, ईमेल और ऑनलाइन बातचीत का अनुवाद करने की अनुमति मिली है।

CompuServe के विदेशी भाषा मंच के नए सदस्य अक्सर पूछते हैं कि क्या कोई उचित मूल्य के लिए एक अच्छे मशीनी अनुवाद कार्यक्रम की सिफारिश कर सकता है।

इस प्रश्न का उत्तर हमेशा "नहीं" है। प्रतिवादी के आधार पर, उत्तर में दो मुख्य तर्क हो सकते हैं: या तो वह मशीनें अनुवाद नहीं कर सकतीं, या यह कि मशीनी अनुवाद बहुत महंगा है।

ये दोनों तर्क कुछ हद तक मान्य हैं। हालाँकि, उत्तर इतना सरल होने से बहुत दूर है। मशीनी अनुवाद (एमटी) की समस्या का अध्ययन करते समय, इस समस्या के विभिन्न उपखंडों पर अलग से विचार करना आवश्यक है। निम्नलिखित विभाजन तकनीकी संचार पर 1990 के अंतर्राष्ट्रीय सम्मेलन में दिए गए लैरी चाइल्ड्स के व्याख्यान पर आधारित है:

पूरी तरह से स्वचालित अनुवाद;

मानव भागीदारी के साथ स्वचालित मशीनी अनुवाद;

कंप्यूटर का उपयोग करने वाले व्यक्ति द्वारा किया गया अनुवाद।

पूरी तरह से स्वचालित मशीनी अनुवाद। मशीनी अनुवाद के बारे में बात करते समय अधिकांश लोगों का मतलब इस तरह के मशीनी अनुवाद से होता है। यहाँ अर्थ सरल है: एक भाषा में पाठ कंप्यूटर में दर्ज किया जाता है, इस पाठ को संसाधित किया जाता है और कंप्यूटर उसी पाठ को दूसरी भाषा में आउटपुट करता है। दुर्भाग्य से, इस प्रकार के स्वचालित अनुवाद के कार्यान्वयन में कुछ बाधाओं का सामना करना पड़ता है जिन्हें दूर किया जाना बाकी है।

मुख्य समस्या भाषा की ही जटिलता है। उदाहरण के लिए, "कर सकते हैं" शब्द का अर्थ लें। मोडल सहायक क्रिया के मुख्य अर्थ के अलावा, "कैन" शब्द के संज्ञा के रूप में कई आधिकारिक और कठबोली अर्थ हैं: "बैंक", "शौचालय", "जेल"। इसके अलावा, इस शब्द का एक पुरातन अर्थ है - "जानना या समझना।" यह मानते हुए कि इन मूल्यों में से प्रत्येक के लिए लक्ष्य भाषा में एक अलग शब्द है, कंप्यूटर उन्हें अलग कैसे बता सकता है?

जैसा कि यह पता चला है, संदर्भ के आधार पर अर्थ में भेदभाव करने वाले अनुवाद कार्यक्रमों को विकसित करने में कुछ प्रगति हुई है। ग्रंथों के विश्लेषण में हाल के अध्ययन संभाव्यता सिद्धांत पर अधिक भरोसा करते हैं। हालाँकि, व्यापक विषय वस्तु के साथ ग्रंथों का पूरी तरह से स्वचालित मशीनी अनुवाद अभी भी एक असंभव कार्य है।

मानव भागीदारी के साथ स्वचालित मशीनी अनुवाद। इस प्रकार का मशीनी अनुवाद अब काफी संभव है। किसी व्यक्ति की भागीदारी के साथ मशीनी अनुवाद के बारे में बोलते हुए, उनका मतलब आमतौर पर कंप्यूटर द्वारा संसाधित किए जाने से पहले और बाद में ग्रंथों को संपादित करना होता है। मानव अनुवादक ग्रंथों को बदलते हैं ताकि उन्हें मशीनों द्वारा समझा जा सके। कंप्यूटर द्वारा अनुवाद करने के बाद, लोग फिर से रफ मशीनी अनुवाद को संपादित करते हैं, जिससे लक्ष्य भाषा में पाठ सही हो जाता है। काम के इस क्रम के अलावा, ऐसे एमटी सिस्टम हैं जिन्हें अनुवाद के दौरान मानव अनुवादक की निरंतर उपस्थिति की आवश्यकता होती है ताकि कंप्यूटर को विशेष रूप से जटिल या अस्पष्ट संरचनाओं का अनुवाद करने में मदद मिल सके।

मानव-सहायता प्राप्त मशीनी अनुवाद, सीमित विषयों की सीमित शब्दावली वाले ग्रंथों पर अधिक हद तक लागू होता है।

मानव-सहायता प्राप्त मशीनी अनुवाद का उपयोग करने का अर्थशास्त्र अभी भी बहस का विषय है। कार्यक्रम स्वयं आमतौर पर काफी महंगे होते हैं, और उनमें से कुछ को काम करने के लिए विशेष उपकरणों की आवश्यकता होती है। संपादन से पहले और बाद में सीखने की जरूरत है, और यह एक सुखद काम नहीं है। शब्दों का डेटाबेस बनाना और बनाए रखना एक श्रमसाध्य प्रक्रिया है और इसके लिए अक्सर विशेष कौशल की आवश्यकता होती है। हालांकि, एक अच्छी तरह से परिभाषित विषय क्षेत्र में बड़ी मात्रा में ग्रंथों का अनुवाद करने वाले संगठन के लिए, मानव-सहायता प्राप्त मशीनी अनुवाद पारंपरिक मानव अनुवाद के लिए काफी लागत प्रभावी विकल्प हो सकता है।

कंप्यूटर का उपयोग करने वाले व्यक्ति द्वारा किया गया अनुवाद। इस दृष्टिकोण के साथ, मानव अनुवादक को अनुवाद प्रक्रिया के केंद्र में रखा जाता है, जबकि कंप्यूटर प्रोग्राम को एक उपकरण के रूप में माना जाता है जो अनुवाद प्रक्रिया को अधिक कुशल और अनुवाद को सटीक बनाता है। ये सामान्य इलेक्ट्रॉनिक शब्दकोश हैं जो आवश्यक शब्द का अनुवाद प्रदान करते हैं, जिससे व्यक्ति सही विकल्प और अनुवादित पाठ के अर्थ को चुनने के लिए जिम्मेदार होता है। इस तरह के शब्दकोश अनुवाद की प्रक्रिया को बहुत सुविधाजनक बनाते हैं, लेकिन इसके लिए उपयोगकर्ता को भाषा का एक निश्चित ज्ञान होना चाहिए और इसके कार्यान्वयन पर समय देना चाहिए। और फिर भी अनुवाद प्रक्रिया अपने आप में बहुत तेज और सुगम है।

उन प्रणालियों में जो अनुवादक को अपने काम में मदद करती हैं, सबसे महत्वपूर्ण स्थान तथाकथित ट्रांसलेशन मेमोरी (टीएम) सिस्टम द्वारा कब्जा कर लिया गया है। टीएम सिस्टम मूल भाषा में समकक्ष टेक्स्ट सेगमेंट के जोड़े को जमा करने और एक में अनुवाद करने के लिए एक इंटरैक्टिव टूल हैं। उनके बाद की खोज और संपादन की संभावना के साथ डेटाबेस। ये सॉफ़्टवेयर उत्पाद अत्यधिक बुद्धिमान सूचना प्रौद्योगिकियों का उपयोग करने के लिए अभिप्रेत नहीं हैं, बल्कि इसके विपरीत, अनुवादक की रचनात्मक क्षमता के उपयोग पर आधारित हैं। काम के दौरान, अनुवादक स्वयं डेटाबेस बनाता है (या इसे अन्य अनुवादकों से या ग्राहक से प्राप्त करता है), और इसमें जितनी अधिक इकाइयाँ होती हैं, इसके उपयोग पर उतना ही अधिक लाभ होता है।

यहाँ सबसे प्रसिद्ध TM सिस्टम की सूची दी गई है:

ट्रांजिट स्विस कंपनी स्टार,

ट्रेडोस (यूएसए),

आईबीएम से अनुवाद प्रबंधक,

फ्रांसीसी कंपनी LANT का यूरोलैंग ऑप्टिमाइज़र,

एटीआरआईएल (यूएसए) से देजावु,

वर्डफिशर (हंगरी)।

टीएम सिस्टम समान पाठ अंशों के बार-बार अनुवाद को बाहर करना संभव बनाता है। एक खंड का अनुवाद अनुवादक द्वारा केवल एक बार किया जाता है, और फिर प्रत्येक बाद के खंड को डेटाबेस के साथ मिलान (पूर्ण या अस्पष्ट) के लिए जांचा जाता है, और यदि एक समान या समान खंड पाया जाता है, तो इसे अनुवाद के रूप में पेश किया जाता है विकल्प।

वर्तमान में, टीएम सिस्टम में सुधार के लिए विकास कार्य चल रहे हैं। उदाहरण के लिए, स्टार के ट्रांजिट सिस्टम का मूल तंत्रिका नेटवर्क प्रौद्योगिकी पर आधारित है।

टीएम सिस्टम की विस्तृत श्रृंखला के बावजूद, वे कुछ सामान्य विशेषताएं साझा करते हैं:

संरेखण समारोह। टीएम सिस्टम के फायदों में से एक इस विषय पर पहले से अनुवादित सामग्री का उपयोग करने की क्षमता है। टीएम डेटाबेस मूल और अनुवाद फ़ाइलों की खंड-दर-खंड तुलना द्वारा प्राप्त किया जा सकता है।

आयात-निर्यात फिल्टर की उपलब्धता। यह गुण विभिन्न प्रकार के वर्ड प्रोसेसर और प्रकाशन प्रणालियों के साथ टीएम सिस्टम की संगतता सुनिश्चित करता है और अनुवादक को ग्राहक से सापेक्ष स्वतंत्रता देता है।

फजी या पूर्ण मैचों की खोज के लिए तंत्र। यह तंत्र है जो टीएम सिस्टम के मुख्य लाभ का प्रतिनिधित्व करता है। यदि, किसी पाठ का अनुवाद करते समय, सिस्टम एक ऐसे खंड का सामना करता है जो पहले से अनुवादित खंड के समान या करीब है, तो पहले से अनुवादित खंड को अनुवादक को वर्तमान खंड के अनुवाद के रूप में पेश किया जाता है, जिसे ठीक किया जा सकता है। फ़ज़ी मिलान की डिग्री उपयोगकर्ता द्वारा निर्धारित की जाती है।

विषयगत शब्दकोशों के लिए समर्थन। यह सुविधा अनुवादक को शब्दकोष से चिपके रहने में मदद करती है। एक नियम के रूप में, यदि किसी अनुवादित खंड में विषयगत शब्दकोश से कोई शब्द या वाक्यांश होता है, तो इसे रंग में हाइलाइट किया जाता है और इसका अनुवाद पेश किया जाता है, जिसे स्वचालित रूप से अनुवादित पाठ में डाला जा सकता है।

पाठ के अंशों की खोज के साधन। अनुवाद संपादित करते समय यह उपकरण बहुत उपयोगी होता है। यदि काम की प्रक्रिया में पाठ के किसी भी अंश के अनुवाद का अधिक सफल संस्करण पाया गया, तो यह टुकड़ा सभी टीएम खंडों में पाया जा सकता है, जिसके बाद टीएम खंडों में क्रमिक रूप से आवश्यक परिवर्तन किए जाते हैं।

बेशक, किसी भी सॉफ्टवेयर उत्पाद की तरह, टीएम सिस्टम के अपने फायदे और नुकसान हैं, और उनका दायरा भी है। हालांकि, टीएम सिस्टम के संबंध में, मुख्य नुकसान उनकी उच्च लागत है।

टीएम सिस्टम का उपयोग करना विशेष रूप से सुविधाजनक है जब उपयोगकर्ता मैनुअल, ऑपरेटिंग निर्देश, डिजाइन और व्यावसायिक दस्तावेज, उत्पाद कैटलॉग और एक ही प्रकार के अन्य दस्तावेजों जैसे बड़ी संख्या में मैचों का अनुवाद करते हैं।

विदेशी भाषाओं में तैयार किए गए दस्तावेज़, ट्रैवल एजेंसी का रूसी में अनुवाद किया जाना चाहिए। अन्यथा, उन पर खर्च कर उद्देश्यों के लिए स्वीकार नहीं किया जाएगा। हालांकि, कभी-कभी अनुवाद की आवश्यकता नहीं होती है। उदाहरण के लिए, यदि हम लैटिन में एन्कोड किए गए इलेक्ट्रॉनिक टिकट के विवरण के बारे में बात कर रहे हैं (रूस की संघीय कर सेवा का पत्र दिनांक 7 जून, 2011 नंबर ईडी-4-3 / 8983)।

दस्तावेजों के अनुवाद की आवश्यकता
25 अक्टूबर, 1991 के रूसी संघ के कानून के अनुच्छेद 16 के अनुच्छेद 1 के अनुसार 18071 "रूसी संघ के लोगों की भाषाओं पर", हमारे देश में संगठनों में आधिकारिक कार्यालय का काम रूसी में किया जाता है .

और जैसा कि रूसी संघ में लेखांकन और वित्तीय रिपोर्टिंग पर विनियमन के अनुच्छेद 9 में निहित है, रूस के वित्त मंत्रालय के आदेश द्वारा अनुमोदित दिनांक 29 जुलाई, 1998 नंबर 34n, संपत्ति, देनदारियों और व्यावसायिक लेनदेन (आर्थिक के तथ्य) का लेखा-जोखा गतिविधि) रूसी संघ की मुद्रा में दर्ज है - रूबल में ।

इसी समय, संपत्ति, देनदारियों और आर्थिक गतिविधि के अन्य तथ्यों का दस्तावेजीकरण, लेखांकन और रिपोर्टिंग रजिस्टरों का रखरखाव रूसी में किया जाता है। इसके अलावा यह कहा गया है: अन्य भाषाओं में तैयार किए गए प्राथमिक लेखा दस्तावेजों का रूसी में लाइन-बाय-लाइन अनुवाद होना चाहिए।

इन मानदंडों के आधार पर, नियामक प्राधिकरण यह निष्कर्ष निकालते हैं कि प्राथमिक दस्तावेज, यदि वे किसी विदेशी भाषा में तैयार किए गए हैं, तो उनका रूसी में अनुवाद किया जाना चाहिए। यह राय, विशेष रूप से, रूस के वित्त मंत्रालय के दिनांक 3 नवंबर, 2009 नंबर 03-03-06 / 725, दिनांक 14 सितंबर, 2009 नंबर 03-03-05 / 170, दिनांक फरवरी के पत्रों में व्यक्त की गई है। 16, 2009 संख्या 03- 03-05/23।

यद्यपि संगठन अदालतों में खर्चों का बचाव करने का प्रबंधन करते हैं, जो बिना अनुवाद के दस्तावेजों द्वारा पुष्टि की जाती है (मास्को जिले की संघीय एंटीमोनोपॉली सेवा के निर्णय दिनांक 21 अप्रैल, 2011 नंबर केए-ए 40 / 2152-11, दिनांक 8 अक्टूबर, 2008 नंबर केए। -ए40 / 8061-08)।

इसके अलावा, मध्यस्थ अक्सर करदाताओं का पक्ष लेते हैं, यह बताते हुए कि रूसी में दस्तावेजों के अनुवाद की कमी वैट में कटौती से इनकार करने के आधार के रूप में काम नहीं कर सकती है। इसका एक उदाहरण 1 अप्रैल, 2009 के मॉस्को जिले की संघीय एंटीमोनोपॉली सेवा का संकल्प है। 16 मार्च, 2009 के नंबर केए-ए 40 / 132809 नंबर केए-ए 40 / 1450-09, की संघीय एंटीमोनोपॉली सेवा। 5 मार्च, 2007 का पश्चिम साइबेरियाई जिला नंबर F04-979 /2007(31967-A45-14)।

हालांकि, अगर ट्रैवल एजेंसी के दस्तावेजों में अनुवाद नहीं है, तो खर्च के लिए कर लेखांकन की संभावना या अदालत में कटौती के अधिकार की रक्षा करना सबसे अधिक आवश्यक होगा। इस मामले में, मुकदमे का परिणाम करदाता के पक्ष में नहीं हो सकता है।

किसी दस्तावेज़ का अनुवाद कैसे करें
वित्तीय विभाग स्पष्ट करता है कि अनुवाद एक पेशेवर अनुवादक और स्वयं संगठन, या इसके कर्मचारी, दोनों द्वारा किया जा सकता है (पत्र दिनांक 14 सितंबर, 2009 संख्या 03-03-05/170, दिनांक 20 मार्च 2006 संख्या 03) -02-07 / 1-66)।

उसी समय, कानून यह स्थापित नहीं करता है कि इस तरह के दस्तावेज़ को कैसे तैयार किया जाना चाहिए। इसलिए, इसे एक अलग दस्तावेज़ के रूप में निष्पादित किया जा सकता है या किसी विदेशी प्राथमिक दस्तावेज़ की एक फोटोकॉपी पर रूसी पाठ में अंकित किया जा सकता है।

यह ध्यान दिया जाना चाहिए कि अनुवाद उस संगठन द्वारा भी किया जा सकता है जिसने प्राथमिक दस्तावेज जारी किया था, उदाहरण के लिए, एक प्रमाण पत्र के रूप में (रूस के वित्त मंत्रालय का पत्र संख्या 03-03-05 / 170)।

आप अनुवाद के बिना कब कर सकते हैं?
कुछ मामलों में, दस्तावेजों का अनुवाद करने की आवश्यकता नहीं होगी।

यह करने की आवश्यकता नहीं है, सबसे पहले, यदि आप नियमित रूप से अपने विदेशी समकक्षों से मानक दस्तावेज़ प्राप्त करते हैं, जिसमें केवल संख्यात्मक संकेतक भिन्न होते हैं (संख्या, दस्तावेज़ की तिथि, मूल्य, आदि), यह प्रपत्र का अनुवाद करने के लिए पर्याप्त है। एक बार रूसी में दस्तावेज़। इस मुद्दे पर स्पष्टीकरण रूस के वित्त मंत्रालय के दिनांक 3 नवंबर 2009 के पत्र संख्या 03-03-06/1/725 में दिया गया है।

दूसरे, उन सूचनाओं का अनुवाद करने की आवश्यकता नहीं है जो किए गए खर्चों की पुष्टि के लिए आवश्यक नहीं हैं।

उदाहरण के लिए, किराया लगाने की शर्तें, हवाई परिवहन के नियम, सामान ले जाने के नियम। मुख्य वित्तीय विभाग के अधिकारियों ने 14 सितंबर 2009 के पत्र क्रमांक 03-03-05 / 170 में इस ओर ध्यान आकर्षित किया।

तीसरा, लैटिन अक्षरों का उपयोग करके भरे गए इलेक्ट्रॉनिक टिकट के औपचारिक (एन्कोडेड) विवरण का अनुवाद करने की कोई आवश्यकता नहीं है (रूस की संघीय कर सेवा के पत्र दिनांक 7 जून, 2011 संख्या ईडी-4-3 / 8983, दिनांक 26 अप्रैल , 2010 नंबर -37- 3/ [ईमेल संरक्षित]).

लेकिन जब इलेक्ट्रॉनिक टिकट में मूल्य वास्तव में एक विदेशी भाषा में इंगित किए जाते हैं और एकीकृत अंतर्राष्ट्रीय कोडिफायर के अनुसार औपचारिक (एन्कोडेड) मूल्यों या कोड के साथ मेल नहीं खाते हैं, तो टिकट के ये संकेतक (मान) हैं रूसी में अनुवाद के अधीन।

अनुवाद लागत के लिए लेखांकन
लेखांकन में, अनुवाद सेवाओं के भुगतान के लिए एक ट्रैवल कंपनी के खर्च को उस महीने के अन्य खर्चों में शामिल किया जाता है जिसमें उन्हें प्रदान किया जाता है। यह खाता 91 "अन्य आय और व्यय" (उप-खाता "अन्य व्यय") की डेबिट प्रविष्टि और खाता 76 "विभिन्न देनदारों और लेनदारों के साथ निपटान" (खंड 11, 16, 18 पीबीयू 10/99) में परिलक्षित होता है। "संगठन के खर्च")।

इस तरह के खर्चों को मुनाफे के कराधान के उद्देश्य से भी स्वीकार किया जाता है - सूचना सेवाओं के लिए भुगतान के रूप में दूसरों के हिस्से के रूप में (रूसी संघ के टैक्स कोड के अनुच्छेद 264 के अनुच्छेद 264) या अन्य अन्य खर्चों के रूप में। इसके बारे में - मास्को के लिए रूस की संघीय कर सेवा के पत्र में दिनांक 26 मई, 2008 संख्या 20-12 / 050126। सच है, यह नियम किसी तृतीय-पक्ष अनुवाद की लागत पर लागू होता है।

याद रखें कि रूसी संघ के टैक्स कोड के अनुच्छेद 252 की आवश्यकताओं का पालन करने के लिए, दस्तावेजों के अनुवाद की लागत का दस्तावेजीकरण किया जाना चाहिए।

"सरलीकरण" के साथ ऐसी लागतों को ध्यान में रखना काम नहीं करेगा। चूंकि उन्हें अनुमत खर्चों की बंद सूची में प्रदान नहीं किया गया है (रूसी संघ के कर संहिता के अनुच्छेद 346.16 के खंड 1)।

याद रखना महत्वपूर्ण

दस्तावेजों के तीसरे पक्ष के अनुवाद की लागत आयकर उद्देश्यों के लिए काटी जा सकती है। लेकिन उन्हें "सरलीकरण" के साथ स्वीकार करना असंभव है।

विदेशी भाषाओं का ज्ञान न केवल रोजमर्रा की जिंदगी में एक उपयोगी कौशल है, बल्कि नौकरी के लिए आवेदन करते समय मुख्य आवश्यकताओं में से एक है। वर्तमान में, एक या कई विदेशी भाषाओं के ज्ञान की आवश्यकता तेजी से प्रासंगिक होती जा रही है।

भाषा का ज्ञान (अंग्रेजी या जर्मन) सचिव के लिए न केवल विदेश में छुट्टी पर यात्रा करते समय, बल्कि विदेश से व्यापार भागीदारों को प्राप्त करते समय, दैनिक जीवन में समाचार पढ़ते समय या फिल्में देखते समय भी आवश्यक है। इसलिए, बड़ी संख्या में नियमित दिनचर्या और रोज़मर्रा के संचालन जिन्हें पहले विदेशी भाषा के ज्ञान की आवश्यकता नहीं थी, आज, अंतर्राष्ट्रीय एकीकरण प्रक्रियाओं के विकास और वैश्वीकरण के लिए व्यापार की व्यापक इच्छा के कारण, यदि आप केवल भरोसा करते हैं तो यह कठिन होता जा रहा है एक भाषा।

आज, हालांकि, केवल विदेशी भाषाओं का ज्ञान ही पर्याप्त नहीं है, क्योंकि प्रतिदिन अनुवाद की जाने वाली जानकारी की मात्रा में काफी वृद्धि हुई है। साथ ही, यह कार्य सफलतापूर्वक हल हो गया है, और किसी के लिए अनुबंध या किसी विदेशी साइट की सामग्री को कुछ ही सेकंड में अनुवाद करना मुश्किल नहीं है। और सभी क्योंकि इस मामले में अनुवाद कार्यक्रम अनुवाद में लगा हुआ है: एक व्यक्ति के पास पलक झपकने का समय नहीं है, और अनुवाद पहले से ही तैयार है।

लक्ष्ययह पाठ छात्रों को कंप्यूटर शब्दकोशों और मशीनी अनुवाद प्रणालियों के बारे में एक विचार प्राप्त करने, इन कार्यक्रमों की क्षमताओं का परिचय देने, इन कार्यक्रमों का उपयोग करने का तरीका सिखाने में मदद करने के लिए है।

डाउनलोड:


पूर्वावलोकन:

पाठ विषय: "ग्रंथों और कंप्यूटर शब्दकोशों के मशीनी अनुवाद की प्रणाली"

पाठ मकसद:

  • छात्रों को कंप्यूटर शब्दकोशों और मशीनी अनुवाद प्रणालियों के बारे में एक विचार प्राप्त करने में मदद करने के लिए, उन्हें इन कार्यक्रमों की क्षमताओं से परिचित कराने के लिए, इन कार्यक्रमों का उपयोग करने का तरीका सिखाने के लिए।
  • संज्ञानात्मक हितों का विकास, आत्म-नियंत्रण, नोट्स लेने की क्षमता।
  • छात्रों की सूचना संस्कृति, ध्यान, सटीकता, अनुशासन, दृढ़ता की शिक्षा।

पाठ प्रकार: सबक सीखना नई सामग्री

उपकरण:

कंप्यूटर, प्रोजेक्टर, स्क्रीन, कंप्यूटर प्रस्तुति।

कक्षाओं के दौरान:

मैं संगठन पल

अभिवादन, उपस्थित लोगों की जाँच करना।

द्वितीय. ज्ञान अद्यतन

वायु की तरह कम से कम एक विदेशी भाषा का ज्ञान आज सभी के लिए आवश्यक है। विशेष रूप से उपयोगकर्ताओं के लिए: आखिरकार, कंप्यूटर पर काम करते समय अंग्रेजी भाषा के साथ टकराव से बचना असंभव है। ठीक है, अगर यह केवल कार्यक्रमों के लिए दस्तावेज़ीकरण से संबंधित है (जो परंपरागत रूप से हमारे देश में कोई नहीं पढ़ता है) या प्रोग्राम मेनू के नाम (जिसे आप वैज्ञानिक प्रहार और क्रैमिंग द्वारा भाषा जानने के बिना नेविगेट करना सीख सकते हैं)।

यदि आप किसी विदेशी भाषा को नहीं जानते हैं तो यह बुरा है... हालांकि, मुझे खेद है - आंशिक रूप से - आप अपने कंप्यूटर पर विशेष अनुवाद कार्यक्रमों में से एक को स्थापित करके या कंप्यूटर शब्दकोशों का उपयोग करके मदद कर सकते हैं।

पाठ का विषय लिखें “पाठ के लिए मशीनी अनुवाद प्रणाली
और कंप्यूटर शब्दकोश।

आज पाठ में आप कंप्यूटर शब्दकोशों और स्वचालित पाठ अनुवाद प्रणालियों के बारे में एक विचार प्राप्त करेंगे और इन कार्यक्रमों की क्षमताओं से परिचित होंगे।

III. नई सामग्री का परिचय

लेखन के आगमन के साथ, लोगों को ज्ञान के भंडारण और संचार के लिए एक शक्तिशाली उपकरण प्राप्त हुआ। मंदिरों और मकबरों की दीवारों पर जो पहला लेख हमारे पास आया है, वह कई सदियों पहले हुए राजाओं और सेनापतियों के कार्यों के बारे में बताता है। इसके अलावा, लोगों ने सफलतापूर्वक व्यापार करने, कर एकत्र करने आदि के लिए आर्थिक गतिविधियों के परिणामों को दर्ज किया।

लोगों के बीच लिखित संचार की सुविधा के लिए, पहले शब्दकोश बनाए गए थे। इन शब्दकोशों में से एक सुमेरियन पुजारियों द्वारा मिट्टी की गोलियों पर लिखा गया था। प्रत्येक टैबलेट को दो बराबर भागों में बांटा गया था। एक ओर, एक सुमेरियन शब्द लिखा गया था, और दूसरी ओर, दूसरी भाषा में समान अर्थ का एक शब्द, कभी-कभी एक संक्षिप्त व्याख्या के साथ। उस समय से लेकर आज तक, शब्दकोशों की संरचना में ज्यादा बदलाव नहीं आया है।

वर्तमान में, सैकड़ों भाषाओं (अंग्रेजी-रूसी, जर्मन-फ्रेंच, और इसी तरह) के बीच अनुवाद के लिए हजारों शब्दकोश हैं, और उनमें से प्रत्येक में हजारों शब्द हो सकते हैं।

कागजी संस्करण में, शब्दकोश सैकड़ों पृष्ठों वाली एक मोटी किताब है, जहां सही शब्द की खोज करना एक श्रमसाध्य प्रक्रिया है।

हमारी दुनिया के वर्तमान वैश्वीकरण से दुनिया के विभिन्न देशों में स्थित लोगों और संगठनों के बीच दस्तावेजों का आदान-प्रदान करने और विभिन्न भाषाएं बोलने की आवश्यकता होती है।

इन शर्तों के तहत, पारंपरिक मैनुअल अनुवाद तकनीक का उपयोग अंतरजातीय संपर्कों के विकास में बाधा डालता है। बहु-पृष्ठ दस्तावेज़ीकरण के मैन्युअल अनुवाद के लिए अनुवादकों के लिए लंबे समय और उच्च वेतन की आवश्यकता होती है। प्राप्त ई-मेल या ब्राउज़र में देखे गए वेब पेज का अनुवाद तुरंत किया जाना चाहिए, और अनुवादक को आमंत्रित करने का कोई अवसर और समय नहीं है।

मशीनी अनुवाद प्रणाली इन समस्याओं का समाधान करती है।

पर्सनल कंप्यूटर के आगमन के साथ, इलेक्ट्रॉनिक शब्दकोशों का निर्माण शुरू हुआ, जिससे सही शब्द खोजना आसान हो गया और कई नए उपयोगी कार्यों की पेशकश की (शब्द को आवाज देना, समानार्थक शब्द की खोज करना, आदि)।

मशीनी अनुवाद तकनीक में धीरे-धीरे सुधार किया गया है। और अगर पहले सिस्टम के अनुवाद की गुणवत्ता और गति वांछित होने के लिए बहुत कुछ छोड़ देती है, तो अब एक कंप्यूटर वास्तव में एक भाषा से दूसरी भाषा में सुसंगत तरीके से पाठ का अनुवाद कर सकता है। और स्वीकार्य गुणवत्ता वाले अधिक आधुनिक सिस्टम 1 सेकंड में टेक्स्ट के 1 पेज का अनुवाद करते हैं।

कंप्यूटर शब्दकोश बहुभाषी हैं।

वे उपयोगकर्ता को भाषाओं और अनुवाद की दिशा (उदाहरण के लिए, अंग्रेजी-रूसी, स्पेनिश-रूसी, आदि) का चयन करने की अनुमति देते हैं।

आमतौर पर इस्तेमाल किए जाने वाले शब्दों के मुख्य शब्दकोश के अलावा, उनमें ज्ञान के क्षेत्रों (प्रौद्योगिकी, चिकित्सा, आदि) में दर्जनों विशिष्ट शब्दकोश शामिल हो सकते हैं।

शब्दकोश प्रविष्टियों के लिए त्वरित खोज प्रदान करें।

आपको वाक्यांशों और ग्रंथों को दर्ज करने की अनुमति देता है।

मल्टीमीडिया हो सकता है, अर्थात्। उपयोगकर्ता को वक्ताओं, देशी वक्ताओं द्वारा किए गए शब्दों को सुनने का अवसर प्रदान करें।

कंप्यूटर अनुवादकों के लिए बुनियादी आवश्यकताएं

क्षमता शब्दावली और विषयगत वर्गों के निरंतर अद्यतन की संभावना में शामिल हैं।

FLEXIBILITY एक विशिष्ट विषय क्षेत्र के लिए डिज़ाइन किया गया।

रफ़्तार - कागज से पाठ जानकारी के ऑटो-इनपुट और प्रसंस्करण की संभावना। ऐसी ही एक प्रणाली (ओसीआर-सिस्टम) हर दिन दस से अधिक अनुभवी टाइपिस्टों की जगह लेती है।

शुद्धता साक्षरता और अनुवादित पाठ के अर्थ का लक्ष्य भाषा में पर्याप्त हस्तांतरण है।

कंप्यूटर ट्रांसलेशन सिस्टम के अपने फायदे और नुकसान हैं।

पेशेवरों

उच्च अनुवाद गति. कंप्यूटर अनुवाद प्रणाली आपको बहु-पृष्ठ दस्तावेज़ों का उच्च गति से अनुवाद करने की अनुमति देती है।

बहुमुखी प्रतिभा।एक पेशेवर अनुवादक, एक नियम के रूप में, एक निश्चित विषय पर ग्रंथों के अनुवाद में विशेषज्ञता रखता है। अनुवाद कार्यक्रम आपको तकनीकी दस्तावेज, व्यावसायिक पत्राचार और अन्य विशिष्ट पाठों का पर्याप्त गुणवत्ता के साथ अनुवाद करने की अनुमति देते हैं।

अनुवाद की कम लागत. पेशेवर अनुवादकों की सेवाओं का उपयोग करते हुए, हम अनुवाद के प्रत्येक पृष्ठ के लिए पैसे देने के लिए बाध्य हैं। हालाँकि, अक्सर पाठ का सही अनुवाद प्राप्त करने की आवश्यकता नहीं होती है, लेकिन आपको भेजे गए पत्र का अर्थ या इंटरनेट पर पृष्ठ की सामग्री को पकड़ने की आवश्यकता होती है। इस मामले में, अनुवाद प्रणाली निस्संदेह एक विश्वसनीय और प्रभावी सहायक बन जाएगी।

गोपनीयता. कई उपयोगकर्ता नियमित रूप से व्यक्तिगत पत्रों का अनुवाद करने के लिए मशीनी अनुवाद प्रणाली का उपयोग करते हैं, क्योंकि हर व्यक्ति बाहरी अनुवादक को व्यक्तिगत पत्राचार देने या वाणिज्यिक या वित्तीय दस्तावेजों का अनुवाद सौंपने के लिए तैयार नहीं होता है।

वेब सामग्री का ऑनलाइन अनुवाद और अनुवाद. आपको वास्तविक समय में वेब पेजों का अनुवाद करने की अनुमति देता है। ऑनलाइन अनुवाद सेवाएं हमेशा उपलब्ध रहती हैं और आपको सही समय पर जानकारी का शीघ्रता से अनुवाद करने में मदद करेंगी। इसके अलावा, आज, अनुवाद प्रणालियों की सहायता से, आप इंटरनेट पृष्ठों की सामग्री और खोज इंजन प्रश्नों का अनुवाद कर सकते हैं।

माइनस

लेकिन इन प्रणालियों पर पूरी तरह से भरोसा नहीं किया जा सकता है। वो हैंशब्दार्थ और शैलीगत त्रुटियाँ करनाऔर लागू नहीं कला के कार्यों का अनुवाद, क्योंकि वे रूपकों, रूपक और मानव कलात्मक रचनात्मकता के अन्य तत्वों का पर्याप्त रूप से अनुवाद करने में सक्षम नहीं हैं।

ऐसा इसलिए होता है क्योंकि वे औपचारिक "ज्ञान" के आधार पर ग्रंथों का अनुवाद करते हैं: भाषा का वाक्यविन्यास (वाक्य बनाने के नियम), शब्द निर्माण के नियम और शब्दकोशों का उपयोग।

विषय अनुकूलन के बिना मशीनी अनुवाद का उपयोग कई इंटरनेट चुटकुलों का विषय है।

वाक्यांश "हमारी बिल्ली ने तीन बिल्ली के बच्चे को जन्म दिया - दो सफेद और एक काला", जिसे PROMT ऑनलाइन अनुवादक ने बदल दिया "हमारी बिल्ली ने तीन बिल्ली के बच्चे को जन्म दिया - दो गोरे और एक अफ्रीकी अमेरिकी।" यदि "काली बिल्ली का बच्चा" लिखकर "अफ्रीकी अमेरिकी" को अभी भी "काला" बनाया जा सकता है, तो "बिल्ली" लिंग नहीं बदल सकती है: उदाहरण के लिए, मादा बिल्ली का अनुवाद "मादा बिल्ली" के रूप में किया गया था।

कार्यक्रम वाक्यांश के संदर्भ को नहीं पहचानता है और सामान्य शब्दों से उचित नामों को अलग नहीं करने के अलावा, शब्दशः शब्दों का अनुवाद करता है। वही PROMT अनुवादक "लियो टॉल्स्टॉय" को "लायन थिक" ("मोटा शेर") में बदल देता है।

Google अनुवादक, इसके विपरीत, अक्सर पूर्व अमेरिकी विदेश मंत्री के उपनाम के लिए "चावल" (चावल) शब्द लेता था।

ऐसी गलतियों से बचने के लिए क्या करें?

  • अनुवाद शुरू करने से पहले, आपको चाहिएटेक्स्ट टाइप को परिभाषित करेंयानी मानव जीवन के किस क्षेत्र से इसका प्रतिनिधित्व होता है (अर्थशास्त्र, खेल, विज्ञान, आदि)। आखिरकार, प्रत्येक क्षेत्र की अपनी बारीकियां और शर्तें होती हैं।
  • गलत अनुवाद अक्सर के कारण होते हैंलेखन अनुवादित पाठ। यह मान्यता प्राप्त ग्रंथों पर भी लागू होता है। त्रुटियों वाले शब्दों को अनुवादकों द्वारा अपरिचित के रूप में चिह्नित किया जाता है, क्योंकि वे इस रूप में शब्दकोशों में नहीं हैं। इससे भी बदतर अगर वहाँ हैविराम चिह्नों में त्रुटियाँ- एक गलत तरीके से लगाया गया अल्पविराम पूरे वाक्य के अनुवाद को विकृत कर सकता है।
  • टेक्स्ट स्निपेट के साथ काम करें. कभी भी पूरे पाठ का एक साथ अनुवाद न करें। इसमें हमेशा ऐसे शब्द होंगे जो शब्दकोश में नहीं हैं और जिनका सिस्टम सही ढंग से अनुवाद नहीं करता है।

इंटरनेट पर ऑनलाइन कंप्यूटर अनुवादक विषयगत शब्दकोश और अनुवाद की दिशा का विकल्प प्रदान करते हैं। वे आपको अनुवाद विंडो में टाइप किए गए या क्लिपबोर्ड, वेब पेजों, हाइपरलिंक्स, साथ ही ईमेल से कॉपी किए गए किसी भी पाठ का अनुवाद करने की अनुमति देते हैं।

सबसे लोकप्रिय गूगल हैं,PROMT, यांडेक्स.अनुवाद।

Translate.ru पहली रूसी वेब सेवा है जिसे टेक्स्ट या वेब पेजों का अन्य भाषाओं में अनुवाद करने के लिए डिज़ाइन किया गया है। एक शब्द का अनुवाद करते समय, यह एक शब्दकोश प्रविष्टि उत्पन्न करता है। PROMT द्वारा 6 मार्च 1998 को खोला गया।

Yandex.Translation एक यांडेक्स वेब सेवा है जिसे किसी टेक्स्ट या वेब पेज के हिस्से को दूसरी भाषा में अनुवाद करने के लिए डिज़ाइन किया गया है। प्रणाली लाखों अनुवादित ग्रंथों के विश्लेषण के आधार पर अपने पत्राचार शब्दकोशों का निर्माण करती है। अनुवाद के लिए पाठ की तुलना पहले कंप्यूटर द्वारा शब्दों के डेटाबेस से की जाती है, फिर भाषा मॉडल के डेटाबेस के साथ, संदर्भ में अभिव्यक्ति के अर्थ को निर्धारित करने की कोशिश की जाती है।

Google अनुवाद एक Google वेब सेवा है जिसे किसी पाठ या वेब पृष्ठ के भाग को किसी अन्य भाषा में स्वचालित रूप से अनुवाद करने के लिए डिज़ाइन किया गया है। कुछ भाषाओं के लिए, उपयोगकर्ताओं को अनुवाद विकल्प प्रदान किए जाते हैं, उदाहरण के लिए, तकनीकी शब्दों के लिए जिन्हें भविष्य में अनुवाद सिस्टम अपडेट में शामिल किया जाना चाहिए। सेवा में संपूर्ण वेब पेज का अनुवाद और यहां तक ​​कि एक साथ किसी अन्य भाषा में अनुवाद के साथ जानकारी की खोज भी शामिल है।

मशीनी अनुवाद प्रणाली का उपयोग करने से ग्रंथों का अनुवाद करने में लगने वाले समय को काफी कम किया जा सकता है। रूसी मशीनी अनुवाद प्रणालियों में सर्वश्रेष्ठ हैंPROMT, ABBYY Lingvo, Multitran, SlovoEd.

इलेक्ट्रॉनिक शब्दकोश ABBYY Lingvo. बहुभाषी संस्करण में 15 भाषाएं शामिल हैं। ABBYY Lingvo में पूर्ण-पाठ अनुवाद फ़ंक्शन नहीं है, लेकिन क्लिपबोर्ड से टेक्स्ट का शब्द-दर-शब्द अनुवाद संभव है।

इलेक्ट्रॉनिक डिक्शनरी Promt. PROMT अंग्रेजी, जर्मन, फ्रेंच, स्पेनिश और अन्य भाषाओं के ग्रंथों का रूसी और इसके विपरीत अनुवाद करने के लिए अनुवाद कार्यक्रम और PROMT शब्दकोश प्रदान करता है। व्यापार और तकनीकी दस्तावेजों, ई-मेल, वेबसाइटों और प्रस्तुतियों के स्वचालित अनुवाद के लिए एक पूर्ण समाधान।

अनुवादक न केवल व्यक्तिगत कंप्यूटरों के लिए, बल्कि मोबाइल फोन, टैबलेट और अन्य उपकरणों के लिए भी उपलब्ध हैं।

उदाहरण के लिए, ग्रंथों के आवश्यक पैराग्राफ का त्वरित और आसानी से अनुवाद करने के लिए, Android - Quick Translator के लिए एक प्रोग्राम बनाया गया था। इसका मुख्य लाभ यह है कि यह टेक्स्ट को क्लिपबोर्ड पर कॉपी करने के बाद उनका अनुवाद करता है। आपको बस अपने एंड्रॉइड टैबलेट या फोन पर त्वरित अनुवाद प्राप्त करने के लिए आवश्यक टेक्स्ट के कुछ हिस्सों को हाइलाइट करना है।

चतुर्थ। अध्ययन सामग्री का समेकन

हम क्लास में मिलेकंप्यूटर शब्दकोश और स्वचालित पाठ अनुवाद प्रणाली और इन कार्यक्रमों की क्षमताएं.

1. कंप्यूटर अनुवादकों के लिए क्या आवश्यकताएं हैं?

2. पारंपरिक पेपर डिक्शनरी की तुलना में कंप्यूटर डिक्शनरी के क्या फायदे हैं?

3. कंप्यूटर अनुवाद प्रणाली का उपयोग कब करना उचित है?

4. कंप्यूटर अनुवादकों का उपयोग करके किन ग्रंथों का अनुवाद नहीं किया जाना चाहिए?

5. सर्वश्रेष्ठ रूसी मशीनी अनुवाद प्रणालियों के नाम क्या हैं?

वी. होमवर्क

व्यावहारिक कार्य के लिए तैयार करें

VI. पाठ का सारांश।

पाठ को सारांशित करना। ग्रेडिंग।

प्रयुक्त साहित्य की सूची

मिखेवा ई.वी. व्यावसायिक गतिविधि में सूचना प्रौद्योगिकी। - एम।: अकादमी, 2006। - 384 पी।

सपकोव वी.वी. सूचना प्रौद्योगिकी और कार्यालय के काम का कम्प्यूटरीकरण। - एम।: अकादमी, 2006। - 288 पी।

मशीनी अनुवाद प्रणाली के प्रकार //logrus.ru