პირველადი დოკუმენტების თარგმნა უცხო ენიდან. გაკვეთილის მონახაზი თემაზე: MDK გაკვეთილი "მანქანური თარგმანის სისტემები და კომპიუტერული ლექსიკონები"

თემა: „კომპიუტერის მთარგმნელები. ტექსტის ამოცნობის სისტემები.

გაკვეთილის მიზნები:

    დაეხმაროს სტუდენტებს კომპიუტერული ლექსიკონებისა და მანქანური თარგმანის სისტემების გააზრებაში, გაეცნონ ამ პროგრამების შესაძლებლობებს, ასწავლონ ამ პროგრამების გამოყენება. დაეხმარეთ მოსწავლეებს გაიგონ OCR - ტექსტის ამოცნობის პროგრამები, გაეცნონ პროგრამის მონაცემების შესაძლებლობებს, ასწავლონ დასკანირებული ტექსტის ამოცნობა, გადატანა და რედაქტირება Word-ში. მოსწავლეთა საინფორმაციო კულტურის განათლება, ყურადღებიანობა, სიზუსტე, დისციპლინა, შეუპოვრობა. შემეცნებითი ინტერესების განვითარება, კომპიუტერული უნარები, თვითკონტროლი, ჩანაწერების გაკეთების უნარი.

აღჭურვილობა:
დაფა, კომპიუტერი, კომპიუტერული პრეზენტაცია.

Გაკვეთილის გეგმა:

1) ორგანიზაციული მომენტი. (1 წუთი)

2) ცოდნის აქტუალიზაცია. (5 წუთი)

3) თეორიული ნაწილი. (10 წუთი)

4) პრაქტიკული ნაწილი. (15 წუთი)

5) საშინაო დავალება (2 წთ)

6)მოსწავლეთა კითხვები. (5 წუთი)

7)გაკვეთილის შედეგი. (2 წუთი)

გაკვეთილების დროს:

I. საორგანიზაციო მომენტი.

მისალმება, დამსწრეების შემოწმება. გაკვეთილის ახსნა.

II. ცოდნის განახლება.

როგორც ხედავთ, ნებისმიერი ნაბეჭდი ტექსტის ელექტრონული, მზა რედაქტირებისთვის ასლის მისაღებად, OCR პროგრამას სჭირდება მრავალი ცალკეული ოპერაციების „ჯაჭვის“ შესრულება.

ჯერ უნდა ამოიცნოთ ტექსტის სტრუქტურა გვერდზე: აირჩიეთ სვეტები, ცხრილები, სურათები და ა.შ. შემდეგი, გვერდის გრაფიკული გამოსახულების შერჩეული ტექსტის ფრაგმენტები უნდა გადაკეთდეს ტექსტად.

თუ საწყის დოკუმენტს აქვს ტიპოგრაფიული ხარისხი (საკმაოდ დიდი შრიფტი, არ არის ცუდად დაბეჭდილი სიმბოლოები ან შესწორებები), მაშინ ამოცნობის პრობლემა მოგვარებულია რასტრულ შაბლონთან შედარებით. პირველი, გვერდის ბიტმაპი იყოფა ინდივიდუალურ სიმბოლოებად. შემდეგ თითოეული მათგანი თანმიმდევრულად თავსდება სისტემის მეხსიერებაში არსებულ სიმბოლოების შაბლონებზე და შეირჩევა თარგი, რომელსაც აქვს ყველაზე ნაკლები რაოდენობა, რომელიც განსხვავდება შეყვანის სურათისგან.

დაბალი ბეჭდვის ხარისხის მქონე დოკუმენტების ამოცნობისას (საბეჭდი ტექსტი, ფაქსი და ა.შ.), სიმბოლოების ამოცნობის მეთოდი გამოიყენება მათში გარკვეული სტრუქტურული ელემენტების (სეგმენტები, რგოლები, რკალი და ა.

ნებისმიერი სიმბოლო შეიძლება აღიწეროს პარამეტრის მნიშვნელობების სიმრავლით, რომელიც განსაზღვრავს მისი ელემენტების შედარებით პოზიციას. მაგალითად, ასო "H" და ასო "I" შედგება სამი სეგმენტისგან, რომელთაგან ორი ერთმანეთის პარალელურია, ხოლო მესამე აკავშირებს ამ სეგმენტებს. ამ ასოებს შორის განსხვავება მდგომარეობს იმ კუთხეების ზომაში, რომელსაც მესამე სეგმენტი ქმნის დანარჩენ ორთან.

სტრუქტურული მეთოდით ამოცნობისას დამახასიათებელი დეტალები გამოიყოფა დამახინჯებულ სიმბოლურ გამოსახულებაში და შედარება სიმბოლოების სტრუქტურულ ნიმუშებთან. შედეგად, შეირჩევა სიმბოლო, რომლისთვისაც ყველა სტრუქტურული ელემენტის მთლიანობა და მათი განლაგება ყველაზე მეტად ემთხვევა აღიარებულ სიმბოლოს.

სიმბოლოების ამოცნობის ყველაზე გავრცელებული ოპტიკური სისტემები, როგორიცაა ABBYY FineReader და CuneiForm Cognitive-დან, იყენებენ როგორც რასტრულ, ასევე სტრუქტურირებულ ამოცნობის მეთოდებს. გარდა ამისა, ეს სისტემები არის „თვითსწავლება“ (თითოეული კონკრეტული დოკუმენტისთვის ისინი ქმნიან სიმბოლოების შაბლონების შესაბამის კომპლექტს) და შესაბამისად, თანდათან იზრდება მრავალგვერდიანი დოკუმენტის ამოცნობის სიჩქარე და ხარისხი.

შეგიძლიათ შეიძინოთ ტექსტის ამომცნობი პროგრამული უზრუნველყოფა ცალკე ან უფასოდ მიიღოთ თქვენ მიერ შეძენილ სკანერთან ერთად.

ალბათ ყველაზე ცნობილი OCR პროგრამული უზრუნველყოფა არის ABBYY-ის FineReader. ეს არის ეს პროგრამა, რომელიც ყველაზე ხშირად ახსოვს, როდესაც საქმე ეხება ამოცნობის სისტემებს.

FineReader საშუალებას გაძლევთ ამოიცნოთ თითქმის ნებისმიერი შრიფტით აკრეფილი ტექსტები, წინასწარი მომზადების გარეშე. FineReader პროგრამის მახასიათებელია ამოცნობის მაღალი სიზუსტე და დაბალი მგრძნობელობა ბეჭდვის დეფექტების მიმართ, რაც მიიღწევა „ჰოლისტური მიზანმიმართული ადაპტური ამოცნობის“ ტექნოლოგიის გამოყენებით.

FineReader-ს აქვს უამრავი დამატებითი ფუნქცია, რომელიც შეიძლება არ სჭირდებოდეს ჩვეულებრივ მომხმარებელს, მაგრამ შთაბეჭდილებას მოახდენს მყიდველების გარკვეულ ჯგუფებზე. ასე რომ, FineReader-ის ერთ-ერთი კოზირი არის ამოცნობის ენების წარმოუდგენელი რაოდენობის მხარდაჭერა - 176, რომელთა შორის ნახავთ ეგზოტიკურ და უძველეს ენებს და პოპულარულ პროგრამირების ენებსაც კი.

მაგრამ ყველა ფუნქცია არ შედის პროგრამის უმარტივეს მოდიფიკაციაში, რომელიც შეგიძლიათ უფასოდ მიიღოთ სკანერთან ერთად. ჯგუფური სკანირება, ცხრილებისა და სურათების კომპეტენტური დამუშავება - ამ ყველაფრისთვის ღირს პროგრამის პროფესიონალური ვერსიის შეძენა.

FineReader-ის ყველა ვერსია, უმარტივესიდან ყველაზე მძლავრამდე, იზიარებს მოსახერხებელი ინტერფეისს. ამოცნობის პროცესის დასაწყებად, თქვენ უბრალოდ უნდა მოათავსოთ დოკუმენტი სკანერში და დააჭიროთ ერთადერთ ღილაკს (Scan & Read wizard) პროგრამის ინსტრუმენტთა პანელზე. ყველა შემდგომი ოპერაცია - სკანირება, გამოსახულების "ბლოკებად" დაყოფა და ბოლოს, პროგრამის ფაქტობრივი ამოცნობა შესრულდება ავტომატურად. მომხმარებელს დასჭირდება მხოლოდ სასურველი სკანირების პარამეტრების დაყენება.

ამოცნობის ხარისხი დიდწილად დამოკიდებულია იმაზე, თუ რამდენად კარგი გამოსახულება მიიღება სკანირების დროს. სურათის ხარისხი კონტროლდება სკანირების ძირითადი პარამეტრების დაყენებით: სურათის ტიპი, გარჩევადობა და სიკაშკაშე.

ნაცრისფერი სკანირება არის ამოცნობის სისტემის ოპტიმალური რეჟიმი. ნაცრისფერ რეჟიმში სკანირების შემთხვევაში ხდება სიკაშკაშის ავტომატური შერჩევა. თუ გსურთ დოკუმენტში შემავალი ფერის ელემენტები (სურათები, ასოები და ფონის ფერები) გადაიტანოთ ელექტრონულ დოკუმენტში ფერის შენარჩუნებით, უნდა აირჩიოთ ფერადი გამოსახულების ტიპი. წინააღმდეგ შემთხვევაში, გამოიყენეთ ნაცრისფერი გამოსახულების ტიპი.

ჩვეულებრივი ტექსტებისთვის ოპტიმალური გარჩევადობაა 300 dpi და 400-600 dpi მცირე ზომის ტექსტებისთვის (9 ან ნაკლები ქულა).

გვერდის ამოცნობის დასრულების შემდეგ, FineReader მომხმარებელს შესთავაზებს არჩევანს: შემდგომი სკანირება და ამოცნობა (მრავალგვერდიანი დოკუმენტისთვის) ან მიღებული ტექსტის შენახვა მრავალ პოპულარულ ფორმატში - Microsoft Office დოკუმენტებიდან HTML ან PDF-მდე. თუმცა, თქვენ შეგიძლიათ დაუყოვნებლივ გადაიტანოთ დოკუმენტი Word-ში ან Excel-ში და უკვე გამოასწოროთ ყველა ამოცნობის ხარვეზი (ამის გარეშე უბრალოდ შეუძლებელია). ამავდროულად, FineReader სრულად ინახავს დოკუმენტის ფორმატირების ყველა მახასიათებელს და მის გრაფიკულ დიზაინს.

    რატომ გვჭირდება ტექსტის ამოცნობის პროგრამები? როგორ ხდება ტექსტის ამოცნობა? ტექსტის ამოცნობის რა პროგრამები იცით? რას იყენებდნენ? რა გარჩევადობაა ოპტიმალური ტექსტის, სურათების სკანირებისთვის?

III. პრაქტიკული ნაწილი.
1. ტექსტის მთარგმნელთან მუშაობა (ბარათებით)
2. ახლა მოდით ვივარჯიშოთ ABBYY FineReader-თან მუშაობაში. ჩვენ გამოვიყენებთ პროგრამის გამარტივებულ ვერსიას, რომელიც მოყვება სკანერს.

IV. Საშინაო დავალება
იცოდეთ რა არის ტექსტის ავტომატური თარგმნის პროგრამები, შეძლოთ ამ პროგრამებთან მუშაობა. დამატებითი დავალება: დაუკავშირდით ინტერნეტს და გამოიყენეთ ნებისმიერი ონლაინ მთარგმნელი ტექსტის თარგმნისთვის.
იცოდეთ რა არის ტექსტის ამოცნობის პროგრამები, შეძლოთ ამ პროგრამებთან მუშაობა. დამატებითი დავალება: დააინსტალირეთ OCR პროგრამა სახლში და მოამზადეთ ესე ნებისმიერ თემაზე. ტექსტის ამოცნობა OCR-ში, რედაქტირება და ფორმატირება Word-ში.

V. მოსწავლეთა კითხვები.
პასუხები სტუდენტების კითხვებზე.

VI. გაკვეთილის შეჯამება.
გაკვეთილის შეჯამება. შეფასება.

გაკვეთილზე გავეცანით ტექსტების თარგმნის კომპიუტერულ პროგრამებს, ვისწავლეთ სიტყვების და ტექსტის თარგმნა მთარგმნელის პროგრამით.

გაკვეთილზე გავეცანით OCR პროგრამებს, ვისწავლეთ როგორ ამოვიცნოთ დასკანირებული სურათი ABBYY FineReader 5.0-ის გამოყენებით.

რუსეთის ფედერაციის ფინანსთა სამინისტროს 2012 წლის 20 აპრილის წერილში No03-03-06/1/202 განმარტავს, რომ უცხოური მივლინების შესახებ დოკუმენტების თარგმნა შესაძლებელია კომპანიის ნებისმიერ თანამშრომელს და არა აუცილებლად პროფესიონალ მთარგმნელს. . ვრცელდება თუ არა ეს განმარტებები უცხო ენაზე არსებულ ნებისმიერ პირველად დოკუმენტზე? რა მოეთხოვება კომპანიის რიგით თანამშრომელს (გარდა უცხო ენის ცოდნისა), რომ შეძლოს დოკუმენტების თარგმნა? როგორ უნდა იყოს ფორმატირებული? რას ნიშნავს ფრაზა "სტრიქონი-სტრიქონი თარგმანი"? შეიძლება თუ არა საგადასახადო ინსპექტორებმა მოითხოვონ თარგმნილი დოკუმენტების ნოტარიულად დამოწმება ან დამოწმება პროფესიონალი თარჯიმნის მიერ აუდიტის დროს დავის შემთხვევაში?

პასუხობს აუდიტისა და საკონსულტაციო ჯგუფის მთავარი აუდიტორი ლიუბოვ არტიუხი BANKO, www.bankoaudit.ru

რუსეთის ფედერაციის ფინანსთა სამინისტროს 2012 წლის 20 აპრილის წერილმა No. 03-03-06 / 1/202 უპასუხა კონკრეტულ კითხვას, თუმცა, მისი განმარტებები ეხება არა მხოლოდ უცხოურ მივლინების დოკუმენტებს, არამედ ზოგადად პირველადი აღრიცხვის შესახებ. უცხო ენებზე შედგენილი დოკუმენტები.

ასეთი პირველადი სააღრიცხვო დოკუმენტები შეიძლება იყოს: ტვირთის საბაჟო დეკლარაცია (დეკლარაცია საქონელზე), საერთაშორისო სატრანსპორტო დოკუმენტები - საქონლის გადამზიდველზე გადაცემის დამადასტურებელი ზედნადები (საერთაშორისო საჰაერო, საავტომობილო, სარკინიგზო ზედნადები, ზედნადები), კომერციული ანგარიშ-ფაქტურები, მიღების მოწმობები - დასრულებული სამუშაოების (მომსახურების) გადაცემა, უცხო სახელმწიფოში მოქმედი ბიზნესბრუნვის ჩვეულების შესაბამისად შედგენილი სხვა დოკუმენტები.

რუსეთის ფინანსთა სამინისტრომ გამოთქვა ეს მოსაზრება ადრე უცხო ენაზე შედგენილი დოკუმენტების თარგმნის საკითხზე: რუსეთის ფედერაციის ფინანსთა სამინისტროს წერილები 03.22.10 No 03-03-06 / 1/168. , 26.03.03.11.09 No03-03-06/1/72 14.09. 09 No03-03-05/170, 2009 წლის 16 თებერვლის No03-03-05/23.

რუსეთის ფედერაციაში ბუღალტრული აღრიცხვისა და ფინანსური ანგარიშგების შესახებ დებულების მე-3 პუნქტის მე-9 პუნქტის მიხედვით, დამტკიცებული რუსეთის ფედერაციის ფინანსთა სამინისტროს 1998 წლის 29 ივლისის №34ნ ბრძანებით, სხვა ენებზე შედგენილი პირველადი სააღრიცხვო დოკუმენტები . უნდა ჰქონდეს სტრიქონ-სტრიქონი თარგმანი რუსულ ენაზე.

კანონმდებლობით, რუსულ ენაზე თარგმნილი დოკუმენტების დამუშავების პროცედურა არ არის რეგულირებული.

თუ თარგმნას ახორციელებს ორგანიზაციის სპეციალისტი, მაშინ ბრძანებით (სხვა შიდა დოკუმენტი) უნდა ჩამოყალიბდეს იმ პირთა წრე, რომლებსაც აქვთ უფლება თარგმნონ პირველადი სააღრიცხვო დოკუმენტები რუსულად და დააფიქსირონ მითითებული თარგმანის მოვალეობები მათ სამუშაო აღწერილობაში.

ამ შემთხვევაში დოკუმენტის თარგმნა უნდა მოხდეს ან დოკუმენტის ქსეროასლზე (სტრიქონი სტრიქონი), ან ცალკე შექმნილ ფურცელზე, რომელშიც თარგმნილი დოკუმენტის ორიგინალური სტრიქონები უნდა მონაცვლეობდეს მათ თარგმანთან.

მიზანშეწონილია დოკუმენტის ნათარგმნი ტექსტის დამაგრება იმ პირის ხელმოწერით, ვინც თარგმნა.

რაც შეეხება „სტრიქონის გადაცემას“, უნდა აღინიშნოს, რომ ბუღალტრული და საგადასახადო აღრიცხვის მიზნებისთვის დანახარჯების აღიარებისთვის საჭიროა ოპერაციის შინაარსის გასაგებად და მისი ღირებულების რაოდენობრივი და ღირებულებითი თვალსაზრისით შეფასების დეტალები. უნდა ითარგმნოს. არ არის საჭირო ინფორმაციის თარგმნა, რომელიც მეორდება ან არ არის აუცილებელი გაწეული ხარჯების გასამყარებლად.

მაგალითად, თუ ორგანიზაცია უცხოური ეკონომიკური საქმიანობის განხორციელების პროცესში იყენებს სტანდარტულ დოკუმენტებს, მაშინ ამ შემთხვევაში საკმარისია რუსულად თარგმნოს სტანდარტული ფორმის მუდმივი დეტალები ერთხელ, შემდეგ კი მხოლოდ დოკუმენტის ცვალებადი ინდიკატორების თარგმნა ( რუსეთის ფედერაციის ფინანსთა სამინისტროს წერილი 03.11.09 No03-03-¬ 06/1/725).

ავიაბილეთების და სხვა სატრანსპორტო დოკუმენტებისთვის უცხო ენაზე, ინფორმაციის თარგმნა, რომელიც არ არის აუცილებელი გაწეული ხარჯების დასადასტურებლად (მაგალითად, მგზავრობის საფასურის გამოყენების პირობები, საჰაერო ტრანსპორტის წესები, ბარგის გადაზიდვის წესები, სხვა ინფორმაცია). არ არის საჭირო (წერილი რუსეთის ფედერაციის ფინანსთა სამინისტროს 03.22.10 No. 03- 03-06/1/168).

ზოგიერთ შემთხვევაში უცხო ენაზე შედგენილი დოკუმენტების თარგმნა საჭირო არ არის.

ამრიგად, ერთიანი საერთაშორისო ფორმის მქონე დოკუმენტების სტრიქონში თარგმნა არ არის საჭირო, კერძოდ, ავიაბილეთები, რომლებიც გამოიყენება სამგზავრო საჰაერო ტრანსპორტის კონტრაქტების დასადასტურებლად (რუსეთის ფინანსთა სამინისტროსა და ფედერალური საგადასახადო სამსახურის ერთობლივი წერილი, 26 აპრილი, 2010 No ShS-37-3 / [ელფოსტა დაცულია]).

საგადასახადო ინსპექტორებს აუდიტის დროს დავის შემთხვევაში არ აქვთ უფლება მოითხოვონ თარგმნილი დოკუმენტების ნოტარიულად დამოწმება.

საგადასახადო შემოწმების დროს დოკუმენტებზე მოთხოვნა რეგულირდება მუხ. რუსეთის ფედერაციის საგადასახადო კოდექსის 93. 93-ე მუხლის მე-2 პუნქტის მე-2 პუნქტის თანახმად: „ქაღალდზე დოკუმენტები წარედგინება შემოწმებული პირის მიერ დამოწმებული ასლების სახით. დაუშვებელია საგადასახადო ორგანოში (თანამდებობის პირისთვის) წარდგენილი დოკუმენტების ასლების ნოტარიულად დამოწმების მოთხოვნა, თუ რუსეთის ფედერაციის კანონმდებლობით სხვა რამ არ არის გათვალისწინებული.

აირჩიეთ ფრაგმენტი შეცდომის ტექსტით და დააჭირეთ Ctrl+Enter

ამჟამად, არსებობს სამი ტიპის მანქანური თარგმანის სისტემა:

გრამატიკულ წესებზე დაფუძნებული სისტემები (Rule-Based Machine Translation, RBMT);

სტატისტიკური სისტემები (Statistical Machine Translation, SMT);

ჰიბრიდული სისტემები;

გრამატიკაზე დაფუძნებული სისტემები აანალიზებენ ტექსტს, რომელიც გამოიყენება თარგმანის პროცესში. თარგმანი კეთდება მოცემული ენობრივი წყვილის ჩაშენებული ლექსიკონების, ასევე ორივე ენის სემანტიკური, მორფოლოგიური, სინტაქსური ნიმუშების გრამატიკის საფუძველზე. ყველა ამ მონაცემზე დაყრდნობით, საწყის ტექსტი თანმიმდევრულად, წინადადება-წინადადება, გარდაიქმნება ტექსტად საჭირო ენაზე. ასეთი სისტემების მუშაობის ძირითადი პრინციპი არის კავშირი წყაროსა და საბოლოო ტექსტების სტრუქტურებს შორის.

გრამატიკულ წესებზე დაფუძნებული სისტემები ხშირად იყოფა კიდევ სამ ქვეჯგუფად - სიტყვასიტყვით თარგმანის სისტემები, გადაცემის სისტემები და ინტერლინგვისტური სისტემები.

გრამატიკულ წესებზე დაფუძნებული სისტემების უპირატესობებია გრამატიკული და სინტაქსური სიზუსტე, შედეგის სტაბილურობა და კონკრეტული საგნის მიმართულების მორგების შესაძლებლობა. გრამატიკულ წესებზე დაფუძნებული სისტემების ნაკლოვანებებს მიეკუთვნება ლინგვისტური მონაცემთა ბაზების შექმნის, შენარჩუნებისა და განახლების აუცილებლობა, ასეთი სისტემის შექმნის სირთულე და ასევე მაღალი ღირებულება.

სტატისტიკური სისტემები თავიანთ მუშაობაში იყენებენ სტატისტიკურ ანალიზს. სისტემაში იტვირთება ტექსტების ორენოვანი კორპუსი (შეიცავს დიდი რაოდენობით ტექსტს საწყის ენაზე და მის „სახელმძღვანელო“ თარგმნას საჭირო ენაზე), რის შემდეგაც სისტემა აანალიზებს ინტერლინგვური შესაბამისობების სტატისტიკას, სინტაქსურ კონსტრუქციებს და ა.შ. სისტემა არის თვითსწავლება - თარგმანის ვარიანტის არჩევისას ის ეყრდნობა წინა სტატისტიკას. რაც უფრო დიდია ლექსიკა ენათა წყვილში და რაც უფრო ზუსტია ის, მით უკეთესი იქნება სტატისტიკური მანქანური თარგმანის შედეგი. ყოველი ახალი ნათარგმნი ტექსტით უმჯობესდება შემდგომი თარგმანების ხარისხი.

სტატისტიკური სისტემები სწრაფად ყალიბდება და მარტივია ახალი თარგმანის მიმართულებების დამატება. ნაკლოვანებებს შორის ყველაზე მნიშვნელოვანია მრავალი გრამატიკული შეცდომის არსებობა და თარგმანის არასტაბილურობა.

ჰიბრიდული სისტემები აერთიანებს ადრე აღწერილ მიდგომებს. მოსალოდნელია, რომ ჰიბრიდული მანქანური თარგმნის სისტემები გააერთიანებს ყველა იმ უპირატესობას, რაც აქვთ სტატისტიკურ და წესებზე დაფუძნებულ სისტემებს.

1.3 მანქანათმთარგმნელობითი სისტემების კლასიფიკაცია

მანქანური თარგმანის სისტემები არის პროგრამები, რომლებიც ასრულებენ სრულად ავტომატიზირებულ თარგმანს. პროგრამის მთავარი კრიტერიუმია თარგმანის ხარისხი. გარდა ამისა, მომხმარებლისთვის მნიშვნელოვანი პუნქტებია ინტერფეისის მოხერხებულობა, პროგრამის სხვა დოკუმენტების დამუშავების ინსტრუმენტებთან ინტეგრაციის სიმარტივე, თემების არჩევანი და ლექსიკონის შევსების პროგრამა. ინტერნეტის მოსვლასთან ერთად, მანქანური თარგმანის მთავარმა მომწოდებლებმა შეიტანეს ვებ-ინტერფეისები თავიანთ პროდუქტებში, ასევე ინტეგრირებულნი არიან სხვა პროგრამულ უზრუნველყოფასთან და ელფოსტასთან, რაც საშუალებას აძლევს MT გამოიყენოს ვებ გვერდების, ელექტრონული ფოსტისა და ონლაინ საუბრების თარგმნისთვის.

CompuServe-ის უცხოენოვანი ფორუმის ახალი წევრები ხშირად კითხულობენ, შეუძლია თუ არა ვინმეს რეკომენდაცია გაუწიოს კარგი მანქანური თარგმანის პროგრამას გონივრულ ფასად.

ამ კითხვაზე პასუხი უცვლელად არის "არა". რესპონდენტიდან გამომდინარე, პასუხი შეიძლება შეიცავდეს ორ მთავარ არგუმენტს: ან რომ მანქანებს არ შეუძლიათ თარგმნა, ან რომ მანქანური თარგმანი ძალიან ძვირია.

ორივე ეს არგუმენტი გარკვეულწილად მართებულია. თუმცა, პასუხი არც ისე მარტივია. მანქანური თარგმანის (MT) პრობლემის შესწავლისას აუცილებელია ცალ-ცალკე განვიხილოთ ამ პრობლემის სხვადასხვა ქვესექცია. შემდეგი განყოფილება ეფუძნება 1990 წელს ტექნიკური კომუნიკაციის საერთაშორისო კონფერენციაზე ლარი ჩაილდსის ლექციებს:

სრულად ავტომატური თარგმანი;

ავტომატური ავტომატური თარგმანი ადამიანის მონაწილეობით;

თარგმანი შესრულებულია კომპიუტერის გამოყენებით პირის მიერ.

სრულად ავტომატიზირებული ავტომატური თარგმანი. ამ სახის მანქანური თარგმანი არის ის, რასაც ადამიანების უმეტესობა გულისხმობს, როდესაც ისინი საუბრობენ მანქანურ თარგმანზე. მნიშვნელობა აქ მარტივია: ტექსტი ერთ ენაზე შედის კომპიუტერში, ეს ტექსტი მუშავდება და კომპიუტერი გამოსცემს იმავე ტექსტს სხვა ენაზე. სამწუხაროდ, ამ ტიპის ავტომატური თარგმანის განხორციელებას აწყდება გარკვეული დაბრკოლებები, რომლებიც ჯერ კიდევ არ არის გადალახული.

მთავარი პრობლემა თავად ენის სირთულეა. ავიღოთ, მაგალითად, სიტყვა „შეიძლება“. გარდა მოდალური დამხმარე ზმნის ძირითადი მნიშვნელობისა, სიტყვა „შეიძლება“ არსებითი სახელის სახით რამდენიმე ოფიციალური და ჟარგონის მნიშვნელობა აქვს: „ბანკი“, „საპირფარეშო“, „ციხე“. გარდა ამისა, არსებობს ამ სიტყვის არქაული მნიშვნელობა - „იცოდე ან გაგება“. თუ დავუშვებთ, რომ სამიზნე ენას აქვს ცალკე სიტყვა თითოეული ამ მნიშვნელობისთვის, როგორ შეიძლება კომპიუტერი განასხვავოს ისინი?

როგორც ირკვევა, გარკვეული პროგრესი იქნა მიღწეული მთარგმნელობითი პროგრამების შემუშავებაში, რომლებიც განასხვავებენ მნიშვნელობას კონტექსტიდან გამომდინარე. უახლესი კვლევები ტექსტების ანალიზში უფრო მეტად ეყრდნობა ალბათობის თეორიას. თუმცა, ვრცელი თემის მქონე ტექსტების სრულად ავტომატიზირებული ავტომატური თარგმნა ჯერ კიდევ შეუძლებელი ამოცანაა.

ავტომატური ავტომატური თარგმანი ადამიანის მონაწილეობით. ამ სახის მანქანური თარგმანი ახლა საკმაოდ შესაძლებელია. პიროვნების მონაწილეობით მანქანურ თარგმანზე საუბრისას, როგორც წესი, იგულისხმება ტექსტების რედაქტირება როგორც კომპიუტერის მიერ დამუშავებამდე, ასევე მის შემდეგ. ადამიანები თარჯიმნები ცვლიან ტექსტებს ისე, რომ მათი გაგება მანქანებისთვის იყოს შესაძლებელი. მას შემდეგ რაც კომპიუტერი შეასრულებს თარგმანს, ადამიანები კვლავ არედაქტირებენ უხეშ მანქანურ თარგმანს, რაც ტექსტს სამიზნე ენაზე სწორს ხდის. სამუშაოს ამ თანმიმდევრობის გარდა, არსებობს MT სისტემები, რომლებიც საჭიროებენ ადამიანის მთარგმნელის მუდმივ ყოფნას თარგმანის დროს, რათა დაეხმაროს კომპიუტერს თარგმნოს განსაკუთრებით რთული ან ორაზროვანი სტრუქტურები.

ადამიანის დახმარებით მანქანური თარგმანი უფრო მეტად გამოიყენება ტექსტებზე, ვიწრო შეზღუდული თემების შეზღუდული ლექსიკის მქონე ტექსტებზე.

ადამიანის დახმარებით მანქანური თარგმანის გამოყენების ეკონომიკა ჯერ კიდევ სადავოა. თავად პროგრამები, როგორც წესი, საკმაოდ ძვირია და ზოგიერთ მათგანს მუშაობისთვის სპეციალური აღჭურვილობა სჭირდება. წინასწარ და შემდგომ რედაქტირებას უნდა ისწავლო და ეს არ არის სასიამოვნო სამუშაო. სიტყვების მონაცემთა ბაზის შექმნა და შენარჩუნება შრომატევადი პროცესია და ხშირად განსაკუთრებულ უნარებს მოითხოვს. თუმცა, ორგანიზაციისთვის, რომელიც თარგმნის დიდი მოცულობის ტექსტებს კარგად განსაზღვრულ საგანში, ადამიანის დახმარებით მანქანური თარგმანი შეიძლება იყოს საკმაოდ ეკონომიური ალტერნატივა ტრადიციული ადამიანური თარგმანისთვის.

თარგმანი შესრულებულია კომპიუტერის გამოყენებით პირის მიერ. ამ მიდგომით, ადამიანი თარჯიმანი მოთავსებულია თარგმანის პროცესის ცენტრში, ხოლო კომპიუტერული პროგრამა განიხილება, როგორც ინსტრუმენტი, რომელიც თარგმნის პროცესს უფრო ეფექტურს და თარგმანს ზუსტს ხდის. ეს არის ჩვეულებრივი ელექტრონული ლექსიკონები, რომლებიც უზრუნველყოფენ საჭირო სიტყვის თარგმანს, რაც პასუხისმგებელია სწორი ვარიანტისა და ნათარგმნი ტექსტის მნიშვნელობის არჩევაზე. ასეთი ლექსიკონები მნიშვნელოვნად უწყობს ხელს თარგმნის პროცესს, მაგრამ მომხმარებლისგან მოითხოვს ენის გარკვეულ ცოდნას და დროის დახარჯვას მის განხორციელებაზე. და მაინც, თავად თარგმანის პროცესი მნიშვნელოვნად დაჩქარებულია და გაადვილებულია.

სისტემებს შორის, რომლებიც ეხმარება მთარგმნელს მის მუშაობაში, ყველაზე მნიშვნელოვანი ადგილი უჭირავს ე.წ. მთარგმნელობითი მეხსიერების (TM) სისტემებს.TM სისტემები ინტერაქტიული ინსტრუმენტია ორიგინალურ ენაზე ექვივალენტური ტექსტის სეგმენტების წყვილის დასაგროვებლად და თარგმნისთვის. მონაცემთა ბაზა მათი შემდგომი ძიების და რედაქტირების შესაძლებლობით. ეს პროგრამული პროდუქტები არ არის გამიზნული მაღალი ინტელექტუალური საინფორმაციო ტექნოლოგიების გამოსაყენებლად, არამედ, პირიქით, ეფუძნება მთარგმნელის შემოქმედებითი პოტენციალის გამოყენებას. მუშაობის პროცესში თარჯიმანი თავად აყალიბებს მონაცემთა ბაზას (ან იღებს მას სხვა მთარგმნელებისგან ან მომხმარებლისგან) და რაც უფრო მეტ ერთეულს შეიცავს, მით მეტია მისი გამოყენების ანაზღაურება.

აქ არის ყველაზე ცნობილი TM სისტემების სია:

სატრანზიტო შვეიცარიული კომპანია Star,

ტრადოსი (აშშ),

თარგმანის მენეჯერი IBM-დან,

ფრანგული კომპანია LANT-ის Eurolang Optimizer,

DejaVu ATRIL-დან (აშშ),

WordFisher (უნგრეთი).

TM სისტემები შესაძლებელს ხდის გამოირიცხოს იდენტური ტექსტის ფრაგმენტების განმეორებითი თარგმანი. სეგმენტის თარგმნას თარჯიმანი მხოლოდ ერთხელ ახორციელებს, შემდეგ კი ყოველი მომდევნო სეგმენტი მოწმდება მონაცემთა ბაზასთან შესატყვისად (სრული ან ბუნდოვანი) და თუ იდენტური ან მსგავსი სეგმენტი იქნა ნაპოვნი, მაშინ იგი შემოთავაზებულია თარგმანის სახით. ვარიანტი.

ამჟამად მიმდინარეობს განვითარება TM სისტემების გასაუმჯობესებლად. მაგალითად, Star's Transit სისტემის ბირთვი დაფუძნებულია ნერვული ქსელის ტექნოლოგიაზე.

მიუხედავად TM სისტემების ფართო სპექტრისა, მათ აქვთ რამდენიმე საერთო მახასიათებელი:

გასწორების ფუნქცია. TM სისტემების ერთ-ერთი უპირატესობა არის ამ თემაზე უკვე თარგმნილი მასალების გამოყენების შესაძლებლობა. TM მონაცემთა ბაზის მიღება შესაძლებელია ორიგინალისა და თარგმანის ფაილების სეგმენტ-სეგმენტური შედარებით.

იმპორტ-ექსპორტის ფილტრების ხელმისაწვდომობა. ეს თვისება უზრუნველყოფს TM სისტემების თავსებადობას სხვადასხვა ტექსტურ პროცესორებთან და საგამომცემლო სისტემებთან და აძლევს მთარგმნელს შედარებით დამოუკიდებლობას მომხმარებლისგან.

ბუნდოვანი ან სრული შესატყვისების ძიების მექანიზმი. სწორედ ეს მექანიზმი წარმოადგენს TM სისტემების მთავარ უპირატესობას. თუ ტექსტის თარგმნისას სისტემა შეხვდება სეგმენტს, რომელიც იდენტურია ან ახლოსაა ადრე ნათარგმნთან, მაშინ უკვე თარგმნილი სეგმენტი თარჯიმანს სთავაზობენ როგორც მიმდინარე სეგმენტის თარგმანის ვარიანტს, რომელიც შეიძლება გამოსწორდეს. ბუნდოვანი შესატყვისობის ხარისხს ადგენს მომხმარებელი.

თემატური ლექსიკონების მხარდაჭერა. ეს ფუნქცია ეხმარება თარჯიმანს დაეყრდნოს ლექსიკონს. როგორც წესი, თუ ნათარგმნი სეგმენტი შეიცავს სიტყვას ან ფრაზას თემატური ლექსიკონიდან, იგი ხაზგასმულია ფერად და შემოთავაზებულია მისი თარგმანი, რომელიც შეიძლება ავტომატურად ჩაერთოს ნათარგმნ ტექსტში.

ტექსტის ფრაგმენტების ძიების საშუალებები. ეს ინსტრუმენტი ძალიან მოსახერხებელია თარგმანის რედაქტირებისას. თუ მუშაობის პროცესში აღმოჩნდა ტექსტის ნებისმიერი ფრაგმენტის თარგმანის უფრო წარმატებული ვერსია, მაშინ ეს ფრაგმენტი შეგიძლიათ ნახოთ ყველა TM სეგმენტში, რის შემდეგაც აუცილებელი ცვლილებები თანმიმდევრულად ხდება TM სეგმენტებში.

რა თქმა უნდა, ნებისმიერი პროგრამული პროდუქტის მსგავსად, TM სისტემებს აქვთ თავისი დადებითი და უარყოფითი მხარეები და მათი ფარგლები. თუმცა, რაც შეეხება TM სისტემებს, მთავარი მინუსი არის მათი მაღალი ღირებულება.

განსაკუთრებით მოსახერხებელია TM სისტემების გამოყენება ისეთი დოკუმენტების თარგმნისას, როგორიცაა მომხმარებლის ინსტრუქციები, ოპერაციული ინსტრუქციები, დიზაინი და ბიზნეს დოკუმენტაცია, პროდუქტის კატალოგები და იგივე ტიპის სხვა დოკუმენტები დიდი რაოდენობით შესატყვისებით.

ტურისტული სააგენტოს უცხო ენებზე შედგენილი დოკუმენტები უნდა იყოს თარგმნილი რუსულად. წინააღმდეგ შემთხვევაში, მათზე გაწეული ხარჯები არ მიიღება საგადასახადო მიზნებისთვის. თუმცა, ზოგჯერ თარგმანი არ არის საჭირო. მაგალითად, თუ ლათინურად დაშიფრული ელექტრონული ბილეთის დეტალებზე ვსაუბრობთ (რუსეთის ფედერალური საგადასახადო სამსახურის 2011 წლის 7 ივნისის წერილი No. ED-4-3 / 8983).

დოკუმენტების თარგმნის საჭიროება
რუსეთის ფედერაციის 1991 წლის 25 ოქტომბრის No18071 „რუსეთის ფედერაციის ხალხთა ენების შესახებ“ რუსეთის ფედერაციის კანონის მე-16 მუხლის 1-ლი პუნქტის შესაბამისად, ჩვენს ქვეყანაში ორგანიზაციებში ოფიციალური საოფისე სამუშაოები ტარდება რუსულ ენაზე. .

და როგორც გათვალისწინებულია რუსეთის ფედერაციაში ბუღალტრული აღრიცხვისა და ფინანსური ანგარიშგების შესახებ დებულების მე-9 პუნქტში, დამტკიცებული რუსეთის ფინანსთა სამინისტროს 1998 წლის 29 ივლისის №34ნ ბრძანებით, ქონების, ვალდებულებებისა და ბიზნეს ოპერაციების აღრიცხვა (ეკონომიკური ფაქტები). საქმიანობა) აღირიცხება რუსეთის ფედერაციის ვალუტაში - რუბლებში.

ამავდროულად, ქონების, ვალდებულებების და ეკონომიკური საქმიანობის სხვა ფაქტების დოკუმენტაცია, სააღრიცხვო და ანგარიშგების რეესტრების წარმოება ხდება რუსულ ენაზე. შემდგომში ნათქვამია: სხვა ენებზე შედგენილი პირველადი სააღრიცხვო დოკუმენტები უნდა ჰქონდეს რუსულ ენაზე სტრიქონ-სტრიქონის თარგმანი.

ამ ნორმებიდან გამომდინარე, მარეგულირებელი ორგანოები ასკვნიან, რომ პირველადი დოკუმენტები, თუ ისინი შედგენილია უცხო ენაზე, უნდა ითარგმნოს რუსულად. ეს მოსაზრება გამოთქმულია, კერძოდ, რუსეთის ფინანსთა სამინისტროს 2009 წლის 3 ნოემბრის No03-03-06 / 725 2009 წლის 14 სექტემბრის No03-03-05 / 170 თებერვლის წერილებში. 16, 2009 No03- 03-05/23.

მიუხედავად იმისა, რომ ორგანიზაციები ახერხებენ დაიცვან ხარჯები სასამართლოებში, რომლებიც დადასტურებულია დოკუმენტებით თარგმანის გარეშე (მოსკოვის ოლქის ფედერალური ანტიმონოპოლიური სამსახურის 2011 წლის 21 აპრილის ბრძანებულებები No. KA-A40 / 2152-11, 2008 წლის 8 ოქტომბერს No. KA. -A40 / 8061-08).

ასევე, არბიტრები ყველაზე ხშირად იკავებენ გადასახადის გადამხდელთა მხარეს და აღნიშნავენ, რომ დოკუმენტების რუსულ ენაზე თარგმნის არარსებობა არ შეიძლება გახდეს დღგ-ის გამოქვითვაზე უარის თქმის საფუძველი. ამის მაგალითია მოსკოვის ოლქის ფედერალური ანტიმონოპოლიური სამსახურის 2009 წლის 1 აპრილის No. KA-A40 / 132809, 2009 წლის 16 მარტის No. KA-A40 / 1450-09, ფედერალური ანტიმონოპოლიური სამსახურის დადგენილება. 2007 წლის 5 მარტის დასავლეთ ციმბირის ოლქი No F04-979 /2007 (31967-A45-14).

ამასთან, თუ ტურისტული სააგენტოს დოკუმენტებს არ აქვს თარგმანი, სავარაუდოდ, საჭირო იქნება სასამართლოში დაიცვათ ხარჯების საგადასახადო აღრიცხვის შესაძლებლობა ან გამოქვითვის უფლება. ამ შემთხვევაში სასამართლო დავის შედეგი შეიძლება არ იყოს გადასახადის გადამხდელის სასარგებლოდ.

როგორ თარგმნოთ დოკუმენტი
ფინანსური განყოფილება განმარტავს, რომ თარგმნა შეუძლია როგორც პროფესიონალ მთარგმნელს, ასევე თავად ორგანიზაციას, უფრო სწორად, მის თანამშრომელს (წერილები 2009 წლის 14 სექტემბრის No. 03-03-05 / 170, 2006 წლის 20 მარტის No. 03. -02-07 /1-66).

ამავდროულად, კანონმდებლობა არ ადგენს, თუ როგორ უნდა იყოს შედგენილი ასეთი დოკუმენტი. აქედან გამომდინარე, ის შეიძლება შესრულდეს როგორც ცალკე დოკუმენტი ან ჩაიწეროს რუსულ ტექსტში უცხოური პირველადი დოკუმენტის ასლზე.

აღსანიშნავია, რომ თარგმნა ასევე შეიძლება შეასრულოს ორგანიზაციამ, რომელმაც გასცა პირველადი დოკუმენტი, მაგალითად, მოწმობის სახით (რუსეთის ფინანსთა სამინისტროს წერილი No. 03-03-05 / 170).

როდის შეიძლება თარგმნის გარეშე?
ზოგიერთ შემთხვევაში, დოკუმენტების თარგმნა არ არის საჭირო.

ამის გაკეთება არ არის საჭირო, პირველ რიგში, თუ რეგულარულად იღებთ სტანდარტულ დოკუმენტებს თქვენი უცხოელი კონტრაგენტებისგან, რომლებშიც განსხვავდება მხოლოდ რიცხვითი ინდიკატორები (დოკუმენტის ნომერი, თარიღი, ფასი და ა.შ.), საკმარისია გადათარგმნოთ ფორმა. დოკუმენტი რუსულად ერთხელ. ამ საკითხზე განმარტებები მოცემულია რუსეთის ფინანსთა სამინისტროს 2009 წლის 3 ნოემბრის No03-03-06/1/725 წერილში.

მეორეც, არ არის საჭირო ინფორმაციის თარგმნა, რომელიც არ არის აუცილებელი გაწეული ხარჯების დასადასტურებლად.

მაგალითად, მგზავრობის საფასურის გამოყენების პირობები, საჰაერო ტრანსპორტის წესები, ბარგის გადაზიდვის წესები. ამაზე ყურადღება გაამახვილეს მთავარი ფინანსური დეპარტამენტის თანამშრომლებმა 2009 წლის 14 სექტემბრის No03-03-05 / 170 წერილში.

მესამე, არ არის საჭირო ლათინური სიმბოლოების გამოყენებით შევსებული ელექტრონული ბილეთის ოფიციალური (დაშიფრული) დეტალების თარგმნა (რუსეთის ფედერალური საგადასახადო სამსახურის წერილები, 2011 წლის 7 ივნისით, No. ED-4-3 / 8983, 26 აპრილი. , 2010 No ШС-37- 3/ [ელფოსტა დაცულია]).

მაგრამ როდესაც ელექტრონულ ბილეთში მნიშვნელობები რეალურად არის მითითებული უცხო ენაზე და არ ემთხვევა ფორმალიზებულ (დაშიფრულ) მნიშვნელობებს ან კოდებს ერთიანი საერთაშორისო კოდიფიკატორების შესაბამისად, მაშინ ბილეთის ეს მაჩვენებლები (მნიშვნელობები) არის ექვემდებარება თარგმნას რუსულ ენაზე.

თარგმანის ხარჯების აღრიცხვა
ბუღალტრულ აღრიცხვაში, ტურისტული კომპანიის ხარჯები მთარგმნელობითი მომსახურების გადახდისთვის შედის სხვა ხარჯებში იმ თვეში, რომელშიც ისინი უზრუნველყოფილია. ეს აისახება ანგარიშის 91 „სხვა შემოსავალი და ხარჯები“ (ქვეანგარიში „სხვა ხარჯები“) და 76 „სხვადასხვა მოვალეებთან და კრედიტორებთან ანგარიშსწორებები“ (პუნქტები 11, 16, 18 PBU 10/99) სადებეტო ჩანაწერში. „ორგანიზაციის ხარჯები“).

ასეთი ხარჯები ასევე მიიღება მოგების დაბეგვრის მიზნებისთვის - როგორც სხვა ნაწილი, როგორც საინფორმაციო მომსახურების გადახდა (რუსეთის ფედერაციის საგადასახადო კოდექსის 14, პუნქტი 1, მუხლი 264) ან სხვა ხარჯები. ამის შესახებ - რუსეთის ფედერალური საგადასახადო სამსახურის მოსკოვისთვის 2008 წლის 26 მაისის No20-12 / 050126 წერილში. მართალია, ეს წესი ვრცელდება მესამე მხარის თარგმანის ღირებულებაზე.

შეგახსენებთ, რომ რუსეთის ფედერაციის საგადასახადო კოდექსის 252-ე მუხლის მოთხოვნების შესასრულებლად, დოკუმენტების თარგმნის ხარჯები უნდა იყოს დოკუმენტირებული.

„გამარტივებით“ ასეთი ხარჯების გათვალისწინება არ იმუშავებს. ვინაიდან ისინი არ არის გათვალისწინებული ნებადართული ხარჯების დახურულ სიაში (რუსეთის ფედერაციის საგადასახადო კოდექსის 346.16 მუხლის 1-ლი პუნქტი).

მნიშვნელოვანია გახსოვდეთ

დოკუმენტების მესამე მხარის თარგმნის ხარჯები შეიძლება გამოიქვითოს საშემოსავლო გადასახადის მიზნებისთვის. მაგრამ მათი „გამარტივებით“ მიღება შეუძლებელია.

უცხო ენების ცოდნა არა მხოლოდ სასარგებლო უნარია ყოველდღიურ ცხოვრებაში, არამედ ერთ-ერთი მთავარი მოთხოვნაა სამუშაოზე განაცხადის დროს. ამჟამად სულ უფრო აქტუალური ხდება ერთი ან თუნდაც რამდენიმე უცხო ენის ცოდნის საჭიროება.

ენის (ინგლისური ან გერმანული) ცოდნა მდივანისთვის აუცილებელია არა მხოლოდ საზღვარგარეთ დასასვენებლად მოგზაურობისას, არამედ უცხოეთიდან საქმიანი პარტნიორების მიღებისას, ყოველდღიურ ცხოვრებაში ახალი ამბების კითხვის ან ფილმების ყურებისას. მაშასადამე, რუტინული და ყოველდღიური ოპერაციების დიდი რაოდენობა, რომლებიც ადრე არ მოითხოვდა უცხო ენის ცოდნას, დღეს, საერთაშორისო ინტეგრაციის პროცესების განვითარებისა და ბიზნესის გლობალიზაციის ფართო სურვილის გამო, სულ უფრო რთული ხდება, თუ მხოლოდ მას დაეყრდნობით. ერთი ენა.

თუმცა, დღეს მხოლოდ უცხო ენების ცოდნა არ არის საკმარისი, რადგან საგრძნობლად გაიზარდა ინფორმაციის მოცულობა, რომელიც ყოველდღიურად უნდა ითარგმნოს. ამასთან, ეს ამოცანა წარმატებით წყდება და არავის უჭირს ხელშეკრულების ან უცხოური საიტის შინაარსის რამდენიმე წამში თარგმნა. და ეს ყველაფერი იმიტომ, რომ ამ შემთხვევაში მთარგმნელობითი პროგრამა თარგმანშია დაკავებული: ადამიანს თვალის დახამხამების დრო არ აქვს და თარგმანი უკვე მზადაა.

სამიზნეეს გაკვეთილი მიზნად ისახავს მოსწავლეებს წარმოდგენაში მიიღონ კომპიუტერული ლექსიკონები და მანქანური თარგმანის სისტემები, გააცნონ ამ პროგრამების შესაძლებლობები, ასწავლონ ამ პროგრამების გამოყენება.

ჩამოტვირთვა:


გადახედვა:

გაკვეთილის თემა: "ტექსტების და კომპიუტერული ლექსიკონების მანქანური თარგმანის სისტემები"

გაკვეთილის მიზნები:

  • დაეხმაროს სტუდენტებს წარმოდგენაში მიიღონ კომპიუტერული ლექსიკონები და მანქანური თარგმანის სისტემები, გააცნონ ისინი ამ პროგრამების შესაძლებლობებს, ასწავლონ ამ პროგრამების გამოყენება.
  • შემეცნებითი ინტერესების განვითარება, თვითკონტროლი, შენიშვნების გაკეთების უნარი.
  • მოსწავლეთა საინფორმაციო კულტურის განათლება, ყურადღებიანობა, სიზუსტე, დისციპლინა, შეუპოვრობა.

გაკვეთილის ტიპი: გაკვეთილზე ახალი მასალის შესწავლა

აღჭურვილობა:

კომპიუტერი, პროექტორი, ეკრანი, კომპიუტერული პრეზენტაცია.

გაკვეთილების დროს:

I. ორგ. მომენტი

მისალმება, დამსწრეების შემოწმება.

II. ცოდნის განახლება

ერთი უცხო ენის ცოდნა დღეს ყველასთვის აუცილებელია, ჰაერივით. განსაკუთრებით მომხმარებლებისთვის: კომპიუტერზე მუშაობისას ინგლისურ ენასთან შეჯახების თავიდან აცილება ხომ შეუძლებელია. კარგად, თუ ეს ეხება მხოლოდ ფაილებს პროგრამების დოკუმენტაციასთან (რომელსაც ტრადიციულად ჩვენს ქვეყანაში არავინ კითხულობს) ან პროგრამის მენიუს სახელებს (რომელზეც შეგიძლიათ ისწავლოთ ნავიგაცია ენის ცოდნის გარეშე, მეცნიერული დაჭერით და შეფუთვით).

ცუდია, თუ უცხო ენა არ იცი... თუმცა, ბოდიშს გიხდით - ნაწილობრივ - შეგიძლიათ დაგეხმაროთ კომპიუტერზე რომელიმე სპეციალიზებული მთარგმნელობითი პროგრამის დაყენებით ან კომპიუტერული ლექსიკონების გამოყენებით.

ჩამოწერეთ გაკვეთილის თემა „ტექსტების ავტომატური თარგმანის სისტემები
და კომპიუტერული ლექსიკონები.

დღეს გაკვეთილზე მიიღებთ წარმოდგენას კომპიუტერულ ლექსიკონებზე და ტექსტის ავტომატური თარგმნის სისტემებზე და გაეცნობით ამ პროგრამების შესაძლებლობებს.

III. გაცნობა ახალ მასალაში

მწერლობის მოსვლასთან ერთად ადამიანებმა მიიღეს მძლავრი ინსტრუმენტი ცოდნის შესანახად და კომუნიკაციისთვის. ტაძრებისა და სამარხების კედლებზე ჩვენამდე მოღწეული პირველი თხზულება მოგვითხრობს მრავალი საუკუნის წინ მომხდარ მეფეთა და გენერლების საქმეებზე. გარდა ამისა, ადამიანები აფიქსირებდნენ ეკონომიკური საქმიანობის შედეგებს, რათა წარმატებით ეწარმოებინათ ვაჭრობა, აგროვებდნენ გადასახადებს და ა.შ.

ხალხებს შორის წერილობითი კომუნიკაციის გასაადვილებლად შეიქმნა პირველი ლექსიკონები. ერთ-ერთი ასეთი ლექსიკონი შუმერმა ქურუმებმა თიხის ფირფიტებზე დაწერეს. თითოეული ტაბლეტი იყოფა ორ თანაბარ ნაწილად. ერთის მხრივ იწერებოდა შუმერული სიტყვა, მეორე მხრივ კი მსგავსი მნიშვნელობის სიტყვა სხვა ენაზე, ხანდახან მოკლე განმარტებით. იმ დროიდან დღემდე ლექსიკონების სტრუქტურა დიდად არ შეცვლილა.

ამჟამად, არსებობს ათასობით ლექსიკონი ასობით ენას შორის თარგმნისთვის (ინგლისურ-რუსული, გერმანულ-ფრანგული და ა.შ.) და თითოეული მათგანი შეიძლება შეიცავდეს ათიათასობით სიტყვას.

ქაღალდის ვერსიით ლექსიკონი ასობით გვერდიანი სქელი წიგნია, სადაც სწორი სიტყვის ძიება საკმაოდ შრომატევადი პროცესია.

ჩვენი სამყაროს ამჟამინდელი გლობალიზაცია იწვევს დოკუმენტების გაცვლის აუცილებლობას მსოფლიოს სხვადასხვა ქვეყანაში მდებარე ადამიანებსა და ორგანიზაციებს შორის, რომლებიც საუბრობენ სხვადასხვა ენაზე.

ამ პირობებში ტრადიციული სახელმძღვანელო თარგმანის ტექნოლოგიის გამოყენება აფერხებს ეთნიკური კონტაქტების განვითარებას. მრავალგვერდიანი დოკუმენტაციის ხელით თარგმნას მთარგმნელებისთვის დიდი დრო და მაღალი ხელფასი სჭირდება. მიღებული ელ. ფოსტის ან ბრაუზერში ნახული ვებ გვერდის თარგმნა დაუყოვნებლივ უნდა მოხდეს და თარჯიმნის მოწვევის შესაძლებლობა და დრო არ არის.

მანქანური თარგმანის სისტემები ამ პრობლემებს წყვეტს.

პერსონალური კომპიუტერის მოსვლასთან ერთად დაიწყო ელექტრონული ლექსიკონების შექმნა, რამაც გააადვილა სწორი სიტყვის პოვნა და შესთავაზა მრავალი ახალი სასარგებლო ფუნქცია (სიტყვის გახმოვანება, სინონიმების ძიება და ა.შ.).

ავტომატური თარგმანის ტექნოლოგია თანდათან გაუმჯობესდა. და თუ პირველი სისტემების თარგმანის ხარისხი და სიჩქარე სასურველს ტოვებდა, ახლა კომპიუტერს ნამდვილად შეუძლია თარგმნოს ტექსტი ერთი ენიდან მეორეზე თანმიმდევრულად. და უფრო თანამედროვე სისტემები მისაღები ხარისხით თარგმნიან 1 გვერდს ტექსტს 1 წამში.

კომპიუტერული ლექსიკონები მრავალენოვანია.

ისინი საშუალებას აძლევს მომხმარებელს შეარჩიოს ენები და თარგმანის მიმართულება (მაგალითად, ინგლისურ-რუსული, ესპანურ-რუსული და ა.შ.)

ხშირად გამოყენებული სიტყვების ძირითადი ლექსიკონის გარდა, მათ შეუძლიათ შეიცავდეს ათობით სპეციალიზებულ ლექსიკონს ცოდნის სფეროებში (ტექნოლოგია, მედიცინა და ა.შ.)

უზრუნველყავით ლექსიკონის ჩანაწერების სწრაფი ძიება.

საშუალებას გაძლევთ შეიყვანოთ ფრაზები და ტექსტები.

შეიძლება იყოს მულტიმედია, ე.ი. მიეცით მომხმარებელს შესაძლებლობა მოუსმინოს გამომსვლელთა, მშობლიური მეტყველების მიერ შესრულებულ სიტყვებს.

ძირითადი მოთხოვნები კომპიუტერის მთარგმნელებისთვის

ეფექტურობა მოიცავს ლექსიკისა და თემატური სექციების მუდმივი განახლების შესაძლებლობას.

მოქნილობა შექმნილია კონკრეტული საგნისთვის.

სიჩქარე - ქაღალდიდან ტექსტური ინფორმაციის ავტომატური შეყვანისა და დამუშავების შესაძლებლობა. ერთი ასეთი სისტემა (OCR-System) ყოველდღიურად ცვლის ათზე მეტ გამოცდილ ტიპაპისტს.

სიზუსტე არის წიგნიერება და ნათარგმნი ტექსტის მნიშვნელობის ადეკვატური გადატანა სამიზნე ენაზე.

კომპიუტერული თარგმანის სისტემებს აქვთ თავისი დადებითი და უარყოფითი მხარეები.

დადებითი

თარგმნის მაღალი სიჩქარე. კომპიუტერული თარგმანის სისტემები საშუალებას გაძლევთ თარგმნოთ მრავალგვერდიანი დოკუმენტები დიდი სიჩქარით.

მრავალმხრივობა.პროფესიონალ მთარგმნელს, როგორც წესი, აქვს სპეციალიზაცია ამა თუ იმ თემაზე ტექსტების თარგმნაში. მთარგმნელობითი პროგრამები საშუალებას გაძლევთ თარგმნოთ ტექნიკური დოკუმენტაცია, საქმიანი მიმოწერა და სხვა სპეციალიზებული ტექსტები საკმარისი ხარისხით.

თარგმანის დაბალი ღირებულება. პროფესიონალი თარჯიმნების მომსახურებით ჩვენ იძულებულნი ვართ გადავიხადოთ ფული თარგმანის ყოველი გვერდისთვის. თუმცა, ხშირად არ არის საჭირო ტექსტის სრულყოფილი თარგმანის მიღება, არამედ უნდა დაიჭიროთ გაგზავნილი წერილის მნიშვნელობა ან გვერდის შინაარსი ინტერნეტში. ამ შემთხვევაში მთარგმნელობითი სისტემა უდავოდ გახდება საიმედო და ეფექტური ასისტენტი.

კონფიდენციალურობა. ბევრი მომხმარებელი რეგულარულად იყენებს ავტომატური თარგმანის სისტემებს პირადი წერილების თარგმნისთვის, რადგან ყველა არ არის მზად გარე მთარგმნელს მისცეს პირადი მიმოწერა ან დაავალოს კომერციული ან ფინანსური დოკუმენტების თარგმნა.

ვებ შინაარსის ონლაინ თარგმნა და თარგმნა. საშუალებას გაძლევთ თარგმნოთ ვებ გვერდები რეალურ დროში. ონლაინ მთარგმნელობითი სერვისები ყოველთვის ხელთ არის და დაგეხმარებათ სწრაფად თარგმნოთ ინფორმაცია საჭირო დროს. გარდა ამისა, დღეს, მთარგმნელობითი სისტემების დახმარებით, შეგიძლიათ თარგმნოთ ინტერნეტ გვერდების შინაარსი და საძიებო სისტემა.

მინუსები

მაგრამ ამ სისტემებზე სრულად დაყრდნობა შეუძლებელია. Ისინი არიანსემანტიკური და სტილისტური შეცდომების დაშვებადა არ გამოიყენება ხელოვნების ნიმუშების თარგმნა, რადგან მათ არ შეუძლიათ ადეკვატურად თარგმნონ მეტაფორები, ალეგორიები და ადამიანის მხატვრული შემოქმედების სხვა ელემენტები.

ეს იმიტომ ხდება, რომ ისინი თარგმნიან ტექსტებს ფორმალური „ცოდნის“ საფუძველზე: ენის სინტაქსი (წინადადებების აგების წესები), სიტყვების ფორმირების წესები და ლექსიკონების გამოყენება.

მანქანური თარგმანის გამოყენება თემის პერსონალიზაციის გარეშე მრავალი ინტერნეტ ხუმრობის საგანია.

ფრაზა "ჩვენმა კატამ გააჩინა სამი კნუტი - ორი თეთრი და ერთი შავი", რომელიც PROMT-ის ონლაინ მთარგმნელმა აქცია "ჩვენმა კატამ გააჩინა სამი კნუტი - ორი თეთრი და ერთი აფროამერიკელი". თუ „აფროამერიკელი“ მაინც შეიძლებოდა „შავი“ ყოფილიყო „შავი კნუტის“ დაწერით, მაშინ „კატა“ ვერ შეცვლიდა სქესს: მაგალითად, მდედრი კატა ითარგმნა როგორც „ქალი კატა“.

პროგრამა არ ცნობს ფრაზის კონტექსტს და სიტყვასიტყვით თარგმნის ტერმინებს, გარდა ამისა, არ განასხვავებს სათანადო სახელებს ჩვეულებრივი სიტყვებისგან. იგივე PROMT-ის მთარგმნელი აქცევს „ლეო ტოლსტოის“ „სქელ ლომად“ („მსუქანი ლომი“).

Google Translator, პირიქით, ხშირად იღებდა სიტყვა "ბრინჯს" (ბრინჯი) აშშ-ს ყოფილი სახელმწიფო მდივნის გვარად.

რა უნდა გავაკეთოთ ასეთი შეცდომების თავიდან ასაცილებლად?

  • სანამ თარგმნას დაიწყებთ, საჭიროატექსტის ტიპის განსაზღვრაანუ, ადამიანის ცხოვრების რომელი სფეროდან არის წარმოდგენილი (ეკონომიკა, სპორტი, მეცნიერება და ა.შ.). ყოველივე ამის შემდეგ, თითოეულ სფეროს აქვს საკუთარი ნიუანსი და პირობები.
  • არასწორი თარგმანი ხშირად გამოწვეულიაბეჭდური შეცდომები ნათარგმნი ტექსტი. ეს ასევე ეხება აღიარებულ ტექსტებს. შეცდომების მქონე სიტყვები მთარგმნელების მიერ მონიშნულია, როგორც უცნობი, რადგან ისინი ამ ფორმით ლექსიკონებში არ არის. უარესი თუ არსებობსშეცდომები პუნქტუაციაში- ერთმა არასწორად დაყენებულმა მძიმემ შეიძლება დაამახინჯოს მთელი წინადადების თარგმანი.
  • იმუშავეთ ტექსტის ნაწყვეტებთან. არასოდეს თარგმნოთ მთელი ტექსტი ერთდროულად. ის ყოველთვის შეიცავს სიტყვებს, რომლებიც არ არის ლექსიკონში და მათ, რომლებსაც სისტემა სწორად არ თარგმნის.

ინტერნეტში კომპიუტერის ონლაინ მთარგმნელები უზრუნველყოფენ თემატური ლექსიკონისა და თარგმანის მიმართულების არჩევანს. ისინი საშუალებას გაძლევთ თარგმნოთ ნებისმიერი ტექსტი, რომელიც აკრეფილია თარგმანის ფანჯარაში ან კოპირებულია ბუფერიდან, ვებ გვერდებიდან, ჰიპერბმულების ჩათვლით, ასევე ელ.

ყველაზე პოპულარულია Google,PROMT, Yandex.translation.

Translate.ru არის პირველი რუსული ვებ სერვისი, რომელიც შექმნილია ტექსტის ან ვებ გვერდების სხვა ენებზე თარგმნისთვის. ერთი სიტყვის თარგმნისას ის ქმნის ლექსიკონის ჩანაწერს. გაიხსნა 1998 წლის 6 მარტს PROMT-ის მიერ.

Yandex.Translation არის Yandex ვებ სერვისი, რომელიც შექმნილია ტექსტის ან ვებ გვერდის ნაწილის სხვა ენაზე თარგმნისთვის. სისტემა აყალიბებს თავის კორესპონდენციურ ლექსიკონებს მილიონობით ნათარგმნი ტექსტის ანალიზზე დაყრდნობით. თარგმანის ტექსტს კომპიუტერი ჯერ ადარებს სიტყვების ბაზას, შემდეგ ენის მოდელების ბაზას, ცდილობს დაადგინოს გამოხატვის მნიშვნელობა კონტექსტში.

Google Translate არის Google-ის ვებ სერვისი, რომელიც შექმნილია ტექსტის ან ვებ გვერდის ნაწილის სხვა ენაზე ავტომატურად თარგმნისთვის. ზოგიერთი ენისთვის, მომხმარებლებს სთავაზობენ თარგმანის ვარიანტებს, მაგალითად, ტექნიკური ტერმინებისთვის, რომლებიც მომავალში უნდა იყოს შეტანილი მთარგმნელობითი სისტემის განახლებებში. სერვისი ასევე მოიცავს მთელი ვებ გვერდის თარგმანს და ინფორმაციის ერთდროულ ძიებას თარგმნით სხვა ენაზე.

მანქანური თარგმანის სისტემის გამოყენებამ შეიძლება მნიშვნელოვნად შეამციროს ტექსტების თარგმნისთვის საჭირო დრო. რუსული მანქანური თარგმანის სისტემებს შორის საუკეთესოაPROMT, ABBYY Lingvo, Multitran, SlovoEd.

ელექტრონული ლექსიკონი ABBYY Lingvo. მრავალენოვანი ვერსია მოიცავს 15 ენას. ABBYY Lingvo-ს არ აქვს სრული ტექსტის თარგმნის ფუნქცია, მაგრამ ბუფერიდან ტექსტების სიტყვა-სიტყვით თარგმნა შესაძლებელია.

ელექტრონული ლექსიკონი Promt. PROMT გთავაზობთ მთარგმნელობით პროგრამებს და PROMT ლექსიკონებს ინგლისური, გერმანული, ფრანგული, ესპანური და სხვა ენებიდან ტექსტების რუსულ ენაზე თარგმნისთვის და პირიქით. სრული გადაწყვეტა ბიზნეს და ტექნიკური დოკუმენტების, ელექტრონული ფოსტის, ვებსაიტების და პრეზენტაციების ავტომატური თარგმნისთვის.

მთარგმნელები ხელმისაწვდომია არა მხოლოდ პერსონალური კომპიუტერებისთვის, არამედ მობილური ტელეფონებისთვის, ტაბლეტებისთვის და სხვა მოწყობილობებისთვის.

მაგალითად, ტექსტების საჭირო აბზაცების სწრაფად და მოხერხებულად თარგმნის მიზნით, შეიქმნა პროგრამა Android-ისთვის - Quick Translator. მისი მთავარი უპირატესობა ის არის, რომ ის თარგმნის ტექსტებს ბუფერში კოპირების შემდეგ. საკმარისია მონიშნოთ ტექსტის ის ნაწილები, რომლებიც გჭირდებათ სწრაფი თარგმანის მისაღებად თქვენს Android ტაბლეტზე ან ტელეფონზე.

IV. შესწავლილი მასალის კონსოლიდაცია

კლასში შევხვდითკომპიუტერული ლექსიკონები და ავტომატური ტექსტის თარგმნის სისტემები და ამ პროგრამების შესაძლებლობები.

1. რა მოთხოვნები აქვს კომპიუტერულ თარჯიმნებს?

2. რა უპირატესობა აქვს კომპიუტერულ ლექსიკონებს ტრადიციულ ქაღალდის ლექსიკონებთან შედარებით?

3. როდის არის მიზანშეწონილი კომპიუტერული თარგმანის სისტემების გამოყენება?

4. რომელი ტექსტები არ უნდა ითარგმნოს კომპიუტერული თარჯიმნების გამოყენებით?

5. როგორია რუსული მანქანური თარგმანის საუკეთესო სისტემების სახელები?

V. საშინაო დავალება

მოემზადეთ პრაქტიკული სამუშაოსთვის

VI. გაკვეთილის შეჯამება.

გაკვეთილის შეჯამება. შეფასება.

გამოყენებული ლიტერატურის სია

მიხეევა ე.ვ. საინფორმაციო ტექნოლოგიები პროფესიულ საქმიანობაში. – მ.: აკადემია, 2006. – 384გვ.

საპკოვი ვ.ვ. საინფორმაციო ტექნოლოგიები და საოფისე მუშაობის კომპიუტერიზაცია. – მ.: აკადემია, 2006. – 288გვ.

მანქანური თარგმანის სისტემების სახეები //logrus.ru