Pagsasalin ng mga pangunahing dokumento mula sa isang wikang banyaga. Balangkas ng aralin sa paksa: Aralin sa MDK "Mga Sistema ng Pagsasalin ng Machine at Mga Diksyonaryo ng Kompyuter"

Paksa: “Mga tagapagsalin ng kompyuter. Mga sistema ng pagkilala sa teksto.

Layunin ng Aralin:

    upang matulungan ang mga mag-aaral na magkaroon ng pang-unawa sa mga diksyunaryo ng computer at mga sistema ng pagsasalin ng makina, upang maging pamilyar sa mga kakayahan ng mga programang ito, upang ituro kung paano gamitin ang mga programang ito. tulungan ang mga mag-aaral na magkaroon ng pag-unawa sa OCR - mga programa sa pagkilala sa teksto, makilala ang mga kakayahan ng data ng programa, magturo na makilala ang na-scan na teksto, ilipat at i-edit ito sa Word. edukasyon ng kultura ng impormasyon ng mga mag-aaral, pagkaasikaso, kawastuhan, disiplina, tiyaga. pag-unlad ng mga interes sa pag-iisip, mga kasanayan sa kompyuter, pagpipigil sa sarili, kakayahang kumuha ng mga tala.

Kagamitan:
board, computer, computer presentation.

Plano ng aralin:

1) sandali ng organisasyon. (1 min)

2) Aktwalisasyon ng kaalaman. (5 minuto)

3) Teoretikal na bahagi. (10 minuto)

4) Praktikal na bahagi. (15 minuto)

5) Takdang-Aralin (2 min)

6) Mga tanong ng mga mag-aaral. (5 minuto)

7) Ang resulta ng aralin. (2 minuto)

Sa panahon ng mga klase:

I. Pansamahang sandali.

Pagbati, pagsuri sa mga naroroon. Pagpapaliwanag ng aralin.

II. Pag-update ng kaalaman.

Tulad ng nakikita mo, upang makakuha ng electronic, ready-to-edit na kopya ng anumang naka-print na teksto, ang OCR program ay kailangang magsagawa ng "chain" ng maraming magkakahiwalay na operasyon.

Una kailangan mong kilalanin ang istraktura ng teksto sa pahina: piliin ang mga haligi, talahanayan, larawan, at iba pa. Susunod, ang mga napiling fragment ng teksto ng graphic na larawan ng pahina ay dapat na ma-convert sa teksto.

Kung ang pinagmulang dokumento ay may typographical na kalidad (isang medyo malaking font, walang mga character na hindi maganda ang pagkaka-print o pagwawasto), kung gayon ang problema sa pagkilala ay malulutas sa pamamagitan ng paghahambing sa isang template ng raster. Una, ang bitmap ng pahina ay nahahati sa mga indibidwal na larawan ng character. Pagkatapos ang bawat isa sa kanila ay sunud-sunod na nakapatong sa mga template ng simbolo na magagamit sa memorya ng system, at ang template na may pinakamaliit na bilang ng mga puntos na naiiba sa input na imahe ay pinili.

Kapag kinikilala ang mga dokumento na may mababang kalidad ng pag-print (typewritten text, fax, at iba pa), ang paraan ng pagkilala ng character ay ginagamit sa pamamagitan ng pagkakaroon ng ilang mga elemento ng istruktura sa mga ito (mga segment, singsing, arko, atbp.).

Ang anumang simbolo ay maaaring ilarawan sa pamamagitan ng isang hanay ng mga halaga ng parameter na tumutukoy sa kamag-anak na posisyon ng mga elemento nito. Halimbawa, ang letrang "H" at ang letrang "I" ay binubuo ng tatlong mga segment, dalawa sa mga ito ay parallel sa isa't isa, at ang pangatlo ay nag-uugnay sa mga segment na ito. Ang pagkakaiba sa pagitan ng mga titik na ito ay nasa laki ng mga anggulo na nabuo ng ikatlong segment kasama ng dalawa pa.

Kapag kinikilala sa pamamagitan ng paraan ng istruktura, ang mga detalye ng katangian ay nakikilala sa isang pangit na simbolikong imahe at inihambing sa mga istrukturang pattern ng mga simbolo. Bilang isang resulta, ang simbolo ay pinili kung saan ang kabuuan ng lahat ng mga elemento ng istruktura at ang kanilang pag-aayos ay higit sa lahat ay tumutugma sa kinikilalang simbolo.

Ang pinakakaraniwang optical character recognition system, gaya ng ABBYY FineReader at CuneiForm mula sa Cognitive, ay gumagamit ng parehong raster at structured na mga paraan ng pagkilala. Bilang karagdagan, ang mga sistemang ito ay "self-learning" (para sa bawat partikular na dokumento, lumikha sila ng naaangkop na hanay ng mga template ng character) at samakatuwid ang bilis at kalidad ng pagkilala ng isang multi-page na dokumento ay unti-unting tumataas.

Maaari kang bumili ng text recognition software nang hiwalay o kunin ito nang libre kasama ng scanner na binili mo.

Marahil ang pinakasikat na OCR software ay ang ABBYY's FineReader. Ito ang program na ito na kadalasang naaalala pagdating sa mga sistema ng pagkilala.

Pinapayagan ka ng FineReader na makilala ang mga tekstong nai-type sa halos anumang font, nang walang paunang pagsasanay. Ang isang tampok ng programa ng FineReader ay ang mataas na katumpakan ng pagkilala at mababang sensitivity sa mga depekto sa pag-print, na nakakamit sa pamamagitan ng paggamit ng teknolohiyang "holistic purposeful adaptive recognition".

Ang FineReader ay may isang toneladang dagdag na feature na maaaring hindi kailangan ng karaniwang user, ngunit mapapahanga ang ilang grupo ng mga mamimili. Kaya, ang isa sa mga trump card ng FineReader ay suporta para sa isang hindi kapani-paniwalang bilang ng mga wika ng pagkilala - 176, kung saan makakahanap ka ng mga kakaiba at sinaunang wika, at maging ang mga sikat na programming language.

Ngunit hindi lahat ng mga tampok ay kasama sa pinakasimpleng pagbabago ng programa, na maaari mong makuha nang libre kasama ang scanner. Batch scanning, karampatang pagproseso ng mga talahanayan at mga imahe - para sa lahat ng ito ay nagkakahalaga ng pagbili ng isang propesyonal na bersyon ng programa.

Lahat ng bersyon ng FineReader, mula sa pinakasimple hanggang sa pinakamakapangyarihan, ay nagbabahagi ng user-friendly na interface. Upang simulan ang proseso ng pagkilala, kailangan mo lamang ilagay ang dokumento sa scanner at pindutin ang tanging pindutan (I-scan at Basahin ang wizard) sa toolbar ng programa. Lahat ng karagdagang operasyon - pag-scan, paghahati ng imahe sa "mga bloke" at, sa wakas, ang aktwal na pagkilala sa programa ay awtomatikong gaganap. Kakailanganin lamang ng user na itakda ang nais na mga parameter sa pag-scan.

Ang kalidad ng pagkilala ay higit sa lahat ay nakasalalay sa kung gaano kahusay ang imahe ay nakuha sa panahon ng pag-scan. Ang kalidad ng larawan ay kinokontrol sa pamamagitan ng pagtatakda ng mga pangunahing parameter ng pag-scan: uri ng larawan, resolution, at liwanag.

Ang pag-scan sa kulay abo ay ang pinakamainam na mode para sa sistema ng pagkilala. Sa kaso ng pag-scan sa gray mode, ang awtomatikong pagpili ng liwanag ay isinasagawa. Kung gusto mong ilipat ang mga elemento ng kulay na nasa dokumento (mga larawan, titik at kulay ng background) sa isang elektronikong dokumento na may pangangalaga ng kulay, dapat kang pumili ng uri ng larawang may kulay. Kung hindi, gamitin ang gray na uri ng imahe.

Ang pinakamainam na resolution para sa mga ordinaryong teksto ay 300 dpi at 400-600 dpi para sa mga teksto sa maliit na print (9 o mas kaunting mga puntos).

Kapag kumpleto na ang pagkilala sa pahina, mag-aalok ang FineReader sa user ng pagpipilian: i-scan at kilalanin pa (para sa isang multi-page na dokumento) o i-save ang resultang text sa isa sa maraming sikat na format - mula sa mga dokumento ng Microsoft Office hanggang sa HTML o PDF. Maaari mong, gayunpaman, agad na ilipat ang dokumento sa Word o Excel, at doon na iwasto ang lahat ng mga bahid ng pagkilala (imposibleng gawin nang wala ito). Kasabay nito, ganap na pinapanatili ng FineReader ang lahat ng mga tampok ng pag-format ng dokumento at ang graphic na disenyo nito.

    Bakit kailangan natin ng mga programa sa pagkilala sa teksto? Paano ginagawa ang pagkilala sa teksto? Anong mga programa sa pagkilala sa teksto ang alam mo? Ano ang ginamit nila? Anong resolution ang pinakamainam para sa pag-scan ng text, mga larawan?

III. Praktikal na bahagi.
1. Paggawa gamit ang isang text translator (sa pamamagitan ng card)
2. Ngayon, magsanay tayo sa pagtatrabaho sa ABBYY FineReader. Gagamit kami ng pinasimpleng bersyon ng program na kasama ng scanner.

IV. Takdang aralin
Alamin kung ano ang mga programa ng awtomatikong pagsasalin ng teksto, magagawang gumana sa mga program na ito. Karagdagang gawain: kumonekta sa Internet at gumamit ng anumang online na tagasalin upang isalin ang teksto.
Alamin kung ano ang mga programa sa pagkilala ng teksto, magagawang magtrabaho sa mga programang ito. Karagdagang gawain: i-install ang OCR program sa bahay at maghanda ng isang sanaysay sa anumang paksa. Kilalanin ang teksto sa OCR, i-edit at i-format sa Word.

V. Mga tanong ng mga mag-aaral.
Mga sagot sa mga tanong ng mga mag-aaral.

VI. Buod ng aralin.
Pagbubuod ng aralin. Pagmamarka.

Sa aralin, nakilala namin ang mga programa sa pagsasalin ng computer para sa mga teksto, natutunan kung paano isalin ang mga salita at teksto gamit ang isang programa ng tagasalin.

Sa aralin, nakilala namin ang mga programa ng OCR, natutunan kung paano makilala ang isang na-scan na imahe gamit ang ABBYY FineReader 5.0.

Ang Liham Blg. 03-03-06/1/202 ng Ministri ng Pananalapi ng Russian Federation na may petsang Abril 20, 2012 ay nagpapaliwanag na ang mga dokumento sa mga dayuhang paglalakbay sa negosyo ay maaaring isalin ng sinumang empleyado ng kumpanya, at hindi kinakailangan ng isang propesyonal na tagasalin . Nalalapat ba ang mga paglilinaw na ito sa anumang pangunahing dokumento sa isang wikang banyaga? Ano ang kinakailangan mula sa isang ordinaryong empleyado ng kumpanya (maliban sa kanyang kaalaman sa isang wikang banyaga) upang makapagsalin ng mga dokumento? Paano ito dapat i-format? Ano ang ibig sabihin ng pariralang "line-by-line na pagsasalin"? Maaari bang kailanganin ng mga inspektor ng buwis ang pagnotaryo ng mga isinaling dokumento o sertipikasyon ng isang propesyonal na tagasalin sa kaso ng mga hindi pagkakaunawaan sa panahon ng pag-audit?

Sagot ni Lyubov Artyukh, lead auditor ng Audit and Consulting Group BANKO, www.bankoaudit.ru

Ang Liham ng Ministri ng Pananalapi ng Russian Federation na may petsang Abril 20, 2012 Hindi. mga dokumentong iginuhit sa mga wikang banyaga.

Ang nasabing pangunahing mga dokumento sa accounting ay maaaring: isang deklarasyon ng customs ng kargamento (deklarasyon para sa mga kalakal), mga dokumento sa internasyonal na transportasyon - mga waybill na nagpapatunay sa paglipat ng mga kalakal sa carrier (internasyonal na hangin, kalsada, mga waybill ng tren, mga bill ng pagkarga), mga komersyal na invoice, mga sertipiko ng pagtanggap - paglipat ng mga gumanap na gawa (serbisyo), iba pang mga dokumento na iginuhit alinsunod sa mga kaugalian ng paglilipat ng negosyo na inilapat sa isang dayuhang estado.

Ipinahayag ng Ministri ng Pananalapi ng Russia ang puntong ito ng pananaw sa isyu ng pagsasalin ng mga dokumento na iginuhit sa isang banyagang wika nang mas maaga: Mga Liham ng Ministri ng Pananalapi ng Russian Federation na may petsang 03.22.10 No. 03-03-06 / 1/168 , na may petsang 03.26. 03.11.09 No. 03-03-06/1/72, na may petsang 14.09. 09 No. 03-03-05/170, na may petsang Pebrero 16, 2009 No. 03-03-05/23.

Ayon sa talata 3, sugnay 9 ng Regulasyon sa accounting at pag-uulat sa pananalapi sa Russian Federation, na inaprubahan ng Order of the Ministry of Finance ng Russian Federation noong Hulyo 29, 1998 No. 34n, pangunahing mga dokumento ng accounting na iginuhit sa iba pang mga wika ​​dapat may line-by-line na pagsasalin sa Russian.

Legislatively, ang pamamaraan para sa pagproseso ng mga dokumento na isinalin sa Russian ay hindi kinokontrol.

Kung ang pagsasalin ay isinasagawa ng isang espesyalista ng organisasyon, kung gayon ang isang order (isa pang panloob na dokumento) ay dapat magtatag ng bilog ng mga taong may karapatang isalin ang mga pangunahing dokumento ng accounting sa Russian, at ayusin ang ipinahiwatig na mga responsibilidad sa pagsasalin sa kanilang mga paglalarawan sa trabaho.

Sa kasong ito, ang pagsasalin ng dokumento ay dapat gawin alinman sa isang photocopy ng dokumento (linya sa linya), o sa isang hiwalay na nilikha na sheet, kung saan ang mga orihinal na linya ng dokumentong isinalin ay dapat na kahalili ng kanilang pagsasalin.

Maipapayo na lagyan ng pirma ng taong nagsagawa ng pagsasalin ang isinalin na teksto ng dokumento.

Tulad ng para sa "line-by-line transfer", dapat tandaan na upang makilala ang mga gastos para sa mga layunin ng accounting at tax accounting, ang mga detalye na kinakailangan upang maunawaan ang nilalaman ng operasyon at suriin ang halaga nito sa dami at halaga na mga termino dapat isalin. Ang pagsasalin ng impormasyon na paulit-ulit o hindi mahalaga upang suportahan ang mga gastos na natamo ay hindi kinakailangan.

Halimbawa, kung ang isang organisasyon sa proseso ng pagsasagawa ng dayuhang aktibidad sa ekonomiya ay gumagamit ng mga karaniwang dokumento, kung gayon sa kasong ito ay sapat na upang isalin sa Russian ang mga pare-parehong detalye ng karaniwang form nang isang beses, at pagkatapos ay isalin lamang ang pagbabago ng mga tagapagpahiwatig ng dokumento ( Liham ng Ministri ng Pananalapi ng Russian Federation na may petsang 03.11.09 No. 03-03-¬ 06/1/725).

Para sa mga tiket sa eroplano at iba pang mga dokumento sa transportasyon sa isang wikang banyaga, ang pagsasalin ng impormasyon na hindi mahalaga para sa pagkumpirma ng mga gastos na natamo (halimbawa, ang mga kondisyon para sa pag-aaplay ng pamasahe, mga tuntunin sa transportasyon sa himpapawid, mga patakaran para sa pagkarga ng mga bagahe, iba pang impormasyon) ay hindi kinakailangan (Liham ng Ministri ng Pananalapi ng Russian Federation na may petsang 03.22.10 No. 03- 03-06/1/168).

Sa ilang mga kaso, ang pagsasalin ng mga dokumento na iginuhit sa isang wikang banyaga ay hindi kinakailangan.

Kaya, ang line-by-line na pagsasalin ng mga dokumento na may pinag-isang pang-internasyonal na anyo ay hindi kinakailangan, lalo na, ang mga tiket sa eroplano na ginamit upang patunayan ang mga kontrata sa transportasyon ng hangin ng pasahero (Pinagsanib na Liham ng Ministri ng Pananalapi ng Russia at ng Federal Tax Service na may petsang Abril 26, 2010 No. ShS-37-3 / [email protected]).

Ang mga inspektor ng buwis sa kaganapan ng mga hindi pagkakaunawaan sa panahon ng pag-audit ay hindi karapat-dapat na humiling ng notarization ng mga isinaling dokumento.

Ang pangangailangan para sa mga dokumento sa panahon ng pag-audit ng buwis ay kinokontrol ng Art. 93 ng Tax Code ng Russian Federation. Ayon sa talata 2 ng sugnay 2 ng artikulo 93: "Ang mga dokumento sa papel ay isinumite sa anyo ng mga kopya na pinatunayan ng taong sinusuri. Hindi pinapayagan na humiling ng notarization ng mga kopya ng mga dokumento na isinumite sa isang awtoridad sa buwis (opisyal), maliban kung ibinigay ng batas ng Russian Federation.

Piliin ang fragment na may teksto ng error at pindutin ang Ctrl+Enter

Sa kasalukuyan, mayroong tatlong uri ng machine translation system:

Mga sistemang batay sa mga tuntunin sa gramatika (Rule-Based Machine Translation, RBMT);

Mga sistema ng istatistika (Statistical Machine Translation, SMT);

hybrid system;

Sinusuri ng mga sistemang batay sa gramatika ang teksto na ginagamit sa proseso ng pagsasalin. Ginagawa ang pagsasalin batay sa mga built-in na diksyunaryo para sa isang partikular na pares ng wika, pati na rin ang mga gramatika na sumasaklaw sa semantic, morphological, syntactic pattern ng parehong wika. Batay sa lahat ng data na ito, ang pinagmulang teksto ay sunud-sunod, pangungusap sa pangungusap, na-convert sa teksto sa kinakailangang wika. Ang pangunahing prinsipyo ng pagpapatakbo ng naturang mga sistema ay ang koneksyon sa pagitan ng mga istruktura ng pinagmulan at mga huling teksto.

Ang mga sistemang batay sa mga tuntunin sa gramatika ay kadalasang nahahati sa tatlong higit pang mga subgroup - mga sistema ng pagsasalin ng salita-sa-salita, mga sistema ng paglilipat at mga sistemang interlinguistic.

Ang mga bentahe ng mga system batay sa mga tuntunin sa gramatika ay ang katumpakan ng gramatika at syntactic, katatagan ng resulta, at ang kakayahang mag-adjust sa isang partikular na lugar ng paksa. Kabilang sa mga disadvantage ng mga system na nakabatay sa mga panuntunan sa gramatika ang pangangailangang lumikha, magpanatili at mag-update ng mga database ng linguistic, ang pagiging kumplikado ng paglikha ng naturang sistema, pati na rin ang mataas na halaga nito.

Ang mga sistema ng istatistika sa kanilang trabaho ay gumagamit ng pagsusuri sa istatistika. Ang isang bilingual corpus ng mga teksto ay ini-load sa system (naglalaman ng isang malaking halaga ng teksto sa pinagmulang wika at ang "manual" na pagsasalin nito sa kinakailangang wika), pagkatapos nito ay sinusuri ng system ang mga istatistika ng mga interlingual na sulat, syntactic constructions, atbp. Ang ang sistema ay self-learning - kapag pumipili ng opsyon sa pagsasalin, umaasa ito sa mga nakaraang istatistika. Kung mas malaki ang bokabularyo sa loob ng isang pares ng wika at mas tumpak ito, mas maganda ang resulta ng statistical machine translation. Sa bawat bagong isinaling teksto, bumubuti ang kalidad ng mga kasunod na pagsasalin.

Mabilis na i-set up ang mga statistic system at madaling magdagdag ng mga bagong direksyon sa pagsasalin. Kabilang sa mga pagkukulang, ang pinakamahalaga ay ang pagkakaroon ng maraming pagkakamali sa gramatika at ang kawalang-tatag ng pagsasalin.

Pinagsasama ng mga hybrid system ang mga diskarte na inilarawan kanina. Inaasahan na pagsasamahin ng hybrid machine translation system ang lahat ng mga pakinabang na mayroon ang mga statistical system at rule-based system.

1.3 Pag-uuri ng mga sistema ng pagsasalin ng makina

Ang mga machine translation system ay mga program na gumaganap ng ganap na awtomatikong pagsasalin. Ang pangunahing pamantayan ng programa ay ang kalidad ng pagsasalin. Bilang karagdagan, ang mga mahahalagang punto para sa gumagamit ay ang kaginhawahan ng interface, ang kadalian ng pagsasama ng programa sa iba pang mga tool sa pagproseso ng dokumento, ang pagpili ng mga paksa, at ang utility sa muling pagdadagdag ng diksyunaryo. Sa pagdating ng Internet, ang mga pangunahing machine translation vendor ay nagsama ng mga Web interface sa kanilang mga produkto, habang isinasama rin ang mga ito sa iba pang software at email, na nagpapahintulot sa MT na magamit upang isalin ang mga Web page, email, at online na pag-uusap.

Ang mga bagong miyembro ng forum ng wikang banyaga ng CompuServe ay madalas na nagtatanong kung sinuman ang makakapagrekomenda ng isang mahusay na programa sa pagsasalin ng makina para sa isang makatwirang presyo.

Ang sagot sa tanong na ito ay palaging "hindi". Depende sa sumasagot, ang sagot ay maaaring maglaman ng dalawang pangunahing argumento: alinman na ang mga makina ay hindi maaaring magsalin, o ang machine na pagsasalin ay masyadong mahal.

Pareho sa mga argumentong ito ay may bisa sa isang tiyak na lawak. Gayunpaman, ang sagot ay malayo sa pagiging napakasimple. Kapag pinag-aaralan ang problema ng machine translation (MT), kinakailangang isaalang-alang nang hiwalay ang iba't ibang subsection ng problemang ito. Ang sumusunod na dibisyon ay batay sa mga lektura ni Larry Childs na ibinigay sa 1990 International Conference on Technical Communication:

Ganap na awtomatikong pagsasalin;

Automated machine translation na may partisipasyon ng tao;

Pagsasalin na isinagawa ng isang tao gamit ang isang computer.

Ganap na awtomatikong pagsasalin ng makina. Ang ganitong uri ng machine translation ang ibig sabihin ng karamihan sa mga tao kapag pinag-uusapan nila ang machine translation. Ang kahulugan dito ay simple: ang teksto sa isang wika ay ipinasok sa computer, ang tekstong ito ay pinoproseso at ang computer ay naglalabas ng parehong teksto sa ibang wika. Sa kasamaang palad, ang pagpapatupad ng ganitong uri ng awtomatikong pagsasalin ay nahaharap sa ilang mga hadlang na hindi pa nalalampasan.

Ang pangunahing problema ay ang pagiging kumplikado ng wika mismo. Kunin, halimbawa, ang mga kahulugan ng salitang "maaari". Bilang karagdagan sa pangunahing kahulugan ng modal auxiliary verb, ang salitang "maaari" ay may ilang mga opisyal at balbal na kahulugan bilang isang pangngalan: "bangko", "latrine", "kulungan". Bilang karagdagan, mayroong isang archaic na kahulugan ng salitang ito - "upang malaman o maunawaan." Ipagpalagay na ang target na wika ay may isang hiwalay na salita para sa bawat isa sa mga halagang ito, paano matukoy ng isang computer ang mga ito?

Sa lumalabas, ilang pag-unlad ang nagawa sa pagbuo ng mga programa sa pagsasalin na nagdidiskrimina ng kahulugan batay sa konteksto. Ang mga kamakailang pag-aaral sa pagsusuri ng mga teksto ay higit na umaasa sa teorya ng posibilidad. Gayunpaman, ang ganap na awtomatikong pagsasalin ng makina ng mga teksto na may malawak na paksa ay imposible pa ring gawain.

Automated machine translation na may partisipasyon ng tao. Ang ganitong uri ng pagsasalin ng makina ay medyo magagawa na ngayon. Sa pagsasalita tungkol sa pagsasalin ng makina na may partisipasyon ng isang tao, karaniwan nilang ibig sabihin ay pag-edit ng mga teksto bago at pagkatapos na maproseso ng isang computer. Ang mga tagapagsalin ng tao ay nagbabago ng mga teksto upang sila ay maunawaan ng mga makina. Matapos magawa ng computer ang pagsasalin, muling ine-edit ng mga tao ang magaspang na pagsasalin ng makina, na ginagawang tama ang teksto sa target na wika. Bilang karagdagan sa ganitong pagkakasunud-sunod ng trabaho, may mga MT system na nangangailangan ng patuloy na presensya ng isang taong tagapagsalin sa panahon ng pagsasalin upang matulungan ang computer na magsalin lalo na ang mga kumplikado o hindi maliwanag na istruktura.

Ang pagsasalin ng makina na tinulungan ng tao ay naaangkop sa mas malawak na lawak sa mga tekstong may limitadong bokabularyo ng limitadong limitadong mga paksa.

Ang ekonomiya ng paggamit ng human-assisted machine translation ay pinagtatalunan pa rin. Ang mga programa mismo ay karaniwang medyo mahal, at ang ilan sa mga ito ay nangangailangan ng espesyal na kagamitan upang gumana. Kailangang matutunan ang pre at post editing, at hindi ito isang magandang trabaho. Ang paglikha at pagpapanatili ng mga database ng mga salita ay isang matrabahong proseso at kadalasan ay nangangailangan ng mga espesyal na kasanayan. Gayunpaman, para sa isang organisasyong nagsasalin ng malalaking volume ng mga teksto sa isang mahusay na tinukoy na lugar ng paksa, ang pagsasalin ng makina na tinulungan ng tao ay maaaring maging isang medyo matipid na alternatibo sa tradisyonal na pagsasalin ng tao.

Pagsasalin na isinagawa ng isang tao gamit ang isang computer. Sa pamamaraang ito, ang tagapagsalin ng tao ay inilalagay sa gitna ng proseso ng pagsasalin, habang ang computer program ay itinuturing na isang tool na ginagawang mas mahusay ang proseso ng pagsasalin at tumpak ang pagsasalin. Ito ay mga ordinaryong electronic na diksyunaryo na nagbibigay ng pagsasalin ng kinakailangang salita, na ginagawang responsable ang tao sa pagpili ng tamang opsyon at ang kahulugan ng isinalin na teksto. Ang ganitong mga diksyunaryo ay lubos na nagpapadali sa proseso ng pagsasalin, ngunit nangangailangan ng gumagamit na magkaroon ng isang tiyak na kaalaman sa wika at gumugol ng oras sa pagpapatupad nito. Gayunpaman, ang proseso ng pagsasalin mismo ay lubos na pinabilis at pinadali.

Sa mga sistemang tumutulong sa tagapagsalin sa kanyang gawain, ang pinakamahalagang lugar ay inookupahan ng tinatawag na Translation Memory (TM) system. Ang mga TM system ay isang interactive na tool para sa pag-iipon ng mga pares ng katumbas na mga segment ng teksto sa orihinal na wika at pagsasalin sa isang database na may posibilidad ng kanilang kasunod na paghahanap at pag-edit. Ang mga produktong ito ng software ay hindi nilayon na gumamit ng napakatalino na mga teknolohiya ng impormasyon, ngunit, sa kabaligtaran, ay batay sa paggamit ng potensyal na malikhain ng tagasalin. Sa kurso ng trabaho, ang tagasalin mismo ang bumubuo ng database (o natatanggap ito mula sa iba pang mga tagapagsalin o mula sa customer), at ang mas maraming mga yunit na nilalaman nito, mas malaki ang balik sa paggamit nito.

Narito ang isang listahan ng mga pinakasikat na sistema ng TM:

Transit Swiss kumpanya Star,

Trados (USA),

Tagapamahala ng Pagsasalin mula sa IBM,

Eurolang Optimizer ng kumpanyang Pranses na LANT,

DejaVu mula sa ATRIL (USA),

WordFisher (Hungary).

Ginagawang posible ng mga system ng TM na ibukod ang paulit-ulit na pagsasalin ng magkaparehong mga fragment ng teksto. Ang pagsasalin ng isang segment ay isasagawa lamang ng tagasalin, at pagkatapos ay ang bawat kasunod na segment ay susuriin para sa isang tugma (buo o malabo) sa database, at kung ang isang kapareho o katulad na segment ay natagpuan, pagkatapos ito ay inaalok bilang isang pagsasalin opsyon.

Sa kasalukuyan, ang mga pagpapaunlad ay isinasagawa upang mapabuti ang mga sistema ng TM. Halimbawa, ang core ng Star's Transit system ay batay sa teknolohiya ng neural network.

Sa kabila ng malawak na hanay ng mga sistema ng TM, nagbabahagi sila ng ilang karaniwang tampok:

Pag-andar ng pagkakahanay. Isa sa mga bentahe ng mga sistema ng TM ay ang kakayahang gumamit ng mga naisalin nang materyales sa paksang ito. Ang database ng TM ay maaaring makuha sa pamamagitan ng paghahambing ng segment-by-segment ng orihinal at mga file ng pagsasalin.

Availability ng mga filter ng import-export. Tinitiyak ng property na ito ang compatibility ng TM system na may iba't ibang word processor at publishing system at binibigyan ang tagasalin ng relatibong kalayaan mula sa customer.

Mekanismo para sa paghahanap ng malabo o kumpletong mga tugma. Ito ang mekanismong ito na kumakatawan sa pangunahing bentahe ng mga sistema ng TM. Kung, kapag nagsasalin ng isang text, ang system ay nakatagpo ng isang segment na kapareho o malapit sa naunang isinalin, kung gayon ang na-translate na segment ay iaalok sa tagasalin bilang isang variant ng pagsasalin ng kasalukuyang segment, na maaaring itama. Ang antas ng fuzzy na pagtutugma ay itinakda ng user.

Suporta para sa mga pampakay na diksyunaryo. Ang tampok na ito ay tumutulong sa tagasalin na manatili sa glossary. Bilang isang tuntunin, kung ang isang isinaling segment ay naglalaman ng isang salita o parirala mula sa isang pampakay na diksyunaryo, ito ay naka-highlight sa kulay at ang pagsasalin nito ay inaalok, na maaaring awtomatikong maipasok sa isinalin na teksto.

Paraan ng paghahanap ng mga fragment ng teksto. Napakadaling gamitin ng tool na ito kapag nag-e-edit ng pagsasalin. Kung sa proseso ng trabaho ay natagpuan ang isang mas matagumpay na bersyon ng pagsasalin ng anumang fragment ng teksto, kung gayon ang fragment na ito ay matatagpuan sa lahat ng mga segment ng TM, pagkatapos nito ang mga kinakailangang pagbabago ay sunud-sunod na ginawa sa mga segment ng TM.

Siyempre, tulad ng anumang produkto ng software, ang mga sistema ng TM ay may kanilang mga pakinabang at disadvantages, at ang kanilang saklaw. Gayunpaman, tungkol sa mga sistema ng TM, ang pangunahing kawalan ay ang kanilang mataas na gastos.

Ito ay lalong maginhawang gumamit ng mga TM system kapag nagsasalin ng mga dokumento tulad ng mga manwal ng gumagamit, mga tagubilin sa pagpapatakbo, disenyo at dokumentasyon ng negosyo, mga katalogo ng produkto at iba pang mga dokumento ng parehong uri na may malaking bilang ng mga tugma.

Ang mga dokumento na iginuhit sa mga banyagang wika, ang ahensya ng paglalakbay ay dapat isalin sa Russian. Kung hindi, ang mga gastos sa kanila ay hindi tatanggapin para sa mga layunin ng buwis. Gayunpaman, minsan hindi kailangan ang pagsasalin. Halimbawa, kung pinag-uusapan natin ang mga detalye ng isang electronic ticket na naka-encode sa Latin (liham ng Federal Tax Service ng Russia na may petsang Hunyo 7, 2011 No. ED-4-3 / 8983).

Ang pangangailangan para sa pagsasalin ng mga dokumento
Alinsunod sa talata 1 ng Artikulo 16 ng Batas ng Russian Federation ng Oktubre 25, 1991 No. 18071 "Sa mga wika ng mga mamamayan ng Russian Federation", ang opisyal na gawain sa opisina sa mga organisasyon sa ating bansa ay isinasagawa sa Russian. .

At gaya ng nakasaad sa talata 9 ng Regulasyon sa accounting at pag-uulat sa pananalapi sa Russian Federation, na inaprubahan ng utos ng Ministri ng Pananalapi ng Russia na may petsang Hulyo 29, 1998 No. 34n, accounting ng ari-arian, pananagutan at mga transaksyon sa negosyo (mga katotohanan ng ekonomiya aktibidad) ay naitala sa pera ng Russian Federation - sa rubles .

Kasabay nito, ang dokumentasyon ng ari-arian, pananagutan at iba pang mga katotohanan ng aktibidad sa ekonomiya, pagpapanatili ng mga rehistro ng accounting at pag-uulat ay isinasagawa sa Russian. Sinabi pa: ang mga pangunahing dokumento ng accounting na iginuhit sa ibang mga wika ay dapat na may line-by-line na pagsasalin sa Russian.

Batay sa mga pamantayang ito, ang mga awtoridad sa regulasyon ay nagtapos na ang mga pangunahing dokumento, kung sila ay iginuhit sa isang banyagang wika, ay dapat na isalin sa Russian. Ang opinyon na ito ay ipinahayag, sa partikular, sa mga liham ng Ministry of Finance ng Russia na may petsang Nobyembre 3, 2009 No. 03-03-06 / 725, na may petsang Setyembre 14, 2009 No. 03-03-05 / 170, na may petsang Pebrero 16, 2009 No. 03- 03-05/23.

Bagaman pinamamahalaan ng mga organisasyon na ipagtanggol ang mga gastos sa mga korte, na kinumpirma ng mga dokumento nang walang pagsasalin (mga atas ng Federal Antimonopoly Service ng Moscow District na may petsang Abril 21, 2011 No. KA-A40 / 2152-11, na may petsang Oktubre 8, 2008 No. KA -A40 / 8061-08).

Gayundin, ang mga arbitrator ay kadalasang pumanig sa mga nagbabayad ng buwis, na itinuturo na ang kakulangan ng pagsasalin ng mga dokumento sa Russian ay hindi maaaring magsilbing batayan para sa pagtanggi na ibawas ang VAT. Ang isang halimbawa nito ay ang resolusyon ng Federal Antimonopoly Service ng Moscow District noong Abril 1, 2009 No. KA-A40 / 132809, ng Marso 16, 2009 No. KA-A40 / 1450-09, ang Federal Antimonopoly Service ng West Siberian District ng Marso 5, 2007 No. F04-979 /2007(31967-A45-14).

Gayunpaman, kung ang mga dokumento ng ahensya sa paglalakbay ay walang pagsasalin, malamang na kinakailangan upang ipagtanggol ang posibilidad ng accounting ng buwis para sa mga gastos o ang karapatan sa isang bawas sa korte. Sa kasong ito, ang resulta ng paglilitis ay maaaring hindi pabor sa nagbabayad ng buwis.

Paano isalin ang isang dokumento
Nilinaw ng departamento ng pananalapi na ang pagsasalin ay maaaring gawin ng parehong propesyonal na tagasalin at ang organisasyon mismo, o sa halip, ang empleyado nito (mga liham na may petsang Setyembre 14, 2009 Blg. 03-03-05 / 170, may petsang Marso 20, 2006 Blg. 03 -02-07 /1-66).

Kasabay nito, ang batas ay hindi nagtatatag kung paano dapat iguhit ang naturang dokumento. Samakatuwid, maaari itong maisakatuparan bilang isang hiwalay na dokumento o nakasulat sa Russian text sa isang photocopy ng isang dayuhang pangunahing dokumento.

Dapat pansinin na ang pagsasalin ay maaari ding isagawa ng organisasyon na nagbigay ng pangunahing dokumento, halimbawa, sa anyo ng isang sertipiko (liham ng Ministri ng Pananalapi ng Russia No. 03-03-05 / 170).

Kailan mo magagawa nang walang pagsasalin?
Sa ilang mga kaso, ang mga dokumento ay hindi kailangang isalin.

Hindi ito kailangang gawin, una, kung regular kang tumatanggap ng mga karaniwang dokumento mula sa iyong mga dayuhang katapat, kung saan ang mga numerong tagapagpahiwatig lamang ang naiiba (numero, petsa ng dokumento, presyo, atbp.), sapat na upang isalin ang anyo ng dokumento sa Russian minsan. Ang mga paliwanag sa isyung ito ay ibinibigay sa liham ng Ministry of Finance ng Russia na may petsang Nobyembre 3, 2009 No. 03-03-06/1/725.

Pangalawa, hindi kinakailangan na isalin ang impormasyon na hindi mahalaga para sa pagkumpirma ng mga gastos na natamo.

Halimbawa, ang mga kondisyon para sa pag-aaplay ng pamasahe, ang mga patakaran ng transportasyon sa himpapawid, ang mga patakaran para sa pagkarga ng mga bagahe. Binigyang-pansin ito ng mga opisyal ng pangunahing departamento ng pananalapi sa isang liham na may petsang Setyembre 14, 2009 No. 03-03-05 / 170.

Pangatlo, hindi na kailangang isalin ang pormal (naka-encode) na mga detalye ng isang elektronikong tiket na pinunan gamit ang mga Latin na character (mga titik ng Federal Tax Service ng Russia na may petsang Hunyo 7, 2011 No. ED-4-3 / 8983, na may petsang Abril 26 , 2010 No. ШС-37- 3/ [email protected]).

Ngunit kapag ang mga halaga sa elektronikong tiket ay aktwal na ipinahiwatig sa isang wikang banyaga at hindi nag-tutugma sa mga pormal (naka-encode) na mga halaga o code alinsunod sa Unified International Codifiers, kung gayon ang mga tagapagpahiwatig (mga halaga) na ito ng tiket ay napapailalim sa pagsasalin sa Russian.

Accounting para sa mga gastos sa pagsasalin
Sa accounting, ang mga gastos ng isang kumpanya sa paglalakbay para sa pagbabayad para sa mga serbisyo ng pagsasalin ay kasama sa iba pang mga gastos sa buwan kung saan ibinigay ang mga ito. Ito ay makikita sa debit entry ng account 91 "Iba pang kita at mga gastos" (sub-account "Iba pang mga gastos") at ang kredito ng account 76 "Mga pag-aayos sa iba't ibang mga may utang at nagpapautang" (mga sugnay 11, 16, 18 PBU 10/99 "Mga gastos ng organisasyon").

Ang mga naturang gastos ay tinatanggap din para sa mga layunin ng pagbubuwis ng tubo - bilang bahagi ng iba bilang pagbabayad para sa mga serbisyo ng impormasyon (subclause 14, sugnay 1, artikulo 264 ng Tax Code ng Russian Federation) o bilang iba pang mga gastos. Tungkol dito - sa liham ng Federal Tax Service ng Russia para sa Moscow na may petsang Mayo 26, 2008 No. 20-12 / 050126. Totoo, nalalapat ang panuntunang ito sa halaga ng pagsasalin ng third-party.

Alalahanin na upang makasunod sa mga kinakailangan ng Artikulo 252 ng Tax Code ng Russian Federation, ang mga gastos sa pagsasalin ng mga dokumento ay dapat na dokumentado.

Sa pamamagitan ng "pagpapasimple" upang isaalang-alang ang mga naturang gastos ay hindi gagana. Dahil ang mga ito ay hindi ibinigay para sa saradong listahan ng mga pinahihintulutang gastos (sugnay 1 ng artikulo 346.16 ng Tax Code ng Russian Federation).

Mahalagang tandaan

Ang mga gastos sa pagsasalin ng mga dokumento ng third-party ay maaaring ibawas para sa mga layunin ng buwis sa kita. Ngunit imposibleng tanggapin ang mga ito sa isang "pagpapasimple".

Ang kaalaman sa mga wikang banyaga ay hindi lamang isang kapaki-pakinabang na kasanayan sa pang-araw-araw na buhay, ngunit isa rin sa mga pangunahing kinakailangan kapag nag-aaplay para sa isang trabaho. Sa kasalukuyan, ang pangangailangan para sa kaalaman ng isa o kahit na ilang mga wikang banyaga ay nagiging lalong nauugnay.

Ang kaalaman sa wika (Ingles o Aleman) ay kinakailangan para sa kalihim hindi lamang kapag naglalakbay sa bakasyon sa ibang bansa, kundi pati na rin kapag tumatanggap ng mga kasosyo sa negosyo mula sa ibang bansa, sa pang-araw-araw na buhay kapag nagbabasa ng mga balita o nanonood ng mga pelikula. Samakatuwid, ang isang malaking bilang ng mga nakagawiang gawain at pang-araw-araw na mga operasyon na dati ay hindi nangangailangan ng kaalaman sa isang wikang banyaga, ngayon, dahil sa pag-unlad ng mga proseso ng internasyunal na integrasyon at ang malawakang pagnanais ng negosyo para sa globalisasyon, ay nagiging mas mahirap kung umaasa ka lamang sa isang wika.

Ngayon, gayunpaman, ang kaalaman sa mga wikang banyaga lamang ay hindi sapat, dahil ang dami ng impormasyon na kailangang isalin araw-araw ay tumaas nang malaki. Kasabay nito, matagumpay na nalutas ang gawaing ito, at hindi mahirap para sa sinuman na isalin ang isang kontrata o ang nilalaman ng isang dayuhang site sa loob lamang ng ilang segundo. At lahat dahil sa kasong ito ang programa ng pagsasalin ay nakikibahagi sa pagsasalin: ang isang tao ay walang oras upang kumurap, at ang pagsasalin ay handa na.

Target Ang araling ito ay upang matulungan ang mga mag-aaral na magkaroon ng ideya tungkol sa mga diksyunaryo ng computer at mga sistema ng pagsasalin ng makina, upang ipakilala ang mga kakayahan ng mga programang ito, upang ituro kung paano gamitin ang mga program na ito.

I-download:


Preview:

Paksa ng aralin: "Mga sistema ng pagsasalin ng makina ng mga teksto at mga diksyunaryo ng computer"

Layunin ng Aralin:

  • upang matulungan ang mga mag-aaral na magkaroon ng ideya tungkol sa mga diksyunaryo ng computer at mga sistema ng pagsasalin ng makina, upang ipaalam sa kanila ang mga kakayahan ng mga programang ito, upang turuan kung paano gamitin ang mga program na ito.
  • pag-unlad ng mga interes ng nagbibigay-malay, pagpipigil sa sarili, kakayahang kumuha ng mga tala.
  • edukasyon ng kultura ng impormasyon ng mga mag-aaral, pagkaasikaso, kawastuhan, disiplina, tiyaga.

Uri ng aralin: aralin sa pagkatuto ng bagong materyal

Kagamitan:

computer, projector, screen, computer presentation.

Sa panahon ng mga klase:

I. Org. sandali

Pagbati, pagsuri sa mga naroroon.

II. Pag-update ng kaalaman

Ang kaalaman sa kahit isang banyagang wika ay kailangan para sa lahat ngayon, tulad ng hangin. Lalo na para sa mga gumagamit: pagkatapos ng lahat, imposibleng maiwasan ang isang banggaan sa wikang Ingles kapag nagtatrabaho sa isang computer. Well, kung ito ay nag-aalala lamang sa mga file na may dokumentasyon para sa mga programa (na ayon sa kaugalian ay walang nagbabasa sa ating bansa) o ang mga pangalan ng mga menu ng programa (na maaari mong matutunang mag-navigate nang hindi alam ang wika, sa pamamagitan ng scientific poke at cramming).

Masama kung hindi ka marunong ng wikang banyaga... Gayunpaman, paumanhin - sa isang bahagi - maaari kang tumulong sa pamamagitan ng pag-install ng isa sa mga dalubhasang programa ng pagsasalin sa iyong computer o paggamit ng mga diksyunaryo ng computer.

Isulat ang paksa ng aralin na “Machine translation systems for texts
at mga diksyunaryo ng kompyuter.

Ngayon sa aralin ay makakakuha ka ng ideya tungkol sa mga diksyunaryo ng computer at mga awtomatikong sistema ng pagsasalin ng teksto at makilala ang mga kakayahan ng mga programang ito.

III. Panimula sa bagong materyal

Sa pagdating ng pagsulat, ang mga tao ay nakatanggap ng isang makapangyarihang kasangkapan para sa pag-iimbak ng kaalaman at para sa komunikasyon. Ang mga unang sulat na bumaba sa amin sa mga dingding ng mga templo at mga libingan ay nagsasabi tungkol sa mga gawa ng mga hari at heneral na naganap maraming siglo na ang nakalilipas. Bilang karagdagan, naitala ng mga tao ang mga resulta ng mga aktibidad sa ekonomiya upang matagumpay na mangalakal, mangolekta ng mga buwis, atbp.

Upang mapadali ang nakasulat na komunikasyon sa pagitan ng mga bansa, nilikha ang mga unang diksyunaryo. Ang isa sa mga diksyunaryong ito ay isinulat ng mga paring Sumerian sa mga tapyas na luwad. Ang bawat tableta ay nahahati sa dalawang pantay na bahagi. Sa isang banda, isang salitang Sumerian ang isinulat, at sa kabilang banda, isang salita na may katulad na kahulugan sa ibang wika, kung minsan ay may maikling paliwanag. Mula noon hanggang sa kasalukuyan, hindi gaanong nagbago ang istruktura ng mga diksyunaryo.

Sa kasalukuyan, mayroong libu-libong mga diksyunaryo para sa pagsasalin sa pagitan ng daan-daang mga wika (Ingles-Russian, German-French, at iba pa), at bawat isa sa kanila ay maaaring maglaman ng sampu-sampung libong mga salita.

Sa bersyong papel, ang diksyunaryo ay isang makapal na aklat na may daan-daang mga pahina, kung saan ang paghahanap ng tamang salita ay isang medyo matrabahong proseso.

Ang kasalukuyang globalisasyon ng ating mundo ay humahantong sa pangangailangan na makipagpalitan ng mga dokumento sa pagitan ng mga tao at organisasyong matatagpuan sa iba't ibang bansa sa mundo at nagsasalita ng iba't ibang wika.

Sa ilalim ng mga kundisyong ito, ang paggamit ng tradisyonal na teknolohiya ng manu-manong pagsasalin ay humahadlang sa pagbuo ng mga interethnic na kontak. Ang manu-manong pagsasalin ng multi-page na dokumentasyon ay nangangailangan ng mahabang panahon at mataas na sahod para sa mga tagapagsalin. Ang pagsasalin ng isang e-mail na natanggap o isang Web page na tiningnan sa isang browser ay dapat gawin kaagad, at walang pagkakataon at oras upang mag-imbita ng isang tagasalin.

Ang mga sistema ng pagsasalin ng makina ay nilulutas ang mga problemang ito.

Sa pagdating ng isang personal na computer, nagsimulang lumikha ng mga elektronikong diksyonaryo, na nagpadali sa paghahanap ng tamang salita at nag-aalok ng maraming mga bagong kapaki-pakinabang na pag-andar (pagboses ng isang salita, paghahanap ng mga kasingkahulugan, atbp.).

Ang teknolohiya sa pagsasalin ng makina ay unti-unting napabuti. At kung ang kalidad at bilis ng pagsasalin ng mga unang sistema ay nag-iiwan ng maraming nais, ngayon ang isang computer ay maaari talagang magsalin ng teksto mula sa isang wika patungo sa isa pang magkakaugnay. At higit pang mga modernong system na may katanggap-tanggap na kalidad ay nagsasalin ng 1 pahina ng teksto sa loob ng 1 segundo.

Multilinguwal ang mga diksyunaryo ng kompyuter.

Pinapayagan nila ang gumagamit na pumili ng mga wika at direksyon ng pagsasalin (halimbawa, English-Russian, Spanish-Russian, atbp.)

Bilang karagdagan sa pangunahing diksyunaryo ng mga karaniwang ginagamit na salita, maaari silang maglaman ng dose-dosenang mga dalubhasang diksyunaryo sa mga lugar ng kaalaman (teknolohiya, gamot, atbp.)

Magbigay ng mabilis na paghahanap para sa mga entry sa diksyunaryo.

Binibigyang-daan kang magpasok ng mga parirala at teksto.

Maaaring multimedia, i.e. bigyan ang user ng pagkakataong makinig sa mga salitang isinagawa ng mga nagsasalita, mga katutubong nagsasalita.

Mga pangunahing kinakailangan para sa mga tagasalin ng computer

Kahusayan ay binubuo sa posibilidad ng patuloy na pag-update ng mga seksyon ng bokabularyo at pampakay.

Kakayahang umangkop dinisenyo para sa isang tiyak na lugar ng paksa.

Bilis - ang posibilidad ng auto-input at pagproseso ng impormasyon ng teksto mula sa papel. Pinapalitan ng isang ganoong sistema (OCR-System) ang higit sa sampung makaranasang typist araw-araw.

Katumpakan ay literacy at sapat na paglipat ng kahulugan ng isinalin na teksto sa target na wika.

Ang mga computer translation system ay may mga kalamangan at kahinaan.

pros

Mataas na bilis ng pagsasalin. Nagbibigay-daan sa iyo ang mga computer translation system na magsalin ng mga dokumentong may maraming pahina sa napakabilis na bilis.

Kagalingan sa maraming bagay.Ang isang propesyonal na tagasalin, bilang panuntunan, ay may espesyalisasyon sa pagsasalin ng mga teksto sa isang partikular na paksa. Nagbibigay-daan sa iyo ang mga translation program na isalin ang teknikal na dokumentasyon, sulat sa negosyo at iba pang espesyal na teksto na may sapat na kalidad.

Mababang halaga ng pagsasalin. Gamit ang mga serbisyo ng mga propesyonal na tagapagsalin, napipilitan kaming magbayad ng pera para sa bawat pahina ng pagsasalin. Gayunpaman, kadalasan ay hindi na kailangang makakuha ng perpektong pagsasalin ng teksto, ngunit kailangan mong makuha ang kahulugan ng ipinadalang liham o ang nilalaman ng pahina sa Internet. Sa kasong ito, ang sistema ng pagsasalin ay walang alinlangan na magiging isang maaasahan at epektibong katulong.

Pagiging kompidensyal. Maraming mga gumagamit ang regular na gumagamit ng mga sistema ng pagsasalin ng makina upang isalin ang mga personal na liham, dahil hindi lahat ng tao ay handa na magbigay ng personal na sulat sa isang tagasalin sa labas o ipagkatiwala ang pagsasalin ng mga komersyal o pinansyal na dokumento.

On-line na pagsasalin at pagsasalin ng nilalaman sa web. Binibigyang-daan kang magsalin ng mga web page sa real time. Ang mga serbisyo sa online na pagsasalin ay palaging nasa kamay at tutulong sa iyo na mabilis na magsalin ng impormasyon sa tamang oras. Bilang karagdagan, ngayon, sa tulong ng mga sistema ng pagsasalin, maaari mong isalin ang nilalaman ng mga pahina sa Internet at mga query sa search engine.

Mga minus

Ngunit ang mga sistemang ito ay hindi ganap na maaasahan. Sila aygumawa ng mga pagkakamali sa semantiko at estilista at hindi naaangkop sa pagsasalin ng mga gawa ng sining, dahil hindi nila sapat na makapagsalin ng mga metapora, alegorya at iba pang elemento ng artistikong pagkamalikhain ng tao.

Nangyayari ito dahil nagsasalin sila ng mga teksto batay sa pormal na "kaalaman": ang syntax ng wika (ang mga tuntunin sa pagbuo ng mga pangungusap), ang mga tuntunin sa pagbuo ng salita at ang paggamit ng mga diksyunaryo.

Ang paggamit ng machine translation nang walang pagpapasadya ng paksa ay paksa ng maraming mga biro sa Internet.

Ang pariralang "Nagsilang ang aming pusa ng tatlong kuting - dalawang puti at isang itim", na ginawang "Ang aming pusa ay nanganak ng tatlong kuting - dalawang puti at isang African American." Kung ang "African American" ay maaari pa ring gawing "itim" sa pamamagitan ng pagsulat ng "itim na kuting", kung gayon ang "pusa" ay hindi maaaring baguhin ang kasarian: halimbawa, ang babaeng pusa ay isinalin bilang "babaeng pusa".

Hindi kinikilala ng programa ang konteksto ng parirala at isinasalin ang mga terminong verbatim, bukod pa sa hindi pagkilala sa mga wastong pangalan mula sa mga ordinaryong salita. Ang parehong tagasalin ng PROMT ay naging "Leo Tolstoy" sa "Lion Thick" ("fat lion").

Ang Google Translator, sa kabaligtaran, ay madalas na kinuha ang salitang "rice" (rice) para sa apelyido ng dating Kalihim ng Estado ng Estados Unidos.

Ano ang dapat gawin upang maiwasan ang gayong mga pagkakamali?

  • Bago mo simulan ang pagsasalin, kailangan motukuyin ang uri ng teksto, iyon ay, mula sa kung aling lugar ng buhay ng tao ito kinakatawan (ekonomiya, palakasan, agham, atbp.). Pagkatapos ng lahat, ang bawat lugar ay may sariling mga nuances at termino.
  • Ang mga maling pagsasalin ay kadalasang sanhi ng mga typo isinalin na teksto. Nalalapat din ito sa mga kinikilalang teksto. Ang mga salitang may mga pagkakamali ay minarkahan ng mga tagasalin bilang hindi pamilyar, dahil wala sila sa mga diksyunaryo sa form na ito. Mas malala kung meronmga pagkakamali sa bantas- ang isang maling inilagay na kuwit ay maaaring makasira sa pagsasalin ng buong pangungusap.
  • Makipagtulungan sa mga snippet ng teksto. Huwag kailanman isalin ang buong teksto nang sabay-sabay. Ito ay palaging naglalaman ng mga salita na wala sa diksyunaryo at ang mga hindi naisalin ng system nang tama.

Ang mga online na computer translator sa Internet ay nagbibigay ng pagpipiliang pampakay na diksyunaryo at direksyon ng pagsasalin. Pinapayagan ka nitong isalin ang anumang tekstong nai-type sa window ng pagsasalin o kinopya mula sa clipboard, mga web page, kabilang ang mga hyperlink, pati na rin ang mga email.

Ang pinakasikat ay ang Google,PROMT, Yandex.translation.

Ang Translate.ru ay ang unang Russian web service na idinisenyo upang isalin ang teksto o mga web page sa ibang mga wika. Kapag nagsasalin ng isang salita, gumagawa ito ng entry sa diksyunaryo. Binuksan noong Marso 6, 1998 ng PROMT.

Ang Yandex.Translation ay isang serbisyo sa web ng Yandex na idinisenyo upang isalin ang bahagi ng isang teksto o web page sa ibang wika. Binubuo ng system ang mga diksyunaryo ng pagsusulatan nito batay sa pagsusuri ng milyun-milyong isinalin na teksto. Ang teksto para sa pagsasalin ay unang inihambing ng computer na may database ng mga salita, pagkatapos ay sa database ng mga modelo ng wika, sinusubukang matukoy ang kahulugan ng expression sa konteksto.

Ang Google Translate ay isang serbisyo sa web ng Google na idinisenyo upang awtomatikong isalin ang bahagi ng isang text o web page sa ibang wika. Para sa ilang wika, inaalok ang mga opsyon sa pagsasalin sa mga user, halimbawa, para sa mga teknikal na termino na dapat isama sa mga update sa hinaharap sa sistema ng pagsasalin. Kasama rin sa serbisyo ang pagsasalin ng buong web page at maging ang sabay-sabay na paghahanap ng impormasyon na may pagsasalin sa ibang wika.

Ang paggamit ng isang machine translation system ay maaaring makabuluhang bawasan ang oras na kinakailangan upang isalin ang mga teksto. Ang pinakamahusay sa mga Russian machine translation system ayPROMT, ABBYY Lingvo, Multitran, SlovoEd.

Elektronikong diksyunaryo ABBYY Lingvo. Ang multilinggwal na bersyon ay sumasaklaw sa 15 mga wika. Ang ABBYY Lingvo ay walang full-text translation function, ngunit word-by-word translation ng mga text mula sa clipboard ay posible.

Elektronikong diksyunaryo Promt. Nag-aalok ang PROMT ng mga programa sa pagsasalin at mga diksyunaryo ng PROMT para sa pagsasalin ng mga teksto mula sa English, German, French, Spanish at iba pang mga wika sa Russian at vice versa. Isang kumpletong solusyon para sa awtomatikong pagsasalin ng negosyo at teknikal na mga dokumento, e-mail, mga website at mga presentasyon.

Available ang mga tagasalin hindi lamang para sa mga personal na computer, ngunit para rin sa mga mobile phone, tablet at iba pang device.

Halimbawa, upang mabilis at maginhawang isalin ang mga kinakailangang talata ng mga teksto, nilikha ang isang programa para sa Android - Mabilis na Tagasalin. Ang pangunahing bentahe nito ay ang pagsasalin ng mga teksto pagkatapos kopyahin ang mga ito sa clipboard. Ang kailangan mo lang gawin ay i-highlight ang mga bahagi ng text na kailangan mo para makakuha ng mabilis na pagsasalin sa iyong Android tablet o telepono.

IV. Pagsasama-sama ng pinag-aralan na materyal

Nagkakilala kami sa klasemga diksyunaryo ng computer at awtomatikong sistema ng pagsasalin ng teksto at ang mga kakayahan ng mga program na ito.

1. Ano ang mga kinakailangan para sa mga computer translator?

2. Ano ang mga pakinabang ng mga diksyunaryo ng computer kaysa sa tradisyonal na mga diksyunaryo ng papel?

3. Kailan ipinapayong gumamit ng mga computer translation system?

4. Anong mga teksto ang hindi dapat isalin gamit ang mga computer translator?

5. Ano ang mga pangalan ng pinakamahusay na Russian machine translation system?

V. Takdang-Aralin

Maghanda para sa praktikal na gawain

VI. Buod ng aralin.

Pagbubuod ng aralin. Pagmamarka.

LISTAHAN NG GINAMIT NA LITERATURA

Mikheeva E.V. Mga teknolohiya ng impormasyon sa propesyonal na aktibidad. – M.: Academy, 2006. – 384 p.

Sapkov V.V. Mga teknolohiya ng impormasyon at computerization ng trabaho sa opisina. – M.: Academy, 2006. – 288 p.

Mga uri ng machine translation system //logrus.ru