Dicționare de calculator și sisteme pentru traducerea automată a textelor. Schema lecției pe tema: Lecția MDK „Sisteme de traducere automată și dicționare computerizate”

Dicționare de calculator și sisteme de traducere automată

Dicționare de calculator. Dicționarele sunt necesare pentru a traduce texte dintr-o limbă în alta. Există mii de dicționare pentru traducerea între sute de limbi (engleză-rusă, germană-franceză etc.), iar fiecare dintre ele poate conține zeci de mii de cuvinte. În versiunea pe hârtie, dicționarul este o carte groasă cu sute de pagini, în care căutarea cuvântului potrivit este un proces destul de lung și laborios.

Dicționarele de calculator pot conține traduceri în diferite limbi a sute de mii de cuvinte și expresii și, de asemenea, oferă utilizatorului funcții suplimentare. În primul rând, dicționarele de computer pot fi multilingve - permițând utilizatorului să aleagă limbile și direcția de traducere (de exemplu, engleză-rusă, spaniolă-rusă etc.).

În al doilea rând, dicţionarele de calculator pot conţine, pe lângă dicţionarul principal de cuvinte de uz curent, zeci de dicţionare specializate în domenii de cunoaştere (tehnologie, medicină, informatică etc.).

În al treilea rând, dicționarele computerizate oferă o căutare rapidă a intrărilor de dicționar: „tastare rapidă”, când apare o listă de cuvinte similare în procesul de tastare a unui cuvânt; acces la cuvintele utilizate frecvent prin marcaje; capacitatea de a introduce fraze etc.

În al patrulea rând, dicționarele de computer pot fi multimedia, adică oferă utilizatorului posibilitatea de a asculta cuvintele interpretate de vorbitori, vorbitori nativi.

Sisteme de traducere pe calculator. Procesul de globalizare a lumii duce la necesitatea schimbului frecvent de documente între oameni și organizații situate în diferite țări ale lumii și care vorbesc diferite limbi.

În aceste condiții, utilizarea tehnologiei tradiționale de traducere „manuală” împiedică dezvoltarea contactelor interetnice. Traducerea manuală a documentației cu mai multe pagini necesită un timp îndelungat și salarii mari pentru traducători. Traducerea unui e-mail primit sau a unei pagini Web vizualizate într-un browser trebuie făcută urgent și nu există timp pentru a invita un traducător.

Sistemele de traducere pe calculator permit rezolvarea acestor probleme. Pe de o parte, sunt capabili să traducă documente cu mai multe pagini la viteză mare (o pagină pe secundă), pe de altă parte, să traducă pagini Web din mers, în timp real.

Sistemele de traducere pe calculator traduc texte pe baza „cunoștințelor” formale: sintaxa limbii (regulile de construire a propozițiilor), regulile de formare a cuvintelor și utilizarea dicționarelor. Programul de traducere analizează mai întâi textul într-o limbă și apoi construiește acest text într-o altă limbă.

Sistemele moderne de traducere pe computer fac posibilă traducerea documentației tehnice, a corespondenței de afaceri și a altor texte specializate cu o calitate suficientă. Cu toate acestea, ele nu sunt aplicabile traducerii operelor de artă, deoarece nu sunt capabile să traducă în mod adecvat metaforele, alegorii și alte elemente ale creativității artistice umane.

întrebări de testare

    1. Care sunt avantajele dicționarelor de calculator față de dicționarele tradiționale de hârtie?
    2. În ce cazuri este recomandabil să se utilizeze sisteme de traducere pe calculator?

sisteme OCR

Sisteme de recunoaștere optică a caracterelor. Sistemele optice de recunoaștere a caracterelor sunt utilizate în crearea de biblioteci și arhive electronice prin conversia cărților și documentelor într-un format de computer digital.

În primul rând, folosind un scaner, trebuie să obțineți o imagine a unei pagini de text în format grafic. În plus, pentru a obține un document într-un format text, este necesar să se efectueze recunoașterea textului, adică să se transforme elementele unei imagini grafice într-o secvență de caractere text.

Sistemele optice de recunoaștere a caracterelor determină mai întâi structura textului de pe pagină și o despart în zone separate: coloane, tabele, imagini etc. În continuare, fragmentele de text selectate ale imaginii grafice a paginii sunt împărțite în imagini cu caractere individuale.

Pentru documentele scanate de calitate tipografică (font suficient de mare, fără caractere sau corecții prost imprimate), recunoașterea caracterelor se realizează prin compararea acestora cu șabloanele bitmap.

Imaginea raster a fiecărui caracter este suprapusă succesiv pe modelele raster ale caracterelor stocate în memoria sistemului de recunoaștere optică. Rezultatul recunoașterii este un caracter al cărui model se potrivește cel mai bine cu imaginea (Fig. 3.16).

La recunoașterea documentelor cu o calitate scăzută a tipăririi (text dactilografiat, fax etc.), se utilizează o metodă de recunoaștere a caracterelor vectoriale. În imaginea de simbol recognoscibilă, primitivele geometrice (segmente, cercuri etc.) sunt selectate și comparate cu șabloanele de simbol vectorial. Ca rezultat, este selectat simbolul pentru care totalitatea tuturor primitivelor geometrice și locația lor se potrivește cel mai mult cu simbolul recunoscut (Fig. 3.17).

Sistemele optice de recunoaștere a caracterelor sunt „autoînvățate” (pentru fiecare document specific, creează setul adecvat de șabloane de caractere) și, prin urmare, viteza și calitatea recunoașterii unui document cu mai multe pagini crește treptat.

Odată cu apariția primului computer portabil Newton de la Apple în 1990, au început să fie create sisteme de recunoaștere a scrisului de mână. Astfel de sisteme convertesc textul scris pe ecranul unui computer de buzunar cu un stilou special într-un document text de computer.

Sisteme de recunoaștere optică a formei. La completarea documentelor de către un număr mare de persoane (de exemplu, atunci când un absolvent al unei școli susține un examen de stat unificat (USE)), se folosesc formulare cu câmpuri goale. Datele sunt introduse manual în câmpuri cu majuscule. Aceste date sunt apoi recunoscute folosind sisteme optice de recunoaștere a formei și introduse în bazele de date computerizate.

Dificultatea constă în faptul că este necesară recunoașterea caracterelor scrise de mână, care variază destul de mult de la persoană la persoană. În plus, astfel de sisteme trebuie să poată determina câmpul căruia îi aparține textul recunoscut.

întrebări de testare

    1. Care sunt diferențele în tehnologia de recunoaștere a textului când se utilizează metode raster și vectoriale?

Nr. 8. Codificarea informațiilor textuale.

# 9 Creați cărți de vizită dintr-un șablon.

Nr. 10. Setarea parametrilor paginii documentului, inserarea antetelor și subsolurilor și a numerelor de pagină.

Nr. 11. Introduceți formule în document.

Nr. 12. Formatați caractere și paragrafe.

Nr. 13. Crearea și formatarea listelor.

#14 Inserarea unui cuprins într-un document care conține titluri.

Nr. 15. Inserarea unui tabel într-un document, formatarea acestuia și completarea cu date.

Nr. 16. Crearea unui document hipertext.

Nr. 17. Traducerea textului folosind un dicționar de calculator.

Nr. 18. Scanarea și recunoașterea unui document text pe hârtie.

Concomitent cu utilizarea pe scară largă a noilor tehnologii informaționale, a apărut conceptul de „sistem informațional” (SI). Sistemul informatic colectează, transmite și prelucrează informații despre obiect, furnizând angajaților de diferite niveluri informații pentru implementarea funcției de management.

Sisteme juridice de referință computerizate (SPS) sunt baze de date care conțin documente normative care reglementează cele mai importante domenii ale relațiilor publice. Sistemele juridice de referință care există astăzi, după ce au trecut de o anumită înregistrare și certificare de stat, devin destul de accesibile potențialuluiutilizatorii (persoane juridice sau fizice), aceștia din urmă au posibilitatea, referitor la conținutul ATP, să elimine lacunele existente în domeniul cunoștințelor de natură juridică.

La mijlocul secolului XX. în toate ţările dezvoltate a început creşterea rapidă a informaţiei juridice. Numărul actelor legislative și alte acte normative juridice ajunge la sute de mii, ceea ce duce la apariția unei crize informaționale. Inițial, s-a crezut că SPS creează doar confort suplimentar atunci când lucrează cu informații și este foarte posibil să se facă fără utilizarea lor. Cu toate acestea, când a început revizuirea și restructurarea pe scară largă a întregii legislații rusești, a devenit imposibil să ținem evidența fluxului imens de reglementări nou adoptate. Prin urmare, până la jumătatea anului 1994, numărul potențialilor cumpărători de pachete software legale a crescut semnificativ.

Metodele tradiționale de obținere a informațiilor, de exemplu, utilizarea periodicelor sau a altor surse tipărite, nu au putut rezolva problema suportului juridic pentru toate părțile interesate. Computerul, pe de altă parte, era un mijloc minunat de acumulare, stocare și emitere a informațiilor legale.

Astăzi, majoritatea avocaților profesioniști apreciază oportunitatea de a obține cele mai complete informații de referință, informaționale și juridice. Ritmul accelerat al afacerilor și noile condiții economice au impus crearea unor sisteme informatice de referință juridică, care sunt baze de date juridice.

Sarcina principală a sistemelor juridice de referință este de a transmite cantitatea maximă de informații juridice fiabile unui număr maxim de utilizatori cu diferite niveluri de pregătire în domeniul calculatorului. În plus, sistemul trebuie să fie prevăzut cu actualizarea constantă a bazelor de date.

Sistemele juridice de referință informatice au o serie de proprietăți importante care le fac practic indispensabile atunci când se lucrează cu informații juridice.

În primul rând, aceasta este capacitatea de a lucra cu matrice uriașă de informații textuale - cantitatea de informații din baza de date este practic nelimitată, acest lucru vă permite să o actualizați zilnic prin adăugarea de câteva zeci de documente la aceasta, în timp ce stocați simultan baze de date de documente de arhivă etc. .

În al doilea rând, utilizarea unui software special de căutare în ATP vă permite să căutați în timp real pe întreaga bază de informații.

Cel de-al treilea avantaj este că posibilitatea de funcționare a SPS folosind mijloace de telecomunicații, de exemplu. folosind e-mail sau rețele globale, vă permite să actualizați bazele de informații și, în același timp, să nu pierdeți spațiu pe disc pe computerul utilizatorului. Cu toate acestea, trebuie remarcat faptul că modificările SPS cu baze de date locale sunt încă la cea mai mare cerere.

Informațiile juridice nu pot fi obținute dintr-o singură sursă, ceea ce duce la rândul său la necesitatea colectării de informații din teren. În acest sens, firmele de informatică non-statale și companiile care lansează pe piață versiuni electronice ale informațiilor juridice joacă un rol din ce în ce mai important în crearea Sistemului Național de Informații Juridice.

O gamă largă de sisteme informatice legale este un fenomen unic pe piața rusă de software de afaceri.

Oferirea organelor de drept cu informații legislative actualizate, complete și de încredere, informații despre modificările și completările aduse documentelor legale este una dintre priorități. Cu toate acestea, în fiecare zi, doar cele mai înalte autorități ale statului adoptă în medie câteva zeci de acte normative. În plus, munca eficientă necesită adesea prezența reglementărilor adoptate de entitățile constitutive ale Federației Ruse, precum și a documentelor departamentale.

În prezent, concurența între firme, producătorii de sisteme juridice de referință este în creștere, iar cererile utilizatorilor sunt în creștere. Dacă până de curând a fost suficient doar să găsiți documentul potrivit, astăzi este adesea necesar să urmăriți toate conexiunile posibile între documente, să obțineți clarificări, să pregătiți o prezentare generală asupra unui subiect de interes și să vă creați propria bază de date cu utilizatori. Bazele de informații sunt destul de voluminoase, conțin adesea documente unice, cu toate acestea, munca unui utilizator în masă cu astfel de sisteme este dificilă din cauza lipsei de canale eficiente pentru a susține actualizările bazei de date, întreținerea sistemului etc. Prin urmare, PCA comerciale, cum ar fi Consultant Plus, Garant, Codex, au primit o largă recunoaștere din partea utilizatorilor.

Sistemele juridice de referință pot fi comparate și evaluate în funcție de următoarele criterii:

  • gradul de autenticitate al documentelor față de original
  • prelucrarea juridică a documentelor
  • volumul băncii de informații; formarea bazei de utilizatori
  • viteza de căutare a bazei de date
  • relevanța informațiilor și promptitudinea primirii documentelor
  • posibilitatea de acces de la distanță la baza de date

Astfel, sistemele juridice de referință, fiind purtători de informații cu caracter juridic, permit eliminarea analfabetismului juridic, facilitează munca specialiștilor (avocați, contabili, manageri), multiplicându-și productivitatea muncii în rezolvarea problemelor juridice. Rezolvarea acestor probleme afectează semnificativ schimbarea realității juridice, îmbunătățirea acesteia și starea de legalitate.

Trimiteți-vă munca bună în baza de cunoștințe este simplu. Utilizați formularul de mai jos

Studenții, studenții absolvenți, tinerii oameni de știință care folosesc baza de cunoștințe în studiile și munca lor vă vor fi foarte recunoscători.

postat pe http://www.allbest.ru/

Introducere

1. Dicționare de calculator

2. Sisteme de traducere pe calculator

3. Sisteme de traducere automată

4 . Traducători online

Concluzie

Bibliografie

Introducere

Sistemele moderne de traducere pe computer ne permit să traducem documentația tehnică, corespondența de afaceri și alte texte specializate cu o calitate acceptabilă. Dar pe aceste sisteme nu se poate baza complet. Ele comit erori semantice și stilistice și nu sunt aplicabile, de exemplu, traducerii operelor de artă, deoarece nu sunt capabile să traducă în mod adecvat metaforele, alegorii și alte elemente ale creativității artistice umane etc.

Există modalități de a îmbunătăți rezultatele traducerii automate:

1. Înainte de a începe traducerea, trebuie să determinați tipul de text, adică din ce zonă a vieții umane este prezentat (economie, sport, știință etc.). La urma urmei, fiecare zonă are propriile sale nuanțe și termeni.

2. Greșelile de tipărire din textul tradus sunt adesea cauza unei traduceri incorecte. Acest lucru este valabil și pentru textele recunoscute. Cuvintele cu erori sunt marcate de traducători ca fiind nefamiliare, deoarece nu sunt în dicționare sub această formă. Mai rău, dacă există erori de punctuație - o virgulă plasată incorect poate distorsiona traducerea întregii propoziții.

3. Lucrați cu fragmente de text. Nu traduceți niciodată întregul text deodată. Acesta va conține întotdeauna cuvinte care nu sunt în dicționar și cele pe care sistemul nu le traduce corect.

Cu ajutorul programelor de traducere, puteți traduce cu succes documentația tehnică, corespondența de afaceri și alte materiale text scrise într-un limbaj „secat”. Traducerea textelor artistice, colorate emoțional, bogate în hiperbole, metafore etc., nu poate fi realizată în totalitate decât de o persoană.

Programe de traducere:

-cunoașterea a cel puțin unei limbi străine este necesară astăzi pentru toată lumea, precum aerul. Mai ales pentru utilizatori: la urma urmei, este imposibil să evitați o coliziune cu limba engleză atunci când lucrați la un computer.

- programele specializate de traducere instalate pe computer pot ajuta.

Un dicționar este o parte integrantă a bibliotecii fiecărei persoane inteligente. Sunt folosite și de cei mai curioși copii. Iar profesorii și lectorii spun că gâtul dicționarului „din nimic de făcut” este un lucru foarte util. Nici un elev, nici un școlar, nici măcar un om de știință nu se poate descurca fără ele. Specialiștii din diverse domenii caută adesea în dicționare mii de întrebări. Chiar și traducătorii foarte buni pun câteva dicționare pe masă înainte de muncă.

traducere dicționar computer internet

1 . Dicționare de calculator

Dicționare de calculator. Dicționarele sunt necesare pentru a traduce texte dintr-o limbă în alta. Primele dicționare au fost create cu aproximativ 5 mii de ani în urmă în Sumer și erau tăblițe de lut împărțite în două părți. Într-o parte, un cuvânt a fost scris în limba sumeriană, iar în cealaltă, un cuvânt cu un sens similar într-o altă limbă, uneori cu explicații scurte.

Dicționarele și o carte electronică s-au dovedit a fi foarte interconectate între ele - recent un dicționar de computer a învățat să caute, să găsească și să pronunțe în mod independent cuvântul dorit. Uneori va fi util altor membri ai familiei atunci când traduc un e-mail de la un prieten din străinătate sau orice instrucțiuni pentru tehnică.

Dicționarele moderne sunt construite pe același principiu. În prezent, există mii de dicționare pentru traducerea între sute de limbi (engleză-rusă, germană-franceză etc.), fiecare dintre acestea putând conține zeci de mii de cuvinte. În versiunea pe hârtie, dicționarul este o carte groasă, cu sute de pagini, în care căutarea cuvântului potrivit este un proces destul de laborios.

Dicționarele computerizate pot conține traduceri a sute de mii de cuvinte și expresii în diferite limbi și, de asemenea, oferă utilizatorului funcții suplimentare:

§ *există dicționare de computer multilingve care permit utilizatorului să selecteze limbile și direcția de traducere (de exemplu, engleză-rusă, spaniolă-rusă etc.);

§ *dicționarele informatice pot conține, pe lângă dicționarul principal de cuvinte de uz curent, zeci de dicționare de specialitate din domenii de cunoaștere (tehnologie, medicină, informatică etc.);

§ *dicționarele de calculator oferă o căutare rapidă a intrărilor de dicționar: „tastare rapidă”, când apare o listă de cuvinte similare în procesul de tastare a unui cuvânt; acces la cuvintele utilizate frecvent prin marcaje; capacitatea de a introduce fraze etc.;

§ dicţionarele de calculator pot fi multimedia, adică oferă utilizatorului posibilitatea de a asculta cuvinte interpretate de vorbitori, vorbitori nativi;

* dicționarele online de calculator de pe Internet oferă o alegere de dicționar tematic și direcția de traducere.

Caracteristici suplimentare ale dicționarelor de calculator

· În primul rând, dicționarele de computer pot fi multilingve, deoarece permit utilizatorului să selecteze limbile și direcția de traducere (de exemplu, engleză-rusă, spaniolă-rusă și așa mai departe).

· În al doilea rând, dicţionarele informatice pot conţine, pe lângă dicţionarul principal de cuvinte uzuale, zeci de dicţionare de specialitate din domenii de cunoaştere (tehnologie, medicină, informatică etc.).

· În al treilea rând, dicționarele de calculator oferă o căutare rapidă a intrărilor de dicționar: „tastare rapidă”, când apare o listă de cuvinte similare în procesul de tastare a unui cuvânt; acces la cuvintele utilizate frecvent prin marcaje; capacitatea de a introduce fraze etc.

· Al patrulea, dicționarele de calculator pot fi multimedia, adică oferă utilizatorului posibilitatea de a asculta cuvintele executate de vorbitori, vorbitori nativi.

2 . Sisteme de traducere pe calculator

Globalizarea actuală a lumii noastre duce la necesitatea schimbului de documente între oameni și organizații situate în diferite țări ale lumii și care vorbesc diferite limbi.

În aceste condiții, utilizarea tehnologiei tradiționale de traducere manuală împiedică dezvoltarea contactelor interetnice. Traducerea manuală a documentației cu mai multe pagini durează mult. Traducerea unui mesaj de e-mail sau a unei pagini Web vizualizate într-un browser trebuie făcută „aici și acum”, și nu există nicio oportunitate și timp pentru a invita un traducător.

Sistemele de traducere pe calculator permit rezolvarea acestor probleme. Pe de o parte, sunt capabili să traducă documente cu mai multe pagini la viteză mare (o pagină pe secundă), pe de altă parte, să traducă pagini Web din mers, în timp real.

Sistemele de traducere computerizată traduc texte pe baza „cunoașterii” formale a limbii: sintaxa limbii (regulile de construire a propozițiilor), regulile de formare a cuvintelor și utilizarea dicționarelor. Programul de traducere analizează mai întâi textul într-o limbă și apoi construiește acest text într-o altă limbă.

Traducătorii online de computer de pe Internet oferă o alegere de dicționar tematic și direcția de traducere. Acestea vă permit să traduceți orice text tastat în fereastra de traducere sau copiat din clipboard, pagini Web, inclusiv hyperlinkuri, păstrând în același timp formatarea originală, precum și e-mailurile.

Un avantaj fără precedent al acestui tip de dicționare este prețul și comoditatea acestuia: se potrivesc pe aproape orice suport, de la un CD la o unitate flash.

Traducătorii sunt utilizați pentru a traduce documente text. Ele se bazează pe o cunoaștere formală a limbii - regulile de formare a cuvintelor și regulile de construire a propozițiilor.

3. Sisteme de traducere automată

· Sistemele de traducere automată vă permit să rezolvați problemele de traducere rapidă a documentației cu mai multe pagini.

· Pe de o parte, sunt capabili să traducă documente cu mai multe pagini la viteză mare (o pagină pe secundă) și, pe de altă parte, să traducă pagini Web din mers, în timp real. PROMT și Socrates sunt considerate cele mai bune dintre sistemele de traducere automată rusă.

Domeniul de aplicare al sistemelor de traducere automată

· Sistemele de traducere automată traduc texte pe baza „cunoașterii” formale a limbii (sintaxa limbii – regulile de construire a propozițiilor, regulile de formare a cuvintelor) și utilizarea dicționarelor. Programul de traducere analizează mai întâi textul într-o limbă și apoi construiește acest text într-o altă limbă.

· Sistemele moderne de traducere automată permit traducerea documentației tehnice, a corespondenței de afaceri și a altor texte specializate cu o calitate suficientă. Cu toate acestea, ele nu sunt aplicabile traducerii operelor de artă, deoarece nu sunt capabile să traducă în mod adecvat metaforele, alegorii și alte elemente ale creativității artistice umane.

Parametrii traducătorilor automati trebuie să îndeplinească patru cerințe de bază:

· eficienţă

flexibilitate

· viteza

· precizie

Eficiența constă în posibilitatea actualizării constante a vocabularului și a secțiunilor tematice.

Flexibilitatea este adaptată unui domeniu specific.

Viteză - capacitatea de a introduce și procesa automat informații text de pe hârtie. Un astfel de sistem (OCR-System) înlocuiește mai mult de zece dactilografe cu experiență în fiecare zi.

Acuratețea constă în alfabetizare și transferul adecvat al sensului textului tradus în limba țintă.

Cu ajutorul programelor de traducere, puteți traduce cu succes documentația tehnică, corespondența comercială și alte materiale text scrise într-un limbaj „secat”. Traducerea textelor artistice, colorate emoțional, bogate în hiperbole, metafore etc., nu poate fi realizată în totalitate decât de o persoană. Programul de traducere analizează mai întâi textul în limba sursă și apoi construiește acest text în limba în care urmează să fie tradus.

4 . Traducători online

De asemenea, odată cu dezvoltarea World Wide Web, au fost create și funcționează așa-numitele dicționare online (engleză on-line - în timp real) sau traducători.

Traducătorul de text online acceptă instrucțiuni de traducere pentru următoarele limbi:

ucrainean

· Rusă

· Engleză

Lustrui

· Deutsch

letonă

· Limba franceza

Introducerea textului și selectarea direcției de traducere.

Textul sursă trebuie introdus sau copiat în fereastra de sus și selectați direcția de traducere din meniul derulant. De exemplu, pentru o traducere rusă-ucraineană, trebuie să introduceți textul în rusă în fereastra de sus și să selectați „rusă” din meniul derulant, apoi „ucraineană”. Apoi, apăsați butonul Traducere.

Dicționare de specialitate

Dacă textul sursă care urmează să fie tradus aparține unei anumite industrii, selectați subiectul unui vocabular specializat din lista derulantă, de exemplu, Afaceri, Internet, Drept, Muzică și altele. Implicit este un dicționar de vocabular general.

Verificarea ortografiei

Calitatea traducerii depinde de scrierea corectă a textului sursă. Vă sfătuim să utilizați Verificarea ortografică. Verificarea ortografică funcționează pentru limbile ucraineană, rusă și engleză.

Transliterare

Atunci când corespondați cu un destinatar care nu are instalat chirilic, puteți utiliza transliterarea. Transliterarea acceptă limbile rusă și ucraineană și translitera atât din latină în chirilic, cât și din chirilic în latină.

Tastatura virtuala

Dacă aspectul necesar nu este disponibil pe computer, utilizați tastatura virtuală. Tastatura virtuală este oferită pentru rusă, ucraineană, engleză, germană, franceză, spaniolă și italiană.

Concluzie

Cel mai important lucru:

§ Capacitățile computerelor moderne de stocare a unor cantități mari de informații și de efectuare a căutărilor rapide în ele stau la baza dezvoltării dicționarelor de calculator și a programelor de traducere. Dicționarele de calculator traduc cuvinte și expresii individuale. Traducătorii sunt utilizați pentru a traduce documente text.

§ Capacitățile computerelor moderne de a stoca cantități mari de date și de a efectua căutări rapide în ele formează baza dezvoltării dicționarelor de calculator și a programelor de traducere.

§ Într-un dicționar tipic care conține câteva sute de pagini, căutarea cuvântului potrivit este un proces lung și laborios. Dicționarele computerizate oferă căutare instantanee pentru intrări de dicționar. Multe dicționare oferă utilizatorilor posibilitatea de a asculta cuvinte interpretate de vorbitori nativi.

§ Dicționarele de calculator (rusă-engleză și engleză-rusă, rusă-franceză, rusă-germană etc.) pot fi instalate pe un computer ca programe independente, sunt integrate în procesoare de text, există online pe Internet.

§ Dicționarele de calculator traduc cuvinte și expresii individuale. Traducătorii sunt utilizați pentru a traduce documente text. Ele se bazează pe o cunoaștere formală a limbii - regulile de formare a cuvintelor și regulile de construire a propozițiilor. Programul de traducere analizează mai întâi textul în limba sursă și apoi construiește acest text în limba în care urmează să fie tradus.

Bibliografie

1. Lecție pe tema: „Traducere pe computer”, Malakhova N.P., Yuzhnogorsk.

2. Vasiliev. A. Computer în loc de traducător // Submarin. - Nr. 6.

3. Sistem de traducere text PROMT Internet. Manualul utilizatorului. -- Sankt Petersburg: PROMT.

4. traduce.meta.ua

Găzduit pe Allbest.ru

...

Documente similare

    Istoria traducerii automate. Programe moderne de traducere pe calculator. Domeniul de aplicare al traducerii automate. Forme de organizare a interacțiunii om-calculator în traducerea automată. Intereditare și post-editare traducere automată.

    lucrare de termen, adăugată 19.06.2015

    Programe specializate de traducere. Posibilitățile dicționarelor de calculator. Probleme de traducere a documentației cu mai multe pagini. Principii pe care sunt construite dicționarele computerizate. Ce texte nu sunt potrivite pentru a traduce cu ajutorul traducătorilor pe calculator.

    prezentare, adaugat 13.11.2010

    Cercetarea tehnologiilor moderne de traducere automată. Studierea clasificării sistemelor de traducere. Caracteristicile caracteristicilor lucrului cu un dicționar electronic. Instrumente lingvistice Google. Programe de verificare a ortografiei și gramaticii, editori de text.

    rezumat, adăugat 02.11.2014

    Istoria apariției, evoluția traducerii automate. Cerințe de bază pentru echivalența comunicativă. Secvența operațiilor formale în sistemul de traducere automată, conceptele sale de dezvoltare. Traducător de birou. Avantajele dicționarelor electronice.

    prezentare, adaugat 22.10.2013

    Istoria mondială a tehnologiei de traducere automată ca o clasă de sisteme de inteligență artificială. Clasificarea programelor de traducător online, suport pentru funcția controlată a limbajului de intrare. Browsere de internet multilingve și o listă de dicționare electronice.

    test, adaugat 02.03.2011

    Sisteme informatice de predare. Principiile noilor tehnologii informaţionale ale educaţiei. Tipuri de programe de formare. Activarea învățării. Testarea calculatorului. Cercetare promițătoare în învățarea pe calculator. Tehnologii Internet, multimedia.

    test, adaugat 09.10.2008

    Programe de traducere asistată de calculator: dicționare electronice, instrumente-aplicații, sistem Memorie de traducere, software de editare. Analiza utilizării programelor CAT în practică. Efectuarea de traduceri cu traducători Wordfast și Promt.

    lucrare de termen, adăugată 11.10.2011

    Numerele întregi în sistemele de numere poziționale. Dezavantajele sistemului binar. Dezvoltarea algoritmilor, structurilor de date. Implementarea software a algoritmilor de traducere în diverse sisteme numerice în limbajul de programare C. Testare software.

    lucrare de termen, adăugată 01.03.2015

    Traducerea este procesul de creare a unui text echivalent comunicativ într-o altă limbă pe baza textului sursă într-o limbă, cerințele pentru asigurarea echivalenței acestuia. Tehnologii de traducere automată; caracteristicile sistemelor de memorie de traducere.

    prezentare, adaugat 01.06.2014

    Un program de calculator este o secvență de instrucțiuni concepute pentru a fi executate de un dispozitiv de control al computerului. Analiza standardelor de traducere pentru texte de jocuri pe calculator. Luarea în considerare a caracteristicilor traducerii IT, exemple de erori grave.

În prezent, există trei tipuri de sisteme de traducere automată:

Sisteme bazate pe reguli gramaticale (Rule-Based Machine Translation, RBMT);

Sisteme statistice (Statistical Machine Translation, SMT);

sisteme hibride;

Sistemele bazate pe gramatică analizează textul care este utilizat în procesul de traducere. Traducerea se face pe baza dicționarelor încorporate pentru o anumită pereche de limbi, precum și a gramaticilor care acoperă modelele semantice, morfologice și sintactice ale ambelor limbi. Pe baza tuturor acestor date, textul sursă este transformat secvenţial, propoziţie cu propoziţie, în text în limba cerută. Principiul de bază al funcționării unor astfel de sisteme este legătura dintre structurile sursă și textele finale.

Sistemele bazate pe reguli gramaticale sunt adesea împărțite în alte trei subgrupe - sisteme de traducere cuvânt cu cuvânt, sisteme de transfer și sisteme interlingvistice.

Avantajele sistemelor bazate pe reguli gramaticale sunt acuratețea gramaticală și sintactică, stabilitatea rezultatului și capacitatea de a se adapta la un anumit domeniu. Dezavantajele sistemelor bazate pe reguli gramaticale includ necesitatea creării, menținerii și actualizării bazelor de date lingvistice, complexitatea creării unui astfel de sistem, precum și costul ridicat al acestuia.

Sistemele statistice în activitatea lor utilizează analiza statistică. În sistem este încărcat un corpus de texte bilingv (conținând o cantitate mare de text în limba sursă și traducerea „manuală” a acestuia în limba cerută), după care sistemul analizează statisticile corespondențelor interlingve, construcțiile sintactice etc. sistemul este de auto-învățare - atunci când alegeți o opțiune de traducere, se bazează pe statisticile anterioare. Cu cât vocabularul dintr-o pereche de limbi este mai mare și cu cât este mai precis, cu atât este mai bun rezultatul traducerii automate statistice. Cu fiecare nou text tradus, calitatea traducerilor ulterioare se îmbunătățește.

Sistemele statistice sunt rapid de configurat și ușor de adăugat noi direcții de traducere. Dintre deficiențe, cele mai semnificative sunt prezența a numeroase erori gramaticale și instabilitatea traducerii.

Sistemele hibride combină abordările descrise mai devreme. Este de așteptat ca sistemele hibride de traducere automată să combine toate avantajele pe care le au sistemele statistice și sistemele bazate pe reguli.

1.3 Clasificarea sistemelor de traducere automată

Sistemele de traducere automată sunt programe care realizează traduceri complet automatizate. Criteriul principal al programului este calitatea traducerii. În plus, puncte importante pentru utilizator sunt confortul interfeței, ușurința integrării programului cu alte instrumente de procesare a documentelor, alegerea subiectelor și utilitatea de completare a dicționarului. Odată cu apariția Internetului, marii furnizori de traduceri automate au încorporat interfețe Web în produsele lor, integrându-le în același timp cu alte programe software și e-mail, permițând ca MT să fie utilizat pentru a traduce pagini Web, e-mail și conversații online.

Noii membri ai forumului de limbi străine CompuServe întreabă adesea dacă cineva poate recomanda un program bun de traducere automată la un preț rezonabil.

Răspunsul la această întrebare este invariabil „nu”. În funcție de respondent, răspunsul poate conține două argumente principale: fie că automatele nu pot traduce, fie că traducerea automată este prea scumpă.

Ambele argumente sunt valabile într-o anumită măsură. Cu toate acestea, răspunsul este departe de a fi atât de simplu. Când studiem problema traducerii automate (MT), este necesar să luăm în considerare separat diferitele subsecțiuni ale acestei probleme. Următoarea diviziune se bazează pe prelegerile lui Larry Childs susținute la Conferința Internațională de Comunicare Tehnică din 1990:

Traducere complet automată;

Traducere automată automată cu participare umană;

Traducerea efectuată de o persoană folosind un computer.

Traducere automată complet automatizată. Acest tip de traducere automată este ceea ce se referă majoritatea oamenilor când vorbesc despre traducerea automată. Semnificația aici este simplă: textul într-o limbă este introdus în computer, acest text este procesat și computerul scoate același text într-o altă limbă. Din păcate, implementarea acestui tip de traducere automată se confruntă cu anumite obstacole care nu au fost încă depășite.

Problema principală este complexitatea limbii în sine. Luați, de exemplu, semnificațiile cuvântului „poate”. Pe lângă sensul principal al verbului auxiliar modal, cuvântul „poate” are mai multe semnificații oficiale și argotice ca substantiv: „bancă”, „latrină”, „închisoare”. În plus, există un sens arhaic al acestui cuvânt - „a cunoaște sau a înțelege”. Presupunând că limba țintă are un cuvânt separat pentru fiecare dintre aceste valori, cum poate un computer să le deosebească?

După cum se dovedește, s-au făcut unele progrese în dezvoltarea programelor de traducere care discriminează sensul în funcție de context. Studiile mai recente în analiza textelor se bazează mai mult pe teoria probabilității. Cu toate acestea, traducerea automată complet automatizată a textelor cu subiecte extinse este încă o sarcină imposibilă.

Traducere automată automată cu participare umană. Acest tip de traducere automată este acum destul de fezabilă. Vorbind despre traducerea automată cu participarea unei persoane, de obicei se referă la editarea textelor atât înainte, cât și după ce acestea sunt procesate de un computer. Traducătorii umani schimbă textele astfel încât să poată fi înțelese de mașini. După ce computerul a făcut traducerea, oamenii editează din nou traducerea automată brută, făcând textul în limba țintă corect. Pe lângă această ordine de lucru, există sisteme MT care necesită prezența constantă a unui traducător uman în timpul traducerii pentru a ajuta computerul să traducă structuri deosebit de complexe sau ambigue.

Traducerea automată asistată de om este aplicabilă într-o măsură mai mare textelor cu un vocabular limitat de subiecte limitate.

Economia utilizării traducerii automate asistate de oameni este încă discutabilă. Programele în sine sunt de obicei destul de scumpe, iar unele dintre ele necesită echipamente speciale pentru a funcționa. Editarea pre și post trebuie învățată și nu este o muncă plăcută. Crearea și întreținerea bazelor de date cu cuvinte este un proces laborios și necesită adesea abilități speciale. Cu toate acestea, pentru o organizație care traduce volume mari de texte într-un domeniu bine definit, traducerea automată asistată de oameni poate fi o alternativă destul de rentabilă la traducerea umană tradițională.

Traducerea efectuată de o persoană folosind un computer. Prin această abordare, traducătorul uman este plasat în centrul procesului de traducere, în timp ce programul de calculator este privit ca un instrument care face procesul de traducere mai eficient și traducerea mai precisă. Acestea sunt dicționare electronice obișnuite care oferă o traducere a cuvântului solicitat, făcând persoana responsabilă pentru alegerea opțiunii potrivite și a sensului textului tradus. Astfel de dicționare facilitează foarte mult procesul de traducere, dar necesită utilizatorului să aibă o anumită cunoaștere a limbii și să petreacă timp implementării acesteia. Și totuși, procesul de traducere în sine este foarte accelerat și facilitat.

Dintre sistemele care ajută traducătorul în munca sa, locul cel mai important îl ocupă așa-numitele sisteme Translation Memory (TM).Sistemele TM sunt un instrument interactiv pentru acumularea de perechi de segmente de text echivalente în limba originală și traducerea într-un baza de date cu posibilitatea de căutare și editare ulterioară a acestora. Aceste produse software nu sunt destinate să utilizeze tehnologii informaționale extrem de inteligente, ci, dimpotrivă, se bazează pe utilizarea potențialului creativ al traducătorului. În procesul de lucru, traducătorul însuși formează baza de date (sau o primește de la alți traducători sau de la client), iar cu cât conține mai multe unități, cu atât este mai mare profitul din utilizarea ei.

Iată o listă cu cele mai cunoscute sisteme TM:

Compania elvețiană de tranzit Star,

Trados (SUA),

Manager de traduceri de la IBM,

Eurolang Optimizer al companiei franceze LANT,

DejaVu de la ATRIL (SUA),

WordFisher (Ungaria).

Sistemele TM fac posibilă excluderea traducerii repetate a fragmentelor de text identice. Traducerea unui segment este efectuată de traducător o singură dată, iar apoi fiecare segment ulterior este verificat pentru o potrivire (complet sau neclar) cu baza de date, iar dacă se găsește un segment identic sau similar, atunci acesta este oferit ca traducere opțiune.

În prezent, sunt în curs de dezvoltare pentru îmbunătățirea sistemelor TM. De exemplu, nucleul sistemului Star’s Transit se bazează pe tehnologia rețelelor neuronale.

În ciuda gamei largi de sisteme TM, acestea au câteva caracteristici comune:

Funcția de aliniere. Unul dintre avantajele sistemelor TM este capacitatea de a folosi materiale deja traduse pe această temă. Baza de date TM poate fi obținută prin compararea segment cu segment a fișierelor originale și de traducere.

Disponibilitatea filtrelor de import-export. Această proprietate asigură compatibilitatea sistemelor TM cu o varietate de procesoare de text și sisteme de publicare și oferă traducătorului o relativă independență față de client.

Mecanism de căutare a potrivirilor neclare sau complete. Acest mecanism reprezintă principalul avantaj al sistemelor TM. Dacă, la traducerea unui text, sistemul întâlnește un segment identic sau apropiat de cel tradus anterior, atunci segmentul deja tradus este oferit traducătorului ca variantă a traducerii segmentului curent, care poate fi corectat. Gradul de potrivire neclară este stabilit de utilizator.

Suport pentru dicționare tematice. Această caracteristică îl ajută pe traducător să respecte glosarul. De regulă, dacă un segment tradus conține un cuvânt sau o expresie dintr-un dicționar tematic, acesta este evidențiat color și este oferită traducerea acestuia, care poate fi introdusă automat în textul tradus.

Mijloace de căutare a fragmentelor de text. Acest instrument este foarte util atunci când editați o traducere. Dacă în procesul de lucru a fost găsită o versiune mai reușită a traducerii oricărui fragment al textului, atunci acest fragment poate fi găsit în toate segmentele TM, după care se efectuează secvenţial modificările necesare la segmentele TM.

Desigur, ca orice produs software, sistemele TM au avantajele și dezavantajele lor, precum și domeniul lor. Cu toate acestea, în ceea ce privește sistemele TM, principalul dezavantaj este costul lor ridicat.

Este deosebit de convenabil să utilizați sisteme TM atunci când traduceți documente precum manuale de utilizare, instrucțiuni de operare, documentație de proiectare și afaceri, cataloage de produse și alte documente de același tip cu un număr mare de potriviri.