Computerwörterbücher und Systeme zur maschinellen Übersetzung von Texten. Unterrichtsablauf zum Thema: MDK-Lektion „Maschinelle Übersetzungssysteme und Computerwörterbücher“

Computerwörterbücher und maschinelle Übersetzungssysteme

Computerwörterbücher. Wörterbücher werden benötigt, um Texte von einer Sprache in eine andere zu übersetzen. Es gibt Tausende von Wörterbüchern zum Übersetzen zwischen Hunderten von Sprachen (Englisch-Russisch, Deutsch-Französisch usw.), und jedes von ihnen kann Zehntausende von Wörtern enthalten. In der Papierversion ist das Wörterbuch ein dickes Buch mit Hunderten von Seiten, in dem die Suche nach dem richtigen Wort ein ziemlich langer und mühsamer Prozess ist.

Computerwörterbücher können Übersetzungen von Hunderttausenden von Wörtern und Sätzen in verschiedene Sprachen enthalten und dem Benutzer auch zusätzliche Funktionen bieten. Erstens können Computerwörterbücher mehrsprachig sein, sodass der Benutzer die Sprache und die Übersetzungsrichtung auswählen kann (z. B. Englisch-Russisch, Spanisch-Russisch usw.).

Zweitens können Computerwörterbücher neben dem Hauptwörterbuch für häufig verwendete Wörter Dutzende von Fachwörterbüchern in Wissensgebieten (Technik, Medizin, Informatik usw.) enthalten.

Drittens bieten Computerwörterbücher eine schnelle Suche nach Wörterbucheinträgen: "schnelles Tippen", wenn eine Liste ähnlicher Wörter beim Eintippen eines Wortes erscheint; Zugriff auf häufig verwendete Wörter durch Lesezeichen; die Möglichkeit, Phrasen usw. einzugeben

Viertens können Computerwörterbücher multimedial sein, d. h. dem Benutzer die Möglichkeit geben, Wörter anzuhören, die von Sprechern, Muttersprachlern, vorgetragen werden.

Computerübersetzungssysteme. Der Prozess der Globalisierung der Welt führt zu der Notwendigkeit eines häufigen Austauschs von Dokumenten zwischen Personen und Organisationen, die sich in verschiedenen Ländern der Welt befinden und verschiedene Sprachen sprechen.

Unter diesen Bedingungen behindert die Verwendung traditioneller "manueller" Übersetzungstechnologie die Entwicklung interethnischer Kontakte. Die manuelle Übersetzung mehrseitiger Dokumentationen erfordert viel Zeit und hohe Löhne für Übersetzer. Die Übersetzung einer empfangenen E-Mail oder einer in einem Browser angezeigten Webseite muss dringend erledigt werden, und es ist keine Zeit, einen Übersetzer einzuladen.

Computerübersetzungssysteme ermöglichen die Lösung dieser Probleme. Einerseits sind sie in der Lage, mehrseitige Dokumente mit hoher Geschwindigkeit (eine Seite pro Sekunde) zu übersetzen, andererseits können sie Webseiten on-the-fly in Echtzeit übersetzen.

Computerübersetzungssysteme übersetzen Texte auf der Grundlage von formalem „Wissen“: der Syntax der Sprache (den Regeln für den Satzbau), den Regeln der Wortbildung und der Verwendung von Wörterbüchern. Das Übersetzerprogramm analysiert zuerst den Text in einer Sprache und konstruiert diesen Text dann in einer anderen Sprache.

Moderne Computerübersetzungssysteme ermöglichen es, technische Dokumentationen, Geschäftskorrespondenz und andere Fachtexte in ausreichender Qualität zu übersetzen. Sie sind jedoch nicht auf die Übersetzung von Kunstwerken anwendbar, da sie nicht in der Lage sind, Metaphern, Allegorien und andere Elemente des menschlichen künstlerischen Schaffens angemessen zu übersetzen.

Testfragen

    1. Welche Vorteile haben Computerwörterbücher gegenüber herkömmlichen Papierwörterbüchern?
    2. In welchen Fällen ist der Einsatz von Computerübersetzungssystemen ratsam?

OCR-Systeme

Systeme zur optischen Zeichenerkennung. Optische Zeichenerkennungssysteme werden bei der Erstellung elektronischer Bibliotheken und Archive verwendet, indem Bücher und Dokumente in ein digitales Computerformat umgewandelt werden.

Zuerst müssen Sie mit einem Scanner ein Bild einer Textseite im Grafikformat erhalten. Um ein Dokument in einem Textformat zu erhalten, ist es außerdem notwendig, eine Texterkennung durchzuführen, d. h. die Elemente eines graphischen Bildes in eine Folge von Textzeichen umzuwandeln.

Optische Zeichenerkennungssysteme bestimmen zuerst die Struktur des Textes auf der Seite und unterteilen ihn in separate Bereiche: Spalten, Tabellen, Bilder usw. Als nächstes werden die ausgewählten Textfragmente des grafischen Bildes der Seite in Bilder einzelner Zeichen unterteilt.

Bei gescannten Dokumenten in typografischer Qualität (ausreichend große Schrift, keine schlecht gedruckten Zeichen oder Korrekturen) erfolgt die Zeichenerkennung durch Vergleich mit Bitmap-Vorlagen.

Das Rasterbild jedes Zeichens wird sukzessive den Rastermustern von Zeichen überlagert, die im Speicher des optischen Erkennungssystems gespeichert sind. Das Ergebnis der Erkennung ist ein Zeichen, dessen Muster dem Bild am nächsten kommt (Abb. 3.16).

Bei der Erkennung von Dokumenten mit geringer Druckqualität (maschinengeschriebener Text, Fax usw.) wird ein Vektorzeichenerkennungsverfahren verwendet. In dem erkennbaren Symbolbild werden geometrische Grundelemente (Segmente, Kreise usw.) ausgewählt und mit Vektorsymbolvorlagen verglichen. Als Ergebnis wird das Symbol ausgewählt, bei dem die Gesamtheit aller geometrischen Grundelemente und deren Lage dem erkannten Symbol am ehesten entspricht (Abb. 3.17).

Optische Zeichenerkennungssysteme sind "selbstlernend" (sie erstellen für jedes spezifische Dokument den geeigneten Satz von Zeichenvorlagen), und daher nimmt die Geschwindigkeit und Qualität der Erkennung eines mehrseitigen Dokuments allmählich zu.

Mit dem Aufkommen von Apples erstem Newton-Handheld-Computer im Jahr 1990 begann die Entwicklung von Handschrifterkennungssystemen. Solche Systeme wandeln mit einem speziellen Stift auf dem Bildschirm eines Taschencomputers geschriebenen Text in ein Textcomputerdokument um.

Optische Formerkennungssysteme. Beim Ausfüllen von Dokumenten durch eine große Anzahl von Personen (z. B. wenn ein Absolvent einer Schule ein einheitliches Staatsexamen (USE) ablegt) werden Formulare mit leeren Feldern verwendet. Daten werden in Druckbuchstaben von Hand in die Felder eingetragen. Diese Daten werden dann mit optischen Formerkennungssystemen erkannt und in Computerdatenbanken eingegeben.

Die Schwierigkeit liegt darin, dass handschriftliche Zeichen erkannt werden müssen, die von Person zu Person sehr unterschiedlich sind. Außerdem müssen solche Systeme feststellen können, zu welchem ​​Feld der erkannte Text gehört.

Testfragen

    1. Was sind die Unterschiede in der Texterkennungstechnologie bei der Verwendung von Raster- und Vektorverfahren?

Nr. 8. Kodierung von Textinformationen.

#9 Erstellen Sie Visitenkarten aus einer Vorlage.

Nr. 10. Festlegen der Seitenparameter des Dokuments, Einfügen von Kopf- und Fußzeilen und Seitenzahlen.

Nr. 11. Fügen Sie Formeln in das Dokument ein.

Nr. 12. Zeichen und Absätze formatieren.

Nr. 13. Erstellen und Formatieren von Listen.

#14 Inhaltsverzeichnis in ein Dokument einfügen, das Überschriften enthält.

Nr. 15. Eine Tabelle in ein Dokument einfügen, formatieren und mit Daten füllen.

Nr. 16. Erstellen eines Hypertext-Dokuments.

Nr. 17. Textübersetzung mit einem Computerwörterbuch.

Nr. 18. Scannen und Erkennen eines Papiertextdokuments.

Gleichzeitig mit der weit verbreiteten Nutzung neuer Informationstechnologien tauchte das Konzept des "Informationssystems" (IS) auf. Das Informationssystem sammelt, übermittelt und verarbeitet Informationen über das Objekt und versorgt Mitarbeiter verschiedener Ebenen mit Informationen zur Umsetzung der Managementfunktion.

Rechtssysteme für Computerreferenzen (SPS) sind Datenbanken mit normativen Dokumenten, die die wichtigsten Bereiche der Öffentlichkeitsarbeit regeln. Die heute existierenden rechtlichen Referenzsysteme werden nach einer gewissen staatlichen Registrierung und Zertifizierung für Potenziale gut zugänglichNutzer (juristische oder natürliche Personen) haben letztere die Möglichkeit, unter Bezugnahme auf die Inhalte der ATP, bestehende Wissenslücken rechtlicher Natur zu beseitigen.

In der Mitte des 20. Jahrhunderts. In allen entwickelten Ländern begann das schnelle Wachstum von Rechtsinformationen. Die Zahl der legislativen und anderen normativen Rechtsakte erreicht Hunderttausende, was zur Entstehung einer Informationskrise führt. Anfänglich wurde angenommen, dass SPS nur zusätzlichen Komfort bei der Arbeit mit Informationen schaffen und auf deren Verwendung durchaus verzichtet werden kann. Als jedoch die groß angelegte Überarbeitung und Umstrukturierung der gesamten russischen Gesetzgebung begann, wurde es unmöglich, den enormen Strom neu verabschiedeter Vorschriften zu verfolgen. Daher stieg die Zahl potenzieller Käufer legaler Softwarepakete Mitte 1994 erheblich an.

Herkömmliche Methoden der Informationsbeschaffung, beispielsweise die Nutzung von Zeitschriften oder anderen gedruckten Quellen, konnten das Problem der rechtlichen Unterstützung für alle Beteiligten nicht lösen. Der Computer hingegen war ein wunderbares Mittel, um Rechtsinformationen zu sammeln, zu speichern und herauszugeben.

Heutzutage schätzt die Mehrheit der Berufsanwälte die Möglichkeit, möglichst vollständige Referenz-, Informations- und Rechtsinformationen zu erhalten. Das beschleunigte Geschäftstempo und die neuen Geschäftsbedingungen erforderten die Schaffung von Computer-Rechtsreferenzsystemen, bei denen es sich um Rechtsdatenbanken handelt.

Die Hauptaufgabe von Referenzrechtssystemen besteht darin, ein Maximum an zuverlässigen Rechtsinformationen an eine maximale Anzahl von Benutzern mit unterschiedlichen Computerkenntnissen zu übermitteln. Außerdem muss das System mit einer ständigen Aktualisierung der Datenbanken versehen sein.

Computer-Referenz-Rechtssysteme haben eine Reihe wichtiger Eigenschaften, die sie bei der Arbeit mit juristischen Informationen praktisch unverzichtbar machen.

Erstens ist dies die Möglichkeit, mit riesigen Mengen an Textinformationen zu arbeiten - die Menge an Informationen in der Datenbank ist praktisch unbegrenzt. Dies ermöglicht Ihnen, sie täglich zu aktualisieren, indem Sie ihr mehrere Dutzend Dokumente hinzufügen, während Sie gleichzeitig Datenbanken mit Archivdokumenten usw. speichern .

Zweitens ermöglicht der Einsatz spezieller Suchsoftware im ATP die Suche in Echtzeit über die gesamte Informationsbasis.

Der dritte Vorteil liegt darin, dass die Möglichkeit des SPS-Betriebs über Telekommunikationsmittel, d.h. die Verwendung von E-Mail oder globalen Netzwerken, ermöglicht es Ihnen, Infobases zu aktualisieren und gleichzeitig keinen Speicherplatz auf dem Computer des Benutzers zu verschwenden. Allerdings sind Modifikationen von SPS mit lokalen Datenbanken nach wie vor am stärksten nachgefragt.

Rechtsinformationen können nicht aus einer einzigen Quelle bezogen werden, was wiederum dazu führt, dass Informationen aus der Praxis gesammelt werden müssen. In dieser Hinsicht spielen nichtstaatliche Computerfirmen und Unternehmen, die elektronische Versionen von Rechtsinformationen auf den Markt bringen, eine immer wichtigere Rolle bei der Schaffung des Nationalen Rechtsinformationssystems.

Eine breite Palette von legalen Computersystemen ist ein einzigartiges Phänomen auf dem russischen Markt für Unternehmenssoftware.

Eine der Prioritäten ist die Bereitstellung aktueller, vollständiger und zuverlässiger Gesetzesinformationen für Strafverfolgungsbeamte sowie Informationen über Änderungen und Ergänzungen von Rechtsdokumenten. Allerdings erlassen täglich nur die obersten Landesbehörden durchschnittlich mehrere Dutzend normative Akte. Darüber hinaus erfordert eine effektive Arbeit häufig das Vorhandensein von Vorschriften, die von den konstituierenden Einheiten der Russischen Föderation verabschiedet wurden, sowie von Abteilungsdokumenten.

Aktuell wächst der Wettbewerb zwischen Firmen, Herstellern von Referenzrechtssystemen und die Anfragen der Nutzer steigen. Reichte es bis vor kurzem noch aus, nur das richtige Dokument zu finden, ist es heute oft notwendig, alle möglichen Zusammenhänge zwischen Dokumenten nachzuvollziehen, Abklärungen einzuholen, sich einen Überblick zu einem interessanten Thema zu verschaffen und eine eigene Benutzerdatenbank anzulegen. Infobases sind ziemlich umfangreich, enthalten oft einzigartige Dokumente, jedoch ist die Arbeit eines Massenbenutzers mit solchen Systemen schwierig, da es an effektiven Kanälen zur Unterstützung von Datenbankaktualisierungen, Systemwartung usw. Daher haben kommerzielle SPS, wie Consultant Plus, Garant, Codex, breite Anerkennung von Benutzern erhalten.

Referenzrechtsordnungen können nach folgenden Kriterien verglichen und bewertet werden:

  • Grad der Echtheit von Dokumenten zum Original
  • rechtliche Bearbeitung von Dokumenten
  • das Volumen der Informationsbank; Bildung der Benutzerbasis
  • Datenbanksuchgeschwindigkeit
  • Relevanz der Informationen und Schnelligkeit des Eingangs von Dokumenten
  • Möglichkeit des Fernzugriffs auf die Datenbank

So ermöglichen Rechtsreferenzsysteme als Träger von Informationen juristischer Art die Beseitigung des juristischen Analphabetentums, erleichtern die Arbeit von Spezialisten (Anwälten, Buchhaltern, Managern) und steigern ihre Arbeitsproduktivität bei der Lösung von Rechtsproblemen erheblich. Die Lösung dieser Probleme wirkt sich erheblich auf die Änderung der Rechtswirklichkeit, ihre Verbesserung und den Stand der Rechtmäßigkeit aus.

Senden Sie Ihre gute Arbeit in die Wissensdatenbank ist einfach. Verwenden Sie das untenstehende Formular

Studenten, Doktoranden, junge Wissenschaftler, die die Wissensbasis in ihrem Studium und ihrer Arbeit nutzen, werden Ihnen sehr dankbar sein.

Veröffentlicht am http://www.allbest.ru/

Einführung

1. Computerwörterbücher

2. Computerübersetzungssysteme

3. Maschinelle Übersetzungssysteme

4 . Online-Übersetzer

Fazit

Literaturverzeichnis

Einführung

Moderne Computerübersetzungssysteme ermöglichen es uns, technische Dokumentationen, Geschäftskorrespondenz und andere Fachtexte in akzeptabler Qualität zu übersetzen. Aber auf diese Systeme kann man sich nicht vollständig verlassen. Sie machen semantische und stilistische Fehler und sind beispielsweise für die Übersetzung von Kunstwerken nicht anwendbar, da sie nicht in der Lage sind, Metaphern, Allegorien und andere Elemente menschlicher künstlerischer Kreativität usw. angemessen zu übersetzen.

Es gibt Möglichkeiten, die Ergebnisse der maschinellen Übersetzung zu verbessern:

1. Bevor Sie mit der Übersetzung beginnen, müssen Sie die Art des Textes bestimmen, dh aus welchem ​​​​Bereich des menschlichen Lebens er präsentiert wird (Wirtschaft, Sport, Wissenschaft usw.). Schließlich hat jeder Bereich seine eigenen Nuancen und Begriffe.

2. Druckfehler im übersetzten Text sind oft die Ursache für fehlerhafte Übersetzungen. Dies gilt auch für anerkannte Texte. Wörter mit Fehlern werden von Übersetzern als unbekannt markiert, weil sie in dieser Form nicht in Wörterbüchern stehen. Schlimmer noch, wenn es Fehler in der Interpunktion gibt - ein falsch gesetztes Komma kann die Übersetzung des gesamten Satzes verfälschen.

3. Arbeiten Sie mit Textschnipseln. Übersetzen Sie niemals den gesamten Text auf einmal. Es enthält immer Wörter, die nicht im Wörterbuch stehen und die das System nicht richtig übersetzt.

Mit Hilfe von Übersetzungsprogrammen übersetzen Sie erfolgreich technische Dokumentationen, Geschäftskorrespondenz und andere Textmaterialien, die in einer „trockenen“ Sprache verfasst sind. Die Übersetzung von künstlerischen Texten, emotional gefärbt, reich an Übertreibungen, Metaphern etc., kann nur von einem Menschen vollumfänglich geleistet werden.

Übersetzungsprogramme:

-Kenntnisse in mindestens einer Fremdsprache sind heute für jeden notwendig, wie die Luft. Vor allem für Anwender: Schließlich kommt man bei der Arbeit am Computer nicht umhin, mit der englischen Sprache zu kollidieren.

- Auf dem Computer installierte spezialisierte Übersetzungsprogramme können helfen.

Ein Wörterbuch ist ein wesentlicher Bestandteil der Bibliothek eines jeden intelligenten Menschen. Sie werden auch von den neugierigsten Kindern verwendet. Und Lehrer und Dozenten sagen, dass das Kehlen des Wörterbuchs "von nichts zu tun" eine sehr nützliche Sache ist. Weder ein Student, noch ein Schüler, noch ein Wissenschaftler kann auf sie verzichten. Spezialisten aus verschiedenen Bereichen suchen oft in Wörterbüchern nach Tausenden von Fragen. Auch sehr gute Übersetzer legen vor der Arbeit ein paar Wörterbücher auf den Tisch.

Computerwörterbuchübersetzung Internet

1 . Computerwörterbücher

Computerwörterbücher. Wörterbücher werden benötigt, um Texte von einer Sprache in eine andere zu übersetzen. Die ersten Wörterbücher wurden vor etwa 5.000 Jahren in Sumer erstellt und waren in zwei Teile geteilte Tontafeln. In einem Teil wurde ein Wort in der sumerischen Sprache geschrieben und im anderen ein Wort mit ähnlicher Bedeutung in einer anderen Sprache, manchmal mit kurzen Erklärungen.

Wörterbücher und ein E-Book stellten sich als sehr eng miteinander verzahnt heraus - neuerdings lernt ein Computerwörterbuch, das gewünschte Wort selbstständig zu suchen, zu finden und auszusprechen. Manchmal ist es für andere Familienmitglieder nützlich, wenn Sie eine E-Mail von einem Freund aus dem Ausland oder Anweisungen für die Technik übersetzen.

Moderne Wörterbücher sind nach dem gleichen Prinzip aufgebaut. Derzeit gibt es Tausende von Wörterbüchern zum Übersetzen zwischen Hunderten von Sprachen (Englisch-Russisch, Deutsch-Französisch usw.), und jedes von ihnen kann Zehntausende von Wörtern enthalten. In der Papierversion ist das Wörterbuch ein dickes Buch mit Hunderten von Seiten, in dem die Suche nach dem richtigen Wort ein ziemlich mühsamer Prozess ist.

Computerwörterbücher können Übersetzungen von Hunderttausenden von Wörtern und Sätzen in verschiedene Sprachen enthalten und dem Benutzer außerdem zusätzliche Funktionen bieten:

§ *Es gibt mehrsprachige Computerwörterbücher, die es dem Benutzer ermöglichen, Sprachen und die Übersetzungsrichtung auszuwählen (z. B. Englisch-Russisch, Spanisch-Russisch usw.);

§ *Computerwörterbücher können neben dem Hauptwörterbuch für häufig verwendete Wörter Dutzende von Fachwörterbüchern in Wissensgebieten (Technik, Medizin, Informatik usw.) enthalten;

§ *Computerwörterbücher bieten eine schnelle Suche nach Wörterbucheinträgen: „schnelles Tippen“, wenn eine Liste ähnlicher Wörter während des Eintippens eines Wortes erscheint; Zugriff auf häufig verwendete Wörter durch Lesezeichen; die Fähigkeit, Phrasen usw. einzugeben;

§ Computerwörterbücher können multimedial sein, d. h. dem Benutzer die Möglichkeit bieten, Wörter anzuhören, die von Sprechern, Muttersprachlern, vorgetragen werden;

* Online-Computerwörterbücher im Internet bieten eine Auswahl an thematischen Wörterbüchern und Übersetzungsrichtungen.

Zusätzliche Funktionen von Computerwörterbüchern

· Erstens, Computerwörterbücher können mehrsprachig sein, da sie es dem Benutzer ermöglichen, Sprachen und die Übersetzungsrichtung auszuwählen (z. B. Englisch-Russisch, Spanisch-Russisch usw.).

· Zweitens, können Computerwörterbücher neben dem Hauptwörterbuch für häufig verwendete Wörter Dutzende von Fachwörterbüchern in Wissensgebieten (Technik, Medizin, Informatik usw.) enthalten.

· Drittens, bieten Computerwörterbücher eine schnelle Suche nach Wörterbucheinträgen: „schnelles Tippen“, wenn eine Liste ähnlicher Wörter während des Eintippens eines Wortes erscheint; Zugriff auf häufig verwendete Wörter durch Lesezeichen; die Möglichkeit, Phrasen usw. einzugeben

· Viertens, Computerwörterbücher können multimedial sein, das heißt, dem Benutzer die Möglichkeit bieten, Wörter anzuhören, die von Sprechern, Muttersprachlern, vorgetragen werden.

2 . Computerübersetzungssysteme

Die gegenwärtige Globalisierung unserer Welt führt zu der Notwendigkeit, Dokumente zwischen Personen und Organisationen auszutauschen, die sich in verschiedenen Ländern der Welt befinden und verschiedene Sprachen sprechen.

Unter diesen Bedingungen behindert der Einsatz traditioneller manueller Übersetzungstechnologie die Entwicklung interethnischer Kontakte. Die manuelle Übersetzung einer mehrseitigen Dokumentation dauert lange. Die Übersetzung einer E-Mail-Nachricht oder einer in einem Browser angezeigten Webseite muss "hier und jetzt" erfolgen, und es gibt keine Gelegenheit und keine Zeit, einen Übersetzer einzuladen.

Computerübersetzungssysteme ermöglichen die Lösung dieser Probleme. Einerseits sind sie in der Lage, mehrseitige Dokumente mit hoher Geschwindigkeit (eine Seite pro Sekunde) zu übersetzen, andererseits können sie Webseiten on-the-fly in Echtzeit übersetzen.

Computerübersetzungssysteme übersetzen Texte auf der Grundlage des formalen "Wissens" der Sprache: der Syntax der Sprache (die Regeln für den Satzbau), die Regeln der Wortbildung und die Verwendung von Wörterbüchern. Das Übersetzerprogramm analysiert zuerst den Text in einer Sprache und konstruiert diesen Text dann in einer anderen Sprache.

Online-Computerübersetzer im Internet bieten eine Auswahl an thematischen Wörterbüchern und Übersetzungsrichtungen. Sie ermöglichen es Ihnen, jeden in das Übersetzungsfenster eingegebenen oder aus der Zwischenablage kopierten Text, Webseiten, einschließlich Hyperlinks, unter Beibehaltung der ursprünglichen Formatierung sowie E-Mails zu übersetzen.

Ein beispielloser Vorteil dieser Art von Wörterbüchern ist ihr Preis und ihre Bequemlichkeit: Sie passen auf fast jedes Medium, von einer CD bis zu einem Flash-Laufwerk.

Übersetzer werden verwendet, um Textdokumente zu übersetzen. Sie basieren auf einer formalen Kenntnis der Sprache - den Regeln der Wortbildung und den Regeln des Satzbaus.

3. Maschinelle Übersetzungssysteme

· Maschinenübersetzungssysteme ermöglichen es Ihnen, die Probleme der schnellen Übersetzung mehrseitiger Dokumentationen zu lösen.

· Einerseits sind sie in der Lage, mehrseitige Dokumente mit hoher Geschwindigkeit (eine Seite pro Sekunde) zu übersetzen und andererseits Webseiten on-the-fly in Echtzeit zu übersetzen. PROMT und Socrates gelten als die besten russischen maschinellen Übersetzungssysteme.

Anwendungsbereich maschineller Übersetzungssysteme

· Maschinenübersetzungssysteme übersetzen Texte auf der Grundlage des formalen "Wissens" der Sprache (Syntax der Sprache - Satzbauregeln, Wortbildungsregeln) und der Verwendung von Wörterbüchern. Das Übersetzerprogramm analysiert zuerst den Text in einer Sprache und konstruiert diesen Text dann in einer anderen Sprache.

· Moderne maschinelle Übersetzungssysteme ermöglichen es, technische Dokumentationen, Geschäftskorrespondenz und andere Fachtexte in ausreichender Qualität zu übersetzen. Sie sind jedoch nicht auf die Übersetzung von Kunstwerken anwendbar, da sie nicht in der Lage sind, Metaphern, Allegorien und andere Elemente des menschlichen künstlerischen Schaffens angemessen zu übersetzen.

Die Parameter von Maschinenübersetzern müssen vier grundlegende Anforderungen erfüllen:

· Effizienz

Flexibilität

· Geschwindigkeit

· Richtigkeit

Die Effizienz liegt in der Möglichkeit der ständigen Aktualisierung des Vokabulars und der thematischen Abschnitte.

Die Flexibilität ist auf ein bestimmtes Fachgebiet zugeschnitten.

Geschwindigkeit - die Fähigkeit, Textinformationen automatisch aus Papier einzugeben und zu verarbeiten. Ein solches System (OCR-System) ersetzt täglich mehr als zehn erfahrene Schreibkräfte.

Die Genauigkeit liegt in der Lesekompetenz und der angemessenen Übertragung der Bedeutung des übersetzten Textes in die Zielsprache.

Mit Hilfe von Übersetzungsprogrammen übersetzen Sie erfolgreich technische Dokumentationen, Geschäftskorrespondenz und andere Textmaterialien, die in einer „trockenen“ Sprache verfasst sind. Die Übersetzung von künstlerischen Texten, emotional gefärbt, reich an Übertreibungen, Metaphern etc., kann nur von einem Menschen vollumfänglich geleistet werden. Das Übersetzerprogramm analysiert zunächst den Text in der Ausgangssprache und baut diesen Text dann in der Sprache auf, in die er übersetzt werden soll.

4 . Online-Übersetzer

Außerdem wurden mit der Entwicklung des World Wide Web sogenannte Online-Wörterbücher (Englisch online – in Echtzeit) oder Übersetzer geschaffen und funktionieren.

Der Online-Textübersetzer unterstützt Übersetzungsanweisungen für die folgenden Sprachen:

ukrainisch

· Russisch

· Englisch

Polieren

· Deutsch

lettisch

· Französisch

Texteingabe und Auswahl der Übersetzungsrichtung.

Der Quelltext muss in das obere Fenster eingetippt oder kopiert werden und die Übersetzungsrichtung aus dem Dropdown-Menü ausgewählt werden. Für eine russisch-ukrainische Übersetzung müssen Sie beispielsweise den Text auf Russisch in das obere Fenster eingeben und im Dropdown-Menü „Russisch“ und dann „Ukrainisch“ auswählen. Als nächstes drücken Sie die Schaltfläche Übersetzen.

Fachwörterbücher

Gehört der zu übersetzende Ausgangstext zu einer bestimmten Branche, wählen Sie aus der Dropdown-Liste das Thema eines Fachvokabulars aus, z. B. Wirtschaft, Internet, Recht, Musik und andere. Der Standardwert ist ein allgemeines Vokabularwörterbuch.

Rechtschreibprüfung

Die Qualität der Übersetzung hängt von der korrekten Schreibweise des Ausgangstextes ab. Wir empfehlen Ihnen, die Rechtschreibprüfung zu verwenden. Die Rechtschreibprüfung funktioniert für ukrainische, russische und englische Sprachen.

Transliteration

Wenn Sie mit einem Empfänger korrespondieren, der Kyrillisch nicht installiert hat, können Sie die Transliteration verwenden. Die Transliteration unterstützt russische und ukrainische Sprachen und transliteriert sowohl von Latein nach Kyrillisch als auch von Kyrillisch nach Latein.

Virtuelle Tastatur

Wenn das erforderliche Layout auf Ihrem Computer nicht verfügbar ist, verwenden Sie die virtuelle Tastatur. Die virtuelle Tastatur wird für Russisch, Ukrainisch, Englisch, Deutsch, Französisch, Spanisch und Italienisch angeboten.

Fazit

Das Wichtigste:

§ Die Fähigkeiten moderner Computer, große Informationsmengen zu speichern und darin schnelle Suchen durchzuführen, bilden die Grundlage für die Entwicklung von Computerwörterbüchern und Übersetzungsprogrammen. Computerwörterbücher übersetzen einzelne Wörter und Sätze. Übersetzer werden verwendet, um Textdokumente zu übersetzen.

§ Die Fähigkeiten moderner Computer, große Datenmengen zu speichern und darin schnell zu suchen, bilden die Grundlage für die Entwicklung von Computerwörterbüchern und Übersetzungsprogrammen.

§ In einem typischen Wörterbuch mit mehreren hundert Seiten ist die Suche nach dem richtigen Wort ein langer und mühsamer Prozess. Computerwörterbücher bieten eine sofortige Suche nach Wörterbucheinträgen. Viele Wörterbücher bieten Benutzern die Möglichkeit, sich Wörter anzuhören, die von Muttersprachlern vorgetragen werden.

§ Computerwörterbücher (Russisch-Englisch und Englisch-Russisch, Russisch-Französisch, Russisch-Deutsch usw.) können als eigenständige Programme auf einem Computer installiert werden, sind in Textverarbeitungsprogramme integriert und existieren online im Internet.

§ Computerwörterbücher übersetzen einzelne Wörter und Sätze. Übersetzer werden verwendet, um Textdokumente zu übersetzen. Sie basieren auf einer formalen Kenntnis der Sprache - den Regeln der Wortbildung und den Regeln des Satzbaus. Das Übersetzerprogramm analysiert zunächst den Text in der Ausgangssprache und baut diesen Text dann in der Sprache auf, in die er übersetzt werden soll.

Literaturverzeichnis

1. Lektion zum Thema: "Computerübersetzung", Malakhova N.P., Yuzhnogorsk.

2. Wassiljew. A. Computer statt Übersetzer // U-Boot. - Nr. 6.

3. Textübersetzungssystem PROMT Internet. Benutzerhandbuch. -- St. Petersburg: PROMT.

4. translate.meta.ua

Gehostet auf Allbest.ru

...

Ähnliche Dokumente

    Geschichte der automatisierten Übersetzung. Moderne Computerübersetzungsprogramme. Umfang der maschinellen Übersetzung. Organisationsformen der Mensch-Computer-Interaktion in der maschinellen Übersetzung. Zwischenbearbeitung und Nachbearbeitung maschineller Übersetzungen.

    Seminararbeit, hinzugefügt am 19.06.2015

    Spezialisierte Übersetzungsprogramme. Möglichkeiten von Computerwörterbüchern. Probleme bei der Übersetzung mehrseitiger Dokumentation. Prinzipien, auf denen Computerwörterbücher aufgebaut sind. Welche Texte sind für die Übersetzung mit Hilfe von Computerübersetzern ungeeignet.

    Präsentation, hinzugefügt am 13.11.2010

    Erforschung moderner Technologien der maschinellen Übersetzung. Studium der Klassifikation von Übersetzungssystemen. Merkmale der Merkmale der Arbeit mit einem elektronischen Wörterbuch. Google Sprachtools. Programme zur Rechtschreib- und Grammatikprüfung, Texteditoren.

    Zusammenfassung, hinzugefügt am 02.11.2014

    Geschichte des Auftretens, Entwicklung der maschinellen Übersetzung. Grundvoraussetzungen für kommunikative Äquivalenz. Die Abfolge formaler Operationen im maschinellen Übersetzungssystem, seine Entwicklungskonzepte. Büro-Übersetzer. Vorteile elektronischer Wörterbücher.

    Präsentation, hinzugefügt am 22.10.2013

    Weltgeschichte der maschinellen Übersetzungstechnologie als Klasse von Systemen der künstlichen Intelligenz. Klassifizierung von Online-Übersetzerprogrammen, Unterstützung für kontrollierte Eingabesprachfunktion. Mehrsprachige Internetbrowser und eine Liste elektronischer Wörterbücher.

    Test, hinzugefügt am 03.02.2011

    Computer-Lehrsysteme. Prinzipien der neuen Informationstechnologien der Bildung. Arten von Trainingsprogrammen. Aktivierung des Lernens. Computer testen. Vielversprechende Forschung zum Computerlernen. Internettechnologien, Multimedia.

    Test, hinzugefügt am 10.09.2008

    Computergestützte Übersetzungsprogramme: elektronische Wörterbücher, Tools-Anwendungen, Translation-Memory-System, Bearbeitungssoftware. Analyse der Nutzung von CAT-Programmen in der Praxis. Durchführen von Übersetzungen mit Wordfast- und Promt-Übersetzern.

    Seminararbeit, hinzugefügt am 10.11.2011

    Ganze Zahlen in Positionszahlensystemen. Nachteile des binären Systems. Entwicklung von Algorithmen, Datenstrukturen. Softwareimplementierung von Übersetzungsalgorithmen in verschiedene Zahlensysteme in der Programmiersprache C. Softwaretest.

    Seminararbeit, hinzugefügt am 03.01.2015

    Übersetzung ist der Prozess der Erstellung eines kommunikativ gleichwertigen Textes in einer anderen Sprache auf der Grundlage des Ausgangstextes in einer Sprache, wobei die Anforderungen für die Gewährleistung seiner Äquivalenz erfüllt sind. Maschinenübersetzungstechnologien; Eigenschaften von Translation-Memory-Systemen.

    Präsentation, hinzugefügt am 06.01.2014

    Ein Computerprogramm ist eine Folge von Anweisungen, die dazu bestimmt sind, von einem Computersteuergerät ausgeführt zu werden. Analyse von Übersetzungsstandards für Texte von Computerspielen. Berücksichtigung der Besonderheiten der IT-Übersetzung, Beispiele grober Fehler.

Derzeit gibt es drei Arten von maschinellen Übersetzungssystemen:

Auf grammatikalischen Regeln basierende Systeme (Rule-Based Machine Translation, RBMT);

Statistische Systeme (statistische maschinelle Übersetzung, SMT);

Hybridsysteme;

Grammatikbasierte Systeme analysieren den Text, der im Übersetzungsprozess verwendet wird. Die Übersetzung erfolgt auf der Grundlage von integrierten Wörterbüchern für ein bestimmtes Sprachpaar sowie von Grammatiken, die die semantischen, morphologischen und syntaktischen Muster beider Sprachen abdecken. Aus all diesen Daten wird der Ausgangstext sequentiell Satz für Satz in Text in der gewünschten Sprache umgewandelt. Das grundlegende Funktionsprinzip solcher Systeme ist die Verbindung zwischen den Strukturen der Ausgangs- und Endtexte.

Systeme, die auf grammatikalischen Regeln basieren, werden oft in drei weitere Untergruppen unterteilt - Wort-für-Wort-Übersetzungssysteme, Übertragungssysteme und interlinguistische Systeme.

Die Vorteile von Systemen, die auf grammatikalischen Regeln basieren, sind grammatikalische und syntaktische Genauigkeit, Stabilität des Ergebnisses und die Fähigkeit, sich auf ein bestimmtes Fachgebiet einzustellen. Zu den Nachteilen von auf Grammatikregeln basierenden Systemen gehören die Notwendigkeit, linguistische Datenbanken zu erstellen, zu pflegen und zu aktualisieren, die Komplexität der Erstellung eines solchen Systems sowie seine hohen Kosten.

Statistische Systeme verwenden in ihrer Arbeit statistische Analysen. In das System wird ein zweisprachiger Textkorpus geladen (der eine große Textmenge in der Ausgangssprache und seine „manuelle“ Übersetzung in die gewünschte Sprache enthält), wonach das System die Statistik der interlingualen Korrespondenzen, syntaktischen Konstruktionen usw. analysiert Das System ist selbstlernend - bei der Auswahl einer Übersetzungsoption stützt es sich auf frühere Statistiken. Je größer und genauer der Wortschatz innerhalb eines Sprachpaares ist, desto besser ist das Ergebnis der statistischen maschinellen Übersetzung. Mit jedem neu übersetzten Text verbessert sich die Qualität nachfolgender Übersetzungen.

Statistische Systeme lassen sich schnell einrichten und neue Übersetzungsrichtungen einfach hinzufügen. Unter den Mängeln sind die wichtigsten das Vorhandensein zahlreicher Grammatikfehler und die Instabilität der Übersetzung.

Hybridsysteme kombinieren die zuvor beschriebenen Ansätze. Es wird erwartet, dass hybride maschinelle Übersetzungssysteme alle Vorteile kombinieren, die statistische Systeme und regelbasierte Systeme haben.

1.3 Klassifizierung maschineller Übersetzungssysteme

Maschinelle Übersetzungssysteme sind Programme, die vollautomatische Übersetzungen durchführen. Das Hauptkriterium des Programms ist die Qualität der Übersetzung. Wichtige Punkte für den Benutzer sind außerdem die Benutzerfreundlichkeit der Benutzeroberfläche, die einfache Integration des Programms mit anderen Dokumentenverarbeitungswerkzeugen, die Auswahl von Themen und das Dienstprogramm zur Ergänzung des Wörterbuchs. Mit dem Aufkommen des Internets haben große Anbieter von maschinellen Übersetzungen Webschnittstellen in ihre Produkte integriert und sie gleichzeitig mit anderer Software und E-Mail integriert, sodass MT zum Übersetzen von Webseiten, E-Mails und Online-Gesprächen verwendet werden kann.

Neue Mitglieder des Fremdsprachenforums von CompuServe fragen oft, ob jemand ein gutes maschinelles Übersetzungsprogramm zu einem vernünftigen Preis empfehlen kann.

Die Antwort auf diese Frage ist ausnahmslos „nein“. Je nach Befragtem kann die Antwort zwei Hauptargumente enthalten: entweder dass Maschinen nicht übersetzen können oder dass die maschinelle Übersetzung zu teuer ist.

Beide Argumente sind bis zu einem gewissen Grad gültig. Die Antwort ist jedoch alles andere als so einfach. Bei der Untersuchung des Problems der maschinellen Übersetzung (MÜ) ist es notwendig, die verschiedenen Unterabschnitte dieses Problems getrennt zu betrachten. Die folgende Aufteilung basiert auf Vorträgen von Larry Childs, die 1990 auf der International Conference on Technical Communication gehalten wurden:

Vollautomatische Übersetzung;

Automatisierte maschinelle Übersetzung mit menschlicher Beteiligung;

Übersetzung, die von einer Person mithilfe eines Computers durchgeführt wird.

Vollautomatische maschinelle Übersetzung. Diese Art der maschinellen Übersetzung ist das, was die meisten Leute meinen, wenn sie von maschineller Übersetzung sprechen. Die Bedeutung hier ist einfach: Text in einer Sprache wird in den Computer eingegeben, dieser Text wird verarbeitet und der Computer gibt denselben Text in einer anderen Sprache aus. Leider stößt die Implementierung dieser Art der automatischen Übersetzung auf gewisse Hindernisse, die noch überwunden werden müssen.

Das Hauptproblem ist die Komplexität der Sprache selbst. Nehmen wir zum Beispiel die Bedeutung des Wortes „kann“. Neben der Hauptbedeutung des modalen Hilfsverbs hat das Wort „kann“ als Substantiv mehrere offizielle und umgangssprachliche Bedeutungen: „Bank“, „Latrine“, „Gefängnis“. Darüber hinaus gibt es eine archaische Bedeutung dieses Wortes - "wissen oder verstehen". Angenommen, die Zielsprache hat für jeden dieser Werte ein eigenes Wort, wie kann ein Computer sie voneinander unterscheiden?

Wie sich herausstellt, wurden einige Fortschritte bei der Entwicklung von Übersetzungsprogrammen erzielt, die die Bedeutung basierend auf dem Kontext unterscheiden. Neuere Studien zur Analyse von Texten stützen sich eher auf die Wahrscheinlichkeitstheorie. Die vollautomatisierte maschinelle Übersetzung von Texten mit umfangreichen Fachgebieten ist jedoch immer noch eine unmögliche Aufgabe.

Automatisierte maschinelle Übersetzung mit menschlicher Beteiligung. Diese Art der maschinellen Übersetzung ist mittlerweile durchaus machbar. Wenn man von maschineller Übersetzung unter Beteiligung einer Person spricht, bedeutet dies normalerweise, dass Texte sowohl vor als auch nach der Verarbeitung durch einen Computer bearbeitet werden. Menschliche Übersetzer verändern Texte so, dass sie von Maschinen verstanden werden können. Nachdem der Computer die Übersetzung durchgeführt hat, bearbeiten die Leute die grobe maschinelle Übersetzung erneut, um den Text in der Zielsprache zu korrigieren. Zusätzlich zu dieser Arbeitsfolge gibt es MÜ-Systeme, die während der Übersetzung die ständige Anwesenheit eines menschlichen Übersetzers erfordern, der dem Computer hilft, besonders komplexe oder mehrdeutige Strukturen zu übersetzen.

Die von Menschen unterstützte maschinelle Übersetzung ist in größerem Umfang auf Texte mit einem begrenzten Vokabular mit eng begrenzten Themen anwendbar.

Die Wirtschaftlichkeit der Verwendung von menschengestützter maschineller Übersetzung ist immer noch umstritten. Die Programme selbst sind in der Regel ziemlich teuer, und einige von ihnen erfordern eine spezielle Ausrüstung, um zu funktionieren. Pre- und Post-Editing will gelernt sein und ist kein angenehmer Job. Das Erstellen und Pflegen von Wortdatenbanken ist ein mühsamer Prozess und erfordert oft spezielle Fähigkeiten. Für eine Organisation, die große Mengen an Texten in einem klar definierten Fachgebiet übersetzt, kann die maschinelle Übersetzung mit menschlicher Unterstützung jedoch eine ziemlich kostengünstige Alternative zur traditionellen menschlichen Übersetzung sein.

Übersetzung, die von einer Person mithilfe eines Computers durchgeführt wird. Bei diesem Ansatz wird der menschliche Übersetzer in den Mittelpunkt des Übersetzungsprozesses gestellt, während das Computerprogramm als Werkzeug betrachtet wird, das den Übersetzungsprozess effizienter und die Übersetzung präziser macht. Dies sind gewöhnliche elektronische Wörterbücher, die eine Übersetzung des erforderlichen Wortes bereitstellen, sodass die Person für die Auswahl der richtigen Option und die Bedeutung des übersetzten Textes verantwortlich ist. Solche Wörterbücher erleichtern den Übersetzungsprozess erheblich, erfordern jedoch, dass der Benutzer über gewisse Sprachkenntnisse verfügt und Zeit für die Implementierung aufwendet. Dabei wird der Übersetzungsprozess selbst stark beschleunigt und erleichtert.

Unter den Systemen, die den Übersetzer bei seiner Arbeit unterstützen, nehmen die sogenannten Translation Memory (TM)-Systeme den wichtigsten Platz ein: TM-Systeme sind ein interaktives Werkzeug zum Sammeln von Paaren äquivalenter Textsegmente in der Originalsprache und der Übersetzung in a Datenbank mit der Möglichkeit ihrer anschließenden Suche und Bearbeitung. Diese Softwareprodukte zielen nicht darauf ab, hochintelligente Informationstechnologien zu nutzen, sondern basieren im Gegenteil auf der Nutzung des kreativen Potenzials des Übersetzers. Im Laufe der Arbeit baut der Übersetzer selbst die Datenbank auf (oder erhält sie von anderen Übersetzern oder vom Kunden), und je mehr Einheiten darin enthalten sind, desto größer ist der Ertrag aus ihrer Nutzung.

Hier ist eine Liste der bekanntesten TM-Systeme:

Transit Schweizer Unternehmen Star,

Trados (USA),

Übersetzungsmanager von IBM,

Eurolang Optimizer der französischen Firma LANT,

DejaVu von ATRIL (USA),

WordFisher (Ungarn).

TM-Systeme ermöglichen es, die wiederholte Übersetzung identischer Textfragmente auszuschließen. Die Übersetzung eines Segments wird vom Übersetzer nur einmal durchgeführt, und dann wird jedes nachfolgende Segment auf Übereinstimmung (vollständig oder unscharf) mit der Datenbank geprüft, und wenn ein identisches oder ähnliches Segment gefunden wird, wird es als Übersetzung angeboten Möglichkeit.

Derzeit laufen Entwicklungen zur Verbesserung der TM-Systeme. Beispielsweise basiert der Kern des Transit-Systems von Star auf der Technologie neuronaler Netze.

Trotz der großen Auswahl an TM-Systemen haben sie einige gemeinsame Merkmale:

Ausrichtungsfunktion. Einer der Vorteile von TM-Systemen ist die Möglichkeit, bereits übersetzte Materialien zu diesem Thema zu verwenden. Die TM-Datenbank kann durch einen segmentweisen Vergleich der Original- und Übersetzungsdateien erhalten werden.

Verfügbarkeit von Import-Export-Filtern. Diese Eigenschaft stellt die Kompatibilität von TM-Systemen mit einer Vielzahl von Textverarbeitungs- und Veröffentlichungssystemen sicher und gibt dem Übersetzer eine relative Unabhängigkeit vom Kunden.

Mechanismus zum Suchen nach unscharfen oder vollständigen Übereinstimmungen. Dieser Mechanismus ist der Hauptvorteil von TM-Systemen. Trifft das System bei der Übersetzung eines Textes auf ein Segment, das mit dem zuvor übersetzten identisch oder diesem nahe kommt, wird dem Übersetzer das bereits übersetzte Segment als korrigierbare Variante der Übersetzung des aktuellen Segments angeboten. Der Grad des Fuzzy-Matching wird vom Benutzer eingestellt.

Unterstützung für thematische Wörterbücher. Diese Funktion hilft dem Übersetzer, sich an das Glossar zu halten. Wenn ein übersetztes Segment ein Wort oder einen Satz aus einem thematischen Wörterbuch enthält, wird es in der Regel farblich hervorgehoben und seine Übersetzung angeboten, die automatisch in den übersetzten Text eingefügt werden kann.

Mittel zur Suche nach Textfragmenten. Dieses Tool ist sehr praktisch beim Bearbeiten einer Übersetzung. Wenn im Laufe der Arbeit eine erfolgreichere Version der Übersetzung eines beliebigen Textfragments gefunden wurde, kann dieses Fragment in allen TM-Segmenten gefunden werden, wonach die erforderlichen Änderungen nacheinander an den TM-Segmenten vorgenommen werden.

Natürlich haben TM-Systeme wie jedes Softwareprodukt ihre Vor- und Nachteile und ihren Umfang. Der Hauptnachteil von TM-Systemen sind jedoch die hohen Kosten.

Besonders komfortabel ist der Einsatz von TM-Systemen bei der Übersetzung von Dokumenten wie Benutzerhandbüchern, Bedienungsanleitungen, Konstruktions- und Geschäftsunterlagen, Produktkatalogen und anderen gleichartigen Dokumenten mit einer großen Anzahl von Übereinstimmungen.