Penerjemahan dokumen utama dari bahasa asing. Garis besar pelajaran dengan topik: Pelajaran MDK "Sistem Penerjemahan Mesin dan Kamus Komputer"

Topik: “Penerjemah komputer. Sistem pengenalan teks.

Tujuan Pelajaran:

    untuk membantu siswa memperoleh pemahaman tentang kamus komputer dan sistem terjemahan mesin, untuk mengenal kemampuan program ini, untuk mengajarkan cara menggunakan program ini. membantu siswa memperoleh pemahaman tentang OCR - program pengenalan teks, berkenalan dengan kemampuan data program, mengajar mengenali teks yang dipindai, mentransfer dan mengeditnya di Word. pendidikan budaya informasi siswa, perhatian, ketepatan, disiplin, ketekunan. perkembangan minat kognitif, keterampilan komputer, pengendalian diri, kemampuan mencatat.

Peralatan:
papan, komputer, presentasi komputer.

Rencana belajar:

1) momen organisasi. (1 menit)

2) Aktualisasi pengetahuan. (5 menit)

3) Bagian teoretis. (10 menit)

4) Bagian praktis. (15 menit)

5) Pekerjaan Rumah (2 menit)

6) pertanyaan siswa. (5 menit)

7) Hasil pelajaran. (2 menit)

Selama kelas:

I. Momen organisasi.

Salam, memeriksa yang hadir. Penjelasan pelajaran.

II. Pembaruan pengetahuan.

Seperti yang Anda lihat, untuk mendapatkan salinan elektronik yang siap diedit dari teks cetak apa pun, program OCR perlu melakukan "rantai" dari banyak operasi terpisah.

Pertama, Anda perlu mengenali struktur teks pada halaman: pilih kolom, tabel, gambar, dan sebagainya. Selanjutnya, fragmen teks yang dipilih dari gambar grafik halaman harus dikonversi menjadi teks.

Jika dokumen sumber memiliki kualitas tipografi (font yang cukup besar, tidak ada karakter atau koreksi yang dicetak dengan buruk), maka masalah pengenalan diselesaikan dengan membandingkan dengan template raster. Pertama, bitmap halaman dibagi menjadi gambar karakter individu. Kemudian masing-masing secara berurutan ditumpangkan pada templat simbol yang tersedia di memori sistem, dan templat dengan jumlah titik paling sedikit berbeda dari gambar input dipilih.

Saat mengenali dokumen dengan kualitas cetak rendah (teks yang diketik, faks, dan sebagainya), metode pengenalan karakter digunakan dengan adanya elemen struktural tertentu di dalamnya (segmen, cincin, busur, dll.).

Simbol apa pun dapat dijelaskan melalui serangkaian nilai parameter yang menentukan posisi relatif elemen-elemennya. Misalnya, huruf "H" dan huruf "I" terdiri dari tiga segmen, dua di antaranya sejajar, dan yang ketiga menghubungkan segmen tersebut. Perbedaan antara huruf-huruf ini terletak pada ukuran sudut yang dibentuk segmen ketiga dengan dua lainnya.

Ketika dikenali dengan metode struktural, detail karakteristik dibedakan dalam gambar simbolis yang terdistorsi dan dibandingkan dengan pola struktural simbol. Akibatnya, simbol dipilih yang totalitas semua elemen struktural dan pengaturannya paling sesuai dengan simbol yang dikenali.

Sistem pengenalan karakter optik yang paling umum, seperti ABBYY FineReader dan CuneiForm dari Cognitive, menggunakan metode pengenalan raster dan terstruktur. Selain itu, sistem ini "belajar mandiri" (untuk setiap dokumen tertentu, mereka membuat satu set templat karakter yang sesuai) dan oleh karena itu kecepatan dan kualitas pengenalan dokumen multi-halaman meningkat secara bertahap.

Anda dapat membeli perangkat lunak pengenalan teks secara terpisah atau mendapatkannya secara gratis bersama dengan pemindai yang Anda beli.

Mungkin perangkat lunak OCR yang paling terkenal adalah FineReader ABBYY. Program inilah yang paling sering diingat dalam hal sistem pengenalan.

FineReader memungkinkan Anda mengenali teks yang diketik di hampir semua font, tanpa pelatihan sebelumnya. Fitur program FineReader adalah akurasi pengenalan yang tinggi dan sensitivitas yang rendah terhadap cacat cetak, yang dicapai melalui penggunaan teknologi "pengenalan adaptif bertujuan holistik".

FineReader memiliki banyak sekali fitur tambahan yang mungkin tidak dibutuhkan oleh rata-rata pengguna, tetapi akan mengesankan kelompok pembeli tertentu. Jadi, salah satu kartu truf FineReader adalah dukungan untuk sejumlah besar bahasa pengenalan - 176, di antaranya Anda akan menemukan bahasa eksotis dan kuno, dan bahkan bahasa pemrograman populer.

Tetapi tidak semua fitur termasuk dalam modifikasi program yang paling sederhana, yang bisa Anda dapatkan secara gratis bersama dengan pemindai. Pemindaian batch, pemrosesan tabel dan gambar yang kompeten - untuk semua ini, ada baiknya membeli versi profesional program.

Semua versi FineReader, dari yang paling sederhana hingga yang paling kuat, berbagi antarmuka yang ramah pengguna. Untuk memulai proses pengenalan, Anda hanya perlu meletakkan dokumen di pemindai dan menekan satu-satunya tombol (wizard Pindai & Baca) pada bilah alat program. Semua operasi lebih lanjut - memindai, membagi gambar menjadi "blok" dan, akhirnya, pengenalan program yang sebenarnya akan dilakukan secara otomatis. Pengguna hanya perlu mengatur parameter pemindaian yang diinginkan.

Kualitas pengenalan sangat tergantung pada seberapa baik gambar diperoleh selama pemindaian. Kualitas gambar dikontrol dengan mengatur parameter pemindaian dasar: jenis gambar, resolusi, dan kecerahan.

Pemindaian abu-abu adalah mode optimal untuk sistem pengenalan. Dalam kasus pemindaian dalam mode abu-abu, pemilihan kecerahan otomatis dilakukan. Jika Anda ingin elemen warna yang terkandung dalam dokumen (gambar, huruf dan warna latar belakang) ditransfer ke dokumen elektronik dengan pelestarian warna, Anda harus memilih jenis gambar berwarna. Jika tidak, gunakan jenis gambar abu-abu.

Resolusi optimal untuk teks biasa adalah 300 dpi dan 400-600 dpi untuk teks dalam cetakan kecil (9 poin atau kurang).

Setelah pengenalan halaman selesai, FineReader akan menawarkan pilihan kepada pengguna: memindai dan mengenali lebih lanjut (untuk dokumen multi-halaman) atau menyimpan teks yang dihasilkan dalam salah satu dari banyak format populer - dari dokumen Microsoft Office hingga HTML atau PDF. Namun, Anda dapat segera mentransfer dokumen ke Word atau Excel, dan sudah ada memperbaiki semua kekurangan pengenalan (tidak mungkin melakukannya tanpa itu). Pada saat yang sama, FineReader sepenuhnya mempertahankan semua fitur pemformatan dokumen dan desain grafisnya.

    Mengapa kita membutuhkan program pengenalan teks? Bagaimana pengenalan teks dilakukan? Program pengenalan teks apa yang Anda ketahui? Apa yang mereka gunakan? Resolusi apa yang optimal untuk memindai teks, gambar?

AKU AKU AKU. Bagian praktis.
1. Bekerja dengan penerjemah teks (dengan kartu)
2. Sekarang mari kita berlatih bekerja dengan ABBYY FineReader. Kami akan menggunakan versi sederhana dari program yang disertakan dengan pemindai.

IV. Pekerjaan rumah
Tahu apa program terjemahan teks otomatis, dapat bekerja dengan program-program ini. Tugas tambahan: sambungkan ke Internet dan gunakan penerjemah online apa pun untuk menerjemahkan teks.
Ketahui apa itu program pengenalan teks, dapat bekerja dengan program ini. Tugas tambahan: instal program OCR di rumah dan siapkan esai tentang subjek apa pun. Kenali teks dalam OCR, edit dan format di Word.

V. Pertanyaan siswa.
Jawaban atas pertanyaan siswa.

VI. Ringkasan pelajaran.
Menyimpulkan pelajaran. Penilaian.

Pada pelajaran itu, kami berkenalan dengan program terjemahan komputer untuk teks, belajar cara menerjemahkan kata dan teks menggunakan program penerjemah.

Pada pelajaran, kami berkenalan dengan program OCR, belajar cara mengenali gambar yang dipindai menggunakan ABBYY FineReader 5.0.

Surat No. 03-03-06/1/202 dari Kementerian Keuangan Federasi Rusia tertanggal 20 April 2012 menjelaskan bahwa dokumen perjalanan bisnis ke luar negeri dapat diterjemahkan oleh setiap karyawan perusahaan, dan tidak harus oleh penerjemah profesional. . Apakah klarifikasi ini berlaku untuk dokumen utama apa pun dalam bahasa asing? Apa yang diperlukan dari karyawan biasa perusahaan (kecuali pengetahuannya tentang bahasa asing) untuk dapat menerjemahkan dokumen? Bagaimana seharusnya diformat? Apa arti frasa "terjemahan baris demi baris"? Apakah pemeriksa pajak dapat meminta notaris untuk menerjemahkan dokumen atau sertifikasi oleh penerjemah profesional jika terjadi perselisihan selama audit?

Lyubov Artyukh, auditor utama Grup Audit dan Konsultasi, menjawab BANKO, www.bankoaudit.ru

Surat Kementerian Keuangan Federasi Rusia tertanggal 20 April 2012 No. 03-03-06 / 1/202 menjawab pertanyaan spesifik, namun klarifikasinya tidak hanya menyangkut dokumen perjalanan bisnis ke luar negeri, tetapi secara umum akuntansi utama dokumen yang dibuat dalam bahasa asing.

Dokumen akuntansi utama tersebut dapat berupa: deklarasi pabean kargo (deklarasi untuk barang), dokumen transportasi internasional - waybill yang mengonfirmasi transfer barang ke pengangkut (udara internasional, jalan raya, waybill kereta api, bill of lading), faktur komersial, sertifikat penerimaan - transfer pekerjaan yang dilakukan (layanan), dokumen lain yang dibuat sesuai dengan kebiasaan perputaran bisnis yang diterapkan di negara asing.

Kementerian Keuangan Rusia menyatakan pandangan ini tentang masalah penerjemahan dokumen yang dibuat dalam bahasa asing sebelumnya: Surat Kementerian Keuangan Federasi Rusia tertanggal 22 Maret 2010 No. 03-03-06 / 1/ 168, 03.11.09 No. 03-03-06/1/72, tanggal 14.09. 09 No. 03-03-05/170, tanggal 16 Februari 2009 No. 03-03-05/23.

Menurut paragraf 3, klausa 9 Peraturan tentang akuntansi dan pelaporan keuangan di Federasi Rusia, disetujui oleh Perintah Kementerian Keuangan Federasi Rusia tanggal 29 Juli 1998 No. 34n, dokumen akuntansi utama yang dibuat dalam bahasa lain​ harus memiliki terjemahan baris demi baris ke dalam bahasa Rusia.

Secara legislatif, prosedur pemrosesan dokumen yang diterjemahkan ke dalam bahasa Rusia tidak diatur.

Jika terjemahan dilakukan oleh spesialis organisasi, maka pesanan (dokumen internal lain) harus membentuk lingkaran orang yang memiliki hak untuk menerjemahkan dokumen akuntansi utama ke dalam bahasa Rusia, dan memperbaiki tanggung jawab terjemahan yang ditunjukkan dalam deskripsi pekerjaan mereka.

Dalam hal ini, terjemahan dokumen harus dilakukan baik pada fotokopi dokumen (baris demi baris), atau pada lembar yang dibuat secara terpisah, di mana baris asli dokumen yang diterjemahkan harus bergantian dengan terjemahannya.

Dianjurkan untuk membubuhkan teks terjemahan dari dokumen dengan tanda tangan orang yang melakukan terjemahan.

Adapun "transfer baris demi baris", perlu dicatat bahwa untuk mengakui biaya untuk tujuan akuntansi dan akuntansi pajak, rincian yang diperlukan untuk memahami isi operasi dan mengevaluasi nilainya secara kuantitatif dan nilai. harus diterjemahkan. Penerjemahan informasi yang berulang atau tidak penting untuk mendukung pengeluaran yang terjadi tidak diperlukan.

Misalnya, jika sebuah organisasi dalam proses pelaksanaan kegiatan ekonomi asing menggunakan dokumen standar, maka dalam hal ini cukup untuk menerjemahkan ke dalam bahasa Rusia rincian konstan bentuk standar satu kali, dan kemudian hanya menerjemahkan indikator perubahan dokumen ( Surat Kementerian Keuangan Federasi Rusia tertanggal 03.11.09 No. 03-03-¬ 06/1/725).

Untuk tiket pesawat dan dokumen transportasi lainnya dalam bahasa asing, terjemahan informasi yang tidak penting untuk mengkonfirmasi biaya yang dikeluarkan (misalnya, ketentuan untuk menerapkan tarif, aturan transportasi udara, aturan pengangkutan bagasi, informasi lainnya) adalah tidak diperlukan (Surat Kementerian Keuangan Federasi Rusia tertanggal 03.22.10 No. 03- 03-06/1/168).

Dalam beberapa kasus, terjemahan dokumen yang dibuat dalam bahasa asing tidak diperlukan.

Dengan demikian, terjemahan dokumen baris demi baris yang memiliki bentuk internasional terpadu tidak diperlukan, khususnya, tiket pesawat yang digunakan untuk mengesahkan kontrak transportasi udara penumpang (Surat Bersama Kementerian Keuangan Rusia dan Layanan Pajak Federal tertanggal 26 April, 2010 No. ShS-37-3 / [dilindungi email]).

Pemeriksa pajak jika terjadi perselisihan selama pemeriksaan tidak berhak meminta notaris atas dokumen yang diterjemahkan.

Permintaan dokumen selama pemeriksaan pajak diatur oleh Art. 93 dari Kode Pajak Federasi Rusia. Menurut ayat 2 ayat 2 pasal 93: “Dokumen di atas kertas diserahkan dalam bentuk salinan yang dilegalisir oleh orang yang diperiksa. Tidak diperbolehkan meminta notaris salinan dokumen yang diserahkan ke otoritas pajak (resmi), kecuali ditentukan lain oleh undang-undang Federasi Rusia.

Pilih fragmen dengan teks kesalahan dan tekan Ctrl+Enter

Saat ini, ada tiga jenis sistem terjemahan mesin:

Sistem berdasarkan aturan tata bahasa (Terjemahan Mesin Berbasis Aturan, RBMT);

Sistem statistik (Statistical Machine Translation, SMT);

sistem hibrida;

Sistem berbasis tata bahasa menganalisis teks yang digunakan dalam proses penerjemahan. Terjemahan dibuat berdasarkan kamus bawaan untuk pasangan bahasa tertentu, serta tata bahasa yang mencakup pola semantik, morfologis, sintaksis dari kedua bahasa. Berdasarkan semua data ini, teks sumber secara berurutan, kalimat demi kalimat, diubah menjadi teks dalam bahasa yang diperlukan. Prinsip dasar pengoperasian sistem tersebut adalah hubungan antara struktur sumber dan teks akhir.

Sistem berdasarkan aturan tata bahasa sering dibagi menjadi tiga subkelompok lagi - sistem terjemahan kata demi kata, sistem transfer, dan sistem interlinguistik.

Keuntungan dari sistem berdasarkan aturan tata bahasa adalah akurasi tata bahasa dan sintaksis, stabilitas hasil, dan kemampuan untuk menyesuaikan dengan area subjek tertentu. Kerugian dari sistem berdasarkan aturan tata bahasa termasuk kebutuhan untuk membuat, memelihara, dan memperbarui basis data linguistik, kerumitan pembuatan sistem seperti itu, serta biayanya yang tinggi.

Sistem statistik dalam pekerjaannya menggunakan analisis statistik. Korpus teks dwibahasa dimuat ke dalam sistem (berisi sejumlah besar teks dalam bahasa sumber dan terjemahan "manual"-nya ke dalam bahasa yang diperlukan), setelah itu sistem menganalisis statistik korespondensi antarbahasa, konstruksi sintaksis, dll. sistem belajar mandiri - ketika memilih opsi terjemahan, itu bergantung pada statistik sebelumnya. Semakin besar kosakata dalam pasangan bahasa dan semakin akurat, semakin baik hasil terjemahan mesin statistik. Dengan setiap teks terjemahan baru, kualitas terjemahan berikutnya meningkat.

Sistem statistik cepat disiapkan dan mudah untuk menambahkan arah terjemahan baru. Di antara kekurangannya, yang paling signifikan adalah adanya banyak kesalahan tata bahasa dan ketidakstabilan terjemahan.

Sistem hybrid menggabungkan pendekatan yang dijelaskan sebelumnya. Diharapkan sistem terjemahan mesin hibrida akan menggabungkan semua keunggulan yang dimiliki sistem statistik dan sistem berbasis aturan.

1.3 Klasifikasi sistem terjemahan mesin

Sistem terjemahan mesin adalah program yang melakukan terjemahan otomatis sepenuhnya. Kriteria utama dari program ini adalah kualitas terjemahan. Selain itu, poin penting bagi pengguna adalah kenyamanan antarmuka, kemudahan mengintegrasikan program dengan alat pemrosesan dokumen lainnya, pilihan topik, dan utilitas pengisian kamus. Dengan munculnya Internet, vendor terjemahan mesin utama telah memasukkan antarmuka Web ke dalam produk mereka, sementara juga mengintegrasikannya dengan perangkat lunak dan email lain, memungkinkan MT digunakan untuk menerjemahkan halaman Web, email, dan percakapan online.

Anggota baru forum bahasa asing CompuServe sering bertanya apakah ada yang bisa merekomendasikan program terjemahan mesin yang bagus dengan harga yang wajar.

Jawaban atas pertanyaan ini selalu "tidak". Bergantung pada responden, jawabannya mungkin mengandung dua argumen utama: mesin tidak dapat menerjemahkan, atau terjemahan mesin terlalu mahal.

Kedua argumen ini valid sampai batas tertentu. Namun, jawabannya jauh dari sederhana. Ketika mempelajari masalah terjemahan mesin (MT), perlu untuk mempertimbangkan secara terpisah berbagai subbagian dari masalah ini. Pembagian berikut didasarkan pada kuliah oleh Larry Childs yang diberikan pada Konferensi Internasional tentang Komunikasi Teknis 1990:

Terjemahan otomatis sepenuhnya;

Terjemahan mesin otomatis dengan partisipasi manusia;

Penerjemahan dilakukan oleh seseorang dengan menggunakan komputer.

Terjemahan mesin yang sepenuhnya otomatis. Terjemahan mesin semacam ini adalah apa yang kebanyakan orang maksudkan ketika mereka berbicara tentang terjemahan mesin. Arti di sini sederhana: teks dalam satu bahasa dimasukkan ke komputer, teks ini diproses dan komputer mengeluarkan teks yang sama dalam bahasa lain. Sayangnya, penerapan terjemahan otomatis jenis ini menghadapi kendala tertentu yang belum diatasi.

Masalah utamanya adalah kompleksitas bahasa itu sendiri. Ambil contoh, arti dari kata "bisa". Selain arti utama dari kata kerja bantu modal, kata "bisa" memiliki beberapa arti resmi dan slang sebagai kata benda: "bank", "jamban", "penjara". Selain itu, ada arti kuno dari kata ini - "untuk mengetahui atau memahami." Dengan asumsi bahwa bahasa target memiliki kata terpisah untuk masing-masing nilai ini, bagaimana komputer dapat membedakannya?

Ternyata, beberapa kemajuan telah dicapai dalam mengembangkan program penerjemahan yang membedakan makna berdasarkan konteks. Studi yang lebih baru dalam analisis teks lebih mengandalkan teori probabilitas. Namun, terjemahan mesin yang sepenuhnya otomatis dari teks dengan materi pelajaran yang luas masih merupakan tugas yang mustahil.

Terjemahan mesin otomatis dengan partisipasi manusia. Terjemahan mesin semacam ini sekarang cukup layak. Berbicara tentang terjemahan mesin dengan partisipasi seseorang, biasanya berarti mengedit teks baik sebelum maupun setelah diproses oleh komputer. Penerjemah manusia mengubah teks sehingga dapat dipahami oleh mesin. Setelah komputer melakukan terjemahan, orang kembali mengedit terjemahan mesin kasar, membuat teks dalam bahasa target menjadi benar. Selain urutan kerja ini, ada sistem MT yang membutuhkan kehadiran penerjemah manusia secara konstan selama penerjemahan untuk membantu komputer menerjemahkan terutama struktur yang kompleks atau ambigu.

Penerjemahan mesin yang dibantu manusia dapat diterapkan pada tingkat yang lebih besar untuk teks-teks dengan kosa kata terbatas dari topik-topik yang sangat terbatas.

Ekonomi menggunakan terjemahan mesin yang dibantu manusia masih bisa diperdebatkan. Program itu sendiri biasanya cukup mahal, dan beberapa di antaranya memerlukan peralatan khusus untuk bekerja. Pengeditan pra dan pasca perlu dipelajari, dan itu bukan pekerjaan yang menyenangkan. Membuat dan memelihara basis data kata adalah proses yang melelahkan dan seringkali membutuhkan keterampilan khusus. Namun, untuk organisasi yang menerjemahkan teks dalam jumlah besar dalam area subjek yang terdefinisi dengan baik, terjemahan mesin yang dibantu manusia dapat menjadi alternatif yang cukup hemat biaya untuk terjemahan manusia tradisional.

Penerjemahan dilakukan oleh seseorang dengan menggunakan komputer. Dengan pendekatan ini, penerjemah manusia ditempatkan di pusat proses penerjemahan, sedangkan program komputer dianggap sebagai alat yang membuat proses penerjemahan lebih efisien dan penerjemahan akurat. Ini adalah kamus elektronik biasa yang menyediakan terjemahan dari kata yang diperlukan, membuat orang yang bertanggung jawab untuk memilih opsi yang tepat dan arti dari teks yang diterjemahkan. Kamus semacam itu sangat memudahkan proses penerjemahan, tetapi mengharuskan pengguna untuk memiliki pengetahuan tertentu tentang bahasa tersebut dan meluangkan waktu untuk implementasinya. Namun proses penerjemahan itu sendiri sangat dipercepat dan difasilitasi.

Di antara sistem yang membantu penerjemah dalam pekerjaannya, tempat yang paling penting ditempati oleh apa yang disebut sistem Translation Memory (TM).Sistem TM adalah alat interaktif untuk mengumpulkan pasangan segmen teks yang setara dalam bahasa asli dan terjemahan dalam bahasa asli. database dengan kemungkinan pencarian dan pengeditan selanjutnya. Produk perangkat lunak ini tidak dimaksudkan untuk menggunakan teknologi informasi yang sangat cerdas, tetapi, sebaliknya, didasarkan pada penggunaan potensi kreatif penerjemah. Selama bekerja, penerjemah sendiri yang membentuk database (atau menerimanya dari penerjemah lain atau dari pelanggan), dan semakin banyak unit yang dikandungnya, semakin besar keuntungan dari penggunaannya.

Berikut adalah daftar sistem TM yang paling terkenal:

Perusahaan transit Swiss Star,

Trados (AS),

Manajer Terjemahan dari IBM,

Eurolang Optimizer dari perusahaan Prancis LANT,

DejaVu dari ATRIL (AS),

WordFisher (Hongaria).

Sistem TM memungkinkan untuk mengecualikan terjemahan berulang dari fragmen teks yang identik. Penerjemahan segmen dilakukan oleh penerjemah hanya sekali, dan kemudian setiap segmen berikutnya diperiksa kecocokannya (penuh atau kabur) dengan database, dan jika segmen identik atau serupa ditemukan, maka ditawarkan sebagai terjemahan. pilihan.

Saat ini, pengembangan sedang dilakukan untuk meningkatkan sistem TM. Misalnya, inti dari sistem Star's Transit didasarkan pada teknologi jaringan saraf.

Meskipun berbagai sistem TM, mereka berbagi beberapa fitur umum:

Fungsi penyelarasan. Salah satu keuntungan sistem TM adalah kemampuan untuk menggunakan materi yang sudah diterjemahkan tentang topik ini. Basis data TM dapat diperoleh dengan perbandingan segmen demi segmen dari file asli dan terjemahan.

Ketersediaan filter ekspor-impor. Properti ini memastikan kompatibilitas sistem TM dengan berbagai pengolah kata dan sistem penerbitan dan memberikan penerjemah kemerdekaan relatif dari pelanggan.

Mekanisme untuk mencari kecocokan fuzzy atau lengkap. Mekanisme inilah yang mewakili keunggulan utama sistem TM. Jika, saat menerjemahkan teks, sistem menemukan segmen yang identik atau mirip dengan yang diterjemahkan sebelumnya, maka segmen yang sudah diterjemahkan ditawarkan kepada penerjemah sebagai varian dari terjemahan segmen saat ini, yang dapat diperbaiki. Tingkat pencocokan fuzzy diatur oleh pengguna.

Dukungan untuk kamus tematik. Fitur ini membantu penerjemah untuk tetap berpegang pada glosarium. Sebagai aturan, jika segmen yang diterjemahkan berisi kata atau frasa dari kamus tematik, segmen tersebut disorot dalam warna dan terjemahannya ditawarkan, yang dapat dimasukkan ke dalam teks terjemahan secara otomatis.

Sarana untuk mencari fragmen teks. Alat ini sangat berguna saat mengedit terjemahan. Jika dalam proses pekerjaan versi terjemahan yang lebih berhasil dari setiap fragmen teks ditemukan, maka fragmen ini dapat ditemukan di semua segmen TM, setelah itu perubahan yang diperlukan dilakukan secara berurutan pada segmen TM.

Tentu saja, seperti produk perangkat lunak lainnya, sistem TM memiliki kelebihan dan kekurangan, dan ruang lingkupnya. Namun, sehubungan dengan sistem TM, kelemahan utama adalah biayanya yang tinggi.

Sangat nyaman untuk menggunakan sistem TM saat menerjemahkan dokumen seperti manual pengguna, instruksi pengoperasian, desain dan dokumentasi bisnis, katalog produk dan dokumen lain dari jenis yang sama dengan banyak kecocokan.

Dokumen yang dibuat dalam bahasa asing, agen perjalanan harus diterjemahkan ke dalam bahasa Rusia. Jika tidak, biaya untuk mereka tidak akan diterima untuk tujuan pajak. Namun, terkadang terjemahan tidak diperlukan. Misalnya, jika kita berbicara tentang detail tiket elektronik yang dikodekan dalam bahasa Latin (surat dari Layanan Pajak Federal Rusia tertanggal 7 Juni 2011 No. ED-4-3 / 8983).

Kebutuhan terjemahan dokumen
Sesuai dengan paragraf 1 Pasal 16 Undang-Undang Federasi Rusia 25 Oktober 1991 No. 18071 “Tentang bahasa rakyat Federasi Rusia”, pekerjaan kantor resmi di organisasi di negara kita dilakukan dalam bahasa Rusia .

Dan sebagaimana diabadikan dalam paragraf 9 Peraturan tentang akuntansi dan pelaporan keuangan di Federasi Rusia, disetujui atas perintah Kementerian Keuangan Rusia tanggal 29 Juli 1998 No. 34n, akuntansi properti, kewajiban dan transaksi bisnis (fakta ekonomi aktivitas) dicatat dalam mata uang Federasi Rusia - dalam rubel .

Pada saat yang sama, dokumentasi properti, kewajiban, dan fakta lain dari kegiatan ekonomi, pemeliharaan register akuntansi dan pelaporan dilakukan dalam bahasa Rusia. Lebih lanjut dikatakan: dokumen akuntansi utama yang dibuat dalam bahasa lain harus memiliki terjemahan baris demi baris ke dalam bahasa Rusia.

Berdasarkan norma-norma ini, otoritas pengatur menyimpulkan bahwa dokumen utama, jika dibuat dalam bahasa asing, harus diterjemahkan ke dalam bahasa Rusia. Pendapat ini secara khusus diungkapkan dalam surat Kementerian Keuangan Rusia tanggal 3 November 2009 No. 03-03-06/725, tanggal 14 September 2009 No. 03-03-05/170 tanggal Februari. 16, 2009 No. 03- 03-05/23.

Meskipun organisasi berhasil mempertahankan pengeluaran di pengadilan, yang dikonfirmasi oleh dokumen tanpa terjemahan (keputusan Layanan Antimonopoli Federal Distrik Moskow tanggal 21 April 2011 No. KA-A40 / 2152-11, tanggal 8 Oktober 2008 No. KA -A40 / 8061-08).

Juga, arbiter paling sering memihak pembayar pajak, menunjukkan bahwa kurangnya terjemahan dokumen ke dalam bahasa Rusia tidak dapat dijadikan dasar untuk menolak pemotongan PPN. Contohnya adalah resolusi Layanan Antimonopoli Federal Distrik Moskow pada 1 April 2009 No. KA-A40 / 132809, 16 Maret 2009 No. KA-A40 / 1450-09, Layanan Antimonopoli Federal dari Distrik Siberia Barat 5 Maret 2007 No. F04-979 /2007(31967-A45-14).

Namun, jika dokumen agen perjalanan tidak memiliki terjemahan, kemungkinan besar perlu untuk mempertahankan kemungkinan akuntansi pajak untuk pengeluaran atau hak untuk pengurangan di pengadilan. Dalam hal ini, hasil litigasi mungkin tidak menguntungkan wajib pajak.

Bagaimana menerjemahkan dokumen
Departemen keuangan mengklarifikasi bahwa penerjemahan dapat dilakukan oleh penerjemah profesional dan organisasi itu sendiri, atau lebih tepatnya, karyawannya (surat tertanggal 14 September 2009 No. 03-03-05 / 170, tanggal 20 Maret 2006 No. 03 -02-07 /1-66).

Pada saat yang sama, undang-undang tidak menetapkan bagaimana dokumen semacam itu harus dibuat. Oleh karena itu, dapat dieksekusi sebagai dokumen terpisah atau ditulis dalam teks Rusia pada fotokopi dokumen utama asing.

Perlu dicatat bahwa terjemahan juga dapat dilakukan oleh organisasi yang mengeluarkan dokumen utama, misalnya, dalam bentuk sertifikat (surat Kementerian Keuangan Rusia No. 03-03-05/170).

Kapan Anda bisa melakukannya tanpa terjemahan?
Dalam beberapa kasus, dokumen tidak perlu diterjemahkan.

Ini tidak perlu dilakukan, pertama, jika Anda secara teratur menerima dokumen standar dari rekanan asing Anda, di mana hanya indikator numerik yang berbeda (nomor, tanggal dokumen, harga, dll.), cukup menerjemahkan bentuk dokumen ke dalam bahasa Rusia sekali. Penjelasan mengenai masalah ini diberikan dalam surat Kementerian Keuangan Rusia tertanggal 3 November 2009 No. 03-03-06/1/725.

Kedua, tidak diperlukan untuk menerjemahkan informasi yang tidak penting untuk mengkonfirmasi biaya yang dikeluarkan.

Misalnya, syarat penerapan tarif, aturan transportasi udara, aturan pengangkutan bagasi. Pejabat departemen keuangan utama memperhatikan hal ini dalam surat tertanggal 14 September 2009 No. 03-03-05 / 170.

Ketiga, tidak perlu menerjemahkan detail formal (dikodekan) dari tiket elektronik yang diisi menggunakan karakter Latin (surat dari Layanan Pajak Federal Rusia tertanggal 7 Juni 2011 No. ED-4-3 / 8983, tertanggal 26 April). , 2010 No. -37- 3/ [dilindungi email]).

Tetapi ketika nilai-nilai dalam tiket elektronik sebenarnya ditunjukkan dalam bahasa asing dan tidak sesuai dengan nilai atau kode yang diformalkan (dikodekan) sesuai dengan Unified International Codifiers, maka indikator (nilai) tiket tersebut adalah tunduk pada terjemahan ke dalam bahasa Rusia.

Akuntansi untuk biaya terjemahan
Dalam akuntansi, biaya perusahaan perjalanan untuk pembayaran layanan penerjemahan termasuk dalam pengeluaran lain di bulan di mana mereka disediakan. Hal ini tercermin dalam entri debet akun 91 "Penghasilan dan pengeluaran lain-lain" (sub-akun "Beban lain-lain") dan kredit akun 76 "Penyelesaian dengan berbagai debitur dan kreditur" (klausul 11, 16, 18 PBU 10/99 "Pengeluaran organisasi").

Pengeluaran semacam itu juga diterima untuk tujuan perpajakan laba - sebagai bagian dari yang lain sebagai pembayaran untuk layanan informasi (subklausul 14, klausul 1, pasal 264 Kode Pajak Federasi Rusia) atau sebagai pengeluaran lainnya. Tentang ini - dalam surat Layanan Pajak Federal Rusia untuk Moskow tertanggal 26 Mei 2008 No. 20-12 / 050126. Benar, aturan ini berlaku untuk biaya terjemahan pihak ketiga.

Ingatlah bahwa untuk memenuhi persyaratan Pasal 252 Kode Pajak Federasi Rusia, biaya penerjemahan dokumen harus didokumentasikan.

Dengan "penyederhanaan" untuk memperhitungkan biaya tersebut tidak akan bekerja. Karena mereka tidak diatur dalam daftar tertutup pengeluaran yang diizinkan (klausul 1 pasal 346.16 Kode Pajak Federasi Rusia).

Penting untuk diingat

Biaya terjemahan dokumen pihak ketiga dapat dikurangkan untuk tujuan pajak penghasilan. Tetapi tidak mungkin menerimanya dengan “penyederhanaan”.

Pengetahuan bahasa asing bukan hanya keterampilan yang berguna dalam kehidupan sehari-hari, tetapi juga salah satu syarat utama saat melamar pekerjaan. Saat ini, kebutuhan akan pengetahuan satu atau bahkan beberapa bahasa asing menjadi semakin relevan.

Pengetahuan bahasa (Bahasa Inggris atau Jerman) diperlukan bagi sekretaris tidak hanya ketika bepergian berlibur ke luar negeri, tetapi juga ketika menerima mitra bisnis dari luar negeri, dalam kehidupan sehari-hari ketika membaca berita atau menonton film. Oleh karena itu, sejumlah besar rutinitas rutin dan operasi sehari-hari yang sebelumnya tidak memerlukan pengetahuan bahasa asing, hari ini, karena perkembangan proses integrasi internasional dan keinginan luas bisnis untuk globalisasi, menjadi semakin sulit jika Anda hanya mengandalkan satu bahasa.

Namun saat ini, pengetahuan bahasa asing saja tidak cukup, karena volume informasi yang perlu diterjemahkan setiap hari telah meningkat secara signifikan. Pada saat yang sama, tugas ini berhasil diselesaikan, dan tidak sulit bagi siapa pun untuk menerjemahkan kontrak atau konten situs asing hanya dalam beberapa detik. Dan semua karena dalam hal ini program terjemahan terlibat dalam terjemahan: seseorang tidak punya waktu untuk mengedipkan mata, dan terjemahannya sudah siap.

Target Pelajaran ini adalah untuk membantu siswa mendapatkan ide tentang kamus komputer dan sistem terjemahan mesin, untuk memperkenalkan kemampuan program ini, untuk mengajarkan cara menggunakan program ini.

Unduh:


Pratinjau:

Topik pelajaran: "Sistem terjemahan mesin teks dan kamus komputer"

Tujuan Pelajaran:

  • untuk membantu siswa mendapatkan ide tentang kamus komputer dan sistem terjemahan mesin, untuk mengenalkan mereka dengan kemampuan program ini, untuk mengajarkan cara menggunakan program ini.
  • perkembangan minat kognitif, pengendalian diri, kemampuan mencatat.
  • pendidikan budaya informasi siswa, perhatian, ketepatan, disiplin, ketekunan.

Jenis pelajaran: pelajaran mempelajari materi baru

Peralatan:

komputer, proyektor, layar, presentasi komputer.

Selama kelas:

I.Org. momen

Salam, memeriksa yang hadir.

II. Pembaruan pengetahuan

Pengetahuan tentang setidaknya satu bahasa asing diperlukan hari ini untuk semua orang, seperti udara. Khusus untuk pengguna: lagi pula, tidak mungkin menghindari tabrakan dengan bahasa Inggris saat bekerja di komputer. Nah, jika itu hanya menyangkut file dengan dokumentasi untuk program (yang secara tradisional tidak ada yang membaca di negara kita) atau nama menu program (yang dapat Anda pelajari untuk menavigasi tanpa mengetahui bahasanya, dengan poke dan cramming ilmiah).

Itu buruk jika Anda tidak tahu bahasa asing... Namun, saya minta maaf - sebagian - Anda dapat membantu dengan menginstal salah satu program terjemahan khusus di komputer Anda atau menggunakan kamus komputer.

Tuliskan topik pelajaran “Sistem terjemahan mesin untuk teks
dan kamus komputer.

Hari ini dalam pelajaran Anda akan mendapatkan ide tentang kamus komputer dan sistem terjemahan teks otomatis dan berkenalan dengan kemampuan program ini.

AKU AKU AKU. Pengenalan materi baru

Dengan munculnya tulisan, orang menerima alat yang ampuh untuk menyimpan pengetahuan dan untuk komunikasi. Tulisan pertama yang sampai kepada kita di dinding kuil dan makam menceritakan tentang perbuatan raja dan jenderal yang terjadi berabad-abad yang lalu. Selain itu, masyarakat mencatat hasil kegiatan ekonomi agar berhasil berdagang, memungut pajak, dll.

Untuk memfasilitasi komunikasi tertulis antara orang-orang, kamus pertama dibuat. Salah satu kamus ini ditulis oleh pendeta Sumeria di atas lempengan tanah liat. Setiap tablet dibagi menjadi dua bagian yang sama. Di satu sisi, sebuah kata Sumeria ditulis, dan di sisi lain, sebuah kata dengan arti yang sama dalam bahasa lain, terkadang dengan penjelasan singkat. Sejak saat itu hingga saat ini, struktur kamus tidak banyak berubah.

Saat ini, terdapat ribuan kamus untuk menerjemahkan antara ratusan bahasa (Inggris-Rusia, Jerman-Prancis, dan sebagainya), dan masing-masing dapat berisi puluhan ribu kata.

Dalam versi kertas, kamus adalah buku tebal dengan ratusan halaman, di mana mencari kata yang tepat adalah proses yang agak melelahkan.

Globalisasi dunia kita saat ini mengarah pada kebutuhan untuk bertukar dokumen antara orang-orang dan organisasi yang berlokasi di berbagai negara di dunia dan berbicara dalam bahasa yang berbeda.

Dalam kondisi ini, penggunaan teknologi terjemahan manual tradisional menghambat perkembangan kontak antaretnis. Penerjemahan manual dari dokumentasi multi-halaman membutuhkan waktu yang lama dan upah yang tinggi bagi para penerjemah. Penerjemahan email yang diterima atau halaman Web yang dilihat di browser harus segera dilakukan, dan tidak ada kesempatan dan waktu untuk mengundang penerjemah.

Sistem terjemahan mesin memecahkan masalah ini.

Dengan munculnya komputer pribadi, kamus elektronik mulai dibuat, yang memudahkan untuk menemukan kata yang tepat dan menawarkan banyak fungsi baru yang berguna (menyuarakan kata, mencari sinonim, dll.).

Teknologi terjemahan mesin telah ditingkatkan secara bertahap. Dan jika kualitas dan kecepatan terjemahan dari sistem pertama masih banyak yang diinginkan, sekarang komputer benar-benar dapat menerjemahkan teks dari satu bahasa ke bahasa lain dengan cara yang koheren. Dan sistem yang lebih modern dengan kualitas yang dapat diterima menerjemahkan 1 halaman teks dalam 1 detik.

Kamus komputer bersifat multibahasa.

Mereka memungkinkan pengguna untuk memilih bahasa dan arah terjemahan (misalnya, Inggris-Rusia, Spanyol-Rusia, dll.)

Selain kamus utama kata-kata yang umum digunakan, mereka dapat berisi lusinan kamus khusus di bidang pengetahuan (teknologi, kedokteran, dll.)

Menyediakan pencarian cepat untuk entri kamus.

Memungkinkan Anda memasukkan frasa dan teks.

Mungkin multimedia, mis. memberikan pengguna kesempatan untuk mendengarkan kata-kata yang dilakukan oleh pembicara, penutur asli.

Persyaratan dasar untuk penerjemah komputer

Efisiensi terdiri dari kemungkinan pembaruan konstan kosakata dan bagian tematik.

Fleksibilitas dirancang untuk area subjek tertentu.

Kecepatan - kemungkinan input otomatis dan pemrosesan informasi teks dari kertas. Salah satu sistem tersebut (OCR-System) menggantikan lebih dari sepuluh juru ketik berpengalaman setiap hari.

Ketepatan adalah literasi dan transfer makna teks terjemahan yang memadai ke dalam bahasa sasaran.

Sistem terjemahan komputer memiliki pro dan kontra.

pro

Kecepatan terjemahan tinggi. Sistem terjemahan komputer memungkinkan Anda menerjemahkan dokumen multi-halaman dengan kecepatan tinggi.

Keserbagunaan.Seorang penerjemah profesional, sebagai suatu peraturan, memiliki spesialisasi dalam menerjemahkan teks dari subjek tertentu. Program terjemahan memungkinkan Anda menerjemahkan dokumentasi teknis, korespondensi bisnis, dan teks khusus lainnya dengan kualitas yang memadai.

Biaya terjemahan rendah. Menggunakan jasa penerjemah profesional, kami terpaksa membayar uang untuk setiap halaman terjemahan. Namun, seringkali tidak perlu mendapatkan terjemahan teks yang sempurna, tetapi Anda perlu menangkap arti dari surat yang dikirim atau konten halaman di Internet. Dalam hal ini, sistem penerjemahan pasti akan menjadi asisten yang andal dan efektif.

Kerahasiaan. Banyak pengguna secara teratur menggunakan sistem terjemahan mesin untuk menerjemahkan surat pribadi, karena tidak setiap orang siap untuk memberikan korespondensi pribadi penerjemah luar atau mempercayakan terjemahan dokumen komersial atau keuangan.

Terjemahan online dan terjemahan konten web. Memungkinkan Anda menerjemahkan halaman web secara real time. Layanan terjemahan online selalu siap sedia dan akan membantu Anda menerjemahkan informasi dengan cepat pada waktu yang tepat. Selain itu, hari ini, dengan bantuan sistem terjemahan, Anda dapat menerjemahkan konten halaman Internet dan permintaan mesin pencari.

minus

Tetapi sistem ini tidak dapat sepenuhnya diandalkan. Merekamembuat kesalahan semantik dan gaya dan tidak berlaku untuk terjemahan karya seni, karena mereka tidak mampu menerjemahkan metafora, alegori, dan elemen lain dari kreativitas artistik manusia secara memadai.

Ini terjadi karena mereka menerjemahkan teks berdasarkan "pengetahuan" formal: sintaksis bahasa (aturan untuk membangun kalimat), aturan pembentukan kata, dan penggunaan kamus.

Penggunaan terjemahan mesin tanpa penyesuaian topik adalah sasaran dari banyak lelucon Internet.

Ungkapan "Kucing kami melahirkan tiga anak kucing - dua putih dan satu hitam", yang diubah oleh penerjemah online PROMT menjadi "Kucing kami melahirkan tiga anak kucing - dua putih dan satu Afrika-Amerika." Jika “African American” masih bisa dibuat “hitam” dengan menulis “black kitten”, maka “cat” tidak bisa mengubah jenis kelamin: misalnya, kucing betina diterjemahkan sebagai “kucing betina”.

Program tidak mengenali konteks frasa dan menerjemahkan istilah kata demi kata, selain tidak membedakan nama diri dari kata biasa. Penerjemah PROMT yang sama mengubah "Leo Tolstoy" menjadi "Singa Tebal" ("singa gemuk").

Google Translator, sebaliknya, sering mengambil kata "rice" (beras) untuk nama keluarga mantan Menteri Luar Negeri AS.

Apa yang harus dilakukan untuk menghindari kesalahan seperti itu?

  • Sebelum Anda mulai menerjemahkan, Anda perlutentukan jenis teks, yaitu, dari bidang kehidupan manusia mana ia diwakili (ekonomi, olahraga, sains, dll.). Lagi pula, setiap daerah memiliki nuansa dan istilahnya sendiri.
  • Kesalahan penerjemahan sering disebabkan oleh salah ketik teks yang diterjemahkan. Ini juga berlaku untuk teks yang dikenali. Kata-kata dengan kesalahan ditandai oleh penerjemah sebagai tidak dikenal, karena tidak ada dalam kamus dalam bentuk ini. Lebih buruk lagi jika adakesalahan dalam tanda baca- satu koma yang salah ditempatkan dapat mendistorsi terjemahan seluruh kalimat.
  • Bekerja dengan cuplikan teks. Jangan pernah menerjemahkan seluruh teks sekaligus. Itu akan selalu berisi kata-kata yang tidak ada dalam kamus dan kata-kata yang tidak diterjemahkan oleh sistem dengan benar.

Penerjemah komputer online di Internet menyediakan pilihan kamus tematik dan arah terjemahan. Mereka memungkinkan Anda untuk menerjemahkan teks apa pun yang diketik di jendela terjemahan atau disalin dari clipboard, halaman web, termasuk hyperlink, serta email.

Yang paling populer adalah Google,PROMT, Yandex.translation.

Translate.ru adalah layanan web Rusia pertama yang dirancang untuk menerjemahkan teks atau halaman web ke bahasa lain. Saat menerjemahkan satu kata, itu menghasilkan entri kamus. Dibuka pada tanggal 6 Maret 1998 oleh PROMT.

Yandex.Translation adalah layanan web Yandex yang dirancang untuk menerjemahkan sebagian teks atau halaman web ke bahasa lain. Sistem membangun kamus korespondensinya berdasarkan analisis jutaan teks yang diterjemahkan. Teks untuk terjemahan pertama-tama dibandingkan oleh komputer dengan basis data kata-kata, kemudian dengan basis data model bahasa, mencoba menentukan makna ungkapan dalam konteksnya.

Google Translate adalah layanan web Google yang dirancang untuk menerjemahkan bagian teks atau halaman web secara otomatis ke bahasa lain. Untuk beberapa bahasa, opsi terjemahan ditawarkan kepada pengguna, misalnya, untuk istilah teknis yang harus disertakan dalam pembaruan sistem terjemahan di masa mendatang. Layanan ini juga mencakup terjemahan seluruh halaman web dan bahkan pencarian informasi secara simultan dengan terjemahan ke bahasa lain.

Menggunakan sistem terjemahan mesin dapat secara signifikan mengurangi waktu yang dibutuhkan untuk menerjemahkan teks. Yang terbaik di antara sistem terjemahan mesin Rusia adalahPROMT, ABBYY Lingvo, Multitran, SlovoEd.

Kamus elektronik ABBYY Lingvo. Versi multibahasa mencakup 15 bahasa. ABBYY Lingvo tidak memiliki fungsi terjemahan teks lengkap, tetapi terjemahan kata demi kata dari teks dari clipboard dimungkinkan.

Kamus elektronik Promt. PROMT menawarkan program terjemahan dan kamus PROMT untuk menerjemahkan teks dari bahasa Inggris, Jerman, Prancis, Spanyol, dan bahasa lainnya ke dalam bahasa Rusia dan sebaliknya. Solusi lengkap untuk terjemahan otomatis dokumen bisnis dan teknis, email, situs web, dan presentasi.

Penerjemah tersedia tidak hanya untuk komputer pribadi, tetapi juga untuk ponsel, tablet, dan perangkat lainnya.

Misalnya, untuk menerjemahkan paragraf teks yang diperlukan dengan cepat dan mudah, sebuah program untuk Android - Penerjemah Cepat telah dibuat. Keuntungan utamanya adalah menerjemahkan teks setelah menyalinnya ke clipboard. Yang harus Anda lakukan adalah menyorot bagian teks yang Anda butuhkan untuk mendapatkan terjemahan cepat langsung di tablet atau ponsel Android Anda.

IV. Konsolidasi materi yang dipelajari

Kita bertemu di kelaskamus komputer dan sistem terjemahan teks otomatis dan kemampuan program ini.

1. Apa saja persyaratan untuk penerjemah komputer?

2. Apa kelebihan kamus komputer dibandingkan kamus kertas tradisional?

3. Kapan sebaiknya menggunakan sistem terjemahan komputer?

4. Teks apa yang tidak boleh diterjemahkan menggunakan penerjemah komputer?

5. Apa nama sistem terjemahan mesin Rusia terbaik?

V. Pekerjaan Rumah

Mempersiapkan kerja praktek

VI. Ringkasan pelajaran.

Menyimpulkan pelajaran. Penilaian.

DAFTAR PUSTAKA YANG DIGUNAKAN

Mikheeva E.V. Teknologi informasi dalam kegiatan profesional. – M.: Akademi, 2006. – 384 hal.

Sapkov V.V. Teknologi informasi dan komputerisasi pekerjaan kantor. – M.: Akademi, 2006. – 288 hal.

Jenis sistem terjemahan mesin //logrus.ru