Компьютерные словари и системы машинного перевода текстов. План-конспект урока на тему: Урок МДК "Системы машинного перевода текстов и компьютерные словари"

Компьютерные словари и системы машинного перевода текстов

Компьютерные словари. Словари необходимы для перевода текстов с одного языка на другой. Существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и т. д.), причем каждый из них может содержать десятки тысяч слов. В бумажном варианте словарь представляет собой толстую книгу объемом в сотни страниц, в которой поиск нужного слова является достаточно долгим и трудоемким процессом.

Компьютерные словари могут содержать переводы на разные языки сотен тысяч слов и словосочетаний, а также предоставляют пользователю дополнительные возможности. Во-первых, компьютерные словари могут являться многоязычными - давать пользователю возможность выбрать языки и направление перевода (например, англо-русский, испанско-русский и т. д.).

Во-вторых, компьютерные словари могут кроме основного словаря общеупотребительных слов содержать десятки специализированных словарей по областям знаний (техника, медицина, информатика и др.).

В-третьих, компьютерные словари обеспечивают быстрый поиск словарных статей: "быстрый набор", когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода словосочетаний и др.

В-четвертых, компьютерные словари могут являться мультимедийными, т. е. предоставлять пользователю возможность прослушивания слов в исполнении дикторов, носителей языка.

Системы компьютерного перевода. Процесс глобализации мира приводит к необходимости частого обмена документами между людьми и организациями, находящимися в разных странах мира и говорящими на различных языках.

В этих условиях использование традиционной технологии перевода "вручную" тормозит развитие межнациональных контактов. Перевод многостраничной документации вручную требует длительного времени и высокой оплаты труда переводчиков. Перевод полученного по электронной почте письма или просматриваемой в браузере Web-страницы необходимо осуществлять срочно, и нет времени пригласить переводчика.

Системы компьютерного перевода позволяют решить эти проблемы. Они, с одной стороны, способны переводить многостраничные документы с высокой скоростью (одна страница в секунду), с другой стороны, переводить Web-страницы "на лету", в режиме реального времени.

Системы компьютерного перевода осуществляют перевод текстов, основываясь на формальном "знании": синтаксиса языка (правил построения предложений), правил словообразования и использовании словарей. Программа-переводчик сначала анализирует текст на одном языке, а затем конструирует этот текст на другом языке.

Современные системы компьютерного перевода позволяют достаточно качественно переводить техническую документацию, деловую переписку и другие специализированные тексты. Однако они не применимы для перевода художественных произведений, так как не способны адекватно переводить метафоры, аллегории и другие элементы художественного творчества человека.

Контрольные вопросы

    1. Какими преимуществами обладают компьютерные словари по сравнению с традиционными бумажными словарями?
    2. В каких случаях целесообразно использовать системы компьютерного перевода?

Системы оптического распознавания документов

Системы оптического распознавания символов. Системы оптического распознавания символов используются при создании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат.

Сначала с помощью сканера необходимо получить изображение страницы текста в графическом формате. Далее для получения документа в текстовом формате необходимо провести распознавание текста, т. е. преобразовать элементы графического изображения в последовательность текстовых символов.

Системы оптического распознавания символов сначала определяют структуру размещения текста на странице и разбивают его на отдельные области: колонки, таблицы, изображения и т. д. Далее выделенные текстовые фрагменты графического изображения страницы разделяются на изображения отдельных символов.

Для отсканированных документов типографского качества (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений) распознавание символов проводится путем их сравнения с растровыми шаблонами.

Растровое изображение каждого символа последовательно накладывается на растровые шаблоны символов, хранящиеся в памяти системы оптического распознавания. Результатом распознавания является символ, шаблон которого it наибольшей степени совпадает с изображением (рис. 3.16).

При распознавании документов с низким качеством печати (машинописный текст, факс и т. д.) используется векторный метод распознавания символов. В распознаваемом изображении символа выделяются геометрические примитивы (отрезки, окружности и др.) и сравниваются с векторными шаблонами символов. В результате выбирается тот символ, для которого совокупность всех геометрических примитивов и их расположение больше всего соответствует распознаваемому символу (рис. 3.17).

Системы оптического распознавания символов являются "самообучающимися" (для каждого конкретного документа они создают соответствующий набор шаблонов символов), и поэтому скорость и качество распознавания многостраничного документа постепенно возрастают.

С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ.

Системы оптического распознавания форм. При заполнении документов большим количеством людей (например, при сдаче выпускником школы единого государственного экзамена (ЕГЭ)) используются бланки с пустыми полями. Данные вводятся в поля печатными буквами от руки. Затем эти данные распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных.

Сложность состоит в том, что необходимо распознавать символы, написанные от руки, которые довольно сильно различаются у разных людей. Кроме того, такие системы должны уметь определять, к какому полю относится распознаваемый текст.

Контрольные вопросы

    1. В чем состоят различия в технологии распознавания текста при использовании растрового и векторного методов?

№ 8. Кодирование текстовой информации.

№ 9. Создание визитных карточек на основе шаблона.

№ 10. Установка параметров страницы документа, вставка колонтитулов и номеров страниц.

№ 11. Вставка в документ формул.

№ 12. Форматирование символов и абзацев.

№ 13. Создание и форматирование списков.

№ 14. Вставка оглавления в документ, содержащий заголовки.

№ 15. Вставка в документ таблицы, ее форматирование и заполнение данными.

№ 16. Создание гипертекстового документа.

№ 17. Перевод текста с помощью компьютерного словаря.

№ 18. Сканирование и распознавание бумажного текстового документа.

Одновременно с широким использованием новых информационных технологий появилось понятие «информационная система» (ИС). Информационная система осуществляет сбор, передачу и переработку информации об объекте, снабжающую работников различного уровня информацией для реализации функции управления.

Компьютерные справочные правовые системы (СПС) - это базы данных, содержащие нормативные документы, регулирующие важнейшие сферы общественных отношений. Существующие на сегодняшний день справочно-правовые системы, пройдя определенную государственную регистрацию и сертификацию, становятся вполне доступными для потенциальн ых пользователей (юридических или физических лиц), последние имеют возможность, обращаясь к содержимому СПС, устранять существующие пробелы в области знаний правового характера.

В середине XX в. во всех развитых странах начался стремительный рост правовой информации. Число законодательных и иных нормативных правовых актов достигает сотен тысяч, что приводит к возникновению информационного кризиса. Изначально считалось, что СПС создают лишь дополнительное удобства при работе с информацией, а без их использования вполне можно обойтись. Однако когда начались масштабные пересмотр и перестройка всего российского законодательства, уследить за огромным потоком вновь принятых нормативных актов стало невозможно. Поэтому к середине 1994 г. число потенциальных покупателей пакетов юридических программ значительно возросло.

Традиционные методы получения информации, например, использование периодических печатных изданий или других печатных источников, не были способны разрешить задачу по правовому обеспечению всех заинтересованных лиц. Компьютер же представлял собой замечательное средство аккумуляции, хранения и выдачи правовой информации.

Сегодня большинству профессиональных юристов важна возможность получения максимально полной справочной, информационной и правовой информации. Ускорившийся ритм бизнеса и новые условия хозяйствования потребовали создания компьютерных правовых справочных систем, представляющих собой правовые базы данных.

Основная задача справочных правовых систем – донести максимальный объем достоверной правовой информации до предельного количества пользователей с различным уровнем компьютерной подготовки. Кроме того, система должна обеспечиваться постоянным обновлением баз данных.

Компьютерные справочные правовые системы обладают рядом важнейших свойств, которые делают их практически незаменимыми при работе с нормативно-правовой информацией.

Во-первых, это возможность работы с огромными массивами текстовой информации - объем информации в базе практически не ограничен, это позволяет ежедневно ее обновлять путем внесения в нее нескольких десятков документов, одновременно храня базы архивных документов и т.д.

Во-вторых, использование в СПС специальных поисковых программных средств позволяет производить поиск в режиме реального времени по всей информационной базе.

Третье достоинство заключается в том, что возможность работы СПС с использованием телекоммуникационных средств, т.е. с применением электронной почты или глобальных сетей, позволяет обновлять информационные базы, и в тоже время не расходовать дисковое пространство на компьютере пользователя. Однако следует отметить, что наибольшим спросом пока пользуются модификации СПС с локальными базами данных.

Правовая информация не может быть получена из одного источника, что в свою очередь, приводит к необходимости сбора информации с мест. В связи с этим в создании Общенациональной системы правовой информации все большую роль играют негосударственные компьютерные фирмы и компании, выпускающие на рынок электронные версии юридической информации.

Широкий спектр юридических компьютерных систем – уникальное явление российского рынка делового программного обеспечения.

Обеспечение работников правоохранительных органов актуальной, полной и достоверной законодательной информацией, сведениями об изменениях и дополнениях, вносимых в нормативно-правовые документы, является одной из первоочередных задач. Однако ежедневно только органами высшей государственной власти принимается в среднем несколько десятков нормативных актов. Более того, для эффективной работы нередко требуется наличие нормативных актов, принимаемых субъектами РФ, а также ведомственных документов.

В настоящее время растет конкуренция между фирмами, производителями справочных правовых систем, повышаются запросы пользователей. Если еще недавно было достаточно лишь найти нужный документ, то сегодня зачастую необходимо еще и проследить все возможные связи между документами, получить разъяснения, подготовить обзор по интересующей теме, создать свою пользовательскую базу данных. Информационные базы достаточно объемны, часто содержат уникальные документы, однако, работа массового пользователя с такими системами затруднена ввиду отсутствия эффективных каналов поддержки обновления базы, сервисного обслуживания систем и т.п. Поэтому широкое признание пользователей получили коммерческие СПС, такие как «Консультант Плюс», «Гарант», «Кодекс».

Сравнивать и оценивать справочные правовые системы можно по следующим критериям:

  • степень аутентичности документов оригиналу
  • юридическая обработка документов
  • объем информационного банка; формирования пользовательской базы
  • скорость поиска документов по базе
  • актуальность информации и оперативность поступления документов
  • возможность удаленного доступа к базе

Таким образом, справочно-правовые системы, являясь носителями информации правового характера, позволяют ликвидировать правовую безграмотность, облегчают работу специалистам (юристам, бухгалтерам, руководителям), многократно повышая их производительность труда при решении правовых вопросов. Решение этих задач существенным образом влияет на изменение правовой действительности, на ее оздоровление, на состояние законности.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

1. Компьютерные словари

2. Системы компьютерного перевода

3. Системы машинного перевода

4 . Онлайновые переводчики

Заключение

Список используемой литературы

Введение

Современные системы компьютерного перевода позволяют с приемлемым качеством переводить техническую документацию, деловую переписку и другие специализированные тексты. Но на эти системы нельзя полностью полагаться. Они допускают смысловые и стилистические ошибки и неприменимы, например, для перевода художественных произведений, так как не способны адекватно переводить метафоры, аллегории и другие элементы художественного творчества человека и т. д.

Существуют способы улучшения результатов машинного перевода:

1. Перед началом перевода, нужно определить тип текста, то есть из какой области жизнедеятельности человека он представлен (экономика, спорт, наука и т.д.). Ведь каждая сфера имеет свои нюансы и термины.

2. Часто причиной неправильного перевода являются опечатки переводимом тексте. Это касается и распознанных текстов. Слова с ошибками помечаются переводчиками как незнакомые, потому что в таком виде их нет в словарях. Хуже, если есть ошибки в пунктуации - одна неправильно поставленная запятая способна исказить перевод всего предложения.

3. Работайте с фрагментами текста. Никогда не переводите весь текст сразу. В нем всегда найдутся слова, отсутствующих в словаре и такие, которые система переводит неправильно.

С помощью программ-переводчиков можно успешно переводить техническую документацию, деловую переписку и другие текстовые материалы, написанные «сухим» языком. Перевод художественных текстов, эмоционально окрашенных, богатых гиперболами, метафорами и др., в полной мере может выполнить только человек.

Программы переводчики:

-знание хотя бы одного иностранного языка необходимо сегодня всем, как воздух. В особенности пользователям: ведь избежать столкновения с английским языком при работе на компьютере, увы, невозможно.

- помочь могут установленные на компьютере специализированные программы-переводчики.

Словарь - это неотъемлемая часть библиотеки каждого интеллигентного человека. Ими также пользуются самые любопытные дети. А учителя и преподаватели утверждают - гортание словаря "от нечего делать" очень полезное дело. Без них не обойдется ни студент, ни школьник, ни даже ученый. Специалисты из разнообразных сфер часто заглядывают в словари по тысячам вопросам. Даже очень хорошие переводчики перед работой, все равно кладут на стол несколько словарей.

компьютерный словарь перевод интернет

1 . Компьютерные словари

Компьютерные словари. Словари необходимы для перевода текстов с одного языка на другой. Первые словари были созданы около 5 тысяч лет назад в Шумере и представляли собой глиняные таблички, разделенные на две части. В одной части записывалось слово на шумерском языке, а в другой -- аналогичное по значению слово на другом языке, иногда с краткими пояснениями.

Словари и электронная книга оказались очень взаимосвязанными между собой - за последнее время компьютерный словарь научился самостоятельно искать, находить и озвучивать искомое слово. Иногда он будет полезен и другим членам семьи при переводе электронного письма от знакомого из-за рубежа, или каких-либо инструкций к технике.

Современные словари построены по такому же принципу. В настоящее время существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и т. д.), причем каждый из них может содержать десятки тысяч слов. В бумажном варианте словарь представляет собой толстую книгу объемом в сотни страниц, в которой поиск нужного слова -- процесс достаточно трудоемкий.

Компьютерные словари могут содержать переводы на разные языки сотен тысяч слов и словосочетаний, а также предоставляют пользователю дополнительные возможности:

§ *существуют многоязычные компьютерные словари, позволяющие пользователю выбрать языки и направление перевода (например, англо-русский, испано-русский и т. д.);

§ *компьютерные словари могут кроме основного словаря общеупотребительных слов содержать десятки специализированных словарей по областям знаний (техника, медицина, информатика и др.);

§ *компьютерные словари обеспечивают быстрый поиск словарных статей: «быстрый набор», когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода словосочетаний и др.;

§ компьютерные словари могут являться мультимедийными, т. е. предоставлять пользователю возможность прослушивания слов в исполнении дикторов, носителей языка;

* онлайновые компьютерные словари в Интернете обеспечивают выбор тематического словаря и направления перевода.

Дополнительные возможности компьютерных словарей

· Во-первых , компьютерные словари могут являться многоязычными, так как дают пользователю возможность выбрать языки и направление перевода (например, англо-русский, испано-русский и так далее).

· Во-вторых , компьютерные словари могут кроме основного словаря общеупотребительных слов содержать десяткиспециализированных словарей по областям знаний (техника, медицина, информатика и др.).

· В-третьих , компьютерные словари обеспечивают быстрый поиск словарных статей: «быстрый набор», когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода словосочетаний и др.

· В-четвертых , компьютерные словари могут являться мультимедийными, то есть предоставлять пользователю возможность прослушивания слов в исполнении дикторов, носителей языка.

2 . Системы компьютерного перевода

Происходящая в настоящее время глобализация нашего мира приводит к необходимости обмена документами между людьми и организациями, находящимися в разных странах мира и говорящими на различных языках.

В этих условиях использование традиционной технологии перевода «вручную» тормозит развитие межнациональных контактов. Перевод многостраничной документации вручную требует длительного времени. Перевод полученного по электронной почте письма или просматриваемой в браузере Web-страницы необходимо осуществить «здесь и сейчас», и нет возможности и времени пригласить переводчика.

Системы компьютерного перевода позволяют решить эти проблемы. Они, с одной стороны, способны переводить многостраничные документы с высокой скоростью (одна страница в одну секунду), с другой стороны, переводить Web-страницы «на лету», в режиме реального времени.

Системы компьютерного перевода осуществляют перевод текстов, основываясь на формальном «знании» языка: синтаксиса языка (правил построения предложений), правил словообразования и использовании словарей. Программа-переводчик сначала анализирует текст на одном языке, а затем конструирует этот текст на другом языке.

Онлайновые компьютерные переводчики в Интернете обеспечивают выбор тематического словаря и направления перевода. Они позволяют переводить любые тексты, набранные в окне перевода или скопированные из буфера обмена, Web-стракицы, включая гиперссылки, с сохранением исходного форматирования, а также электронные письма.

Беспрецедентным преимуществом такого рода словарей есть его цена и удобность: они помещаются на практически любом носителе от компакт-диска до "флешки.

Для перевода текстовых документов применяются программы-переводчики. Они основаны на формальном знании языка -- правил словообразования и правил построения предложений.

3. Системы машинного перевода

· Системы машинного перевода позволяют решить проблемы быстрого перевода многостраничной документации.

· Они, с одной стороны, способны переводить многостраничные документы с высокой скоростью (одна страница в секунду) и, с другой стороны, переводить Web-страницы «на лету», в режиме реального времени. Лучшими среди российских систем машинного перевода считаются PROMT и«Сократ».

Область применения систем машинного перевода

· Системы машинного перевода осуществляют перевод текстов, основываясь на формальном «знании» языка (синтаксиса языка -- правил построения предложений, правил словообразования) и использовании словарей. Программа-переводчик сначала анализирует текст на одном языке, а затем конструирует этот текст на другом языке.

· Современные системы машинного перевода позволяют достаточно качественно переводить техническую документацию, деловую переписку и другие специализированные тексты. Однако они неприменимы для перевода художественных произведений, так как не способны адекватно переводить метафоры, аллегории и другие элементы художественного творчества человека.

Параметры машинных переводчиков должны удовлетворять четырем основным требованиям:

· оперативность

· гибкость

· скорость

· точность

Оперативность заключается в возможности постоянного обновления словарного запаса и тематических разделов.

Гибкость рассчитана на конкретную предметную область.

Скорость - возможность автоввода и обработки текстовой информации с бумаги. Одна такая система (OCR-System) ежедневно заменяет больше десяти опытных машинисток.

Точность заключается грамотности и адекватной передачи смысла переводимого текста на язык перевода.

С помощью программ-переводчиков можно успешно переводить техническую документацию, деловую переписку и другие текстовые материалы, написанные «сухим» языком. Перевод художественных текстов, эмоционально окрашенных, богатых гиперболами, метафорами и др., в полной мере может выполнить только человек. Программа-переводчик сначала анализирует текст на исходном языке, а затем конструирует этот текст на том языке, на который его требуется перевести.

4 . Онлайновые переводчики

Также, с развитием Всемирной Паутины создаты и функционируют так званые онлайновые словари (англ. on-line - в реальном времени) или переводчики.

Онлайн переводчик текстов поддерживает направления перевода для таких языков:

· украинский

· русский

· английский

· польский

· немецкий

· латышский

· французский

Ввод текста и выбор направления перевода .

Исходный текст нужно напечатать либо скопировать в верхнее окно и выбрать направление перевода из выпадающего меню. Например, для русско-украинского перевода, нужно ввести текст на русском языке в верхнее окно и выбрать из выпадающего меню пункт «русский», затем «украинский». Далее необходимо нажать клавишу Перевести

Специализированные словари

Если исходный текст для перевода относится к специфической отрасли, выберите тему специализированного лексического словаря из ниспадающего списка, например, Бизнес, Интернет, Законы, Музыка и другие. По умолчанию используется словарь общей лексики.

Проверка орфографии

Качество перевода зависит от правильности написания исходного текста. Советуем воспользоваться Проверкой орфографии.Проверка орфографии работает для украинского, русского и английского языков.

Транслитерация

При переписке с адресатом, у которого не установлена кириллица, можно воспользоваться транслитерацией. Транслитерация поддерживает русский и украинский языки, и транслитерирует как с латиницы в кириллицу, так и с кириллицы в латиницу.

Виртуальная клавиатура

Если необходимой раскладки нет на вашем компьютере, воспользуйтесь виртуальной клавиатурой. Виртуальная клавиатура предлагается для русского, украинского, английского, немецкого, французского, испанского и итальянского языков.

Заключение

Самое главное:

§ Возможности современных компьютеров по хранению больших массивов информации и осуществлению в них быстрого поиска положены в основу разработки компьютерных словарей и программ-переводчиков. Компьютерные словари выполняют перевод отдельных слов и словосочетаний. Для перевода текстовых документов применяются программы-переводчики.

§ Возможности современных компьютеров по хранению больших массивов данных и осуществлению в них быстрого поиска положены в основу разработки компьютерных словарей и программ-переводчиков.

§ В обычном словаре, содержащем несколько сотен страниц, поиск нужного слова является длительным и трудоёмким процессом. Компьютерные словари обеспечивают мгновенный поиск словарных статей. Многие словари предоставляют пользователям возможность прослушивания слов в исполнении носителей языка.

§ Компьютерные словари (русско-английские и англо-русские, русско-французские, русско-немецкие и др.) могут быть установлены на компьютер как самостоятельные программы, бывают встроены в текстовые процессоры, существуют в online-режиме в сети Интернет.

§ Компьютерные словари выполняют перевод отдельных слов и словосочетаний. Для перевода текстовых документов применяются программы-переводчики. Они основаны на формальном знании языка -- правил словообразования и правил построения предложений. Программа-переводчик сначала анализирует текст на исходном языке, а затем конструирует этот текст на том языке, на который его требуется перевести.

Список используемой литературы

1. Урок на тему: "Компьбтерный перевод", Малахова Н. П., г. Южногорск.

2. Васильев. А. Компьютер на месте переводчика // Подводная лодка. - № 6.

3. Система перевода текста PROMT Internet. Руководство пользователя. -- С.-Петербург: ПРОМТ.

4. translate.meta.ua

Размещено на Allbest.ru

...

Подобные документы

    История автоматизированного перевода. Современные компьютерные программы перевода. Сфера использования машинного перевода. Формы организации взаимодействия человека и ЭВМ в машинном переводе. Интерредактирование и постредактирование машинного перевода.

    курсовая работа , добавлен 19.06.2015

    Специализированные программы-переводчики. Возможности компьютерных словарей. Проблемы перевода многостраничной документации. Принципы, по которым построены компьютерные словари. Какие тексты нецелесообразно переводить с помощью компьютерных переводчиков.

    презентация , добавлен 13.11.2010

    Исследование современных технологий машинного перевода. Изучение классификации систем перевода. Характеристика особенностей работы с электронным словарем. Языковые инструменты Google. Программы для проверки правописания и грамматики, текстовые редакторы.

    реферат , добавлен 02.11.2014

    История возникновения, эволюция машинного перевода. Основные требования к коммуникативной эквивалентности. Последовательность формальных операций в системе машинного перевода, ее концепции развития. Переводчик для офиса. Преимущества электронных словарей.

    презентация , добавлен 22.10.2013

    Мировая история технологии машинного перевода как класса систем искусственного интеллекта. Классификация программ онлайн-переводчиков, поддержка функции контролируемого входного языка. Многоязычные браузеры в Интернете и перечень электронных словарей.

    контрольная работа , добавлен 03.02.2011

    Компьютерные обучающие системы. Принципы новых информационных технологий обучения. Типы обучающих программ. Активизация обучения. Компьютерное тестирование. Перспективные исследования в области компьютерного обучения. Интернет-технологии, мультимедиа.

    контрольная работа , добавлен 10.09.2008

    Программы автоматизированного перевода: электронные словари, tools-приложения, система Translation Memory, редакторское ПО. Анализ использования САТ-программ в практической деятельности. Выполнение перевода при помощи переводчиков Wordfast и Promt.

    курсовая работа , добавлен 10.11.2011

    Целые числа в позиционных системах счисления. Недостатки двоичной системы. Разработка алгоритмов, структур данных. Программная реализация алгоритмов перевода в различные системы счисления на языке программирования С. Тестирование программного обеспечения.

    курсовая работа , добавлен 03.01.2015

    Перевод - процесс создания на основе исходного текста на одном языке равноценного ему в коммуникативном отношении текста на другом языке, требования к обеспечению его эквивалентности. Машинные технологии перевода; характеристика систем Translation Memory.

    презентация , добавлен 06.01.2014

    Компьютерная программа как последовательность инструкций, предназначенная для исполнения устройством управления вычислительной машины. Анализ стандартов перевода текстов компьютерных игр. Рассмотрение особенностей ИТ-перевода, примеры грубейших ошибок.

В настоящее время различают три вида систем машинного перевода:

Системы на основе грамматических правил (Rule-Based Machine Translation, RBMT);

Статистические системы (Statistical Machine Translation, SMT);

Гибридные системы;

Системы на основе грамматических правил производят анализ текста, который используется в процессе перевода. Перевод производится на основе встроенных словарей для данной языковой пары, а так же грамматик, охватывающих семантические, морфологические, синтаксические закономерности обоих языков. На основе всех этих данных исходный текст последовательно, предложение за предложением, преобразуется в текст на требуемом языке. Основной принцип работы таких систем - связь структур исходного и конечного текстов.

Системы на основе грамматических правил часто разделяют еще на три подгруппы - системы пословного перевода, трансфертные системы и интерлингвистические системы.

Преимуществами систем на основе грамматических правил являются грамматическая и синтаксическая точность, стабильность результата, возможность настройки на специфическую предметную область. К недостаткам систем на основе грамматических правил относят необходимость создания, поддержки и обновления лингвистических баз данных, трудоемкость создания такой системы, а так же ее высокая стоимость.

Статистические системы при своей работе используют статистический анализ. В систему загружается двуязычный корпус текстов (содержащий большое количество текста на исходном языке и его «ручной» перевод на требуемый язык), после чего система анализирует статистику межъязыковых соответствий, синтаксических конструкций и т. д. Система является самообучаемой - при выборе варианта перевода она опирается на полученную ранее статистику. Чем больший словарь внутри языковой пары и чем точнее он составлен, тем лучше результат статистического машинного перевода. С каждым новым переведенным текстом улучшается качество последующих переводов.

Статистические системы отличаются быстротой настройки и легкостью добавления новых направлений перевода. Среди недостатков наиболее значительными являются наличие многочисленных грамматических ошибок и нестабильность перевода.

Гибридные системы сочетают в себе подходы, описанные ранее. Ожидается, что гибридные системы машинного перевода позволят объединить все преимущества, которыми обладают статистические системы и системы, основанные на правилах.

1.3 Классификация систем машинного перевода

Системы машинного перевода - программы, осуществляющие полностью автоматизированный перевод. Главным критерием программы является качество перевода. Кроме этого, для пользователя важными моментами является удобство интерфейса, лёгкость интеграции программы с другими средствами обработки документов, выбор тематики, утилита пополнения словаря. С появлением Internet основные поставщики систем машинного перевода включили в свои продукты Web-интерфейсы, обеспечив при этом их интеграцию с остальным программным обеспечением и электронной почтой, что позволило применять механизмы МП для перевода Web-страниц, электронной корреспонденции и онлайновых разговорных сеансов.

Новые члены форума по иностранным языкам компании CompuServe зачастую задают вопрос о том, не мог ли бы кто-нибудь посоветовать им хорошую программу машинного перевода за умеренную цену.

Ответом на этот вопрос неизменно является "нет". В зависимости от отвечающего, ответ может содержать два основных аргумента: либо о том, что машинам перевод не под силу, либо, что машинный перевод стоит слишком дорого.

Оба эти аргумента в определенной степени справедливы. Однако ответ далеко не так прост. Изучая проблему машинного перевода (МП), следует рассмотреть отдельно различные подразделы этой проблемы. Следующее разделение основано на лекциях Лари Чайлдса, проведенных в рамках Международной Конференции по Техническим Коммуникациям 1990 года:

Полностью автоматический перевод;

Автоматизированный машинный перевод при участии человека;

Перевод, осуществляемый человеком с использованием компьютера.

Полностью автоматизированный машинный перевод. Этот вид машинного перевода и подразумевается большинством людей, когда они говорят о машинном переводе. Смысл здесь прост: в компьютер вводится текст на одном языке, этот текст обрабатывается и компьютер выводит этот же текст на другом языке. К сожалению, реализация такого вида автоматического перевода сталкивается с определенными препятствиями, которые еще предстоит преодолеть.

Основной проблемой является сложность языка как такового. Возьмем, к примеру, значения слова "can". Помимо основного значения модального вспомогательного глагола, у слова "can" имеется несколько официальных и жаргонных значений в качестве существительного: "банка", "отхожее место", "тюрьма". Кроме этого, существует архаичное значение этого слова - "знать или понимать". Если предположить, что у выходного языка для каждого из этих значений имеется отдельное слово, каким образом может компьютер их различить?

Как оказалось, определенные успехи были достигнуты в сфере разработки программ перевода, различающих смысл основываясь на контексте. Более поздние исследования при анализе текстов опираются больше на теории вероятности. Тем не менее, полностью автоматизированный машинный перевод текстов с обширной тематикой все еще является невыполнимой задачей.

Автоматизированный машинный перевод при участии человека. Этот вид машинного перевода теперь вполне осуществим. Говоря о машинном переводе при участии человека, обычно подразумевают редактирование текстов как до, так и после их обработки компьютером. Люди-переводчики изменяют тексты так, чтобы они были понятны машинам. После того, как компьютер сделал перевод, люди опять-таки редактируют грубый машинный перевод, делая текст на выходном языке правильным. Помимо такого порядка работы, существуют системы МП, во время перевода требующие постоянного присутствия человека-переводчика, помогающего компьютеру делать перевод особенно сложных или неоднозначных конструкций.

Машинный перевод с помощью человека применим в большей степени к текстам с ограниченным вокабуляром узко-ограниченной тематики.

Экономичность использования машинного перевода с помощью человека - вопрос все еще спорный. Сами программы обычно достаточно дорогостоящи, а для работы некоторых из них требуется специальное оборудование. Предварительному и последующему редактированию необходимо обучаться, да и работа эта не из приятных. Создание и поддержание в рабочем состоянии баз данных слов - процесс трудоемкий и зачастую требует специальных навыков. Однако для организации, переводящей большие объемы текстов в четко-определенной тематической сфере, машинный перевод с помощью человека может оказаться достаточно экономичной альтернативой традиционному человеческому переводу.

Перевод, осуществляемый человеком с использованием компьютера. При этом подходе человек-переводчик ставится в центр процесса перевода, в то время как программа компьютера расценивается в качестве инструмента, делающего процесс перевода более эффективным, а перевод - точным. Это обычные электронные словари, которые обеспечивают перевод требуемого слова, возлагая на человека ответственность за выбор нужного варианта и смысл переведенного текста. Такие словари значительно облегчают процесс перевода, но требуют от пользователя определенного знания языка и затрат времени на его осуществление. И все же сам процесс перевода значительно ускоряется и облегчается.

Среди систем, помогающих переводчику в работе, важнейшее место занимают так называемые системы Translation Memory (TM).Системы ТМ представляют собой интерактивный инструмент для накопления в базе данных пар эквивалентных сегментов текста на языке оригинала и перевода с возможностью их последующего поиска и редактирования. Эти программные продукты не имеют целью применение высокоинтеллектуальных информационных технологий, а наоборот, основаны на использовании творческого потенциала переводчика. Переводчик в процессе работы сам формирует базу данных (или же получает ее от других переводчиков или от заказчика), и чем больше единиц она содержит, тем больше отдача от ее использования.

Вот список наиболее известных систем ТМ:

Transit швейцарской фирмы Star,

Trados (США),

Translation Manager от IBM,

Eurolang Optimizer французской фирмы LANT,

DejaVu от ATRIL (США),

WordFisher (Венгрия).

Системы ТМ позволяют исключить повторный перевод идентичных фрагментов текста. Перевод сегмента осуществляется переводчиком только один раз, а затем каждый следующий сегмент проверяется на совпадение (полное или нечеткое) с базой данных, и, если найден идентичный или похожий сегмент, то он предлагается в качестве варианта перевода.

В настоящее время ведутся разработки по усовершенствованию систем ТМ. Например, ядро системы Transit фирмы Star реализовано на основе технологии нейронных сетей.

Несмотря на широкий ассортимент систем TM, они имеют несколько общих функций:

Функция сопоставления (Alignment). Одно из преимуществ систем ТМ – это возможность использования уже переведенных материалов по данной тематике. База данных ТМ может быть получена путем посегментного сопоставления файлов оригинала и перевода.

Наличие фильтров импорта – экспорта. Это свойство обеспечивает совместимость систем ТМ с множеством текстовых процессоров и издательских систем и дает переводчику относительную независимость от заказчика.

Механизм поиска нечетких или полных совпадений. Именно этот механизм и представляет собой основное достоинство систем ТМ. Если при переводе текста система встречает сегмент, идентичный или близкий к переведенному ранее, то уже переведенный сегмент предлагается переводчику как вариант перевода текущего сегмента, который может быть подкорректирован. Степень нечеткого совпадения задается пользователем.

Поддержка тематических словарей. Эта функция помогает переводчику придерживаться глоссария. Как правило, если в переводимом сегменте встречается слово или словосочетание из тематического словаря, то оно выделяется цветом и предлагается его перевод, который можно вставить в переводимый текст автоматически.

Средства поиска фрагментов текста. Этот инструмент очень удобен при редактировании перевода. Если в процессе работы был найден более удачный вариант перевода какого-либо фрагмента текста, то этот фрагмент может быть найден во всех сегментах ТМ, после чего в сегменты ТМ последовательно вносятся необходимые изменения.

Конечно, как и любой программный продукт, системы ТМ имеют свои достоинства и недостатки, и свою область применения. Однако в отношении систем TM,основным недостатком является их дороговизна.

Особенно удобно использовать системы ТМ при переводе таких документов, как руководства пользователя, инструкции по эксплуатации, конструкторская и деловая документация, каталоги продукции и другой однотипной документации с большим количеством совпадений.