Rambler's Top100
 
 
  01 декабря 2008 года Компьюлента
CIO
Терралаб
Бизнес-журнал
в поле зрения | обзоры и тесты | своя игра | интерактив
Электронный толмач
Автор: Константин Курасов
Опубликовано в журнале "Спецвыпуск Компьютерры" №5 от 21 октября 2003 года

Oтношение мое к системам машинного перевода — как к калькулятору: отсутствие средства автоматизации при неумении справиться самостоятельно может очень сильно подвести.

Давным-давно, лет десять назад, мне рассказали байку о какой-то программе-переводчике. С ее помощью русскую пословицу «Один   в поле не воин» перевели на английский, а потом снова на русский. Правда ли это, я не знаю, но утверждалось, что обратным переводом была фраза: «Один человек, стоящий за городом, не хочет служить в армии». Уже тогда это установило в моем неокрепшем сознании скептическое отношение к автоматизированным переводчикам.

Другая история, реальная. Было время, когда я учился в седьмом классе. На уроках алгебры мы изучали синусы и косинусы. Для определения точных значений этих функций существовали (да и сейчас, скорее всего, существуют) средней толщины брошюрки, проходящие под кодовым названием «Таблицы Брадиса». Я же был счастливым обладателем инженерного калькулятора «Электроника» и мог мгновенно узнавать синусы и косинусы углов, не копаясь в таблицах. Учительница говорила, что я не прав, что может наступить момент, когда мне будет жизненно необходимо рассчитать синус угла, а калькулятора под рукой не окажется, и поэтому я должен научиться работать с «Таблицами Брадиса». На что мне хватило ума ответить, что в такой ситуации у меня «Таблиц Брадиса» тоже скорее всего не будет.

Теперь я понимаю, что был не совсем прав. Уметь что-нибудь делать никогда не помешает.
К чему этот экскурс в глубины моей памяти?

А к тому, что мое отношение к системам машинного перевода — как к калькулятору: отсутствие средства автоматизации при неумении справиться самостоятельно может очень сильно подвести. Поэтому мое твердое мнение, укрепленное другим преподавателем, уже в университете, — иностранные языки нужно изучать и знать.

Но лень родилась раньше нас. Мы чаще всего не знаем и своего родного языка. А для изучения иностранного не хватает то денег, то времени, то силы воли. В таких ситуациях на помощь приходит PROMT.

Как пишут авторы, PROMT — это не просто переводчик, это целая профессиональная среда для перевода и мощный лингвистический редактор с широким набором функций настройки перевода. PROMT входит в состав семейства PROMT XP, которое включает в себя широкий набор программных продуктов для профессионального перевода и для работы со словарями. На моем скромном препараторском столе ненадолго расположился PROMT XT Office Giant, или же, после пропуска названия программного продукта через сам продукт, «ПРОМТ XT Гигант Офиса».

Основная функция программы — перевод текста. В самом простом случае вы помещаете текст в подокно (именно в «подокно» — так в справочной системе) исходного документа (открываете ли файл, вставляете ли из буфера или набираете сами — неважно), изменяете при необходимости направление перевода (в некоторых случаях система сама определяет, с какого языка на какой переводить), включаете или выключаете специализированные словари, нажимаете кнопку «Перевести весь текст» — и после небольшой паузы получаете во втором подокне перевод. Его можно просто прочитать или скопировать в буфер, а можно и сохранить в виде файла.

По-моему, самый главный вопрос, который возникает в данный момент: что за перевод мы получили. А перевод-то как раз может показаться странным. Например, переведенный на русский язык английский текст напоминает речь магистра Ордена джедаев Йоды. Посудите сами. Оригинал (из статьи про яблоки из «Британники»):

To grow apple trees, a method called grafting is used. First, a twig or a bud from the stem of one apple plant is cut. This portion, called the scion, is then placed on the stem or branch of another well-rooted apple plant.
Машинный перевод:
Чтобы выращивать яблони, метод названный прививанием используется. Сначала, прут или зародыш от стебля одного растения {завода} яблока сокращены. Эта часть, названная отростком, тогда помещена в стебель или отрасль {отделение} другого хорошо-внедренного растения {завода} яблока.


Ну, о чем идет речь — понятно. Но учителю такой перевод не сдашь. А для более точного перевода уже нужен специализированный словарь — в данном случае биологический, хотя система для всей статьи порекомендовала словарь «Космическая промышленность». В системе, кстати, предустановлены один постоянный («Генеральный словарь») и три подключаемых словаря: один пользовательский и два специализированных, «Интернет» и «Информатика» (для перевода с английского на русский). Другие специализированные словари (только для того же направления перевода в справочной системе их заявлено 43 штуки) можно приобрести дополнительно. Также можно создавать и пополнять словари самостоятельно.

Но не только наличие словарей определяет качество перевода. Есть еще множество влияющих факторов и возможностей настройки программы, на знакомство со всеми тонкостями которых может уйти очень много времени. Однако как говорил гриф страусу в коротком, но очень смешном мультфильме: «Лучше день потерять, но потом за пять минут долететь».

Несколько лет назад я видел по телевизору интервью с одним умным молодым человеком, представлявшим какую-то софтверную компанию, занимавшуюся проблемой машинного перевода. Очень даже может быть, что он как раз работал в компании «ПРОМТ». Так этот человек заявил, что более перспективным направлением развития машинного перевода является создание баз переводов словосочетаний и целых фраз, чтобы система каждый раз не выдумывала перевод, а брала его уже из готового образца. Таким образом, заранее грамотно переведя большой объем словосочетаний и фраз, можно было бы повысить качество перевода. Главным препятствием этому до определенного момента были ограниченные объемы и дороговизна носителей. Но уже на тот момент, по его оценке, указанная проблема была снята.

Слова запали в душу. И вот в PROMT XT в разделе «Что нового в программе» я нахожу буквально следующий текст:

«Возможность использовать базы переводов Ассоциированной памяти в процессе перевода: программа сравнивает переводимый текст с фрагментами текста из подключенных баз переводов Ассоциированной памяти, и в случае полного совпадения перевод фрагмента подставляется из базы переводов Ассоциированной памяти».

Так это как раз то, о чем говорил тот умный молодой человек! Значит сделали! Только вот пока готовых баз переводов особенно и нет. Но есть надежда. А базы эти можно и самому сделать.

Авторы правы: система действительно профессиональна. Но, как всякий сложный механизм, ее нужно тщательно настраивать. А настройки по умолчанию хватит как раз на то, чтобы пересказать учителю по-русски в общих чертах, о чем был заданный текст.

Последовательность работы в программах семейства ПРОМТ, обычно ограничивается двумя движеними мыши: «Перевести» и «Сохранить». Попробуйте использовать дополнительные возможности прграммы и качество перевода заметно возрастет.

Нередко перевод документов на русский язык оказывается нечитаемым в силу использования шрифтов без кирилических символов. Вот что рекомендует инструкция к ПРОМТ ХТ Office для решения данной проблемы.

Диалог «Шрифты по умолчанию»

На вкладке «Русифицированный шрифт» выберите шрифт, который содержит кириллицу (АБВ) и может использоваться для отображения русских текстов (например, шрифт Arial(Cyrillic)).

На вкладке «Нерусифицированный шрифт» выберите шрифт, который не содержит кириллицу и может использоваться для отображения спецсимволов в иностранных текстах, например, умлаутов (ЦЬД) в немецких текстах и диакритики (ЗЙУ) во французских текстах (например, шрифт Arial (Western)).

Выбранные Вами шрифты будут использоваться по умолчанию:
1 В режиме замены шрифтов по умолчанию соответственно в русском или иностранном текстах перевода;
2 При создании новых документов и при открытии текстовых файлов.

Диалог «Замена шрифтов в тексте перевода»

В этом диалоге Вам предлагается указать, какие шрифты должны использоваться в тексте перевода вместо исходных шрифтов.
Для чего это необходимо? Очень часто возникает ситуация, когда исходный иностранный текст набран шрифтом, не содержащим кириллицы, и, соответственно, русский текст перевода, выведенный этим же шрифтом, будет невозможно прочитать.
Этого можно избежать, если для шрифтов указать их замену.

Определить замену можно двумя способами:

1) Вы можете задать индивидуальные замены для отдельных шрифтов.
Например, потребовать, чтобы при переводе с иностранного языка на русский исходный шрифт Arial (Western), который не содержит кириллицы, автоматически заменялся в русском тексте перевода на шрифт Arial (Cyrillic), содержащий кириллицу.
Эти пары шрифтов заносятся в таблицу (Исходный шрифт -> Шрифт замены), которую Вы можете редактировать, используя кнопки Добавить, Изменить, Удалить.

2) Вы можете также установить опцию «Выполнять замену всех остальных шрифтов на шрифт по умолчанию». В этом случае все шрифты (кроме тех, для которых заданы индивидуальные замены) будут заменены на шрифт по умолчанию.
  При переводе с иностранного языка на русский и с русского языка на иностранный используются разные таблицы замен шрифтов. Обращайте внимание на название вкладок диалога!

Замена шрифтов выполняется только в процессе перевода документа.
В том случае, если для используемых в тексте шрифтов не заданы индивидуальные замены и не установлена опция «Выполнять замену всех остальных шрифтов на шрифт по умолчанию», текст перевода выводится теми же шрифтами, что и исходный текст.

ТАКЖЕ В РАЗДЕЛЕ
 
SQL Server 2008 - это шифрование баз данных, регулятор ресурсов, управление серверами на основе Политик Администрирования, а также готовность управлять большими объемами данных.

TechDays.ru - окунитесь в мир технологий Microsoft
Более 50 технических докладов для ИТ-специалистов и разработчиков. Узнайте самое интересное по каждой технологии за 15 минут. Если интересно - прослушайте дополнительные доклады.

Театр ИТ-кошмаров
Ваша ИТ-инфраструктура не способна выдерживать темп развития бизнеса? Не прячьтесь от реальности. Загляните в Театр ИТ-кошмаров и посмотрите правде в глаза.

САМОЕ ПОПУЛЯРНОЕ
Нетбуки против Windows
Нетбукам нужна лёгкая операционная система. Windows Vista, определённо, такой не является. Windows XP давно морально устарела. Linux? Или всё-таки подождать выхода легковесной версии Windows 7?
Тонкости анонимного серфинга в Сети
Сегодня мы будем учиться заметать следы. Правда, не настоящие, а виртуальные, всякий раз оставляемые пользователем при работе в Интернете и с большим удовольствием потребляемые всевозможными онлайновыми сервисами.
Неделя после Fallout
Продажи новой игры из серии Fallout, разработанной студией Bethesda, идут очень неплохо - и это при том, что первый патч принёс игрокам кучу проблем, а японцы, оказалось, лишились части одного из квестов.
Диалоги с программистами. Часть 3: iPhone и бар на пляже
Сегодня в нашем распоряжении программист, который создает код для совершенно непрограммистского устройства - iPhone. Да, здесь есть свои особенности...
/  бумажный номер

Тема номера: Кризис в ИТ Читайте на сайте тему номера "Кризис в ИТ" и другие статьи из журнала "Компьютерра" от 04 ноября 2008 года
  Архив номеров журнала

О проекте | Реклама на сайте | Рассылки сайта | КПК–версия | RSS-трансляция

© ООО «Компьютерра–Онлайн», 1997 — 2008.
При цитировании и использовании любых материалов ссылка на портал «Компьютерра–Онлайн» обязательна (для Интернет–изданий — www.computerra.ru)
Редакция сайта: site@computerra.ru
Техподдержка сайта: websupport@computerra.ru
Редакция журнала: inform@computerra.ru
Отдел рекламы: reklama@computerra.ru
Телефон: (495) 232–22–61, (495) 232–22–63
Работает на «Битрикс: Управление сайтом»
Почта защищена сервером «СПАМОРЕЗ»
Трилан — продвижение сайта,
поисковая оптимизация сайта

Сайт работает на сервере DEPO Computers
Rambler's Top100