Чтобы машинный перевод был хорош, система должна тренироваться, и чем больше, тем лучше. Лучше всего он работает, когда есть много текстов для переработки. Но компьютер никогда полностью не заменит живого переводчика.Многие пользователи интернета пользуются машинным переводом вроде «Гугл Транслейт» (Google Translate) или «Бинг» (Bing). Такие службы могут помочь более чем с сотней языков и постоянно развиваются. В прошлом году «Гугл» представил пару наушников для синхронного перевода.


Но насколько хороши на самом деле машинные переводы? Порой они все-таки оказываются довольно непонятными.

 

В первую очередь все зависит от того, о каком языке идет речь, и была ли у системы возможность как следует «потренироваться» с данной парой языков. Повторение — мать учения, это правило работает и для компьютера. Чтобы развиваться, системе нужны уже готовые переводы, сделанные человеком.


«Путем автоматического сравнения оригинальных текстов и переводов можно провести параллели между языками, предложение за предложением и слово за словом, чтобы определить возможные связи. Появляется статистика вероятных соотношений, то есть возможных соответствий слов, фраз и предложений», — говорит Анна Согвалль Хейн (Anna Sågvall Hein), заслуженный профессор компьютерной лингвистики Уппсальского университета.


Чем больше текстов можно «скормить» машине, тем лучше. И когда речь идет о крупных западных языках вроде английского, французского, испанского и немецкого, то запас текстов и переводов, к которым можно прибегнуть, велик. Благодаря этому у системы есть много материала для того, чтобы вычислить, какие слова друг другу соответствуют.


«Важно также, чтобы переводы, которые даются на анализ, были хорошего качества», — говорит Анна Согвалль Хейн. Машинные переводы шведского языка работают все лучше, считает она, — в последние годы прогресс в этой области хороший. Гораздо труднее с малыми языками, такими, например, как саамский и курдский.


«Для того, чтобы обучать систему, тут недостаточно данных. Поэтому результат получается далеким от совершенства».


Также непростую задачу представляют собой языки со сложной морфологией, то есть такие, где слова склоняются и изменяются согласно своей грамматической функции. Примеры таких языков — греческий, португальский и финский. Для компьютера предложение — это всего лишь строчка символов, и финский с его 15 падежами вызывает затруднения.


«Лучше всего машинный перевод работает с текстами практического назначения в рамках ограниченной тематики», — говорит Анна Согвалль Хейн.

 

Сама она следит за развитием этой сферы с 1960-х годов, когда она оказалась в числе первых студентов, изучающих компьютерную обработку данных в Уппсальском университете. Она интересовалась языками и компьютерами, поэтому машинный перевод и стал полем ее профессиональной деятельности. Сегодня она руководит предприятием, занимающимся языковыми технологиями, которое, например, переводят учебные планы и правительственную информацию на английский, арабский и персидский. Мы встретились в ее офисе, или «лаборатории», как она это называет, в Уппсале. Она подчеркивает, что машина никогда полностью не заменит живого переводчика. Особенно в том, что касается перевода литературных текстов.


«Литературный перевод — это творческий процесс. Он требует и совершенно других знаний,, а также подразумевает способность читать между строк. Машина же лишь совершает механическую перекодировку, а это совсем другое».

Материалы ИноСМИ содержат оценки исключительно зарубежных СМИ и не отражают позицию редакции ИноСМИ.