Как-то раз мой приятель Фрэнк пришел на одно из наших воскресных занятий по сальсе со спутницей датчанкой. Я знал, что Фрэнк хорошо говорит на датском, так как его мать родом из Дании, и он жил там в детстве. Что касается его приятельницы, то она бегло говорила по-английски: для скандинавов это считается нормой. Но, к моему удивлению, в ходе вечера выяснилось, что двое друзей обычно обмениваются электронными письмами с помощью переводчика «Гугл» (Google Translate).
Фрэнк пишет сообщение на английском языке, а затем пропускает его через переводчик «Гугл», чтобы создать новый текст на датском; а она, наоборот, создает письмо на датском языке, а потом с помощью программы переделывает его на английский лад. Так странно! Зачем это делать двум умным людям, каждый из которых хорошо говорит на языке другого? Мой собственный опыт работы с системами машинного перевода неизменно вызывал у меня скептическое к ним отношение, которое эти двое явно не разделяли. Действительно, многие вдумчивые люди в восторге от программ автоматического перевода и находят в них мало поводов для критики. Меня это не на шутку озадачивает.
Как большой поклонник языков и страстный переводчик, как ученый-когнитивист, хранящий непоколебимую веру в проницательность человеческого ума, я уже несколько десятилетий слежу за попытками механизировать перевод. Когда в середине 1970-х годов я впервые заинтересовался этим предметом, мне попалось письмо, написанное в 1947 году математиком Уорреном Уивером, одним из первых защитников машинного перевода, Норберту Винеру, ключевой фигуре тогдашней кибернетики, в котором Уивер делает одно любопытное и сегодня довольно знаменитое заявление: «Когда я вижу статью на русском языке, я говорю: „На самом деле это написано на английском языке, но зашифровано с помощью каких-то странных символов. Сейчас я перейду к расшифровке"».
Несколько лет спустя он выразил другую точку зрения: «Ни одному разумному человеку не придет в голову мысль о том, что машинный перевод способен когда-либо сравняться с человеческим по степени изящества и отточенности слога. Пушкину не придется переворачиваться в гробу». Уф! Посвятив целый год моей жизни незабываемой напряженной работе над переводом блестящего романа в стихах Александра Пушкина «Евгений Онегин» на свой родной язык (то есть, до основания переработав это великое произведение русской литературы в англоязычный роман в стихах), я нахожу последнее замечание Уивера в гораздо большей степени верным, чем предыдущее, которое являет собой до странного упрощенное видение языка. Как бы то ни было, высказанное им в 1947 году представление о переводе как о расшифровке сделалось своего рода кредо, на долгое время ставшим движущим фактором в сфере машинного перевода.
С тех пор «механизмы перевода» не переставали совершенствоваться, а в последнее время использование так называемых «глубоких нейронных сетей» даже заставило некоторых экспертов (см. статьи «Великое пробуждение искусственного интеллекта» Гидеона Льюиса-Крауса в газете «Нью Йорк Таймс» и «Машинный перевод: за пределами Вавилона» Лейн Грин в «Экономист») предположить, что люди-переводчики могут превратиться в исчезающий вид. В этом случае занимающиеся переводом люди через несколько лет превратятся в простых специалистов по контролю качества и устранению дефектов вместо того, чтобы быть создателями новых свежих текстов.
Подобный сценарий станет настоящим переворотом в моей духовной жизни. Хотя я прекрасно понимаю всю увлекательность попыток создать совершенные системы перевода, я совсем не хочу видеть в этих неодушевленных машинах замену живым переводчикам. На самом деле эта мысль меня пугает и вызывает отвращение. На мой взгляд, перевод — это невероятно тонкое искусство, источником которого неизменно является многолетний жизненный опыт и творческое воображение человека. Если в один «прекрасный» день человеческие переводчики станут реликтами прошлого, мое уважение к человеческому разуму серьезно пошатнется. Это потрясение приведет меня в невероятное замешательство и посеет в моей душе неизбывную печаль.
Каждый раз, когда я читаю статью, в которой утверждается, что сообщество человеческих переводчиков скоро будет вынуждено признать свое поражение перед безжалостным молниеносным мечом какой-нибудь очередной технологии, я чувствую, что мне нужно излить собственное негодование отчасти из страха перед тем, что этот кошмар может быть уже близок, но скорее из желания успокоить себя, что он не настолько близок, и, наконец, чтобы выразить свою давнюю уверенность в том, что с преувеличенными заявлениями об искусственном интеллекте необходимо бороться.
Итак, прочитав о том, как старая идея искусственных нейронных сетей, недавно взятая на вооружение одним из подразделений «Гугл» под названием Google Brain и сегодня подкрепленная методами «глубокого обучения», привела к появлению нового типа программного обеспечения, которое якобы произвело революцию в автоматическом переводе, я решил посмотреть на последнее воплощение переводчика «Гугл» в действии. Можно ли здесь говорить о кардинальных переменах, как то было в случае Deep Blue и AlphaGo, перевернувших наше представление о таких почтенных играх, как шахматы и Го?
Я узнал, что, хотя более ранняя версия переводчика «Гугл» может работать с довольно большим набором языков, в своем новом воплощении с внедрением глубокого обучения программа действует всего на девяти языках. Соответственно я ограничил свои исследования английским, французским, немецким и китайским.
Однако, прежде чем делиться полученными результатами, я должен подчеркнуть двусмысленность прилагательного «глубокий», на которую здесь делается ставка. Когда мы слышим, что «Гугл» приобрел компанию DeepMind, чьи продукты имеют «глубокие нейронные сети», усиленные «глубоким обучением», мы первым делом думаем, что «глубокий» здесь означает «содержательный» и, следовательно, «мощный», «проницательный», «мудрый». И все же значение слова «глубокий» в данном контексте всего лишь связано с тем фактом, что эти нейронные сети имеют больше слоев (скажем, 12) по сравнению с предыдущими, у которых их могло быть только два или три. Но подразумевает ли такого рода глубина содержательность этой сети? Едва ли. Это всего лишь вербальный пиар.
Я с большой осмотрительностью отношусь к переводчику «Гугл», особенно учитывая всю поднимаемую вокруг него шумиху. Но несмотря на все отвращение я признаю за объектом моей неприязни целый ряд удивительных свойств. Эта программа доступна бесплатно любому человеку на земле и способна преобразовывать текст на любом из примерно ста языков в такой же текст на любом другом языке. Это не может не заслуживать уважения.
Если я горжусь тем, что называю себя «Пи-лингвом» (это значит, что сумма всех частично известных мне языков немного превышает число три; это определение помогает мне непринужденно отвечать на вопрос: «На скольких языках вы говорите?»), то представьте, какую гордость должна испытывать программа Google Translate, ведь она может называть себя «байлингвом» («бай» по-китайски значит «сто»). Байлингвизм способен произвести на простого Пи-лингва неизгладимое впечатление. Более того, если я скопирую и вставлю страницу текста на языке А в переводчик «Гугл», за какую-то пару секунд я получу страницу, заполненную словами на языке B. И это происходит постоянно на множестве экранов в самых разных уголках планеты, на десятках языков.
Практическая полезность переводчика «Гугл» и аналогичных технологий неоспорима, и, вероятно, в целом это позитивное явление, но в этом подходе все-таки не хватает чего-то очень важного, что выражается одним словом: понимание. Автоматический перевод никогда не делает установку на понимание языка. Его главная цель — попытаться «декодировать» текст — сделать свое дело, не беспокоясь о том, что такое понимание и смысл. Неужели и правда можно допустить, что для создания хорошего перевода не требуется понимание? Способен ли какой бы то ни было субъект, человек или машина выполнять высококачественный перевод, не обращая внимания на природу и суть данного языка? Чтобы пролить свет на этот вопрос, я перехожу к моим экспериментам.
Я начал свои исследования с незамысловатой и короткой фразы, которая в человеческом сознании вызывает отчетливые ассоциации:
In their house, everything comes in pairs. There's his car and her car, his towels and her towels, and his library and hers.
У них дома всего было по паре. Его машина и ее машина, его полотенца и ее полотенца, его библиотека и ее библиотека.
Переводческая задача кажется несложной, однако во французском языке (как и в других романских языках) слова «его» и «ее» согласуются по признаку пола не с обладателем, но с самим предметом. В итоге переводчик «Гугл» предложил мне следующее:
Dans leur maison, tout vient en paires. Il y a sa voiture et sa voiture, ses serviettes et ses serviettes, sa bibliothèque et les siennes.
Программа попалась в мою ловушку за отсутствием понимания — свойственного любому читающему этот текст человеку — того, что я описывал супружескую пару, подчеркивая, что на каждую вещь, которой владел супруг, у супруги приходилась своя собственная. Так, система глубокого обучения использовала притяжательное местоимение «sa» для обозначения «его машины» и «ее машины», вот почему пол владельцев машины здесь определить невозможно. Аналогичным образом, она использовала лишенную показателя рода форму множественного числа «ses» как для «его полотенец», так и для «ее полотенец», а в последнем случае с двумя библиотеками, его и ее, переводчика явно смутил «s» на конце слова «hers», и он почему-то решил, что этот «s» указывает на множественное число («les siennes»). В итоге вариант перевода на французский, предложенный программой «Гугл», упускает главный смысл оригинала.
Затем я сам перевел эту фразу на французский язык так, чтобы передать подразумевающийся в ней смысл. Вот моя французская версия:
Chez eux, ils ont tout en double. Il y a sa voiture à elle et sa voiture à lui, ses serviettes à elle et ses serviettes à lui, sa bibliothèque à elle et sa bibliothèque à lui.
Словосочетание «sa voiture à elle» передает идею «ее автомобиля», а «sa voiture à lui» может быть понято только как «его машина». И тут я решил, что переводчику «Гугл» не составит особого труда перевести мой французский перевод обратно на английский язык и на этот раз уже без ошибок, но я заблуждался. Вот что выдал мне переводчик:
At home, they have everything in double. There is his own car and his own car, his own towels and his own towels, his own library and his own library.
Что?! Даже когда входное предложение со всей очевидностью указывает на пол хозяев — очевиднее уже некуда — переводчик это игнорирует и ставит все в мужской род. Почему он выбросил из предложения самую важную информацию?
Мы, люди, знаем многое о супружеских парах, домах, личном имуществе, гордости, соперничестве, ревности, частном пространстве и многих других нюансах, которые приводят к причудам, подобным этой: когда у супружеской пары есть полотенца, на которых вышито «его» и «ее». Переводчик «Гугл» с такими ситуациями не знаком. Он вообще не знаком ни с какими ситуациями. Точка. Ему ведомы только цепочки, состоящие из слов, которые в свою очередь складываются из букв.
Здесь речь идет исключительно о сверхбыстрой обработке фрагментов текста, а не о мышлении, воображении, вспоминании или понимании. Он даже не знает, что слова означают вещи. Поспешу сказать, что компьютерная программа, безусловно, могла бы знать, для чего нужен язык, могла бы иметь идеи, воспоминания и опыт и могла бы их использовать, но переводчик «Гугл» создавался не для этого. Таких амбиций не было даже в планах его разработчиков.
В общем, я посмеялся над этим неудачным представлением, с облегчением подумав, что мы в конце концов не так уж близки к замене живых переводчиков автоматами. Но все-таки я понимал, что следует проверить эту программу более тщательно. В конце концов один глоток жажды не утоляет.
Кстати, а как насчет этой недавно придуманной фразы «Один глоток жажды не утоляет» (отсылающей, разумеется, к «Одна ласточка весны не делает»)? Я не мог удержаться от того, чтобы не пропустить через переводчик «Гугл» и эту фразу; и вот что получил на выходе: «Une hirondelle n'aspire pas la soif». Это грамматически правильное французское предложение, смысл которого, однако, довольно сложно постичь. Сначала в нем называется некая птица («une hirondelle» — ласточка), потом говорится, что эта птица не вдыхает или не всасывает («n'aspire pas»), и в конце выясняется, что птица не совершает этих действий в отношении жажды («la soif»). Переводчик «Гугл» явно не понял, что я имел в виду; он просто выдал какую-то нелепицу. «Il vient de sortir avec un tas de taureaux». Прошу простить мой французский, а точнее, псевдофранцузский переводчика «Гугл».
Из огня французского языка перепрыгнем в полымя немецкого. В последнее время я погрузился в чтение книги Sie nannten sich der Wiener Kreis («Они называли себя венским кружком») австрийского математика Карла Зигмунда. В ней описывается группа венских интеллектуалов-идеалистов, существовавшая в 1920-е и 1930-е годы и оказавшая значительное влияние на философию и науку в последующие десятилетия XX века. Я выбрал небольшой отрывок из книги Зигмунда и пропустил его через переводчик «Гугл». Привожу его сначала на немецком и в моем собственном переводе, а затем в версии автоматического переводчика. (К слову, я показал свой перевод двум носителям немецкого языка, в том числе Карлу Зигмунду, и потому полагаю, что его можно считать точным).
Зигмунд:
Nach dem verlorenen Krieg sahen es viele deutschnationale Professoren, inzwischen die Mehrheit in der Fakultät, gewissermaßen als ihre Pflicht an, die Hochschulen vor den «Ungeraden» zu bewahren; am schutzlosesten waren junge Wissenschaftler vor ihrer Habilitation. Und Wissenschaftlerinnen kamen sowieso nicht in frage; über wenig war man sich einiger.
Хофштадтер:
После поражения многие сочувствовавшие пангерманизму преподаватели, которые к тому времени составляли большинство на факультете, считали своим долгом защищать высшие учебные заведения от «нежелательных» лиц. Наиболее вероятными претендентами на исключение были молодые ученые, еще не полувшие права преподавать в университете. Что же касается женщин-ученых, то для них места в этой системе вообще не предполагалось; это был вопрос решенный.
Переводчик «Гугл»:
После проигранной войны многие немецко-национальные профессора, в то время как большинство на факультете, считали своим долгом удерживать университеты от «странных»; Молодые ученые были наиболее уязвимы перед их абилитацией. И ученые все равно не сомневались; их было мало.
Все слова в машинном переводе являются словами английского языка (даже несмотря на то, что некоторые из них по непонятным причинам сделаны именами собственными там, где этого не требуется). Пока недурно! Однако очень скоро перевод начинает хромать и чем дальше, тем сильнее.
Остановлюсь сначала на «странных» («the odd»). Это слово употребляется для передачи немецкого «Ungeraden», которое в свою очередь означает «политически неугодных людей». Однако для выбора слова «странные» у переводчика «Гугл» была своя причина — статистически очень легко объяснимая: в огромной двуязычной базе слово «ungerade» почти всегда переводилось как «странный». Хотя автоматический переводчик не понимал, почему это так, я могу вам это объяснить.
Дело в том, что «ungerade», буквально означающее «un-straight» или «uneven», почти всегда имеет значение «не делимый на два». Мой перевод слова «Ungeraden» как «нежелательные», напротив, не имел никакого отношения к статистике словесного употребления, но исходил из понимания ситуации: я сосредоточился на том смысле, который явно не выражен в тексте и, наверняка, не упоминается в качестве перевода слова «ungerade» ни в одном из моих немецких словарей.
А теперь обратимся к немецкому слову «Habilitation», обозначающему университетский статус, что-то вроде срока пребывания в должности. Однокоренное английское слово «habilitation» существует, но употребляется крайне редко и, разумеется, не несет в себе идею пребывания в должности или чего-то подобного. Вот почему я коротко объяснил эту мысль вместо того, чтобы просто повторить не совсем понятное слово, ведь механический жест не донес бы до англоязычных читателей никакого конкретного смысла. Понятно, что переводчик «Гугл» никогда не сможет сделать ничего подобного, поскольку не располагает моделью знаний своих читателей.
Последние два предложения со всей очевидностью демонстрируют, насколько важно для перевода понимание. 15-буквенное немецкое существительное «Wissenschaftler» означает «ученый» (в области точных или гуманитарных наук). (Я выбрал последний вариант, так как в данном отрывке речь шла об интеллектуалах в целом. Переводчик «Гугл» в такие тонкости не вдавался.) Однокоренное 17-буквенное существительное «Wissenschaftlerin», которое мы находим в последнем предложении в форме множественного числа «Wissenschaftlerinnen», является результатом того, что в немецком языке существительные могут нести в себе показатель рода.
В то время как «более короткое» существительное грамматически принадлежит мужскому роду и следовательно означает мужчину-ученого, более длинное существительное — женского рода и применимо только к женщинам. Чтобы передать эту идею, я выбрал вариант «женщина-ученый». Между тем переводчик «Гугл» не понял, что в центре внимания в последнем предложении был именно суффикс «-in», являющийся показателем женского рода. А поскольку идея обособленного положения женщин осталась непонятой, автоматический переводчик просто дважды употребил слово «ученый», таким образом лишив предложение его главного смысла.
Как и в предыдущем случае с текстом на французском, переводчик «Гугл» ни на йоту не приблизился к пониманию того, что единственная цель немецкого предложения — подчеркнуть контраст между мужчинами и женщинами.
Помимо этой оплошности, катастрофой выглядит и перевод всего заключительного предложения. Взять, к примеру, его первую половину. Неужели фраза «ученые все равно не сомневались» действительно может служить переводом «женщины-ученые не берутся в расчет»? Она не передает значение оригинала — даже приблизительно. Перед нами просто беспорядочный набор английских слов, появившихся тут под влиянием немецкого оригинала. Выходит, чтобы заслужить звание «перевода», тексту большего не требуется?
Вторая половина предложения также неверна. Последние шесть немецких слов означают буквально следующее: «мало что могло их в большей степени объединить» или более благозвучный вариант: «едва ли что-то еще вызывало у них столь единодушное согласие», между тем переводчик «Гугл» умудрился превратить эту совершенно ясную мысль в «их было немного». Сбитые с толку читатели, принадлежащие роду человеческому, спросят: «Немного — это о чем?», но для механического слушателя такой вопрос был бы лишен смысла. У переводчика «Гугл» нет завуалированных идей, поэтому он не мог бы даже начать отвечать на этот простой вопрос. Механическая программа не воображала себе цифр или большого или малого количества чего-либо. Она просто перераспределяла символы, не имея ни малейших представлений о том, что они могут что-то означать.
Человеку с большим опытом и пониманием жизни, который привык использовать слова для передачи смыслов, трудно осознать, насколько лишены содержания все слова, появляющиеся на экране с подачи переводчика «Гугл». Слишком силен соблазн допустить, что программное обеспечение, которое с такой легкостью оперирует словами, непременно должно знать, что они означают. Это классическое заблуждение, связанное с программами искусственного интеллекта, называется «эффектом Элизы», поскольку одна из первых программ, еще в 1960-е годы пустившая людям пыль в глаза своим кажущимся пониманием английского языка, была бессодержательным фразовым комбинатором под названием ELIZA: программа имитировала реплики психотерапевта, и при взаимодействии с ней у многих людей возникало жутковатое ощущение того, что она глубоко понимает их самые сокровенные чувства.
На протяжении десятилетий многие умудренные опытом люди — даже некоторые исследователи искусственного интеллекта — оказывались под воздействием «эффекта Элизы». Чтобы убедиться в том, что мои читатели не попадутся в эту ловушку, позвольте мне процитировать несколько фраз из предыдущих абзацев, а именно: «переводчик „Гугл" не понимал», «он не осознал», и «переводчик „Гугл" ни на йоту не приблизился к пониманию». Как ни парадоксально, но эти фразы, в которых делается акцент на отсутствии понимания, едва ли не предполагают, что переводчик «Гугл» по крайней мере иногда способен понимать, что означает то или иное слово, фраза или предложение. Но на самом деле это не так. Переводчик «Гугл» — это исключительно инструмент обхода смыслов, полностью игнорирующий сам акт понимания языка.
Для меня слово «перевод» окружено аурой таинственности и выразительности. Он обозначает глубоко человеческую форму искусства, которая любезно передает идеи, ясно выраженные на языке А, в столь же ясной форме на язык В, и в процессе наведения этих мостов переводчик должен не только сохранять ясность, но также давать представление об изюминке, странностях и своеобразии стиля автора оригинала. Всякий раз, когда я перевожу, я сначала внимательно читаю текст оригинала и добиваюсь наиболее ясного понимания заключенных в нем смыслов, позволяя им свободно бродить в моем сознании.
Это происходит не со словами оригинала, но с идеями, которые влекут за собой целый каскад идей, создавая в моем сознании красочный ореол переплетающихся друг с другом сценариев. Излишне говорить, что большая часть этого ореола возникает бессознательно. Только когда этот ореол достигает достаточных размеров в моем сознании, я начинаю пытаться его выразить — «вытиснуть его» — на другом языке. Я пытаюсь найти в языке B те слова, которые, как мне кажется, естественнее всего рассказывают о ситуациях, составляющих данный ореол значений.
Короче говоря, я не перехожу непосредственно от слов и фраз на языке А к словам и фразам на языке В. Вместо этого я бессознательно вызываю в своем воображении образы, явления и идеи, перебираю в памяти собственные воспоминания (или то, что когда-то почерпнул из книг, фильмов или рассказов друзей), и, только когда сформируется этот невербальный, воображаемый, эмпирический, мысленный «ореол» — только когда неуловимый пузырь смысла всплывет в моем мозгу — я начинаю процесс словесного формулирования на языке перевода, а затем многократно пересматриваю получившееся. Данный процесс, опосредованный смыслом, может показаться слишком вялым, и действительно, по сравнению с двумя или тремя секундами, за которые переводчик «Гугл» выдает страницу перевода, так оно и есть — однако именно этим занимается любой серьезный переводчик. Именно это я представляю себе, когда слышу уже упомянутое словосочетание «глубокий ум».
В общем, теперь я перехожу к китайскому языку, который в отличие от двух европейских языков стал для автоматического переводчика по-настоящему серьезным испытанием. Материал для своего эксперимента я позаимствовал из трогательных мемуаров «Мы трое», написанных китайским драматургом и переводчицей Ян Цзян, умершей совсем недавно в возрасте 104-х лет. В своей книге она рассказывает о тесно переплетающихся жизнях трех людей: ее собственной, ее мужа Цяня Чжуншу (также романиста и переводчика) и их дочери. Книга написана не заумным, а живым языком хорошо образованного человека. Я выбрал небольшой отрывок и пропустил его через переводчик «Гугл». Вот результаты, включая мой собственный перевод (опять-таки проверенный носителями китайского языка).
Ян:
锺 书 到 清华 工作 一年 后, 调任 毛 选 翻译 委员会 的 工作, 住 在 城里, 周末 回 校. 他 仍 兼管 研究生.
毛 选 翻译 委员会 的 领导 是 徐永 煐 同志. 介绍 锺 书 做 这份 工作 的 是 清华 同学 乔冠华 同志.
事 定 之 日, 晚饭 后, 有 一位 旧友 特 雇 黄包车 从 城里 赶来 祝贺 客 去 后, 锺 书 惶恐 地 对 我 说.:
他 以为 我 要做 «南 书房 行走» 了. 这 件事 不是 好 做 的, 不 求 有功, 但 求 无 过.
Хофштадтер:
После того, как Чжуншу год проработал в университете Цинхуа, он был переведен в комитет, занимавшийся переводами избранных трудов председателя Мао. Он жил в городе, но каждые выходные приезжал в университет. Он также продолжал вести своих аспирантов.
Руководителем комитета по переводу трудов Мао был товарищ Сюй Юнинг, а человеком, устроившим Чжуншу на эту работу, был его старый приятель по Цинхуа, товарищ Цяо Гуанхуа.
В тот день, когда его кандидатуру окончательно утвердили, старый друг специально нанял рикшу и после обеда приехал из города, чтобы поздравить Чжуншу. Когда наш гость уехал, Чжуншу повернулся ко мне и с тревогой в голосе сказал:
«В мыслях он, верно, уже записал меня в „советники Южного кабинета". Это не такая уж простая работа. Надеяться на славу здесь не приходится; единственное, на что можно надеяться, так это на то, чтобы делать эту работу без ошибок».
Переводчик «Гугл»:
After a year of work at Tsinghua, he was transferred to the Mao Translating Committee to live in the city and back to school on weekends. He is still a graduate student.
The leadership of the Mao Tse Translation Committee is Comrade Xu Yongjian. Introduction to the book to do this work is Tsinghua students Qiao Guanhua comrades.
On the day of the event, after dinner, an old friend hired a rickshaw from the city to congratulate. Guest to go, the book of fear in the book said to me:
He thought I had to do «South study walking.» This is not a good thing to do, not for meritorious service, but for nothing.
(После года работы в Цинхуа он был переведен в Маоский переводческий комитет, чтобы жить в городе и вернуться в школу по выходным. Он все еще аспирант.
Руководство Комитета переводов Мао Цзе является товарищем Сюй Юнцзянем. Введение в книгу для этой работы — ученики Цинхуа, товарищи Цяо Гуанхуа.
В день мероприятия, после обеда, старый друг нанял рикшу из города, чтобы поздравить. Гость, чтобы пойти, книга страха в книге сказала мне:
Он думал, что мне нужно сделать «южное исследование». Это нехорошо, но не для достойного служения, а для ничего.)
Кратко остановлюсь на нескольких несуразностях. Во-первых, переводчик «Гугл» никогда не называет Чжуншу по имени, хотя его имя («锺 书») трижды встречается в оригинале. В первом случае переводчик использует местоимение «он»; во втором — фигурирует «книга»; а в третьем мы читаем: «книга страха в книге». Поди разбери!
Вторая странность заключается в том, что в первом абзаце четко говорится, что Чжуншу является научным руководителем у аспирантов, между тем переводчик «Гугл» превращает в аспиранта его самого.
Третье несоответствие в том, что во фразе «Комитет перевода Мао Цзэдуна» куда-то пропала третья часть имени председателя Мао Цзэдуна.
Четвертая несуразность заключается в том, что имя «Yongying» было заменено на «Yongjian».
Пятая странность состоит в том, что фраза «после того, как наш гость ушел» была сокращена до «гость чтобы пойти».
Наконец, шестое несоответствие заключается в том, что последнее предложение не несет в себе вообще никакого смысла.
На самом деле этих шести несуразностей уже достаточно для того, чтобы порядком пристыдить переводчик «Гугл», но давайте простим и забудем. Вместо этого я обращу ваше внимание только на одну фразу, которая меня сразу смутила: я имею в виду пять иероглифов, заключенных в кавычки, в последнем абзаце («南 书房 行走»). Иероглиф за иероглифом ее можно было бы перевести как «прогулка по южному кабинету», но этот вариант явно неприемлем, тем более что судя по контексту это должно быть существительное. Переводчик «Гугл» решил перевести ее как «Южное исследование», что тоже мало что разъясняет.
Сейчас я признаю, что смысл этого китайского словосочетания был полностью от меня скрыт. Хотя буквально речь шла о каком-то движении пешком в кабинете на южной стороне какого-то здания, я знал, что это неверно; в контексте этот перевод не имел никакого смысла. Чтобы перевести это словосочетание, нужно было знать о какой-то неведомой мне особенности китайской культуры. Итак, куда же я обратился за помощью? К поисковику «Гугл»! (На этот раз уже не к переводчику). Я забил в поисковик китайские иероглифы и заключил их в кавычки, чтобы «Гугл» искал лишь это конкретное сочетание иероглифов. На экране сразу же открылось несколько веб-страниц на китайском языке, и я начал усердно продираться через их начальные абзацы, пытаясь понять, что это за фраза.
Я обнаружил, что этот термин восходит к Династии Цин (1644-1911) и обозначает одного из советников императора, в чьи обязанности входило помогать императору (в кабинете, находящемся в южной части императорского дворца) составлять официальные заявления по всем правилам ораторского искусства. Два иероглифа, которые, как казалось, означали «идти гулять», на самом деле составляли фрагмент со значением «помощи». В результате, учитывая информацию, предоставленную мне поисковой системой «Гугл», я перевел это словосочетание как «советник Южного кабинета».
Очень плохо, что переводчик «Гугл» не мог позволить себе воспользоваться услугами поисковой системы, как это сделал я, не так ли? Но опять же, переводчик «Гугл» не может понимать содержание веб-страниц, хотя и переводит их в считанные секунды. Или все-таки может? Ниже я привожу поразительный образчик синтезируемого текста, который переводчик «Гугл» с невероятной скоростью вывел мне на экран после того, как открылся веб-сайт, предоставивший мне нужную информацию:
«Юг изучения ходьбы» не является официальной позицией, до эпохи Цин это всего лишь «посланник», как правило, тогдашней имперской интеллигенцией Хэнлином. Юг учится у чиновников Ханлинь в «выборе товаров и отличных изделий из ченцай» в ценности, называемой «Южное изучение ходьбы». Из-за приближения к императору решение императора оказать определенное влияние. Yongzheng позже создали «военный самолет», министр военной машины, полный рабочий день, хотя исследование все еще Hanlin в ценности, но не участвует в государственных делах. Ученые в династии Цин в ценность Южного исследования гордятся. Многие ученые и ученые в ранней династии Цин на юг через исследование«.
Разве это английский? Безусловно, никто не станет отрицать, что этот текст состоит из английских слов (во всяком случае, по большей части), но означает ли это, что данный текст на английском языке? На мой взгляд, ввиду того, что приведенный выше абзац не содержит смысла, это не английский язык; это просто беспорядочная смесь из английских ингредиентов — салат из случайно выбранных слов, бессвязная мешанина.
Если вам интересно, вот моя версия перевода того же отрывка (на него мне потребовались часы):
Нан-шуханг-хинзу («специальный помощник Южного кабинета») не считался официальной позицией, однако на заре династии Цин эта особая роль как правило отдавалась тому, кто был тогдашним ученым советником императора. Ученые мужи, работавшие в южном кабинете императорского дворца, выбирали в своих рядах человека недюжинных способностей и благого нрава, который мог бы служить автором-призраком императора и приходить к нему по первому зову; вот почему его называли «специальным помощником Южного кабинета». Помощник Южного кабинета благодаря своей чрезвычайной близости к императору очевидным образом мог влиять на политические решения последнего.
Однако после того, как император Юнчжэн учредил официальное военное министерство во главе с министром и с рядом низших должностей, помощник Южного кабинета — хотя эта должность и не была упразднена — больше не играл столь важной роли в принятии правительственных решений. Тем не менее среди ученых династии Цин работа в Южном кабинете императора считалась невероятно почетной, и на начальном этапе правления этой династии на должности специального помощника Южного кабинета побывало немало известных ученых.
Некоторые читатели могут подумать, что с целью раскритиковать переводчик «Гугл» я выбрал самые неудачные отрывки его переводов и что при более широком наборе текстов он справляется со своей задачей намного лучше. Хотя это звучит правдоподобно, это не так. Почти каждый абзац, выбранный мною из книг, которые я сейчас читаю, порождал ошибки перевода самых разных форм и размеров, включая бессмысленные и непонятные фразы, подобные тем, что я уже приводил.
Разумеется, я допускаю, что иногда переводчик «Гугл» выдает вполне благозвучные предложения (хотя они могут вводить в заблуждение или быть в корне неверными). Перевод целого абзаца или двух может оказаться превосходным, создавая иллюзию того, что переводчик «Гугл» знает, что он делает, понимает, что «читает». В таких случаях программа действительно производит впечатление — кажется почти что человеком! Эта заслуга, безусловно, принадлежит ее создателям и их усердному коллективному труду. Но в то же время не стоит забывать, что переводчик «Гугл» натворил с этими двумя отрывками на китайском, а также с текстами на французском и немецком. Чтобы осознать эти оплошности, необходимо иметь в виду «эффект Элизы».
Многоязычный переводчик ничего не читает — по крайней мере не в привычном для людей понимании «чтения». Он обрабатывает текст. Символы, которые он расшифровывает, находятся в отрыве от реального опыта в окружающем мире. Слова, которые он так бойко перетасовывает, не могут взывать ни к воспоминаниям, ни к воображению, потому что их у него нет, за этими словами не стоят ни понимание, ни смысл.
Один приятель спросил меня, не является ли уровень мастерства переводчика «Гугл» всего лишь одной из функций базы данных этой программы. Он выяснил, что, если увеличить базу данных, скажем, в миллион или миллиард раз, в один прекрасный день она сможет перевести все что угодно и в совершенстве. Я так не думаю. Количественное увеличение данных не приблизит вас к пониманию, поскольку понимание подразумевает наличие мыслей, между тем именно отсутствие мыслей является корнем проблем, перед которыми сегодня стоит машинный перевод. Так что осмелюсь предположить, что более крупные базы данных — даже самые обширные — проблемы не решат.
Еще один естественный вопрос заключается в том, насколько использование переводчиком «Гугл» нейронных сетей — шаг в направлении имитирования мозговой деятельности — приближает нас к истинному пониманию языка машинами. Сначала эта перспектива кажется правдоподобной, однако пока что не было сделано ни одной попытки выйти за пределы поверхностного уровня слов и фраз. Всевозможные статистические сведения об огромных базах данных заключены в нейронных сетях, однако эта статистика связывает слова с другими словами, а не с идеями.
Пока что не предпринимается попыток создать внутренние структуры, которые задумывались бы как идеи, образы, воспоминания или опыт. Такого рода структуры слишком эфемерны, чтобы внедрить их в компьютерную систему, вот почему в качестве замены используются быстрые и тщательно разработанные алгоритмы кластеризации слов. Правда результаты этих техник далеки от того, чтобы соответствовать идеям, возникающим в голове у человека, когда он читает, понимает, создает, преобразует и выносит свое суждение о том или ином тексте.
Несмотря на мой негативизм переводчик «Гугл» предлагает услуги, которые многие люди ценят довольно высоко: он совершает довольно грубую трансформацию наполненных смыслом текстов, написанных на языке А, в необязательно внятные по смыслу цепочки слов на языке B. До тех пор, пока удается понять смысл текста на языке B, многие люди вполне удовлетворены конечным продуктом. Они радуются возможности «получить общее представление» о смысле написанного на языке, которого они не знают. На мой взгляд, к этому явлению не применимо слово «перевод», однако некоторые люди со мной не согласятся и будут расценивать этот сервис как переводческий. Разумеется, я понимаю, чего они хотят и что приносит им удовлетворение. Этим людям можно только позавидовать!
Недавно я видел составленные технофилами диаграммы, якобы представляющие «качество» переводов, сделанных людьми и компьютерами, и судя по этим графикам последние машинные переводчики стремительно приближаются к уровню людей, занимающихся переводами профессионально. Но, по-моему, такой количественный анализ отдает псевдонаукой или, если угодно, педантичными попытками с помощью цифр представить то, что имеет неосязаемую, трудноуловимую и художественную природу. На мой взгляд, результаты, которые сегодня выдает переводчик «Гугл», варьируются от превосходных до самых абсурдных, но мне сложно количественно выразить свое к ним отношение.
Вспомните мой первый пример с местоимениями «его» и «ее». Лишенная идей программа перевела почти все слова правильно, но несмотря на этот небольшой успех, она совершенно не уловила главный смысл текста. Как в подобном случае нам следует «количественно определять» качество выполненной работы? Использование диаграмм, претендующих на научность, для того, чтобы демонстрировать качество переводов, есть не более чем злоупотребление внешними атрибутами науки.
Позвольте мне вернуться к этому новому безрадостному образу переводчика — человека, профессия которого выходит из моды и очень скоро будет списана со счетов, человека, функции которого постепенно сводятся к контролированию качества и внесению в текст небольших поправок. Такой рецепт подойдет в лучшем случае для посредственностей. Настоящий художник не станет брать за основу полный ошибок низкопробный текст, чтобы подлатать его с разных сторон и превратить в произведение высокого искусства. Природа искусства в другом. А перевод — это искусство.
В своих статьях я всегда повторял, что человеческий мозг является машиной — очень сложно организованной машиной — и яростно не соглашался с теми, кто считал машины по сути своей неспособными иметь дело со смыслом. Существует даже целая школа философов, которые утверждают, что компьютеры никогда «не постигнут смысловую нагрузку», потому что сделаны «не из той материи» (силикона). По-моему, это полная чепуха. Я не буду касаться сейчас этих споров, но мне бы не хотелось, чтобы читатели составили обо мне неверное мнение: будто бы, с моей точки зрения, интеллект и понимание вообще не доступны компьютерам. Если в этой статье я произвожу на вас именно такое впечатление, то лишь потому, что технология, о которой идет речь, не пытается воспроизводить человеческий интеллект. Скорее наоборот: она пытается искусно избежать человеческого интеллекта, и приведенные выше результаты перевода со всей ясностью выявляют эти гигантские упущения.
С моей точки зрения, нет основательных причин полагать, что в один прекрасный день машины не смогут думать, творить, быть забавными, тосковать о прошлом, приходить в восторг, пугаться, испытывать экстаз, смиряться, надеяться на что-то и, как следствие, делать блестящие переводы с одного языка на другой. Нет основательных причин думать, что в один прекрасный день машины не смогут с большим успехом переводить шутки, игру слов, сценарии, романы, стихи и, разумеется, очерки, подобные этому. Но все это произойдет лишь тогда, когда машины будут наполнены мыслями, эмоциями и опытом — как человеческие существа. А такая перспектива пока даже не маячит на горизонте. И на самом деле, как мне кажется, она от нас чрезвычайно далека. По крайней мере это то, на что горячо надеется ваш покорный слуга, не перестающий восхищаться глубинами человеческого разума.
В тот день, когда автоматический переводчик создаст художественный роман в стихах на английском с использованием четырехстопного ямба и звукописи, остроумный и берущий за душу, я пойму, что настало время откланяться.