Новый глава Microsoft Сатья Наделла (Satya Nadella) решил, что его компании следует освоить новую, почти неизведанную территорию: устный перевод практически в реальном времени.
«Преодолеть языковые границы было мечтой человечества с тех пор, как мы научились говорить», — считает Наделла.
Выступая на новой конференции Code Conference, организованной в Южной Калифорнии сайтом Re/Code (ранее организовывавшим D Conference), Наделла и вице-президент Skype Гурдип Сингх Полл (Gurdeep Singh Pall) позвонили по Skype не говорящему по-английски немецкому другу. Им удалось понять друг друга с помощью предварительной версии переводчика Skype.
«Больше никто этим не занимается, — сказал мне Полл. — Это первая попытка сделать нечто подобное». Вероятно, такой переводчик будет очень востребован.
Английский — не самый распространенный язык в мире. По некоторым оценкам, он занимает третье место после китайского (в разных вариантах) и хинди. Однако продолжающаяся глобализация нашего общества настоятельно требует, чтобы мы могли общаться поверх языковых барьеров. По подсчетам Microsoft, у Skype уже более 300 миллионов активных пользователей. На его долю приходится примерно треть международных звонков. Только представьте себе, во что он превратится, если обзаведется встроенным переводчиком речи.
Microsoft не впервые занялась распознаванием речи. Соответствующие технологии используются в новом личном помощнике Cortana из Windows Phone 8.1 и в консолях Xbox 360 и Xbox. Переводчик Skype, созданный Microsoft Research, объединяет в себе распознавание речи, преобразование текста в речь и машинный перевод.
«Сообщество пользователей Skype ОЧЕНЬ велико, — написал нам по электронной почте глава Microsoft Research Питер Ли (Peter Lee). — Чтобы воплотить идею переводчика Skype в жизнь, потребовались серьезные научные исследования и отличная инженерная работа».
Как же работает переводчик Skype? Один из собеседников начинает говорить. Переводчик распознает слова и преобразовывает их в печатный текст, который переводится на язык второго собеседника и зачитывается на этом языке.
Этот процесс может показаться медленным, и, как объяснил мне Полл, перевод действительно немного запаздывает, однако проблема заключается не в самой технологии, а в том, что с учетом наличия видео-компонента, система должна работать так, чтобы все это выглядело естественно.
Когда первый собеседник говорит, второй слышит его голос в приглушенном варианте, а переводчик Skype зачитывает переведенный текст. Более того, система выявляет естественные паузы в речи («отслеживает молчание», как выражается Полл) и начинает переводить именно в это время. Длительность процесса полностью зависит от длины фразы или предложения. Альтернативой этому было бы держать нажатой кнопку, пока говоришь, и отпускать ее в конце фразы. Избранный разработчиками подход выглядит естественнее.
Чтобы переводчик Skype понимал, какие языки использовать, его нужно специально настроить. Распознавать с ходу языки он пока не научился.
Как и прочие речевые системы, переводчик Skype со временем будет развиваться и улучшать качество перевода и речи. Тем не менее, пройдет еще немало времени, прежде чем мы сможем позвонить итальянскому родственнику и приветствовать его на его родном языке: «Come stai amico mio?» Переводчик Skype выйдет в этом году как автономное приложение Windows 8.1. Планируется встроить его в сам Skype, чтобы он работал на всех платформах, однако, когда эта цель будет достигнута, Microsoft пока не говорит.