Ученый Лесли Вэлиант, занимающийся компьютерами, считает понятие «машинное обучение» излишним. По его мнению, обучением можно назвать и игру едва начинающего ходить ребенка с резиновым мячом, и сеть по глубинному изучению фотографий кошек. Охарактеризовать последнюю систему как «машинную» — значит привести различение без различия.

Вэлиант, специализирующийся на изучении компьютеров ученый из Гарвардского университета, отнюдь не единственный специалист, предполагающий наличие фундаментального сходства между возможностями интеллекта и компьютера. Однако он был одним из первых, кому удалось формализовать то, как именно эти отношения могут выглядеть на практике: предложенная им в 1984 году модель «приближенного правильного обучения» (probably approximately correct learning, PAC) математически определяет условия, при которых о механистической системе можно сказать, что она «изучает» информацию. За свой вклад в науку Вэлиант был удостоен премии имени Алана Тьюринга (A.M. Turing Award) — ее часто называют Нобелевской премией в области вычислительной техники, — и это помогло сформировать целую область знаний, связанную с теорией компьютерного обучения.

Концептуальный скачок Вэлианта этим не ограничился. В опубликованной в 2003 году книге с таким же названием «Приближенно правильное обучение» (Probably Approximately Correct) Вэлиант раздвинул рамки своей теории, включив в нее также биологическую эволюцию.

Он расширил концепцию алгоритма, превратив его в «экоритм» (ecorithm), представляющий собой алгоритм обучения, который «работает» в любой системе, способной взаимодействовать со своим физическим окружением. Алгоритмы применяются к вычислительным системам, тогда как экоритмы могут применяться к биологическим организмам или к целым видам. Его концепция устанавливает эквивалентность между тем способом, с помощью которого люди учатся, и тем способом, на основании которого развивается вся экосистема. В обоих случаях экоритмы описывают адаптивное поведение механистическим способом.

Провозглашаемая самим Вэлиантом цель состоит в том, чтобы найти «математические определения обучения и эволюции, применимые ко всем случаям, в которых информация может вводиться в систему». Если цель будет достигнута, то тогда полученная «теория всего» (theory of everything) — эту фразу использует сам Вэлиант и только наполовину в шутку – в буквальном смысле сплавит воедино науку о жизни и науку о компьютерах. Более того, наше интуитивное определение «обучения» и «интеллекта» будет расширено и будет включать в себя не только не-организмы, но и не-индивиды. «Мудрость толпы» перестает быть простой фигурой речи.

Корреспондент журнала Quanta Magazine побеседовал с Вэлиантом о его работе, направленной на преодоление различия между биологией, вычислением, эволюцией и обучением. Далее следует отредактированный и сокращенный вариант этого интервью.

Quanta Magazine: Как у вас возникла идея относительно «приближенно правильного» обучения?

Лесли Вэлиант: Я принадлежу к сообществу теоретических компьютерных наук, члены которого специализируются в области теории вычислительной сложности, но я также интересовался вопросами, связанными с искусственным интеллектом. Первый мой вопрос формулировался так: Какой аспект искусственного интеллекта можно превратить в квантитативную теорию? Я быстро остановился на идее о том, что это должно быть обучение.

В то время, когда я начал работать над этой темой (в 1980-е годы), люди уже изучали машинное обучение, однако в то время не было консенсуса относительно того, что это было за «обучение». На самом деле, специалисты в области теоретической компьютерной науки относились к обучению крайне подозрительно — как к чему-то, что никогда не будет иметь возможности стать наукой.

С другой стороны, обучение является легко воспроизводимым феноменом — как яблоко, падающее на землю. Каждый день дети во всем мире изучают тысячи новых слов. Это масштабный феномен, для которого должно существовать определенное квантитативное объяснение.

Поэтому я подумал о том, что обучение должно иметь нечто вроде теории. Поскольку статистические выводы (statistical inference) уже существовали, то мой следующий вопрос был таким: Почему статистики недостаточно для того, чтобы объяснить искусственный интеллект? Это послужило началом: обучение должно стать чем-то статистическим, но также чем-то вычислительным. Мне нужна была теория, которая объединяла бы вычисление и статистику, а также объясняла бы, что это за феномен.

— Так что же такое обучение? Отличается ли оно от вычисления или от счета?

— Это своего рода счет, однако цель обучения состоит в том, чтобы добиваться успехов в мире, который заранее не является точно смоделированным. Алгоритм обучения проводит наблюдение за миром, и с учетом полученной информации он решает, что делать, и, кроме того, производится оценка принятого решения. В своей книге я делаю вывод о том, что все знания индивида должны быть получены либо через обучение, либо  через эволюционный процесс. А если это так, то тогда индивидуальное обучение и эволюционный процесс должны иметь объединяющую теорию для их объяснения.

— И вы, в конечном итоге, приходите к концепции «экоритма». Что такое экоритм и чем он отличается от алгоритма?

— Экоритм — это алгоритм, однако его действия оцениваются на основе вводимых данных, которые он получает  от довольно неконтролируемого и непредсказуемого мира. А его цель состоит в том, чтобы показывать хорошие результаты в том же сложном мире. Вы представляете себе алгоритм как нечто работающее в вашем компьютере, но он с той же легкостью может работать и в биологическом организме. Однако в каждом из этих случаев экоритм существует во внешнем мире и взаимодействует с этим миром.

— То есть, концепция экоритма призвана вытеснить ошибочное интуитивное представление многих из нас о том, что «машинное обучение» фундаментальным образом отличается от «немашинного обучения»?

— Да, конечно. С точки зрения науки, уже более полувека существует тезис о том, что наш мозг осуществляет вычисления, и если мы могли бы определить алгоритм, производящий эти вычисления, то тогда мы могли бы смоделировать это на машине, и в таком случае «искусственный интеллект» и «интеллект» стали бы одним и тем же. Однако на практике сложность состоит в точном определении того, какие именно вычисления происходят в нашем мозге. Машинное обучение  оказывается эффективным способом, позволяющим обойти эту сложность.

Некоторые из самых больших вызовов, остающихся для машин, связаны с вычислениями относительно поведения, приобретаемыми нами через эволюцию, а также с тем, что мы изучаем, когда мы, будучи малыми детьми, ползаем по земле, дотрагиваемся до предметов и воспринимаем нашу окружающую среду. Именно таким способом мы приобретаем знания, которые нигде не записаны. Так, например, если я сдавлю бумажный стакан, наполненный горячим кофе, то я знаю, что за этим последует, однако такого рода информацию весьма непросто найти в интернете. Если бы она была доступна именно в таком виде, то мы могли бы с меньшими усилиями получить эту информацию машинным способом.

— Можно ли сказать о системах, чье поведение мы уже понимаем достаточно хорошо для моделирования с помощью алгоритмов — как, например, происходит в случае солнечных систем или кристаллов — что они тоже «обучаются»?


— Я бы не стал рассматривать подобные системы как обучающиеся. Я думаю, что необходима некая минимальная вычислительная активность  со стороны изучающей системы, и если происходит какие-то обучение, то оно должно сделать соответствующую систему более эффективной. Еще 10 или 20 лет назад, когда машинное обучение начало быть чем-то, что компьютеры могли делать впечатляюще хорошо, не было свидетельств обучения, происходящего во вселенной за рамками биологических систем.

— Каким образом теория обучения может быть применена к такому феномену как биологическая эволюция?

— Биология базируется на сетях протеинового выражения, и в процессе эволюции эти сети изменяются. Модель изучения PAC накладывает некоторые логические ограничения на то, что может происходить в этих сетях и что может послужить причиной изменений в процессе дарвиновской эволюции. Если мы соберем больше наблюдений и проанализируем их в рамках обучения на основе PAC, то мы тогда должны будем понять, как и почему биологическая революция оказывается успешной, и это сделает наше понимание эволюции более конкретным и предсказуемым.

— Как далеко мы продвинулись?

— Мы еще не решили всех имеющихся у нас проблем в отношении биологического поведения, и нам только предстоит идентифицировать фактические, специфические экоритмы, используемые в биологии для реализации подобных феноменов. И поэтому я думаю, что данные рамки ставят правильные вопросы, но мы просто не знаем правильных ответов. На мой взгляд, эти вопросы находятся в пределах досягаемости, и этого можно добиться за счет сотрудничества между биологами и учеными, занимающимися компьютерными науками. Мы знаем, что надо искать. В настоящее время мы заняты поисками алгоритма обучения, подчиняющегося дарвиновским ограничениям относительно того, что биология может поддерживать и, на самом деле, поддерживает. Это даст нам  объяснение того, что происходит на этой планете в то количество времени, которое находилось в распоряжении эволюции.

— Представим себе, что специфические экоритмы, в которых в зашифрованном виде находятся биологическая эволюция и обучение, завтра будут открыты. И когда мы уже будем обладать этим точным знанием, что мы сможем делать или понимать из того, что мы не могли до этого?

— Ну, мы будем понимать, откуда мы пришли. Однако другая экстраполяция  состоит в привлечении большего количества психологии в область понимаемого с помощью вычислений. И поэтому более глубокое понимание человеческой природы будет еще одним результатом в том случае, если эту программу удастся успешно осуществить.

— Вы полагаете, что компьютеры будут в состоянии надежно предсказать то, что мы, люди, будем делать?

— Это весьма экстремальный сценарий. Какие данные мне будут нужны относительно вас для того, чтобы точно предсказать, что вы будете делать через час? Из естественных наук мы знаем, что люди состоят из атомов, а еще мы много знаем относительно свойств атомов, и в некотором теоретическом смысле мы способны предсказать, что могут делать определенные наборы атомов. Однако подобная точка зрения не позволяет очень далеко продвинуться в объяснении человеческого поведения, потому что человеческое поведение является исключительно сложным проявлением слишком большого количества атомов. Я говорю вот о чем: если иметь объяснение работы интеллекта боле высокого уровня, то тогда можно будет ближе подойти к такому объяснению  человеческого поведения, которое будет соответствовать нашему механистическому пониманию других физических систем. Поведение атомов слишком далеко отстоит от человеческого поведения, но если бы мы понимали алгоритмы, используемые в мозге, то это предоставило бы нам механистическую концепцию, которая была бы намного ближе к человеческому поведению.  И тогда полученные нами объяснения того, почему вы делаете то, что вы делаете, стали бы значительно более правдоподобными и более точными по своим прогнозам.

— А что если управляющие эволюцией и изучением экоритмы окажутся недоступными для изучения?

— Подобного рода возможность является логичной, но я не думаю, что она, вообще, вероятна. На мой взгляд, это будет что-то весьма ощутимым и разумно легким для понимания. Мы можем задать такой же вопрос относительно нерешенных фундаментальных проблем в математике. Вы верите в то, что эти проблемы имеют такие решения, которые могут быть понятны людям, или вы считаете, что они находятся за пределами человеческого поминания? В этом области я весьма уверен — в противном случае я бы не занимался этим делом. Я считаю, что используемый природой алгоритм является воспринимаемым и понятным, и он не потребует наличия способностей непосредственного познания, которыми мы не обладаем.


— Многие известные ученые выражают озабоченность по поводу возможного появления искусственного «сверхинтеллекта», который может превзойти наши способности его контролировать. Если ваша теория относительно экоритмов верна, и разум, на самом деле, возникает из взаимодействия между алгоритмом обучения и его средой, то означает ли это, что мы должны быть столь же бдительными относительно той среды, где мы размещаем системы искусственного интеллекта, как и относительно программирования самих систем?

— Если вы создаете интеллектуальную систему, способную обучаться на основе своих контактов со средой, то тогда – кто знает? На самом деле, в некоторых средах системы могут демонстрировать поведение, которое вообще невозможно предсказать, и это поведение может быть вредоносным. Поэтому есть смысл в том, что вы говорите. Но, в целом, меня не беспокоят все эти разговоры по поводу сверхинтеллекта, который каким-то образом может положить конец человеческой истории. Я рассматриваю интеллект как нечто, состоящее из воспринимаемых, механических и, в конечном итоге, понятных процессов. Мы будем понимать закладываемый в машины интеллект так же, как мы понимаем физику взрывчатых веществ — то есть, достаточно хорошо, чтобы сделать их поведение в достаточной мере предсказуемым для того, чтобы они не причиняли нам непреднамеренного ущерба. Я не очень беспокоюсь по поводу того, что искусственный интеллект может, по своей сути, чем-то отличаться от существующих мощных технологий. Он обладает таким же научным фундаментом, как и другие.