За последние несколько лет лаборатория нейробиологии Джека Галланта извела кучу бумаги на исследования, выводы из которых звучат абсурдно.
В 2011 году лаборатория показала, что возможно воспроизвести видеоклипы, опираясь лишь на наблюдения за активностью мозга людей, которые их смотрят. Используя компьютер для воссоздания образов фильма и сканируя для этого мозг человека, который смотрит этот фильм, в каком-то смысле можно заниматься чтением мыслей. Подобным же образом в 2015 году команда ученых под руководством Галланта смогла определить, какие известные картины люди, чья мозговая активность наблюдалась, рисовали в уме.
В этом году команда объявила в журнале Nature, что они создали «атлас», в котором зафиксировали, где в мозгу располагаются более 10 000 отдельных слов — просто изучая, как участники эксперимента слушают подкасты.
Как им все это удалось? С помощью возможностей машинного обучения — можно сказать, искусственного интеллекта, который смог вскрыть огромную сокровищницу информации головного мозга и определить паттерны его активности, позволяющие угадывать, что происходит у нас в сознании.
Цель построить машину для чтения мыслей не стояла (хотя часто так думают). Нейробиологи не собираются красть пароли прямо у вас из головы. Ваши страшные тайны их тоже не интересуют. Настоящая цель гораздо величественнее. Превратив нейробиологию в науку о «больших данных» и используя машинное обучение для изучения этих данных, Галлант с коллегами вступили на путь возможной революции в наших представлениях о мозге.
Ведь все-таки человеческий мозг — это самый сложноустроенный объект, известный нам во вселенной, и мы едва знаем его. Безумная идея лаборатории Галланта — идея, которая могла бы помочь нейробиологии «вырасти» из детского возраста и встать на ноги — состоит вот в чем: может быть, нам стоит создать специальные машины, которые объяснят нам наш собственный мозг. Есть надежда, что если мы сможем расшифровать невероятно затейливые узоры активности мозга, то тогда сможем и понять, как исправлять последствия его болезней.
Функциональная МРТ — основной инструмент изучения и анализа функций мозга и его анатомии — была изобретена только в 90-х и она дает нам лишь очень приблизительную картину.
Для сравнения: самый маленький элемент активности мозга, который может зафиксировать фМРТ, — это так называемый воксел. Обычно такие вокселы чуть меньше, чем куб со стороной один миллиметр. А в одном вокселе может быть 100 000 нейронов. Как мне объяснил нейробиолог Техасского университета Тал Яркони (Tal Yarkoni), фМРТ «напоминает полет над городом в поисках зажженных фонарей».
Снимки традиционной фМРТ могут показать, где находятся обширные зоны, связанные с поведением, — например, где у нас рождаются негативные эмоции или какие зоны активизируются, когда мы видим знакомое лицо.
Но при этом мы не знаем, какую именно роль та или иная зона играет в нашем поведении, и имеют ли решающее значение также и менее активные зоны. Наш мозг — это не набор конструктора «Лего», где каждая из деталей имеет конкретное назначение. Это целая система активностей. «Каждая область мозга имеет 50%-ный шанс оказаться связанной с любой другой областью», — говорит Галлант.
Поэтому простые эксперименты по поиску в мозге, например, «зоны голода» или «зоны внимания» фактически не могут дать удовлетворительного результата.
«Последние 15 лет мы разглядывали эти очаги активности и размышляли о том, что это и есть вся информация здесь — сами очаги», говорил мне в июле Петер Бандеттини, руководитель отделения методики фМРТ в Национальном институте психического здоровья. «А оказывается, что каждый нюанс каждого очагаа, малейшее изменение в его колебаниях содержит информацию о деятельности мозга, мы в этом еще даже не до конца разобрались. Вот почему нам нужны эти технологии машинного обучения. Наши глаза видят эти очаги, но не различают их структуру. Структура слишком сложна».
Вот пример. Традиционное представление о том, как мозг использует язык, заключается в том, что процесс происходит в левом полушарии и двух специальных зонах — зоне Брока и зоне Вернике — центрах языковой активности. Если эти зоны буду повреждены, вы станете неспособны к лингвистической деятельности.
Но Алекс Хут (Alex Huth), постдокторант Лаборатории Галланта, недавно показал, что такое понимание слишком упрощенно. Хуту хотелось знать, участвует ли в использовании языка весь мозг.
В одном его эксперименте несколько участников слушали двухчасовой подкаст, в котором рассказывалась история под названием «Мотылек», в то время как он с коллегами записывал их мозговую активность с помощью сканеров фМРТ. Цель была установить связь между активностью определенных зон мозга и прослушиванием конкретных слов.
Это дало огромный объем информации, больше, чем какой-либо человек в состоянии обработать, рассказал Галлант. Но компьютерная программа, обученная поиску паттернов, может их определять. И с помощью программы, которую создал Хут, оказалась возможным нарисовать «атлас», показывающий где то или иное конкретное слово «живет» в мозгу.
«Исследование Алекса показало, что огромные части мозга участвуют в семантическом осмыслении», — говорит Галлант. Кроме того, он показал, что слова со смежными значениями — типа «пудель» и «собака» — располагаются в мозгу рядом друг с другом.
Так в чем же значение подобного проекта? В сфере науки прогнозирование означает власть. Если ученые объяснят, как ошеломляющий шквал мозговой активности отражает лингвистическую активность, они смогут построить лучшую модель работы мозга. А если они создадут рабочую модель, то смогут лучше понять, что случается, когда переменные изменяются — когда мозг нездоров.
Что такое машинное обучение?
«Машинное обучение» — это широкий термин, который охватывает огромный массив программного обеспечения. В области бытовых технологий машинное обучение развивается как на дрожжах — например, обучаясь идентифицировать, то есть «видеть» объекты, скажем, на фото почти как человек. Используя технологию машинного обучения, которая называется «глубокое обучение», сервис Google’s Translate развился из зачаточного инструмента перевода (часто дающего очень смешные результаты) до программного обеспечения, которое может переводить Хемингуэя на дюжину языков и выдавать стиль, способный конкурировать с профи.
Но на базовом уровне программное обеспечение с машинным обучением занимается поиском паттернов: какова вероятность того, что переменная X будет коррелировать с Y.
Как правило, программы машинного обучения нуждаются в первичной «тренировке» на определенном наборе данных. Чем больше тренировочных данных, тем «умнее» обычно становится механизм. После тренировки программы машинного обучения получают совершенно новые наборы данных, с которыми они раньше не сталкивались. И на основе этих новых наборов данных они уже могут начать делать прогнозы.
Простой и хороший пример — ваш фильтр против спама. Самообучающаяся программа просканировала достаточное количество «мусорных» посланий, изучила, какие языковые паттерны в них содержались, и теперь может распознать спам в пришедшем письме.
Машинное обучение может использоваться в очень простых программах, которые просто вычисляют математические регрессии (Помните уроки математики в средней школе? Подсказка: это о том, как найти наклон линии, которая описывает соотношение нескольких точек графика). Или оно может быть как у Google DeepMind, собирающей миллионные наборы значений, которая помогла компании Google создать компьютер, обыгравший человека в го, игру настолько сложную, что ее доска и фигуры делают возможными большее количество конфигураций, чем число атомов во вселенной.
Нейробиологи используют машинное обучение для нескольких разных целей. Вот две основных: кодирование и декодирование.
«Кодирование» подразумевает, что программа с машинным обучением пытается предсказать, какой паттерн мозговой активности вызовет определенный раздражитель.
«Декодирование» — это обратный процесс: по имеющейся информации об активных зонах мозга нужно определить, на что смотрят участники эксперимента.
(Примечание: нейробиологи используют машинное обучение и вместе с другими сканерами мозговой активности — такими, как ЭЭГ и МЭГ — в дополнение к фМРТ).
Брайс Кул (Brice Kuhl), нейробиолог Орегонского университета, недавно использовал декодирование, чтобы реконструировать лица, на которые смотрели партиципанты, основываясь лишь на данных фМРТ.
Области мозга, которые Кул зафиксировал на снимках МРТ, давно известны тем, что связаны с яркими воспоминаниями. «Связана ли эта область с конкретными особенностями того, что вы видели, или просто [активизируется] из-за того, что у вас отчетливые воспоминания?» — задается вопросом Кул. Судя по тому, что программа машинного обучения определяет черты лица, опираясь на активность мозга в этой области, можно предположить, что в этой зоне «живет» и информация о «подробностях увиденного».
Верхний ряд — это реальные лица, использованные в эксперименте Кула. Два нижних ряда — угаданы на основе активности двух разных областей мозга. Реконструкции далеки от совершенства, но они отражают основные характеристики оригиналов — пол, тон кожи и улыбку удалось зафиксировать. Изображение из The Journal of Neuroscience.
Похожим образом эксперимент Галланта по определению того, о каком произведении искусства думают партиципанты, раскрыл еще один небольшой секрет мозга: мы активизируем одни и те же зоны мозга, когда вспоминаем визуальную информацию и когда собственно воспринимаем ее.
Те нейробиологи, с которыми я разговаривал, рассказали, что пока что машинное обучение не произвело в их области какой-то особенной революции. Основная причина этого то, что у них нет достаточного количества данных. Сканирование мозга занимает очень много времени и стоит дорого, так что в экспериментах обычно задействуются несколько дюжин участников, а не несколько тысяч.
«В 90-х нейровизуализация только появилась, люди искали разницу в восприятии разных категорий явлений — какая часть мозга активизируется при восприятии лиц, а какая — при восприятии домов или инструментов, это были крупномасштабные задачи», — рассказывает Авнил Хьюмен (Avniel Ghuman), исследователь нейродинамики в Питтсбургском университете. «Сейчас мы можем задавать более конкретные вопросы. Например, вспоминает ли человек сейчас о том же, о чем думал 10 минут назад?»
Это прогресс «скорее эволюционный, чем революционный», говорит он.
Нейробиологи надеются, что машинное обучение поможет диагностировать и лечить умственные расстройства
На сегодняшний день психиатры не могут просто обследовать пациента с помощью фМРТ и определить, страдает ли он умственным расстройством типа шизофрении, только по информации об активности мозга. Они вынуждены полагаться на клинические беседы с пациентом (которые, без сомнения, имеют огромное значение). Но программный диагностический подход мог бы позволить отличать один вид недуга от другого, что повлияло бы на выбор лечения. Чтобы этого добиться, по словам Бандеттини из Национального института психического здоровья, нейробиологам требуется доступ к огромным базам данных по очагам мозговой активности на основе фМРТ-сканирований, состоящим из 10 000 субъектов.
Программы с машинным обучением могли бы изучить эти наборы данных в поисках сигнальных паттернов умственных расстройств. «А тогда можно вернуться в начало и использовать все это более клинически — просканировать человека и сказать: „На основании биомаркера, выделенного с помощью базы данных, сформированной из показателей 10 000 человек, мы может поставить диагноз, скажем, шизофрения“», — объясняет Бандеттини. Работа в этом направлении все еще носит предварительный характер и усилия не дали значительных результатов.
Но при достаточном понимании того, как взаимодействуют между собой мозговые системы, можно было бы «планировать все более и более сложные способы вмешательства с целью исправить работу мозга, если она вдруг пошла не так», — говорит Дан Яминс (Dan Yamins), вычислительный нейробиолог в Массачусетском технологическом институте. «Например, возможно, мы сможем вживлять что-то вроде имплантата, который каким-то образом скорректирует болезнь Альцгеймера или Паркинсона».
Машинное обучение могло бы также помочь психиатрам заранее определять, как мозг того или иного пациента отреагирует на конкретное медикаментозное лечение депрессии. «На сегодняшний день психиатры вынуждены только догадываться, какое лекарство вероятнее всего будет эффективно с диагностической точки зрения», — говорит Яминс. «Потому что информация, которую дают симптомы, не предоставляет достаточно точной картины того, что происходит в мозгу».
Он подчеркнул, что в ближайшем будущем этого не произойдет. Но ученые уже начали размышлять над этими проблемами. Журнал NeuroImage развил целую дискуссию, посвященную исследованиям в области изучения индивидуальных различий мозга и диагностике, основанной исключительно на данных нейровизуализации.
Это важная работа. Потому что в области здравоохранения подобная расшифровка предложит новые способы лечения и профилактики.
Машинное обучение могло бы прогнозировать эпилептические припадки
Больные, страдающие эпилепсией, никогда не знают, когда ждать парализующего приступа. «Это очень ухудшает качество жизни — вы, например, не можете водить машину, это бремя, вы не участвуете во всех сферах повседневной жизни, как могли бы», — говорит мне Кристиан Майсел (Christian Meisel), нейробиолог, сотрудник Национальных институтов здоровья США, — «Идеально было бы иметь какую-то систему предупреждения».
Да и способы лечения эпилепсии далеки от совершенства. Некоторые пациенты принимают противосудорожные препараты 24 часа в сутки 7 дней в неделю, а ведь у них есть серьезные побочные эффекты. А на 20-30% пациентов никакие препараты просто не действуют.
Прогнозирование могло бы изменить правила игры.
Если бы эпилептики знали, что приближается припадок, они успевали хотя бы найти безопасное место. Прогнозирование могло бы также повилять на способы лечения: предупреждение давало бы сигнал прибору, который вводит быстродействующий противоэпилептический препарат или посылает электрический сигнал, препятствующий развитию припадка.
Майсел показал мне ЭЭГ — электроэнцефалограмму — одного из страдающих эпилепсией пациентов. «В этот момент припадка не было», — рассказывает Майсел, — «Вопрос в том, отражена ли здесь активность мозга за час или более чем за четыре часа до припадка»?
Для клинициста будет очень трудно это спрогнозировать, «если вообще не невозможно», говорит он.
Но информация о приближающемся припадке может быть скрыта в этом водовороте активности. Чтобы проверить эту возможность, лаборатория Майсела недавно приняла участие в конкурсе, организованном научным интернет-сообществом Kaggle. Kaggle предоставило электроэнцефалограммы трех страдающих эпилепсией пациентов, записывавшиеся в течение нескольких лет. Майсел использовал машинное обучение, чтобы проанализировать данные и найти паттерны.
Насколько хорошо можно предсказывать по ЭЭГ приступы с целью подготовиться к ним? «Если считать, что у нас есть совершенная система, которая может прогнозировать абсолютно все, пусть это будет 1 балл», — говорит Майсел, — «А если система делает предсказание случайно, не надежнее, чем подбрасывая монетку, то это 0,5 балла. Мы сейчас на уровне 0,8. Это значит, что мы не делаем идеальных прогнозов. Но наши прогнозы гораздо надежнее, чем случайные догадки». (Звучит это здорово, но в реальности сейчас этот подход относится скорее к области теории, чем к практике. ЭЭГ изученных пациентов были внутричерепными, а это инвазивная процедура).
Майсел занимается теоретической нейрологией, разрабатывая модели, по которым эпилептические припадки разрастаются из небольших очагов нейтральной активности во всеобъемлющий изнуряющий шторм. Он рассказывает, что машинное обучение становится полезным инструментом, который поможет ему развить свою теорию. Он может включить эту теорию в модель с машинным обучением и посмотреть, станет ли система делать более надежные или менее надежные прогнозы. «Если это сработает, значит, моя теория верна», — говорит он.
Чтобы машинное обучение дало действительно значительные результаты, нейробиология должна стать наукой с большой базой данных
Машинное обучение не решит всех основных проблем нейробиологии. Оно ограничивается качеством информации, поступающей от сканирования фМРТ и других типов сканирования мозга. (Следует помнить, что фМРТ дает в лучшем случае лишь размытое изображение мозга.) «Даже если бы у нас бесконечное число изображений, мы все равно не смогли бы делать идеальные прогнозы, так как нынешние способы визуализации очень несовершенны», — говорит Гейл Вероко (Gael Varoquaux), специалист по вычислительным системам, который превратил машинное обучение в инструмент для работы нейробиологов.
Во всяком случае, все нейробиологи, с которыми я разговаривал, восхищались машинным обучением как минимум потому, что оно делает науку более точной. Машинное обучение справляется с так называемой «проблемой множественного сравнения», благодаря чему ученые могут вылавливать статистически значимые результаты в добытых данных (при условии наличия достаточного количества сканов мозга, где «подсвечена» какая-то область). Благодаря машинному обучению вы точно знаете, правильный ваш прогноз относительно реакции мозга или нет. «Возможность предсказывать», — говорит Вероко, — «дает вам контроль».
Подход по принципу работы с большими данными также подразумевает, что нейробиологи смогут начать изучение мозга за пределами лаборатории. «Все наши традиционные модели изучения того, как происходит мозговая активность, основана на очень специфических искусственных условиях эксперимента», — говорит Хьюмен, — «Мы не вполне уверены, что все будет происходить так же в условиях реальной жизни». Если у нас будет достаточно данных о мозговой активности (например, поставляемых мобильными сканерами ЭЭГ) и реакций мозга, программы машинного обучения могли бы начать искать паттерны, связывающие две эти области, не нуждаясь в надуманных экспериментах.
Есть и еще одно применение машинного обучения в нейробиологии, и звучит оно фантастически: мы можем использовать машинное изучение мозга, чтобы создать еще лучшие программы машинного обучения. Самым большим прогрессом в развитии машинного обучения за последние десять лет стала так называемая идея «сверточной нейронной сети». Именно ее Google использует, чтобы распознавать объекты на фотографиях. Эти нейронные сети основаны на теориях нейробиологии. Поэтому если машинное обучение поможет программам лучше понимать устройство мозга, они могут найти новые приемы для себя и стать умнее. Тогда эти усовершенствованные программы машинного обучения можно вернуть к дальнейшему изучению мозга и узнать еще больше в области нейробиологии.
(Исследователи также могут использовать данные, полученные с помощью программ машинного обучения, созданных для визуального воспроизведения человеческого поведения. Возможно, изучая человеческое поведение, программа сможет повторить и то, как мозг в реальности это делает.)
«Я не хочу, чтобы люди думали, что мы вот сейчас внезапно изобретем прибор для чтения мыслей, это не так», — говорит Вероко, — «Мы рассчитываем разработать вычислительные модели с более широкими возможностями, чтобы лучше понять мозг. И я думаю, мы преуспеем в этом».