В прошлом месяце мы узнали, что российские спецслужбы потратили, по меньшей мере 100 тысяч долларов на рекламные объявления в Facebook. Мы также узнали, что подставные российские пользователи использовали Facebook, чтобы организовать антииммиграционные протесты в реальной жизни. Только на прошлой неделе в одном исследовании фигурировали подсчеты, согласно которым «естественный охват» политических публикаций российской фабрики троллей (Агентства интернет-исследований) насчитывал от 340 миллионов до нескольких миллиардов просмотров. Это исследование вызвало огромный интерес. Статья о нем была опубликована статья в блоге Washington Post Switch.
Это большие цифры. Однако их легко неверно интерпретировать. 100 тысяч долларов на рекламу — это капля в море по сравнению с 70 миллионами, потраченными непосредственно на кампанию Трампа. Много кто приходил на протесты против иммиграции. Выясняется, что многократно цитировавшаяся система подсчетов естественного охвата аудитории столкнулась с проблемой сетевых ботов.
Исследование, утверждающее, что российские публикации получили миллиарды просмотров, опубликовано Джонатаном Олбрайтом (Jonathan Albright), руководителем исследовательского отдела Центра цифровой журналистики Тоу при Колумбийском университете. Олбрайт опирался на данные CrowdTangle, популярного инструмента для анализа социальных сетей, занимающегося мониторингом взаимодействий пользователей Facebook и выявлением популярного контента. Это новаторское, творческое применение инструментов CrowdTangle, а не прямое его назначение. К сожалению, это могло привести к некоторым проблемам при анализе.
Я изучал CrowdTangle в своей книге 2016 года «Аналитический активизм». Вот как работает этот инструмент: «Логика модели CrowdTangle относительно проста (даже несмотря на появляющиеся сложности в лежащих в его основе подсчетах и программном обеспечении). CrowdTangle отслеживает кластеры страниц Facebook и конкретные ключевые слова. Он собирает исторические сведения о том, как истории, посты и изображения, пользующиеся успехом по сравнению с ожидаемым исходным уровнем производительности. Далее компания отправляет эту информацию в ежедневном электронном письме, предупреждая своих клиентов о том контенте, который скорее всего будет демонстрировать наилучшие результаты на повседневной основе».
CrowdTangle играет ключевую кулуарную роль в стратегиях оптимизации размещения информации в социальных сетях таких цифровых медиаресурсов, как Upworthy, Vox и Buzzfeed. CrowdTangle не был разработан для противодействия, устранения или даже изучения сетей ботов. Он был задуман как инструмент для распознавания историй и контента, показывающего результаты выше среднего в пиринговой сети компании.
Исследование Олбрайта сосредоточено на паре измерений, которые CrowdTangle генерирует на основе собираемых данных: «взаимодействия» и «естественный охват аудитории». Проблема с подобными цифровыми показателями состоит в том, что их легко раздуть. Мы видели это в Твиттере, где почти половина подписчиков президента Трампа относится к фейковым аккаунтам и ботам. Это может быть особенно проблематично при рассмотрении российского влияния. В своем репортаже Эдриен Чен (Adrien Chen) зафиксировал, что российское Агентство интернет-исследований специализируется на создании фейковых аккаунтов в социальных сетях, чтобы увеличить воздействие их активности. Эти фейковые аккаунты могут деформировать простые замеры мнений в интернете.
На примере страницы «Черных активистов» можно увидеть, как это работает
Показательным примером служит страница «Черных активистов» (Blacktivists) в Facebook. Эта страница была создана Агентством интернет-исследований. Дони О‘Салливан (Donie O'Sullivan) и Дилан Байерс (Dylan Byers) до этого докладывали, что страница Черных активистов «получила 360 тысяч лайков, больше, чем подтвержденный аккаунт движения Black Lives Matter (Жизни черных имеют значение) на Facebook, у которого на данный момент имеется всего около 301 тысячи лайков». Мы не можем сказать, опираясь на публичные данные, какая часть этих лайков исходила от аккаунтов, созданных Агентством интернет-исследований. Однако высока вероятность, что причина, по которой страница, созданная Агентством, получила больше лайков, чем подтвержденный аккаунт движения Black Lives Matter, состоит в том, что Агентство сгенерировало также несколько тысяч профилей на Facebook, а потом использовало эти аккаунты, чтобы придать своему контенту видимость легитимности.
Исследование Олбрайта указывает на 6,18 миллиона «взаимодействий» (реакций, комментариев, репостов), которые получила страница Черных активистов в 500 своих публикациях. С одним постом со страницы Черных активистов, получившим самое большое количество републикаций, произошло 344 209 взаимодействия, что меньше, чем общее количество лайков, оставленных на странице.
Это может указывать на широкое распространение публикации по интернету среди социально активных пользователей Facebook. Исследование также оценивает «естественный охват аудитории», подсчитывая общую сумму подписчиков всех страниц на Facebook, поделившихся публикацией Черных активистов. Эта сумма часто грешит преувеличениями при подсчетах: если у каждого из двух фейковых профилей на Facebook есть пять тысяч одинаковых фейковых друзей и обе страницы републикуют один и то же фейковый пост Черных активистов, то «естественный охват» по подсчетам CrowdTangle составит 10 тысяч человек.
Основная мысль исследования Олбрайта состоит в том, что «естественный охват аудитории» у публикаций страницы Черных активистов достигал 103,8 миллиона. В сочетании с пятью другими страницами, созданными Агентством интернет-исследований, Олбрайт насчитал 340 миллионов. Поскольку Facebook удалил 470 страниц, исследователь обоснованно заключает, что общий «естественный охват аудитории» всех этих сайтов, вероятно, составляет миллиарды. Это верный подсчет, но он уводит нас в неверном направлении. Мы не можем знать, какая доля этих просмотров связана с реальными людьми, проживающими в Соединенных Штатах Америки.
Еще большую сложность составляет то, что Facebook имеет практически монополию в области размещения материалов в социальных сетях. Мы сталкиваемся с новостным контентом благодаря черному ящику алгоритмов Facebook, и никто, кроме самих инженеров Facebook, не может точно сказать, как эти алгоритмы работают. Внутренние данные Facebook могут помочь разобраться с этими вопросами, но даже в этом уверенности нет. Общественно доступных данных Facebook крайне мало. Это осложняет процесс вычленения российской пропагандистской деятельности в ходе выборов 2016 года.
Мы знаем, что иностранные подставные лица потратили значительное время и деньги, пытаясь внедрить пропагандистские материалы в ходе выборов 2016 года. Мы знаем, что они делали это, стремясь снизить уровень доверия к демократии и поддержать кампанию Трампа.
Сбор четких данных о масштабе этих действий одновременно невероятно важен и феноменально сложен. Попытки Олбрайта пролить свет на эту деятельность можно только приветствовать. Однако следует предупредить читателей, чтобы они не создавали излишнего ажиотажа вокруг горячих новостей: это может случайно увести их в совершенно ошибочном направлении.