Регистрация пройдена успешно!
Пожалуйста, перейдите по ссылке из письма, отправленного на

Каждый день новый сюрприз: как работает самое популярное в мире средство слежения за коронавирусом (Science, США)

Материалы ИноСМИ содержат оценки исключительно зарубежных СМИ и не отражают позицию редакции ИноСМИ
Читать inosmi.ru в
Многие сейчас следят за данными на сайтах, отслеживающих распространение коронавируса, как за фронтовыми сводками. Один из важнейших источников этих сайтов — онлайн-панель Университета Джонса Хопкинса. Журнал Science побеседовал с ее создательницей и выяснил, как ведется сбор и публикация информации.

За губительным распространением болезни и смертей от коронавируса следят многие вебсайты, начиная с карты мира Всемирной организации здравоохранения и кончая «Нью-Йорк Таймс», которая ведет счет заболеваний в США на уровне округов. Но одним из первых средств стала онлайновая информационная панель, которую ведет Университет Джонса Хопкинса. Она превратилась в самый популярный источник последней информации о COVID-19.

Это черная карта мира с красными кругами и таблицами, в которые сведены данные по количеству заражений, смертей и выздоровлений в масштабах всего мира, страны и штатов. Информационная панель под названием «Глобальная заболеваемость COVID-19» придерживается строгих фактов, и там нет никаких диковинных графиков и таблиц. Однако этот сайт, у которого свыше миллиарда посещений в день, стал самым авторитетным источником данных по заболеваниям COVID-19. Его информацией пользуются информационные агентства и государственные учреждения во всем мире. Данные с панели копируют штаты и страны. Ее заметили на фотографии на стене в Министерстве здравоохранения США и в оперативном штабе по борьбе с коронавирусом.

Сайт этот создан при активном участии содиректора Центра системологии и инжиниринга при Университете Хопкинса Лорен Гарднер (Lauren Gardner), которая ранее занималась пространственным моделированием эпидемий кори и вируса Зика. Гарднер побеседовала в пятницу с корреспондентом нашего издания. В этот день число заболевших COVID-19 в мире превысило миллион человек, а количество умерших составило более 50 000. Интервью было сокращено ради краткости и ясности.

— Есть много сайтов, занимающихся отслеживанием случаев COVID-19. Каким образом ваш сайт вышел на первое место?

— Наверное, потому что он существует дольше всех. Мы запустили его в январе, когда вспышка заболевания была ограничена в основном пределами Китая. Этим лично заинтересовался мой аспирант китаец Эньшен Дун (Ensheng Dong). За несколько часов мы создали информационную панель. А на следующий день (22 января) я разместила ее в Твиттере, и она немедленно завоевала популярность.

— Данные для панели берутся из сотен источников, начиная с информации ВОЗ и кончая сайтами-агрегаторами новостей и сообщениями о COVID-19 из социальных сетей. Как вы добиваетесь точности сведений, как избегаете двойного счета?

— За ситуацией постоянно следят миллионы глаз. Так что если мы что-то упускаем, в чем-то ошибаемся, люди очень быстро выходят на нас. Мы получаем тысячи сообщений по электронной почте. Нам говорят: «Эй, есть два новых случая, о которых вы не знаете». А еще у нас появилась система выявления аномалий, которая предупреждает о несоответствиях в данных о клинических случаях, которые мы собираем автоматически.

Нам приходится думать о повторах (когда наши собственные данные возвращаются к нам как исходная информация). В США есть агрегатор новостей 1point3Acres, за которым мы очень внимательно следим. Оттуда мы берем данные по США, а они берут у нас данные по миру. Мы должны проявлять осторожность, ссылаясь только на их данные по стране. Но если в данных будет повтор, о котором никто не сообщит (о заболеваниях и смертях от COVID-19), цифры будут преувеличены. Но мы знаем, что у нас этого нет.

Мне бы хотелось, чтобы все местные органы здравоохранения постоянно совершенствовали свою отчетность так, чтобы мы могли брать данные непосредственно у них, а не у местных СМИ.

— Вы можете получать данные по США из Центров по контролю и профилактике заболеваний?

— Наверное, да. Но они предоставляют данные только на уровне штатов, причем иногда с задержкой в 24-48 часов. На уровне округов они ничего не дают.

— У вас большая команда?

— Сначала это была моя группа, примерно шесть человек. Но Университет Хопкинса почти сразу предложил нам помощь. Дело в том, что из-за спроса мы просто взрывали серверы Амазон (облачный интернет-сервис). Сейчас университетская лаборатория прикладной физики помогает нам, курируя данные и предоставляя технику. Управлять платформой нам помогает компания «Эсри» (Esri), у которой есть соответствующее картографическое программное обеспечение. Люди из университета занимаются СМИ и коммуникациями. Но группа все равно слишком малочисленна для тех задач, которые мы решаем.

— Велика ли нагрузка? Вы работаете по сменам?

— Более двух месяцев мы вырабатывали решения о том, где собирать данные, каким данным доверять, как их компилировать, как их проверять. Поначалу мы все делали вручную. Сейчас почти все автоматизировано, есть различные перекрестные проверки. Информационная панель обновляется автоматически, ежечасно. Мы работаем круглые сутки по сменам по таким вопросам как серверы и обработка данных. Например, у нас есть аспирант, живущий в Англии, который берет на себя раннюю утреннюю смену.

Это служение обществу на добровольной основе. Мы делаем все возможное, чтобы работа выполнялась качественно, однако понимаем, что она не идеальна.

— Вас критиковали за то, что вы называете Тайвань Тайванем, и за то, что поначалу поместили статистику по круизному лайнеру «Даймонд Принсесс» прямо посреди США, в Канзасе.

— Да. Каждый день новый сюрприз. Геополитические последствия напрягают и отвлекают. Я просто хочу сообщать полезные и нужные данные людям, которые пытаются получить к ним доступ. Вирусу наплевать на границы.

До вчерашнего дня у нас было много случаев без определенного места, которые мы помещали на вымышленный остров Ноль у побережья Африки, имеющий нулевые координаты. Он знаменит. Я думала, что будет здорово поместить туда все, что не имеет конкретного местоположения. Но это многих расстроило, и мы отказались от такой статистики.

— Количество заболеваний COVID-19 увеличивается. Работы становится больше?

— На самом деле, ручной работы стало меньше, потому что все автоматизировано. Мы сейчас больше времени уделяем другим исследованиям. Почти 90% своих усилий я снова трачу на математическое моделирование, связанное с этой болезнью. Мы проводим в режиме реального времени оценку рисков происходящего в США, намереваясь передать результаты своей работы политическому руководству и сказать ему: «Вот расчеты, о которых мы должны беспокоиться завтра». Мы можем это сделать, и мы должны с этим помочь.

— Вы высыпаетесь?

— Работа утомляет. Мы занимаемся ею в полном объеме с января. От всего прочего в лаборатории мы отказались. Наверное, так будет продолжаться еще пару месяцев, как минимум. И я думаю, что следить за вспышкой мы будем год. Вирус будет и дальше гулять по планете. Так что да, это работа на 110%. Мне кажется, сейчас так работают все люди из сферы здравоохранения.