Как технологии предсказывают пандемии

Дроны-дезинфекторы, QR-коды вместо пропусков - еще никогда технологии не развивались так стремительно, как во время пандемии коронавируса. Впрочем, технологии могут помочь не только победить эпидемию, но и предсказать ее

Об авторе: Юрий Бондарь, заместитель генерального директора SAP CIS.

В конце декабря канадская платформа мониторинга здоровья на основе искусственного интеллекта BlueDot предсказала вспышку коронавируса в Китае. Она сообщила своим клиентам о новой инфекции на неделю раньше, чем это сделала ВОЗ. Платформа проанализировала новости на разных языках, сводки о заболеваниях среди животных и информацию из соцсетей. Затем она сопоставила полученную информацию с базами данных разных авиакомпаний, чтобы предсказать, куда быстрее всего доберется вирус.

Коронавирус

Россия Москва Мир

0 (за сутки)

Заразились

0 (за сутки)

Умерли

0 (за сутки)

Заразились

0 (за сутки)

Умерли

0 (за сутки)

Заразились

0 (за сутки)

Умерли

Источник: JHU, федеральный и региональные оперштабы по борьбе с вирусом

Читать подробнее

Может показаться, что искусственный интеллект самостоятельно отыскал все первые подозрительные новости о новой инфекции и пришел к выводу, что это коронавирус. Но так ли это? Рассказываем, способен ли алгоритм без вмешательства человека узнать об эпидемии, и как вообще работают подобные системы.

Может ли искусственный интеллект предсказать пандемию «с нуля»?

Искусственный интеллект может предсказать вспышки заболеваемости и распространение вируса. Но первое, с чего нужно начинать исследование — это постановка задачи.

Например, можно пытаться предсказать возникновение эпидемии до того, как вирус не начал мутировать у животных и заражать людей. Либо это может быть задача спрогнозировать распространение эпидемии, если она уже диагностирована. Тогда для построения модели необходима более детальная информация о самом вирусе: насколько он агрессивен, R0 (предположительное количество людей, которые могут заразиться после контакта с инфицированным пациентом), инкубационный период и т.д. Используя всю информацию и подключив источники данных, с помощью методов искусственного интеллекта можно построить прогнозную модель.

Как работает алгоритм, который используется для выявления эпидемий?

Для выявления эпидемий можно использовать модель с применением технологии искусственного интеллекта. Для того, чтобы сделать анализ по запросу (допустим, это будет анализ заболеваемости гриппом в городе N), необходимо на уже имеющуюся информацию о гриппе (насколько он агрессивен, какой у него инкубационный период, как быстро он распространяется среди людей) наложить данные из различных источников. Таких источников может быть несколько:

Социальные сети, где люди делятся информацией о том, что происходит вокруг них: школы находятся на карантине, закрыли детский сад, распроданы все маски, нет парацетамола в аптеке, вся семья заболела и сидит дома.
СМИ региона, где проводится анализ: как правило они дают информацию на языке этого региона или страны. Тут очень важен правильный перевод, трактовка терминов и знание контекста новости.
Общая информация о том месте, где проводится анализ: географическая справка, население, транспортная доступность, климат и т.д.
Меры, которые принимаются государством: введен ли режим удаленной работы, есть ли рекомендации не собираться большими группами, введен ли комендантский час, отменены ли мероприятия, закрыты ли границы на въезд и выезд и т.д.

Перед тем как начать исследование, данные делятся на две части.

Первая будет использоваться для анализа — это обучающая выборка. Вторая понадобится для тестирования уже полученных моделей — это контрольная выборка. В системах для предиктивного анализа содержится большое количество уже установленных алгоритмов. Они начинают анализировать данные и строить прогнозные модели. Когда модель построена, ее необходимо дообучить и протестировать с помощью второй части собранной ранее информации. Затем полученный результат сравнивают с теми данными, что были изначально известны, и если они на 90—95% совпадают, то такая модель считается валидной и ее можно использовать для получения достоверных прогнозов.

Одним из примеров здесь может быть проект SAP Health. Он представляет из себя обширный банк данных, в котором содержится информация по различным видам мутировавших генов в результате онкологических и других заболеваний. Система взаимодействует с большим числом американских клиник, в нее загружаются результаты биопсий, лабораторных исследований, схемы лечений и т.д. Все данные используются для построения прогнозов развития заболеваний, создания схем лечения и других запросов.

Экономика инноваций Победу принесет солидарность: ученые России и мира — о борьбе с COVID-19

Еще один пример: допустим, уже есть интерактивная карта заболеваемости по региону — то есть сколько людей в каких городах уже заразилось. Эта карта будет отправной точкой. На нее накладывают слой с новыми данными (какие потоки перемещения пассажиров происходят внутри региона, между регионами или даже странами, какие меры уже ввело региональное правительство), и система построит прогноз по динамике распространения вируса в ближайшее время.

Насколько можно доверять ИИ?

Безусловно, для любой отрасли при создании прогноза с помощью искусственного интеллекта необходима его проверка, в том числе людьми. Без нее промышленное использование такого прогноза опасно, стоимость ошибки может обернуться большими рисками для разработчиков и пользователей. В процессе проверки, как и в создании самой модели, конечно, присутствуют люди. Но они выполняют больше роль постановщика задачи и наблюдателя, а система сама проводит тесты (сравнение обучаемой выборки с контрольной). Человек принимает финальное решение как правильно действовать в данной ситуации и использовать ли данную модель для других прогнозов.

Как алгоритм понимает, что сейчас произойдет вспышка коронавируса, а не сибирской язвы или атипичной пневмонии?

Сам искусственный интеллект ничего не понимает. Машина может предсказать вероятность эпидемиологической вспышки и потенциальную скорость распространения, сориентировать по очагу заражения. Но какой это именно будет вирус, она не предскажет. Ведь помимо расшифровки самого генома конкретного появившегося штамма вируса, для предсказания динамики эпидемии, важно составить еще сложнейшую модель его взаимодействия с человеком. Это очень сложная задача. И не стоит забывать о вопросах мутации вируса.

Пока построить достоверные модели просто невозможно, хотя бы потому, что для этой задачи не хватает даже научной базы.

Что еще почитать по теме:

Подписывайтесь и читайте нас в Яндекс.Дзене — технологии, инновации, эко-номика, образование и шеринг в одном канале.

Обновлено 15.04.2020

Наука Цифровая медицина IT Четвертая промышленная революция