Обученная на данных многолетних наблюдений за 6 млн датчан модель искусственного интеллекта смогла с высокой точностью прогнозировать важные события в жизни людей вплоть до указания даты их смерти. Точность предсказаний можно повысить ещё сильнее, если добавить к данным наблюдений сопровождающие жизнь людей видео, переписку и информацию о социальных связях. Но сначала предстоит решить этическую сторону вопроса.
Совместный проект исследователей из Университета Копенгагена (Дания) и Северо-Восточного университета в Бостоне (США) показал, что модель машинного обучения типа «трансформер» (transformer) может быть использована для прогнозирования событий в жизни людей.
Модель трансформер создавалась для обработки последовательностей, таких как текст на естественном языке. От других моделей она отличается более масштабным распараллеливанием задач и не требует соблюдения последовательности в анализе данных. Оказалось, что модель удачно подошла для упорядочивания данных и прогнозирования того, что произойдёт в жизни человека и даже смогла указать приблизительное время смерти. Более того, по точности предсказания поведения личности и времени её смерти новая модель превзошла все ранее созданные аналогичные модели.
Статья «Использование последовательности жизненных событий для прогнозирования человеческих жизней» с описанием созданной в эксперименте модели life2vec на основе данных о 6 млн датчан опубликована в журнале Nature Computational Science. Также она свободно доступна на сайте arХiv.org.
«Мы использовали модель для решения фундаментального вопроса: в какой степени мы можем предсказать события в вашем будущем, основываясь на условиях и событиях в вашем прошлом? С научной точки зрения нас интересует не столько само предсказание, сколько те нюансы в информации, которые позволяют модели давать такие точные ответы», — рассказал Сун Леманн (Sune Lehmann), профессор DTU и первый автор статьи.
Авторы работы использовали последовательность событий в жизни людей подобно тому, как строится из слов предложение. Собственно по этой причине для работы была взята модель трансформер, которая создавалась для анализа текстов. В то же время модель работает с учётом известных социальных закономерностей и наблюдений, на основании которых не только ИИ, но и обычные специалисты также могут сделать выводы о дальнейшем жизненном пути человека по месту его проживания, профессии, социальному статусу, полу, привычкам и по медицинской карте (посещениям врачей).
Данные для обучения модели life2vec взяты из информации о рынке труда и данных Национального регистра пациентов (LPR) и Статистического управления Дании. Набор данных включает в себя информацию обо всех 6 млн датчан и содержит сведения о доходах, заработной плате, стипендии, типе работы, отрасли, социальных пособиях и т.д. Набор медицинских данных включает записи о посещениях медицинских работников или больниц, диагнозе, типе пациента и насколько внезапным или срочным было обращение за медицинской помощью. Данные для модели представлены за период с 2008 по 2020 годы, хотя по ограниченной возрастной группе данные брались за период с 2008 по 2016 годы.
Авторы исследования отмечают, что для полномасштабного использования подобной модели в социальных целях необходимо ответить на множество этических вопросов. В то же время они подчёркивают, что широко распространённые механизмы по оценке целевой аудитории для рекламы позволяют узнавать о людях не намного меньше и это уже используется. Так что не будет ничего плохого, если модель сможет предсказать какое-нибудь негативное событие в жизни конкретного человека, которое можно будет избежать тем или иным образом. Дату смерти, кстати, модель предсказывает с точностью в пределах четырёх лет.
По словам исследователей, следующим шагом стало бы включение в модель других типов информации, таких как текст и изображения или информация о наших социальных связях. Такое использование данных открывает совершенно новое взаимодействие между социальными науками и наукой о здоровье.
Источник: