Новости Software

Microsoft разрабатывает технологию анализа и описания изображений

Корпорация Microsoft поделилась информацией об одном из своих исследовательских проектов, который в перспективе может помочь в создании систем искусственного интеллекта. Речь идёт о платформе глубокого анализа изображений с целью идентификации и описания представленных на них объектов.

Идея заключается в том, чтобы научить программу воспринимать фотографии так, как это делает человек. То есть, если на снимке запечатлён, скажем, пользователь за компьютерным столом, система должна понимать, что главным объектом является именно пользователь, а не предмет мебели. Далее благодаря различным алгоритмам, а также базе знаний программа сможет сделать предположения о возрасте, расовой и половой принадлежности и пр. Так, распознав щетину на лице, система сделает вывод, что на фотографии запечатлён мужчина.

Процесс описания изображений можно разбить на три основных этапа (см. иллюстрации). На первом после идентификации отдельных объектов подбираются соответствующие им ключевые слова — например, женщина, толпа, кошка, камера. На втором этапе на основе сгенерированного списка слов формируются фразы: «женщина в толпе держит камеру», «женщина держит кошку» и т. п. Наконец, заключительная фаза предполагает сортировку фраз в порядке важности.

Пока система несовершенна и может ошибаться, а также некорректно распознавать отдельные фрагменты изображений. Но работа над проектом продолжается, и с течением времени точность будет повышаться. 

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥