Amazon намеревается произвести «перезапуск» голосового помощника Alexa в качестве агента с искусственным интеллектом, который сможет выполнять практические задачи, но для этого техническим специалистам компании придётся найти решения нескольких проблем, которые пока не позволяют перестроить систему.
Компания вот уже два года пытается дать новую жизнь голосовому помощнику, который используется на 500 млн устройств по всему миру, — пересадить ему новый «мозг», основанный на генеративном ИИ. Этому препятствуют несколько проблем: галлюцинации ИИ, то есть дача заведомо неверных ответов на запросы; скорость отклика, то есть задержка перед получением ответа; и общая надёжность системы. Об этом изданию Financial Times рассказал Рохит Прасад (Rohit Prasad), глава команды разработчиков сильного ИИ (AGI) в Amazon. Сегодня Alexa способна решать лишь самые простые задачи, например, включать музыку или ставить будильники, но в компании намереваются расширить её возможности до полноценного агента, действующего как персональный консьерж. Такая система, например, поможет пользователю с выбором ресторана или настроит освещение в спальне в зависимости от циклов сна.
Работа над проектом по перезапуску Alexa начались в момент выхода OpenAI ChatGPT в конце 2022 года. Microsoft, Google и Meta✴ быстро внедрили генеративный ИИ в свои вычислительные платформы, повысили качество своих программных сервисов, и есть сомнения, что Amazon реализует свою задумку своевременно, чтобы выступить наравне с другими технологическими гигантами. Сейчас голосовой помощник работает на основе жёстко выверенных алгоритмов, но у компании возникли неожиданные трудности при внедрении более мощных, но менее предсказуемых больших языковых моделей. Интеграция генеративного ИИ в сервис, которым пользуются сотни миллионов человек по всему миру, представляется для специалистов компании беспрецедентным по сложности проектом, которые не сводится к механическому наложению большой языковой модели на службу Alexa.
Чтобы система заработала в качестве агента, «мозг» Alexa должен иметь возможность обращаться к нескольким сотням программ и сервисов. «Иногда мы недооцениваем, сколько сервисов интегрированы в Alexa, а их огромное число. Эти приложения получают миллиарды запросов в неделю, поэтому когда пытаешься сделать надёжные действия быстрыми, <..> нужно быть в состоянии сделать это очень экономически эффективным способом», — рассказал Рохит Прасад. Пользователи ожидают, что Alexa будет давать быстрые и точные ответы, и это противоречит вероятностной природе современного генеративного ИИ, представляющего собой статистическое ПО, предсказывающее последовательности слов на основе речевых и языковых моделей.
В Amazon собираются набрать экспертов, которые сформируют личность, голос и дикцию ИИ, чтобы он оставался знакомым пользователям Alexa. И придётся что-то сделать с «галлюцинациями», которые в масштабах работы Amazon рискуют возникать много раз в день. Несмотря на то, что в компании работает множество сильных специалистов, и она располагает внушительными финансовыми ресурсами, разработчикам приходится противостоять «техническим и бюрократическим проблемам»: некачественной разметке данных в обучающих массивах и устаревшей или отсутствующей документации.
Оригинальная реализация Alexa была построена на основе технологии, приобретённой у британского стартапа Evi в 2012 году — это машина, работающая с вопросами и ответами, которая производит поиск в массиве фактов; ответами могут выступать прогноз погоды или песня в фонотеке. Технологию в основе голосового помощника, которая и без того не отличалась гибкостью, отяготили неуклюжая и неорганизованная кодовая база, а также чрезвычайно распределенная команда разработчиков. В новой Alexa используется целый набор моделей ИИ: одни применяются для распознавания и перевода голосовых запросов и генерации ответов, другие выполняют контролирующую функцию, не пропуская неподходящие ответы и предотвращая возникновение «галлюцинаций». В этот набор входят большие языковые модели Amazon, включая представленные недавно Nova, а также продукт её партнёра — Anthropic Claude.
Сейчас разработчики в компании намереваются интегрировать дополнительные фильтры для детей и протестировать работу интегрированного с Alexa оборудования, такого как умные светильники и дверные звонки Ring. Разработчики сторонних продуктов пока не дают прогнозов, когда появится обновлённая Alexa, и как она сможет работать со сторонними сервисами. Amazon напугала их, призвав готовиться к радикальному обновлению голосового помощника, но пока всё затихло. И в компании нет понимания, как Alexa будет монетизироваться — допускаются сценарии с введением платной подписки или получением комиссии с продажи товаров и услуг.
Источник: