Amazon подключила к своему голосовому помощнику Alexa одноимённую большую языковую модель, обученную с прицелом на управление умным домом. Это поможет ассистенту лучше понимать разговорные фразы, эффективнее интерпретировать контекст и производить несколько операций по одной команде. Но в перспективе некоторые функции Alexa могут стать платными.
Большая языковая модель Alexa LLM в корне отличается от платформ, лежащих в основе чат-ботов Bard и ChatGPT, — она оптимизирована для работы в формате голосового помощника и управления умным домом, рассказал ресурсу The Verge старший вице-президент Amazon по устройствам и сервисам Дейв Лимп (Dave Limp). Потребность в кардинальных переменах на рынке голосовых помощников назрела уже давно: десять лет назад, когда они только появились, на них возлагались большие надежды, но за прошедшее время инноваций здесь почти не было, а улучшения носили скорее эволюционный, очень неспешный характер. Шансом на прорыв здесь может оказаться генеративный искусственный интеллект.
После выхода ChatGPT техногиганты Microsoft и Google ринулись внедрять генеративный ИИ в большинство своих сервисов и успели наделать ошибок, поэтому в Amazon решили действовать с осторожностью. Учитывая, что Alexa LLM решили подключить напрямую к умному дому, для компании было важно свести на минимум инциденты с галлюцинациями ИИ. Внедряться он будет постепенно в рамках предварительной программы на протяжении нескольких месяцев и только для американских пользователей. Заявку можно подать прямо через голосового помощника, отдав ему команду: «Алекса, давай поболтаем! (Alexa, let’s chat)».
Учитывая расширенные возможности, которые обещает генеративный ИИ голосовому помощнику, платформа не сможет оставаться бесплатной всегда. В своём теперешнем виде, уточнил господин Лимп, она так и будет бесплатной, но «сверхчеловеческий» голосовой помощник, который сможет выполнять сложные задачи, станет платной услугой. На начальном этапе Alexa научится лучше понимать, что ему говорит пользователь, и перестанет требовать конкретики. Необходимость повторять слова или присваивать элементам умного дома уникальные названия — одна из наиболее распространённых причин недовольства голосовыми помощниками.
Пользователь сможет пожаловаться новой Alexa, что ему холодно, и та прибавит температуру на климатической системе. Получив команду «Алекса, освети эту комнату под Seahawk», ИИ выяснит, в какой цвет окрашивают вертолёт Seahawk, определит, в какой комнате находится владелец дома и сделает соответствующие запросы API. Большая языковая модель поддерживает более двухсот инструментов API умного дома — в сочетании с контекстом диалога с умной колонкой Echo и списком умных устройств это поможет эффективнее ими управлять. Установив дома новый источник освещения, можно будет отдать голосовому помощнику распоряжение включить «новый свет», и тот правильно интерпретирует команду.
Генеративный ИИ поможет Alexa интерпретировать последовательности команд в одной фразе — сценарии можно будет задавать без их настройки в приложении. Вице-президент Amazon Дейв Лимп привёл такой пример регулярного сценария, который он отдал обновлённому голосовому помощнику у себя дома: «Алекса, каждое утро в 8 часов включай свет и музыку в спальне ребёнка, чтобы он проснулся, а на кухне включай кофеварку». Подобные сценарии, несмотря на их сложность, сразу появляются в приложении в списке регулярных. На начальном этапе функция множественных команд будет работать лишь на части устройств умного дома, но в перспективе их набор расширится.
Когнитивными функциями Alexa смогут пользоваться и разработчики стороннего совместимого оборудования — для этого предусмотрены инструменты Dynamic Controller и Action Controller. Данные инструменты помогут им задавать команды, отсутствующие в базовом наборе голосового помощника. Dynamic Controller позволит, например, задавать предустановленные схемы освещения. Установив в помещении многоцветные лампы GE Cync, можно будет отдать команду «Алекса, сделай здесь жуткий вид», и система правильно её интерпретирует, не потребовав дополнительных манипуляций. А Action Controller поможет голосовому помощнику корректно отреагировать на замечание: «Алекса, пол грязный» — и в дело вступит робот-пылесос. Этими инструментами, рассказали в Amazon, уже заинтересовались компании GE Cync, Philips, GE Appliances, iRobot, Roborock и Xiaomi, а в перспективе к программе подключаются и другие разработчики.
Подключение большой языковой модели к Alexa — это лишь начало нового этапа развития голосового помощника. В компании хотят упростить пользователям повседневные задачи, а о дальнейших планах пока не говорят.
Источник: