OpenAI делает большую ставку на аудио ИИ, сообщил ресурс The Information. По его данным, за последние два месяца компания объединила несколько инженерных, продуктовых и исследовательских групп в одну структуру с целью модернизации имеющихся аудиомоделей в рамках подготовки к выпуску персонального устройства, ориентированного на разговорный ИИ. Как ожидается, новинка появится на рынке примерно через год.
Источник изображения: Mariia Shalabaieva/unsplash.com
Этот шаг отражает направление, в котором движется вся технологическая индустрия, когда аудио ИИ или разговорный ИИ выходит на первый план, отметил TechCrunch. Умные колонки с голосовыми ассистентами уже стали неотъемлемой частью более чем трети домовладений в США. Компания Meta✴ недавно представила новую функцию своих умных очков Ray-Ban, которая позволяет с помощью массива из пяти микрофонов слышать разговоры в шумном помещении. В свою очередь, Google в июне начала экспериментировать с функцией аудиообзора, преобразующей результаты поиска в диалоговые резюме, а Tesla интегрирует ИИ-чат-бота Grok от xAI в системы своих электромобилей, благодаря чему разговорный голосовой ассистент (conversational voice assistant) сможет управлять всем — от навигации до климат-контроля — с помощью естественного диалога.
Не все инициативы в этом направлении ведут к успеху. Проект Humane по созданию смарт-броши AI Pin закончился полным провалом. Кулон Friend AI с поддержкой ИИ, призванный составить компанию пользователю в качестве собеседника и предлагаемый в качестве средства для борьбы с одиночеством, вызвал опасения по поводу конфиденциальности и, по всей видимости, тоже окажется невостребованным.
Форм-факторы могут быть разными, но основная идея заключается в том, разговорный ИИ — это интерфейс будущего. Новая аудиомодель OpenAI, выход которой запланирован на начало 2026 года, по сообщениям источников, будет звучать более естественно, делать уместные паузы, как настоящий собеседник, и даже говорить в то время, когда пользователь разговаривает, чего не могут делать современные ИИ-модели.
По словам источников, OpenAI планирует создать семейство устройств, которое, возможно, будет включать смарт-очки или умные колонки без экрана, для использования в большей мере в качестве ИИ-компаньона, чем ИИ-инструмента.