Сегодня 29 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → голосовой ввод

ИИ-поисковик Google научился понимать голосовые запросы, но доступна функция не всем

Google начала тестировать функцию Search Live в режиме поиска с ИИ — AI Mode. Новая функция позволяет задавать вопросы ИИ-чат-боту голосом прямо из поисковой системы. Открытое тестирование доступно пока только в США и исключительно для участников программы Google Labs по тестированию экспериментальных функций. На данный момент Search Live не поддерживает использование камеры смартфона, но Google планирует добавить такую возможность «в ближайшие месяцы».

 Источник изображений: Google

Источник изображений: Google

Search Live позволяет взаимодействовать со специально адаптированной версией ИИ-помощника Gemini и выполнять поиск в интернете в режиме реального времени. Функция доступна в приложении Google для Android и iOS. В будущем Search Live получит поддержку камеры смартфона — пользователь сможет навести её на объект и задать голосом интересующий вопрос о нём.

Google анонсировала функцию Search Live для режима поиска с ИИ AI Mode в прошлом месяце. Она является частью более широкой программы компании по трансформации своей поисковой системы и расширению его ИИ-возможностей. Сейчас компания, например, также экспериментирует с ИИ-функцией, которая превращает результаты поиска в подкаст. После запроса пользователя и вывода чат-ботом результатов, пользователь может использовать функцию Generate Audio Overview и ИИ предоставит ответ в аудиоформате в виде кратного подкаст-обзора по теме.

Принять участие в тестировании Search Live можно через Google Labs (в России недоступен), после чего в приложении Google на Android или iOS станет активен новый значок Live. Затем чат-боту можно вслух задать, например, такой вопрос: «Как предотвратить появление складок на льняном платье, упакованном в чемодан?». Чат-бот предложит ответ, а пользователь сможет задать уточняющий вопрос, например: «Что делать, если оно всё равно мнётся?». Search Live также предложит ссылки на материалы с возможными решениями во время диалога.

Другие ИИ-компании также внедряют голосовые режимы в своих чат-ботах. Так, OpenAI представила расширенный голосовой режим для ChatGPT в прошлом году, а Anthropic запустила голосовую функцию в приложении Claude в мае. Apple также работает над большой языковой моделью для Siri, однако её выпуск был отложен — по словам старшего вице-президента Apple по программному обеспечению Крейга Федериги (Craig Federighi), компания пока не достигла «желаемого уровня надёжности».

Google отмечает, что Search Live может работать в фоновом режиме, позволяя продолжать диалог с чат-ботом даже при переходе в другие приложения. Пользователь может также включить субтитры, чтобы видеть текстовую версию ответа, и при желании продолжить общение текстом. Кроме того, Search Live сохраняет историю прошлых разговоров в разделе поиска AI Mode.

В Windows 11 появилась возможность отключения фильтра ненормативной лексики

Больше никаких «звёздочек» — теперь голосовой ввод в Windows 11 не станет заменять ими слова обсценной и ненормативной лексики. По многочисленным просьбам пользователей, обвинявших Microsoft в «ханжестве», компания добавила переключатель фильтра ненормативной лексики, который обеспечит полноценное отображение проклятий, брани, вульгаризмов, мата и прочих эвфемизмов при голосовом вводе.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

В последней инсайдерской сборке Windows 11 26120.3941 появился переключатель, позволяющий транскрибировать даже самые «неприличные» слова. Теперь при отключённом фильтре ненормативной лексики набор «звёздочек» больше не будет маскировать реакцию пользователя, случайно пролившего на себя горячий кофе.

«Мы рады ответить на самые популярные отзывы клиентов о голосовом вводе, начав развёртывание новой настройки, которая позволяет вам управлять фильтром ненормативной лексики», — заявила Microsoft. Многие пользователи приветствовали это нововведение, отметив, что теперь проще будет при помощи голосового ввода написать эмоциональный отзыв на очередные исправления и обновления Microsoft.

Остальные новые функции в последнем обновлении в основном ориентированы на улучшение пользовательского опыта владельцев ПК Copilot+. В частности, Microsoft исправила проблему, из-за которой изображения, используемые с действиями Click to Do, «застревали» во временной папке ПК. Также компания изменила настройки «Улучшенного поиска Windows» для пользователей, вошедших в OneDrive с рабочей или учебной учётной записью: теперь в результатах поиска отображаются только текстовые фрагменты, а не изображения.

Как обычно, нет никаких гарантий, что новые функции, появившиеся в инсайдерской сборке, доберутся до релизной версии ОС. Но в случае с переключателем фильтра ненормативной лексики это будет просто ******* позором.

Поговорить с ChatGPT теперь можно в веб-версии сервиса — там появился голосовой интерфейс Advanced Voice Mode

Компания OpenAI запустила голосовой интерфейс Advanced Voice Mode в веб-версии сервиса ChatGPT. Об этом через свою страницу в соцсети X сообщил директор по продуктам компании Кевин Вейл (Kevin Weil). Продвинутый голосовой интерфейс по-прежнему доступен только платным пользователям ChatGPT.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

Голосовой интерфейс Advanced Voice Mode стал доступен для владельцев подписок Plus, Enterprise, Teams или Edu теперь и в веб-версии сервиса ChatGPT. С момента своего дебюта в сентябре продвинутый интерфейс был доступен только в мобильной версии ChatGPT для iOS и Android.

Голосовой интерфейс Advanced Voice Mode использует аудиовозможности ИИ-модели GPT-4o, предлагая естественное общение в реальном времени между пользователем и ChatGPT. Чат-бот способен понимать и реагировать на невербальные сигналы пользователя, включая такие вещи, как скорость речи. Кроме того, он может реагировать с «эмоциями».

Для начала разговора в веб-версии чат-бота необходимо выбрать значок «Голос» в правом нижнем углу у поля ввода запросов к ChatGPT. Затем необходимо предоставить браузеру разрешение на доступ к микрофону вашего компьютера. После начала голосового чата пользователь попадёт на экран с синим шаром в центре.

Функция предлагает на выбор один из девяти голосов для ChatGPT, каждый из которых имеет свой собственный тон и характер. Например, можно выбрать «лёгкий и универсальный стиль Arbor» или «уверенный и оптимистичный Ember».

По словам Вайля, OpenAI планирует «в ближайшие недели» внедрить голосовой формат общения с ChatGPT и для бесплатных пользователей. Владельцы подписок Plus и Team могут использовать голосовой формат Advanced Voice Mode лишь определённое количество времени в сутки.

Система уведомит, когда у пользователя останется последние 15 минут ежедневного доступа к голосовому общению с ИИ-ботом. Бесплатным пользователям будет предлагаться доступ на непродолжительное время для знакомства с функцией.


window-new
Soft
Hard
Тренды 🔥
Meta готова привлечь $29 млрд на расширение вычислительных мощностей в США 5 ч.
Speedata представила ускоритель анализа данных и привлекла на развитие $44 млн 12 ч.
Первые огневые испытания ускорителя для лунных и марсианских ракет SLS закончились яркой и шумной аномалией 15 ч.
Смартфоны в России подорожали на 10 %, а их продажи упали на 15–20 % 15 ч.
ИИ-процессор Microsoft выйдет с опозданием и будет медленнее Nvidia Blackwell 18 ч.
Старый марсианский спутник NASA научился «стоять на голове» — это на порядок повысило чувствительность подповерхностного радара 21 ч.
Мёртвый спутник NASA потёрся об атмосферу и перепугал учёных, испустив загадочный радиосигнал 28-06 12:05
Вторая жизнь «Конкорда»: обновлённый сверхзвуковой лайнер вернётся в небо, но это не точно 28-06 10:45
Tesla впервые доехала до покупателя своим ходом без людей в салоне 28-06 07:21
Maxell выпустила кассетный ретро-плеер MXCP-P100 с поддержкой Bluetooth-наушников и USB-C 28-06 07:02