Сегодня 19 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → голосовой ввод

Клавиатура перестанет быть главным инструментом создания контента уже к 2028 году

Лондонская школа экономики при участии компании Jabra провела исследование, согласно результатам которого ввод информации при помощи голосового интерфейса ИИ станет общепринятым стандартом. Родившиеся после 2010 года офисные сотрудники в недалёком будущем в своей деятельности могут вообще не столкнуться с необходимостью набора текста руками.

 Источник изображения: Unsplash, Glenn Carstens-Peters

Источник изображения: Unsplash, Glenn Carstens-Peters

По мнению представителей Jabra, ввод информации голосом отодвинет на второй план работу с клавиатурой. Она будет нужна только для редактирования первично введённого голосом текста. Преобразование речи в текст позволяет быстрее вводить информацию и делает этот процесс более естественным. При этом руки пользователя остаются свободными, он буквально может генерировать текст, передвигаясь в машине или занимаясь домашними делами.

Впрочем, у такого подхода имеются и свои недостатки. Обратное восприятие информации делает текст более удобным. Чтение в целом занимает меньше времени, чем прослушивание речевого сообщения, а ещё с текстовыми данными гораздо проще работать с точки зрения анализа, обобщения и структурирования информации. Поиск по ключевым словам в тексте занимает секунды, а перематывание аудиозаписей превращается в пытку. По мнению учёных, ввод текста будет осуществляться голосом, но те же электронные сообщения останутся текстовыми.

Кроме того, авторы текстовых заметок обычно более ответственно подходят к их содержанию, тогда как голосовые сообщения буквально размывают суть информации и её структуру. При большом наборе голосовых сообщений сложно определить, что именно и кем было сказано, а также привязать эти данные к шкале времени. Спустя несколько месяцев проще анализировать текстовую переписку, чем рыться в голосовых сообщениях.

Не нужно также забывать, что живая речь по своей природе у большинства людей далека от совершенства. Интонации, дефекты речи и влияние акцента — всё это затрудняет голосовой ввод. Более того, лёгкость записи голосовых сообщений увеличивает количество передаваемой информации. Авторы высказываний порой не будут задумываться о ценности и сути своих комментариев, и собеседникам будет сложнее ориентироваться в этом потоке сознания, выделяя саму суть.

ИИ-поисковик Google научился понимать голосовые запросы, но доступна функция не всем

Google начала тестировать функцию Search Live в режиме поиска с ИИ — AI Mode. Новая функция позволяет задавать вопросы ИИ-чат-боту голосом прямо из поисковой системы. Открытое тестирование доступно пока только в США и исключительно для участников программы Google Labs по тестированию экспериментальных функций. На данный момент Search Live не поддерживает использование камеры смартфона, но Google планирует добавить такую возможность «в ближайшие месяцы».

 Источник изображений: Google

Источник изображений: Google

Search Live позволяет взаимодействовать со специально адаптированной версией ИИ-помощника Gemini и выполнять поиск в интернете в режиме реального времени. Функция доступна в приложении Google для Android и iOS. В будущем Search Live получит поддержку камеры смартфона — пользователь сможет навести её на объект и задать голосом интересующий вопрос о нём.

Google анонсировала функцию Search Live для режима поиска с ИИ AI Mode в прошлом месяце. Она является частью более широкой программы компании по трансформации своей поисковой системы и расширению его ИИ-возможностей. Сейчас компания, например, также экспериментирует с ИИ-функцией, которая превращает результаты поиска в подкаст. После запроса пользователя и вывода чат-ботом результатов, пользователь может использовать функцию Generate Audio Overview и ИИ предоставит ответ в аудиоформате в виде кратного подкаст-обзора по теме.

Принять участие в тестировании Search Live можно через Google Labs (в России недоступен), после чего в приложении Google на Android или iOS станет активен новый значок Live. Затем чат-боту можно вслух задать, например, такой вопрос: «Как предотвратить появление складок на льняном платье, упакованном в чемодан?». Чат-бот предложит ответ, а пользователь сможет задать уточняющий вопрос, например: «Что делать, если оно всё равно мнётся?». Search Live также предложит ссылки на материалы с возможными решениями во время диалога.

Другие ИИ-компании также внедряют голосовые режимы в своих чат-ботах. Так, OpenAI представила расширенный голосовой режим для ChatGPT в прошлом году, а Anthropic запустила голосовую функцию в приложении Claude в мае. Apple также работает над большой языковой моделью для Siri, однако её выпуск был отложен — по словам старшего вице-президента Apple по программному обеспечению Крейга Федериги (Craig Federighi), компания пока не достигла «желаемого уровня надёжности».

Google отмечает, что Search Live может работать в фоновом режиме, позволяя продолжать диалог с чат-ботом даже при переходе в другие приложения. Пользователь может также включить субтитры, чтобы видеть текстовую версию ответа, и при желании продолжить общение текстом. Кроме того, Search Live сохраняет историю прошлых разговоров в разделе поиска AI Mode.

В Windows 11 появилась возможность отключения фильтра ненормативной лексики

Больше никаких «звёздочек» — теперь голосовой ввод в Windows 11 не станет заменять ими слова обсценной и ненормативной лексики. По многочисленным просьбам пользователей, обвинявших Microsoft в «ханжестве», компания добавила переключатель фильтра ненормативной лексики, который обеспечит полноценное отображение проклятий, брани, вульгаризмов, мата и прочих эвфемизмов при голосовом вводе.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

В последней инсайдерской сборке Windows 11 26120.3941 появился переключатель, позволяющий транскрибировать даже самые «неприличные» слова. Теперь при отключённом фильтре ненормативной лексики набор «звёздочек» больше не будет маскировать реакцию пользователя, случайно пролившего на себя горячий кофе.

«Мы рады ответить на самые популярные отзывы клиентов о голосовом вводе, начав развёртывание новой настройки, которая позволяет вам управлять фильтром ненормативной лексики», — заявила Microsoft. Многие пользователи приветствовали это нововведение, отметив, что теперь проще будет при помощи голосового ввода написать эмоциональный отзыв на очередные исправления и обновления Microsoft.

Остальные новые функции в последнем обновлении в основном ориентированы на улучшение пользовательского опыта владельцев ПК Copilot+. В частности, Microsoft исправила проблему, из-за которой изображения, используемые с действиями Click to Do, «застревали» во временной папке ПК. Также компания изменила настройки «Улучшенного поиска Windows» для пользователей, вошедших в OneDrive с рабочей или учебной учётной записью: теперь в результатах поиска отображаются только текстовые фрагменты, а не изображения.

Как обычно, нет никаких гарантий, что новые функции, появившиеся в инсайдерской сборке, доберутся до релизной версии ОС. Но в случае с переключателем фильтра ненормативной лексики это будет просто ******* позором.

Поговорить с ChatGPT теперь можно в веб-версии сервиса — там появился голосовой интерфейс Advanced Voice Mode

Компания OpenAI запустила голосовой интерфейс Advanced Voice Mode в веб-версии сервиса ChatGPT. Об этом через свою страницу в соцсети X сообщил директор по продуктам компании Кевин Вейл (Kevin Weil). Продвинутый голосовой интерфейс по-прежнему доступен только платным пользователям ChatGPT.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

Голосовой интерфейс Advanced Voice Mode стал доступен для владельцев подписок Plus, Enterprise, Teams или Edu теперь и в веб-версии сервиса ChatGPT. С момента своего дебюта в сентябре продвинутый интерфейс был доступен только в мобильной версии ChatGPT для iOS и Android.

Голосовой интерфейс Advanced Voice Mode использует аудиовозможности ИИ-модели GPT-4o, предлагая естественное общение в реальном времени между пользователем и ChatGPT. Чат-бот способен понимать и реагировать на невербальные сигналы пользователя, включая такие вещи, как скорость речи. Кроме того, он может реагировать с «эмоциями».

Для начала разговора в веб-версии чат-бота необходимо выбрать значок «Голос» в правом нижнем углу у поля ввода запросов к ChatGPT. Затем необходимо предоставить браузеру разрешение на доступ к микрофону вашего компьютера. После начала голосового чата пользователь попадёт на экран с синим шаром в центре.

Функция предлагает на выбор один из девяти голосов для ChatGPT, каждый из которых имеет свой собственный тон и характер. Например, можно выбрать «лёгкий и универсальный стиль Arbor» или «уверенный и оптимистичный Ember».

По словам Вайля, OpenAI планирует «в ближайшие недели» внедрить голосовой формат общения с ChatGPT и для бесплатных пользователей. Владельцы подписок Plus и Team могут использовать голосовой формат Advanced Voice Mode лишь определённое количество времени в сутки.

Система уведомит, когда у пользователя останется последние 15 минут ежедневного доступа к голосовому общению с ИИ-ботом. Бесплатным пользователям будет предлагаться доступ на непродолжительное время для знакомства с функцией.


window-new
Soft
Hard
Тренды 🔥
Google назвала лучшие приложения и игры «Play Маркета» за 2025 год 14 мин.
«Сырая и сломанная, но всё ещё прекрасная»: возрождённая ролевая песочница Hytale в духе Minecraft получила 16 минут геймплея, и фанаты в восторге 18 мин.
Авторы ремейка «Готики» рассказали и показали, как прокачали боевую систему благодаря отзывам игроков 2 ч.
Microsoft исправила проблему с установкой первого платного обновления безопасности для Windows 10 2 ч.
«Мы подвели весь интернет»: технический директор Cloudflare извинился за сбой, уронивший половину интернета 2 ч.
Релиз почтового сервера RuPost 4.0: поддержка геокластеризации и повышенная безопасность 3 ч.
Capcom похвасталась продажами Dragon’s Dogma 2 — игроки требуют обещанных улучшений и DLC 3 ч.
xAI намерена привлечь $15 млрд инвестиций и увеличить оценку до $230 млрд — более чем вдвое дешевле OpenAI 3 ч.
В Chrome нашли опасную уязвимость, которую уже используют хакеры — вышел экстренный патч 13 ч.
Electronic Arts и Codemasters анонсировали переосмысление симуляторов «Формулы-1» — F1 26 не будет 16 ч.
В ближайшие месяцы DRAM подорожает ещё на 50 %, а Nvidia придётся оснащать ИИ-ускорители смартфонной памятью 13 мин.
Jeep представила электрический внедорожник Recon со съёмными дверями и задними стёклами за $65 000 36 мин.
«Яндекс» выпустил «Станцию 3» мощностью 50 Вт с окружающей подсветкой и пиксельным дисплеем 38 мин.
DJI начала продажи экшн-камеры Osmo Action 6 с квадратным сенсором по цене от €379 39 мин.
Второй европейский экзафлопсный суперкомпьютер Alice Recoque получит чипы AMD EPYC Venice и ускорители Instinct MI430X 2 ч.
Ровер Perseverance нашёл на Марсе камень, которого там не должно было быть 2 ч.
Телевизоры TCL серий X, C и P: обзор актуальной линейки 2 ч.
«Samsung не нужен»: лондонские грабители брезгуют Android-смартфонами, предпочитая iPhone 2 ч.
Блок питания SAMA P1200 — «платиновый» КПД и два разъема 12V-2x6 2 ч.
Huawei строит антисанкционную экосистему — более 60 китайских компаний получили инвестиции 3 ч.