Сегодня 09 декабря 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ввод

Клавиатура перестанет быть главным инструментом создания контента уже к 2028 году

Лондонская школа экономики при участии компании Jabra провела исследование, согласно результатам которого ввод информации при помощи голосового интерфейса ИИ станет общепринятым стандартом. Родившиеся после 2010 года офисные сотрудники в недалёком будущем в своей деятельности могут вообще не столкнуться с необходимостью набора текста руками.

 Источник изображения: Unsplash, Glenn Carstens-Peters

Источник изображения: Unsplash, Glenn Carstens-Peters

По мнению представителей Jabra, ввод информации голосом отодвинет на второй план работу с клавиатурой. Она будет нужна только для редактирования первично введённого голосом текста. Преобразование речи в текст позволяет быстрее вводить информацию и делает этот процесс более естественным. При этом руки пользователя остаются свободными, он буквально может генерировать текст, передвигаясь в машине или занимаясь домашними делами.

Впрочем, у такого подхода имеются и свои недостатки. Обратное восприятие информации делает текст более удобным. Чтение в целом занимает меньше времени, чем прослушивание речевого сообщения, а ещё с текстовыми данными гораздо проще работать с точки зрения анализа, обобщения и структурирования информации. Поиск по ключевым словам в тексте занимает секунды, а перематывание аудиозаписей превращается в пытку. По мнению учёных, ввод текста будет осуществляться голосом, но те же электронные сообщения останутся текстовыми.

Кроме того, авторы текстовых заметок обычно более ответственно подходят к их содержанию, тогда как голосовые сообщения буквально размывают суть информации и её структуру. При большом наборе голосовых сообщений сложно определить, что именно и кем было сказано, а также привязать эти данные к шкале времени. Спустя несколько месяцев проще анализировать текстовую переписку, чем рыться в голосовых сообщениях.

Не нужно также забывать, что живая речь по своей природе у большинства людей далека от совершенства. Интонации, дефекты речи и влияние акцента — всё это затрудняет голосовой ввод. Более того, лёгкость записи голосовых сообщений увеличивает количество передаваемой информации. Авторы высказываний порой не будут задумываться о ценности и сути своих комментариев, и собеседникам будет сложнее ориентироваться в этом потоке сознания, выделяя саму суть.

Microsoft рассказала о пугающем будущем Windows — без мышки и клавиатуры, но со множеством ИИ-функций

Глава подразделения Microsoft Windows and Surface Паван Давулури (Pavan Davuluri) пообщался с авторами YouTube-канала Windows IT Pro. В ходе беседы он дал представление о том, как будет меняться процесс взаимодействия пользователей с операционной системой Windows. Управление с помощью голосовых команд, жестов, пера, а также сенсорное управление, станут более распространёнными, «точно так же, как мы используем мышь и клавиатуру».

 Источник изображения: Sunrise King / Unsplash

Источник изображения: Sunrise King / Unsplash

«Я думаю, мы увидим, как компьютерные технологии станут более объёмными, более распространёнными, будут по-прежнему охватывать разные формфакторы и, безусловно, станут более мультимодальными», — сказал Давулури.

Это заявление может вызвать дежавю. Дело в том, что 13 лет назад Microsoft выпустила Windows 8 с пользовательским интерфейсом, оптимизированным для сенсорного управления, которое, по мнению софтверного гиганта, было необходимо клиентам компании. Эта версия Windows достаточно сильно отличалась от предшественниц, и пользователи в основном отнеслись к ней негативно. Из-за этого Microsoft пришлось достаточно быстро отказаться от использования полноэкранного интерфейса Metro в Windows 8.

Возможно, Microsoft хочет повторить попытку расширения возможностей в плане сенсорного управления. Если основанная на сенсорном управлении Windows 8 стала реакцией компании на формфактор планшетов, то сейчас речь скорее идёт о смене аппаратного обеспечения и демонстрации того, что значительные инвестиции компании в искусственный интеллект были оправданы.

Однако неясно, действительно ли пользователи хотят взаимодействовать со своими компьютерами с помощью сенсорного управления и пера или мешать коллегам, отдавая устройству голосовые команды. Возможно, они бы предпочли, чтобы «огромные инвестиции», которые упомянул Давулури во время интервью, были направлены на устранение недостатков и багов Windows, а не на увеличение количества функций, чтобы оправдать покупку компьютера класса Copilot+ PC.

Вряд ли кто-то не согласится с тем, что Windows 8 стала катастрофической ошибкой Microsoft с точки зрения удобства взаимодействия пользователя с платформой. Она лишилась привычных элементов управления из Windows 7 и не получила ничего равноценного взамен. В интервью Давулури подробно рассказал об амбициях Microsoft в отношении внедрения ИИ-функций в Windows, но ни разу не произнёс слова «качество» и «тестирование». Некоторые из планов разработчиков можно видеть уже сейчас. К примеру, в Windows 11 появилась функция, которая позволяет пользователю вводить запросы естественным языком, а ОС их выполняет.

ИИ-поисковик Google научился понимать голосовые запросы, но доступна функция не всем

Google начала тестировать функцию Search Live в режиме поиска с ИИ — AI Mode. Новая функция позволяет задавать вопросы ИИ-чат-боту голосом прямо из поисковой системы. Открытое тестирование доступно пока только в США и исключительно для участников программы Google Labs по тестированию экспериментальных функций. На данный момент Search Live не поддерживает использование камеры смартфона, но Google планирует добавить такую возможность «в ближайшие месяцы».

 Источник изображений: Google

Источник изображений: Google

Search Live позволяет взаимодействовать со специально адаптированной версией ИИ-помощника Gemini и выполнять поиск в интернете в режиме реального времени. Функция доступна в приложении Google для Android и iOS. В будущем Search Live получит поддержку камеры смартфона — пользователь сможет навести её на объект и задать голосом интересующий вопрос о нём.

Google анонсировала функцию Search Live для режима поиска с ИИ AI Mode в прошлом месяце. Она является частью более широкой программы компании по трансформации своей поисковой системы и расширению его ИИ-возможностей. Сейчас компания, например, также экспериментирует с ИИ-функцией, которая превращает результаты поиска в подкаст. После запроса пользователя и вывода чат-ботом результатов, пользователь может использовать функцию Generate Audio Overview и ИИ предоставит ответ в аудиоформате в виде кратного подкаст-обзора по теме.

Принять участие в тестировании Search Live можно через Google Labs (в России недоступен), после чего в приложении Google на Android или iOS станет активен новый значок Live. Затем чат-боту можно вслух задать, например, такой вопрос: «Как предотвратить появление складок на льняном платье, упакованном в чемодан?». Чат-бот предложит ответ, а пользователь сможет задать уточняющий вопрос, например: «Что делать, если оно всё равно мнётся?». Search Live также предложит ссылки на материалы с возможными решениями во время диалога.

Другие ИИ-компании также внедряют голосовые режимы в своих чат-ботах. Так, OpenAI представила расширенный голосовой режим для ChatGPT в прошлом году, а Anthropic запустила голосовую функцию в приложении Claude в мае. Apple также работает над большой языковой моделью для Siri, однако её выпуск был отложен — по словам старшего вице-президента Apple по программному обеспечению Крейга Федериги (Craig Federighi), компания пока не достигла «желаемого уровня надёжности».

Google отмечает, что Search Live может работать в фоновом режиме, позволяя продолжать диалог с чат-ботом даже при переходе в другие приложения. Пользователь может также включить субтитры, чтобы видеть текстовую версию ответа, и при желании продолжить общение текстом. Кроме того, Search Live сохраняет историю прошлых разговоров в разделе поиска AI Mode.

В Windows 11 появилась возможность отключения фильтра ненормативной лексики

Больше никаких «звёздочек» — теперь голосовой ввод в Windows 11 не станет заменять ими слова обсценной и ненормативной лексики. По многочисленным просьбам пользователей, обвинявших Microsoft в «ханжестве», компания добавила переключатель фильтра ненормативной лексики, который обеспечит полноценное отображение проклятий, брани, вульгаризмов, мата и прочих эвфемизмов при голосовом вводе.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

В последней инсайдерской сборке Windows 11 26120.3941 появился переключатель, позволяющий транскрибировать даже самые «неприличные» слова. Теперь при отключённом фильтре ненормативной лексики набор «звёздочек» больше не будет маскировать реакцию пользователя, случайно пролившего на себя горячий кофе.

«Мы рады ответить на самые популярные отзывы клиентов о голосовом вводе, начав развёртывание новой настройки, которая позволяет вам управлять фильтром ненормативной лексики», — заявила Microsoft. Многие пользователи приветствовали это нововведение, отметив, что теперь проще будет при помощи голосового ввода написать эмоциональный отзыв на очередные исправления и обновления Microsoft.

Остальные новые функции в последнем обновлении в основном ориентированы на улучшение пользовательского опыта владельцев ПК Copilot+. В частности, Microsoft исправила проблему, из-за которой изображения, используемые с действиями Click to Do, «застревали» во временной папке ПК. Также компания изменила настройки «Улучшенного поиска Windows» для пользователей, вошедших в OneDrive с рабочей или учебной учётной записью: теперь в результатах поиска отображаются только текстовые фрагменты, а не изображения.

Как обычно, нет никаких гарантий, что новые функции, появившиеся в инсайдерской сборке, доберутся до релизной версии ОС. Но в случае с переключателем фильтра ненормативной лексики это будет просто ******* позором.

Поговорить с ChatGPT теперь можно в веб-версии сервиса — там появился голосовой интерфейс Advanced Voice Mode

Компания OpenAI запустила голосовой интерфейс Advanced Voice Mode в веб-версии сервиса ChatGPT. Об этом через свою страницу в соцсети X сообщил директор по продуктам компании Кевин Вейл (Kevin Weil). Продвинутый голосовой интерфейс по-прежнему доступен только платным пользователям ChatGPT.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

Голосовой интерфейс Advanced Voice Mode стал доступен для владельцев подписок Plus, Enterprise, Teams или Edu теперь и в веб-версии сервиса ChatGPT. С момента своего дебюта в сентябре продвинутый интерфейс был доступен только в мобильной версии ChatGPT для iOS и Android.

Голосовой интерфейс Advanced Voice Mode использует аудиовозможности ИИ-модели GPT-4o, предлагая естественное общение в реальном времени между пользователем и ChatGPT. Чат-бот способен понимать и реагировать на невербальные сигналы пользователя, включая такие вещи, как скорость речи. Кроме того, он может реагировать с «эмоциями».

Для начала разговора в веб-версии чат-бота необходимо выбрать значок «Голос» в правом нижнем углу у поля ввода запросов к ChatGPT. Затем необходимо предоставить браузеру разрешение на доступ к микрофону вашего компьютера. После начала голосового чата пользователь попадёт на экран с синим шаром в центре.

Функция предлагает на выбор один из девяти голосов для ChatGPT, каждый из которых имеет свой собственный тон и характер. Например, можно выбрать «лёгкий и универсальный стиль Arbor» или «уверенный и оптимистичный Ember».

По словам Вайля, OpenAI планирует «в ближайшие недели» внедрить голосовой формат общения с ChatGPT и для бесплатных пользователей. Владельцы подписок Plus и Team могут использовать голосовой формат Advanced Voice Mode лишь определённое количество времени в сутки.

Система уведомит, когда у пользователя останется последние 15 минут ежедневного доступа к голосовому общению с ИИ-ботом. Бесплатным пользователям будет предлагаться доступ на непродолжительное время для знакомства с функцией.


window-new
Soft
Hard
Тренды 🔥
10 тысяч модов и 350 миллионов загрузок: Larian похвасталась новыми достижениями игроков Baldur’s Gate 3 6 ч.
Вызывающий привыкание роглайк Ball x Pit достиг миллиона проданных копий и в 2026 году получит новые шары 7 ч.
Соавтор Counter-Strike признался в любви к русской культуре и рассказал о «самом депрессивном» периоде за 25 лет карьеры 9 ч.
Apple резко снизила награды багхантерам — при этом рост вредоносов в macOS бьёт рекорды 9 ч.
Mortal Kombat 1, Routine и Dome Keeper возглавили первую волну декабрьских новинок Game Pass, а Mortal Kombat 11 скоро подписку покинет 10 ч.
Google закрыла 107 дыр в Android — две нулевого дня уже использовались в атаках 10 ч.
В YouTube появился Recap — пользователям расскажут, чем они занимались на платформе в течение года 10 ч.
ИИ-агенты научились взламывать смарт-контракты в блокчейне — это риск на сотни миллионов долларов 10 ч.
Инструмент YouTube для защиты блогеров от дипфейков создал риск утечки их биометрии 11 ч.
В Microsoft Teams появились «иммерсивные встречи» в метавселенной с аватарами без ног 11 ч.