Сегодня 21 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → голосовые подсказки

xAI Grok 3 заговорил и тут-же стал ругаться и заигрывать с пользователями

Анонсированная в феврале компанией xAI мультимодальная ИИ-модель Grok 3 получила голосовой режим, позволяющий пользователям взаимодействовать с ИИ в реальном времени посредством голоса. Он доступен платным пользователям. Как сообщает ресурс Aibase, пользователь платформы X обнаружил, что приложение также получило поддержку двух режимов для взрослых: «Безбашенный» (Unhinged) и «Сексуальный» (Sexy).

 Источник изображения: xAI

Источник изображения: xAI

По словам пользователя, в режиме Unhinged приложение «постоянно вовлекает вас в жаркие дебаты», преуспевая в провокационных аргументах. В свою очередь, режим Sexy «начинается с флирта», наполненного романтическими высказываниями или сексуальными намеками.

Как полагает Aibase, добавление таких режимов не только обогащает методы взаимодействия ИИ-приложения с пользователями, но и расширяет развлекательный аспект. Режим «Безбашенный» может включать спорный контент, способный вызвать интерес, в то время как режим «Сексуальный» использует беззаботный заигрывающий стиль диалога.

На этом личности «Грока» не заканчиваются. Есть режим «Укурок» (Stoner), имитирующий разговор с человеком под действием запрещённых в России и многих других странах веществ. Для тех, кто предпочитает более спокойные беседы, есть режимы «Лучший друг» и «Гений» — последний подражает стилю общения астрофизика Карла Сагана (Carl Sagan). Все эти личности доступны с женским (Ara) и мужским (Rex) голосами, причем женская версия имеет более строгие ограничения.

Появление этих режимов вызвало дискуссии среди пользователей о необходимости модерации контента, особенно в отношении их потенциального воздействия на несовершеннолетних.

Являются ли эти режимы официальными или просто находятся на стадии тестирования, пока неясно. Компания пока никак не прокомментировала сообщение пользователя. По мнению аналитиков, этот шаг xAI направлен на привлечение более широкой пользовательской базы, одновременно расширяя границы взаимодействия с ИИ. Голосовое общение в реальном времени и разнообразные режимы приложения Grok могут стать его конкурентным преимуществом, но, вместе с тем, создать для xAI проблемы в достижении баланса между инновациями и безопасностью.

ИИ в Gmail научат понимать голосовые команды и облагораживать письма, а в «Документах» появятся вкладки

Сегодня на конференции Cloud Next в Лас-Вегасе компания Google сообщила, что подписчики Google Workspace вскоре смогут при помощи голосовых запросов пользоваться ИИ-инструментом «Помоги мне написать», чтобы, к примеру, составить письмо в Gmail «на ходу». Google также анонсировала в Gmail для Workspace новую функцию на основе искусственного интеллекта, которая мгновенно умеет «облагораживать» черновики писем.

 Исчтоник изображения: Google

Источник изображений: Google

Представленные инструменты в первую очередь станут доступны платным подписчикам. По словам представителя Google, компания имеет «долгую историю создания действительно полезных и универсальных функций с искусственным интеллектом для всех наших пользователей, включая умный ответ и умное составление сообщения». После получения отзывов от платных подписчиков, которые, получается, выступят в качестве бета-тестеров, Google «рассмотрит возможность распространения их [функций ИИ] на всех пользователей».

В дополнение к новым функциям ИИ Google добавила в пакет Workspace несколько других возможностей, среди которых «Уведомления» для «Таблиц», присылающие настраиваемое оповещение, например, при изменении определённого поля. Кроме того, в «Таблицах» появятся новые шаблоны, которые должны упростить создание новой электронной таблицы.

«Документы» получат поддержку вкладок, так что пользователь «сможет организовывать информацию в одном документе вместо того, чтобы ссылаться на несколько документов». Эта функция может оказаться весьма полезной при работе с большими документами со сложным форматированием. В «Документах» появилась возможность создавать макеты обложек без полей.

Google Chat теперь может обслуживать до 500 000 участников, кроме того, добавлена поддержка обмена сообщениями со Slack и Teams.

По данным Google, Workspace используют около 3 миллиардов пользователей, из которых более 10 миллионов составляют платные подписчики.

ChatGPT научился понимать голосовые команды и работать с изображениями

OpenAI расширила варианты взаимодействия с ChatGPT. Новая версия чат-бота теперь принимает в качестве промтов (подсказок) не только текст, но также изображения и голосовые команды. Для коммерческих пользователей новые возможности станут доступны в ближайшие две недели, а остальным придётся какое-то время подождать.

 Источник изображения: The Verge

Источник изображения: The Verge

Общение голосом с ChatGPT в чём-то похоже на разговор с любым голосовым помощником, но, по утверждению OpenAI, качество ответов значительно выше благодаря улучшенной базовой технологии. Пользователь нажимает кнопку и произносит вопрос, ChatGPT преобразует его в текст и передаёт в большую языковую модель, получает ответ, преобразует его обратно в речь и произносит ответ вслух.

Новые возможности ChatGPT опираются на большую языковую модель Whisper, которая выполняет значительную часть работы по преобразованию речи в текст и обратно. По утверждению OpenAI, новая модель может генерировать «человеческий голос из текста и образца речи длиной в несколько секунд». Пока доступно пять вариантов голоса ChatGPT, но OpenAI видит в этой модели гораздо больший потенциал.

Возможность создать синтезированный голос любого человека, опираясь всего на несколько секунд его речи, даёт широкое поле деятельности для киберпреступников, признаёт OpenAI в анонсе новых функций: «Это новые риски, такие как возможность злоумышленников выдать себя за общественных деятелей или совершить мошенничество». По утверждению компании, модель недоступна для широкого использования именно по этой причине: OpenAI планирует ограничить модель конкретными вариантами использования и партнёрскими соглашениями.

Что касается запроса в ChatGPT при помощи изображения, пользователю достаточно сфотографировать или нарисовать предмет своего интереса и отправить боту. В процессе общения можно применять текстовые или голосовые подсказки, чтобы уточнить запрос или ограничить область поиска.

Очевидно, что использование изображений в качестве подсказки для чат-бота также имеет свои потенциальные проблемы. В первую очередь это касается запроса о личности человека на фотографии, хотя OpenAI заявляет, что ограничила «способность ChatGPT анализировать и делать прямые заявления о людях» как по соображениям точности, так и по соображениям конфиденциальности.

Спустя почти год после первого запуска ChatGPT OpenAI продолжает расширять границы применения и использования своего чат-бота, пытаясь избежать связанных с ним проблем и недоработок. В частности, компания намеренно ограничивает возможности своих новых ИИ-моделей. Но такой подход не будет работать вечно. По мере того, как все больше людей используют голосовое управление и поиск изображений, а ChatGPT становится мультимодальным и полезным виртуальным помощником, удерживать ИИ в рамках будет все труднее и труднее.


window-new
Soft
Hard
Тренды 🔥
OpenAI заподозрили в манипуляциях с тестами мощной ИИ-модели o3 2 ч.
Cyberpunk 2077 стала первой подтверждённой игрой для Switch 2 с поддержкой DLSS, но есть нюанс 2 ч.
Олдскульная стратегия Tempest Rising в духе Command & Conquer из-за ошибки вышла на неделю раньше запланированного — издатель смирился с этим 2 ч.
Европейский регулятор случайно раскрыл планы Ubisoft на Assassin’s Creed Shadows для Nintendo Switch 2 3 ч.
Российские пираты предпочитают доменную зону .RU остальным 4 ч.
«Киберпротект» представил новую версию системы резервного копирования Кибер Бэкап 17.3 5 ч.
Создатели ремастера Days Gone рассказали о режимах производительности на PS5 и графических улучшениях 5 ч.
Meta уже несколько лет пытается вернуть Facebook культурную ценность 16 ч.
Новая статья: Blue Prince — особняк желаний. Рецензия 20-04 00:05
Новая статья: Gamesblender № 722: народные GeForce 50, подорожание консолей и ролевая свобода в The Outer Worlds 2 19-04 23:32
Doogee покажет на московской выставке «Связь-2025» новые смартфоны, планшеты и смарт-часы с поддержкой ИИ 25 мин.
CATL представила натрий-ионные аккумуляторы, которые не теряют заряд на морозе 27 мин.
Oukitel покажет на выставке «Связь-2025» защищённые смартфоны WP200 Pro, WP100 Titan и другие новинки 29 мин.
Fujitsu, Supermicro и Nidec сообща повысят энергоэффективность ИИ ЦОД 55 мин.
Atto представила сетевые адаптеры Celerity FC-644E с четырьмя портами FC64G и FastFrame N424 с четырьмя портами 25GbE 2 ч.
CoolIT представила 2-МВт блок распределения охлаждающей жидкости CHx2000 для ИИ и HPC ЦОД 2 ч.
Представлен модуль Banana Pi BPI-CM6 — аналог Raspberry Pi CM4 на базе RISC-V 5 ч.
Представлен LG Smart Monitor Swing — смарт-монитор на колёсиках и webOS 5 ч.
Американское предприятие TSMC принесло компании в прошлом году $440 млн убытков 5 ч.
ASML продала часть земли в корейском Хвасоне, где собиралась построить совместный с Samsung исследовательский центр 6 ч.