Сегодня 13 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → голосовой помощник

OpenAI отложила запуск голосового помощника, чтобы он не наговорил лишнего

OpenAI отложила запуск долгожданной функции голосового помощника ChatGPT в стремлении гарантировать, что он сможет безопасно и эффективно обрабатывать запросы миллионов пользователей. Первоначально запуск функции намечался на конец июня — теперь его перенесли примерно на месяц.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

Голосовой интерфейс чат-бота OpenAI анонсировала в мае на мероприятии, посвящённом обновлённой модели искусственного интеллекта GPT-4o, которая более эффективно обрабатывает текст, звук и изображения в реальном времени. Компания сообщила, что первоначально рассчитывала запустить голосового помощника для небольшого числа подписчиков ChatGPT Plus, но приняла решение потратить ещё месяц, чтобы «достичь нашей планки для запуска».

«Мы совершенствуем способность модели обнаруживать и отклонять определённый контент. Мы также работаем над повышением качества работы системы и готовим инфраструктуру к масштабированию для обеспечения выдачи ответов в реальном времени», — сообщила OpenAI. Это не самое приятное решение для компании, которая стремится сохранить лидерство в жёсткой конкурентной среде.

Всем платным подписчикам голосовой помощник, согласно плану, должен стать доступным осенью. OpenAI также рассказала, что готовится развернуть для чат-бота поддержку видео и трансляции экрана — более подробно об этих функциях она пообещала рассказать позже. В результате с выходом голосового помощника его возможности будут ограничены в сравнении с версией, которую компания демонстрировала на презентации в мае. К примеру, не будет работать функция компьютерного зрения, которая помогла ИИ консультировать пользователя по танцевальным движениям.

Представлен электромобиль Kia EV3 с голосовым помощником на базе ChatGPT

Сегодня Kia представила полностью электрический кроссовер EV3, который иллюстрирует растущий интерес мировых автопроизводителей к внедрению генеративного ИИ в свои автомобили. Электромобиль будет оснащён новым голосовым помощником, созданным на базе ChatGPT от OpenAI. Сама Kia также приложила руку к разработке голосового помощника — большая языковая модель, лежащая в основе ChatGPT, была модифицирована и настроена автопроизводителем.

 Источник изображения: Kia

Источник изображения: Kia

Голосовые помощники в транспортных средствах не новость, при этом далеко не всегда водители оценивают их положительно. Автопроизводители, такие как BMW, Kia, Mercedes-Benz и Volkswagen, утверждают, что генеративный ИИ сделает голосовых помощников гораздо более функциональными и даст возможность водителям и пассажирам взаимодействовать с ними естественным образом.

На сегодняшний день некоторые автопроизводители уже сделали первые шаги к масштабному внедрению генеративного ИИ в транспортные средства. Mercedes-Benz добавила диалогового ИИ-бота в свою информационно-развлекательную систему MBUX в июне 2023 года. В январе 2024 года BMW и Volkswagen продемонстрировали свои варианты этой технологии на выставке CES в Лас-Вегасе.

Голосовой помощник Kia Assistant впервые дебютировал в апреле 2024 года в новом компактном седане с ДВС Kia K4. Руководитель отдела дизайна Kia Пабло Мартинес (Pablo Martinez), рассказал, что лежащая в основе ИИ-помощника большая языковая модель, представляет собой ChatGPT от OpenAI, но она была «сильно модифицирована и настроена автопроизводителем, чтобы позволить клиентам планировать поездки, управлять автомобилем и находить развлечения, включая музыку и игры».

В первое время электромобиль будет доступен только с мотором мощностью 204 л.с. (283 Нм), а вот батарей будет два варианта: стандартной ёмкости на 58,3 кВт·ч и Long Range на 81,4 кВт·ч. Последняя обеспечит до 600 км хода по циклу WLTP. Поддерживается быстрая зарядка — с 10 до 80 % батарея восполняется всего за 31 минуту. Разгон до 100 км/ч кроссовер разгоняется за 7,5 секунды, а максимальная скорость составляет 170 км/ч.

Kia EV3 станет первым полностью электрическим автомобилем в портфолио компании, оснащённым новым помощником на базе ИИ. Продажи Kia EV3 стартуют в Корее в июле 2024 года, во второй половине года кроссовер появится в продаже в Европе. Дата начала поставок в США не называется. Стоимость, согласно предварительным данным, будет начинаться от 30 тыс. долларов.

OpenAI отключила в ChatGPT голос Sky из-за удивительного сходства с голосом Скарлетт Йоханссон

Голос Sky стал доступен в ChatGPT сразу после запуска голосовых функций чат-бота в сентябре 2023 года наряду с ещё четырьмя вариантами озвучения: Breeze, Cove, Ember и Juniper. Особую значимость эти функции приобрели после презентации новой модели ChatGPT-4o, сделавшей голосового помощника более выразительным. После многочисленных сообщений о сходстве тембра и интонаций Sky с голосом Скарлетт Йоханссон, разработчик ChatGPT компания OpenAI «поставила голос Sky на паузу».

 Источник изображения: kinopoisk.ru

Источник изображения: kinopoisk.ru

«Мы считаем, что голоса ИИ не должны намеренно имитировать характерный голос знаменитости — голос Sky не является имитацией Скарлетт Йоханссон, а принадлежит другой профессиональной актрисе, использующей свой собственный естественный голос», — заявил сегодня утром представитель OpenAI.

По утверждению OpenAI, подбор голосов проводился в течение пяти месяцев с участием профессиональных актёров озвучения, кастинг-директоров и отраслевых экспертов. Из соображений конфиденциальности имя актрисы, чей голос так похож на голос Йоханссон, компания не раскрывает.

Технический директор OpenAI Мира Мурати опровергла утверждение, что имитация голоса Йоханссон была преднамеренной. Однако, судя по сообщению генерального директора OpenAI Сэма Альтмана (Sam Altman) в социальной сети X из одного слова: «Она», похоже, что он был в курсе ситуации. Альтман ранее говорил, что одним из его любимых фильмов является «Она», в котором Скарлетт Йоханссон озвучивает виртуальную помощницу.

 Источник изображения: Warner Bros

Источник изображения: Warner Bros

Существует вероятность, что для Sky сознательно подбирался голос озвучения, максимально схожий с голосом Скарлетт Йоханссон. Сама актриса сложившуюся ситуация не комментирует. Перспектива судебных разбирательств представляется весьма туманной — OpenAI достаточно будет предоставить суду персональные данные актрисы, озвучившей Sky.

Новые возможности голосового помощника ChatGPT будут запущены «в ближайшие недели» в качестве ограниченной альфа-версии для подписчиков ChatGPT Plus. OpenAI планирует со временем ввести дополнительные голоса, чтобы «лучше соответствовать разнообразным интересам и предпочтениям пользователей».

Apple обновит Siri: виртуальный помощник устарел и отстаёт от конкурентов

Компания Apple осознала, что её виртуальный помощник Siri безнадёжно отстаёт от конкурентов, в частности от ChatGPT, разработанного OpenAI. Это привело к масштабной реорганизации внутри компании и срочным усилиям по модернизации Siri с использованием новейших технологий ИИ. Apple сосредоточится на улучшении существующей функциональности Siri, а не на создании нового чат-бота.

 Изображение: Kandinsky

Изображение: Kandinsky

В начале прошлого года топ-менеджеры Apple по программному обеспечению пришли к выводу, что виртуальный помощник Siri нуждается в переменах. Siri слишком часто неправильно понимает вопросы и не может вести диалоги. Поводом для этого стало тестирование нового чат-бота ChatGPT компании OpenAI. Использование передовых технологий генеративного искусственного интеллекта, способного создавать стихи, код и вести диалог с пользователями, заставило Siri выглядеть устаревшей.

Осознав отставание Siri, руководство Apple во главе с Тимом Куком (Tim Cook) решило сделать модернизацию виртуального помощника приоритетным проектом компании и догнать конкурентов в сфере AI любой ценой. Apple уже работает над тем, чтобы виртуальный помощник смог вести диалог по принципу чат-ботов, а не просто отвечать на отдельные запросы. Сможет ли Siri сочинять стихи и писать код, пока не известно. В любом случае, все подробности станут известны на ежегодной конференции Apple для разработчиков 10 июня.

Стоит отметить, что модернизация Siri — это лишь часть более масштабных планов Apple по интеграции технологий генеративного ИИ в свои продукты и сервисы. В частности, компания планирует увеличить объём памяти в новых моделях iPhone, чтобы поддерживать расширенные возможности Siri. Кроме того, обсуждается приобретение лицензий на использование передовых моделей ИИ таких компаний как Google, Cohere и OpenAI.

Как сообщает The New York Times, топ-менеджмент Apple обеспокоен тем, что новые технологии ИИ могут подорвать доминирующие позиции компании на рынке смартфонов. В частности, есть опасения, что генеративный ИИ может со временем стать альтернативной мобильной операционной системой, вытеснив полностью iOS. Кроме того, ИИ открывает путь для создания экосистемы «интеллектуальных агентов», способных заменить множество приложений из AppStore.

Чтобы не допустить такого развития событий, Apple решила сконцентрироваться на усилении собственных позиций в сфере ИИ. В частности, не так давно компания отменила проект по созданию беспилотных автомобилей стоимостью 10 млрд долларов и вместо этого сотни инженеров были переведены на разработку в области ИИ.

Хотя Apple не планирует создавать аналог ChatGPT, основные усилия сосредоточены на расширении возможностей Siri как помощника для решения повседневных задач. Помимо улучшенного диалога, обновленная Siri сможет точнее устанавливать таймеры, планировать встречи, составлять списки покупок и резюмировать тексты. При этом в Apple подчёркивают, что новая Siri будет более приватной, чем конкурирующие ИИ, так как обработка запросов будет производиться непосредственно на iPhone, а не на удалённых серверах.

Apple разработала ИИ, который понимает человека лучше GPT-4

Научные сотрудники Apple разработали систему искусственного интеллекта ReALM (Reference Resolution as Language Modeling), способную существенно улучшить понимание человека голосовыми помощниками и повысить эффективность их реакции на запросы.

В Apple описали систему как способ решить проблему разрешения ссылок большими языковыми моделями — она поможет ИИ интерпретировать описание пользователем объектов на экране и лучше понимать контекст разговора. В результате ReALM приведёт к более интуитивному и естественному взаимодействию с устройствами. Разрешение ссылок помогает системам лучше понимать естественную речь, позволяя пользователям в разговоре с ИИ пользоваться местоимениями и другими косвенными отсылками. Для голосовых помощников этот аспект взаимодействия с человеком традиционно представлял значительную проблему, и система ReALM сводит её к задаче, решаемой на уровне языковой модели. ИИ начинает адекватно воспринимать отсылки к визуальным элементам на экране и интегрирует эти понятия в поток разговора.

ReALM восстанавливает визуальный макет экрана при помощи текстовых представлений. Этот процесс включает в себя анализ экранных объектов и их местоположений с его переводом в текстовый формат, отражающий содержимое и структуру элементов на экране. Исследователи Apple обнаружили, что этот способ в сочетании с тонкой настройкой языковых моделей значительно превосходит традиционные методы, включая возможности нейросети OpenAI GPT-4. ReALM поможет пользователям предельно просто описывать элементы экрана, а ИИ-помощникам — понимать такие описания. Эти возможности окажутся полезными, например, при управлении информационно-развлекательными системами автомобилей с помощью голосовых команд и повысят эффективность голосового интерфейса для людей с ограниченными возможностями.

Samsung прокачает голосового помощника Bixby генеративным ИИ

Samsung планирует внедрить технологии генеративного искусственного интеллекта (ИИ) в голосовой помощник Bixby, что позволит повысить привлекательность устройств разработчика для пользователей, сообщил CNBC со ссылкой на топ-менеджера компании. Умный ассистент Bixby используется на всех устройствах Samsung — от смартфонов и умных часов до бытовой техники.

Ранее стало известно о планах компании оснастить нейронными процессорами (NPU) все новые продукты в категории бытовой техники, включая телевизоры, посудомоечные машины, духовки, холодильники и кондиционеры.

Вон Чжун Чой (Won-Joon Choi), исполнительный вице-президент мобильного бизнеса Samsung, ранее заявил ресурсу CNBC, что «Bixby стал ключевым голосовым помощником Samsung не только для мобильных устройств, но также для телевизоров и цифровых устройств, которые имеются в экосистеме компании».

Топ-менеджер отметил, что с появлением технологий генеративного ИИ и больших языковых моделей (LLM) компании необходимо пересмотреть роль Bixby, чтобы он мог быть оснащён генеративным ИИ и стал «более умным в будущем». «Это позволит вести более естественный диалог и разработать интерфейс, поддерживающий продукты Samsung в нашей экосистеме», — подчеркнул Вон Чжун Чой.

Чой сообщил, что в настоящее время Samsung усиленно работает над внедрением генеративного ИИ в Bixby, однако сроки анонса версии голосового помощника с расширенной функциональностью называть не стал.

Как и многие производители смартфонов, Samsung стремится оснастить выпускаемые устройства более продвинутыми функциями ИИ. Недавно компания добавила ранее эксклюзивные для серии Galaxy S24 функции ИИ Galaxy AI в некоторые старые модели, включая серии смартфонов Galaxy S23, S23 FE, Galaxy Z Flip 5, Z Fold 5 и планшет Tab S9.

ChatGPT появится во всех новых автомобилях Peugeot

Концерн Stellantis объявил о намерении использовать ИИ-чат-бота ChatGPT для улучшения голосового помощника в легковых автомобилях и фургонах бренда Peugeot. Таким образом, французский бренд присоединился к другим производителям, таким как Volkswagen и Mercedes, которые уже используют популярного чат-бота в своих авто.

 Источник изображений: stellantis.com

Источник изображений: stellantis.com

«Мы интегрируем ChatGPT во все автомобили, включая новую модель e-3008, и небольшие коммерческие автомобили», — приводит источник слова директора по продуктовому плану Peugeot Жерома Мишерона (Jerome Micheron).

Уже на этой неделе Peugeot запустит пилотную версию сервиса с ChatGPT, который сможет подключаться к элементам управления транспортным средством, а также будет отвечать на вопросы навигационного и общего характера. На данном этапе нововведение будет доступно владельцам авто бренда во Франции, Великобритании, Германии, Италии и Испании. Ожидается, что в течение года эта услуга станет стандартной функцией и будет доступна всем владельцам авто Peugeot.

В прошлом году владельцы автомобилей Mercedes-Benz в США получили возможность использования ChatGPT. В компании заявили, что интеграция ИИ-бота позволит голосовому помощнику давать более естественные и развёрнутые ответы. Не так давно Volkswagen объявила, что ChatGPT будет интегрирован с фирменным голосовым помощником компании к середине года.


window-new
Soft
Hard
Тренды 🔥
OpenAI выпустила GPT-5.3-Codex-Spark — свою первую ИИ-модель, работающую без чипов Nvidia 4 ч.
Можно ли клонировать Gemini, завалив её запросами? Google раскрыла мощную дистилляционную атаку 5 ч.
Несмотря на 10 месяцев молчания, мультиплеерный боевик The Duskbloods от создателей Bloodborne и Elden Ring всё ещё запланирован на 2026 год 6 ч.
«Те же щи, да пожиже»: 19 минут геймплея шпионской ролевой игры Zero Parades: For Dead Spies в духе Disco Elysium не впечатлили фанатов 8 ч.
Амбициозный симулятор выживания Blackfrost: The Long Dark 2 не выйдет в 2026 году — разработчики несут потери 8 ч.
Google научит Chrome запускаться вместе с Windows — сразу с открытым окном 9 ч.
Илон Маск сообщил о скором запуске X Money — сервиса, «где будут храниться все деньги» пользователей X 9 ч.
Сайт-двойник 7-Zip десять дней заражал пользователей — вредонос подменял ссылки с задержкой 9 ч.
В Steam вышла демоверсия «Былины» — грандиозной экшен-RPG в мире славянских мифов 10 ч.
Владелец TikTok выпустил ИИ-модель Seedance 2.0 для генерации видео — она стала вирусной 10 ч.
Новая статья: «Железо» эпохи Си 4 ч.
Наскоро построенные ИИ ЦОД могут оказаться не нужны, предупредила китайская SMIC 4 ч.
В ядре Земли нашли водорода на 45 океанов — гипотеза кометного происхождения воды под вопросом 5 ч.
Sony представила флагманские TWS-наушники WF-1000XM6 с улучшенным шумоподавлением за $330 5 ч.
Обещанного два года ждут: Google наконец выпустила приложение YouTube для Apple Vision Pro 7 ч.
Триумф AMD: Ryzen захватили больше 36 % рынка CPU для настольных ПК, пока Intel теряет позиции по всем направлениям 7 ч.
Кризис памяти разогнал продажи ПК — бизнес закупается, пока не стало ещё дороже 9 ч.
InWin представила панорамный компьютерный корпус W50 с геометрическим дизайном 9 ч.
Заказы на газовые турбины Siemens бьют рекорды — причина кроется в ненасытности ИИ 9 ч.
Samsung представила пятислойные матрицы QD-OLED Penta Tandem — вдвое долговечнее и с яркостью до 4500 кд/м² 10 ч.