Сегодня 11 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → голосовой помощник
Быстрый переход

Brilliant Labs представила умные очки Halo за $299, которые помогут вспомнить всё

Компания Brilliant Labs представила преемника своих умных очков Frame с открытым исходным кодом за $349. Новые умные очки Halo за $299 по цене приближаются к базовым моделям Ray-Ban от Meta и оснащены улучшенными возможностями ИИ. Агентская система памяти Narrative использует данные с камеры и микрофонов для создания «личной и персонализированной базы знаний», а мультимодальный ИИ-агент Noa «понимает, что слышит и видит в окружающей среде».

 Источник изображений: Brilliant Labs

Умные очки Halo предлагают новую «запатентованную агентскую систему памяти» от Brilliant Labs под названием Narrative, которая использует данные, собранные с камеры и микрофонов, для создания «личной и персонализированной базы знаний». Стартап заявляет, что умные очки будут запоминать имя собеседников и содержание прошлых разговоров.

По утверждению Brilliant Labs, общение с встроенным мультимодальным ИИ-агентом Noa теперь будет «естественным и интуитивно понятным, как при общении с реальным человеком», благодаря контекстно-релевантной информации, основанной на окружающей обстановке. Noa предоставляет дополнительные возможности по управления очками Halo, позволяя отключать микрофон или переводить их в спящий режим с помощью расширенных голосовых команд.

В умение очки Halo также встроена новая экспериментальная функция кодирования под названием Vibe Mode, которая позволит «создавать пользовательские приложения с помощью простых голосовых команд на естественном языке». Вместо поиска нужного приложения в магазине, пользователь, по словам Brilliant Labs, сможет создать собственное приложение с необходимыми функциями.

Кроме голосовых подсказок через динамики с костной проводимостью в дужках, владельцу доступен 0,2-дюймовый цветной microOLED-дисплей, который «проецирует интерфейс в стиле ретро-аркад» на периферийное зрение. Время автономной работы устройства составляет внушительные 14 часов, отчасти благодаря энергосберегающей камере и ИИ-чипу со специальным нейронным процессором. Весят умные очки Halo чуть более 40 граммов.

Halo в строгом матово-чёрном корпусе уже доступны для ограниченного предзаказа на сайте Brilliant Labs за $299. Поставки ожидаются в конце ноября 2025 года. Возможен заказ очков с диоптрическими линзами.

«Яндекс» раскрыл алгоритм распознавания голосовых команд в шумных условиях

Инженеры «Яндекса» опубликовали научную статью, в которой раскрыли принципы работы нейросети, обеспечивающей распознавание голосовых команд в условиях внешнего шума. Компания уже применяет эту технологию, и теперь внедрить её смогут разработчики по всему миру.

 Источник изображения: yandex.ru/company

Источник изображения: yandex.ru/company

Работа будет представлена на международной конференции по речевым технологиям Interspeech, которая пройдёт с 17 по 21 августа в нидерландском Роттердаме; среди прочих участников мероприятия значатся Microsoft, Google DeepMind и Google AR.

Разработанная специалистами «Яндекса» технология используется в умных колонках и «ТВ Станциях». Она позволяет устройствам с «Алисой» правильно интерпретировать голосовые команды, если что-то пытается этому помешать: играет музыка, шумит вода, гудит вечеринка, или за окном грохочет стройка — система услышит пользователя, даже если он не будет пытаться перекричать песню или не станет выключать пылесос. Используя эту технологию, любая компания сможет повысить качество работы голосового помощника с искусственным интеллектом и уменьшить долю ложных срабатываний.

Если человеческий голос раздаётся на фоне музыки, эффективными считаются алгоритмы эхоподавления; в случае других посторонних источников лучше работает шумоподавление, которое, однако, ухудшает и разборчивость человеческой речи. Поэтому в «Яндексе» разработали attention-механизм на основе нейросетей — на вход ему подаются сразу оба сигнала, с эхо- и шумоподавлением, и система динамически выбирает наиболее чёткий, адаптируясь к звуковому фону от источников разной природы.

Скоро рынок наполнится наушниками со встроенным ИИ на базе GPT-4.1 — Bragi и OpenAI договорились о партнёрстве

В 2019 году немецкая компания Bragi переключилась с производства наушников на лицензирование собственных разработок. Фирменные технологии компании используют многие именитые производители аудиотехники. Сегодня Bragi анонсировала приложение ChatAI, разработанное в партнёрстве с OpenAI. Оно позволит производителям наушников интегрировать в свои продукты голосового помощника на базе GPT-4.1 — для создания заметок, постановки вопросов и доступа к информации.

 Источник изображений: Bragi

Источник изображений: Bragi

Когда владелец наушников активирует голосового помощника, мультимодальная локальная модель в приложении ChatAI обрабатывает запрос и отправляет его на серверы OpenAI. Модель GPT-4.1 формирует ответ, который озвучивается через наушники. Чтобы минимизировать риск случайной активации и обработки посторонних голосов, ChatAI обучен реагировать только на команды владельца устройства. В Bragi подчёркивают, что компания не получает персональные данные пользователей, а их запросы не сохраняются в приложении после отправки в OpenAI.

Bragi также заявляет, что новая система позволит партнёрам создавать собственный фирменный интерфейс и реализовывать агентские функции — например, изучение привычек пользователя и проактивную настройку эквалайзера в зависимости от контекста и личных предпочтений.

На первом этапе ChatAI будет поддерживать английский, немецкий, французский, испанский и китайский языки. В дальнейшем планируется расширение языковой поддержки. Согласно исследованиям Bragi, пользователи в разных регионах используют ИИ-функции по-разному: в Китае наиболее востребован перевод, тогда как в других странах сценарии применения более разнообразны.

По данным компании, 89 % потребителей готовы заплатить в среднем на $25 больше за наушники с ИИ-функциями, что увеличивает среднюю цену таких устройств до $135–160. Приложение ChatAI станет доступным для производителей наушников уже этим летом.

Amazon похвалилась сотнями тысяч пользователей Alexa+, но их никто не видел

Amazon утверждает, что сотни тысяч пользователей уже получили доступ к обновлённому голосовому помощнику Alexa+, но независимые журналисты не смогли найти ни одного подтверждённого пользователя. Компания объясняет это тем, что большинство тестирующих — это сотрудники, однако эксперты сомневаются в готовности технологии.

 Источник изображения: Nicolas J Leclercq / Unsplash

Источник изображения: Nicolas J Leclercq / Unsplash

Amazon представила обновлённого голосового помощника Alexa+ шесть недель назад, однако до сих пор неясно, кто действительно им пользуется. Reuters провёл собственное расследование, изучив десятки новостных сайтов и соцсетей, включая YouTube, TikTok, X и Reddit, но не нашёл ни одного подтверждённого пользователя. Два человека на Reddit заявили, что тестировали Alexa+, однако не смогли предоставить доказательств, отмечает PCMag.

Компания обещала, что Alexa+ станет более «человечной» в общении, а также получит функции агентного ИИ — например, сможет самостоятельно договариваться с сервисными центрами о ремонте техники. Пока эти возможности ограничены, но Amazon утверждает, что «сотни тысяч клиентов» уже получили доступ к Alexa+. Правда, большинство из них — сотрудники компании, а остальные лишь подали заявку на ранний доступ.

Интересно, что запуск Alexa+ не раз откладывался. В феврале обновление задержали на месяц из-за того, что помощник давал некорректные ответы во время тестов. Ещё одна задержка произошла в ноябре — из-за президентских выборов в США. Некоторые аналитики считают, что ситуация с Alexa+ отражает общую тенденцию: многие компании анонсируют продукты, когда те почти готовы, но завершающий этап разработки оказывается сложнее, чем ожидалось.

Amazon, в свою очередь, опровергает выводы Reuters, настаивая на том, что Alexa+ уже доступна реальным пользователям. Однако отсутствие подтверждений со стороны независимых источников вызывает вопросы. Когда же Alexa+ станет общедоступной, подписка на неё будет стоить $20 в месяц, но для пользователей Amazon+ она окажется бесплатной.

Большое обновление Siri откладывается — Apple споткнулась о множество проблем при внедрении ИИ

В прошлом году Apple заявила о намерении выпустить обновлённую версию голосового помощника Siri, улучшенную с помощью технологий на базе искусственного интеллекта. Теперь же стало известно, что в процессе разработки компания столкнулась с рядом проблем, которые ставят под угрозу запланированный на апрель запуск обновлённого голосового помощника. Об этом пишет Bloomberg со ссылкой на осведомлённые источники.

Впервые Apple анонсировала новую версию Siri на базе искусственного интеллекта на своей конференции для разработчиков в июне прошлого года. Тогда же компания представила некоторые новые функции, но их внедрение, похоже, затянется. По данным источника, ИИ-функции, запуск которых был намечен на апрель, появятся в мае или даже позже.

Переработанная Siri должна стать центральным элементом платформы Apple Intelligence, с помощью которой компания стремится подтолкнуть пользователей к покупке новых iPhone. Даже без учёта проблем с Siri запуск ИИ-функций Apple проходил не слишком гладко. Новые возможности выпускались поэтапно, и некоторые из них, такие как сгенерированные новостные сводки, вызвали критику со стороны потребителей.

Apple представила Siri ещё в 2011 году, и для компании особенно важно, чтобы обновлённый голосовой помощник работал качественно, поскольку сейчас он является символом отставания Apple от конкурентов в сфере ИИ. Отмечается, что разработка Siri отделена от усилий компании по запуску функций Apple Intelligence в Китае, где производитель iPhone сотрудничает с Alibaba и Baidu, чтобы создать систему, которая пройдёт проверку местных регуляторов и сможет выйти на потребительский рынок.

 Источник изображения: Apple

Источник изображения: Apple

Официальные представители Apple воздерживаются от комментариев относительно того, как продвигается процесс разработки ИИ-функций для обновлённой Siri. На момент анонса ИИ-функций для Siri в середине прошлого года Apple говорила о трёх основных нововведениях. Прежде всего речь шла о том, что алгоритм сможет задействовать данные о пользователе, чтобы более качественно отвечать на заданные вопросы. Кроме того, Siri получит больше возможностей для взаимодействия с приложениями. Голосовой помощник также сможет анализировать данные на экране устройства, используя этот контекст для повышения качества своей работы.

В то время Apple намекнула, что изменения появятся не раньше 2025 года. Предполагалось, что обновлённая Siri станет частью iOS 18.4, стабильная версия которой выйдет в апреле. Теперь же Apple может отложить запуск нововведений полностью или частично до выхода iOS 18.5 в мае.

Сотрудники Apple, занимающиеся тестированием Siri, обнаружили, что ИИ-функции работают нестабильно. Несмотря на то, что стабильная версия iOS 18.4 не выйдет до апреля, бета-версия ОС станет доступна разработчикам уже на следующей неделе. Также не исключается, что новые функции станут частью iOS 18.4, но будут отключены. При таком подходе Apple сможет активировать их вместе с iOS 18.5.

Запуск обновлённой Siri в этом году должен стать важным шагом на пути к созданию голосового помощника, который станет более разговорчивым и похожим на ChatGPT. Однако работа в этом направлении, вероятно, будет завершена лишь в следующем году.

Apple заявила, что никогда не продавала данные из диалогов с Siri рекламодателям

Компания Apple выступила с официальным заявлением, в котором подтвердила свою приверженность конфиденциальности взаимодействия пользователей с Siri, подчеркнув, что не предоставляла данные голосового помощника рекламодателям и не продавала их кому-либо.

«Apple никогда не использовала данные Siri для создания маркетинговых профилей, никогда не предоставляла их для рекламы и никогда не продавала их кому-либо в каких-либо целях. Мы постоянно разрабатываем технологии, чтобы сделать голосового ассистента ещё более конфиденциальным, и будем продолжать это делать», — сказано в заявлении компании.

Публикация Apple появилась после того, как она урегулировала коллективный иск, связанный с Siri, на сумму $95 млн. Истцы обвинили Apple в записи разговоров, полученных в результате случайных активаций виртуального помощника, и в последующем распространении информации из этих разговоров для сторонних рекламодателей.

Некоторые истцы утверждали, что после упоминания в разговоре таких брендов, как Air Jordan, Easton bats, Pit Viper и Olive Garden, им показывали на устройствах Apple рекламу соответствующих продуктов. Ещё один истец заявил, что ему направили рекламу хирургического лечения после обсуждения этого вопроса в частном порядке со своим врачом.

Ранее на этой неделе Apple пояснила ресурсу MacRumors, что иск был урегулирован, чтобы избежать дополнительных судебных разбирательств.

В своём заявлении Apple отметила, что «не сохраняет аудиозаписи взаимодействия с голосовым помощником, если пользователи явно не соглашаются помочь улучшить Siri, и даже в этом случае записи используются исключительно для этой цели. Пользователи могут легко отказаться в любое время». Также Apple акцентировала внимание на том, что поисковые запросы и обращения к Siri не связаны с учётной записью Apple и не могут быть использованы для идентификации конкретного пользователя.

Apple согласилась выплатить по $20 десяткам миллионов пользователей, чьи разговоры подслушивала Siri

Apple согласилась выплатить $95 млн для урегулирования коллективного иска, обвиняющего её голосового помощника Siri в несанкционированной записи и передаче личных разговоров пользователей рекламодателям. Владельцы мобильных устройств заявили, что Apple регулярно записывала их частные разговоры после случайной активации Siri, а затем передавала эти данные третьим сторонам, включая рекламодателей.

 Источник изображения: Daniel Romero / Unsplash

Источник изображения: Daniel Romero / Unsplash

По сообщению Reuters, компания Apple достигла предварительного соглашения по делу о нарушении конфиденциальности, в рамках которого пользователи могут получить до $20 за каждое устройство с Siri, которым они пользовались.

Голосовые помощники обычно активируются с помощью «горячих фраз» вроде «Привет, Siri». Однако истцы указали, что даже случайные упоминания определённых брендов или тем в дальнейшем вызывали показ таргетированной рекламы. Например, два заявителя сообщили, что после обсуждения кроссовок Air Jordan и ресторанов Olive Garden им стала предлагаться реклама этих продуктов. Другой истец заявил, что получил прицельную рекламу медицинского характера после разговора с врачом, который, как он считал, был полностью приватным. Иск охватывает период, который начинается с 17 сентября 2014 года и заканчивается 31 декабря 2024 года, когда в Siri была внедрена функция «Привет, Siri».

По предварительным оценкам, участниками коллективного иска являются десятки миллионов человек, которые могут получить до 20 долларов за каждое устройство с поддержкой Siri, например iPhone и Apple Watch. Apple, в свою очередь, отрицает какие-либо нарушения, но согласилась на урегулирование для избежания дальнейших судебных разбирательств. Представители Apple и их юристы пока не ответили на запросы о комментариях.

Юристы истцов также не предоставили комментариев, но, как ожидается, они запросят до $28,5 млн в качестве гонораров и $1,1 млн на покрытие расходов из фонда урегулирования. Примечательно, что $95 млн, выделенные на урегулирование, составляют всего девять часов прибыли Apple.

Стоит отметить, что аналогичный иск от имени пользователей голосового помощника Google находится на рассмотрении в суде, а истцов в обоих делах представляют одни и те же юридические фирмы. Дело против Apple, зарегистрированное под номером 19-04577, может стать важным прецедентом в вопросах конфиденциальности и использования персональных данных голосовыми помощниками.

Голосовой помощник VK «Маруся» заговорит другим голосом

Стало известно, что голосовой помощник VK «Маруся» изменит голос, а случится это уже в начале следующего года. Об этом пишет РИА «Новости» со ссылкой на осведомлённый источник, близкий к компании.

 Источник изображения: ilgmyzin / unsplash.com

Источник изображения: ilgmyzin / unsplash.com

«Новая актриса записала уже около половины необходимых часов, и в начале 2025 года пользователи услышат новый голос "Маруси"», — сообщил источник.

В сообщении сказано, что в течение последних месяцев эксперты VK проводили количественные и качественные исследования, анализировали восприятие голоса и соответствие основным ценностям персонажа «Маруся». В дополнение к этому они сравнили звучание «Маруси» с аналогами от конкурентов. Отмечается, что компания планирует сохранить «доброту, позитивный настрой и тёплый обволакивающий тембр», которые уже есть в нынешнем звучании голосового помощника.

Представитель VK подтвердил, что голос «Маруси» изменится в следующем году. В настоящее время голосовой помощник общается голосом Елены Соловьёвой, которая, помимо прочего, озвучивала Тринити из «Матрицы». Сам же голосовой помощник VK работает с 2019 года и к текущему времени интегрирован с многими сервисами Mail.ru Group, а также колонками «VK Капсула». В дополнение к этому «Маруся» встроена в колонки Xiaomi Mi Smart Speaker для российского рынка и Prestigio SmartVoice.

Переосмысленная Amazon Alexa будет использовать ИИ-модели Anthropic Claude и станет платной

Готовящаяся к выходу новая версия голосового помощника Alexa, получившая в компании названия Remarkable Alexa и Project Banyan, будет использовать ИИ-модели Claude от Anthropic, а не собственные ИИ-технологии Amazon, пишет Reuters со ссылкой на информированные источники. Как ожидается, Alexa 2 выйдет в октябре, а превью сервиса представят в сентябре на ежегодном мероприятии Amazon.

 Источник изображений: aboutamazon.com

Источник изображений: aboutamazon.com

По словам одного из источников, первым версиям обновлённого помощника Alexa на базе собственных ИИ-технологий Amazon, иногда требовалось шесть или семь секунд, чтобы подтвердить получение запроса и ответить. Поэтому Amazon решила использовать Claude, чат-бот на основе ИИ стартапа Anthropic, который показал себя лучше, чем собственные ИИ-модели компании.

Нынешняя версия Alexa позволяет устанавливать таймеры, воспроизводить музыку, выступать в качестве центрального узла для управления умным домом и отвечать на вопросы. Вместе с тем попытки Amazon убедить пользователей совершать с помощью голосового помощника покупки, что позволило бы увеличить доход, не увенчались успехом, и подразделение по разработке Alexa остаётся убыточным.

В отличие от нынешней бесплатной версии голосового помощника, Remarkable Alexa будет доступен по подписке стоимостью от $5 до $10 в месяц. Платная версия Alexa будет предлагать более продвинутые функции, включая ведение разговоров, основанных на предыдущих вопросах и ответах. Она также будет давать советы по покупкам, собирать новости и выполнять более сложные запросы, такие как заказ еды или составление писем. Кроме того, новая Alexa будет служить центром домашней автоматизации, запоминая предпочтения клиентов и выполняя такие задачи, как установка будильника или запись любимых телешоу.

Сотрудники Amazon выражают сомнение по поводу готовности клиентов платить от $60 до $120 в год за услугу, которая сейчас бесплатна. Тем не менее Amazon стремится показать потенциал Alexa в получении доходов и делает ставку на обновлённую версию умного помощника как ключевую стратегию для достижения этой цели.

Amazon не раскрывает количество активных пользователей Alexa. По данным аналитика Bank of America Джастина Поста (Justin Post), аудитория Alexa составляет около 100 млн человек. Согласно прогнозу аналитика, около 10 % пользователей может выбрать платную версию Alexa, что означает для компании не менее $600 млн дополнительного годового дохода.

Amazon вот-вот выпустит платную Alexa с ИИ — она должна компенсировать убытки от устройств Echo

В апреле 2024 года генеральный директор Amazon Энди Джесси (Andy Jassy) пообещал акционерам «более умную и способную Alexa». План Amazon по запуску платной версии Alexa является попыткой компенсировать убытки в размере $25 млрд, которые её бизнес по производству устройств понёс в период с 2017 по 2021 год. Продажи Alexa с ИИ могут начаться в ближайшее время, месячная подписка будут стоить $10. По слухам, разработчики сомневаются в успехе обновлённой Alexa.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Согласно инсайдерской информации, подразделение приближается к крайнему сроку запуска подписки, хотя «технологии ещё нет». Впервые о планах Amazon взимать плату за улучшенную версию Alexa было объявлено в прошлом году. Но компания, как сообщается, сильно отстаёт — в прошлом месяце в отчёте Fortune говорилось, что Alexa даже близко не подошла к «выполнению миссии Amazon — стать лучшим личным помощником в мире», поскольку команда сталкивается с техническими и организационными проблемами.

Сервис Alexa — любимый проект основателя Amazon Джеффа Безоса (Jeff Bezos), который придумал эту технологию, имитируя вымышленный голосовой компьютер из телевизионного сериала «Звёздный путь». Доступ к Alexa осуществляется через телевизоры Amazon и умные колонки Echo. Alexa в основном используется в качестве будильника, прогноза погоды, для воспроизведения музыки и ответов на простые вопросы. Надежды Amazon на увеличение продаж в сфере электронной коммерции с помощью этого сервиса не оправдались.

Предполагается, что новая версия Alexa будет дополнена генеративными функциями ИИ, которые позволят ей выполнять несколько задач за одну подсказку и создавать последовательности действий. «Мы уже интегрировали генеративный ИИ в различные компоненты Alexa и усердно работаем над их развёртыванием более чем на полумиллиарде устройств с поддержкой Alexa, установленных в домах по всему миру, чтобы обеспечить ещё более проактивную, персональную и надёжную помощь для наших клиентов», — заявил представитель Amazon.

Сотрудники компании сомневаются, что клиенты захотят платить за подписку на Alexa с ИИ сверх оплаты членства Amazon Prime в размере $139 в год. Поскольку базовые версии ИИ-помощников, такие как ChatGPT, Google Gemini, а вскоре и Siri, не требуют никаких затрат в использовании, Amazon может столкнуться с трудностями взимания платы за Alexa.

Для Amazon крайне важно идти в ногу с конкурентами в области генеративного ИИ, поскольку Google, Microsoft и OpenAI вырвались далеко вперёд благодаря чат-ботам, мгновенно отвечающим на естественном языке на сложные вопросы. Осведомлённые источники утверждают, что Amazon страдает от «неоднократных фальстартов» в разработке, проблем с галлюцинациями ИИ и плохого морального состояния сотрудников в подразделении.

Audi интегрирует ChatGPT в свои автомобили — это расширит голосовое управление

Audi внедряет ChatGPT в свою информационно-развлекательную систему MIB3 для расширения возможностей голосового управления. С июля около двух миллионов автомобилей Audi, выпущенных с 2021 года, включая Audi A3, получат обновлённые функции. Новые модели, такие как Q6 e-tron, также будут оснащены ChatGPT.

 Источник изображения: Audi

Источник изображения: Audi

Интеграция ChatGPT в систему MIB3 открывает новые, ранее недоступные возможности, сообщает в своём блоге компания. Водители Audi смогут использовать расширенное голосовое управление для работы с информационно-развлекательной системой, навигацией и системой кондиционирования воздуха, а также задавать общие вопросы. Возможность запрашивать информацию в реальном режиме времени, не отвлекаясь от дороги, делает вождение безопаснее.

ChatGPT предоставляется через Azure OpenAI Service, а в основе новой функции лежит технология Chat Pro от компании Cerence, которая непосредственно занимается интеграцией чат-бота в Audi Assistant на новой архитектуре E 3 1.2.

Маркус Кит (Marcus Keith), вице-президент по развитию информационно-развлекательных систем в Audi, отмечает, что благодаря бесшовной интеграции ChatGPT в систему голосового управления были объединены сильные стороны технологий ChatGPT и Chat Pro. «Помимо широкого спектра голосовых функций, наши клиенты теперь получат простой и безопасный доступ к базе знаний на основе ИИ. Это ещё один шаг к созданию премиального пользовательского опыта в автомобилях Audi», — сказал он.

Чтобы активировать помощника, надо сказать «Hey Audi» или нажать кнопку push-to-talk на рулевом колесе. В зависимости от вопроса или команды, ИИ-помощник определит, что именно он должен сделать. Если система не может справится с заданием, она перенаправит его ChatGPT. В будущем также станет возможным задавать вопросы о техническом состоянии автомобиля, например, о давлении в шинах.

Компания Audi стремится шагать со временем в ногу и максимально использовать потенциал искусственного интеллекта, предлагая услуги и продукты для улучшения пользовательского взаимодействия с автомобилем, а также в бизнес-процессах. В частности, ИИ используется для решений, касающихся дизайна интерьера, поддержки контроля качества в производстве. Компания заявляет, что также привержена ответственному использованию ИИ в соответствии с принципами этики и регламента ЕС, касающегося искусственного интеллекта, а её сотрудники проходят обучение для использования ИИ в соответствии с современными стандартами и с учётом будущих потребностей.

OpenAI отложила запуск голосового помощника, чтобы он не наговорил лишнего

OpenAI отложила запуск долгожданной функции голосового помощника ChatGPT в стремлении гарантировать, что он сможет безопасно и эффективно обрабатывать запросы миллионов пользователей. Первоначально запуск функции намечался на конец июня — теперь его перенесли примерно на месяц.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

Голосовой интерфейс чат-бота OpenAI анонсировала в мае на мероприятии, посвящённом обновлённой модели искусственного интеллекта GPT-4o, которая более эффективно обрабатывает текст, звук и изображения в реальном времени. Компания сообщила, что первоначально рассчитывала запустить голосового помощника для небольшого числа подписчиков ChatGPT Plus, но приняла решение потратить ещё месяц, чтобы «достичь нашей планки для запуска».

«Мы совершенствуем способность модели обнаруживать и отклонять определённый контент. Мы также работаем над повышением качества работы системы и готовим инфраструктуру к масштабированию для обеспечения выдачи ответов в реальном времени», — сообщила OpenAI. Это не самое приятное решение для компании, которая стремится сохранить лидерство в жёсткой конкурентной среде.

Всем платным подписчикам голосовой помощник, согласно плану, должен стать доступным осенью. OpenAI также рассказала, что готовится развернуть для чат-бота поддержку видео и трансляции экрана — более подробно об этих функциях она пообещала рассказать позже. В результате с выходом голосового помощника его возможности будут ограничены в сравнении с версией, которую компания демонстрировала на презентации в мае. К примеру, не будет работать функция компьютерного зрения, которая помогла ИИ консультировать пользователя по танцевальным движениям.

Представлен электромобиль Kia EV3 с голосовым помощником на базе ChatGPT

Сегодня Kia представила полностью электрический кроссовер EV3, который иллюстрирует растущий интерес мировых автопроизводителей к внедрению генеративного ИИ в свои автомобили. Электромобиль будет оснащён новым голосовым помощником, созданным на базе ChatGPT от OpenAI. Сама Kia также приложила руку к разработке голосового помощника — большая языковая модель, лежащая в основе ChatGPT, была модифицирована и настроена автопроизводителем.

 Источник изображения: Kia

Источник изображения: Kia

Голосовые помощники в транспортных средствах не новость, при этом далеко не всегда водители оценивают их положительно. Автопроизводители, такие как BMW, Kia, Mercedes-Benz и Volkswagen, утверждают, что генеративный ИИ сделает голосовых помощников гораздо более функциональными и даст возможность водителям и пассажирам взаимодействовать с ними естественным образом.

На сегодняшний день некоторые автопроизводители уже сделали первые шаги к масштабному внедрению генеративного ИИ в транспортные средства. Mercedes-Benz добавила диалогового ИИ-бота в свою информационно-развлекательную систему MBUX в июне 2023 года. В январе 2024 года BMW и Volkswagen продемонстрировали свои варианты этой технологии на выставке CES в Лас-Вегасе.

Голосовой помощник Kia Assistant впервые дебютировал в апреле 2024 года в новом компактном седане с ДВС Kia K4. Руководитель отдела дизайна Kia Пабло Мартинес (Pablo Martinez), рассказал, что лежащая в основе ИИ-помощника большая языковая модель, представляет собой ChatGPT от OpenAI, но она была «сильно модифицирована и настроена автопроизводителем, чтобы позволить клиентам планировать поездки, управлять автомобилем и находить развлечения, включая музыку и игры».

В первое время электромобиль будет доступен только с мотором мощностью 204 л.с. (283 Нм), а вот батарей будет два варианта: стандартной ёмкости на 58,3 кВт·ч и Long Range на 81,4 кВт·ч. Последняя обеспечит до 600 км хода по циклу WLTP. Поддерживается быстрая зарядка — с 10 до 80 % батарея восполняется всего за 31 минуту. Разгон до 100 км/ч кроссовер разгоняется за 7,5 секунды, а максимальная скорость составляет 170 км/ч.

Kia EV3 станет первым полностью электрическим автомобилем в портфолио компании, оснащённым новым помощником на базе ИИ. Продажи Kia EV3 стартуют в Корее в июле 2024 года, во второй половине года кроссовер появится в продаже в Европе. Дата начала поставок в США не называется. Стоимость, согласно предварительным данным, будет начинаться от 30 тыс. долларов.

OpenAI отключила в ChatGPT голос Sky из-за удивительного сходства с голосом Скарлетт Йоханссон

Голос Sky стал доступен в ChatGPT сразу после запуска голосовых функций чат-бота в сентябре 2023 года наряду с ещё четырьмя вариантами озвучения: Breeze, Cove, Ember и Juniper. Особую значимость эти функции приобрели после презентации новой модели ChatGPT-4o, сделавшей голосового помощника более выразительным. После многочисленных сообщений о сходстве тембра и интонаций Sky с голосом Скарлетт Йоханссон, разработчик ChatGPT компания OpenAI «поставила голос Sky на паузу».

 Источник изображения: kinopoisk.ru

Источник изображения: kinopoisk.ru

«Мы считаем, что голоса ИИ не должны намеренно имитировать характерный голос знаменитости — голос Sky не является имитацией Скарлетт Йоханссон, а принадлежит другой профессиональной актрисе, использующей свой собственный естественный голос», — заявил сегодня утром представитель OpenAI.

По утверждению OpenAI, подбор голосов проводился в течение пяти месяцев с участием профессиональных актёров озвучения, кастинг-директоров и отраслевых экспертов. Из соображений конфиденциальности имя актрисы, чей голос так похож на голос Йоханссон, компания не раскрывает.

Технический директор OpenAI Мира Мурати опровергла утверждение, что имитация голоса Йоханссон была преднамеренной. Однако, судя по сообщению генерального директора OpenAI Сэма Альтмана (Sam Altman) в социальной сети X из одного слова: «Она», похоже, что он был в курсе ситуации. Альтман ранее говорил, что одним из его любимых фильмов является «Она», в котором Скарлетт Йоханссон озвучивает виртуальную помощницу.

 Источник изображения: Warner Bros

Источник изображения: Warner Bros

Существует вероятность, что для Sky сознательно подбирался голос озвучения, максимально схожий с голосом Скарлетт Йоханссон. Сама актриса сложившуюся ситуация не комментирует. Перспектива судебных разбирательств представляется весьма туманной — OpenAI достаточно будет предоставить суду персональные данные актрисы, озвучившей Sky.

Новые возможности голосового помощника ChatGPT будут запущены «в ближайшие недели» в качестве ограниченной альфа-версии для подписчиков ChatGPT Plus. OpenAI планирует со временем ввести дополнительные голоса, чтобы «лучше соответствовать разнообразным интересам и предпочтениям пользователей».

Apple обновит Siri: виртуальный помощник устарел и отстаёт от конкурентов

Компания Apple осознала, что её виртуальный помощник Siri безнадёжно отстаёт от конкурентов, в частности от ChatGPT, разработанного OpenAI. Это привело к масштабной реорганизации внутри компании и срочным усилиям по модернизации Siri с использованием новейших технологий ИИ. Apple сосредоточится на улучшении существующей функциональности Siri, а не на создании нового чат-бота.

 Изображение: Kandinsky

Изображение: Kandinsky

В начале прошлого года топ-менеджеры Apple по программному обеспечению пришли к выводу, что виртуальный помощник Siri нуждается в переменах. Siri слишком часто неправильно понимает вопросы и не может вести диалоги. Поводом для этого стало тестирование нового чат-бота ChatGPT компании OpenAI. Использование передовых технологий генеративного искусственного интеллекта, способного создавать стихи, код и вести диалог с пользователями, заставило Siri выглядеть устаревшей.

Осознав отставание Siri, руководство Apple во главе с Тимом Куком (Tim Cook) решило сделать модернизацию виртуального помощника приоритетным проектом компании и догнать конкурентов в сфере AI любой ценой. Apple уже работает над тем, чтобы виртуальный помощник смог вести диалог по принципу чат-ботов, а не просто отвечать на отдельные запросы. Сможет ли Siri сочинять стихи и писать код, пока не известно. В любом случае, все подробности станут известны на ежегодной конференции Apple для разработчиков 10 июня.

Стоит отметить, что модернизация Siri — это лишь часть более масштабных планов Apple по интеграции технологий генеративного ИИ в свои продукты и сервисы. В частности, компания планирует увеличить объём памяти в новых моделях iPhone, чтобы поддерживать расширенные возможности Siri. Кроме того, обсуждается приобретение лицензий на использование передовых моделей ИИ таких компаний как Google, Cohere и OpenAI.

Как сообщает The New York Times, топ-менеджмент Apple обеспокоен тем, что новые технологии ИИ могут подорвать доминирующие позиции компании на рынке смартфонов. В частности, есть опасения, что генеративный ИИ может со временем стать альтернативной мобильной операционной системой, вытеснив полностью iOS. Кроме того, ИИ открывает путь для создания экосистемы «интеллектуальных агентов», способных заменить множество приложений из AppStore.

Чтобы не допустить такого развития событий, Apple решила сконцентрироваться на усилении собственных позиций в сфере ИИ. В частности, не так давно компания отменила проект по созданию беспилотных автомобилей стоимостью 10 млрд долларов и вместо этого сотни инженеров были переведены на разработку в области ИИ.

Хотя Apple не планирует создавать аналог ChatGPT, основные усилия сосредоточены на расширении возможностей Siri как помощника для решения повседневных задач. Помимо улучшенного диалога, обновленная Siri сможет точнее устанавливать таймеры, планировать встречи, составлять списки покупок и резюмировать тексты. При этом в Apple подчёркивают, что новая Siri будет более приватной, чем конкурирующие ИИ, так как обработка запросов будет производиться непосредственно на iPhone, а не на удалённых серверах.


window-new
Soft
Hard
Тренды 🔥
Открытый бета-тест Battlefield 6 стал крупнейшим в серии — шутер вошёл в топ-20 самых популярных игр Steam 10 ч.
Поумневшая Siri появится только к весне 2026 года — вместе с углубленной интеграцией сторонних приложений 15 ч.
Хакеры заполонили Facebook замаскированными в SVG-изображениях вирусами 16 ч.
ИИ в Firefox загружает CPU до предела и быстро разряжает ноутбуки, пожаловались пользователи 20 ч.
Новая статья: Of Ash and Steel — от фанатов для фанатов. Предварительный обзор 10-08 00:10
Google выпустит «Булочку с корицей» — такое имя получила Android 17 09-08 21:12
Учёные создали редактор для визуализации «физически невозможных» объектов 09-08 19:25
Google отрицает падение посещаемости сайтов из-за ИИ: трафик стабилен, но распределяется иначе 09-08 15:23
В WinRAR 7.13 исправили уязвимость, через которую хакеры незаметно заражали компьютеры 09-08 15:09
Модель o3 от OpenAI разгромила Grok Илона Маска в шахматном турнире 09-08 15:06