Сегодня 20 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → bixby

Samsung прокачает голосового помощника Bixby генеративным ИИ

Samsung планирует внедрить технологии генеративного искусственного интеллекта (ИИ) в голосовой помощник Bixby, что позволит повысить привлекательность устройств разработчика для пользователей, сообщил CNBC со ссылкой на топ-менеджера компании. Умный ассистент Bixby используется на всех устройствах Samsung — от смартфонов и умных часов до бытовой техники.

Ранее стало известно о планах компании оснастить нейронными процессорами (NPU) все новые продукты в категории бытовой техники, включая телевизоры, посудомоечные машины, духовки, холодильники и кондиционеры.

Вон Чжун Чой (Won-Joon Choi), исполнительный вице-президент мобильного бизнеса Samsung, ранее заявил ресурсу CNBC, что «Bixby стал ключевым голосовым помощником Samsung не только для мобильных устройств, но также для телевизоров и цифровых устройств, которые имеются в экосистеме компании».

Топ-менеджер отметил, что с появлением технологий генеративного ИИ и больших языковых моделей (LLM) компании необходимо пересмотреть роль Bixby, чтобы он мог быть оснащён генеративным ИИ и стал «более умным в будущем». «Это позволит вести более естественный диалог и разработать интерфейс, поддерживающий продукты Samsung в нашей экосистеме», — подчеркнул Вон Чжун Чой.

Чой сообщил, что в настоящее время Samsung усиленно работает над внедрением генеративного ИИ в Bixby, однако сроки анонса версии голосового помощника с расширенной функциональностью называть не стал.

Как и многие производители смартфонов, Samsung стремится оснастить выпускаемые устройства более продвинутыми функциями ИИ. Недавно компания добавила ранее эксклюзивные для серии Galaxy S24 функции ИИ Galaxy AI в некоторые старые модели, включая серии смартфонов Galaxy S23, S23 FE, Galaxy Z Flip 5, Z Fold 5 и планшет Tab S9.

Находка для интроверта: Samsung научит свои смартфоны клонировать голос пользователя для ответов на звонки

В смартфонах Samsung есть функция Bixby Text Call, которая позволяет отвечать на голосовые вызовы, не произнося ни звука. Идея в том, что при невозможности или нежелании ответить вслух, пользователь сможет напечатать ответ, и он будет озвучен звонящему. Ранее ею могли пользоваться корейские пользователи, а теперь она стала доступна и на английском языке. Кроме того, планируется научить смартфоны озучивать сообщения голосом пользователя.

 Источник изображения: Bloomberg

Источник изображения: Bloomberg

В настоящее время озвучка текста голосом пользователя доступна только на корейском языке в приложении Bixby Custom Voice Creator для небольшого количества смартфонов Samsung — только новых флагманов Galaxy S23, S23+ и S23 Ultra. Качество голоса может быть ужасным, а время отклика слишком велико, чтобы эта функция оказалась реально полезной. Но само по себе клонирование голосов для ответа на вызовы вполне по плечу современным технологиям, поскольку инструменты искусственного интеллекта способны создавать реалистичные копии голосов всего за несколько минут аудиозаписи.

Сам по себе ответ на аудиозвонки через текстовый интерфейс встроенным синтезированным голосом уже не новинка. На устройствах Samsung эта функция известна как Bixby Text Call, она была представлена ​​в оболочке One UI 5 для Android. Google предлагает аналогичную услугу под названием Call Screen, которая позволяет вам отвечать на потенциальные спам-вызовы с помощью автоматизированного голоса. Но служба Google позволяет вам выбирать только из списка общих ответов, а не вводить собственные ответы.

Нетрудно представить, что в ближайшем будущем эти функции станут более сложными и автоматизированными. В конце концов, достаточно будет подключить свой голосовой клон, преобразующий текст в речь, к чат-боту на базе ИИ. Сама Samsung обещает, что в будущем сгенерированные пользователями голоса будут «совместимы с другими приложениями Samsung, помимо телефонных звонков», хотя неясно, что это значит.

Технологические компании давно обещают, что помощники на базе ИИ смогут выполнять разного рода администрирование от имени пользователя, и создание голосового клона самого себя и постановка ему задач через чат-бота может фактически воплотить эту идею в жизнь.

Это также может создать всевозможные проблемы. Google уже пыталась внедрять аналогичную функциональность в 2018 году c помощью своей технологии Duplex AI, как способ автоматического бронирования столиков в ресторанах с помощью голоса ИИ. Но реакция на эту технологию была неоднозначной: многие критиковали её как неэтичную и отмечали, что она создаёт больше работы для людей, принимающих звонки. В конце концов, компания закрыла Duplex AI в конце 2022 года.

Существуют также злонамеренные варианты использования голосовых клонов ИИ, от разжигания ненависти и преследований ИИ до простого мошенничества. Весьма вероятно, что в ближайшем будущем окажется практически невозможно определить, действительно ли это человек на другом конце провода.


window-new
Soft
Hard
Тренды 🔥
Schneider Electric ведёт переговоры о покупке Bentley Systems 7 ч.
Новая статья: Atom Bomb Baby: рассказываем, почему Fallout — идеальная экранизация видеоигрового материала, и почему этот сериал не стоит пропускать 8 ч.
Bethesda готовит «несколько очень хороших обновлений» для Starfield, а Fallout 5 не в приоритете 9 ч.
Apple откроет сторонним приложениям доступ к NFC 9 ч.
В Dota 2 стартовало сюжетное событие «Павшая корона» с уникальными наградами, новыми «арканами» и комиксом 10 ч.
Связанные одной шиной: «Лаб СП» и «Фактор-ТС» представили отечественную интеграционную платформу Integration Gears 10 ч.
Paradox отказала Prison Architect 2 в досрочном освобождении — релиз отложили ещё на четыре месяца 12 ч.
Спустя 17 лет после релиза Team Fortress 2 получила поддержку 64 бит — выросла производительность и даже боты пропали 13 ч.
Netflix резко нарастила аудиторию и прибыль, запретив совместное использование аккаунтов 14 ч.
Российские студенты победили в чемпионате мира по программированию ICPC 14 ч.
«Народный» электрический кроссовер Kia EV2 за $14 500 мелькнул на видео 27 мин.
Власти Китая упростили условия привлечения иностранных инвестиций в национальный технологический сектор 60 мин.
Гиперщит с ИИ: Cisco представила систему безопасности Hypershield 9 ч.
Highpoint представила карту расширения на восемь SSD: до 64 Тбайт со скоростью до 56 Гбайт/с 9 ч.
Китайские экспериментальные лунные навигационные спутники прислали фотографии обратной стороны Луны 10 ч.
Налоговая служба Швеции закрыла 18 дата-центров за незаконный майнинг криптовалют 11 ч.
LG выпустила флагманский саундбар S95TR за $1500 с поддержкой Dolby Atmos и настройкой с помощью ИИ 13 ч.
Seagate заявила, что жёсткие диски с HAMR уже не уступают по надёжности традиционным HDD 13 ч.
Corsair представила обновлённые доступные проводные гарнитуры HS35 v2 для геймеров 14 ч.
Tesla отзовёт все проданные электромобили Cybertruck для замены залипающей педали газа 15 ч.