Сегодня 22 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → голосовые ассистенты

Сервис простой интеграции голосового ИИ для малого и среднего бизнеса появился в России

Группа компаний Fromtech (в которую входят ООО «ФРОМТЕК» и ООО «СМАРТДИАЛОГС») анонсировала запуск инструмента для быстрой и эффективной интеграции голосовых ассистентов для компаний малого и среднего бизнеса. Платформа SmartDialogs, построенная на базе технологий и экспертизы Fromtech, помогает автоматизировать взаимодействие с клиентами, упрощая коммуникации и снижая затраты. Оператором платформы выступает дочерняя компания SmartDialogs.

 Источник изображения: Fromtech

Источник изображения: Fromtech

SmartDialogs позволяет быстро интегрировать голосового ассистента в бизнес любой отрасли и масштаба — от индивидуальных предпринимателей до микропредприятий. Платформа предлагает готовые шаблоны голосовых роботов, уже проверенные крупнейшими компаниями России в различных отраслях (телеком, банки, ритейл, медицина) —действующими клиентами Fromtech.

«Основная миссия SmartDialogs — это быстрая и качественная доставка высоких технологий для небольших и средних предприятий. За более чем 5 лет во Fromtech мы накопили значительную экспертизу в интеграции ИИ в различные сферы отечественного Enterprise. Однако мы видим колоссальную потребность в этих технологиях и у представителей сегмента МСП и просто не можем не поделиться нашим опытом, предлагая доступные и эффективные решения для оптимизации клиентского сервиса и снижения операционных затрат. Именно поэтому мы создали SmartDialogs — платформу, ориентированную на конечных пользователей, которым нужно быстрое и удобное решение для интеграции голосового ИИ без дополнительных затрат на разработчиков. Интерфейс платформы понятен и не перегружен лишними деталями, что позволяет даже неподготовленным пользователям легко настроить бота и разобраться в структуре ценообразования», — рассказал технический директор Fromtech Александр Цепелев.

SmartDialogs предлагает максимально упрощённый процесс создания робота – несколько понятных шагов.

  1. Выбор шаблона. Пользователь выбирает подходящий шаблон для своего сценария взаимодействия.
  2. Настройка переменных. Вводится информация, которая индивидуализирует выбранного бота под конкретного пользователя и его потребности.
  3. Выбор голоса. Пользователь может выбрать синтезированный голос или заказать озвучку диктором.
  4. Проведение тестового звонка. Пользователь может протестировать робота, совершив тестовый звонок на свой номер.
  5. Запуск бота. После всех настроек робот готов к приему или совершению звонков.

Платформа предлагает несколько тарифных планов, включая базовую минимальную подписку, которая позволяет одновременно использовать один шаблон робота. Расширенные тарифные планы включают приоритетную техническую поддержку и неограниченное количество создаваемых роботов. Также доступна возможность озвучки робота голосом диктора.

«В ближайших планах — адаптировать больше проектов для использования на платформе и добавить новые сценарии. Этим займутся проектные команды компании, а пользователи смогут оставлять запросы на разработку новых шаблонов, которые будут добавляться в маркетплейс решений. В ближайших релизах также планируется внедрение ассистентов на базе технологий генеративного искусственного интеллекта, позволяющих создавать голосовых роботов без использования шаблонов. Достаточно будет описать задачу, и большие языковые модели (LLM) вместе с другими модулями самостоятельно создадут нужного бота. Этот функционал уже готов на 80% и скоро станет доступен первым пользователям», — поделился технический директор Fromtech Александр Цепелев.

Умная электроника отправляет личные разговоры пользователей рекламщикам — признались сами маркетологи

На сайте маркетинговой компании Cox Media Group (CMG) некоторое время назад был размещён баннер с однозначным и тревожным заявлением: «Это правда. Ваши устройства Вас слушают». Этим заявлением CMG спровоцировала панику, намекнув, что у неё есть доступ к частным разговорам людей, собираемым их телефонами, телевизорами и другой личной электроникой. Маркетинговая компания заявила, что использует эти личные разговоры для таргетинга рекламы своих клиентов.

 Источник изображений: unsplash.com

Источник изображений: unsplash.com

Наверное, каждый пользователь интернета на себе испытал или хотя бы слышал от других: стоит только сказать вслух о желании приобрести кожаную куртку «как у Дженсена», как реклама таких кожаных курток начинает транслироваться из каждого утюга. Производители электроники с микрофонами порой признаются в продаже голосовых данных третьим лицам (рекламодателям), но обычно речь идёт о данных, накопленных после того, как пользователь разрешил устройству начать его прослушивать и согласился на сбор данных.

CMG ещё 28 ноября рассказала о технологии Active Listening («Активное прослушивание»), которая использует ИИ для «обнаружения соответствующих разговоров через смартфоны, смарт-телевизоры и другие устройства». По утверждению компании, она знает, «когда и на что настраиваться». CMG готова удовлетворить желание рекламодателей услышать каждый шёпот, который мог бы помочь им таргетировать рекламу: «Это мир, где ни один шум перед покупкой не останется без анализа, а слухи потребителей становятся для вас инструментом таргетинга, переориентации и завоевания местного рынка».

CMG не предоставила подробных и точных разъяснений своей технологии, сейчас информация об Active Listening пропала с сайта, а архивная версия даёт весьма расплывчатое представление о том, как эта функция якобы работает. CMG загружала на свою платформу данные, создавая «персонажи покупателей». Затем каждому персонажу ставились в соответствие ключевые слова, интересующие клиента CMG.

Процесс отслеживания описывался так: «Активное прослушивание начинается и анализируется с помощью искусственного интеллекта для обнаружения соответствующих разговоров через смартфоны, смарт-телевизоры и другие устройства». Далее обсуждался анализ данных при помощи ИИ и создание «зашифрованного вечнозелёного списка аудитории», используемого для таргетирования рекламы на различных платформах, включая потоковое телевидение и аудио, медийную рекламу, платные социальные сети, YouTube, Google и Bing.

 Источник изображения: CMG

Источник изображения: CMG

В ноябрьском сообщении в блоге CMG указывалось на неназванного технологического партнёра, который может «агрегировать и анализировать голосовые данные во время разговоров перед покупкой», а также на «растущие возможности доступа к данным микрофона на устройствах». Но компания никогда не объясняла, как получила вычислительные и сетевые ресурсы, необходимые для записи и отправки каждого разговора в радиусе действия устройства. Также неясно, как CMG могла получить доступ, требующий наличия ордера от правоохранительных органов.

Компания ссылалась на многостраничное соглашение об условиях использования устройств, которые обычно никто не читает, где мелким шрифтом якобы описывалась возможность использования технологий, подобных Active Listening. Ещё больше путаницы добавило утверждение CMG о сотрудничестве с Facebook, Microsoft, Google и Amazon, хотя в реальности CMG является просто участником рекламных партнёрских программ этих компаний.

Теперь CMG уверяет, что она «не прослушивает какие-либо разговоры и не имеет доступа к чему-либо, кроме стороннего агрегированного, анонимного и полностью зашифрованного набора данных, который может быть использован для размещения рекламы и сожалеет о любой путанице». Рекламные инструменты компании включают «продукты сторонних поставщиков, основанные на наборах данных, полученных от пользователей различными социальными сетями и другими приложениями, которые затем упаковываются и перепродаются поставщикам услуг данных».

Компания утверждает, что рекламные данные, основанные на голосовых и других данных, собираются этими платформами и устройствами в соответствии с условиями, предусмотренными этими приложениями и принятыми их пользователями, а затем могут быть проданы сторонним компаниям и преобразованы в анонимную информацию для рекламодателей. Эти обезличенные данные затем перепродаются многочисленными рекламными компаниями.

Как бы жутко ни звучали заявления CMG, некоторые из них не являются надуманными. Голосовые помощники дали электронике повод держать микрофоны включёнными круглосуточно. Крупные технологические компании оказываются перед выбором: максимально удовлетворить ожидания клиентов или в первую очередь обеспечивать конфиденциальность пользователей. За прошедшие годы это привело к множеству судебных разбирательств, в том числе громких процессов, которые продолжаются годами и во многом определяют будущее конфиденциальности потребителей.

Начиная с 2019 года против Google регулярно подаётся иск, обвиняющий Google Assistant в использовании данных после неверно воспринятой команды на активацию голосового управления (например, «Эй, пудель!» вместо «Эй, Google»). В июле 2021 года, добиваясь прекращения дела, Google заявила, что «никогда не обещала, что Google Assistant будет активироваться только тогда, когда истцы захотят этого». Google также отметила, что не сохраняет аудиозаписи. В 2022 году в очередном иске против Google утверждалось, что компания собирает данные распознавания голоса и лица без согласия пользователя. Google утверждает, что это «является неверной характеристикой её продуктов».

Другим примером является борьба Apple с обвинениями в записи разговоров пользователей без запроса с их стороны к Siri. Apple утверждает, что Siri не слушает пользователей, если она не активирована, а компания «активно работает над улучшением Siri, чтобы предотвратить непреднамеренные срабатывания и предоставлять визуальные и звуковые сигналы… чтобы пользователи знали, когда Siri срабатывает».

На фоне судебных разбирательств и заверений от компаний о защите конфиденциальности клиентов, маркетологи и рекламодатели продолжают попытки вторжения в личные устройства с целью монетизации полученных персональных данных. И, хотя возможности CMG оказались преувеличенными, сам факт её заявлений многое говорит о неясном состоянии конфиденциальности и доверия потребителей, когда дело касается персональных интеллектуальных устройств. Одного этого уже достаточно, чтобы пересмотреть использование интеллектуальных продуктов с микрофоном и освежить понимание пользовательских соглашений и настроек конфиденциальности.

Находка для интроверта: Samsung научит свои смартфоны клонировать голос пользователя для ответов на звонки

В смартфонах Samsung есть функция Bixby Text Call, которая позволяет отвечать на голосовые вызовы, не произнося ни звука. Идея в том, что при невозможности или нежелании ответить вслух, пользователь сможет напечатать ответ, и он будет озвучен звонящему. Ранее ею могли пользоваться корейские пользователи, а теперь она стала доступна и на английском языке. Кроме того, планируется научить смартфоны озучивать сообщения голосом пользователя.

 Источник изображения: Bloomberg

Источник изображения: Bloomberg

В настоящее время озвучка текста голосом пользователя доступна только на корейском языке в приложении Bixby Custom Voice Creator для небольшого количества смартфонов Samsung — только новых флагманов Galaxy S23, S23+ и S23 Ultra. Качество голоса может быть ужасным, а время отклика слишком велико, чтобы эта функция оказалась реально полезной. Но само по себе клонирование голосов для ответа на вызовы вполне по плечу современным технологиям, поскольку инструменты искусственного интеллекта способны создавать реалистичные копии голосов всего за несколько минут аудиозаписи.

Сам по себе ответ на аудиозвонки через текстовый интерфейс встроенным синтезированным голосом уже не новинка. На устройствах Samsung эта функция известна как Bixby Text Call, она была представлена ​​в оболочке One UI 5 для Android. Google предлагает аналогичную услугу под названием Call Screen, которая позволяет вам отвечать на потенциальные спам-вызовы с помощью автоматизированного голоса. Но служба Google позволяет вам выбирать только из списка общих ответов, а не вводить собственные ответы.

Нетрудно представить, что в ближайшем будущем эти функции станут более сложными и автоматизированными. В конце концов, достаточно будет подключить свой голосовой клон, преобразующий текст в речь, к чат-боту на базе ИИ. Сама Samsung обещает, что в будущем сгенерированные пользователями голоса будут «совместимы с другими приложениями Samsung, помимо телефонных звонков», хотя неясно, что это значит.

Технологические компании давно обещают, что помощники на базе ИИ смогут выполнять разного рода администрирование от имени пользователя, и создание голосового клона самого себя и постановка ему задач через чат-бота может фактически воплотить эту идею в жизнь.

Это также может создать всевозможные проблемы. Google уже пыталась внедрять аналогичную функциональность в 2018 году c помощью своей технологии Duplex AI, как способ автоматического бронирования столиков в ресторанах с помощью голоса ИИ. Но реакция на эту технологию была неоднозначной: многие критиковали её как неэтичную и отмечали, что она создаёт больше работы для людей, принимающих звонки. В конце концов, компания закрыла Duplex AI в конце 2022 года.

Существуют также злонамеренные варианты использования голосовых клонов ИИ, от разжигания ненависти и преследований ИИ до простого мошенничества. Весьма вероятно, что в ближайшем будущем окажется практически невозможно определить, действительно ли это человек на другом конце провода.


window-new
Soft
Hard
Тренды 🔥
Foxconn немного охладела к покупке Nissan, но вернётся к этой теме, если слияние с Honda не состоится 6 ч.
В следующем году выйдет умная колонка Apple HomePod с 7-дюймовым дисплеем и поддержкой ИИ 6 ч.
Продажи AirPods превысили выручку Nintendo, они могут стать третьим по прибыльности продуктом Apple 7 ч.
Прорывы в науке, сделанные ИИ в 2024 году: археологические находки, разговоры с кашалотами и сворачивание белков 14 ч.
Arm будет добиваться повторного разбирательства нарушений лицензий компанией Qualcomm 19 ч.
Поставки гарнитур VR/MR достигнут почти 10 млн в 2024 году, но Apple Vision Pro занимает лишь 5 % рынка 21 ч.
Первая частная космическая станция появится на два года раньше, но летать на неё будет нельзя 22 ч.
В США выпущены федеральные нормы для автомобилей без руля и педалей 22 ч.
Для невыпущенного суперчипа Tachyum Prodigy выпустили 1600-страничное руководство по оптимизации производительности 23 ч.
Qualcomm выиграла в судебном разбирательстве с Arm — нарушений лицензий не было 21-12 08:39