Сегодня 23 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → нейросети

Созданный с помощью ИИ виртуальный аватар обошёл защиту банка и ввёл в заблуждение родственников

Обозреватель The Wall Street Journal Джоанна Стерн (Joanna Stern) попыталась выяснить, насколько натуральным может получиться цифровой аватар человека, созданный с помощью передовых алгоритмов на базе генеративного ИИ. Результат эксперимента оказался пугающим, поскольку Джоанне удалось получить собственный цифровой клон, который смог ввести в заблуждение её родственников и обмануть систему голосовой идентификации банка.

 Источник изображения: The Wall Street Journal

Источник изображения: The Wall Street Journal

Для создания виртуального аватара Джоанна использовала инструмент Synthesia, который позиционируется разработчиками как сервис создания видеоаватаров на основе видео- и аудиозаписей реальных людей. После создания аватара пользователь может вводить любой текст, который виртуальный клон послушно повторяет. Исходным материалом для обучения алгоритма стали 30 минут видео и около двух часов аудиозаписей голоса Джоанны.

Стартап Synthesia берёт $1000 в год за создание и поддержку виртуального аватара, а также взимает с пользователей дополнительную ежемесячную плату. Через несколько недель цифровой клон журналиста был готов, после чего начались его испытания. Джоанна сгенерировала с помощью ChatGPT текст для TikTok-ролика про iOS и загрузила его в Synthesia, после чего аватар создал готовый видеоролик. У неё сложилось впечатление, что она смотрит в зеркало и видит своё отражение.

Однако на данном этапе технология не совсем идеальна. Если при воспроизведении коротких предложений аватар выглядит достаточно убедительным, то более длинные фразы дают понять, что их произносит не человек. Несмотря на то, что в TikTok далеко не все пользователи отличаются внимательностью, некоторые из подписчиков обратили внимание на то, что созданное с использованием виртуального аватара видео выглядит неестественно.

Аналогичная проблема обнаружилась при попытке использовать цифровой аватар во время видеозвонков в Google Meet. К некачественному воспроизведению длинных предложений добавилась то, что аватар всё время держит идеальную осанку и практически не движется. Несмотря на это, очевидно, что в скором времени видеоаватар станет более совершенным, поскольку в разработке Synthesia уже есть несколько бета-версий, способных кивать головой, поднимать и опускать брови, а также выполнять некоторые другие свойственные человеку движения.

 Источник изображения: Joanna Stern / The Wall Street Journal

Источник изображения: Joanna Stern / The Wall Street Journal

После проверки возможностей видеоаватара Джоанна решила испытать голосовой клон, созданный с помощью генеративного ИИ-алгоритма ElevenLabs. Потребовалось загрузить в сервис около 90 минут записей голоса, и менее чем через две минуты голосовой клон был готов. Аудиоаватар может воспроизводить любой текст голосом пользователя. За создание голосового клона ElevenLabs берёт от $5 в месяц.

По сравнению с видеоаватром от Synthesia, аудиоклон более похож на реального человека. Он добавляет в речь интонации, а само воспроизведение текста происходит более плавно. Сначала Джоанна позвонила сестре и использовала в беседе с ней голосовой клон. Отмечается, что сестра не сразу заметила подвох, но через некоторое время обратила внимание на то, что в процессе беседы голосовой клон не делает пауз, чтобы перевести дух. После этого был звонок отцу с просьбой напомнить номер социального страхования. Он сумел заметить подвох, поскольку голос Джоанны звучал как бы в записи. Несмотря на это, родственники журналиста не сразу заметили, что с ними общается не живой человек, хотя долго обманывать их не удалось.

Ещё один звонок был совершён в службу поддержки Chase Bank. Предварительно алгоритму были заданы несколько вопросов, на которые предстояло ответить в процессе голосовой идентификации банка. После непродолжительного общения Джоанну соединили с представителем банка, поскольку система идентификации голоса не обнаружила каких-либо проблем. Позднее представитель Chase сообщил, что банк использует голосовую идентификацию вместе с другими инструмента подтверждения личности клиентов, отметив, что идентификация по голосу позволяет перейти к общению с сотрудником поддержки, но с её помощью нельзя провести транзакцию или выполнить иную операцию.

Голос, который генерирует сервис ElevenLabs, оказался максимально похож на голос Джоанны. Он учитывал интонации и другие особенности речи. Любопытно, что для создания такого голосового клона достаточно загрузить в сервис несколько аудиозаписей и согласиться с правилами платформы, в которых говорится, что пользователь обязуется не использовать алгоритм в мошеннических целях. Это означает, что любой желающий может запросто сгенерировать голос кого-то из своих знакомых или знаменитостей.

Представитель ElevenLabs рассказал, что компания разрешает клонировать голос только владельцам платных аккаунтов. В случае нарушения политики платформы аккаунт пользователя будет заблокирован. Кроме того, разработчики планируют выпустить сервис, который позволит загружать в него любое аудио для проверки, использовался ли при его создании алгоритм ElevenLabs. Отмечается, что разработчики могут идентифицировать весь генерируемый пользователями контент для его фильтрации или применения иных мер к нарушителям, включая сотрудничество с правоохранительными органами.

Джоанна отметила, что каждый из используемых ей алгоритмов пока не в состоянии сделать копию, которую невозможно отличить от оригинала. ChatGPT генерировал текст, не опираясь на знания и опыт журналиста. Сервис Synthesia создал аватар, который хоть и выглядит похожим на человека, но не способен передать все характерные особенности пользователя. Наконец, система ElevenLabs генерирует очень похожую речь, но и она не идеальна. В дальнейшем ИИ-технологии продолжат развиваться и, вероятно, в будущем отличить виртуальный аватар от живого человека в процессе общения будет только сложнее.

Великобритания потратит £100 млн на создание суверенного ИИ

Премьер-министра Великобритании Риши Сунак (Rishi Sunak) и министр по науке и технологиям Мишель Донелан (Michelle Donelan) анонсировали выделение £100 млн (около $124 млн) на создание рабочей группы, которая начнёт разработку «суверенного» искусственного интеллекта. Предполагается, что этот алгоритм сделает страну «конкурентоспособной на глобальном уровне», а участники рабочей группы помогут сделать ИИ-системы более безопасными и надёжными.

 Источник изображения: Placidplace/pixabay.com

Источник изображения: Placidplace/pixabay.com

Группа по разработке искусственного интеллекта будет отчитываться непосредственно перед премьер-министром и министром по науке и технологиям, а её председателя назначат летом этого года. Объявленное финансирование выделяется наряду с £900 млн, которые предусмотрены бюджетом Великобритании и предназначены для создания суперкомпьютера, проведения исследований в сфере искусственного интеллекта и др.

Британские власти ожидают, что этот проект позволит создать «суверенный ИИ-алгоритм», который поможет стимулировать экономику страны, избегая этических и технологических проблем. Существующие в настоящее время ИИ-алгоритмы не всегда предоставляют достоверную информацию и могут вести себя непредсказуемо. Британские власти хотят создать заслуживающий доверия алгоритм, который может оказаться полезным в разных сферах, включая разработку новых медицинских препаратов, борьбу с климатическими изменениями и др.

Форум Stack Overflow сделает платным доступ к своим данным для тренировки нейросетей

Разработка ИИ-алгоритмов вроде ChatGPT и DALL-E стоит сотни миллионов долларов, и скоро она станет ещё дороже. Это связано с тем, что всё больше платформ, являющихся источником данных для обучения больших языковых моделей (LLM), планируют запретить бесплатное использование своего контента для тренировки нейросетей. Ранее о таком решении объявило сообщество Reddit, а теперь аналогичным образом поступил форму для разработчиков Stack Overflow.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Согласно имеющимся данным, Stack Overflow планирует начать взимать плату с разработчиков ИИ-алгоритмов в середине этого года. Взамен платформа готова предложить доступ к более чем 50 млн вопросов и ответов на них. Эти планы подтвердил генеральный директор Stack Overflow Прашант Чандрасекар (Prashanth Chandrasekar). В настоящее время на площадке зарегистрировано более 20 млн пользователей.

«Платформы сообществ, которые подпитывают развитие LLM, абсолютно точно должны получать компенсацию за свой вклад, чтобы такие компании как наша могли реинвестировать обратно в сообщества для поддержания их процветания. Мы поддерживаем подход Reddit к этому вопросу», — заявил Чандрасекар.

Как и в случае с Reddit, представители Stack Overflow ещё не озвучили размер платы, которая будет взиматься с разработчиков ИИ-алгоритмов. Stack Overflow продолжает изучать стратегию Reddit и проводит консультации с потенциальными клиентами. Обе компании ведут обсуждение финансовых вопросов и обещают поделиться информацией с общественностью в ближайшие несколько недель.

«Жидкие» нейросети помогут дронам ориентироваться на незнакомой местности

Исследователи Массачусетского технологического института (МТИ) предложили эффективный, по их словам, способ помочь дронам перемещаться по незнакомой местности — так называемые «жидкие» нейросети.

 Источник изображения: youtube.com/@MITCSAIL

Источник изображения: youtube.com/@MITCSAIL

Инженеры МТИ начали строить «жидкие» нейросети в 2021 году — так учёные назвали алгоритмы искусственного интеллекта, способные самостоятельно изменять свои параметры прямо в процессе работы. Такие нейросети адаптируются к новым данным в реальном мире, а не только на этапе обучения — иными словами, они обучаются «на лету».

Способность самостоятельно расставлять приоритеты в поступающей информации и игнорировать некритичные особенности местности может иметь решающее значение для работы дронов, отмечают исследователи. При решении навигационных задач «жидкие» нейросети оказались эффективнее всех остальных подходов: они принимали адекватные решения на незнакомой местности любого типа: лес, город, а также искусственная среда с дополнительными помехами и нестабильной обстановкой.

Первичное обучение адаптивного алгоритма было построено на наборе данных, полученных от пилота — человека. Благодаря этому система научилась учитывать его способность применять свои навигационные навыки на незнакомой местности, когда в условиях среды и её ландшафте происходят значительные изменения. «Жидкие» нейросети, в частности, помогают дронам отслеживать движущиеся цели. А дальнейшее их обучение может быть построено на данных от новых экспертных источников — это повысит надёжность и эффективность дронов в работе.

Китай будет проверять безопасность всех сервисов на генеративных нейросетях

Китай планирует проверять безопасность всех сервисов на базе генеративных нейросетей до того, как им будет разрешено работать в стране. Это вызывает некоторую обеспокоенность относительно дальнейшей судьбы чат-ботов, подобных ChatGPT от Open AI, разработанных местными IT-гигантами, такими как Baidu.

 Источник изображения: Placidplace/pixabay.com

Источник изображения: Placidplace/pixabay.com

Поставщики услуг должны гарантировать, что ИИ-алгоритмы предоставляют достоверную информацию и соблюдают авторские права, а также не ставят под угрозу безопасность пользователей. Разработчики ИИ-алгоритмов также должны чётко маркировать генерируемый нейросетью контент. Об этом сказано в проекте Администрации киберпространства Китая, который был представлен широкой публике для получения отзывов от общественности.

Требования Администрации киберпространства Китая являются частью более масштабных усилий властей по регулированию рынка генеративных нейросетей, который начал расти взрывными темпами после запуска алгоритма ChatGPT в ноябре прошлого года. Китайские IT-компании, такие как Alibaba, SenseTime и Baidu, стремятся создать надёжную платформу на основе нейросетей для крупнейшего в мире интернет-рынка.

На фоне заявления регулятора курс акций Alibaba значительно снизился, тогда как ценные бумаги SenseTime почти не потеряли в цене. Ранее на этой неделе SenseTime анонсировала собственный ИИ-бот SenseChat, который позиционируется как конкурент ChatGPT. Baidu запустила тестирование своего чат-бота Ernie около месяца назад. В настоящее время Baidu считается лидером на китайском рынке генеративных нейросетей.

Спрос на специалистов по ChatGPT вырос в России в 13 раз за месяц

По данным сервиса hh.ru, количество вакансий, где необходим навык работы с нейросетями, в период с августа 2022 года по февраль 2023 года увеличилось с 312 до 506 единиц. Наибольший рост показывают вакансии с упоминанием ChatGPT — в 13 раз за прошлый месяц (с 3 до 38 объявлений).

 Источник изображения: Kevin Ku/unsplash.com

Источник изображения: Kevin Ku/unsplash.com

В сообщении сказано, что чаще всего работодатели ищут сотрудников, которые умеют работать с приложением Colorize, которое позволяет раскрашивать чёрно-белые фотографии, а также алгоритмами DALL-E 2, Midjourney и Stable Diffusion, способными генерировать изображения по текстовому описанию. Согласно имеющимся данным, сотрудники с навыком работы в Colorize чаще всего требуются онлайн-ретейлерам, а умение работы с ChatGPT интересует IT-компании и представителей финансового сектора. В качестве специальностей обычно указываются программисты, пиарщики, интернет-маркетологи и аналитики.

По данным hh.ru, основная часть вакансий, в описании которых упоминаются нейросети, приходится на IT и финансовый сектор (45 % и 14 % соответственно). Далее следует электроника (6 %), услуги для бизнеса (5 %) и металлургия (5 %). Реже всего специалистами с навыками работы с нейросетями интересуются представители госсектора, строительных компаний, логистических предприятий, организации из сферы здравоохранения и машиностроения.

Источник отмечает, что ChatGPT официально не работает в России и Белоруссии из-за того, что разработчик алгоритма Open AI является американской компанией. На фоне этого в Рунете стали появляться сайты мошенников, на которых пользователям предлагается помощь в получении доступа к аккаунтам для работы с чат-ботом. Отмечается, что в период с декабря 2022 года по февраль 2023 года количество таких сайтов выросло с 3 до 41.


window-new
Soft
Hard
Тренды 🔥
Новая статья: Keep Driving — великолепная игра, сотканная из странных идей. Рецензия 10 ч.
Количество слияний и поглощений в российском IT-секторе в 2024 году выросло на треть 10 ч.
В рекордной краже криптовалюты у ByBit обвинили северокорейских хакеров 20 ч.
«Нам просто нужно больше мощностей»: OpenAI постепенно поборет зависимость от Microsoft 20 ч.
Трамповская криптооттепель: Coinbase удалось малой кровью отделаться от иска Комиссии по ценным бумагам США 20 ч.
Apple выпустила первую бету iOS 18.4, в которой появились «приоритетные уведомления» 22 ч.
Новая статья: Kingdom Come: Deliverance II — ролевое вознесение. Рецензия 22-02 00:03
Apple отключила сквозное шифрование в iCloud по требованию властей Великобритании 21-02 23:43
Взрывной платформер Shotgun Cop Man от создателя My Friend Pedro предложит спуститься в ад и арестовать Дьявола — трейлер и демоверсия в Steam 21-02 22:01
Valve заблокировала игру в российском Steam по требованию Роскомнадзора 21-02 20:20
Глава Apple пообещал Трампу вложить сотни миллионов долларов в развитие производства на территории США 2 ч.
Lenovo сообщила о двузначном росте выручки за III финансовый квартал по всем подразделениям — ISG снова в плюсе благодаря ИИ 11 ч.
В облаке Google Cloud появились инстансы A4X на базе суперускорителей NVIDIA GB200 NVL72 11 ч.
STMicroelectronics представила фотонный чип для 1,6-Тбит/с сетей 11 ч.
Несмотря на риск землетрясений, геотермальную энергию ждёт светлое будущее, считают учёные 12 ч.
Размышляющий ИИ DeepSeek R1 встроят в смартфоны Infinix Note 50 15 ч.
Huawei захватила больше половины рынка складных смартфонов в Китае — на втором месте Honor 17 ч.
В Asus разогнали GeForce RTX 5090 до 3,5 ГГц и установили несколько рекордов 18 ч.
Норвежцы представили человекоподобного робота для дома и семьи — он мягкий и обтекаемый 19 ч.
Дженсен Хуанг снял с DeepSeek обвинения в обвале акций Nvidia — это инвесторы всё не так поняли 21 ч.