Сегодня 20 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → имитация

YouTube разрабатывает ИИ-инструмент для создания музыкальных треков с голосами известных вокалистов

Согласно сообщению Bloomberg, YouTube в настоящее время разрабатывает инструмент на базе ИИ, который позволит пользователям имитировать голоса известных музыкантов при записи звука. В настоящее время сервис пытается получить у музыкальных компаний права на обучение своей нейросети на песнях из их музыкальных каталогов. Ни один крупный звукозаписывающий лейбл пока не дал согласия, но источники утверждают, что переговоры между сторонами продолжаются.

 Источник изображения: Pixabay

Источник изображения: Pixabay

В прошлом месяце YouTube представил несколько новых инструментов на базе ИИ для авторов, в том числе созданные с помощью нейросети фоновые изображения и видео. Компания планировала включить в эти объявления и новый инструмент для клонирования голосов известных музыкантов, но не смогла вовремя получить разрешения от правообладателей.

Музыка, сгенерированная ИИ, в настоящее время находится в юридической «серой» зоне из-за трудностей с установлением прав собственности на песни, которые воспроизводят уникальный голос исполнителя, но не используют напрямую защищённых текстов или аудиозаписей. В настоящее время с точки зрения существующего законодательства неясно, является ли обучение генеративного ИИ клонированию голоса на музыкальном каталоге звукозаписывающей компании нарушением авторских прав. Тем не менее, это не подорвало интерес к разработке и обучению «музыкальных» нейросетей — в этом году Meta, Google и Stability AI выпустили ИИ-инструменты для создания музыки.

YouTube позиционирует себя в качестве партнёра, который поможет отрасли двигаться вперёд с помощью технологии генеративного ИИ, которую, по данным Bloomberg, приветствуют музыкальные компании. Хотя Alphabet в течение последнего года активно продвигала свои разработки в области генеративного ИИ, далеко не факт, что ей удастся на законных основаниях предоставить создателям YouTube инструменты клонирования голоса на базе ИИ, не вызвав многочисленных исков о нарушении авторских прав.

В настоящее время неясно, помогут ли дискуссии об ИИ-инструменте клонирования голоса YouTube решить возникающие претензии о нарушении авторских прав от звукозаписывающих компаний на фоне увеличения количества треков, созданных с помощью ИИ и подражающих популярным музыкантам. Широкое внимание к этой проблеме было привлечено в начале года, когда созданная ИИ песня Drake стала вирусной в интернете. В то время как некоторые музыканты, такие как Граймс (Grimes), поддерживают музыку, генерируемую ИИ, многие другие, в том числе Стинг (Sting), Джон Ледженд (John Legend) и Селена Гомес (Selena Gomez), призывают к введению правил, защищающих их голоса от копирования.

ИИ сгенерировал новые песни с голосом популярной певицы, которые стали вирусными в Китае

Сингапурская певица и композитор популярной музыки в стиле Mandopop Стефани Сан (Stefanie Sun) неожиданно обрела вирусную популярность на Bilibili, крупнейшем в Китае видео-хостинге. Внезапное возрождение интереса к Стефани, не выпускавшей альбомов с 2017 года, объясняется отнюдь не её творческим прорывом. В треках, получивших миллионы просмотров на Bilibili, голос Сан клонирован ИИ, что, кроме всего прочего, вызывает вопросы о защите авторских прав.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Mandopop (Mandarin popular music) — жанр китайской популярной музыки. Он популярен в Азии, особенно среди людей, говорящих на стандартном китайском языке, в Китае, Малайзии, Сингапуре, Тайване и Японии. Ностальгируя по золотому веку Mandopop, технически подкованные китайские интернет-пользователи стали имитировать вокал Стефани Сан, используя преобразование голоса певицы при помощи глубокого машинного обучения. Использование ИИ позволяет воспроизводить пение одного человека голосом другого.

Поиск по запросу AI Stefanie Sun выдаёт сотни видео, загруженных на Bilibili за последний месяц. Самые популярные ролики набрали более миллиона просмотров. Индекс WeChat, отслеживающий ключевые слова в социальной и контент-экосистеме приложения, показывает, что 5 мая показатель тренда запроса взлетел до 50 000 с нуля всего двумя днями ранее. После появления дипфейков Сан на Bilibili, подобные ролики также были размещены на других крупных социальных платформах, включая Douyin, китайскую версию TikTok.

 Источник изображения: TechCrunch

Источник изображения: TechCrunch

Дипфейковое пение очаровало публику и на Западе. В конце апреля созданная искусственным интеллектом песня с голосами The Weekend и Drake взорвала Spotify и TikTok. Певица Grimes произвела фурор, написав в Twitter, что поделится 50 % гонорара за любую успешную песню, созданную искусственным интеллектом, с использованием её голоса.

Как и на Западе, действующий закон об авторском праве в Китае не содержит конкретных указаний для песен, созданных с помощью ИИ, которые копируют голоса знаменитостей, но регулирующие органы страны быстро сформулировали юридические ограничения в области синтетических технологий в целом.

В то время как китайские технологические фирмы стремились извлечь выгоду из прорывов в области генеративного ИИ с помощью своих альтернатив Midjourney и ChatGPT, в ноябре Китай принял постановление, определяющее, как следует использовать передовые технологии. Поставщики услуг обязаны, например, проверять реальные личности пользователей и фиксировать их незаконные действия.

Компания Douyin, принадлежащая ByteDance, опубликовала сегодня руководство по контенту, создаваемому ИИ, которое в значительной степени основано на новом китайском регулировании синтетических технологий. Пользователи, загружающие контент, должны помечать творчество ИИ «отличительными ярлыками» и нести ответственность за последствия такого контента, говорится в руководстве платформы коротких видео. Любой контент, нарушающий авторские права, запрещён и подлежит «суровому наказанию».

Возникает вопрос, нарушают ли права артистов песни, созданные с помощью инструментов ИИ, имитирующих голоса певцов без их согласия. Стефани Сан пока никак публично не отреагировала на десятки песен, клонированных ИИ с использованием её голоса. А генеративный ИИ нашёл себе ещё одно применение, помогая заполнить эмоциональную пустоту людей.

Мошенники стали с помощью ИИ имитировать голоса членов семей своих жертв

В США растёт количество мошенников, выдающих себя за других с помощью ИТ-технологий, которые упростили и удешевили имитацию голоса, помогая убеждать людей, в основном пожилых, что их близкие попали в беду и им срочно требуется финансовая помощь. По данным Федеральной торговой комиссии (FTC), в 2022 году подобные схемы стали вторым по популярности способом вымогательства в США — зарегистрировано 36 000 преступлений, 5 100 из них совершены по телефону, ущерб составил более $11 млн.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Достижения в области искусственного интеллекта добавили новые пугающие возможности, позволяющие злоумышленникам воспроизвести голос с помощью всего лишь аудиосэмпла из нескольких предложений. Множество дешёвых онлайн-инструментов на базе искусственного интеллекта могут преобразовать аудиофайл в копию голоса, позволяя мошеннику заставить его «говорить» то, что он печатает. Преступник выдаёт себя за кого-то, заслуживающего доверия — ребёнка или друга — и убеждает жертву отправить ему деньги. А технология искусственного голоса делает эту уловку более убедительной.

Эксперты говорят, что федеральные регулирующие органы, правоохранители и суды плохо оснащены, чтобы обуздать аферистов. Как правило, практически невозможно идентифицировать преступника, а полиции сложно отследить мошенников, действующих по всему миру. У судов не хватает юридических прецедентов для привлечения компаний, создающих инструменты имитации голоса, к ответственности за их неправомерное использование.

«Это ужасно, — говорит Хани Фарид (Hany Farid), профессор цифровой криминалистики Калифорнийского университета. — Это своего рода идеальный шторм… со всеми ингредиентами, необходимыми для создания хаоса». По словам Фарида, программное обеспечение для генерации голоса с помощью ИИ анализирует и выявляет уникальные признаки голоса, включая возраст, пол и акцент. Для этого достаточно короткого образца аудиозаписи из YouTube, подкаста, рекламного ролика, TikTok, Instagram или Facebook. «Два года, даже год назад, нужно было много аудио, чтобы клонировать голос, — отметил Фарид. — Теперь для этого достаточно 30 секунд звучания».

Аналитик FTC Уилл Максон (Will Maxson), отметил, что отслеживание мошенников крайне затруднено, так как звонок может поступать из любой точки мира, что затрудняет даже определение страны юрисдикции. Нужно проявлять бдительность и разумную осторожность. Если любимый человек говорит вам по телефону, что ему нужны деньги, перезвоните ему сами, помните, что входящий номер тоже может быть подменён.


window-new
Soft
Hard
Тренды 🔥