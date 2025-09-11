Сегодня 11 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
3DNews Новости Software Искусственный интеллект, машинное обучен... Технокомпании обучают ИИ на миллионах ро...
реклама
Новости Software
Самое интересное в обзорах

Технокомпании обучают ИИ на миллионах роликов, скаченных с YouTube, без разрешения их авторов

В массив данных, предназначенных для обучения искусственного интеллекта, попали более 15,8 млн видеороликов с более чем 2 млн каналов YouTube — технологические компании без разрешения пользуются ими в своих проектах, обратил внимание американский журнал The Atlantic.

Источник изображения: Aidin Geranrekab / unsplash.com

Источник изображения: Aidin Geranrekab / unsplash.com

Эти видеоролики присутствуют как минимум в 13 наборах данных, которые распространяют разработчики ИИ из технологических компаний, университетов и исследовательских организаций через такие платформы как, например, Hugging Face. В большинстве случаев видео являются анонимными — не указываются ни их названия, ни имена авторов; хотя журналистам издания удалось их идентифицировать.

Для создания генераторов видео с ИИ разработчикам требуются огромное количество роликов, и YouTube представляется стандартным источником материалов для таких целей. Платформа позволяет пользователям платных тарифов загружать видео в приложении, чтобы впоследствии смотреть их в любое время и в любом месте; разработчики же скачивают их в виде файлов и обрабатывают при помощи алгоритмов ИИ, что прямо нарушает условия обслуживания платформы, но её администрация, очевидно, бездействует.

Не все видео на YouTube защищены авторскими правами, некоторые ролики вообще загружаются пользователями, не связанными с правообладателями, но многие действительно защищены. Их несанкционированное копирование или распространение незаконно, и вопрос об их добросовестном использовании для обучения ИИ до сих пор обсуждается в рамках судебных процессов. Некоторые судьи не согласны с позицией технологических компаний, но единого мнения пока не сформировано.

Источник изображения: Rubidium Beach / unsplash.com

Источник изображения: Rubidium Beach / unsplash.com

Созданные ИИ ролики, например, исторические, демонстрируют всё большее присутствие на YouTube — несмотря на множество неточностей, они уже начали вытеснять проверенный экспертами контент; то же касается музыкальных ремиксов. Проблема выходит далеко за рамки YouTube: многие современные чат-боты работают на базе мультимодальных моделей ИИ, способных в качестве ответов генерировать медиафайлы — вскоре ChatGPT или другая платформа вместо ссылки на видеоинструкцию с YouTube выдаст индивидуальное обучающее видео. Возможно, оно окажется хуже, чем созданное человеком, но будет адаптировано к требованиям пользователя.

Обучающие массивы, в которые входят скачанные с YouTube ролики, используются многими технологическими компаниями, в том числе Microsoft, Meta, Amazon, Nvidia, Runway, ByteDance, Snap и Tencent. В Meta, Amazon и Nvidia ответили на просьбу журналистов прокомментировать ситуацию и заверили, что уважают создателей контента и считают использование этих данных законным. В Amazon добавили, что сейчас работают над системой, которая позволит генерировать «убедительную, высококачественную рекламу по простым запросам».

У Meta есть сервис Movie Gen, генерирующий видео по текстовым запросам; в Snapchat есть функция AI Video Lenses, позволяющая дополнять пользовательские видео элементами с генеративным ИИ. Эти службы были бы невозможными, если бы владеющие ими компании не обучали ИИ на большом объёме роликов — так и ChatGPT не смог бы писать в духе Шекспира, если бы не «прочитал» его. Значительная часть материала взята с новостных и образовательных каналов; сотни тысяч видео были созданы авторами обычных каналов.

Разработчики ИИ признаются, что одни ролики им интереснее, чем другие. Так, специализирующаяся на разработке генератора видео с ИИ компания Runway в качестве приоритетных исходных материалов в неофициальном порядке перечислила «быстрое движение камеры», «красивые кинематографические пейзажи», «высококачественные фрагменты фильмов» и «сверхкачественные научно-фантастические короткометражки». Создатели обучающих массивов HowTo100M и HD-VILA-100M отдают приоритет видео с высоким количеством просмотров на YouTube; для массива HD-VG-130M отбор видео производит специально обученная ИИ-модель. Ниже приоритет у видео с субтитрами и логотипами каналов — есть риск, что эти элементы попадут и в генерируемые ролики; возможно, владельцам каналов следует обратить на этот факт внимание, если они не хотят увидеть свои работы в обучающих массивах.

Источник изображения: BoliviaInteligente / unsplash.com

Источник изображения: BoliviaInteligente / unsplash.com

При подготовке видео к добавлению в массив разработчики разбивают материал на короткие ролики, отбрасывая, например, моменты смены ракурса. К каждому созданному таким образом клипу добавляется описание на английском языке, чтобы модель научилась сопоставлять слова с движущимися изображениями и впоследствии генерировала видео на основе текстового запроса. Иногда такое аннотирование осуществляют люди, иногда — специальные модели ИИ. На канале TED при помощи ИИ производится дублирование речи выступающих, и даже осуществляется корректировка артикуляции губ для синхронизации со звуковой дорожкой на новом языке.

Активно появляются сервисы и для рядовых пользователей. Facetune позволяет корректировать лица на видеозаписях; Facewow — полностью заменять их; Runway Aleph — менять цвета объектов или превращать солнечную погоду в снежную бурю. Google Gemini превращает фотографии в короткие ролики; Vidnoz AI обещает генерировать реалистичные изображения говорящих людей в любом стиле; Arcads готовит полноценные рекламные ролики с актёрами и закадровым голосом — аналогичные возможности есть в Symphony Creative Studio для TikTok. Доступны также виртуальная примерка одежды, создание собственных компьютерных игр, анимация людей и персонажей мультфильмов.

Из-за ИИ возникают серьёзные конфликты. Жюри фестиваля рекламы «Каннские львы» присудило, а администрация впоследствии отозвала награду ролику, в котором использовался образ американской женщины-политика ДеАндреа Сальвадор (DeAndrea Salvador) — она подала в суд и на создавшую этот ролик компанию, и на его заказчиков. Disney и Universal, а вслед за ними и Warner Brothers подали в суд на создателей генератора изображений Midjourney, которую в иске охарактеризовали как «бездонную яму плагиата». На Meta подали в суд две студии, снимающие фильмы для взрослых — гигант соцсетей скачал и начал раздавать по протоколу BitTorrent более 2000 их видеороликов. Пользователь YouTube Дэвид Миллетт (David Millette) в августе прошлого года подал в суд на Nvidia, обвинив компанию в несправедливом обогащении и недобросовестной конкуренции при обучении ИИ Cosmos, но дело удалось уладить.

Люди зарабатывают на ИИ-контенте. DeepBrain AI платит по $500 за опубликованные на YouTube ИИ-видео, которые наберут 10 000 просмотров, и это не очень высокая планка. Google и Meta делятся с пользователями платформ доходами от рекламы и зачастую поощряют создание контента с помощью ИИ. Появились и «инфоцыгане», готовые научить секретам заработка на созданных ИИ материалах. Техногиганты и сами обучают свои системы ИИ на видео с принадлежащих им платформ: Google взяла не менее 70 млн видео с YouTube, а Meta обучала ИИ на более чем 65 млн роликов из Instagram. Не за горами день, когда людям придётся конкурировать с ИИ за создание более качественного контента. А соцсети постепенно лишатся своего изначально социального характера — иронично, что совсем недавно об этом задумался глава OpenAI Сэм Альтман (Sam Altman).

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
Anthropic увернулась от иска за обучение ИИ на электронных книгах с помощью «исторического соглашения»
Perplexity ответит в суде за использование материалов японских СМИ для обучения ИИ
Universal Pictures пригрозила ИИ-компаниям судом за незаконное использование фильмов студии для обучения нейросетей
YouTube добавил функцию ИИ-дубляжа видео на разных языках для всех авторов
OpenAI купит у Oracle вычислительные мощности для развития ИИ за баснословные $300 млрд
В интернете появилась система, которая заставит разработчиков ИИ платить за контент
Теги: youtube, ии, обучение, видео
youtube, ии, обучение, видео
← В прошлое В будущее →

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

© 1997—2025 Электронное периодическое издание "3ДНьюс" | Свидетельство о регистрации СМИ Эл ФС 77-22224

выдано Федеральной Службой по надзору за соблюдением законодательства в сфере массовых коммуникаций и охране культурного наследия

При цитировании документа ссылка на сайт с указанием автора обязательна. Полное заимствование документа является нарушением
российского и международного законодательства и возможно только с согласия редакции 3DNews.

Яндекс.Метрика

Система Orphus

window-new
Контакты Поиск Реклама О сайте
Soft
Hard
Тренды 🔥
Тепло принятая публикой RPG с открытым миром Tainted Grail: The Fall of Avalon получила большой патч с «Новой игрой +»
AMD не признаёт поражения на графическом направлении и обещает нокаутировать Nvidia с помощью Instinct MI450
«Великий китайский файрвол» отправили на экспорт — теперь он ограничивает интернет в разных странах
Windows 95 на ноутбуках быстрее разряжала аккумулятор, чтобы не превратить ПК в кирпич
Google Pixel стал самым быстрорастущим брендом премиальных смартфонов в мире
Игровая выставка РЭД ЭКСПО 2025 отменена — «Леста Игры» выбрала «Игромир» и Comic Сon 22 мин.
Вышла предварительная версия Microsoft Visual Studio 2026: обновился дизайн, углубилась интеграция с ИИ 50 мин.
Счастливый финал с подвохом: с дополнением Legacy of the Forge в Kingdom Come: Deliverance 2 появилась новая секретная концовка 2 ч.
Технокомпании обучают ИИ на миллионах роликов, скаченных с YouTube, без разрешения их авторов 2 ч.
Apple заблокирует функцию онлайн-перевода в AirPods для пользователей из Европы 2 ч.
Разрушительный шутер The Finals получил поддержку русского языка спустя почти два года после выхода 3 ч.
Стартап Mistral AI привлёк на развитие €1,7 млрд при участии ASML 5 ч.
Минцифры расширит белый список интернет-сервисов в несколько этапов 5 ч.
Ролевой шутер Witchfire от бывших создателей Painkiller и Bulletstorm не выйдет из раннего доступа в 2025 году — представлен обновлённый план 6 ч.
YouTube добавил функцию ИИ-дубляжа видео на разных языках для всех авторов 6 ч.
В облаке Astra Cloud появились выделенные серверы с процессорами Baikal-S 21 мин.
Kioxia вместе с Nvidia разрабатывают PCIe 7.0 SSD в 100 раз быстрее нынешних — его представят в 2027 году 42 мин.
Новые наушники Nothing Ear (3) получат кейс с микрофоном и кнопкой Talk — зачем они, производитель не говорит 51 мин.
Утёкшие рендеры Samsung Galaxy S26 Pro подтверждают его сходство с Galaxy S25 57 мин.
Перезагрузка кадров в высшем эшелоне должна помочь Intel в укреплении бизнеса 2 ч.
Страдают не только астрономы: аппарат Starlink помешал спутнику-шпиону сделать фото китайской военной базы 2 ч.
Караоке-вечеринка в кубе — SVEN PS-555: для друзей и детских праздников 3 ч.
SberDevices представила миниатюрную колонку SberBoom Micro с ИИ 3 ч.
Тест показал, что OLED-монитор «раздражает» выгоранием уже через 18 месяцев использования, но не всё так однозначно 3 ч.
Подорожание DDR4 не остановится: производители чипов повторно накрутят цены до конца года 4 ч.