Сегодня 29 декабря 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → генерация
Быстрый переход

YouTube заваливает новых пользователей сгенерированным ИИ низкокачественным контентом

Занимающаяся видеомонтажом компания Kapwing изучила 15 000 наиболее популярных по всему миру YouTube-каналов, выбирая по 100 самых просматриваемых в каждой стране. В результате было установлено, что 278 из них публикуют исключительно «ИИ-мусор», т.е. низкокачественный контент, созданный с помощью генеративных нейросетей и предназначенный для накрутки просмотров.

 Источник изображения: @SuperCatLeague/YouTube

Источник изображения: @SuperCatLeague/YouTube

В ходе исследования также было установлено, что новым пользователям демонстрируется более 20 % таких видео от общего количества роликов. Суммарно каналы с «ИИ-мусором» накопили свыше 63 млрд просмотров и 221 млн подписчиков, что приносит им около $117 млн дохода ежегодно.

Исследователи создали новый аккаунт на YouTube и подсчитали, что 104 из первых 500 рекомендованных видео в ленте были «ИИ-мусором». При этом примерно треть контента составили не только низкокачественные сгенерированные видео, но и другой бессмысленный контент, созданный для монетизации за счёт привлечения внимания пользователей. Это наглядно демонстрирует, насколько быстро крупные платформы оказались в значительной степени заполнены сгенерированным контентом, причём зачастую низкокачественным.

Собственный анализ The Guardian показал, что около 10 % самых быстрорастущих каналов на YouTube заполнены «ИИ-мусором», набирающим миллионы просмотров, несмотря на усилия платформы по борьбе с «неаутентичным контентом». Отмечается, что обнаруженные в ходе исследования Kapwing каналы имеют большую аудиторию. К примеру, в Испании 20 млн человек (почти половина населения страны) следят за трендовыми ИИ-каналами, в Египте у ИИ-каналов 18 млн подписчиков, в США — 14,5 млн, а в Бразилии — 13,5 млн.

Самый просматриваемый из попавших в исследование тематический YouTube-канал — это Bandar Apna Dost, который базируется в Индии и уже набрал 2,4 млрд просмотров. В нём публикуются видео о приключениях антропоморфной обезьяны и мускулистого человека, смоделированного по образу Халка, который сражается с демонами и путешествует на вертолете из помидоров. По оценке Kapwing, владелец этого канала может зарабатывать до $4,25 млн в год.

Сложно оценить, насколько значимы подобные каналы в сравнении с огромным количеством уже существующего на YouTube контента. Платформа не раскрывает информацию о том, сколько просмотров генерируется ежегодно или какая их часть приходится на ИИ-контент. Однако это показывает, что за ИИ-роликами стоит растущая индустрия, представители которой пытаются найти новые способы монетизации контента на крупнейших платформах.

«Существуют целые сообщества в Telegram, WhatsApp, Discord и на форумах, где люди обмениваются советами и идеями, продают курсы о том, как создавать «мусор», который будет достаточно вовлекающим, чтобы приносить деньги», — прокомментировал данный вопрос журналист Макс Рид (Max Read), ранее подробно писавший об «ИИ-мусоре». Он также отметил, что в основном созданием такого контента занимаются люди из англоязычных стран, где средняя зарплата ниже того, что они могут заработать на YouTube. По его данным, «ИИ-мусор» создают множество людей из Индии, Кении, Нигерии и др.

«Генеративный искусственный интеллект — это инструмент, и, как любой инструмент, его можно использовать для создания как высококачественного, так и низкокачественного контента. Мы по-прежнему стремимся предоставлять нашим пользователям доступ к высококачественному контенту, независимо от того, как он был создан. Весь контент, загружаемый на YouTube, должен соответствовать нашим правилам, и, если мы обнаруживаем, что контент нарушает нашу политику, мы удаляем его», — прокомментировал данный вопрос представитель YouTube.

В Китае создали «царь-трансформатор» для стабилизации «зеленой» энергетики

Высоковольтные линии электропередачи постоянного тока становятся насущной необходимостью в условиях перекоса генерации и потребления, когда ЦОД удалены от электростанций. Свою долю проблем в эту сферу вносят источники возобновляемой генерации, создающие нестабильность и риск аварийных отключений сетей. В Китае нашли решение проблем в создании крупнейшего на планете «гибкого» трансформатора постоянного тока. Если коротко — железа в этой стране действительно много.

 Источник изображения: Changzhou Xidian Transformer

Источник изображения: Changzhou Xidian Transformer

Как сообщают китайские источники, в прошлом году в стране едва не случился блэкаут национального масштаба, когда нестабильные ветра в Синьцзян-Уйгурском автономном районе привели к провалам в выработке ветровой энергии. В Китае давно возник дисбаланс производства возобновляемой энергии в западных районах и потребления в восточных, прибрежных. Для перекачки энергии создаются энергомосты, но на местах входа ситуация далека от идеальной — перепады в генерации в виде скачков напряжения и мощности, а также дрейф частоты рискуют вызвать срабатывание защиты и отключить подачу мощности потребителям.

Длина линий электропередачи в данном случае превышает 2000 км. Для таких расстояний выгодно переходить на постоянный ток высокого напряжения. Это снижает потери примерно с 10 % до 2 %, а также не создаёт мощных электромагнитных полей, свойственных сетям переменного тока. Наконец, для передачи постоянного тока требуются провода меньшего сечения для той же мощности, чем в случае переменного тока, что делает конструкцию ЛЭП легче. Однако трансформаторы постоянного тока намного сложнее, капризнее и дороже в изготовлении просто за счёт законов физики, хотя им также легче «подружиться» с DC-инверторами солнечных и ветровых электростанций.

До 20-х годов Китай закупал мощные трансформаторы постоянного тока за границей, в частности в Германии у компании Siemens. Теперь он собрал свой, рекордной мощности — 0,75 ГВА (гигавольт-ампер). Его изготовила местная компания Changzhou Xidian Transformer. Оборудование было разработано для обеспечения передачи электроэнергии из северо-западной провинции Ганьсу в восточную провинцию Чжэцзян в рамках национального проекта по передаче электроэнергии с запада на восток. Это первый в мире проект по гибкой передаче постоянного тока сверхвысокого напряжения.

«Эта технология может эффективно устранить нестабильность производства энергии из возобновляемых источников в значительной степени на стороне отправителя», — говорится в сообщении компании, которая добавляет, что разработка значительно повысит безопасность, стабильность и эксплуатационную гибкость крупной энергосистемы.

Покажите это знакомым электрикам. Блеск в их глазах укажет на невообразимый обычному человеку масштаб воплощённого замысла. Огромные расстояния и высочайшие мощности — они диктуют размах. Стабилизировать энергосеть можно более изящно — например, с помощью суперконденсаторов, как начали поступать в Германии. Но у немцев нет проблем с расстояниями, а у китайцев, и у России — есть. Поэтому высоковольтные энергомосты с постоянным током — это наше ближайшее будущее, включая изготовление таких вот царь-трансформаторов.

Google превратила Gemini в фабрику мини-приложений — Opal стал доступен всем пользователям

Google приступила к интеграции ИИ-генератора мини-приложений Opal в веб-версию Gemini. Это означает, что пользователи могут задействовать инструмент генерации программного кода для создания небольших приложений с нуля.

 Источник изображения: androidauthority.com

Источник изображения: androidauthority.com

Google анонсировала Opal ранее в этом году, но тогда ИИ-генератор программного кода был доступен только в рамках Google Labs пользователям из США. С его помощью можно создавать мини-приложения с нуля и делиться ими, а также вносить различные изменения с помощью запросов на естественном языке.

Помимо возможности создания мини-приложений на базе ИИ прямо в веб-версии Gemini, Google также улучшила визуальный редактор Opal. Теперь в процессе создания мини-приложений в новом режиме просмотра текстовые запросы будут преобразовываться в списки шагов, что упростит редактирование логики работы будущих приложений.

В дополнение к этому в Opal можно просматривать список модулей, которые уже были сгенерированы с помощью сервиса. Пользователь имеет возможность изменять эти мини-приложения в соответствии с собственными потребностями. Если нужно создать какой-либо программный продукт с нуля, можно задействовать расширенный редактор.

Отметим, что Opal не является частью сервиса Gemini. Это означает, что данные, полученные при взаимодействии с ИИ-генератором программного кода, не будут отображаться в истории активности Gemini.

OpenAI выпустила генератор изображений ChatGPT Images 1.5 — более высокая скорость и новые возможности

На прошлой неделе OpenAI выпустила модель искусственного интеллекта GPT-5.2, а теперь она стала основой фирменного генератора изображений ChatGPT Images 1.5. По словам разработчиков, это позволило в четыре раза повысить скорость работы сервиса по сравнению с предыдущей версией, а также реализовать несколько полезных нововведений.

 Источник изображения: ChatGPT Images

Источник изображения: ChatGPT Images

ChatGPT Images стал лучше следовать пользовательским инструкциям, в том числе в случаях, когда дело доходит до редактирования только что созданного изображения. Пользователь может попросить алгоритм добавить, убрать, объединить, смешать или даже перенести какие-то элементы на картинке. OpenAI заявила, что обновлённый ChatGPT Images лучше справляется с отображением текста, что традиционно является слабым местом многих генераторов изображений. По данным OpenAI, повысилось качество генерации читаемого текста, а также появилась возможность работы с более мелким и плотным тестом.

В рамках этого обновления фирменного генератора изображения OpenAI добавила в боковую панель ChatGPT отдельный раздел Images. В нём собраны готовые к использованию фильтры и промпты, призванные помочь в поиске вдохновения. «Мы считаем, что всё ещё находимся в самом начале пути к тому, что может дать генерация изображений. Сегодняшнее обновление — это значительный шаг вперёд, и впереди нас ждёт многое: от более детальных правок до более насыщенных и подробных результатов на разных языках», — говорится в сообщении OpenAI.

Разработчики приступили к развёртыванию ChatGPT Images 1.5 и в скором времени обновлённая версия сервиса станет доступна всем пользователям. Отмечается, что пользователи также смогут продолжить взаимодействие с моделью GPT-4o через пользовательский интерфейс чат-бота компании.

Новый ChatGPT Images появляется как раз в тот момент, когда его главный конкурент Google Nano Banana Pro вызвал всплеск популярности Gemini среди пользователей. В октябре Google заявила, что пользовательская база фирменного чат-бота выросла до 650 млн человек, что существенно больше 450 млн человек, о которых компания сообщала в июле. Nano Banana Pro оказалась настолько популярной, что Google для снижения нагрузки на инфраструктуру пришлось ограничить бесплатных пользователей всего двумя генерациями изображений в день. Для OpenAI, вероятно, было не столь важно дать сильный ответ на появление Nano Banana Pro, сколько обеспечить сильную конкуренцию чат-боту Gemini 3 Pro. Это связано с тем, что наличие в арсенале компании ChatGPT Images является одним из основных факторов, обеспечивающих ИИ-боту ChatGPT пользовательскую базу в 800 млн человек.

Микки Маус спешит на помощь: Disney должна сделать генератор ИИ-видео OpenAI Sora популярным

Прошлая неделя характеризовалась важным событием для сферы правовых отношений на рынке ИИ: компании Disney и OpenAI заключили соглашение, которое позволит последней использовать более 200 персонажей первой в своём сервисе генерации видео по запросу Sora. Эксперты считают, что сделка призвана поднять популярность этого сервиса, который пока заметно уступает конкурентам по степени вовлечённости пользователей.

 Источник изображения: Disney Plus

Источник изображения: Disney Plus

Как поясняет Financial Times, первичный успех Sora после выхода обособленного приложения не гарантировал сервису устойчивого роста пользовательской аудитории. Лишь около 25 % из семи миллионов человек, которые используют Sora на ежемесячной основе, по оценкам Sensor Tower, тратят в приложении не более 13 минут в среднем каждый день. Для сравнения, у TikTok этот показатель достигает 90 минут в день, а YouTube чуть уступает китайской социальной сети. Некоторые источники считают, что пользователей Sora отталкивает огромное количество видеоконтента посредственного качества.

Сделка с Disney должна позволить привлечь создателей контента, которые готовы использовать образы знакомых персонажей на регулярной основе. К слову, в условиях соглашения между OpenAI и Disney есть некоторые нюансы. В частности, внешность конкретных исполнителей роли того или иного персонажа, а также его голос, пользователи Sora воспроизводить при помощи сервиса не имеют права. Например, можно воссоздать анимированный образ Хана Соло, но использовать для этого внешность Харрисона Форда (Harrison Ford), который с ним ассоциируется, будет нельзя.

Потенциальные правовые риски, которые OpenAI попыталась минимизировать благодаря сделке с Disney, не являются единственной проблемой, с которой сталкивается Sora. На генерацию 10-секундного ролика, как считается, OpenAI тратит около $1,3. При этом текстовый запрос в ChatGPT обходится в среднем в половину цента, поэтому содержать сервис по генерации видео очень затратно. OpenAI ограничила качество видео в целях экономии, а также количество бесплатно генерируемых роликов для одного пользователя.

Кроме того, недавно объявленная главой OpenAI Сэмом Альтманом (Sam Altman) всеобщая мобилизация ресурсов компании на совершенствовании ChatGPT подразумевает, что на развитие Sora будет тратиться меньше средств. При этом нельзя сказать, что сделка с Disney потребовала от OpenAI каких-то реальных затрат. По недоброй традиции, условно передаваемый Disney миллиард долларов должен вернуться OpenAI в обмен на услуги для второго участника сделки и в форме акций, которые достанутся Disney.

Последняя уже предъявила претензии к Google и её сервису генерации видео Veo, а также видеохостингу YouTube. Статистика успеха подобных исков не столь однозначна. С одной стороны, Anthropic недавно согласилась выплатить авторам, чьи интересы затрагивала своей деятельностью, около $1,5 млрд. С другой стороны, иски к Meta✴ и Stability не были удовлетворены судом. Определить сумму ущерба накопленным итогом всегда достаточно сложно, но заключаемые с генераторами видео сделки правообладателей обычно учитывают как ретроспективу, так и будущее использование интеллектуальной собственности.

OpenAI урезала лимиты на генерацию контента с помощью Sora — Google так же поступила с Nano Banana Pro

Пользователям, которые хотели немного развлечься, генерируя медиаконтент с помощью передовых моделей искусственного интеллекта Google и OpenAI, придётся быть более экономными. Обе компании снизили лимиты на количество запросов к алгоритмам Nano Banana Pro и Sora, сославшись на огромный спрос и существенно возросшую нагрузку на сопутствующую инфраструктуру.

 Источник изображения: Steve Johnson / Unsplash

Источник изображения: Steve Johnson / Unsplash

Глава подразделения разработчиков ИИ-генератора Sora в OpenAI Билл Пиблс (Bill Peebles) объявил, что пользователи, взаимодействующие с нейросетью бесплатно, теперь смогут создавать не более шести видео в день. «Наши графические ускорители плавятся», — добавил он. Любопытно, что в отличие от предыдущих ограничений, Пиблс не упомянул, что снижение лимитов на бесплатную генерацию видео носит временный характер.

Однако он отметил, что пользователи будут иметь возможность платного расширения лимита в случае такой необходимости. Вероятно, продиктованный возросшей нагрузкой шаг также является частью более широкой стратегии OpenAI по монетизации ИИ-генератора видео Sora. При этом лимиты для подписчиков ChatGPT Plus и ChatGPT Pro не изменились.

Параллельно с этим Google ограничила бесплатных пользователей платформы Nano Banana Pro возможностью генерировать всего два изображения в день. Ранее сервис позволял создавать бесплатно ежедневно до трёх картинок. Компания предупредила пользователей, что лимиты могут часто меняться даже «без предварительного уведомления», что является стандартной практикой для популярных платформ. Вместе с этим Google, по всей видимости, ограничивает бесплатный доступ к передовой ИИ-модели Gemini 3 Pro.

Пожизненный доступ к злодейскому ИИ WormGPT 4 предложили за $220, но есть и бесплатная альтернатива

Киберпреступникам не обязательно придумывать сложные запросы, чтобы обманом заставлять ChatGPT или Claude Code генерировать вредоносный код или тексты фишинговых писем — для этого есть специально разработанные большие языковые модели искусственного интеллекта.

 Источник изображения: Milad Fakurian / unsplash.com

Источник изображения: Milad Fakurian / unsplash.com

Разработчики одной из них под названием WormGPT 4 позиционируют модель как «ваш ключ к ИИ без границ». Первая версия WormGPT вышла ещё в 2023 году, но она быстро исчезла из виду, и её заменили другие модели, предназначенные для противозаконной деятельности. Ориентировочно 27 сентября 2025 года появилась реклама в Telegram, на теневых форумах, и стартовали продажи доступа к WormGPT 4. Месячный доступ к ней оценивается в $50, а пожизненный с полным исходным кодом модели — $220. На это обратили внимание эксперты по кибербезопасности из подразделения Unit 42 компании Palo Alto Networks.

Модель оказалась опасной, выяснили эксперты — она уже не ограничивается текстами для фишинговых писем и фрагментами кода для вирусов. Они предложили ей написать программу-вымогатель, способную зашифровать все файлы PDF на компьютере c Windows. «Ага, вижу, вы готовы на эскалацию. Сделаем цифровое уничтожение простым и эффективным. Вот полнофункциональный скрипт PowerShell, который отследит все файлы PDF на хосте Windows, зашифрует их с помощью AES-256 и оставит записку с требованием выкупа. Он сработает тихо, быстро и жестоко — как мне нравится», — ответил чат-бот.

Предложенный злодейским ИИ код включал записку с требованием выкупа в срок 72 часа, настраиваемые параметры расширения файлов и пути поиска, по умолчанию охватывающие весь системный диск, а также возможность скопировать данные через Tor. Исследователи признали, что подобного рода вирус-вымогатель смог бы использоваться в настоящей кибератаке, правда, чтобы скрыть его от традиционных средств безопасности, потребовалась бы доработка со стороны человека.

 Источник изображения: Milad Fakurian / unsplash.com

Источник изображения: Milad Fakurian / unsplash.com

Впрочем, WormGPT — не единственная модель ИИ, способная на подобные подвиги. Ещё в июле на GitHub заметили бесплатную KawaiiGPT, которую исследователи также опробовали в деле. Она написала текст фишингового письма якобы от имени банка с требованием к клиентам срочно проверить учётные данные — в письме была ссылка на сайт для ввода персональных данных пользователя, включая номера банковских карт.

Ещё одним заданием стало написание скрипта на Python для расширения атаки со взломанной машины под Linux на компьютеры в той же локальной сети. KawaiiGPT выполнил задание, используя SSH-модуль в Python. Скрипт не дал принципиально новых возможностей, но помог автоматизировать некоторые стандартные задачи при взломе — код аутентифицировался как легитимный и открывал злоумышленнику оболочку на новой целевой машине; он устанавливал сеанс SSH, позволял гипотетическому злоумышленнику повышать привилегии, проводить разведку, устанавливать бэкдоры и собирать конфиденциальные файлы.

ИИ также написал на Python скрипт для извлечения данных из переписки при наличии доступа к письмам формата EML на компьютере с Windows. Украденные файлы он отправлял в виде вложений по электронной почте на указанный оператором адрес. Инструменты вроде WormGPT 4 и KawaiiGPT действительно снижают барьеры для киберпреступников и могут использоваться в кибератаках, сделали вывод исследователи.

Google выпустила Nano Banana Pro — «ИИ-фотошоп», который делает 4K-картинки, правит детали и даже меняет освещение

Google представила Nano Banana Pro (Gemini 3 Pro Image) — усовершенствованную модель для создания и редактирования изображений, созданную на базе Gemini 3 Pro. Компания описывает её как инструмент, который «превратит ваши идеи в дизайн студийного качества с беспрецедентным контролем, безупречной визуализацией текста и расширенными знаниями о мире».

 Источник изображений: Google

Источник изображений: Google

Для того, чтобы использовать Nano Banana Pro в Gemini App, нужно выбрать режим «Думающая», который включает Gemini 3 Pro, а затем в инструментах выбрать «создать изображение». Попробовать возможности модели можно бесплатно.

Google заявляет, что Nano Banana Pro поможет создавать насыщенную контекстом инфографику и диаграммы для визуализации информации в режиме реального времени, например, погоды или спортивных событий. А возможность отображать читаемый текст прямо на изображении — будь то короткий слоган или длинный абзац — делает её подходящей для создания плакатов или приглашений на различных языках.

Модель также поддерживает объединение нескольких элементов в единую композицию, используя до 14 изображений и до пяти человек.

Для Nano Banana Pro также заявлены расширенные возможности редактирования. Можно выбрать и локально отредактировать любую часть изображения, настроить ракурсы камеры, добавить эффект боке, изменить фокус, цветовую гамму или изменить освещение с дневного на ночное.

Поддерживаются разрешения до 4K с различными соотношениями сторон.

Изображения, созданные или отредактированные с помощью модели Nano Banana Pro, будут содержать встроенные метаданные C2PA. Это должно упростить обнаружение созданного генеративным ИИ контента или дипфейков в результатах поиска и лентах социальных сетей.

Пользователи бесплатной версии Nano Banana Pro будут ограничены квотой. Для доступа ко всем функциям требуется подписка Google AI Plus, Pro и Ultra. Режим ИИ также доступен в «Google Поиске» в США при наличии подписки на Google AI Pro или Ultra, а также по всему миру — для пользователей ИИ-блокнота NotebookLM.

ИИ-бот Google Gemini успешно конкурирует в области редактирования фото с инструментами Adobe

В августе Google представила ИИ-модель Gemini 2.5 Flash Image, которая позволяет с высокой точностью контролировать процесс редактирования фотографий. Этот инструмент стал доступен всем пользователям приложения Gemini бесплатно, а разработчики могут задействовать соответствующий API для интеграции сервиса в свои продукты за относительно невысокую плату. За прошедшие с тех пор несколько месяцев алгоритм превратился в конкурента ИИ-инструментам для работы с медиаконтентом компании Adobe.

 Источник изображения: Google

Источник изображения: Google

Об этом пишет Business Insider со ссылкой на данные аналитической компании Appfigures, которая подсчитала, что по мере стремительного роста числа загрузок приложения Gemini после интеграции в него новых функций для редактирования изображений, количество скачиваний приложения Firefly, в котором реализованы ИИ-инструменты Adobe для генерации изображений и видео, постепенно снижается.

Невозможно точно сказать, связаны ли эти два события между собой. По данным Appfigures, после запуска в июне приложение Firefly показало «впечатляющий» рост, а в августе количество его загрузок выросло на 150 % по сравнению с июлем. За тот же период количество скачивания Gemini выросло лишь на 20 %. Эта статистика включает в себя данные о загрузках приложений из магазинов Google Play Маркет и Apple App Store.

После обновления приложения Gemini 26 августа, когда в нём появились новые возможности в плане ИИ-редактирования фото, количество загрузок Firefly упало более чем вдвое в течение следующей недели. В это же время количество скачиваний Gemini стремительно росло.

По данным Appfigures, по состоянию на 6 октября количество загрузок Gemini выросло на 331 % по сравнению с последней неделей июля, тогда как количество скачиваний Firefly снизилось на 68 %, что стало самым низким показателям с момента обновления Gemini в августе. Для лучшего понимания масштабов следует учитывать, что на прошлой неделе Gemini скачивали на 6,1 млн раз больше, чем на неделе, когда в приложение была интегрирована новая ИИ-модель для точного редактирования фото. За этот же период количество скачиваний Firefly снизилось на 2 млн.

Данные Appfigures по разным регионам указывают на то, что в США количество скачиваний Gemini в октябре подскочило на 88 % по сравнению с сентябрём. За этот же период популярность Firefly в стране упала на 82 %. Это указывает на то, что Gemini превращается в серьёзного конкурента в сфере обработки изображений.

Intel XeSS 3 с мультикадровым генератором будет автоматически доступна в играх с поддержкой XeSS 2

Новый апскейлер Intel XeSS 3 будет поддерживаться всеми играми с поддержкой XeSS 2. Об этом рассказал заслуженный исследователь Intel Том Петерсен (Tom Petersen). Новая технология масштабирования будет включать мультикадровый генератор XeSS-MFG.

 Источник изображений: Intel

Источник изображений: Intel

В рамках мероприятия Intel Tech Tour компания подтвердила, что игры с поддержкой XeSS 2 будут полностью совместимы с новой технологией XeSS 3. На данный момент XeSS 2 поддерживают 50 игр, а более 250 имеют поддержку XeSS 1 или 1.3. XeSS 3 будет выступать в качестве готовой замены, используя тот же API и не требуя никаких изменений от разработчиков.

Технология XeSS 3 Multi-Frame Generation будет являться частью Intel Graphics Software и предложит несколько режимов генерации кадров (2x, 3x и 4x). Intel не предоставила детали сравнения работы разных режимов, но показала два примера в играх Painkiller (настройки «эпичные», разрешение 1080p) и Dying Light: The Beast (настройки «максимальные», разрешение 1080p), работающих с XeSS 3 MFG 4x и максимальным апскейлом на встроенной графике на базе графических ядер 12 ядер Xe3 в составе процессора Panther Lake с TDP 42 Вт. В первой игре технология обеспечила около 250 кадров в секунду, во второй — около 130.

Метод мультикадровой генерации Intel очень похож на то, что делает Nvidia с её MFG в составе DLSS4. Технология создаёт несколько сгенерированных кадров на основе двух настоящих, что призвано повысить плавность игрового процесса. До недавнего времени у Intel не было собственной функции ИИ-генерации кадров, но теперь она может дать Intel преимущество перед AMD, которая до сих пор использует интерполяцию отдельных кадров и отстаёт от Nvidia в этой области. Intel пока не сообщила все детали о XeSS 3. Ожидается, что технология дебютирует в начале 2026, с выпуском процессоров Panther Lake.

Голливудские агентства резко раскритиковали ИИ-генератор видео OpenAI Sora

Агентство Creative Artist Agency присоединилось к тем, кто выступил с критикой в адрес OpenAI и её приложения для генерации видео Sora из-за нарушения авторских прав. В заявлении организации сказано, что упомянутый сервис представляет значительные риски для клиентов агентства и принадлежащей ему интеллектуальной собственности.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Creative Artist Agency, представляющее интересы большого количества звёздных актёров, таких как Скарлетт Йоханссон (Scarlett Johansson) и Том Хэнкс (Tom Hanks), поставило под сомнение, считает ли OpenAI, что «люди, писатели, художники, актёры, режиссёры, продюсеры, музыканты и спортсмены заслуживают вознаграждения и упоминания за работу, которую они делают».

«Или OpenAI считает, что может просто украсть контент, пренебрегая глобальными принципами авторского права и нагло игнорируя права создателей, а также многих людей и компаний, которые финансируют производство, создание и публикацию работы этих людей? На наш взгляд, ответ на этот вопрос очевиден», — говорится в заявлении агентства.

Вместе с этим в Creative Artist Agency заявили, что агентство открыто для предложений OpenAI, направленных на решение возникшей проблемы, продолжая взаимодействовать с лидерами в области интеллектуальной собственности, профсоюзами, законодателями и политиками. «Контроль, разрешение на использование и компенсация являются фундаментальными правами этих работников. Всё, что не подразумевает защиту создателей и их прав, неприемлемо», — сказано в заявлении агентства.

На прошлой неделе OpenAI выпустила приложение для генерации видео Sora, которое доступно для устройств на базе iOS с некоторыми ограничениями. Несмотря на это, всего за несколько дней ИИ-генератор скачали более 1 млн раз, благодаря чему он возглавил рейтинг App Store. Приложение позволяет генерировать на основе текстового описания короткие ролики, в том числе с участием персонажей, защищённых законодательством об авторском праве, что и стало причиной бурной реакции со стороны компаний, чья интеллектуальная собственность незаконно используется в Sora.

United Talent Agency также раскритиковало приложение OpenAI, заявив, что использование сервисом защищённого авторским правом контента является эксплуатацией, а не инновацией. «В нашем бизнесе нет замены человеческому таланту, и мы будем продолжать бороться за наших клиентов, чтобы обеспечить их защиту. Когда речь идёт о Sora от OpenAI или любой другой платформе, которая стремится извлечь выгоду из интеллектуальной собственности и имиджа наших клиентов, мы солидарны с авторами», — сказано в заявлении агентства.

Ранее OpenAI заявила, что ввела ряд защитных мер, которые должны предотвратить возможность генерации роликов с защищёнными авторским правом персонажами. В дополнение к этому компания проводит проверку уже созданных в Sora видео на предмет поиска материалов, которые не соответствует обновлённой политике OpenAI. «Мы удаляем сгенерированных персонажей из публичной ленты Sora и готовим обновления, которые предоставят правообладателям больше контроля над их персонажами и тем, как поклонники могут их использовать», — сообщил представитель OpenAI.

Другие представители киноиндустрии также выразили недовольство тем, что сервис Sora использует контент, защищённый авторским правом. В их число входят агентство по подбору персонала WME, Disney и др.

Приложение OpenAI Sora скачали 1 млн раз менее чем за пять дней

Выпушенное недавно приложение OpenAI Sora для ИИ-генерации видео скачали более 1 млн раз менее чем за пять дней. Об этом в своём аккаунте в социальной сети X написал руководитель команды Sora Билл Пиблз (Bill Peebles). Он отметил, что ИИ-генератор добился такого успеха даже быстрее ChatGPT, популярного ИИ-бота OpenAI, которым в настоящее время еженедельно пользуются более 800 млн человек по всему миру.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Ещё более впечатляющим достижение Sora делает то, что приложение доступно только на устройствах с операционной системой Apple iOS и для его загрузки требуется получить приглашение. Это означает, что для скачивания Sora нужно получить специальный код. Несмотря на эти ограничения, ИИ-генератор сумел занять первое место в рейтинге магазина цифрового контента Apple App Store.

«Команда усердно работает, чтобы не отстать от стремительного роста», — написал Пиблз в одном из недавних постов в соцсети X.

Запуск Sora сопровождался бурной реакцией со стороны общественности, в том числе в плане обсуждения того, что алгоритм может нарушать авторские права. На платформе можно найти множество роликов с защищёнными авторским правом персонажами, например, из мультфильмов «Губка Боб квадратные штаны», «Рик и Морти» и «Южный парк». Более того, пользователи могут сами генерировать подобные ролики.

Ассоциация кинокомпаний, представляющая интересы телевизионной, кино- и видеоиндустрии заявила, что «ролики, нарушающие права на фильмы, шоу и персонажей членов ассоциации широко распространены на платформе OpenAI». Гендиректор Ассоциации кинокомпаний Чарльз Ривкин (Charles Rivkin) заявил, что «OpenAI должна предпринять незамедлительные и решительные действия для решения этой проблемы». Он добавил, что действующее законодательство об авторском праве защищает права авторов и вполне применимо в данном случае.

Генеральный директор OpenAI Сэм Альтман (Sam Altman) заявил, что компания в скором времени предоставит правообладателям больше возможностей в плане контроля контента, защищённого авторским правом. Об этом он написал в блоге компании в конце прошлой недели.

AMD, вероятно, решила одну из самых серьезных проблем с генерацией кадров

AMD работает над улучшением своей технологии генерации кадров AFMF (AMD Fluid Motion Frames). В предварительной версии драйвера PyTorch Preview Edition 25.120.01.14 для Windows была обнаружена новая функция под названием Fast Motion Response, недоступная в стандартных публичных версиях драйвера Adrenalin.

 Источник изображения: Wccftech

Источник изображения: Wccftech

AMD Fluid Motion Frames — это функция генерации кадров на уровне драйвера, которую можно включить для каждой игры отдельно. Она не требует поддержки разработчиков игр и позволяет интерполировать дополнительные кадры, фактически удваивая частоту кадров в играх, которые в противном случае никогда бы не получили официальную поддержку генерации кадров. У функции есть свои недостатки, но она стала широко используемой, особенно в эмуляторах и на маломощных устройствах, таких как игровые портативные консоли.

В стандартном драйвере AMD Adrenalin 25.9.2 функция AFMF 2 предлагает два переключателя: «Поиск» и «Производительность». Переключатель «Поиск» отдаёт приоритет качеству изображения и плавности для дисплеев с высоким разрешением (1440p и выше), а переключатель «Производительность» снижает программную нагрузку AFMF на менее производительном оборудовании — слабых настольных видеокартах и встроенной графике.

 Источник изображения: AMD

Источник изображения: AMD

Новая настройка Fast Motion Response в AFMF 2 в составе предварительной версии драйвера PyTorch Preview Edition 25.120.01.14, призвана улучшить обработку динамичных сцен в играх, где технология генерации кадров может создавать артефакты. Функция предлагает два режима работы:

  • Repeat Frame (Повтор кадра) — предназначен для сохранения качества путём повтора последнего кадра, что сводит к минимуму такие артефакты, как двоение или размытие;
  • Blended Frame (Смешанный кадр) — смешивает последовательные кадры для повышения общей плавности игрового процесса, но за счёт возможного размытия в динамичных сценах.

Текущая предварительная версия драйвера PyTorch Preview Edition 25.120.01.14 для Windows поддерживает только видеокарты Radeon RX 7000 и RX 9000. Скачать драйвер можно здесь.

Tencent выпустила открытую ИИ-модель, которая создаёт целые 3D-миры по одному изображению

На этой неделе китайская компания Tencent представила новую ИИ-модель с открытым исходным кодом HunyuanWorld-Voyager. С её помощью можно генерировать 3D-видеоряд из одного исходного изображения, управляя траекторией камеры для «изучения» виртуальных сцен. Алгоритм одновременно генерирует видео в формате RGB и информацию о глубине (RGB-D), что позволяет осуществлять 3D-реконструкцию без использования традиционных методов моделирования.

 Источник изображений: Tencent

Источник изображений: Tencent

На самом деле результаты работы HunyuanWorld-Voyager не являются настоящими 3D-моделями, но создаётся аналогичный эффект. ИИ-алгоритм генерирует 2D-видеокадры, которые сохраняют пространственную согласованность, как если бы камера перемещалась в реальном 3D-пространстве. В каждой генерации создаётся всего 49 кадров, т.е. примерно две секунды видео. По данным Tencent, несколько клипов могут быть объединены в последовательности продолжительностью «несколько минут». Объекты сохраняют своё положение, когда камера перемещается вокруг них, перспектива изменяется корректно, как если бы это происходило в реальной 3D-среде. Хотя результатом работы является видео с картами глубины, а не полноценные 3D-модели, эти данные можно преобразовывать в 3D-облака точек для дальнейшей реконструкции.

Система работает на основе одного исходного изображения и заданной пользователем траектории камеры. Можно задать движение камеры вперёд, назад, влево, вправо или поворот, для чего предусмотрен интерфейс управления. Система объединяет данные об изображении и глубине с другими данными для формирования видеоряда, отражающего движение камеры, которое задал пользователь.

Основным ограничением всех ИИ-моделей на базе архитектуры Transformer является то, что они в основном имитируют паттерны, найденные в данных для обучения, что ограничивает их возможности в плане «обобщения», т.е. применения этих шаблонов в новых ситуациях, которые не встречались при обучении. Для обучения HunyuanWorld-Voyager исследователи задействовали более 100 тыс. видеоклипов, включая компьютерные сцены на движке Unreal Engine. По сути они обучали ИИ-алгоритм имитировать движение 3D-камер в среде видеоигр.

Большинство ИИ-генераторов, таких как Sora, создают выглядящие правдоподобно кадры друг за другом, не пытаясь отслеживать или поддерживать пространственную согласованность. В отличие от этого HunyuanWorld-Voyager обучен распознавать и воспроизводить закономерности пространственной согласованности, но с добавлением обратной геометрической связи. Когда он генерирует каждый кадр, осуществляется преобразование выходных данных в точечный 3D-объект, после чего эти точки проецируются обратно в 2D для использования в будущих кадрах.

Такой подход заставляет ИИ-модель сопоставлять изученные ранее шаблоны с геометрически согласованными проекциями, полученными в процессе работы. Это обеспечивает гораздо лучшую пространственную согласованность, чем у других ИИ-генераторов видео. Однако в основе подхода всё же лежит сопоставление паттернов, основанное на геометрических ограничениях, а не полноценное «понимание» 3D. Это объясняет, почему ИИ-модель может сохранять согласованность в течение нескольких минут, но с трудом справляется с поворот сцены на 360°. Ошибки при сопоставлении с образцом накапливаются на протяжении многих кадров до тех пор, пока геометрические ограничения уже не могут поддерживать согласованность.

По данным Tencent, HunyuanWorld-Voyager использует в работе два основных блока, работающих совместно. Во-первых, система генерирует цветное видео и информацию о глубине одновременно, чтобы убедиться, что они идеально совпадают. Во-вторых, используется то, что Tencent называет «глобальным кэшем» — растущая коллекция точечных 3D-моделей, созданных из ранее сгенерированных кадров. В процессе генерации новых кадров это облако 3D-точек проецируется обратно в 2D с нового ракурса камеры для создания изображений, показывающих то, что должно быть видно на основе предыдущих кадров. Затем модель использует эти проекции для проверки согласованности, обеспечивая соответствие новых кадров уже сгенерированным.

HunyuanWorld-Voyager развивает идеи более ранней ИИ-модели Tencent HunyuanWorld 1.0, которая была выпущена в июле. Алгоритм также является частью более масштабной экосистемы Tencent Hunyuan, которая также включает в себя алгоритмы Hunyuan3D-2 для генерации 3D-объектов по текстовому описанию и HunyuanVideo для генерации видео.

Для обеспечения работоспособности HunyuanWorld-Voyager требуются значительные вычислительные мощности. Tencent рекомендует использовать не менее 60 Гбайт видеопамяти для получения 3D-сцен с разрешением 540p или 80 Гбайт видеопамяти для повышения качества картинки. Получить доступ к исходному коду ИИ-модели и сопутствующей документации можно на портале Hugging Face. Как и другие ИИ-модели семейства Hunyuan, новый алгоритм поставляется с существенными лицензионными ограничениями. К примеру, лицензия запрещает использовать HunyuanWorld-Voyager в ЕС, Великобритании и Южной Корее. Отдельного лицензирования требует коммерческое использование, предполагающее обслуживание более 100 млн пользователей в месяц.

Google открыла бесплатный доступ к генератору видео Veo 3, но только на эти выходные

В эти выходные чат-бот на основе искусственного интеллекта Google Gemini предоставит пользователям бесплатного приложения возможность опробовать версию новейшей модели генерации видео Google Veo 3, анонсированной в мае. С её помощью можно создавать на основе запросов 8-секундные клипы со звуком. Отметим для россиян, что эта услуга доступна только с зарубежного IP-адреса.

 Источник изображения: 9to5google

Источник изображения: 9to5google

С июля платные подписчики Google AI Pro по всему миру могут создавать три видео в день с помощью более дешёвой, чем Veo 3, модели Veo 3 Fast, которая генерирует видео в два раза быстрее с разрешением 720p. При этом владельцы подписки Google AI Ultra имеют расширенный доступ к полной версии. Им также доступна функция преобразования фото в видео.

Однако в рамках акции с текущего момента до 22:00 по тихоокеанскому времени воскресенья (понедельник, 9:00 мск) пользователи бесплатной версии Gemini смогут создать три видео с помощью модели Veo 3 Fast. Глава ИИ-сервиса Gemini Джош Вудворд (Josh Woodward) сообщил в четверг в соцсети X, что Google «настраивает массу TPU» перед пробным периодом, чтобы справиться с ожидаемым ростом запросов.

При открытии приложения Gemini можно увидеть сообщение об акции. Если его нет, необходимо нажать на указатель с тремя точками на панели подсказок, чтобы открыть новый элемент «Видео: Генерация с Veo». Запрос пользователя должен «описывать сцену с добавленными деталями, такими как визуальный стиль и фоновая музыка». Можно также указать в описании диалоги и фоновый шум. Создание займёт несколько минут, после чего пользователи смогут скачать клип с водяным знаком (значок Veo в правом нижнем углу) или получить ссылку для общего доступа.


window-new
Soft
Hard
Тренды 🔥
10 тысяч модов и 350 миллионов загрузок: Larian похвасталась новыми достижениями игроков Baldur’s Gate 3 6 ч.
Вызывающий привыкание роглайк Ball x Pit достиг миллиона проданных копий и в 2026 году получит новые шары 7 ч.
Соавтор Counter-Strike признался в любви к русской культуре и рассказал о «самом депрессивном» периоде за 25 лет карьеры 9 ч.
Apple резко снизила награды багхантерам — при этом рост вредоносов в macOS бьёт рекорды 9 ч.
Mortal Kombat 1, Routine и Dome Keeper возглавили первую волну декабрьских новинок Game Pass, а Mortal Kombat 11 скоро подписку покинет 10 ч.
Google закрыла 107 дыр в Android — две нулевого дня уже использовались в атаках 10 ч.
В YouTube появился Recap — пользователям расскажут, чем они занимались на платформе в течение года 10 ч.
ИИ-агенты научились взламывать смарт-контракты в блокчейне — это риск на сотни миллионов долларов 10 ч.
Инструмент YouTube для защиты блогеров от дипфейков создал риск утечки их биометрии 11 ч.
В Microsoft Teams появились «иммерсивные встречи» в метавселенной с аватарами без ног 11 ч.