Сегодня 22 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → генератор
Быстрый переход

Власти Японии призвали OpenAI соблюдать авторские права по отношению к манге и аниме при генерации видео в Sora 2

Компания OpenAI недавно анонсировала обновлённую версию Sora 2 — сервиса по созданию видео силами искусственного интеллекта по текстовому запросу. Внимание общественности к подобным инструментам выросло и по линии правообладателей, в Японии на их защиту встало правительство, которое потребовало от OpenAI обеспечить адекватную защиту.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Как сообщает The Japan Times, министр цифровых технологий Японии Масааки Таира (Masaaki Taira) в интервью телеканалу TBS признался, что правительство страны запросило у OpenAI изменение в подходе к учёту интересов правообладателей при взаимодействии с пользователями Sora 2. Те, правообладатели, которые потребуют от OpenAI ограничить использование своих защищаемых законом персонажей в среде Sora 2, должны будут обратиться к американскому стартапу с соответствующим запросом. Изначально предполагалось, что запрет будет распространяться на всех правообладателей, и желающие от него отказаться будут подавать соответствующие заявки OpenAI.

Японский министр подчеркнул, что необходимо создать механизм, который позволит правообладателям получать материальную компенсацию за использование их персонажей на платформе OpenAI Sora. Власти страны также потребовали от OpenAI предусмотреть возможность удаления контента по запросу правообладателей. Сообщается, что компания согласилась с подобными требованиями. Глава стартапа Сэм Альтман (Sam Altman) ранее сообщал, что предоставит правообладателям более тонкий контроль за созданием образов, и это будет напоминать заявительную модель контроля за схожестью персонажей, но с дополнительными возможностями.

«Аниме и манга являются незаменимыми сокровищами нашей страны», — заявил министр Минору Киути (Minoru Kiuchi), отвечающий за государственную стратегию в области интеллектуальной собственности, добавив, что данные виды художественных произведений ценятся по всему миру. Правительство Японии, по словам чиновника, хотело бы отвечать на новые вызовы соответствующим образом.

Sora 2 уже навлекла на себя волну критики, связанную с возмущением родственников усопших знаменитостей, внешность которых пользователи сервиса начали свободно использовать для создания видео с использованием образов покойных. В Японии резонанс вызвало использование авторами видеороликов популярных в стране элементов местной культуры из миров Pokemon, One Piece и Dragon Ball Z. Представители Nintendo не стали напрямую критиковать политику OpenAI, но в целом выразили готовность защищать свою интеллектуальную собственность в суде. За пять дней с момента запуска Sora 2 приложение в App Store было скачано 1 млн раз.

Google выпустила ИИ-генератор видео Veo 3.1 с повышенным реализмом и улучшенным звуком

Google представила обновлённую версию ИИ-модели для генерации видео Veo 3.1. Модель генерирует более реалистичные видеоклипы, точнее следует текстовым запросам пользователя и получила значительные улучшения в области звукового сопровождения.

 Источник изображения: Google

Источник изображения: Google

Как пишет TechCrunch, модель Veo 3.1 развивает функциональность, представленную в мае в версии Veo 3, добавляя аудиосопровождение ко всем существующим возможностям редактирования — от привязки персонажей к референсным изображениям до ИИ-генерации клипов, включая возможность продления существующего видео на основе последних нескольких кадров.

По словам представителей Google, благодаря этим улучшениям создаваемые ролики становятся «более живыми». Veo 3.1 будет доступна в видеоредакторе Flow, а также в приложении Gemini, через Gemini API и централизованную платформу Vertex AI. Пользователи Flow также смогут удалять существующие объекты из видео. С момента запуска Flow в мае пользователи создали с его помощью свыше 275 миллионов видеороликов.

Microsoft представила первый ИИ-генератор изображений собственной разработки — MAI-Image-1

Подразделение Microsoft AI, отвечающее за разработки в сфере искусственного интеллекта, анонсировало алгоритм MAI-Image-1 — первый ИИ-генератор изображений по текстовому описанию, полностью созданный внутри компании. Софтверный гигант, не так давно представивший свои первые ИИ-модели, назвал новый генератор изображений «следующим шагом на нашем пути».

 Источник изображения: Microsoft

Источник изображения: Microsoft

Microsoft заявила, что собирала отзывы профессиональных создателей контента, чтобы избежать «повторяющихся или шаблонно-стилизованных результатов». Компания утверждает, что MAI-Image-1 «превосходно справляется» с созданием фотореалистичных изображений. Кроме того, алгоритм способен обрабатывать запросы и генерировать изображения быстрее, чем «более крупные и медленные модели». MAI-image-1 уже занял место в топ-10 рейтинга бенчмарка LMArena, пользователи которого могут сравнивать результаты работы разных нейросетей и выбирать лучшие из них.

Алгоритм MAI-Image-1 присоединился к списку других ИИ-продуктов Microsoft, таким как генератор голоса MAI-Voice-1 и чат-бот MAI-1-preview. Microsoft была одним из первых и крупнейших инвесторов OpenAI, но со временем отношения между компаниями стали всё более сложными. На этом фоне Microsoft начала использовать ИИ-модели Anthropic для обеспечения работоспособности некоторых функций на платформе Microsoft 365, а также делать существенные инвестиции в разработку собственных нейросетей.

Intel XeSS 3 с мультикадровым генератором будет автоматически доступна в играх с поддержкой XeSS 2

Новый апскейлер Intel XeSS 3 будет поддерживаться всеми играми с поддержкой XeSS 2. Об этом рассказал заслуженный исследователь Intel Том Петерсен (Tom Petersen). Новая технология масштабирования будет включать мультикадровый генератор XeSS-MFG.

 Источник изображений: Intel

Источник изображений: Intel

В рамках мероприятия Intel Tech Tour компания подтвердила, что игры с поддержкой XeSS 2 будут полностью совместимы с новой технологией XeSS 3. На данный момент XeSS 2 поддерживают 50 игр, а более 250 имеют поддержку XeSS 1 или 1.3. XeSS 3 будет выступать в качестве готовой замены, используя тот же API и не требуя никаких изменений от разработчиков.

Технология XeSS 3 Multi-Frame Generation будет являться частью Intel Graphics Software и предложит несколько режимов генерации кадров (2x, 3x и 4x). Intel не предоставила детали сравнения работы разных режимов, но показала два примера в играх Painkiller (настройки «эпичные», разрешение 1080p) и Dying Light: The Beast (настройки «максимальные», разрешение 1080p), работающих с XeSS 3 MFG 4x и максимальным апскейлом на встроенной графике на базе графических ядер 12 ядер Xe3 в составе процессора Panther Lake с TDP 42 Вт. В первой игре технология обеспечила около 250 кадров в секунду, во второй — около 130.

Метод мультикадровой генерации Intel очень похож на то, что делает Nvidia с её MFG в составе DLSS4. Технология создаёт несколько сгенерированных кадров на основе двух настоящих, что призвано повысить плавность игрового процесса. До недавнего времени у Intel не было собственной функции ИИ-генерации кадров, но теперь она может дать Intel преимущество перед AMD, которая до сих пор использует интерполяцию отдельных кадров и отстаёт от Nvidia в этой области. Intel пока не сообщила все детали о XeSS 3. Ожидается, что технология дебютирует в начале 2026, с выпуском процессоров Panther Lake.

Intel представила апскейлер XeSS 3 и технологию мультикадровой генерации XeSS-MFG

На конференции Intel Tech Tour компания Intel официально анонсировала XeSS 3 — следующую крупную версию своей технологии апскейлинга на основе искусственного интеллекта. Также была представлена новая функция XeSS-MFG (Multi-Frame Generation), расширяющая возможности XeSS за пределы традиционной однокадровой интерполяции.

 Источник изображений: Intel

Источник изображений: Intel

Функция XeSS-MFG станет главным нововведением в XeSS 3 и предназначена для генерации нескольких промежуточных кадров для более плавной анимации и более высокой воспринимаемой частоты кадров. Речь идёт об аналоге технологии мультикадровой генерации, которая присутствует в составе Nvidia DLSS 4.

До этого у Intel не было собственной технологии однокадровой генерации. Но компания решила перейти сразу к многокадровой интерполяции, способной создавать до четырёх кадров из двух исходных. XeSS-MFG использует оптическую сеть потоков, построенную на векторах движения и буферах глубины, интерполируя по три дополнительных кадра, чтобы обеспечить увеличение частоты кадров вплоть до четырёхкратного.

Благодаря технологии XeSS-MFG Intel становится вторым поставщиком графических процессоров, поддерживающим многокадровую генерацию после Nvidia с её DLSS 4. При этом XeSS-MFG будет поддерживать все графические процессоры Arc с матричными движками XMX, включая графику Arc A-серии, встроенную графику процессоров Core Ultra 200 (Xe2) и будущие продукты Arc B-серии (Xe3). Более старые графические процессоры на архитектуре Xe1 также получат поддержку, но позже. Таким образом, Intel станет первой компанией, внедрившей многокадровую генерацию сразу на нескольких поколениях оборудования.

Intel также подтвердила появление новых настроек в своём приложении Graphics Software для управления графикой. Функция Frame Generation Override позволит вручную выбирать режимы генерации 2x, 3x, 4x или доверить это приложению. В этом же обновлении добавлена функция Shared GPU/NPU Memory Override, позволяющая выделять системную память для рабочих нагрузок iGPU и NPU, аналогично функции общей памяти у AMD.

Компания также анонсировала предстоящую поддержку прекомпиляции шейдеров через систему Microsoft Advanced Shader Delivery. Она позволит драйверам Intel загружать предварительно скомпилированные шейдеры из облака, что уменьшит задержки при первом запуске игр и сократит время загрузки.

Утилита PresentMon для мониторинга будет обновлена для поддержки MFG. Она будет отслеживать как родные кадры, так и сгенерированные. Intel также представила технологию Intelligent Bias Control v3, улучшающую планирование работы графических процессоров и энергоснабжение будущих систем на кристалле Panther Lake.

Intel не сообщила дату выпуска XeSS 3 и других представленных функций, но ожидается, что они дебютируют с платформой Panther Lake и графической архитектурой Xe3 в 2026 году.

ИИ нашёл себя в маркетинге: каждый четвёртый пресс-релиз написан нейросетью

Похоже, что есть сфера, где искусственный интеллект нашёл применение — это работа в корпоративных пресс-службах. На это указывают данные исследования, которые были опубликованы в журнале Patterns. Авторы работы провели анализ письменных материалов, которые публиковались корпоративными и государственными структурами в период после появления ChatGPT. Оказалось, что ИИ, вероятно, регулярно использовался для генерации разных материалов — от пресс-релизов до объявлений о вакансиях.

 Источник изображения: Shutterstock

Источник изображения: Shutterstock

Исследователи изучили тысячи примеров текстов со всего интернета, включая такие популярные платформы для корпоративных новостей, как Newswire, PRWeb и PRNewswire. В результате было установлено, что с момента запуска ChatGPT в ноябре 2022 года примерно каждый четвёртый пресс-релиз был сгенерирован ИИ, причём в публикациях, связанных с наукой и технологиями, этот показатель даже выше.

Ещё генеративные ИИ-алгоритмы часто использовались при написании объявлений о вакансиях. Исследователи установили, что созданный ИИ текст встречается примерно в 6-10 % объявлений о вакансиях на платформе LinkedIn. Примечательно, что чаще к помощи нейросетей прибегают небольшие компании (около 15 % от общего количества таких объявлений).

Любопытно, что созданный ИИ текст встречается не только в материалах, публикуемых представителями корпоративного сегмента. Исследователи изучили пресс-релизы Организации Объединённых Наций за последние годы. Они установили с большой долей вероятности, что сотрудники ООН регулярно используют ИИ при написании пресс-релизов. Авторы работы подсчитали, что доля созданных с помощью ИИ текстов выросла с 3,1 % в первом квартале 2023 года до 10,1 % к третьему кварталу того же года. При этом к третьему кварталу 2024 года этот показатель достиг рекордных 13,7 %.

Любопытно и то, что, по всей видимости, уровень использовании ИИ в данном сегменте достиг своего максимума и не продолжает расти. Для написания пресс-релизов пик использования ИИ был достигнут в декабре 2023 года, когда около 24,3 % попавших в исследование материалов с большой долей вероятности были созданы с использованием нейросетей. С тех пор уровень использования ИИ-алгоритмов снизился примерно на 0,5 % и практически не меняется. Что касается объявлений, то здесь прослеживается аналогичная динамика. Если же говорить об использовании ИИ в ООН, то там, похоже, рост сохраняется, но его темпы значительно замедлились.

В потребительском сегменте внедрение генеративных технологий на базе ИИ проходит по похожему сценарию. Чтобы понять, как обычные люди используют ИИ, исследователи собрали и обработали более 687 тыс. жалоб, которые были поданы в Бюро финансовой защиты потребителей в период с 2022 года по 2024 год. Оказалось, что 18 % из них с большой долей вероятности были составлены с помощью ИИ. Любопытно и то, что люди, проживающие в регионах с более низким уровнем образования, немного чаще использовали ИИ-алгоритмы для написания жалоб, чем другие.

Это несколько противоречит многим технологическим трендам, поскольку чаще всего новыми технологиями начинают пользоваться более молодые и образованные люди. Однако ИИ-инструменты, особенно бесплатные генераторы текста, вполне могут развиваться по другому сценарию. Авторы исследования планируют продолжить работу, чтобы более точно оценить уровень проникновения нейросетей в разные сферы деятельности человека.

Sora поделится прибылью — OpenAI предложит роялти за использование персонажей Disney и других

Проблема защиты авторских прав при использовании генерируемого нейросетями контента давно будоражит заинтересованных правообладателей, в сфере заимствования текстовой информации она уже породила серию крупных судебных дел с многомиллиардными исками. OpenAI хочет предоставить правообладателям возможность регулировать использование своей интеллектуальной собственности в Sora.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Напомним, что речь идёт о средстве создания видео при помощи искусственного интеллекта, которое недавно вышло в обновлённом варианте. Глава OpenAI Сэм Альтман в своём блоге в пятницу заявил, что компания предоставит правообладателям более чёткий контроль над созданием персонажей, которые изначально были придуманы ими. Телекомпании и киностудии смогут блокировать использование тех образов создателями видео в Sora, которых сочтут ограничить в копировании и воспроизведении. По данным Reuters, студия Disney уже выразила намерения блокировать использование своего материала в Sora.

Альтман добавил, что при этом OpenAI собирается ввести механизм монетизации для тех правообладателей, которые разрешат использование своих персонажей в Sora. По сути, они смогут получать своего рода роялти. Люди создают видео гораздо активнее, чем ожидала OpenAI, нередко для ограниченной аудитории, потребность в монетизации такого контента становится всё более очевидной. Впрочем, Альтман не скрывает, что попытки реализовать монетизацию в этой сфере пройдут путём проб и ошибок, и нужного результата не удастся добиться сразу. Компания готова испытать несколько вариантов, прежде чем остановится на лучшем из них.

OpenAI представила Sora 2 — ИИ-генератор видео с реалистичной физикой и логикой, а также возможностью встроить в ролик самого себя

OpenAI анонсировала Sora 2 — флагманскую ИИ-модель для генерации видео и аудио, которую в компании позиционируют как огромный качественный скачок по сравнению с оригинальной Sora и сравнивают с GPT-3.5, ставшей революционной для генерации текста. Разработчики отмечают, что новая модель приближает ИИ-симуляцию мира к уровню, когда искусственный интеллект начинает «понимать» физику и динамику объектов почти так же, как человек.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Если ранние модели для генерации видео часто создавали правдоподобную «картинку», но не справлялись с элементарной логикой движений — например, могли «телепортировать» баскетбольный мяч в корзину при промахе, то Sora 2 моделирует именно поведение объектов. Промах — значит, мяч отскочит от щита. Фигурист, делающий тройной аксель, может ошибиться и упасть. Система научилась имитировать не только успех, но и провал — ключевое требование для создания реальных симуляторов мира и продвинутых роботов. Разработчики обещают, что теперь не будет странных деформаций объектов и нарушений логики сцены в угоду соблюдению промпта.

Контролируемость — ещё один акцент, отмечаемый OpenAI. Модель Sora 2 уверенно справляется со сложными многошаговыми сценами, удерживая непротиворечивое состояние объектов, локаций и света. В качестве примера приводятся ролики, где фигуристка выполняет сложную программу из нескольких элементов с котом на голове, или где герой аниме вовлечён в зрелищную битву. Всё это — с сохранением целостности мира, связности кадров и даже эмоций на лицах персонажей. Sora 2 умеет работать с несколькими стилями: реалистичным, кинематографичным и аниме.

Как универсальная система генерации видео и аудио, Sora 2 способна создавать сложные фоновые звуковые ландшафты, речь и звуковые эффекты с высокой степенью реалистичности. Для этого достаточно короткой видеозаписи: модель точно воспроизведёт внешность, мимику и даже голос, органично интегрируя их в любую сцену. Эта возможность универсальна и работает для любого человека, животного или объекта, отмечает пресс-релиз OpenAI.

Одновременно с выпуском Sora 2 компания OpenAI запускает социальное iOS-приложение Sora. В нём пользователи смогут генерировать ролики и делиться ими с друзьями, а также делать ремиксы на работы друг друга, находить новые видео в настраиваемой ленте Sora и добавлять себя или своих друзей с помощью функции «камео». С помощью «камео» можно попасть в любую сцену Sora с поразительной точностью — нужно только через само приложение записать короткое видео с собой и свой голос для подтверждения личности и захвата образа.

«На прошлой неделе мы запустили приложение внутри OpenAI. Наши коллеги уже сообщили нам, что благодаря этой функции они завели новых друзей в компании. Мы считаем, что социальное приложение, построенное вокруг функции “камео”, — лучший способ ощутить всю магию Sora 2», — отметила OpenAI в пресс-релизе.

OpenAI подчеркнула, что этическое и ответственное использование станет важной частью новой платформы. Пользователь сам будет решать, кто и как может использовать его «камео»; любое видео с участием пользователя можно удалить в любой момент. Контент с откровенно вредным содержанием или созданный без согласия людей блокируется на уровне алгоритмов и модераторов.

Приложение Sora уже доступно для скачивания пользователям iPhone в США и Канаде, регистрация проходит через систему приглашений. Через несколько недель Sora 2 станет доступна в веб-версии. Базовая версия бесплатна и имеет «щедрые лимиты», а подписчики ChatGPT Pro вскоре получат доступ к экспериментальной модели Sora 2 Pro с повышенным качеством. Монетизация пока туманна: единственный план — брать деньги за дополнительные генерации при высоком спросе. Расширение географии сервиса и открытие доступа через API входят в планы на ближайшее время.

Генератор видео Grok Imagine стал доступен бесплатно для всех

Специализирующийся на разработке технологий искусственного интеллекта стартап Илона Маска (Elon Musk) xAI оперативно подготовил ответ на выход новой флагманской модели OpenAI GPT-5 — компания сделала генератор видео Grok Imagine доступным бесплатно для всех желающих. Об этом говорится в сообщении администрации соцсети X.

 Источник изображения: x.com/X

Источник изображения: x.com/X

Grok Imagine является одним из немногих общедоступных и бесплатных генераторов видео на основе ИИ. Он создаёт короткие ролики на основе загружаемых пользователями изображений. Сервис работает на базе модели Aurora и генерирует ролики длиной до 15 секунд. Первоначально функция была доступна только для подписчиков SuperGrok в отдельном приложении Grok и для подписчиков Premium+ в соцсети X, но теперь ограничения для приложения Grok решили убрать.

Сервис предлагает создание видео в трёх режимах: в Normal генерируются «профессиональные» ролики, Fun предназначается для забавного контента, а Spicy открывает доступ к созданию материалов деликатного характера, но с ограничениями и строгой модерацией. Есть мнение, что пока Grok Imagine по реалистичности видео и аудио уступает лидерам отрасли, таким как Google Veo 3 и OpenAI Sora.

Воспользоваться генератором видео Grok Imagine можно в приложениях Grok для Android и iOS — достаточно обновить их до последней версии.

Alibaba представила ИИ-генератор изображений Qwen-Image с высокой степенью грамотности

Alibaba представила модель искусственного интеллекта Qwen-Image 20B MMDiT, предназначенную для работы с изображениями — в ней разработчик значительно улучшил механизмы прорисовки сложных текстов и реализовал возможности точного редактирования изображений.

 Источник изображения: huggingface.co/Qwen

Источник изображения: huggingface.co/Qwen

Модель, доступ к которой откроется на платформе Qwen Chat в разделе «Генерация изображений», обладает расширенными возможностями рендеринга текста, в том числе многострочных макетов с семантикой на уровне абзацев и детализированными элементами. Поддерживаются языки на основе букв и иероглифов. Усовершенствованные механизмы многозадачного обучения помогли расширить возможности редактирования изображений с сохранением смыслового наполнения и визуального реализма.

Новая Qwen-Image, уверяет Alibaba, обошла существующие решения в нескольких тестах по задачам на генерацию и редактирование изображений, включая GenEval, DPG, OneIG-Bench, GEdit, ImgEdit и GSO. Особых успехов удалось добиться в тестах на качество прорисовки текста, таких как LongText-Bench, ChineseWord и TextCraft — новая модель превзошла современные аналоги. Qwen-Image, в частности, справляется с точным отображением китайских иероглифов на вывесках магазинов с правильной глубиной резкости, с созданием детализированного английского текста на обложках книг и информационных слайдах, поддерживается работа с двуязычным контентом.

Помимо обработки текста, модель свободно ориентируется в художественных жанрах от фотореализма до импрессионизма; поддерживаются различные операции при редактировании изображений, в том числе изменение стиля, добавление, удаление и улучшение деталей, а также редактирование текста и изменение поз у персонажей. В проекте Qwen-Image разработчики Alibaba, по их словам стремились способствовать развитию генерации изображений, снизить технические барьеры для создания визуальных материалов и вдохновить коллег на инновационные приложения.

xAI запустила Grok Imagine — платный ИИ-генератор изображений и видео с «пикантным режимом»

Компания xAI Илона Маска (Elon Musk) официально представила Grok Imagine — генератор изображений и видео, доступный для подписчиков тарифных планов SuperGrok и Premium+. Как и обещал Маск, позиционирующий Grok как ИИ, свободный от цензуры, Grok Imagine позволяет создавать контент, который обычно в интернете маркируется аббревиатурой NSFW (not safe/suitable for work — «небезопасно/неподходяще для демонстрации на работе»).

 Источник изображения: @elonmusk

Источник изображения: @elonmusk

Grok Imagine преобразовывает текстовые или графические запросы в 15-секундные видеоролики с оригинальным звуком и предлагает «пикантный режим», позволяющий пользователям создавать контент сексуального характера, включая частичную наготу. Пример такого видео опубликовал в своём аккаунте X Илон Маск. Журналисты TechCrunch сообщили, что многие из опробованных ими (во имя журналистики, конечно!) пикантных запросов привели к появлению «модерированных» размытых изображений, однако изображения полуобнажённых тел им получить удалось.

NSFW-контент неудивителен для xAI, учитывая выход в прошлом месяце пикантного аниме-компаньона Ani с искусственным интеллектом. Но так же, как необузданная натура Grok была забавной, пока он не начал изрыгать оскорбительный, антисемитский и женоненавистнический контент, появление Grok Imagine может повлечь за собой свои непредвиденные последствия.

При этом в Grok Imagine предусмотрены серьёзные ограничения, особенно учитывая, что модель позволяет создавать контент с изображениями знаменитостей. Так, попытки журналистов TechCrunch сгенерировать изображение беременного Дональда Трампа (Donald Trump) успехом не увенчались — Grok Imagine создавал либо изображения Трампа с младенцем на руках, либо рядом с беременной женщиной.

Grok Imagine стремится конкурировать с такими игроками, как Google DeepMind, OpenAI, Runway и китайские нейросети, но пока находится на начальном этапе развития. По отзывам тестировщиков, генерируемые им изображения и видео людей нередко выглядят мультяшно, особенно из-за неестественной текстуры кожи.

Тем не менее, генератор впечатляет: изображения создаются за считаные секунды и продолжают формироваться автоматически по мере прокрутки страницы. Затем их можно анимировать в стилизованные видеоролики. Пользовательский интерфейс удобен и интуитивно понятен.

Недавно Маск заявил о намерении создать Baby Grok — чат-бот, пригодный для работы с детским контентом. Учитывая, насколько скандально развивается «взрослая версия» Grok, подобное направление экспансии довольно рискованно. Тем не менее, с точки зрения охвата аудитории эта ставка вполне может себя оправдать. Популярность Baby Grok может стать дополнительным источником дохода для xAI и новой статьёй расходов для родителей.

Google представила экспериментальный ИИ-генератор веб-приложений Opal

Специализированные инструменты для генерации программного кода при помощи искусственного интеллекта в последние несколько месяцев стали чрезвычайно популярными — многим работающим в этом направлении стартапам приходится почти отбиваться от желающих вложиться в них или даже поглотить. К модному тренду подключилась и Google, представившая экспериментальный проект Opal.

 Источник изображения: Google

Источник изображения: Google

Инструмент Opal доступен в экспериментальном разделе Google Labs и только в США. Он позволяет по текстовым запросам создавать небольшие веб-приложения либо с нуля, либо изменять присутствующие в библиотеке. Пользователю достаточно описать, что он хочет получить на выходе, и Opal при помощи различных моделей Google сделает работу за него.

Когда мини-приложение готово, можно перейти в панель редактора и увидеть рабочую схему, в которой представлены ввод запроса, этапы генерации кода и вывод результата. В панели доступен выбор любого из этапов с описанием текущего процесса — его при необходимости можно отредактировать или добавить новый этапе с панели инструментов.

Готовое приложение можно опубликовать и поделиться с другими пользователями, у которых есть учётные записи Google. В арсенале компании уже есть средства генерации приложений по текстовому описанию, но подробное визуальное представление рабочего процесса указывает, что Google, возможно, стремится охватить более широкую аудиторию. Прототипы приложений без необходимости писать код позволяют также генерировать платформы Canva, Figma и Replit.

«Лучший на сегодня» ИИ-генератор изображений Google Imagen 4 стал доступен бесплатно для всех

Компания Google представила ИИ-генератор изображений следующего поколения — Imagen 4, назвав его «лучшей на сегодняшний день моделью преобразования текста в изображение». «Imagen 4 предлагает значительно улучшенную визуализацию текста по сравнению с нашими предыдущими моделями и расширяет границы качества генерации изображений по тексту», — сообщила компания.

 Источник изображений: Google Developers Blog

Источник изображений: Google Developers Blog

Imagen 4 доступен в виде платной предварительной версии через API Gemini, а также для ограниченного бесплатного тестирования — в Google AI Studio. В настоящее время семейство Imagen 4 включает две модели: Imagen 4 и Imagen 4 Ultra.

Модель преобразования текста в изображение Imagen 4 разработана для решения широкого спектра задач генерации изображений с существенным улучшением качества — особенно при работе с текстом — по сравнению с Imagen 3. Стоимость использования Imagen 4 составляет $0,04 за одно сгенерированное изображение.

Флагманская модель Imagen 4 Ultra предназначена для создания изображений, максимально точно соответствующих текстовым подсказкам пользователя, что позволяет добиться лучших результатов по сравнению с другими ведущими генеративными моделями. Стоимость одного изображения, созданного с помощью Imagen 4 Ultra, составляет $0,06.

Все изображения, созданные моделями Imagen 4, получают маркировку в виде невидимого цифрового водяного знака SynthID.

Adobe выпустила мобильное приложение со всеми генеративными ИИ-инструментами Firefly

Платформа генеративных ИИ-сервисов Adobe Firefly теперь доступна на устройствах, работающих под управлением Android и iOS. Новое мобильное приложение Firefly позволяет пользователям генерировать изображения и видео по текстовому описанию, а также экспериментировать с популярными ИИ-инструментами для редактирования фотографий.

 Источник изображения: Adobe

Источник изображения: Adobe

Приложение Firefly для Android и iOS включает в себя фирменные алгоритмы Adobe для преобразования текста в изображения и видео, а также генеративные функции, такие как Generative Fill и Generative Expand, которые ранее были доступны в Photoshop. В дополнение к этому пользователи приложения могут взаимодействовать с ИИ-моделями сторонних разработчиков, такими как Google Imagen 3 и Imagen 4 для создания картинок, Veo 2 и Veo 3 для создания видео, а также генератором изображений OpenAI.

Созданный в приложении Firefly контент автоматически синхронизируется с учётной записью пользователя на платформе Creative Cloud, что упрощает его дальнейшее размещение в интернете или обработку в других приложениях Adobe. Как и в случае с веб-приложением Firefly, для взаимодействия с некоторыми ИИ-инструментами необходимы кредиты Firefly, которые можно получить в рамках ежемесячных обновлений или путём оформления одного из платных тарифов Creative Cloud.

Вместе с этим Adobe расширила возможности генерации видео в публичной бета-версии платформы интерактивных досок Firefly Boards. Теперь пользователи могут повторно микшировать загруженные клипы и генерировать новые кадры с помощью ИИ-модели Firefly, а также сторонних инструментов, таких как Veo 3 от Google. В ближайшее время разработчики также внедрят на платформу больше партнёрских ИИ-моделей от сторонних разработчиков для увеличения количества доступных функций.

OpenAI пришлось идти на крайние меры, чтобы справиться с ажиотажем вокруг генерации картинок в стиле Ghibli

Популярность ИИ-решений OpenAI среди пользователей сейчас зашкаливает, и каждый новый продукт пользуется буквально ажиотажным спросом. По словам главы OpenAI Сэма Альтмана (Sam Altman), компании пришлось пойти на необычные меры, чтобы справиться со спросом на создание изображений в стиле японской студии Ghibli Хаяо Миядзаки (Hayao Miyazaki) с помощью генератора изображений в ChatGPT.

 Источник изображения: Growtika/unsplash.com

Источник изображения: Growtika/unsplash.com

Сэм Альтман тогда пошутил, что шумиха вокруг этой функции чуть не расплавила графические процессоры компании, вынудив её на время ввести ограничения на частоту отправки запросов на генерацию изображений, чтобы смягчить проблему. Он буквально умолял пользователей снизить частоту генерации изображений, объясняя просьбу тем, что команде OpenAI нужна передышка и время для отдыха.

Из-за всплеска спроса на картинки в стиле Ghibli от GPT-4o Image Generation аудитория чат-бота ChatGPT менее чем за час увеличилась на 1 млн пользователей. Популярность сервиса объясняется тем, что он позволяет получать более реалистичные изображения по сравнению с другими инструментами, такими как технология генерации изображений DALL-E 3.

В недавнем интервью ресурсу Bloomberg Сэм Альтман признал, что компания была вынуждена идти на «неестественные» меры, чтобы справиться с вирусным эффектом Ghibli. «Я не думаю, что это случалось с какой-либо компанией раньше, — говорит Альтман. — Я видел вирусные моменты, но я никогда не видел, чтобы кто-то сталкивался с таким массовым наплывом использования продукта».

Альтман рассказал, что создание изображения с помощью нового генератора изображений компании требует значительных вычислительных ресурсов, и чтобы справиться со всплеском спроса, OpenAI пришлось сделать много вещей, в том числе позаимствовать вычислительные мощности у исследовательского подразделения OpenAI, а также отсрочить запуск новых функций.

«У нас нет сотен тысяч графических процессоров, которые просто простаивают без дела», — сообщил Альтман, добавив, что если бы у OpenAI было больше графических процессоров, она могла бы лучше справляться с резкими скачками спроса, и ей бы не пришлось прибегать к экстремальным мерам, таким как ограничения по скорости и задержка предоставления новых функций для бесплатных пользователей.


window-new
Soft
Hard
Тренды 🔥
«Жидкое стекло» Apple можно будет заматировать: представлена нова бета iOS 26.1 12 мин.
Сервисы AWS упали второй раз за день — тысячи сайтов по всему миру снова недоступны 8 ч.
Fujitsu влила £280 млн в британское подразделение в преддверии выплат компенсаций жертвам багов в её ПО Horizon 8 ч.
Календарь релизов 20 – 26 октября: Ninja Gaiden 4, Painkiller, Dispatch и VTM – Bloodlines 2 8 ч.
В Windows сломалась аутентификация по смарт-картам после октябрьских обновлений — у Microsoft есть временное решение 9 ч.
Вместо Majesty 3: российские разработчики выпустили в Steam амбициозную фэнтезийную стратегию Lessaria: Fantasy Kingdom Sim 9 ч.
Слухи: Лана Дель Рей исполнит заглавную песню для «Джеймса Бонда», но не в кино, а в игре от создателей Hitman 10 ч.
Зов сердца: разработчики Dead Cells объяснили, почему вместо Dead Cells 2 выпустили Windblown 11 ч.
Adobe запустила фабрику ИИ-моделей, заточенных под конкретный бизнес 11 ч.
Китай обвинил США в кибератаках на Национальный центр службы времени — это угроза сетям связи, финансовым системам и не только 12 ч.
Президент США подписал соглашение с Австралией на поставку критически важных минералов на сумму $8,5 млрд 18 мин.
Новая статья: Обзор смартфона realme 15 Pro: светит, но не греется 5 ч.
Ещё одна альтернатива платформам NVIDIA — IBM объединила усилия с Groq 5 ч.
Учёные создали кибер-глаз, частично возвращающий зрение слепым людям 6 ч.
Samsung выпустила недорогой 27-дюймовый геймерский монитор Odyssey OLED G50SF c QD-OLED, 1440p и 180 Гц 6 ч.
Акции Apple обновили исторический максимум на новостях об отличных продажах iPhone 17 8 ч.
Представлен флагман iQOO 15 с чипом Snapdragon 8 Elite Gen 5 и батареей на 7000 мА·ч по цене меньше $600 9 ч.
Нечто из космоса врезалось в лобовое стекло самолёта Boeing 737 MAX компании United Airlines 10 ч.
Умные кольца Oura научатся выявлять признаки гипертонии, как последние Apple Watch 11 ч.
Дешёвая корейская термопаста оказалась вредна для процессоров и здоровья пользователей 11 ч.