Опрос
|
реклама
Быстрый переход
Adobe выпустила мобильное приложение со всеми генеративными ИИ-инструментами Firefly
17.06.2025 [18:08],
Владимир Фетисов
Платформа генеративных ИИ-сервисов Adobe Firefly теперь доступна на устройствах, работающих под управлением Android и iOS. Новое мобильное приложение Firefly позволяет пользователям генерировать изображения и видео по текстовому описанию, а также экспериментировать с популярными ИИ-инструментами для редактирования фотографий. ![]() Источник изображения: Adobe Приложение Firefly для Android и iOS включает в себя фирменные алгоритмы Adobe для преобразования текста в изображения и видео, а также генеративные функции, такие как Generative Fill и Generative Expand, которые ранее были доступны в Photoshop. В дополнение к этому пользователи приложения могут взаимодействовать с ИИ-моделями сторонних разработчиков, такими как Google Imagen 3 и Imagen 4 для создания картинок, Veo 2 и Veo 3 для создания видео, а также генератором изображений OpenAI. Созданный в приложении Firefly контент автоматически синхронизируется с учётной записью пользователя на платформе Creative Cloud, что упрощает его дальнейшее размещение в интернете или обработку в других приложениях Adobe. Как и в случае с веб-приложением Firefly, для взаимодействия с некоторыми ИИ-инструментами необходимы кредиты Firefly, которые можно получить в рамках ежемесячных обновлений или путём оформления одного из платных тарифов Creative Cloud. Вместе с этим Adobe расширила возможности генерации видео в публичной бета-версии платформы интерактивных досок Firefly Boards. Теперь пользователи могут повторно микшировать загруженные клипы и генерировать новые кадры с помощью ИИ-модели Firefly, а также сторонних инструментов, таких как Veo 3 от Google. В ближайшее время разработчики также внедрят на платформу больше партнёрских ИИ-моделей от сторонних разработчиков для увеличения количества доступных функций. OpenAI пришлось идти на крайние меры, чтобы справиться с ажиотажем вокруг генерации картинок в стиле Ghibli
13.06.2025 [14:59],
Владимир Мироненко
Популярность ИИ-решений OpenAI среди пользователей сейчас зашкаливает, и каждый новый продукт пользуется буквально ажиотажным спросом. По словам главы OpenAI Сэма Альтмана (Sam Altman), компании пришлось пойти на необычные меры, чтобы справиться со спросом на создание изображений в стиле японской студии Ghibli Хаяо Миядзаки (Hayao Miyazaki) с помощью генератора изображений в ChatGPT. ![]() Источник изображения: Growtika/unsplash.com Сэм Альтман тогда пошутил, что шумиха вокруг этой функции чуть не расплавила графические процессоры компании, вынудив её на время ввести ограничения на частоту отправки запросов на генерацию изображений, чтобы смягчить проблему. Он буквально умолял пользователей снизить частоту генерации изображений, объясняя просьбу тем, что команде OpenAI нужна передышка и время для отдыха. Из-за всплеска спроса на картинки в стиле Ghibli от GPT-4o Image Generation аудитория чат-бота ChatGPT менее чем за час увеличилась на 1 млн пользователей. Популярность сервиса объясняется тем, что он позволяет получать более реалистичные изображения по сравнению с другими инструментами, такими как технология генерации изображений DALL-E 3. В недавнем интервью ресурсу Bloomberg Сэм Альтман признал, что компания была вынуждена идти на «неестественные» меры, чтобы справиться с вирусным эффектом Ghibli. «Я не думаю, что это случалось с какой-либо компанией раньше, — говорит Альтман. — Я видел вирусные моменты, но я никогда не видел, чтобы кто-то сталкивался с таким массовым наплывом использования продукта». Альтман рассказал, что создание изображения с помощью нового генератора изображений компании требует значительных вычислительных ресурсов, и чтобы справиться со всплеском спроса, OpenAI пришлось сделать много вещей, в том числе позаимствовать вычислительные мощности у исследовательского подразделения OpenAI, а также отсрочить запуск новых функций. «У нас нет сотен тысяч графических процессоров, которые просто простаивают без дела», — сообщил Альтман, добавив, что если бы у OpenAI было больше графических процессоров, она могла бы лучше справляться с резкими скачками спроса, и ей бы не пришлось прибегать к экстремальным мерам, таким как ограничения по скорости и задержка предоставления новых функций для бесплатных пользователей. Canon бросила вызов Sony, представив высокочувствительный датчик изображения для автомобилей
13.06.2025 [14:57],
Алексей Разин
Вполне объяснимо, что современный автомобиль по количеству бортовых камер превосходит среднестатистический смартфон, а потому для производителей датчиков изображений автомобильный рынок открывает новые перспективы сбыта продукции. Компания Canon отчётливо это понимает, а потому представила высокочувствительный датчик изображений для автомобильных камер. ![]() Источник изображения: Canon Как отмечает Nikkei Asian Review, новинка обладает высокой чувствительностью, позволяя бортовым системам машинного зрения определять пешеходов и другие объекты на вероятной траектории движения не только на значительном удалении, но и в условиях ограниченной для человеческого глаза видимости. Новый датчик устроен по принципу однофотонного лавинного диода (SPAD), до сих пор подобные элементы использовались главным образом в камерах видеонаблюдения, но развитие автомобильной электроники сделало данный сегмент привлекательным для подобных решений. Массовое производство новых датчиков изображений для бортовых систем автомобилей Canon развернёт к 2031 году. Датчики типа SPAD превосходят традиционные для автомобильного сектора CMOS-камеры по способности получать чёткие изображения объектов в условиях низкой освещённости. Над созданием таких датчиков Canon начала работать ещё в 2016 году, но ранние образцы плохо справлялись с обработкой изображений в светлых сценах и потребляли много энергии. Оптимизация помогла в четыре раза снизить энергопотребление датчика типа SPAD по сравнению с прототипом 2022 года. Свои сенсоры нового поколения Canon рассчитывает предлагать по той же цене, что и конкурирующие датчики типа CMOS. По прогнозам Yano Research Institute, к 2030 году ёмкость рынка датчиков для автомобильных систем увеличится более чем в два раза по сравнению с 2024 годом, до половины этого рынка будут формировать как раз датчики изображения. Главным конкурентом Canon на этом рынке остаётся корпорация Sony, хотя в США с ними обеими соперничают Onsemi и OmniVision. Последняя, кстати, формально принадлежит китайской Will Semiconductor. Корпорация Sony ставит перед собой задачу увеличить свою долю данного рынка с 32 до 43 % к концу марта 2027 года. Датчики типа SPAD разработки Sony найдут преимущественное применение в лидарах, а не камерах. Новое решение Sony позволяет в 2,7 раза увеличить разрешающую способность датчиков, при неизменном расстоянии оно определяет в три раза меньшие по размерам объекты по сравнению с датчиками текущего поколения. AMD представила ответ DLSS 4 — FSR Redstone с генерацией кадров, ИИ-освещением и регенерацией лучей
21.05.2025 [15:12],
Николай Хижняк
На выставке Computex 2025 компания AMD анонсировала следующую ступень в эволюции своей технологии FidelityFX Super Resolution (FSR). FSR 4, дебютировавшая вместе с видеокартами серии Radeon RX 9070 в начале года, была лишь очередным шагом к чему-то более масштабному. Теперь AMD представила FSR Redstone — технологию, объединяющую новые версии Super Resolution и генератора кадров, ещё теснее интегрированных с методами машинного обучения. ![]() Источник изображений: ComputerBase.de В новой технологии акцент сделан на трёх ключевых элементах: Neural Radiance Caching, регенерации лучей и генерации кадров, ускоренных с помощью машинного обучения и ИИ. Суть технологии Neural Radiance Caching заключается в том, что нейросеть анализирует, как свет распределяется в трёхмерных сценах, и заранее предсказывает его воздействие на объекты. Это снижает объём вычислений для GPU и ускоряет рендеринг сложных эффектов — таких как отражения и рассеянное освещение. Технология регенерации лучей (Ray Regeneration) — аналог функции реконструкции лучей (Ray Reconstruction), входящей в состав Nvidia DLSS 3.5 и выше. Она предназначена для устранения артефактов, возникающих при трассировке. Нейросеть в реальном времени устраняет шумы, сохраняя детализацию теней и бликов. Наконец, новый генератор кадров, основанный на машинном обучении и входящий в состав FSR Redstone, отличается от версии в FSR 3.1 тем, что использует не интерполяцию, а промежуточные кадры, созданные ИИ с учётом движения объектов и изменений освещения. Это должно значительно уменьшить размытость в динамичных сценах. При этом AMD не заявляла о применении технологии мультикадрового генератора, аналогичной той, что используется в Nvidia DLSS 4. FSR Redstone будет выпущена во второй половине этого года. К сожалению, поддержка технологии будет реализована только на видеокартах с архитектурой RDNA 4. FSR Redstone — это рабочее название. Возможно, финальная версия получит имя FSR 4.1 или, например, FSR 4.5. На Computex компания AMD не сделала никаких заявлений о внедрении поддержки FSR 4 для видеокарт предыдущих поколений. Однако компания отметила, что к 5 июня поддержку FSR 4 будут иметь 60 игр. Японцы изобрели камеру, способную снимать голограммы живых органов в реальном времени
21.05.2025 [12:25],
Геннадий Детинич
«Тайная жизнь мозга» — так могло называться первое видео мозга мыши, снятое научной камерой в 3D-разрешении сквозь кости черепа зверька. Это стало возможным благодаря японской разработке — однопиксельной камере для съёмок голографических видео. Созданная учёными Университета Кобе (Kobe University) камера, обещает малоинвазивное наблюдение за внутренними органами людей и другие применения, где нужна микро-3D-визуализация. ![]() Источник изображения: ИИ-генерация Grok 3/3DNews Сегодня голографические изображения без использования лазеров (когерентного освещения) получают двумя методами — это технология FINCH (Fresnel Incoherent Correlation Holography) в видимом диапазоне и технология OSH (Optical Scanning Holography) за пределами видимого света. Первая даёт возможность снимать движущиеся объекты, а вторая — только неподвижные, но в диапазонах, в которых нет доступных матриц изображения: ультрафиолетовом, инфракрасном и терагерцевом. Подчеркнём, оба метода работают на отражённом и рассеянном естественном свете или за счёт люминесценции, что делает работу платформ достаточно простой и доступной, в отличие от создания голограмм с помощью лазеров. Каждая из них имеет свои преимущества и недостатки, и японские учёные смогли объединить лучшее из каждого метода, создав однопиксельную платформу для съёмки голографических видео даже сквозь рассеивающие свет препятствия. Модернизированная установка OSH получила сканирующую зеркальную систему для проекции на объект специальных узоров, которые благодаря интерференции позволяют восстанавливать объёмное изображение. Отражённый свет собирается однопиксельным датчиком и обрабатывается на компьютере, а, в зависимости от момента, с привлечением искусственного интеллекта. ![]() Источник изображения: Kobe University Традиционные сканеры OSH работали с частотой 60 Гц. Модернизированная установка подсвечивала объект для обработки с частотой 22 кГц, что позволило приблизиться к созданию движущихся голографических изображений. Представленная в эксперименте камера снимала со скоростью один кадр в секунду. В перспективе учёные обещают довести скорость съёмки до 30 к/с, чтобы это было настоящее «киношное» видео. Разработка обещает погрузить учёных в мир голографической микроскопии, обещая упростить медицинские исследования в сфере биологии и здравоохранения. Google научила ИИ-бота Gemini редактировать любые изображения
01.05.2025 [14:22],
Дмитрий Федоров
Google Gemini научился редактировать как сгенерированные ИИ изображения, так и загруженные со смартфона или компьютера. В ближайшие недели новая функциональность станет доступна пользователям в большинстве стран мира, где доступен Gemini, и получит поддержку более чем 45 языков. Россия, напомним, в этот список не входит, однако русский язык Gemini понимает и «говорит» на нём. ![]() Источник изображений: Google Нативное редактирование изображений в ИИ-чат-боте Gemini представляет собой эволюционный шаг в развитии возможностей взаимодействия пользователя с ИИ. Запуск последовал за моделью редактирования изображений с помощью ИИ, которую Google опробовала в марте в своей платформе AI Studio и которая получила широкую огласку благодаря своей спорной способности удалять водяные знаки с любого изображения. Подобно недавно обновлённому инструменту редактирования изображений в ChatGPT, встроенный редактор Gemini теоретически способен достигать более высоких результатов по сравнению с автономными ИИ-генераторами изображений. Теперь Gemini предлагает инновационный «многоэтапный» процесс редактирования, обеспечивающий, по описанию компании, «более богатые и контекстуальные» отклики на каждый запрос — с интеграцией текста и изображений. Функциональность нового редактора позволяет пользователям изменять фон на изображениях, заменять объекты, добавлять элементы и выполнять множество других операций — и всё это непосредственно в интерфейсе Gemini. Подобное решение существенно упрощает процесс создания и редактирования визуального контента, устраняя необходимость переключаться между несколькими специализированными приложениями. ![]() «Например, вы можете загрузить личную фотографию и попросить Gemini сгенерировать изображение того, как вы будете выглядеть с разными цветами волос. Также можно попросить Gemini создать первый черновик сказки на ночь о драконах и сгенерировать иллюстрации к истории», — поясняет Google в своём блоге. Эти примеры наглядно демонстрируют многофункциональность системы, пригодной как для утилитарных, так и для креативных задач. Потенциальные риски технологии в контексте создания дипфейков обоснованно вызывают опасения у специалистов по информационной безопасности. Чтобы нивелировать возможные злоупотребления, Google внедряет технологию невидимых водяных знаков во все изображения, созданные или отредактированные с помощью нативного генератора изображений Gemini. Параллельно компания проводит экспериментальные исследования по внедрению видимых водяных знаков на всех изображениях, сгенерированных с помощью Gemini. Adobe обновила ИИ-генератор изображений Firefly и переработала его веб-приложение
24.04.2025 [14:11],
Владимир Фетисов
Adobe объявила о запуске новой версии ИИ-модели Firefly для генерации изображений, а также алгоритма генерации векторной графики и обновлённого веб-приложения, в котором собраны все генеративные модели компании, а также некоторые нейросети конкурентов. В дополнение к этому разработчики продолжают трудиться над созданием мобильного приложения Firefly. ![]() Источник изображения: Rubaitul Azad / Unsplash Большая языковая модель Firefly Image Model 4, по данным Adobe, превосходит своих предшественниц по качеству генерируемых изображений, скорости обработки запросов и возможностям по настройке параметров создаваемого контента. Поддерживается генерация изображений с разрешением до 2K. Существует также более производительная версия алгоритма Image Model 4 Ultra, которая может создавать сложные сцены с множеством мелких структур и большим количеством деталей. Представитель Adobe рассказал, что разработчики сделали новые ИИ-модели более производительными, чтобы они могли генерировать более детализированные изображения. Помимо прочего, более качественной стала генерация текста на изображениях, а также появилась возможность создавать несколько изображений в том же стиле, что и исходное. Вместе с этим компания открыла доступ всем желающим к своему ИИ-генератору видео Firefly, бета-тестирование которого началось в прошлом году. Алгоритм позволяет создавать видео на основе текстового описания или изображения, менять ракурсы камеры, указывать начальный и конечный кадры, настраивать элементы стиля анимации и др. ИИ-модель может создавать ролики в формате 1080p. ИИ-модель Firefly для создания векторной графики может генерировать пригодные для дальнейшего редактирования векторные иллюстрации, а также итерировать и генерировать варианты логотипов, паттернов и др. Доступ ко всем новым ИИ-моделям Adobe можно получить в обновлённом веб-приложении Firefly. Там также нашлось место генератору изображений GPT от OpenAI, моделям Imagen 3 и Veo 2 от Google, а также алгоритму Flux 1.1 Pro от Flux. Пользователи могут переключаться между этими алгоритмами по своему усмотрению. Adobe также проводит публичное тестирование нового продукта под названием Firefly Boards, который представляет собой холст для творчеств и реализации идей. С его помощью можно генерировать или импортировать изображения, редактировать их, в том числе совместно с другими пользователями платформы. Firefly Boards также будет доступен в веб-приложении Firefly. В дополнение к этому Adobe открыла доступ к API Text-to-Image и Avatar API, а также объявила о начале бета-тестирования API Text-to-Video. Получить доступ к этим и другим программным интерфейсам компании можно через платформу Firefly Services. Adobe и Figma взяли на вооружение передовой генератор изображений от OpenAI
24.04.2025 [12:58],
Павел Котов
Обновлённый генератор изображений OpenAI 4o Image Generation в составе ChatGPT привлёк внимание широкой аудитории благодаря своей способности создавать картинки в стиле студии аниме Ghibli. Теперь компания открыла доступ к «изначально мультимодальной модели» через API — доступ к платформе gpt-image-1 уже начали бронировать для себя крупные партнёры. ![]() Источник изображения: openai.com «Универсальность модели позволяет ей создавать изображения в различных стилях, в точности придерживаться запросов пользователей, применять знания о мире и правильно воспроизводить текст, раскрывая бесчисленное множество сценариев практического применения в различных областях», — говорится в блоге OpenAI. Поработать с моделью смогут пользователи сервисов Adobe и Figma, которые уже включили её поддержку в свои наборы инструментов. Adobe добавила её в приложения Firefly и Express; с сегодняшнего дня генератор изображений gpt-image-1 доступен также в Figma Design, где по простым текстовым запросам он сможет корректировать стили, добавлять или удалять объекты, расширять фоновые изображения и производить множество других операций. OpenAI добавила, что продолжает сотрудничать с другими партнёрами, которые помогут ей раскрыть новые сценарии применения генератора изображений — среди них значатся, в частности, Canva, GoDaddy и Instacart. AMD представила Amuse 3.0 — приложение для ИИ-генерации изображений на Ryzen и Radeon
15.04.2025 [18:45],
Николай Хижняк
Компания AMD представила Amuse 3.0 — программный инструмент для ИИ-генерации изображений. Платформа разработана в партнёрстве с компанией TensorStack AI. Она использует мощности процессоров AMD Ryzen AI и видеокарт Radeon RX для создания изображений и коротких видеороликов локально на ПК. ![]() Источник изображений: TechPowerUp / AMD AMD заявляет, что платформа Amuse 3.0 способна генерировать изображения печатного качества и видеоролики чернового качества (низкого разрешения) длиной до 6 секунд. Amuse 3.0 поддерживает более 100 новых моделей ИИ, включая Stable Diffusion 3.5 и FLUX. Каждая из этих моделей была тщательно оптимизирована для работы с аппаратным обеспечением AMD, что привело к увеличению скорости вывода до 4,3 раз по сравнению с универсальными моделями. Для платформы заявлена поддержка видеофильтров на основе ИИ. Amuse 3.0
![]() Смотреть все изображения (6)
![]() ![]() ![]() Смотреть все изображения (6) AMD заявляет, что производительность Amuse 3.0 по сравнению с универсальной базовой платформой генерации изображения Olive Optimize в 4,3 раза выше и была достигнута на видеокарте Radeon RX 9070 XT. Компания также добавила данные о производительности процессоров Ryzen AI со встроенным NPU мощностью 50 TOPS, с которыми оптимизированные модели AMD показали себя в 3,3 раза быстрее при генерации изображений. Каждый десятый человек на Земле теперь пользуется ChatGPT, и его популярность только растёт
14.04.2025 [13:42],
Дмитрий Федоров
Число еженедельных активных пользователей ChatGPT приблизилось к одному миллиарду. Такой рост совпал с мартовским обновлением функции генерации изображений, что вызвало всплеск интереса к ИИ-сервису. В прошлом месяце ChatGPT стал самым загружаемым в мире приложением за исключением игр, а общее количество его установок составило 46 млн. ![]() Источник изображения: Growtika / Unsplash Во время беседы на сцене конференции TED куратор мероприятия Крис Андерсон (Chris Anderson) задал Сэму Альтману (Sam Altman), генеральному директору OpenAI, вопрос о числе пользователей ChatGPT. Альтман ответил, что последняя озвученная цифра составляла 500 млн еженедельных активных пользователей, и добавил, что аудитория продолжает стремительно расти. Андерсон заметил, что в частной беседе Альтман упоминал о двукратном росте за несколько недель. Альтман это не опроверг. Альтман также сообщил, что ChatGPT пользуются около 10 % населения Земли. Поскольку сегодня на Земле живут более 8 млрд человек, это примерно 800 млн пользователей. После запуска 30 ноября 2022 года бесплатной исследовательской версии ChatGPT на основе ИИ-модели GPT-3.5, он достиг отметки в 100 млн пользователей всего за два месяца, став самым популярным приложением в истории. Для сравнения: TikTok для этого потребовалось девять месяцев, а Instagram✴ — два с половиной года. К августу 2024 года число еженедельных активных пользователей ChatGPT достигло 200 млн. Последующий резкий рост был вызван обновлением 25 марта, в котором были улучшены возможности генерации изображений. После этого социальные сети наводнили изображения и видео, выполненные в различных художественных стилях, наиболее популярным из которых оказался стиль японской анимационной студии Studio Ghibli. Альтман отметил, что спрос оказался настолько высоким, что фактически «плавил» графические процессоры компании. Хорошей новостью для OpenAI стало то, что обновление привлекло миллион новых пользователей ChatGPT всего за один час. Согласно данным аналитической платформы Appfigures, в марте ChatGPT стал самым скачиваемым неигровым приложением в мире. Количество установок выросло на 28 % по сравнению с февралем и достигло 46 млн. Взрывному успеху способствовало не только улучшение генератора изображений, но и, вероятно, снятие некоторых ограничений в работе сервиса. ![]() Источник изображения: TED На фоне популяризации генеративного ИИ усиливаются опасения по поводу его влияния на рынок труда. Всё больше компаний сокращают персонал, поскольку задачи, ранее выполнявшиеся людьми, теперь выполняют ИИ-системы. На вопрос о том, заменит ли ИИ человека, Альтман ответил: «Можно сказать: „О, Боже, оно делает всё, что делаю я. Что же со мной будет?“ Или вы можете сказать, как во времена всех других технологических революций в истории: „Хорошо, теперь есть новый инструмент. Я могу делать гораздо больше. Что я смогу делать?“ Конечно, ожидания от человека, занимающего определённую должность, возрастают, но возможности расширяются настолько значительно, что, я думаю, соответствовать этим ожиданиям возможно». Учёные соединили 60 сенсоров для смартфонных камер, чтобы наблюдать за аннигиляцией антипротонов
09.04.2025 [17:51],
Павел Котов
Учёные из подразделения Antimatter Factory в ЦЕРН, занятые в проекте AEgIS, решили построить 3,84-гигапиксельный датчик изображения, который поможет в наблюдении за аннигиляцией протонов — его сформировали из 60 сенсоров, которые используются в современных смартфонах. ![]() Источник изображения: home.cern Экспериментальный детектор на датчиках, изначально разработанных для камер смартфонов, построила группа учёных под руководством профессора Кристофа Хугеншмидта (Christoph Hugenschmidt) из Мюнхенского технического университета. Вместо того, чтобы создавать такую систему с нуля, они перепрофилировали 60 сенсоров разрешением по 64 мегапикселя и сформировали массив суммарным разрешением 3,84 гигапикселя под названием OPHANIM (Optical Photon and Antimatter Imager). С его помощью они намереваются фиксировать столкновения антипротонов с материей и возникающие при аннигиляции вспышки. Чтобы адаптировать сенсоры для научного использования, учёным пришлось удалить некоторые компоненты, предназначенные для используемой в смартфонах электроники — в результате датчики получили возможность напрямую фиксировать световые изображения, связанные с событиями при аннигиляции. Детектор OPHANIM позволит учёным наблюдать события аннигиляции в реальном времени с разрешением около 0,6 мкм — этого достаточно, чтобы различать возникающие в ходе процесса новые частицы. Значение работы выходит за рамки исследований антиматерии. Способность OPHANIM отслеживать частицы с такой точностью может принести пользу для широкого спектра экспериментов при относительно невысокой стоимости оборудования, созданного на основе существующих потребительских решений. Amazon представила ИИ-модель Nova Reel 1.1 для генерации двухминутных видео по текстовым подсказкам
08.04.2025 [07:56],
Владимир Мироненко
Amazon представила обновлённую ИИ-модель Nova Reel 1.1, позволяющую генерировать видео продолжительностью до двух минут на основе текстовых подсказок пользователей. Её предыдущая версия Nova Reel была анонсирована в декабре 2024 года, став первой попыткой компании выйти на рынок моделей для создания видео с помощью генеративного ИИ. ![]() Источник изображения: Amazon Nova Reel 1.1, может генерировать «многокадровые» видео с «единым стилем» между кадрами, сообщила в блоге разработчик-адвокат AWS Элизабет Фуэнтес (Elizabeth Fuentes). Пользователи могут предоставить текстовую подсказку длиной до 4000 символов для генерации двухминутного видео, состоящего из шестисекундных кадров. Обновлённая модель также получила новый режим под названием «Ручной многокадровый» (Multishot Manual). В этом режиме модель может использовать изображение вместе с подсказкой, чтобы обеспечить лучшее соответствие запросу композиции видеокадра. По словам Фуэнтес, при наличии изображения с разрешением 1280 × 720 пикселей и подсказки с максимальным количеством символов 512 модель может генерировать видео, содержащие до 20 кадров. Модели Nova Reel доступны только на платформах и в сервисах AWS, включая Bedrock — набор инструментов для разработки ИИ компании. При этом клиенты должны запросить доступ к ним. Модели, генерирующие видео, обучаются на огромном количестве образцов видео, необходимых для «изучения» закономерностей для создания новых клипов. Некоторые компании обучают модели на видео, защищённых авторским правом без получения на это разрешения от владельцев или авторов. В результате эти модели могут «выдать» защищённые авторским правом кадры, подвергая пользователей моделей опасности судебного иска в связи нарушением прав на интеллектуальную собственность. Amazon не раскрыла источник данных для обучения Nova Reel, но пообещала, что будет защищать клиентов AWS в случае их обвинения в нарушении авторских прав в соответствии со своей политикой возмещения ущерба. Представлена Midjourney V7 — ИИ-генератор изображений стал идеально понимать запросы и поразил качеством
04.04.2025 [15:46],
Павел Котов
Midjourney представила альфа-версию основанного на искусственном интеллекте генератора изображений V7. В отличие от OpenAI ChatGPT эта модель не была оптимизирована для создания картинок в стиле Ghibli, но это не мешает ей генерировать эстетически приятные работы, пишет TechCrunch. ![]() Источник изображения: x.com/midjourney Прежде чем начать работу с Midjourney V7, пользователю придётся оценить около двух сотен изображений, чтобы система создала для него профиль «персонализации» — это помогает настроить модель в соответствии с визуальными предпочтениями конкретного человека; в данном проекте персонализация впервые включена по умолчанию. По окончании настройки можно начинать работу с V7 как на сайте Midjourney, так и на сервере компании в Discord. При её разработке использовалась «совершенно иная архитектура», рассказал гендиректор Midjourney Дэвид Хольц (David Holz). Модель доступна в двух вариантах: есть более ресурсоёмкий Turbo; и Relax с режимом Draft Mode, при котором изображения генерируются в десять раз быстрее, и задействуются вдвое меньше вычислительных ресурсов. «Черновые» изображения Draft Mode имеют более низкое качество, чем созданные в стандартном режиме картинки, но их можно улучшить и повторно отрисовать в один щелчок мыши. Модель имеет как преимущества, так и недостатки, предупредил господин Хольц, поэтому для достижения оптимального результата пользователям рекомендуется экспериментировать с составлением запросов. Midjourney — необычная компания. Её открыл в 2022 году Дэвид Хольц, некогда соучредитель производителя периферии Leap Motion; отличительной чертой стартапа является полное отсутствие внешнего финансирования. В конце 2023 года компания сообщила, что ожидает получить около $200 млн прибыли. В прошлом году Midjourney объявила о наборе сотрудников в проект по разработке оборудования; при этом она продолжала обучение ранее анонсированных моделей для генерации видео и трёхмерных объектов. Картинки в стиле Ghibli перегрузили серверы OpenAI — выпуск новых функций замедлен
02.04.2025 [00:41],
Анжелла Марина
Генеральный директор OpenAI Сэм Альтман (Sam Altman) заявил, что из-за высокой популярности нового инструмента генерации изображений в ChatGPT компания столкнулась с перегрузкой оборудования, из-за чего выход новых продуктов и функций придётся ограничить. ![]() Источник изображения: Mariia Shalabaieva / Unsplash По словам Альтмана, OpenAI пытается справиться с ситуацией, но пользователям следует ожидать как минимум задержек в релизах, а также перебоев в работе сервисов и замедления работы платформы. Тем не менее, как отмечает TechCrunch, компания уверяет, что держит ситуацию под контролем. «Что-то будет ломаться, а обслуживание иногда будет медленным, поскольку мы справляемся с проблемами, связанными с пропускной способностью, — написал Альтман. — Мы стараемся решать проблемы оперативно, чтобы всё действительно работало». Напомним, выпущенный недавно новый генератор изображений вызвал буквально ажиотаж благодаря способности имитировать различные стили, в частности популярный стиль анимационной студии Studio Ghibli. Однако компания не успевает справляться с наплывом пользователей, а сотрудники вынуждены работать допоздна и даже в выходные, чтобы поддерживать работоспособность системы. Чтобы снизить нагрузку на свои серверы, OpenAI задержала запуск нового инструмента генерации изображений для бесплатных пользователей ChatGPT, а возможность создания видео с помощью Sora временно отключена для новых пользователей. Компания не уточняет, когда проблемы с перегрузкой будут окончательно решены и пока продолжает работать над улучшением инфраструктуры. В понедельник ChatGPT зафиксировал регистрацию в сервисе одного миллиона новых пользователей всего за один час. Также отметим, что на сегодня системой пользуются 500 миллионов еженедельных пользователей и 20 миллионов подписчиков, что значительно больше по сравнению с концом 2024 года, когда показатели составляли 300 миллионов и 15,5 миллиона соответственно. Завирусившийся новый генератор изображений в ChatGPT стал доступен всем пользователям
01.04.2025 [11:24],
Владимир Фетисов
Новый генератор изображений OpenAI, работающий на базе большой языковой модели GPT-4o, теперь доступен всем пользователям. Об этом на своей странице в социальной сети X написал гендиректор OpenAI Сэм Альтман (Sam Altman). До этого момента использовать новый ИИ-генератор изображений могли только платные подписчики ChatGPT. ![]() Источник изображения: OpenAI Бесплатные пользователи сервиса сейчас могут генерировать не больше двух изображений в сутки. Ранее Альтман упоминал о возможности введения лимита в три изображения в день. Инструмент генерации изображений OpenAI мгновенно стал сверхпопулярным сразу после его запуска в массы. Альтман заявлял, что спрос на генерацию картинок был так высок, что используемые компанией графические ускорители попросту «плавились». Генератор быстро стал известен тем, что его использовали для преобразования изображений в стиль японской анимационной студии Studio Ghibli. Это вызвало обеспокоенность по поводу нарушения авторских прав, поскольку создаваемые ИИ-генератором изображения были очень похожи на работы студии. Некоторые люди также использовали данный инструмент для создания поддельных квитанций, например, ресторанных счетов. В компании на это заявили, что все сгенерированные ИИ изображения содержат метаданные, указывающие на их происхождение. Вместе с этим OpenAI заявила о привлечении $40 млрд инвестиций, за счёт чего рыночная стоимость компании составила $300 млрд. В качестве основного инвестора в рамках этого раунда финансирования выступил Softbank. Компания также объявила, что ИИ-бот ChatGPT еженедельно используют более 500 млн человек по всему миру, тогда как количество ежемесячно активных пользователей выросло до 700 млн человек. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |