Сегодня 29 марта 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → генератор
Быстрый переход

OpenAI открыла доступ к генератору изображений DALL-E 3 для подписчиков ChatGPT Plus и Enterprise

OpenAI расширяет доступность своего новейшего генератора изображений по текстовому описанию DALL-E 3. Компания объявила, что на этой неделе ИИ-алгоритм станет доступен подписчикам ChatGPT Plus и ChatGPT Enterprise. Разработчики заявили, что для этой модели был подготовлен пакет мер по повышению уровня безопасности, что указывает на её готовность к расширенному запуску.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Модель DALL-E 3 была анонсирована в прошлом месяце, и разработчики показали, насколько она лучше справляется с генерацией картинок по сравнению с предыдущей версией алгоритма DALL-E 2. Пользователи могли убедиться в этом, составляя в ChatGPT более длинные и детальные описания изображений, которые должен создать генератор. Ранее в этом месяце модель DALL-E 3 была интегрирована в службы Bing Chat и Bing Image Creator.

Разработчики признают, что предыдущие версии генератора вызывали опасения, поскольку могли использоваться для создания фейковых изображений с целью распространения дезинформации или ведения другой неправомерной деятельности. В DALL-E 3 реализованы инструменты для ограничения генерации картинок определённых тематик. К примеру, алгоритм будет отклонять запросы, содержащие имена общественных деятелей или какие-либо «вредные побуждения». Разработчики ввели ограничения, которые не позволят DALL-E создавать изображения в стиле живущих ныне художников. OpenAI также заявила о наличии классификатора изображений, который позволяет с точностью до 99 % определить, была ли та или иная картинка сгенерирована с помощью DALL-E.

В Android 14 появился ИИ-генератор обоев

Сегодня состоялась презентация смартфонов Pixel 8 и Pixel 8 Pro, а также других аппаратных и программных новинок компании Google. Вместе с этим состоялся релиз мобильной операционной системы Android 14, которая имеет немало новых функций, включая генератор обоев на базе нейросети.

 Источник изображения: Google

Источник изображения: Google

Впервые эта функция была анонсирована в рамках мероприятия Google I/O в мае этого года. Взаимодействие с генератором обоев начинается с выбора категории, например, классического искусства, после чего нужно задать требуемые параметры и алгоритм представит несколько вариантов изображений на их основе. В одном из примеров Google выбирается категория Dreamscape, после чего отмечаются варианты структуры, материала и цвета. В конечном итоге формируется запрос «Дом из растений цвета индиго», после обработки которого алгоритм выдаёт несколько изображений покрытых растениями построек с входной дверью и фиолетовым оттенком.

Первыми функцию генерации обоев смогут испытать в деле обладатели смартфонов Pixel 8 и Pixel 8 Pro. Когда она может появиться на других смартфонах с Android 14, не уточняется. Однако формулировка Google предполагает, что в конечном счёте это всё же произойдёт.

ИИ-генератор обоев — это лишь одна из многих новых функций Android 14. Программная платформа предоставит широкие возможности в плане настройки пользовательского интерфейса, включая экран блокировки, возможность выбора разных шрифтов и цветов, ситуативные виджеты и др. Хотя Android в целом опережает iOS в плане возможностей визуальной настройки, пользователям не всегда легко привести интерфейс к желаемому виду. С выходом Android 14 сделать это будет проще.

Представлен ИИ-генератор изображений DALL-E 3 — он лучше понимает людей и скоро будет встроен в ChatGPT

Компания OpenAI представила новую версию генератора изображений DALL-E и заявила о планах интегрировать его в ChatGPT. Разработчики сообщают, что DALL-E 3 может «значительно лучше понимать запросы», анализировать сложные инструкции и генерировать «чрезвычайно детальные и точные изображения» по сравнению с DALL-E 2.

 Источник изображений: OpenAI / DALL-E 3

Источник изображений: OpenAI / DALL-E 3

«Современные генераторы изображений имеют тенденцию игнорировать слова или описания, вынуждая пользователей изучать промпт-инженерию. DALL-E 3 представляет собой шаг вперёд в нашей способности создавать изображения, которые точно соответствуют предоставленному вами запросу», — сообщает OpenAI в описании нового генератора изображений.

Модель лучше справляется и с такими сложными для искусственного интеллекта мелкими деталями, как человеческие руки. Даже при одинаковых запросах результаты DALL-E 3 намного лучше, чем у DALL-E 2, отмечают разработчики. DALL-E 3 сможет точно отобразить сцену с конкретными объектами и учесть, как они друг с другом связаны, как показано на изображении ниже.

OpenAI планирует в ближайшем будущем встроить DALL-E 3 в чат-бот ChatGPT Plus и Enterprise. Комбинация языковых навыков чат-бота с генератором изображений позволит создавать ещё более точные изображения и предоставит ещё больше возможностей в тонкой настройке запроса, если первый полученный результат окажется не тем, чего ожидал пользователь.

«При запросе ChatGPT автоматически сгенерирует индивидуальные подробные подсказки для DALL-E 3, на основе которых тот создаст изображение. Если полученное изображение понравится пользователю, но оно не совсем точно будет отображать запрос, то в него можно будет внести изменения, добавив всего несколько дополнительных уточняющих слов», — говорят в OpenAI

Сейчас DALL-E 3 находится на стадии исследовательской предварительной версии и станет доступен подписчикам ChatGPT Plus и Enterprise в октябре через API. Следует напомнить, что использование DALL-E 2 платное, а месячная подписка на тот же ChatGPT Plus стоит $20. В настоящий момент единственным крупным ИИ-чат-ботом, предлагающим бесплатный встроенный генератор изображений, является Bing Chat AI от Microsoft. Он, к слову, работает на базе мощной языковой модели GPT-4 от OpenAI.

«Как и в случае с DALL-E 2, сгенерированные с помощью DALL-E 3 изображения будут принадлежать пользователю, и ему не потребуется разрешение на их перепечатку, продажу или распространение», — уточняют в OpenAI.

В компании также отметили, что в DALL-E 3 предусмотрены инструменты, ограничивающие создание определённых изображений. Например, генератор изображений будет отклонять запросы с именами общественных деятелей или «вредными предубеждениями», чтобы снизить риск распространения пропаганды и дезинформации. Разработчики также тестируют классификатор происхождения — инструмент, который позволит определить, было ли изображение сгенерировано нейросетью. Наконец, DALL-E не будет генерировать картинки в стиле ныне живущих и творящих художников.

Созданная с помощью ИИ песня Дрейка и The Weeknd не получит премию «Грэмми»

Ранее СМИ писали, что песня Heart on My Sleeve, сгенерированная с помощью нейросети на основе вокала Дрейка и The Weeknd, будет претендовать на получение престижной премии «Грэмми». Теперь же, президент Национальной академии искусства и науки звукозаписи Харви Мейсон (Harvey Mason Jr.) заявил, что трек не будет номинирован.

 Источник изображения: Elice Moore / unsplash.com

Источник изображения: Elice Moore / unsplash.com

Господин Мейсон опроверг своё же предыдущее заявление относительно того, что упомянутый трек может получить «Грэмми», поскольку он создавался с участием человека. Ранее на этой неделе Мейсон в беседе с журналистами заявил, что песня Heart on My Steeve «полностью соответствует требованиям, потому что её написал человек».

«Позвольте мне быть предельно ясным: несмотря на то, что она была написана человеком, вокал не был получен законным путём, не было получено одобрение на использование вокала от лейбла или исполнителей, песня не является коммерчески доступной, и поэтому она не может быть включена в список», — рассказал Мейсон в беседе с журналистами.

Напомним, автором композиции стал человек с ником Ghostwriter, который использовал текст собственного сочинения и сгенерированные нейросетью голоса известных исполнителей. Сообщалось, что трек будет претендовать на получение награды сразу в двух номинациях: «Лучшая рэп-песня» и «Песня года» (обе премии традиционно присуждаются автору композиции, а не её исполнителю). Несмотря на то, что Heart on My Sleeve не получит престижную премию, Мейсон дал понять, что в будущем на получение «Грэмми» могут быть номинированы композиции, созданные с помощью искусственного интеллекта.

При помощи ИИ уже создано 15 млрд изображений — у фотографов на это ушло 150 лет

Сервис Everypixel решил оценить, сколько изображений было создано искусственным интеллектом с 2022 года. Проанализировав некоторые статистические данные и факты, эксперты сервиса установили, что за это время появились 15 миллиардов таких изображений — столько же снимков человек сделал с момента получения первой фотографии в 1826 году и до 1975 года, то есть примерно за 150 лет.

 Источник изображений: journal.everypixel.com

Источник изображений: journal.everypixel.com

С момента запуска модели OpenAI DALL-E 2 в апреле 2022 года пользователи создают в среднем 34 млн изображений ежедневно. Самым быстрорастущим генератором изображений является интегрированный в Photoshop инструмент Adobe Firefly — всего за три месяца при его помощи был создан 1 млрд изображений. Самой популярной централизованной платформой с общедоступной статистикой является Midjourney с 15 млн пользователей — для сравнения, на всю Adobe Creative Cloud приходятся около 30 млн пользователей. А больше всего изображений было создано при помощи моделей, сервисов, платформ и приложений на основе нейросети Stable Diffusion с открытым исходным кодом — на неё пришлось 80 % «творчества» ИИ или 12,59 млрд изображений.

Авторы проекта не претендуют на то, что их исследование — истина в последней инстанции. Их легко понять: технологии ИИ интенсивно развиваются, ассортимент моделей и приложений расширяется буквально каждый день, что значительно усложняет сбор статистических данных. Поэтому показатель в 15 млрд изображений носит скорее оценочный характер. Зато они предложили сравнить это число с другими: библиотека фотобанка Shutterstock содержит 386 млн изображений; на платформу Instagram загружено 50 млрд снимков; поисковик Google проиндексировал 136 млрд файлов картинок; до 240 млрд их значится на платформе Pinterest; а пользователи Facebook загрузили в соцсеть уже 1,5 трлн изображений.

Раджа Кодури представил сервис MIHIRA — ИИ-генератор видеоряда в реальном времени

Раджа Кодури (Raja Koduri) является одним из самых авторитетных в мире специалистов в области графических ускорителей, успевший на своём веку поработать в Intel, AMD, Apple и Makuta. На выставке SemiconIndia 2023 он представил свою компанию MIHIRA и разрабатываемую её инженерами систему генерации графики в реальном времени, основанную на искусственном интеллекте.

 Источник изображения: businesswireindia.com

Источник изображения: businesswireindia.com

Под руководством Раджи Кодури MIHIRA ведёт разработку программной и аппаратной платформы для сценаристов, чьи сюжеты смогут в режиме реального времени воплощаться в компьютерной графике. Для решения комплексной задачи используются мощные графические инструменты и модели генеративного ИИ — экранизируемые таким образом истории могут иметь как линейный, так и интерактивный сюжет.

Платформа разрабатывается опытными специалистами — бывшими сотрудниками технологических гигантов, а также студий анимации и визуальных эффектов. Перед ними поставлена задача устранить технологические препятствия в программном и аппаратном обеспечении, мешающие современным представителям творческих профессий реализовывать собственный потенциал.

«Каждому художнику в мире необходим демократичный доступ к сложному оборудованию для разработки иммерсивных сред, настройки собственных ИИ-моделей и развёртывания собственного контента. Мы в MIHIRA разрабатываем программные и аппаратные системы для помощи художникам. Мы также стремимся стать крупнейшим работодателем для художников по всему миру», — прокомментировал новый проект Раджа Кодури.

Meta✴ анонсировала производительный ИИ-генератор изображений CM3Leon с поддержкой точных команд редактирования

За минувшие два года основанные на алгоритмах искусственного интеллекта генераторы изображений стали почти повседневным явлением, и на первый взгляд в работе они не так сильно отличаются друг от друга. Но в Meta утверждают, что разработанная инженерами компании новая модель CM3Leon является прорывом.

 Источник изображений: ***

Источник изображений: Meta

Отличием модели Meta CM3Leon, как заявляют разработчики, является высокая производительность при преобразовании текста в изображение. Кроме того, это одна из первых моделей, обеспечивающих обратную операцию — создание подписей к изображениям. Большинство современных генераторов изображений, включая OpenAI DALL-E, Google Imagen и Stable Diffusion при создании картинок используют диффузию — процесс постепенного удаления шума из первоначального изображения по мере приближения к поставленной цели. Результат получается убедительным, но данный алгоритм требует значительных вычислительных ресурсов, что делает работу таких систем дорогостоящей, а сами модели — медленными, и в реальном времени они функционировать попросту не могут.

 Редактирование исходного изображения: заменить девушку на бородатого мужчину, добавить очки, увеличить возраст, раскрасить лицо

Редактирование исходного изображения: заменить девушку на бородатого мужчину, добавить очки, увеличить возраст, раскрасить лицо

Модель CM3Leon действует принципиально иначе — в её основе лежит алгоритм-трансформер, предусматривающий оценку релевантности исходных данных, будь то текст или изображение. Примечательно, что и в OpenAI первоначально строили генераторы изображений на основе моделей-трансформеров, но на смену Image GPT пришли диффузионные алгоритмы. При обучении CM3Leon использовались 2 млн изображений, лицензированных у Shutterstock — самая мощная версия модели имеет 7 млрд параметров — в два раза больше, чем у OpenAI DALL-E 2. Наконец, здесь использован механизм дообучения SFT (Supervised Fine-Tuning), обычно свойственный генераторам текста. В результате увеличилась производительность модели при генерации изображений и составлении описаний к готовым картинкам, а система получила возможность редактировать изображения по текстовым командам, например, «изменить цвет неба на ярко-синий».

 Генерация интерьера с объектами, для которых указываются точные координаты

Генерация интерьера с объектами, для которых указываются точные координаты

В результате Meta CM3Leon воспринимает в качестве исходных данных весьма конкретные команды — вплоть до того, в какой области изображения в пикселях должен находиться тот или иной предмет. Для сравнения, DALL-E такие нюансы игнорирует и зачастую даже отказывается помещать на изображение объекты, непосредственно указанные в инструкции.

«Сбер» научил нейросеть Kandinsky генерировать стикеры и фотореалистичные изображения и портреты

«Сбер» представил новую версию своей нейросети для генерации изображений по текстовому описанию — Kandinsky 2.2, которая позволит создавать фотореалистичные изображения с более высоким разрешением и изменять соотношение сторон при генерации, а также обеспечит значительный прирост качества при создании портретов.

 Генерация Kandinsky 2.2           Источник изображений: «Сбер»

Генерация Kandinsky 2.2. Источник изображений: «Сбер»

Для дообучения Kandinsky 2.2 использовался набор данных из 1,5 млрд пар «текст — изображение», что на 300 млн больше, чем для предыдущей версии — Kandinsky 2.1, вышедшей в апреле этого года и набравшей всего за 6 дней 2 млн пользователей.

Новую версию модели научили создавать стикеры, из которых можно собирать полноценные стикерпаки в Telegram. Также благодаря внедрению специального структурного блока управляемых изменений ControlNetона она получила способность изменять по текстовому описанию отдельные объекты или элементы на изображениях, сохраняя при этом композицию исходной иллюстрации.

 Генерация Kandinsky 2.2

Генерация Kandinsky 2.2

Согласно пресс-релизу, Kandinsky 2.2 понимает запросы на русском и английском языках, обладает способностью рисовать более чем в 20 стилях, смешивать несколько рисунков, стилизовать изображение по текстовому описанию, генерировать изображения, похожие на заданные, а также дорисовывать недостающие части картинки (inpainting) и создавать картины в режиме бесконечного полотна (outpainting).

 Стикерпак от Kandinsky 2.2

Стикерпак от Kandinsky 2.2

«Нейросеть уже не просто пытается подражать творчеству человека, а способна создавать новые художественные смыслы и интерпретации», — сообщил первый зампред правления Сбербанка Александр Ведяхин, добавив, что, как и предыдущая версия, Kandinsky 2.2 находится в открытом доступе, и протестировать её можно совершенно бесплатно.

Сообщается, что ознакомиться с возможностями Kandinsky 2.2 можно на промостранице модели, на платформе FusionBrain.AI, в Telegram-боте и боте соцсети «ВКонтакте», а также при помощи команды «Запусти художника» на умных устройствах Sber, в мобильном приложении Салют. Модель доступна на платформе ML Space в хабе предобученных моделей и датасетов DataHub.

Разработкой и обучением нейросети занимались исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.

ИИ-генератор изображений Microsoft Designer вышел в открытый доступ

Основанный на алгоритмах искусственного интеллекта генератор изображений Microsoft Designer стал общедоступной платформой, испробовать которую может любой желающий — достаточно войти в свой аккаунт системы Microsoft.

 Источник изображения: designer.microsoft.com

Источник изображения: designer.microsoft.com

Работа с Microsoft Designer начинается либо с загрузки собственного изображения, либо с генерации картинки по описанию. Есть также возможность создать слайд с заданным текстом в соответствии с набором шаблонов. Поддерживаются функции редактирования: перед получением окончательного результата можно внести в макет некоторые правки, например, изменить размер или начертание текста. При изменении размера картинки макет подстраивается под новый формат.

Microsoft Designer создан с расчётом на экспорт в социальные сети: шаблоны оптимизированы для выгрузки в Instagram и Facebook — всего около 20 платформ. Нейросеть может помочь в создании описания загруженного пользователем изображения, подобрать хештеги для него или произвести публикацию прямо из Designer.

Генерируемые ИИ изображения сегодня являются своеобразным «Диким Западом» с позиции авторского права — оно признается только в той части работы, которую совершает человек. Любопытно, что Microsoft разделяет эту позицию, заявляя, что не претендует ни на авторство контента, загружаемого пользователями, ни на авторство генерируемых изображений. Корпорация не ограничивает пользователей в коммерциализации этих изображений и, вместе с тем, возлагает на них всю ответственность за принимаемые ими решения по продаже таких картинок.

Microsoft планирует добавить Designer в браузер Edge наряду с инструментом Image Creator. При просмотре лент Twitter или Facebook в Edge и создании публикаций Designer может предложить дополнить их своими изображениями, чтобы оживить её. Кроме того, в планах Microsoft — новые функции редактирования изображений с ИИ. К примеру, можно будет убрать с головы человека корону или заменить её бейсболкой. Появится также функция смены фона, аналогичная той, что уже есть в Adobe Photoshop. Наконец, Microsoft Designer будет работать по freemium-модели: некоторые возможности станут доступными только для подписчиков Microsoft 365.

2 млн пользователей за 6 дней: нейросеть «Сбера» Kandinsky 2.1 оказалась среди самых быстрорастущих сервисов мира

Стало известно, что бесплатная генеративная модель Kandinsky 2.1, презентация которой состоялась ранее в этом месяце, стала одним из самых быстрорастущих сервисов искусственного интеллекта в мире. Она способна генерировать красочные картинки по текстовому описанию пользователя, а также поддерживает возможность создания работ в разных стилях.

Результат работы алгоритма Kandinsky 2.1 по запросу

Результат работы алгоритма Kandinsky 2.1 по запросу «современный художник за работой»

Разработчики сообщили, что алгоритму Kandinsky 2.1 потребовалось всего четыре дня, чтобы достичь отметки в 1 млн уникальных пользователей. Любопытно, что это на один день быстрее результата чат-бота ChatGPT компании Open AI. Согласно имеющимся данным, с момента запуска алгоритма было сгенерировано свыше 10 млн изображений, а число уникальных пользователей достигло 2 млн человек. Также отмечается, что на прошлой неделе алгоритм Kandinsky 2.1 попал в топ-5 трендов мировых репозиториев по версии сервиса GitHub.

Напомним, алгоритм Kandinsky 2.1 может генерировать изображения по их текстовому описанию на естественном языке. Модель поддерживает обработку запросов на 101 языке и готова открыть для пользователей новые творческие возможности, включая смешивание нескольких рисунков, дорисовку изображений, создание картин в режиме бесконечного полотна и др. Разработкой и обучением алгоритма занимались специалисты Sber AI совместно с учёными из Института искусственного интеллекта AIRI на объединённом дата-сете Sber AI и компании SberDevices. Kandinsky 2.1 содержит 3,3 млрд параметров вместо 2 млрд параметров в предыдущей версии алгоритма.

Adobe представила ИИ-генератор изображений и он совсем не нарушает авторские права

Adobe присоединилась к гонке ИИ, представив «набор генеративных ИИ-моделей» Firefly для работы с изображениями. Представленные Adobe инструменты ориентированы, конечно же, на людей творческих профессий, а их отличительной особенностью является то, что они не нарушают авторские права — модели обучены на изображениях, авторы которых дали разрешение на такое их использование.

 Источник изображений: Adobe

Источник изображений: Adobe

Первый представленный ИИ-инструмент является аналогом популярных нейросетей DALL-E или Midjourney — он так же позволяет создавать изображения по текстовому описанию. Второй инструмент позволяет творчески декорировать надписи и напоминает продвинутую версию WordArt.

Adobe пытается сделать свои ИИ-инструменты более простыми в использовании. Например, вместо ввода подробного описания для стилизации изображения, Adobe предлагает встроенные варианты художественных стилей, освещения и соотношения сторон. Пользователи также смогут применять эти эффекты к уже созданному изображению, а не генерировать новое каждый раз. Инструмент для создания текстовых эффектов работает аналогичным образом, со встроенными опциями для размера эффекта и цвета фона.

В будущем Adobe запустит ещё больше ИИ-инструментов, в том числе для редактирования изображений. Например, ИИ сможет перерисовывать части изображения или менять его стилистику, заменять цвета, менять отдельные объекты или их окружение, а также выполнять другие изменения по текстовым описаниям. Также обещан генератор изображений по 3D-моделям, преобразователь набросков в изображения и многое другое.

Но самой важной частью Firefly является то, что Adobe обучала свои модели на открытых или на лицензированных изображениях, в том числе из библиотеки Adobe Stock, заведомо не нарушая авторских прав художников. В дальнейшем компания собирается платить поставщикам данных, а также позволить владельцам изображений запрещать обучение ИИ по своим материалам.

Как отметили в Adobe, такой подход позволяет «генерировать высококачественный контент, а не случайные [сочетания из] интеллектуальной собственности брендов и других людей, потому что наша модель никогда не видела контента этого бренда или торговую марку». Также в компании добавили: «Мы не боимся перемен, и мы принимаем эти перемены».

Также Adobe планирует разрешить художникам тренировать Firefly на собственных изображениях, что по задумке позволит генерировать работы в совершенно уникальном, персональном стиле.

Пока что Firefly находится в стадии бета-тестирования и доступен исключительно на сайте Adobe. Доступ к инструментам пока ограничен — нужно получить приглашение. Записаться в очередь на приглашения может любой желающий. Позднее компания интегрирует Firefly в свои творческие приложения, включая Photoshop, Illustrator и Premiere Pro, снабдив простым визуальным интерфейсом.

В Photoshop появится ИИ-генерируемая заливка, Illustrator сможет генерировать векторные вариации нарисованных от руки эскизов, а Premiere Pro позволит изменять цвет или стиль изображения, используя подсказки. Adobe не называет сроков выпуска этих функций, но это одни из функций, над которыми компания работает.

Генеративная нейросеть MidJourney для создания изображений по текстовому описанию обновилась до пятой версии

Разработчики представили пятую версию системы генеративного искусственного интеллекта MidJourney, способную создавать изображения по текстовым описаниям. В настоящий момент новая версия генеративной ИИ-сети доступна в рамках программы альфа-тестирования для тех, кто подписан на сервис MidJourney. Подписку можно оформить в официальном канале разработчиков в Discord.

 Источник изображений: MidJourney

Источник изображений: MidJourney

По словам графического дизайнера Джули Виланд (Julie Wieland), часто публикующей в Twitter изображения, созданные с помощью MidJourney, генеративная сеть MidJourney v5 научилась создавать практически фотореалистичные изображения.

«MJ v5 ощущается так, как будто вы наконец-то надели очки после того, как долго страдали от недостатка зрения. Неожиданно всё вокруг вы видите, как в 4K. Это одновременно ошеломляет и удивляет», — прокомментировала Виланд.

Виланд, давно наблюдающая за развитием генеративной сети MidJourney, поделилась изображениями, демонстрирующими прогресс в её эволюции. Её первая версия была представлена в марте 2022 года. До третьей версии генеративная сеть добралась в августе, а четвёртая версия была представлена в ноябре. Ниже представлены примеры, демонстрирующие прогресс в развитии этой технологии. С каждым новым поколением нейросеть училась создавать более сложные и детализованные изображения.

 MidJourney v3 (слева), MidJourney v4 (в центре) и MidJourney v5 (справа)

MidJourney v3 (слева), MidJourney v4 (в центре) и MidJourney v5 (справа)

MidJourney работает по тому же принципу, согласно которому работают другие генеративные системы искусственного интеллекта, вроде Stable Diffusion и DALL-E. Они создают изображения на основе заданного текстового описания (промта), используя ИИ-модель, обученную на основе миллионов изображений, созданных людьми.

За день экспериментов MidJourney v5 Виланд пришла к выводу, что нейросеть значительно продвинулась вперёд. Она научилась «невероятно реалистично» передавать текстуру кожи и черты лица, создаёт более реалистичное и кинематографическое освещение, лучше передаёт отражения, блики и тени, выбирает более выразительные ракурсы и общий план, «а глаза научилась создавать практически идеально».

Также MidJourney v5 научилась лучше рисовать руки и зубы. В описании к MidJourney v5 указывается, что генеративная система искусственного интеллекта получила расширенный стилистический диапазон, у неё повышена отзывчивость на запросы, разрешение сгенерированных изображений увеличено в два раза. Кроме того, улучшены динамический диапазон и детализация.

Зебры вдохновили учёных на создание эластичного генератора энергии, который можно носить на теле

Бытовая электроника и техника, да и сами люди выделяют тепло, которое обычно просто рассеивается в окружающей среде. Термоэлектрические генераторы (ТЭГ), которые преобразуют разницу температур в электричество известны давно, но теперь исследователям удалось создать на основе полимера мягкий и эластичный термоэлектрический генератор, который к тому же сможет полностью разлагаться под воздействием окружающей среды.

 Источник изображения: Korea university

Источник изображения: Korea university

В отличие от традиционных термоэлектрических устройств, новый генератор можно будет легко интегрировать на тканевую основу, что позволяет создавать носимые на теле датчики, работающие от тепла, или одноразовые маски для лица, которые способны измерять температуру.

В ТЭГ поток зарядов между горячими и холодными областями приводит к появлению разницы потенциалов и генерированию электрического тока. Такие генераторы изготавливают различными способами из разных материалов. Обычно это устройство, одна сторона которого остаётся холодной, а другая соприкасается источником тепла.

Поскольку они представляют собой полупроводниковые устройства без движущихся частей, ТЭГ требуют минимального обслуживания и весьма долговечны. До сих пор такие устройства изготавливались из сравнительно дорогих и, порою, токсичных полупроводниковых материалов, таких как теллурид висмута и теллурид свинца, и в основном находили применение в нишевых приложениях, таких как космические корабли и спутники. Например, недавно команда учёных разработала способ получения электричества в космосе, поместив материал, излучающий тепло в космическое пространство, поверх материала, поглощающего тепло из воздуха внутри космического аппарата.

Исследователи давно стремились снизить стоимость и повысить эффективность ТЭГ, однако материалы и конструкции, используемые до сих пор для изготовления ТЭГ, «могут привести к созданию сложного и неэффективного ТЭГ, который будет громоздким и трудным для установки с другими компонентами», — говорит Янг Мин Сонг (Young Min Song), профессор электротехники и информатики в корейском институте науки и техники.

Сонг и его коллеги решили отказаться от традиционного «двухстороннего» подхода. Вместо этого они используют узор, вдохновлённый полосками зебры, чтобы создать между этими самыми полосками разницу температур, которая достаточно велика для производства электроэнергии. На белый лист, сделанный из эластичного и биоразлагаемого полимера поликапролактона, который обычно используется для хирургических имплантатов и шовного материала, равномерно наносятся полосы чёрного полимера. Белые полосы отражают солнечный свет и излучают тепло в инфракрасном диапазоне, а чёрные, наоборот, поглощают. Таким образом, чередующиеся чёрные и белые полосы создают горячие и холодные области на эластичной полимерной основе.

 Источник изображения: Korea university

Источник изображения: Korea university

Этот полосатый лист помещён поверх так называемой «кремниевой наномембраны». Она представляет собой массив из полупроводниковых нанопроводников волнообразной формы, за счёт чего они могут растягиваться, не ломаясь.

При тестировании на открытом воздухе в солнечный день, белые полосы стали на 8 °C холоднее, а чёрные на 14 °C теплее температуры окружающего воздуха, создав максимальную разницу температур в 22 °C. Нанопроводники преобразовывали эту разницу температур в электрическую энергию, генерируя максимальную мощность около 6 микроватт на квадратный метр (мкВт/м²).

По словам Сонга, этого достаточно для работы датчиков с низким энергопотреблением, но, безусловно, ниже идеала для коммерческих приложений. Использование более термоэлектрически эффективных материалов, увеличило бы выходную мощность, но главные преимущества устройства — дешевизна, эластичность и биоразлагаемость — были бы утрачены.

 Источник изображения: Korea university

Источник изображения: Korea university

«Даже когда образец был растянут примерно в 1,3 раза, производительность генерации сохранилась», — утверждает Сонг. В лаборатории устройство полностью растворилось на безвредные побочные продукты за 35 дней при помещении в солевой раствор. По словам Сонга, такая деградация в естественной среде займёт больше времени.

Учёные придумали бескварцевую электронику: это снизит зависимость США от импорта

Как известно, США возрождают свою полупроводниковую промышленность. Заводы растут как грибы после дождя, но удовлетворить все потребности необъятного рынка микроэлектроники не выйдет ни при каких условиях. Учёные из США придумали, как обойти потребность в одном из важнейших элементов для современной электроники — в тактовых генераторах, которые нужны для работы многих сложных систем и которые выпускаются отдельно от контроллеров и процессоров.

 Источник изображения: Second Bay Studios \ purdue.edu

Источник изображения: Second Bay Studios \ purdue.edu

Группа исследователей с Факультета электротехники и компьютерной инженерии Университета Пердью (Уэст-Лафайетт, штат Индиана) предложила превратить в тактовый генератор часть FinFET-транзисторов в самом микропроцессоре.

«В каждом элементе высокопроизводительной электроники используются FinFET, — сказала Дана Вайнштейн (Dana Weinstein), профессор и сотрудник университета, а также один из авторов разработки. — Интеграция этих функций [тактового генератора в чип] расширяет возможности нашей микроэлектроники за пределы просто цифровых микропроцессоров. Если технология изменится, мы сможем адаптироваться, но мы будем двигаться вперед с интегрированной микропроцессорной системой».

Иными словами, пока для выпуска чипов будет применяться технология FinFET с вертикальными транзисторными каналами, чипы могут нести в себе встроенные тактовые генераторы.

Тактовые генераторы необходимы для того, чтобы синхронизировать различные элементы в компьютерной системе — частота генератора используется в качестве эталона. Без тактового генератора ничего работать не будет. Традиционно тактовые генераторы используют резонаторы из кварца, а потому интегрировать их просто так в микросхему невозможно. В последнее время на смену тактовым генераторам с кварцевыми и пьезокерамическими резонаторами пришли интегрированные и настраиваемые тактовые генераторы на микроэлектромеханических схемах (МЭМС). Это одновременно и простое и сложное устройство. Однако без традиционных кварцевых устройств по-прежнему не обойтись.

Поэтому предложение американских учёных очень интересно и позволит сэкономить деньги и время. Идея со встроенным тактовым генератором следующая. Транзисторы FinFET могут не только переключаться (открываться и закрываться), но также работать в режиме удержания энергии — как своеобразный конденсатор, чему будет способствовать относительно большое вертикальное ребро транзисторного канала. Исследователи смогли подобрать такой режим переключения соседних транзисторов, что те попеременно создавали физическое давление на диэлектрическую плёнку (изолятор) между каналом (ребром) и затвором.

«Мы сжимаем эти слои между затвором и полупроводником, надавливая и притягивая эту тонкую область между затвором и ребром, — пояснил другой автор работы. — Мы делаем это попеременно на соседних транзисторах — один сжимаем, другой растягиваем — создавая вибрации в боковом направлении в устройстве».

Пара работающих таким образом FinFET транзисторов начинает переключаться с определённой резонансной частотой, превращаясь, по сути, в интегрированный резонатор. Но ещё интереснее, как частота акустических колебаний превращается в электронный сигнал! Колебания физически передаются другим соседним FinFET-транзисторам, что отражается на синхронном изменении их токовых параметров. Обработка и усиление такого сигнала создают тактовый сигнал с превосходными характеристиками.

«У вас будет один чип, который делает всё, вместо нескольких чипов, нескольких методов производства и нескольких наборов материалов, которые должны быть интегрированы — часто за рубежом, — резюмирует Дана Вайнштейн. — Америке необходимо развивать свои возможности в производстве чипов, и такое развитие решает множество проблем в области поставок, национальной безопасности и безопасности оборудования». К тому же, использование встроенных генераторов создаст трудности для хакеров, желающих атаковать блок тактового генератора по ряду побочных каналов (временные атаки с использованием задержек). На внешний генератор такую атаку провести сравнительно просто, тогда как до интегрированного генератора добраться будет просто невозможно.

Shutterstock запустил ИИ-инструмент для генерации изображений по текстовому описанию

В прошлом году фотобанк Shutterstock и компания Open AI объявили о партнёрстве, в рамках которого последняя планировала интегрировать в фотосервис свою ИИ-модель DALL-E 2 для генерации изображений по текстовому описанию. Теперь же было объявлено, что пользователи онлайн-платформы для дизайнеров Creative Flow от Shutterstock смогут генерировать изображения по текстовому описанию, используя для этого инструмент на основе DALL-E 2.

 Источник изображения: freepik.com

Источник изображения: freepik.com

Ключевая особенность нового инструмента, который, похоже, не имеет названия, заключается в том, что сгенерированные ИИ изображения можно будет лицензировать. Это важно, поскольку один из крупнейших конкурентов Shutterstock в лице платформы Getty Images в настоящее время ведёт судебное разбирательство по поводу изображений, созданных с помощью генеративного алгоритма Stable Diffusion от компании Stability AI. Поводом для иска стало использование разработчиками для обучения своего алгоритма изображений, размещённых на платформе Getty Images.

Другими словами, сервис Shutterstock не только намерен использовать возможности нейросетей для генерации картинок, но и наделять авторскими правами созданный таким образом контент. Этим решением сервис ставит себя в оппозицию Getty Images, владельцы которого выступили на стороне авторов контента, недовольных тем, что их работы используются для обучения генеративных нейросетей. Хотя Stability AI получила значительное финансирование, по состоянию на эту неделю Open AI значительно превосходит её в этом плане. В 2019 году Microsoft инвестировала в Open AI $1 млрд и на днях софтверный гигант объявил, что намерен вложить ещё миллиарды.

Помимо партнёрства с Open AI, Shutterstock также недавно объявил о сотрудничестве с Meta Platforms, владельцем Facebook, Instagram и WhatsApp. В рамках этого сотрудничества Meta будет использовать фото- и другие медиатеки Shutterstock для создания наборов данных для обучения собственных ИИ-алгоритмов. В конечном счёте можно ожидать появления новых инструментов на основе генеративных нейросетей.


window-new
Soft
Hard
Тренды 🔥
Беспощадное солнце пустыни: журналисты поделились новыми подробностями и кадрами Dune: Awakening 27 мин.
Activision Blizzard расследует кражи учётных данных у читеров 30 мин.
Пользователям Windows 11 смогут использовать ИИ-помощника Copilot без учётной записи Microsoft, но с ограничениями 2 ч.
Google сообщила, что iPhone получат поддержку современного протокола для СМС этой осенью 2 ч.
Microsoft защитила клиентские ИИ-приложения от галлюцинаций 3 ч.
Gearbox отметила уход от Embracer увольнением «бесчисленного множества» сотрудников 3 ч.
ИИ-стартап Илона Маска X.ai представил обновлённую нейросеть Grok-1.5 — она стала ближе к GPT-4 3 ч.
Пользователи Telegram из России, Украины и Беларуси смогут заблокировать сообщения от незнакомцев 3 ч.
«Золотая лихорадка закончилась»: инди-разработчикам стало невыгодно делать свои игры эксклюзивами Epic Games Store и Game Pass 4 ч.
Крупное обновление добавило в No Man’s Sky возможность создавать собственные космические корабли — фанаты мечтали об этом с 2016 года 15 ч.