Новости Software

ИИ научился рисовать изображения по их текстовому описанию

Скоро андроиды будут не только мечтать об электроовцах, но даже смогут изобразить их на холсте. На днях компания OpenAI, к основанию которой в своё время приложил руку Илон Маск, сообщила, что смогла обучить нейронную сеть создавать рисунки из коротких текстовых подписей. Это первое решение, когда ИИ создаёт сложное и связное визуальное представление, используя лишь короткое текстовое пояснение. Профессия художника-иллюстратора может исчезнуть.

Источник изображения: OpenAI

Источник изображения: OpenAI

Для графических представлений подписей компанией OpenAI обучено программное обеспечение Dall-E. Для обучения через нейросеть прогнали набор данных из 12 млрд изображений и их подписей, которые были найдены в Интернете. Результат обучения впечатлил даже создателей.

«Мы обнаружили, что он [Dall-E] обладает разнообразным набором возможностей, включая создание антропоморфных версий животных и объектов, комбинирует несвязанные концепции правдоподобными способами, рендерит текст и применяет преобразования к существующим изображениям», — написала компания. Ниже на иллюстрации представлен пример изображений, которые Dall-E нарисовал на базе двух текстовых сообщений, одно о детёныше дайконе (редисе) в балетной пачке выгуливающей собаку, а второе — о кресле в форме авокадо.

Иллюстрация маленькой редиски дайкон в балетной пачке, выгуливающей собаку, автор DALL-E

Иллюстрация маленькой редиски (дайкон) в балетной пачке, выгуливающей собаку, автор DALL-E

Кресло в форме авокадо, автор DALL-E

Кресло в форме авокадо, автор DALL-E

Программа Dall-E, сочетающая в своём названии имя художника-сюрреалиста Сальвадора Дали и имя мультяшного персонажа Wall-E, имеет в своей основе текстовый генератор под названием GPT-3 (Generative Pre-Training). Генератор GPT-3 компания OpenAI представила весной прошлого года и готовится к коммерциализации API для этой разработки. Система, обученная GPT-3, оказалась способной создавать связные тексты как для чат-ботов, так и виде развёрнутых статей на любую тематику. В дополнение к GPT-3 пакет Dall-E прошёл также обучение текстом и графикой, показав тот результат, который всем нам ещё предстоит осмыслить.

Разработчики из OpenAI признают, что Dall-E обладает «потенциалом значительного и широкого общественного воздействия», добавив, что компания «планирует проанализировать потенциальное влияние подобных Dall-E решений на определенные рабочие процессы и профессии, долгосрочные этические проблемы и другие вопросы, связанные с этой технологией».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥
Война лицензий: Amazon Web Services делает свободный форк Elasticsearch и Kibana 55 мин.
В Spotify появились аудиокниги, но пока это пилотный проект 3 ч.
Обновление Windows 10 21H1 будет незначительным и выйдет раньше обычного 5 ч.
Windows 10X теперь можно установить на Surface Pro 7 — хакер выпустил образ установочного носителя 6 ч.
Take-Two заставила производителя читов для GTA Online свернуть деятельность и пожертвовать выручку на благотворительность 7 ч.
11 Мбайт счастья: в Disco Elysium наконец появился русский язык 7 ч.
Приложение Instagram получит бизнес-интрументы и позволит блогерам IGTV зарабатывать на рекламе 7 ч.
В Совфеде разработают штрафы для интернет-компаний за необоснованную блокировку пользователей 9 ч.
Загрузки ICQ в Гонконге выросли в 35 раз на фоне изменений правил конфиденциальности WhatsApp 10 ч.
Временное решение: авторы Cyberpunk 2077 рассказали, как обойти новый баг с Такэмурой 10 ч.
Новая статья: Групповое тестирование 42 видеокарт в HITMAN III 2 ч.
Gigabyte наделила новую версию гигантской видеокарты GeForce RTX 3090 Aorus Master третьим разъёмом питания 3 ч.
Результаты превзошли ожидания: независимые эксперты протестировали аккумулятор AirPods Max 5 ч.
Samsung скоро выпустит среднебюджетный Galaxy A72 — новинка появилась на российском сайте компании 7 ч.
ASUS представила игровой ноутбук Sky Selection 2 с процессором Ryzen 5000, 240-Гц экраном и необычной внешностью 7 ч.
NVIDIA призвала производителей ноутбуков подробнее описывать характеристики видеокарт Ampere, но те не стали этого делать 7 ч.
Microsoft высмеяла сенсорную панель MacBook Pro в новой рекламе Surface 7 ч.
Motorola скоро выпустит доступный 5G-смартфон Ibiza с 90-Гц экраном и ёмкой батареей 8 ч.
Realme готовит смарт-динамики, телевизоры и самый доступный 5G-смартфон в мире 8 ч.
Apple сможет зарабатывать на автомобильном рынке десятки миллиардов долларов, но в основном за счёт ПО 9 ч.