Сегодня 06 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

LG представила нейросеть Captioning AI, которая создаёт текстовые описания для изображений

Одно из подразделений компании LG представило генеративную систему ИИ Captioning AI, которая может распознавать элементы изображения и генерировать для них описания и ключевые слова — трудно переоценить пользу, которую подобная технология способна оказать, например, при систематизации баз фотоснимков крупных компаний.

 Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Представители LG AI Research, занимавшейся разработкой Captioning AI, выступили на мероприятии Computer Vision and Pattern Recognition 2023, крупнейшей в мире конференции, посвящённой «компьютерному зрению» — она проходила в воскресенье в Ванкувере (Канада). Как сообщили в LG, сервис основан на разработанной LG AI Research технологии Zero-shot Image Captioning, позволяющей ИИ «понимать» и описывать объекты или сцены, которые нейросеть оценивает впервые без дополнительных подсказок, на основе своего предыдущего опыта — так же, как и люди.

В компании объяснили, что технология отличается от ИИ-сервисов вроде Midjourney, в которых всё происходит ровно наоборот — пользователи вводят текст или загружают картинку, на основе которых ИИ генерирует собственное творение. Создание «субтитров» к картинкам может показаться довольно лёгким, поскольку концепция не нова. Тем не менее, технология вышла на новый уровень. Например, искусственный интеллект действительно может делать выводы и описывать то, чего он не «видел» никогда раньше — посмотреть на пейзаж или человека и вычислить, о каком именно месте идёт речь. Технология позволяет распознавать на изображении фон, персонажей и даже активность и описывать взаимодействие элементов.

 Источник изображения: LG

Источник изображения: LG

Captioning AI может генерировать текстовые описания и ключевые слова для 10 тыс. изображений менее чем за два дня, что в теории позволяет повысить эффективность и продуктивность для компаний, которым необходимо справляться с большими массивами изображений. В среднем система может генерировать 5 предложений и 10 ключевых слов за 10 секунд.

Сервис разработан при сотрудничестве с Shutterstock, одной из крупнейших платформ для размещения визуального контента — от изображений до видео. LG AI Research сотрудничала с этой американской компанией ранее и намерена делать это и впредь расширяя сотрудничество и с другими партнёрами. Как сообщили в Shutterstock, технология Caption AI развивается благодаря «раннему доступу» к программе десяти глобальных клиентов.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В открытый доступ попал релизный трейлер дополнения Lies of P: Overture — аддон выйдет со дня на день 5 мин.
Apple разработала ИИ, выявляющий нетипичные аспекты устной речи — это поможет диагностировать заболевания 18 мин.
ChatGPT научился получать доступ к Gmail, Outlook и «Google Диску» в реальном времени 23 мин.
Microsoft зарабатывает деньги каждый раз, когда кто-либо использует ChatGPT 36 мин.
Инсайдер раскрыл детали CoD: Modern Warfare 4, которая выйдет в 2026 году — игроков отправят в Корею предотвращать Третью мировую войну 57 мин.
В России хотят наказывать за DDoS-атаки крупным штрафом или тюремным заключением 2 ч.
Соцсеть X запретила использовать свой контент для обучения чужих ИИ 3 ч.
Отечественные ОС пропишут в каждый ноутбук, продаваемый в России 5 ч.
Google навела порядок в Gemini 2.5 Pro — исправлены накопившиеся у ИИ-модели «регрессии» 6 ч.
Game Science подтвердила дату выхода Black Myth: Wukong на Xbox и анонсировала первую скидку на игру 7 ч.
Вышли обзоры «ужасной видеокарты для 1440p» — Radeon RX 9060 XT 8GB сильно отстала от старшей версии 24 мин.
AMD купила команду разработчика ИИ-чипов Untether AI, но не саму компанию, которая тут же закрылась 27 мин.
Для создания российской космической станции «Роскосмос» заказал ещё три ракеты «Ангара-А5М» 5 ч.
Intel признала, что изначально разрабатывала ангстремные техпроцессы 18A и 14A для себя, а не сторонних заказчиков 5 ч.
После рекордного обвала акции Tesla пошли вверх, поскольку Трамп и Маск готовят примирение 6 ч.
Японский лунный аппарат Resilience с мини-луноходом долетел до Луны — и мгновенно разобрался 6 ч.
В Китае испытали сверхзащищённый канал уникальной квантовой связи с взлетающей ракетой 7 ч.
Huawei и XPeng представили гигантский 87-дюймовый проекционный дисплей для авто 7 ч.
Nvidia захватила 92 % рынка видеокарт, но Intel осталась лидером на рынке GPU 7 ч.
Razer выпустила Phantom Collection — клавиатуру, мышь, гарнитуру и коврик в полупрозрачных корпусах 7 ч.