Сегодня 06 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → lg ai research

LG представила нейросеть Captioning AI, которая создаёт текстовые описания для изображений

Одно из подразделений компании LG представило генеративную систему ИИ Captioning AI, которая может распознавать элементы изображения и генерировать для них описания и ключевые слова — трудно переоценить пользу, которую подобная технология способна оказать, например, при систематизации баз фотоснимков крупных компаний.

 Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Представители LG AI Research, занимавшейся разработкой Captioning AI, выступили на мероприятии Computer Vision and Pattern Recognition 2023, крупнейшей в мире конференции, посвящённой «компьютерному зрению» — она проходила в воскресенье в Ванкувере (Канада). Как сообщили в LG, сервис основан на разработанной LG AI Research технологии Zero-shot Image Captioning, позволяющей ИИ «понимать» и описывать объекты или сцены, которые нейросеть оценивает впервые без дополнительных подсказок, на основе своего предыдущего опыта — так же, как и люди.

В компании объяснили, что технология отличается от ИИ-сервисов вроде Midjourney, в которых всё происходит ровно наоборот — пользователи вводят текст или загружают картинку, на основе которых ИИ генерирует собственное творение. Создание «субтитров» к картинкам может показаться довольно лёгким, поскольку концепция не нова. Тем не менее, технология вышла на новый уровень. Например, искусственный интеллект действительно может делать выводы и описывать то, чего он не «видел» никогда раньше — посмотреть на пейзаж или человека и вычислить, о каком именно месте идёт речь. Технология позволяет распознавать на изображении фон, персонажей и даже активность и описывать взаимодействие элементов.

 Источник изображения: LG

Источник изображения: LG

Captioning AI может генерировать текстовые описания и ключевые слова для 10 тыс. изображений менее чем за два дня, что в теории позволяет повысить эффективность и продуктивность для компаний, которым необходимо справляться с большими массивами изображений. В среднем система может генерировать 5 предложений и 10 ключевых слов за 10 секунд.

Сервис разработан при сотрудничестве с Shutterstock, одной из крупнейших платформ для размещения визуального контента — от изображений до видео. LG AI Research сотрудничала с этой американской компанией ранее и намерена делать это и впредь расширяя сотрудничество и с другими партнёрами. Как сообщили в Shutterstock, технология Caption AI развивается благодаря «раннему доступу» к программе десяти глобальных клиентов.


window-new
Soft
Hard
Тренды 🔥
Ремейк Persona 4 скоро выйдет из тени — журналисты рассекретили дату анонса 4 мин.
AMD продолжает шоппинг: компания купила стартап Brium для борьбы с доминированием NVIDIA 39 мин.
В открытый доступ попал релизный трейлер дополнения Lies of P: Overture — аддон выйдет со дня на день 2 ч.
Apple разработала ИИ, выявляющий нетипичные аспекты устной речи — это поможет диагностировать заболевания 2 ч.
ChatGPT научился получать доступ к Gmail, Outlook и «Google Диску» в реальном времени 2 ч.
Microsoft зарабатывает деньги каждый раз, когда кто-либо использует ChatGPT 2 ч.
Инсайдер раскрыл детали CoD: Modern Warfare 4, которая выйдет в 2026 году — игроков отправят в Корею предотвращать Третью мировую войну 2 ч.
В России хотят наказывать за DDoS-атаки крупным штрафом или тюремным заключением 3 ч.
Соцсеть X запретила использовать свой контент для обучения чужих ИИ 4 ч.
Отечественные ОС пропишут в каждый ноутбук, продаваемый в России 6 ч.
Вышли обзоры «ужасной видеокарты для 1440p» — Radeon RX 9060 XT 8GB сильно отстала от старшей версии 2 ч.
AMD купила команду разработчика ИИ-чипов Untether AI, но не саму компанию, которая тут же закрылась 2 ч.
Для создания российской космической станции «Роскосмос» заказал ещё три ракеты «Ангара-А5М» 6 ч.
Intel признала, что изначально разрабатывала ангстремные техпроцессы 18A и 14A для себя, а не сторонних заказчиков 6 ч.
После рекордного обвала акции Tesla пошли вверх, поскольку Трамп и Маск готовят примирение 7 ч.
Японский лунный аппарат Resilience с мини-луноходом долетел до Луны — и мгновенно разобрался 7 ч.
В Китае испытали сверхзащищённый канал уникальной квантовой связи с взлетающей ракетой 8 ч.
Huawei и XPeng представили гигантский 87-дюймовый проекционный дисплей для авто 8 ч.
Nvidia захватила 92 % рынка видеокарт, но Intel осталась лидером на рынке GPU 8 ч.
Razer выпустила Phantom Collection — клавиатуру, мышь, гарнитуру и коврик в полупрозрачных корпусах 8 ч.