Сегодня 14 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → lg ai research

LG представила нейросеть Captioning AI, которая создаёт текстовые описания для изображений

Одно из подразделений компании LG представило генеративную систему ИИ Captioning AI, которая может распознавать элементы изображения и генерировать для них описания и ключевые слова — трудно переоценить пользу, которую подобная технология способна оказать, например, при систематизации баз фотоснимков крупных компаний.

 Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Представители LG AI Research, занимавшейся разработкой Captioning AI, выступили на мероприятии Computer Vision and Pattern Recognition 2023, крупнейшей в мире конференции, посвящённой «компьютерному зрению» — она проходила в воскресенье в Ванкувере (Канада). Как сообщили в LG, сервис основан на разработанной LG AI Research технологии Zero-shot Image Captioning, позволяющей ИИ «понимать» и описывать объекты или сцены, которые нейросеть оценивает впервые без дополнительных подсказок, на основе своего предыдущего опыта — так же, как и люди.

В компании объяснили, что технология отличается от ИИ-сервисов вроде Midjourney, в которых всё происходит ровно наоборот — пользователи вводят текст или загружают картинку, на основе которых ИИ генерирует собственное творение. Создание «субтитров» к картинкам может показаться довольно лёгким, поскольку концепция не нова. Тем не менее, технология вышла на новый уровень. Например, искусственный интеллект действительно может делать выводы и описывать то, чего он не «видел» никогда раньше — посмотреть на пейзаж или человека и вычислить, о каком именно месте идёт речь. Технология позволяет распознавать на изображении фон, персонажей и даже активность и описывать взаимодействие элементов.

 Источник изображения: LG

Источник изображения: LG

Captioning AI может генерировать текстовые описания и ключевые слова для 10 тыс. изображений менее чем за два дня, что в теории позволяет повысить эффективность и продуктивность для компаний, которым необходимо справляться с большими массивами изображений. В среднем система может генерировать 5 предложений и 10 ключевых слов за 10 секунд.

Сервис разработан при сотрудничестве с Shutterstock, одной из крупнейших платформ для размещения визуального контента — от изображений до видео. LG AI Research сотрудничала с этой американской компанией ранее и намерена делать это и впредь расширяя сотрудничество и с другими партнёрами. Как сообщили в Shutterstock, технология Caption AI развивается благодаря «раннему доступу» к программе десяти глобальных клиентов.


window-new
Soft
Hard
Тренды 🔥
Уязвимость Spectre вернулась в процессоры Intel и замедлила старые ПК 2 ч.
Новые атаки Spectre-v2 легко обходят защиту CPU Intel и крадут данные из ядра 4 ч.
TikTok научился оживлять фотографии с помощью ИИ-функции AI Alive 9 ч.
Google превратила приложение «Найти устройство» в Find Hub и расширила его функциональность 9 ч.
Google анонсировала появление ИИ-ассистента Gemini в автомобилях и телевизорах 10 ч.
В Android появятся новые средства защиты от телефонных мошенников 10 ч.
«Ну вот и GTA VI наконец вышла»: криминальная песочница The Precinct обрадовала игроков на релизе 10 ч.
Apple представила «музыкальную терапию» — коллекцию Lo-Fi-треков для работы, учёбы и сна 11 ч.
Суд признал банкротом юрлицо знаменитого магазина «Плеер.ру» — долг перед налоговой составил 350 млн рублей 12 ч.
Захватывающие анонсы, мировые премьеры и секретные разработки: игровая презентация Warhammer Skulls 2025 пройдёт на следующей неделе 13 ч.
Panasonic представила полнокадровую беззеркальную камеру Lumix S1 II — мощную, но дорогую 2 ч.
Саудовская сделка увеличила благосостояние основателя Nvidia до $120 млрд 4 ч.
Новый химсостав батарей поможет электрокарам GM проезжать 650 км без подзарядки и сделает их безопаснее 8 ч.
Новая статья: Обзор видеокарты NVIDIA GeForce RTX 5060 Ti: не ошибись с гигабайтами 9 ч.
Саудовская Аравия всерьёз намерена стать лидером в ИИ: госстартап Humain договорился о многомиллиардном партнёрстве с NVIDIA, AMD и AWS 9 ч.
Новый уровень RGB в видеокартах: Vastarmor представила Radeon RX 9070 XT Super Alloy Ultra в ярком дизайне 9 ч.
AMD представила процессоры EPYC 4005 Grado для сокета AM5 11 ч.
Bahnhof построит ЦОД в шведском бункере времён Второй мировой войны 12 ч.
Nvidia скоро представит мобильную GeForce RTX 5050 — ноутбуки с ней уже показались в магазинах 13 ч.
xMEMS представила «самый тонкий в мире динамик» для качественного звука в смарт-часах 13 ч.