Сегодня 14 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

LG представила нейросеть Captioning AI, которая создаёт текстовые описания для изображений

Одно из подразделений компании LG представило генеративную систему ИИ Captioning AI, которая может распознавать элементы изображения и генерировать для них описания и ключевые слова — трудно переоценить пользу, которую подобная технология способна оказать, например, при систематизации баз фотоснимков крупных компаний.

 Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Представители LG AI Research, занимавшейся разработкой Captioning AI, выступили на мероприятии Computer Vision and Pattern Recognition 2023, крупнейшей в мире конференции, посвящённой «компьютерному зрению» — она проходила в воскресенье в Ванкувере (Канада). Как сообщили в LG, сервис основан на разработанной LG AI Research технологии Zero-shot Image Captioning, позволяющей ИИ «понимать» и описывать объекты или сцены, которые нейросеть оценивает впервые без дополнительных подсказок, на основе своего предыдущего опыта — так же, как и люди.

В компании объяснили, что технология отличается от ИИ-сервисов вроде Midjourney, в которых всё происходит ровно наоборот — пользователи вводят текст или загружают картинку, на основе которых ИИ генерирует собственное творение. Создание «субтитров» к картинкам может показаться довольно лёгким, поскольку концепция не нова. Тем не менее, технология вышла на новый уровень. Например, искусственный интеллект действительно может делать выводы и описывать то, чего он не «видел» никогда раньше — посмотреть на пейзаж или человека и вычислить, о каком именно месте идёт речь. Технология позволяет распознавать на изображении фон, персонажей и даже активность и описывать взаимодействие элементов.

 Источник изображения: LG

Источник изображения: LG

Captioning AI может генерировать текстовые описания и ключевые слова для 10 тыс. изображений менее чем за два дня, что в теории позволяет повысить эффективность и продуктивность для компаний, которым необходимо справляться с большими массивами изображений. В среднем система может генерировать 5 предложений и 10 ключевых слов за 10 секунд.

Сервис разработан при сотрудничестве с Shutterstock, одной из крупнейших платформ для размещения визуального контента — от изображений до видео. LG AI Research сотрудничала с этой американской компанией ранее и намерена делать это и впредь расширяя сотрудничество и с другими партнёрами. Как сообщили в Shutterstock, технология Caption AI развивается благодаря «раннему доступу» к программе десяти глобальных клиентов.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
TikTok научился оживлять фотографии с помощью ИИ-функции AI Alive 2 ч.
Google превратила приложение «Найти устройство» в Find Hub и расширила его функциональность 3 ч.
Google анонсировала появление ИИ-ассистента Gemini в автомобилях и телевизорах 3 ч.
В Android появятся новые средства защиты от телефонных мошенников 3 ч.
Apple представила «музыкальную терапию» — коллекцию Lo-Fi-треков для работы, учёбы и сна 5 ч.
Суд признал банкротом юрлицо знаменитого магазина «Плеер.ру» — долг перед налоговой составил 350 млн рублей 6 ч.
Захватывающие анонсы, мировые премьеры и секретные разработки: игровая презентация Warhammer Skulls 2025 пройдёт на следующей неделе 6 ч.
Nintendo Switch 2 получит режим ограничения заряда аккумулятора, который продлит срок его службы 6 ч.
Microsoft уволит около 7000 управленцев по всему миру ради оптимизации 6 ч.
Гарнитура Apple Vision Pro поможет людям лучше видеть 6 ч.
Новый химсостав батарей поможет электрокарам GM проезжать 650 км без подзарядки и сделает их безопаснее 2 ч.
Новая статья: Обзор видеокарты NVIDIA GeForce RTX 5060 Ti: не ошибись с гигабайтами 2 ч.
Саудовская Аравия всерьёз намерена стать лидером в ИИ: госстартап Humain договорился о многомиллиардном партнёрстве с NVIDIA, AMD и AWS 2 ч.
Новый уровень RGB в видеокартах: Vastarmor представила Radeon RX 9070 XT Super Alloy Ultra в ярком дизайне 3 ч.
AMD представила процессоры EPYC 4005 Grado для сокета AM5 4 ч.
Bahnhof построит ЦОД в шведском бункере времён Второй мировой войны 5 ч.
Смерть Вселенной наступит намного раньше ожидаемого, подсчитали голландские учёные 5 ч.
Nvidia скоро представит мобильную GeForce RTX 5050 — ноутбуки с ней уже показались в магазинах 6 ч.
xMEMS представила «самый тонкий в мире динамик» для качественного звука в смарт-часах 6 ч.
Ноутбук Gigabyte Aorus Master 16 AI PC получил награду Computex 2025 Best Choice Award за дизайн и ИИ-возможности 6 ч.