Сегодня 22 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → lg ai research

LG представила нейросеть Captioning AI, которая создаёт текстовые описания для изображений

Одно из подразделений компании LG представило генеративную систему ИИ Captioning AI, которая может распознавать элементы изображения и генерировать для них описания и ключевые слова — трудно переоценить пользу, которую подобная технология способна оказать, например, при систематизации баз фотоснимков крупных компаний.

 Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Возможно, не все изображения будет легко описать. Источник изображения: Rick Rothenberg/unsplash.com

Представители LG AI Research, занимавшейся разработкой Captioning AI, выступили на мероприятии Computer Vision and Pattern Recognition 2023, крупнейшей в мире конференции, посвящённой «компьютерному зрению» — она проходила в воскресенье в Ванкувере (Канада). Как сообщили в LG, сервис основан на разработанной LG AI Research технологии Zero-shot Image Captioning, позволяющей ИИ «понимать» и описывать объекты или сцены, которые нейросеть оценивает впервые без дополнительных подсказок, на основе своего предыдущего опыта — так же, как и люди.

В компании объяснили, что технология отличается от ИИ-сервисов вроде Midjourney, в которых всё происходит ровно наоборот — пользователи вводят текст или загружают картинку, на основе которых ИИ генерирует собственное творение. Создание «субтитров» к картинкам может показаться довольно лёгким, поскольку концепция не нова. Тем не менее, технология вышла на новый уровень. Например, искусственный интеллект действительно может делать выводы и описывать то, чего он не «видел» никогда раньше — посмотреть на пейзаж или человека и вычислить, о каком именно месте идёт речь. Технология позволяет распознавать на изображении фон, персонажей и даже активность и описывать взаимодействие элементов.

 Источник изображения: LG

Источник изображения: LG

Captioning AI может генерировать текстовые описания и ключевые слова для 10 тыс. изображений менее чем за два дня, что в теории позволяет повысить эффективность и продуктивность для компаний, которым необходимо справляться с большими массивами изображений. В среднем система может генерировать 5 предложений и 10 ключевых слов за 10 секунд.

Сервис разработан при сотрудничестве с Shutterstock, одной из крупнейших платформ для размещения визуального контента — от изображений до видео. LG AI Research сотрудничала с этой американской компанией ранее и намерена делать это и впредь расширяя сотрудничество и с другими партнёрами. Как сообщили в Shutterstock, технология Caption AI развивается благодаря «раннему доступу» к программе десяти глобальных клиентов.


window-new
Soft
Hard
Тренды 🔥
«Превращает мечту в реальность»: эксперта Digital Foundry впечатлила работа Bloodborne на ПК через эмулятор shadPS4 54 мин.
Google вложит ещё $1 млрд в конкурента OpenAI — ИИ-стартап Anthropic 2 ч.
Трамп помиловал основателя даркнет-платформы Silk Road, осуждённого на пожизненный срок 2 ч.
Регулирование криптовалют станет простым и понятным — сторонники Трампа запустили глубинные изменения в SEC 2 ч.
Аналитики подсчитали траты российских геймеров на игры в 2024 году и назвали главные хиты продаж 2 ч.
Журналисты случайно «засветили» дату выхода Doom: The Dark Ages, которую анонсируют на Developer_Direct 3 ч.
Аудитория Netflix взлетела до 302 млн благодаря «Игре в кальмара» — сервис поднял цены на подписку 3 ч.
Microsoft разрешила OpenAI пользоваться облачными сервисами конкурентов 7 ч.
Microsoft встроила свой браузер Edge во все игры сразу 8 ч.
Windows 11 получила мелкое, но очень полезное обновление индикатора батареи ноутбука 16 ч.
Германия поставила на боевое дежурство израильский подводный беспилотник Blue Whale для патрулирования Балтики 26 мин.
Марсоход Curiosity обнаружил, где на Красной планете плескались волны 51 мин.
Silicon Motion разрабатывает SSD-контроллер SM8466 с поддержкой PCIe 6.0 2 ч.
OpenAI, Softbank и Oracle запустили Stargate — предприятие на $500 млрд по превращению США в ИИ-сверхдержаву 3 ч.
Transcend выпустила SSD серии ETD410T формата U.2 для дата-центров 4 ч.
Владелец TikTok потратит в этом году $12 млрд на ИИ-ускорители от Nvidia и китайских производителей 4 ч.
Samsung вложит в контрактное производство чипов на порядок меньше, чем TSMC 6 ч.
Ускорители Ascend не готовы состязаться с чипами NVIDIA в деле обучения ИИ, но за эффективность инференса Huawei будет бороться всеми силами 6 ч.
Meta планирует выпустить умные очки Oakley, часы и наушники с ИИ 8 ч.
Nvidia в третий раз обошла Apple, став самой дорогой компанией в мире 8 ч.