Сегодня 25 сентября 2023
18+
MWC 2018 2018 Computex IFA 2018
Новости Software

«Яндекс.Диск» научился искать изображения по надписям на них

Компания «Яндекс» реализовала технологию компьютерного зрения в облачном хранилище данных «Яндекс.Диск»: отныне сервис позволяет искать изображения, содержащие текст поискового запроса.

В основе поиска надписей на изображениях лежит технология оптического распознавания символов. Система состоит из двух частей — классификатора картинок и модуля распознавания. Сначала классификатор (глубокая нейронная сеть) отбирает из всех доступных изображений те, на которых присутствует текст. Использование машинного обучения позволяет добиться высокого качества распознавания, поскольку алгоритм опирается не на какие-то определённые правила, а на опыт анализа миллионов разных файлов.

Когда изображения с текстом отобраны, система находит на них линии, предположительно содержащие текст, — различать их помогает ещё одна нейронная сеть. На следующем этапе алгоритм оставляет только те линии текста, в которых он уверен. Далее модуль распознавания разбивает линии текста на отдельные символы. Для каждого символа определяется несколько наиболее вероятных вариантов распознавания. Например, это могут быть буквы «О», «о» и цифра «0», очень похожие друг на друга.

После этого в дело вступает языковая модель — система принимает решение, какой из символов-кандидатов подходит лучше всего. Данный инструмент опирается на словари и учитывает не только сходство символов с теми, которые знает система, но и контекст, то есть соседние символы. Если из нескольких вероятных символов складывается известное системе слово, то она может принять решение, что на картинке написано именно оно.

В настоящее время сервис позволяет искать по тексту изображения форматов JPEG, GIF и PNG. В результатах поиска выводятся не только картинки, соответствующие введённому запросу, но и файлы и папки, в названиях и описаниях которых есть указанное слово.

Система способна распознавать текст на изображениях, разных по виду, содержанию и качеству. Точность распознавания текстов на русском языке составляет около 80 % для отсканированных документов, примерно 63 % для фотографий с надписями и почти 100 % для скриншотов. Помимо русского языка, система также распознаёт английский, украинский и турецкий. Точность распознавания текстов всего потока изображений превышает 70 %.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Гибридная облачная платформа Huawei Cloud Stack упростит создание кастомных ИИ-моделей 6 ч.
Военная стратегия Company of Heroes выйдет на Nintendo Switch со всеми дополнениями уже 12 октября 8 ч.
Видео: 9 минут геймплея сессионного онлайн-шутера Escape from Tarkov: Arena 11 ч.
400 тыс. новых вирусов каждый день: «Лаборатория Касперского» заявила о глобальном росте числа кибератак 19 ч.
Nintendo сделала шаг в будущее без паролей: заработал вход в аккаунт Nintendo через Passkey 22 ч.
Новая статья: Dune: Spice Wars — дождевой червяк вместо Шаи-Хулуда. Рецензия 24-09 00:22
Resident Evil Village для iPhone и iPad выйдет 30 октября 23-09 17:33
Microsoft обогатила мобильную клавиатуру SwiftKey ИИ-функциями — умные подсказки, проверка текста и генерация картинок и стикеров 23-09 16:21
Клиентов российских хостингов будут идентифицировать через «Госуслуги» или по паспорту 23-09 14:40
ИИ-генераторы текстов и изображений оказались экологичнее живых писателей и художников 23-09 12:40
Новая статья: Как DDR5-память влияет на производительность Ryzen 7 7800X3D: отвечаем на главные вопросы 5 ч.
Microsoft ищет топ-менеджера по внедрению малых модульных реакторов для питания ЦОД 6 ч.
Swissbit представила индустриальные microSD-карты iShield Archive с аппаратным AES-шифрованием и контролем доступа 8 ч.
Китай под санкциями удвоил уровень локализации в сфере оборудования для производства чипов 16 ч.
SpaceX повторила рекорд по использованию первой ступени Falcon 9 в 17-й раз 18 ч.
Apple iPhone 15 Plus стал рекордсменом по продолжительности работы аккумулятора 22 ч.
Американская Lucid Motors получила разрешение на выпуск электромобилей в Саудовской Аравии 22 ч.
В Остине роботизированные такси Cruise создали затор на перекрёстке и быстро его усугубили 22 ч.
Смартфоны iPhone 15 поддерживают проводное подключение к интернету — быстрее, чем по Wi-Fi 24 ч.
Solidigm представила SSD P5810 на памяти SLC для нагрузок с активной записью данных 23-09 22:13