Сегодня 21 ноября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Программное обеспечение

Вектор модернизации: обзор обновленного ABBYY FineReader 12

Система оптического распознавания текстов FineReader в представлении не нуждается и широко известна во всем мире. За 21 год своего существования на рынке (первая версия программы увидела свет в 1993 году) флагманский продукт ABBYY сумел не только завоевать доверие более чем 20 миллионов пользователей, но и задать новые стандарты качества и направления развития решений класса Optical Character Recognition (OCR). Успело приложение закрепиться и в компьютерной терминологии, о чем свидетельствует прочно вошедшее в обиход и ставшее привычным для многих людей выражение «распознать с помощью FineReader». Система из года в год демонстрирует свою востребованность на рынке электронного документооборота, и нет ничего удивительного в том, что специалисты ABBYY стараются уделять максимум внимания продукту и совершенствованию задействованных в нем технологий.

ABBYY FineReader: смена поколений

В новой, двенадцатой по счету версии OCR-пакета разработчики добавили поддержку распознавания русского языка с ударениями и внесли ряд улучшений в движок системы, в результате чего удалось добиться увеличения скорости обработки документов, точности определения их структуры и распознавания символов. По результатам проведенных ABBYY тестов, FineReader 12 демонстрирует возросшую на 10-15% производительность по сравнению с предыдущей редакцией продукта, точнее воссоздает и сохраняет структуру таблиц (на 40%), диаграмм и графиков (на 33%) плюс лучше справляется с текстами, написанными на иврите, арабском, а также китайском, японском и корейском языках. Все это стало возможным благодаря доработкам адаптивной технологии распознавания документов ADRT (Adaptive Document Recognition Technology), играющей ключевую роль в процессе предварительного анализа изображений и последующей сборки обработанных данных в единое целое.

Не остался без внимания программистов компании ABBYY интерфейс приложения — он стал более «собранным», получил новые диалоги открытия и сохранения файлов, выполнен в единой с Windows 8 стилистике и адаптирован для устройств с сенсорными экранами. FineReader 12 получил не только укрупненные элементы управления, но и поддержку мультитач-жестов, позволяющих пользователям планшетных компьютеров быстро изменять масштаб открытого в программе документа, пролистывать страницы и выполнять прочие операции простым движением пальцев.

Пользовательский интерфейс ABBYY FineReader 12

Серьезно изменились механизмы обработки многостраничных документов и средства извлечения из них фрагментов текста. Операции, которые раньше могли выполняться достаточно длительное время и блокировали доступ пользователя к интерфейсу программы, в новой версии FineReader выполняются в фоновом режиме. Теперь можно просматривать документ, корректировать области распознавания, изменять порядок страниц, заходить в меню программы и выполнять прочие действия, не дожидаясь, пока OCR-система обработает загруженный файл.

В обновленном FineReader нет необходимости дожидаться распознавания всего документа целиком. Можно сразу перейти к нужной странице, выделить необходимую область (картинки, текст, таблицы) и нажать «Копировать». Программа автоматически распознает содержимое и сохранит его в буфер обмена.

В FineReader 12 реализована удобная работа с многостраничными документами и фрагментами текста

Для улучшения качества исходных изображений в FineReader 12 добавлены новые инструменты предобработки графических файлов. В программе появились средства автоматической обрезки фотографий с исправлением геометрических искажений, выравнивания яркости и цвета фона, а также удаления следов печатей и пометок на черно-белых изображениях. Возможности встроенного редактора изображений позволяют изменить разрешение обрабатываемых фотографий, устранить перекосы строк, поменять ориентацию страниц и многое другое, причем все эти настройки можно сделать автоматическими.

Улучшения в предобработке изображений

Усовершенствованиям подвергся также инструментарий для ручной корректировки результатов распознавания. Появилась возможность корректировать форматирование текста в окне «Проверка» — указывать тип шрифта, его размер и начертание, вставлять специальные символы из таблицы Unicode. Для удобства работы с большими объемами текста был добавлен переход между словами с помощью «горячих» клавиш клавиатуры.

Улучшения в окне «Проверка»

В настройках двенадцатой версии FineReader появилась возможность отключать генерацию таких элементов структуры, как колонтитулы, сноски, содержание, нумерованные списки. Деактивация распознавания определенных структурных составляющих позволяет ускорить перевод документов в электронный вид и избежать проблем при их последующей обработке сторонними продуктами (например, системами перевода или конверторами в e-book). Кроме того, пользователь может выбрать один из двух режимов распознавания — с приоритетом скорости или качества. Первый режим позволяет обрабатывать документы до 50% быстрее и рекомендуется для распознавания больших объемов документов с простым оформлением и хорошим качеством печати. Второй режим требует больше времени, но обеспечивает лучшее качество распознавания. Он пригоден для распознавания сложных документов, содержащих текст на цветном фоне, таблицы и прочие элементы оформления.

Настройки OCR-движка FineReader 12

Претерпели изменения в FineReader 12 также инструменты сохранения обработанных документов и их конвертирования в различные форматы. Из наиболее значимых новшеств можно отметить функцию создания файлов EPub, соответствующих стандартам спецификации 2.0.1 или 3.0, а также тесную интеграцию с Google Drive, Dropbox и SkyDrive — теперь перечисленные облачные хранилища отображаются в диалоге сохранения файлов и всегда находятся под рукой. При сохранении в PDF стало возможным использование новой технологии Precise Scan, улучшающей внешний вид отсканированного документа посредством сглаживания изображения символов и устраняющей эффект пикселизации при увеличении масштаба страницы. При конвертации документов в формат XLSX отныне доступны опции сохранения картинок, удаления форматирования текста, а также сохранения каждой страницы документа на отдельном листе Excel. Кроме того, в корпоративной версии FineReader отныне поддерживается экспорт непосредственно в SharePoint Online и Microsoft Office 365, что тоже положительным образом отражается на скорости работы с программой.

Улучшения при сохранении в PDF

Таковы основные отличительные особенности обновленной линейки FineReader, определенно заслуживающей внимания тех, кто часто занимается оцифровкой бумажных документов. Программа представлена на рынке в редакциях Professional и Corporate, распознает документы на 190 мировых языках, совместима со всеми популярными моделями сканеров и многофункциональных устройств (МФУ) и позволяет распознавать текст, полученный с фотоаппарата или встроенной камеры смартфона. Для корректной работы пакета необходим функционирующий под управлением Windows компьютер с тактовой частотой процессора 1 ГГц или выше и объемом оперативной памяти не менее одного гигабайта (для обладателей компьютеров Apple предусмотрен FineReader Pro для Mac).

Обновленная линейка OCR-решений уже доступна в онлайн-маркете store.abbyy.ru, торговых сетях партнеров компании и в виде ознакомительных версий на сайте ABBYY. Рекомендованная розничная цена коробочной версии FineReader 12 Professional составляет 4 990 рублей, электронной версии — 4 490 рублей. Стоимость Corporate-редакции продукта варьируется в зависимости от количества приобретаемых корпоративными заказчиками лицензий. Пользователи предыдущих сборок FineReader могут сэкономить, приобретя соответствующий набор обновлений. Также сберечь финансы можно, ограничившись годовой лицензией на продукт.

И последнее. Прилагаемый к FineReader 12 Professional лицензионный договор допускает использование одной копии приложения на одном стационарном компьютере и одном портативном ПК при условии, что оба устройства принадлежат приобретшему продукт пользователю. Таким образом, программу можно установить и на рабочий ноутбук, и на домашний компьютер, не нарушая тем самым условий лицензионного соглашения с компанией ABBYY.

 
 
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
GTA наоборот: полицейская песочница The Precinct с «дозой нуара 80-х» не выйдет в 2024 году 32 мин.
D-Link предложила устранить уязвимость маршрутизаторов покупкой новых 2 ч.
Valve ужесточила правила продажи сезонных абонементов в Steam и начнёт следить за выполнением обещаний разработчиков 2 ч.
Австралия представила беспрецедентный законопроект о полном запрете соцсетей для детей до 16 лет 3 ч.
Биткоин приближается к $100 000 — курс первой криптовалюты установил новый рекорд 3 ч.
В открытых лобби Warhammer 40,000: Space Marine 2 запретят играть с модами, но есть и хорошие новости 4 ч.
Apple попросила суд отклонить антимонопольный иск Минюста США 4 ч.
Битва за Chrome: Google рассказала об ужасных последствиях отчуждения браузера для США и инноваций 4 ч.
ИИ помог Google выявить 26 уязвимостей в открытом ПО, включая двадцатилетнюю 6 ч.
Власти США попытаются отнять самый популярный браузер у Google через суд 6 ч.
«Квантовые жёсткие диски» стали ближе к реальности благодаря разработке австралийских учёных 3 мин.
Электромобили станут более автономными и долговечными: Honda через несколько лет стартует массовый выпуск твердотельных батарей 11 мин.
Большой планшет Oppo Pad 3 Pro вышел на глобальный рынок за €600 24 мин.
Гигантские ракеты SpaceX Starship смогут летать в пять раз чаще с 2025 года 42 мин.
Каждый третий смартфон теперь попадает в Россию нелегально 2 ч.
Зонд Solar Orbiter прислал самые чёткие изображения поверхности Солнца 3 ч.
Суперкомпьютеры Eviden заняли первые места в рейтинге экологичных систем Green500 3 ч.
NASA поручит SpaceX и Blue Origin доставку автомобиля и жилища для астронавтов на Луну 3 ч.
Квартальная выручка NVIDIA в сегменте ЦОД бьёт рекорды, но рост замедлился 3 ч.
Huawei санкции нипочём: поставки новейших ИИ-ускорителей Ascend 910C стартуют в следующем квартале 4 ч.