Сегодня 20 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Программное обеспечение

Вектор модернизации: обзор обновленного ABBYY FineReader 12

Система оптического распознавания текстов FineReader в представлении не нуждается и широко известна во всем мире. За 21 год своего существования на рынке (первая версия программы увидела свет в 1993 году) флагманский продукт ABBYY сумел не только завоевать доверие более чем 20 миллионов пользователей, но и задать новые стандарты качества и направления развития решений класса Optical Character Recognition (OCR). Успело приложение закрепиться и в компьютерной терминологии, о чем свидетельствует прочно вошедшее в обиход и ставшее привычным для многих людей выражение «распознать с помощью FineReader». Система из года в год демонстрирует свою востребованность на рынке электронного документооборота, и нет ничего удивительного в том, что специалисты ABBYY стараются уделять максимум внимания продукту и совершенствованию задействованных в нем технологий.

ABBYY FineReader: смена поколений

В новой, двенадцатой по счету версии OCR-пакета разработчики добавили поддержку распознавания русского языка с ударениями и внесли ряд улучшений в движок системы, в результате чего удалось добиться увеличения скорости обработки документов, точности определения их структуры и распознавания символов. По результатам проведенных ABBYY тестов, FineReader 12 демонстрирует возросшую на 10-15% производительность по сравнению с предыдущей редакцией продукта, точнее воссоздает и сохраняет структуру таблиц (на 40%), диаграмм и графиков (на 33%) плюс лучше справляется с текстами, написанными на иврите, арабском, а также китайском, японском и корейском языках. Все это стало возможным благодаря доработкам адаптивной технологии распознавания документов ADRT (Adaptive Document Recognition Technology), играющей ключевую роль в процессе предварительного анализа изображений и последующей сборки обработанных данных в единое целое.

Не остался без внимания программистов компании ABBYY интерфейс приложения — он стал более «собранным», получил новые диалоги открытия и сохранения файлов, выполнен в единой с Windows 8 стилистике и адаптирован для устройств с сенсорными экранами. FineReader 12 получил не только укрупненные элементы управления, но и поддержку мультитач-жестов, позволяющих пользователям планшетных компьютеров быстро изменять масштаб открытого в программе документа, пролистывать страницы и выполнять прочие операции простым движением пальцев.

Пользовательский интерфейс ABBYY FineReader 12

Серьезно изменились механизмы обработки многостраничных документов и средства извлечения из них фрагментов текста. Операции, которые раньше могли выполняться достаточно длительное время и блокировали доступ пользователя к интерфейсу программы, в новой версии FineReader выполняются в фоновом режиме. Теперь можно просматривать документ, корректировать области распознавания, изменять порядок страниц, заходить в меню программы и выполнять прочие действия, не дожидаясь, пока OCR-система обработает загруженный файл.

В обновленном FineReader нет необходимости дожидаться распознавания всего документа целиком. Можно сразу перейти к нужной странице, выделить необходимую область (картинки, текст, таблицы) и нажать «Копировать». Программа автоматически распознает содержимое и сохранит его в буфер обмена.

В FineReader 12 реализована удобная работа с многостраничными документами и фрагментами текста

Для улучшения качества исходных изображений в FineReader 12 добавлены новые инструменты предобработки графических файлов. В программе появились средства автоматической обрезки фотографий с исправлением геометрических искажений, выравнивания яркости и цвета фона, а также удаления следов печатей и пометок на черно-белых изображениях. Возможности встроенного редактора изображений позволяют изменить разрешение обрабатываемых фотографий, устранить перекосы строк, поменять ориентацию страниц и многое другое, причем все эти настройки можно сделать автоматическими.

Улучшения в предобработке изображений

Усовершенствованиям подвергся также инструментарий для ручной корректировки результатов распознавания. Появилась возможность корректировать форматирование текста в окне «Проверка» — указывать тип шрифта, его размер и начертание, вставлять специальные символы из таблицы Unicode. Для удобства работы с большими объемами текста был добавлен переход между словами с помощью «горячих» клавиш клавиатуры.

Улучшения в окне «Проверка»

В настройках двенадцатой версии FineReader появилась возможность отключать генерацию таких элементов структуры, как колонтитулы, сноски, содержание, нумерованные списки. Деактивация распознавания определенных структурных составляющих позволяет ускорить перевод документов в электронный вид и избежать проблем при их последующей обработке сторонними продуктами (например, системами перевода или конверторами в e-book). Кроме того, пользователь может выбрать один из двух режимов распознавания — с приоритетом скорости или качества. Первый режим позволяет обрабатывать документы до 50% быстрее и рекомендуется для распознавания больших объемов документов с простым оформлением и хорошим качеством печати. Второй режим требует больше времени, но обеспечивает лучшее качество распознавания. Он пригоден для распознавания сложных документов, содержащих текст на цветном фоне, таблицы и прочие элементы оформления.

Настройки OCR-движка FineReader 12

Претерпели изменения в FineReader 12 также инструменты сохранения обработанных документов и их конвертирования в различные форматы. Из наиболее значимых новшеств можно отметить функцию создания файлов EPub, соответствующих стандартам спецификации 2.0.1 или 3.0, а также тесную интеграцию с Google Drive, Dropbox и SkyDrive — теперь перечисленные облачные хранилища отображаются в диалоге сохранения файлов и всегда находятся под рукой. При сохранении в PDF стало возможным использование новой технологии Precise Scan, улучшающей внешний вид отсканированного документа посредством сглаживания изображения символов и устраняющей эффект пикселизации при увеличении масштаба страницы. При конвертации документов в формат XLSX отныне доступны опции сохранения картинок, удаления форматирования текста, а также сохранения каждой страницы документа на отдельном листе Excel. Кроме того, в корпоративной версии FineReader отныне поддерживается экспорт непосредственно в SharePoint Online и Microsoft Office 365, что тоже положительным образом отражается на скорости работы с программой.

Улучшения при сохранении в PDF

Таковы основные отличительные особенности обновленной линейки FineReader, определенно заслуживающей внимания тех, кто часто занимается оцифровкой бумажных документов. Программа представлена на рынке в редакциях Professional и Corporate, распознает документы на 190 мировых языках, совместима со всеми популярными моделями сканеров и многофункциональных устройств (МФУ) и позволяет распознавать текст, полученный с фотоаппарата или встроенной камеры смартфона. Для корректной работы пакета необходим функционирующий под управлением Windows компьютер с тактовой частотой процессора 1 ГГц или выше и объемом оперативной памяти не менее одного гигабайта (для обладателей компьютеров Apple предусмотрен FineReader Pro для Mac).

Обновленная линейка OCR-решений уже доступна в онлайн-маркете store.abbyy.ru, торговых сетях партнеров компании и в виде ознакомительных версий на сайте ABBYY. Рекомендованная розничная цена коробочной версии FineReader 12 Professional составляет 4 990 рублей, электронной версии — 4 490 рублей. Стоимость Corporate-редакции продукта варьируется в зависимости от количества приобретаемых корпоративными заказчиками лицензий. Пользователи предыдущих сборок FineReader могут сэкономить, приобретя соответствующий набор обновлений. Также сберечь финансы можно, ограничившись годовой лицензией на продукт.

И последнее. Прилагаемый к FineReader 12 Professional лицензионный договор допускает использование одной копии приложения на одном стационарном компьютере и одном портативном ПК при условии, что оба устройства принадлежат приобретшему продукт пользователю. Таким образом, программу можно установить и на рабочий ноутбук, и на домашний компьютер, не нарушая тем самым условий лицензионного соглашения с компанией ABBYY.

 
 
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
Schneider Electric ведёт переговоры о покупке Bentley Systems 10 ч.
Новая статья: Atom Bomb Baby: рассказываем, почему Fallout — идеальная экранизация видеоигрового материала, и почему этот сериал не стоит пропускать 11 ч.
Bethesda готовит «несколько очень хороших обновлений» для Starfield, а Fallout 5 не в приоритете 12 ч.
В Dota 2 стартовало сюжетное событие «Павшая корона» с уникальными наградами, новыми «арканами» и комиксом 13 ч.
Связанные одной шиной: «Лаб СП» и «Фактор-ТС» представили отечественную интеграционную платформу Integration Gears 13 ч.
Paradox отказала Prison Architect 2 в досрочном освобождении — релиз отложили ещё на четыре месяца 15 ч.
Спустя 17 лет после релиза Team Fortress 2 получила поддержку 64 бит — выросла производительность и даже боты пропали 16 ч.
Netflix резко нарастила аудиторию и прибыль, запретив совместное использование аккаунтов 17 ч.
Российские студенты победили в чемпионате мира по программированию ICPC 17 ч.
Мошенники стали угонять Telegram-аккаунты через сайты с изображениями 17 ч.
В Японии в 2034 году запустят маглев, скорость движения которого составит 500 км/ч 3 ч.
«Народный» электрический кроссовер Kia EV2 за $14 500 мелькнул на видео 4 ч.
Власти Китая упростили условия привлечения иностранных инвестиций в национальный технологический сектор 5 ч.
Гиперщит с ИИ: Cisco представила систему безопасности Hypershield 12 ч.
Highpoint представила карту расширения на восемь SSD: до 64 Тбайт со скоростью до 56 Гбайт/с 13 ч.
Китайские экспериментальные лунные навигационные спутники прислали фотографии обратной стороны Луны 13 ч.
Налоговая служба Швеции закрыла 18 дата-центров за незаконный майнинг криптовалют 14 ч.
LG выпустила флагманский саундбар S95TR за $1500 с поддержкой Dolby Atmos и настройкой с помощью ИИ 16 ч.
Seagate заявила, что жёсткие диски с HAMR уже не уступают по надёжности традиционным HDD 17 ч.
Corsair представила обновлённые доступные проводные гарнитуры HS35 v2 для геймеров 17 ч.