Сегодня 10 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Программное обеспечение

Вектор модернизации: обзор обновленного ABBYY FineReader 12

Система оптического распознавания текстов FineReader в представлении не нуждается и широко известна во всем мире. За 21 год своего существования на рынке (первая версия программы увидела свет в 1993 году) флагманский продукт ABBYY сумел не только завоевать доверие более чем 20 миллионов пользователей, но и задать новые стандарты качества и направления развития решений класса Optical Character Recognition (OCR). Успело приложение закрепиться и в компьютерной терминологии, о чем свидетельствует прочно вошедшее в обиход и ставшее привычным для многих людей выражение «распознать с помощью FineReader». Система из года в год демонстрирует свою востребованность на рынке электронного документооборота, и нет ничего удивительного в том, что специалисты ABBYY стараются уделять максимум внимания продукту и совершенствованию задействованных в нем технологий.

ABBYY FineReader: смена поколений

В новой, двенадцатой по счету версии OCR-пакета разработчики добавили поддержку распознавания русского языка с ударениями и внесли ряд улучшений в движок системы, в результате чего удалось добиться увеличения скорости обработки документов, точности определения их структуры и распознавания символов. По результатам проведенных ABBYY тестов, FineReader 12 демонстрирует возросшую на 10-15% производительность по сравнению с предыдущей редакцией продукта, точнее воссоздает и сохраняет структуру таблиц (на 40%), диаграмм и графиков (на 33%) плюс лучше справляется с текстами, написанными на иврите, арабском, а также китайском, японском и корейском языках. Все это стало возможным благодаря доработкам адаптивной технологии распознавания документов ADRT (Adaptive Document Recognition Technology), играющей ключевую роль в процессе предварительного анализа изображений и последующей сборки обработанных данных в единое целое.

Не остался без внимания программистов компании ABBYY интерфейс приложения — он стал более «собранным», получил новые диалоги открытия и сохранения файлов, выполнен в единой с Windows 8 стилистике и адаптирован для устройств с сенсорными экранами. FineReader 12 получил не только укрупненные элементы управления, но и поддержку мультитач-жестов, позволяющих пользователям планшетных компьютеров быстро изменять масштаб открытого в программе документа, пролистывать страницы и выполнять прочие операции простым движением пальцев.

Пользовательский интерфейс ABBYY FineReader 12

Серьезно изменились механизмы обработки многостраничных документов и средства извлечения из них фрагментов текста. Операции, которые раньше могли выполняться достаточно длительное время и блокировали доступ пользователя к интерфейсу программы, в новой версии FineReader выполняются в фоновом режиме. Теперь можно просматривать документ, корректировать области распознавания, изменять порядок страниц, заходить в меню программы и выполнять прочие действия, не дожидаясь, пока OCR-система обработает загруженный файл.

В обновленном FineReader нет необходимости дожидаться распознавания всего документа целиком. Можно сразу перейти к нужной странице, выделить необходимую область (картинки, текст, таблицы) и нажать «Копировать». Программа автоматически распознает содержимое и сохранит его в буфер обмена.

В FineReader 12 реализована удобная работа с многостраничными документами и фрагментами текста

Для улучшения качества исходных изображений в FineReader 12 добавлены новые инструменты предобработки графических файлов. В программе появились средства автоматической обрезки фотографий с исправлением геометрических искажений, выравнивания яркости и цвета фона, а также удаления следов печатей и пометок на черно-белых изображениях. Возможности встроенного редактора изображений позволяют изменить разрешение обрабатываемых фотографий, устранить перекосы строк, поменять ориентацию страниц и многое другое, причем все эти настройки можно сделать автоматическими.

Улучшения в предобработке изображений

Усовершенствованиям подвергся также инструментарий для ручной корректировки результатов распознавания. Появилась возможность корректировать форматирование текста в окне «Проверка» — указывать тип шрифта, его размер и начертание, вставлять специальные символы из таблицы Unicode. Для удобства работы с большими объемами текста был добавлен переход между словами с помощью «горячих» клавиш клавиатуры.

Улучшения в окне «Проверка»

В настройках двенадцатой версии FineReader появилась возможность отключать генерацию таких элементов структуры, как колонтитулы, сноски, содержание, нумерованные списки. Деактивация распознавания определенных структурных составляющих позволяет ускорить перевод документов в электронный вид и избежать проблем при их последующей обработке сторонними продуктами (например, системами перевода или конверторами в e-book). Кроме того, пользователь может выбрать один из двух режимов распознавания — с приоритетом скорости или качества. Первый режим позволяет обрабатывать документы до 50% быстрее и рекомендуется для распознавания больших объемов документов с простым оформлением и хорошим качеством печати. Второй режим требует больше времени, но обеспечивает лучшее качество распознавания. Он пригоден для распознавания сложных документов, содержащих текст на цветном фоне, таблицы и прочие элементы оформления.

Настройки OCR-движка FineReader 12

Претерпели изменения в FineReader 12 также инструменты сохранения обработанных документов и их конвертирования в различные форматы. Из наиболее значимых новшеств можно отметить функцию создания файлов EPub, соответствующих стандартам спецификации 2.0.1 или 3.0, а также тесную интеграцию с Google Drive, Dropbox и SkyDrive — теперь перечисленные облачные хранилища отображаются в диалоге сохранения файлов и всегда находятся под рукой. При сохранении в PDF стало возможным использование новой технологии Precise Scan, улучшающей внешний вид отсканированного документа посредством сглаживания изображения символов и устраняющей эффект пикселизации при увеличении масштаба страницы. При конвертации документов в формат XLSX отныне доступны опции сохранения картинок, удаления форматирования текста, а также сохранения каждой страницы документа на отдельном листе Excel. Кроме того, в корпоративной версии FineReader отныне поддерживается экспорт непосредственно в SharePoint Online и Microsoft Office 365, что тоже положительным образом отражается на скорости работы с программой.

Улучшения при сохранении в PDF

Таковы основные отличительные особенности обновленной линейки FineReader, определенно заслуживающей внимания тех, кто часто занимается оцифровкой бумажных документов. Программа представлена на рынке в редакциях Professional и Corporate, распознает документы на 190 мировых языках, совместима со всеми популярными моделями сканеров и многофункциональных устройств (МФУ) и позволяет распознавать текст, полученный с фотоаппарата или встроенной камеры смартфона. Для корректной работы пакета необходим функционирующий под управлением Windows компьютер с тактовой частотой процессора 1 ГГц или выше и объемом оперативной памяти не менее одного гигабайта (для обладателей компьютеров Apple предусмотрен FineReader Pro для Mac).

Обновленная линейка OCR-решений уже доступна в онлайн-маркете store.abbyy.ru, торговых сетях партнеров компании и в виде ознакомительных версий на сайте ABBYY. Рекомендованная розничная цена коробочной версии FineReader 12 Professional составляет 4 990 рублей, электронной версии — 4 490 рублей. Стоимость Corporate-редакции продукта варьируется в зависимости от количества приобретаемых корпоративными заказчиками лицензий. Пользователи предыдущих сборок FineReader могут сэкономить, приобретя соответствующий набор обновлений. Также сберечь финансы можно, ограничившись годовой лицензией на продукт.

И последнее. Прилагаемый к FineReader 12 Professional лицензионный договор допускает использование одной копии приложения на одном стационарном компьютере и одном портативном ПК при условии, что оба устройства принадлежат приобретшему продукт пользователю. Таким образом, программу можно установить и на рабочий ноутбук, и на домашний компьютер, не нарушая тем самым условий лицензионного соглашения с компанией ABBYY.

 
 
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

window-new
Soft
Hard
Тренды 🔥
Финансовый отчёт Arkane Studios раскрыл, когда выйдет боевик Marvel’s Blade от создателей Deathloop и Dishonored 40 мин.
Snoop Dogg выпустил трек про Telegram — миллион его NFT-подарков разлетелся за считанные минуты 2 ч.
Microsoft похвасталась, что сэкономила $500 млн с помощью ИИ в прошлом году, — а в этом уволила 15 000 сотрудников 2 ч.
Дополнение к «Смуте» превратилось в отдельную игру — дата выхода и скриншоты приключенческого боевика «Земский собор» 2 ч.
Безинтернетный мессенджер Bitchat от основателя Twitter провалил первую проверку безопасности 3 ч.
Биткоин рекордно подорожал до $112 000 — в том числе благодаря Nvidia 3 ч.
Bethesda приступила к улучшению производительности The Elder Scrolls IV: Oblivion Remastered — в Steam вышла бета-версия патча 1.2 3 ч.
Meta купила главу разработки ИИ Apple за $200 млн — даже Тим Кук получает меньше 3 ч.
Перенос ценой $250 миллионов: Subnautica 2 не выйдет в 2025 году, зато получила первый геймплейный трейлер 5 ч.
Суд: почта Великобритании и Fujitsu «должны были знать» о дефектах IT-системы Horizon, сломавших сотни жизней 5 ч.
«Пользователи не просили»: Samsung объяснила, почему Galaxy Z Fold7 не получил более ёмкую батарею 10 мин.
Выше всех ожиданий: квартальная выручка TSMC взлетела на 38,6 % благодаря ИИ 2 ч.
Российская Caviar выпустила смартфоны Galaxy Z fold7 и Galaxy Z Flip7 с золотыми Labubu по цене от $8910 2 ч.
Samsung столкнулась с утечкой мозгов — инженеры бегут из компании из-за бюрократии и проблем с руководством 2 ч.
Украина первой в Европе подключит смартфоны к спутникам Starlink — уже в следующем году 2 ч.
Непредсказуемый космический бильярд — NASA просчиталось с ударным отклонением опасных астероидов 2 ч.
Углеродные выбросы Google выросли на 1515 % за 14 лет, но компания уверяет, что экоактивисты перевирают факты 4 ч.
Новые тесты подтвердили высокую эффективность электрических грузовиков Tesla Semi 4 ч.
Nvidia выпустит новый ИИ-ускоритель для Китая не раньше сентября 4 ч.
Tesla через пару месяцев намерена запустить свои роботакси в Сан-Франциско 6 ч.