Сегодня 18 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Программное обеспечение

Утилиты конвертирования PDF-документов в форматы Word и Excel

⇣ Содержание
Вся техническая документация сегодня поставляется в формате PDF, для просмотра документов в котором используется бесплатная утилита Adobe Acrobat Reader. Но довольно часто возникает необходимость воспользоваться какими-то фрагментами PDF-файлов при подготовке собственных документов или даже отредактировать материалы в PDF-формате, например, статью, контракт, отчет и т.п. В первом случае потребуется извлечь из PDF-файлов фрагменты текста и/или изображения. Теоретически, это обычно можно сделать и встроенными средствами Acrobat Reader, но нередко с посредственным результатом. Во втором случае придется конвертировать PDF-документы в редактируемый формат (например, MS Word) с сохранением оформления исходного документа, что в программе Acrobat Reader не предусмотрено. Существуют два варианта решения проблемы - установить программу-конвертер, которая обеспечит преобразование PDF-документов в формат MS Word и/или MS Excel, либо воспользоваться специальным онлайновым сервисом. На использовании утилит такого плана мы, в основном, и остановимся в данной статье. Что касается онлайновых сервисов, то в качестве примеров можно привести Pdftoword.com компании Nitro PDF Software и Zamzar.com компании Zamzar. С их помощью осуществить конвертирование PDF-документов проще простого - нужно лишь указать в поле "Step1" интересующий PDF-файл, в поле "Step2" выбрать нужный вам формат, ввести в поле "Step3" свой адрес электронной почты и щелкнуть на кнопке "Convert". Сервис любезно сообщит о том, что файл принят, и через некоторое время на свой почтовый ящик вы получите вожделенный Word-документ (на первом из названных сервисов), либо ссылку на него (на втором сервисе).
 1_s.jpg
Онлайн-сервис Pdftoword.com умеет преобразовывать PDF-документы в форматы DOC или RTF, а результаты его конвертирования просто идеальны - никаких прямоугольных блоков с отдельными фрагментами текста, что нередко можно наблюдать после работы ряда программ-конвертеров. Правда, в сети имеются замечания пользователей об иногда некорректном преобразовании этим сервисом документов с кириллицей, однако в нашем случае такой проблемы отмечено не было. Ниже приведен пример исходного PDF-документа и полученный на его основе DOC-файл.
 2_s.jpg
Сервис Zamzar.com может использоваться не только для конвертирования PDF-файлов в форматы DOC или RTF, но и других преобразований файлов, скажем, изображений и музыки из одного формата в другой, и поддерживает пакетный режим обработки данных. Однако полученные с его помощью из PDF-файлов Word-документы имеют несколько худшее качество, чем после обработки на Pdftoword.com, поскольку в них присутствуют прямоугольные блоки данных. Но все равно, для бесплатного решения вариант достаточно неплох.
 3_s.jpg

#ABBYY PDF Transformer 3.0

Разработчик: ABBYY Software
Размер дистрибутива: 220 Мб
Распространение: условно бесплатная ABBYY PDF Transformer - профессиональное решение для конвертирования PDF-документов в форматы документов Microsoft Word и Microsoft Excel, а также в HTML и TXT-файлы. Программа умеет конвертировать любые PDF-файлы, включая файлы без текстового слоя (такие файлы чаще всего получаются из отсканированных документов и представляют собой изображение текста) и корректно обрабатывает PDF-файлы, содержащие любые комбинации поддерживаемых языков, которых всего 184, включая, русский и английский. При необходимости, возможно выборочное конвертирование отдельных страниц или даже конкретных их фрагментов. Утилита точно сохраняет оформление исходного документа (картинки, таблицы, расположение колонок, ссылки) и позволяет управлять вариантами конвертирования и сохранения. Например, можно четко определить области, которые должны восприниматься программой как текст или как изображения (что может быть актуальным для PDF-файлов со сложным оформлением), сохранить готовый документ с таким же оформлением, как в оригинале, или как колонку текста (с картинками или без - по желанию) и т.д. Кроме того, программа может использоваться для создания PDF-документов напрямую из приложений Microsoft Office, любых приложений, поддерживающих вывод документов на печать, а также из проводника Windows одним щелчком мыши. Вдобавок она может применяться для объединения нескольких файлов различного формата в один PDF-документ. Демо-версия программы (имеется русскоязычная локализация) работоспособна в течение 15 дней и позволяет конвертировать не более 50 PDF-документов и не более двух страниц за один раз. Количество PDF-файлов, создаваемых во время испытательного периода, не ограничено, но все они будут иметь специальную отметку. Стоимость коммерческой версии зависит от варианта приобретения: коробочная версия - 1490 руб., версия для скачивания - 1340 руб. В ABBYY PDF Transformer предусмотрено несколько способов конвертирования PDF-документов в документы MS Office. Можно запустить конвертер и для конвертирования в документ Word нажать кнопку "Открыть PDF", затем в открывшемся окне выбрать файл для конвертирования. Если PDF-документ защищен паролем, то программа запросит пароль. Затем в списке форматов, в которые может быть произведено конвертирование, нужно выбрать вариант "Конвертировать в документ Microsoft Word". При необходимости, можно изменить имя файла и папку для его сохранения, для чего следует нажать на ссылку "Изменить". Тут же можно настроить дополнительные параметры в группе "Дополнительные опции". В частности, выбрать режим сохранения оформления:
  • "Как в оригинале" - позволяет получить документ, внешний вид которого будет полностью идентичен оригиналу;
  • "В одну колонку" - обеспечивает полное восстановление конвертируемого текста (с учетом разбиения на абзацы, начертания и размера шрифта), однако оформление оригинала при этом воспроизведено не будет.
Также можно включить/отключить флажок "Сохранять картинки", для того чтобы иллюстрации при конвертировании сохранялись (это увеличивает размер получаемого файла) либо нет.
 4_s.jpg
После этого осталось щелкнуть на кнопке "Конвертировать" и получить готовый Word-документ, который будет автоматически открыт. Никакого дополнительного редактирования в полученном документе не потребуется, поскольку преобразование производится очень качественно.
 5_s.jpg
Если требуется конвертировать не весь документ, а отдельные страницы, то их можно выделить в окне "Страницы" (оно в правой части главного окна) и из контекстного меню выбирать команду "Конвертировать выбранные страницы". Для выборочного конвертирования PDF-файлов в таблицы Excel надо действовать несколько иначе. Вначале открыть исходный PDF-файл, потом найти в нем страницу с таблицей, выделить мышью область с таблицей и определить данную область в качестве таблицы (команда "Область Таблица" из контекстного меню). Затем активировать из контекстного меню, на этот раз вызванного на странице в окне "Страницы", команду "Конвертировать выбранные страницы".
 6_s.jpg
Полученная таблица будет сформирована и открыта в Excel.
 7_s.jpg
Если требуется сохранить все таблицы из PDF-документа в файл Excel, то выделять их не нужно, а следует выбрать в списке форматов вариант "Конвертировать в документ Microsoft Excel". Затем в группе "Дополнительные опции" надо включить флажок "Игнорировать текст вне таблицы" и щелкнуть на кнопке "Конвертировать". Все таблицы из документа будут помещены на одном листе друг за другом.
 8_s.jpg
Извлечение изображений теоретически также возможно, но реализовано неудобно - картинки придется по очереди выделять и копировать через буфер обмена, то есть никакого преимущества перед копированием изображений из Acrobat Reader не наблюдается. Иными словами, извлечь и сохранить в виде графических файлов картинки с выделенных страниц, либо всего документа, невозможно. Есть возможность запускать процесс конвертирования PDF-документов из проводника Windows (команда "ABBYY PDF Transformer" > "Открыть в Microsoft Word" из контекстного меню). Кроме того, теоретически, можно запускать преобразование PDF-документа и не отрываясь от работы в Word или Excel, поскольку после установки конвертера в них интегрируется панель инструментов, на которой присутствует кнопка "Конвертировать PDF". Правда, щелчок по этой кнопке просто приводит к открытию конвертера и ничему более, что и понятно, ведь указать исходный PDF-файл и настроить процесс конвертирования все равно необходимо вручную.
Следующая страница →
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
Необычный платформер-головоломка Schim о потерявшем своего человека духе выйдет из тени в июле — дата релиза и новый трейлер 15 мин.
Криптовалюта продолжила падение: биткоин опустился ниже $60 тысяч, а Ethereum — ниже $3 тысяч 43 мин.
Kingdom Come: Deliverance 2 выйдет в 2024 году — журналисты раньше времени опубликовали анонсирующий трейлер 2 ч.
Еврокомиссия не нашла ничего предосудительного в отношениях Microsoft и OpenAI 13 ч.
Stability AI расширила доступ к тестированию Stable Diffusion третьего поколения 13 ч.
Тодд Говард прояснил спорный момент из сериала Fallout — каноничность Fallout: New Vegas в безопасности 13 ч.
Amazon предложит свои «умные» продуктовые тележки сторонним магазинам 15 ч.
Пошаговая ролевая игра SteamWorld Heist спустя девять лет всё-таки получит продолжение — трейлер и подробности SteamWorld Heist II 15 ч.
Microsoft признала, что Copilot автоматически установился на Windows 11 из-за ошибки 15 ч.
Дьявол нашептал: сюрреалистическое приключение Indika про одержимую монахиню выйдет раньше запланированного, но только на ПК 15 ч.
Intel представила нейроморфный компьютер Hala Point на 1152 чипах Loihi 2 с мозгоподобной архитектурой 9 мин.
Huawei представила флагманский смартфон Pura 70 Ultra — он может делать чёткие снимки на скорости 300 км/ч 24 мин.
TSMC снимает сливки с бума ИИ-технологий: выручка и прибыль за первый квартал превзошли прогнозы 2 ч.
После ухода западных вендоров российские ЦОД пересмотрели требования к поставщикам инженерной инфраструктуры 2 ч.
Канада обложит дополнительным налогом на выручку IT-гигантов из США 3 ч.
Micron получит от США субсидии в размере $6,1 млрд — об этом сообщат на следующей неделе 6 ч.
Появились изображения первого ноутбука с чипом Qualcomm Snapdragon X Elite — Lenovo Yoga Slim 7 14 2024 Snapdragon Edition 7 ч.
Новая статья: Обзор и тестирование корпуса MSI MPG Gungnir 300R Airflow: сделай это красиво 12 ч.
Delta Computers анонсировала первые российские OCP-серверы на базе Intel Xeon Sapphire Rapids и Emerald Rapids 14 ч.
ИИ переплюнет по энергопотреблению Индию уже к 2030 году, спрогнозировал глава Arm 14 ч.