Вся техническая документация сегодня поставляется в формате PDF, для просмотра документов в котором используется бесплатная утилита Adobe Acrobat Reader. Но довольно часто возникает необходимость воспользоваться какими-то фрагментами PDF-файлов при подготовке собственных документов или даже отредактировать материалы в PDF-формате, например, статью, контракт, отчет и т.п. В первом случае потребуется извлечь из PDF-файлов фрагменты текста и/или изображения. Теоретически, это обычно можно сделать и встроенными средствами Acrobat Reader, но нередко с посредственным результатом. Во втором случае придется конвертировать PDF-документы в редактируемый формат (например, MS Word) с сохранением оформления исходного документа, что в программе Acrobat Reader не предусмотрено.
Существуют два варианта решения проблемы - установить программу-конвертер, которая обеспечит преобразование PDF-документов в формат MS Word и/или MS Excel, либо воспользоваться специальным онлайновым сервисом. На использовании утилит такого плана мы, в основном, и остановимся в данной статье.
Что касается онлайновых сервисов, то в качестве примеров можно привести
Pdftoword.com компании Nitro PDF Software и
Zamzar.com компании Zamzar. С их помощью осуществить конвертирование PDF-документов проще простого - нужно лишь указать в поле "Step1" интересующий PDF-файл, в поле "Step2" выбрать нужный вам формат, ввести в поле "Step3" свой адрес электронной почты и щелкнуть на кнопке "Convert". Сервис любезно сообщит о том, что файл принят, и через некоторое время на свой почтовый ящик вы получите вожделенный Word-документ (на первом из названных сервисов), либо ссылку на него (на втором сервисе).
Онлайн-сервис Pdftoword.com умеет преобразовывать PDF-документы в форматы DOC или RTF, а результаты его конвертирования просто идеальны - никаких прямоугольных блоков с отдельными фрагментами текста, что нередко можно наблюдать после работы ряда программ-конвертеров. Правда, в сети имеются замечания пользователей об иногда некорректном преобразовании этим сервисом документов с кириллицей, однако в нашем случае такой проблемы отмечено не было. Ниже приведен пример исходного PDF-документа и полученный на его основе DOC-файл.
Сервис Zamzar.com может использоваться не только для конвертирования PDF-файлов в форматы DOC или RTF, но и других преобразований файлов, скажем, изображений и музыки из одного формата в другой, и поддерживает пакетный режим обработки данных. Однако полученные с его помощью из PDF-файлов Word-документы имеют несколько худшее качество, чем после обработки на Pdftoword.com, поскольку в них присутствуют прямоугольные блоки данных. Но все равно, для бесплатного решения вариант достаточно неплох.
⇡#ABBYY PDF Transformer 3.0
Разработчик: ABBYY Software
Размер дистрибутива: 220 Мб
Распространение: условно бесплатная
ABBYY PDF Transformer - профессиональное решение для конвертирования PDF-документов в форматы документов Microsoft Word и Microsoft Excel, а также в HTML и TXT-файлы. Программа умеет конвертировать любые PDF-файлы, включая файлы без текстового слоя (такие файлы чаще всего получаются из отсканированных документов и представляют собой изображение текста) и корректно обрабатывает PDF-файлы, содержащие любые комбинации поддерживаемых языков, которых всего 184, включая, русский и английский. При необходимости, возможно выборочное конвертирование отдельных страниц или даже конкретных их фрагментов.
Утилита точно сохраняет оформление исходного документа (картинки, таблицы, расположение колонок, ссылки) и позволяет управлять вариантами конвертирования и сохранения. Например, можно четко определить области, которые должны восприниматься программой как текст или как изображения (что может быть актуальным для PDF-файлов со сложным оформлением), сохранить готовый документ с таким же оформлением, как в оригинале, или как колонку текста (с картинками или без - по желанию) и т.д.
Кроме того, программа может использоваться для создания PDF-документов напрямую из приложений Microsoft Office, любых приложений, поддерживающих вывод документов на печать, а также из проводника Windows одним щелчком мыши. Вдобавок она может применяться для объединения нескольких файлов различного формата в один PDF-документ.
Демо-версия программы (имеется русскоязычная локализация) работоспособна в течение 15 дней и позволяет конвертировать не более 50 PDF-документов и не более двух страниц за один раз. Количество PDF-файлов, создаваемых во время испытательного периода, не ограничено, но все они будут иметь специальную отметку. Стоимость коммерческой версии зависит от варианта приобретения: коробочная версия - 1490 руб., версия для скачивания - 1340 руб.
В ABBYY PDF Transformer предусмотрено несколько способов конвертирования PDF-документов в документы MS Office. Можно запустить конвертер и для конвертирования в документ Word нажать кнопку "Открыть PDF", затем в открывшемся окне выбрать файл для конвертирования. Если PDF-документ защищен паролем, то программа запросит пароль. Затем в списке форматов, в которые может быть произведено конвертирование, нужно выбрать вариант "Конвертировать в документ Microsoft Word". При необходимости, можно изменить имя файла и папку для его сохранения, для чего следует нажать на ссылку "Изменить".
Тут же можно настроить дополнительные параметры в группе "Дополнительные опции". В частности, выбрать режим сохранения оформления:
- "Как в оригинале" - позволяет получить документ, внешний вид которого будет полностью идентичен оригиналу;
- "В одну колонку" - обеспечивает полное восстановление конвертируемого текста (с учетом разбиения на абзацы, начертания и размера шрифта), однако оформление оригинала при этом воспроизведено не будет.
Также можно включить/отключить флажок "Сохранять картинки", для того чтобы иллюстрации при конвертировании сохранялись (это увеличивает размер получаемого файла) либо нет.
После этого осталось щелкнуть на кнопке "Конвертировать" и получить готовый Word-документ, который будет автоматически открыт. Никакого дополнительного редактирования в полученном документе не потребуется, поскольку преобразование производится очень качественно.
Если требуется конвертировать не весь документ, а отдельные страницы, то их можно выделить в окне "Страницы" (оно в правой части главного окна) и из контекстного меню выбирать команду "Конвертировать выбранные страницы".
Для выборочного конвертирования PDF-файлов в таблицы Excel надо действовать несколько иначе. Вначале открыть исходный PDF-файл, потом найти в нем страницу с таблицей, выделить мышью область с таблицей и определить данную область в качестве таблицы (команда "Область Таблица" из контекстного меню). Затем активировать из контекстного меню, на этот раз вызванного на странице в окне "Страницы", команду "Конвертировать выбранные страницы".
Полученная таблица будет сформирована и открыта в Excel.
Если требуется сохранить все таблицы из PDF-документа в файл Excel, то выделять их не нужно, а следует выбрать в списке форматов вариант "Конвертировать в документ Microsoft Excel". Затем в группе "Дополнительные опции" надо включить флажок "Игнорировать текст вне таблицы" и щелкнуть на кнопке "Конвертировать". Все таблицы из документа будут помещены на одном листе друг за другом.
Извлечение изображений теоретически также возможно, но реализовано неудобно - картинки придется по очереди выделять и копировать через буфер обмена, то есть никакого преимущества перед копированием изображений из Acrobat Reader не наблюдается. Иными словами, извлечь и сохранить в виде графических файлов картинки с выделенных страниц, либо всего документа, невозможно.
Есть возможность запускать процесс конвертирования PDF-документов из проводника Windows (команда "ABBYY PDF Transformer" > "Открыть в Microsoft Word" из контекстного меню).
Кроме того, теоретически, можно запускать преобразование PDF-документа и не отрываясь от работы в Word или Excel, поскольку после установки конвертера в них интегрируется панель инструментов, на которой присутствует кнопка "Конвертировать PDF". Правда, щелчок по этой кнопке просто приводит к открытию конвертера и ничему более, что и понятно, ведь указать исходный PDF-файл и настроить процесс конвертирования все равно необходимо вручную.
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.