Конвертировать PDF в другие форматы документов

Aspose.Words может загружать даже такой сложный формат, как PDF. Это открывает новые возможности: можно конвертировать PDF в Word или другие форматы, что значительно продвинет пользователей в решении многих прикладных задач.

Конвертировать PDF в другие форматы

Наиболее популярным преобразованием из PDF является преобразование в форматы Microsoft Word, такие как DOCX, DOC, а также в графические форматы, такие как JPG или PNG. При этом преобразование документа из одного формата в другой выполняется привычным способом.

В следующем примере кода показано, как преобразовать документ из PDF в DOCX:

Укажите параметры загрузки при импорте PDF

Aspose.Words предоставляет вам класс PdfLoadOptions, который позволяет более точно контролировать процесс загрузки документов PDF.

Большинство свойств наследуют или перегружают свойства, которые уже существуют в классе LoadOptions. В дополнение к ним для формата PDF задан ряд свойств. Например, вы можете использовать свойства page_count и page_index для определения диапазона страниц, которые будут загружены из документа PDF, а свойства skip_pdf_images - для управления тем, следует ли пропускать изображения при загрузке PDF. Другим поддерживаемым параметром является password, который должен быть указан для документов, защищенных паролем.

Поддерживаемый PDF контент

PDF2Word в настоящее время плагин поддерживает следующие типы данных:

  • Текстовые абзацы
  • Изображения
  • Таблицы
  • Списки
  • Верхние и нижние колонтитулы
  • Сноски
  • Номера страниц
  • Текст справа налево (с некоторыми ограничениями)
  • Доступно для поиска PDFs (передние изображения будут удалены в пользу фонового текста)

Планируемые объекты

Некоторые функции все еще находятся на ранней стадии разработки или включены в дорожную карту разработки:

  • Содержание
  • OCR для объектов с возможностью поиска и без нее PDFs
  • Отчет о ходе работы
  • Текст с несколькими столбцами
  • Математические формулы
  • Дополнительные автоматические поля (помимо PAGE и NUMPAGES)

PDF Загружать исключения

Во время преобразования документа PDF может произойти одно из следующих исключений:

Исключение Описание
FileLoadException По какой-то причине файл PDF не может быть обработан.
DrmProtectedFileException Файл PDF защищен Adobe DRM и не может быть декодирован с помощью Pdf2Word.
PasswordProtectedFileException Для защищенного паролем PDF веб-сайта необходимо ввести правильный пароль.