Преобразование PDF в другие форматы документов

Aspose.Words Можно загрузить даже такой сложный формат, как PDF. Это открывает новые возможности: можно конвертировать PDF в Word или другие форматы, которые значительно опережают пользователей в решении многих прикладных задач.

Преобразование PDF в другие форматы

Наиболее популярным преобразованием из PDF является преобразование в Microsoft Word форматы, такие как DOCX, DOC, а также форматы изображений, такие как JPG или PNG. При этом преобразование документа из одного формата в другой выполняется знакомым образом.

Следующий пример кода показывает, как конвертировать документ из PDF в DOCX:

Укажите параметры загрузки при импорте PDF

Aspose.Words Предоставляет вам PdfLoadOptions Класс, который позволяет более точно контролировать загрузку PDF-документов.

Большинство свойств наследуют или перегружают свойства, которые уже существуют. LoadOptions класс. Помимо них, для формата PDF указан ряд свойств. Например, вы можете использовать page_count и page_index свойства для определения диапазона страниц, загружаемых из документа PDF, и skip_pdf_images Свойства для контроля того, следует ли пропускать изображения при загрузке PDF. Другим поддерживаемым параметром является password, которые должны быть предоставлены для защищенных паролем документов.

Поддерживаемый PDF Контент

Плагин PDF2Word поддерживает следующие типы данных:

  • Текстовые абзацы
  • Изображения
  • Таблицы
  • Списки
  • Заголовки и футеры
  • Сноски
  • Номер страницы
  • Право-левый текст (с некоторыми ограничениями)
  • Поисковые PDF-файлы (передние изображения будут удалены в пользу фонового текста)

Планируемые особенности

Некоторые функции все еще находятся на ранней стадии разработки или включены в дорожную карту развития:

  • Таблица содержимого
  • OCR для поисковых и непоисковых PDF-файлов
  • Доклад о ходе работы
  • Многоколонный текст
  • Математические формулы
  • Больше автоматических полей (кроме) PAGE и цифры

PDF Исключения из нагрузки

Во время конвертации PDF-документа может произойти одно из следующих исключений:

Исключение Описание
FileLoadException PDF-файл не может быть обработан по какой-либо причине.
DrmProtectedFileException PDF-файл защищен Adobe DRM и не может быть декодирован Pdf2Word
PasswordProtectedFileException Правильный пароль должен быть предоставлен для защищенного паролем PDF