Конвертировать PDF в другие форматы документов
Aspose.Words может загружать даже такой сложный формат, как PDF. Это открывает новые возможности: можно конвертировать PDF в Word или другие форматы, что значительно продвинет пользователей в решении многих прикладных задач.
Конвертировать PDF в другие форматы
Наиболее популярным преобразованием из PDF является преобразование в форматы Microsoft Word, такие как DOCX, DOC, а также в графические форматы, такие как JPG или PNG. При этом преобразование документа из одного формата в другой выполняется привычным способом.
В следующем примере кода показано, как преобразовать документ из PDF в DOCX:
Укажите параметры загрузки при импорте PDF
Aspose.Words предоставляет вам класс PdfLoadOptions, который позволяет более точно контролировать процесс загрузки документов PDF.
Большинство свойств наследуют или перегружают свойства, которые уже существуют в классе LoadOptions. В дополнение к ним для формата PDF задан ряд свойств. Например, вы можете использовать свойства page_count и page_index для определения диапазона страниц, которые будут загружены из документа PDF, а свойства skip_pdf_images - для управления тем, следует ли пропускать изображения при загрузке PDF. Другим поддерживаемым параметром является password, который должен быть указан для документов, защищенных паролем.
Поддерживаемый PDF контент
PDF2Word в настоящее время плагин поддерживает следующие типы данных:
- Текстовые абзацы
- Изображения
- Таблицы
- Списки
- Верхние и нижние колонтитулы
- Сноски
- Номера страниц
- Текст справа налево (с некоторыми ограничениями)
- Доступно для поиска PDFs (передние изображения будут удалены в пользу фонового текста)
Планируемые объекты
Некоторые функции все еще находятся на ранней стадии разработки или включены в дорожную карту разработки:
- Содержание
- OCR для объектов с возможностью поиска и без нее PDFs
- Отчет о ходе работы
- Текст с несколькими столбцами
- Математические формулы
- Дополнительные автоматические поля (помимо
PAGE
и NUMPAGES)
PDF Загружать исключения
Во время преобразования документа PDF может произойти одно из следующих исключений:
Исключение | Описание |
---|---|
FileLoadException | По какой-то причине файл PDF не может быть обработан.
Вы можете сообщить о проблеме группе разработчиков для детального изучения, используя техническая поддержка.
|
DrmProtectedFileException | Файл PDF защищен Adobe DRM и не может быть декодирован с помощью Pdf2Word. |
PasswordProtectedFileException | Для защищенного паролем PDF веб-сайта необходимо ввести правильный пароль. |