Конвертиране на PDF в други формати на документи

Aspose.Words може да зареди дори такъв сложен формат като PDF. Това отваря нови възможности: възможно е да се превърне PDF в Word или други формати, които водят потребителите далеч напред в решаването на много приложни проблеми.

Предпоставки

  • Добавена препратка към Aspose.Words Опаковка OR to Aspose.Words.Pdf2Word.dll.
  • Поне .NET Framework 4.6.1 или .NET Standard 2.0. Цели като .NET Core 2.x или 3.0, .NET 5, и Xamarin са подкрепени и чрез съвместимост с .NET Standard.

Конвертиране на PDF в различни формати

Най-популярното преобразуване от PDF е превръщането в Microsoft Word формати като DOCX, DOC, както и формати на изображения като JPG или PNG. С това каза, конвертирането на документ от един формат в друг изпълнява по познат начин.

Следният пример за код показва как да конвертирате документ от PDF в DOCX:

Посочете настройките за зареждане при импортиране на PDF

Aspose.Words Ви осигурява PdfLoadOptions клас, който позволява по-точен контрол върху начина на зареждане на PDF документите.

Повечето свойства наследяват или претоварване свойства, които вече съществуват в LoadOptions Клас. В допълнение към тях са посочени редица свойства за PDF формат. Например, можете да използвате PageCount както и PageIndex свойства за определяне на обхвата на страницата, която ще бъде заредена от PDF документ, и SkipPdfImages свойства за контрол дали изображенията трябва да се пропускат при зареждане на PDF. Друг поддържан параметър е Password, които трябва да бъдат предвидени документи, защитени с парола.

Поддържан PDF Съдържание

Приставката PDF2Word в момента поддържа следните типове данни:

  • Текстови абзаци
  • Снимки
  • Таблици
  • Списък
  • Headers and footers
  • Бележки под линия
  • Номер на страница
  • Отдясно-ляво текст (с някои ограничения)
  • Търсене PDF (предни изображения ще бъдат премахнати в полза на фонов текст)

Бъдещи функции

Някои характеристики са все още в ранното развитие или включени в пътната карта за развитие:

  • Съдържание
  • OCR за търсене и търсене на PDFs
  • Доклад за напредъка
  • Multicolon текст
  • Математически формули
  • Още автоматични полета (освен PAGE и НУМ СТРАНИЦА)

PDF Изключения от натоварването

При преобразуване на PDF документ може да се случи едно от следните изключения:

Изключение Описание
FileLoadException По някаква причина PDF файл не може да бъде обработен.
DrmProtectedFileException PDF файл е защитен от Adobe DRM и не може да бъде декодиран от Pdf2Word
PasswordProtectedFileException Правилната парола трябва да бъде предоставена за защитена с парола PDF

Вижте също