Převést PDF na jiné formáty dokumentů

Aspose.Words může načíst i tak složitý formát jako PDF. To otevírá nové příležitosti: je možné převést PDF na Word nebo jiné formáty, které přinášejí uživatele daleko vpřed při řešení mnoha aplikované problémy.

Předpoklady

  • Přidán odkaz na Aspose.Words balení *** NEBO*** Aspose.Words.Pdf2Word.dll.
  • Alespoň .NET Framework 4.6.1 nebo .NET Standard 2.0 Cíle jako .NET Core 2.x nebo 3.0, .NET 5 a Xamarin jsou rovněž podporovány prostřednictvím kompatibility s .NET Standard.

Převést PDF na různé formáty

Nejoblíbenější konverze z PDF je konverze na Microsoft Word formáty jako DOCX, DOC, jakož i formáty obrázků, jako jsou JPG nebo PNG. S tím, jak bylo řečeno, převod dokumentu z jednoho formátu do druhého provádí známým způsobem.

Následující příklad kódu ukazuje, jak převést dokument z PDF na DOCX:

Upřesnit možnosti zatížení při importu PDF

Aspose.Words poskytuje vám PdfLoadOptions třída, která umožňuje přesnější kontrolu nad načtením dokumentů PDF.

Většina nemovitostí zdědí nebo přetížení vlastnosti, které již existují v LoadOptions třída. Kromě nich je pro formát PDF uvedena řada vlastností. Například můžete použít PageCount a PageIndex vlastnosti definovat rozsah stránek, které mají být načteny z PDF dokumentu, a SkipPdfImages vlastnosti pro kontrolu, zda by měly být obrázky při načítání PDF přeskočeny. Dalším podporovaným parametrem je Password, který musí být stanoven dokumenty chráněné heslem.

Podporované PDF Obsah

PDF2Word plugin v současné době podporuje tyto datové typy:

  • Textové odstavce
  • Obrázky
  • Tabulky
  • Seznamy
  • Hlavičky a zápatí
  • Poznámky
  • Čísla stránek
  • Pravý až levý text (s určitými omezeními)
  • Vyhledatelné PDF (přední obrázky budou odstraněny ve prospěch pozadí textu)

Budoucí funkce

Některé prvky jsou stále v raném vývoji nebo jsou zahrnuty v plánu rozvoje:

  • Obsah
  • OCR pro vyhledávatelné a nevyhledatelné PDF
  • Zpráva o pokroku
  • Vícesloupný text
  • Matematika vzorce
  • Více automatických polí (besides PAGE a NUMPAGES)

PDF Výjimky z zatížení

Během konverze dokumentu PDF může nastat jedna z následujících výjimek:

Výjimka Popis zboží
FileLoadException Soubor PDF nelze z nějakého důvodu zpracovat.
DrmProtectedFileException Soubor PDF je chráněn Adobe DRM a nelze jej dekódovat pomocí Pdf2Word
PasswordProtectedFileException Pro PDF chráněný heslem musí být uvedeno správné heslo

Viz také