Převést PDF na jiné formáty dokumentů

Aspose.Words může načíst i tak složitý formát jako PDF. To otevírá nové příležitosti: je možné převést PDF na Word nebo jiné formáty, které přinášejí uživatele daleko vpřed při řešení mnoha aplikované problémy.

Převést PDF na jiné formáty

Nejoblíbenější konverze z PDF je konverze na Microsoft Word formáty jako DOCX, DOC, jakož i formáty obrázků, jako jsou JPG nebo PNG. S tím, jak bylo řečeno, převod dokumentu z jednoho formátu do druhého provádí známým způsobem.

Následující příklad kódu ukazuje, jak převést dokument z PDF na DOCX:

Upřesnit možnosti zatížení při importu PDF

Aspose.Words poskytuje vám PdfLoadOptions třída, která umožňuje přesnější kontrolu nad načtením dokumentů PDF.

Většina nemovitostí zdědí nebo přetížení vlastnosti, které již existují v LoadOptions třída. Kromě nich je pro formát PDF uvedena řada vlastností. Například můžete použít page_count a page_index vlastnosti definovat rozsah stránek, které mají být načteny z PDF dokumentu, a skip_pdf_images vlastnosti pro kontrolu, zda by měly být obrázky při načítání PDF přeskočeny. Dalším podporovaným parametrem je password, které musí být poskytnuty pro dokumenty chráněné heslem.

Podporované PDF Obsah

PDF2Word plugin v současné době podporuje tyto datové typy:

  • Textové odstavce
  • Obrázky
  • Tabulky
  • Seznamy
  • Hlavičky a zápatí
  • Poznámky
  • Čísla stránek
  • Pravý až levý text (s určitými omezeními)
  • Vyhledatelné PDF (přední obrázky budou odstraněny ve prospěch pozadí textu)

Plánované funkce

Některé prvky jsou stále v raném vývoji nebo jsou zahrnuty v plánu rozvoje:

  • Obsah
  • OCR pro vyhledávatelné a nevyhledatelné PDF
  • Zpráva o pokroku
  • Vícesloupný text
  • Matematika vzorce
  • Více automatických polí (besides PAGE a NUMPAGES)

PDF Výjimky z zatížení

Během konverze dokumentu PDF může nastat jedna z následujících výjimek:

Výjimka Popis zboží
FileLoadException Soubor PDF nelze z nějakého důvodu zpracovat.
DrmProtectedFileException Soubor PDF je chráněn Adobe DRM a nelze jej dekódovat pomocí Pdf2Word
PasswordProtectedFileException Pro PDF chráněný heslem musí být uvedeno správné heslo