Převést PDF na jiné formáty dokumentů
Aspose.Words může načíst i tak složitý formát jako PDF. To otevírá nové příležitosti: je možné převést PDF na Word nebo jiné formáty, které přinášejí uživatele daleko vpřed při řešení mnoha aplikované problémy.
Převést PDF na jiné formáty
Nejoblíbenější konverze z PDF je konverze na Microsoft Word formáty jako DOCX, DOC, jakož i formáty obrázků, jako jsou JPG nebo PNG. S tím, jak bylo řečeno, převod dokumentu z jednoho formátu do druhého provádí známým způsobem.
Následující příklad kódu ukazuje, jak převést dokument z PDF na DOCX:
Upřesnit možnosti zatížení při importu PDF
Aspose.Words poskytuje vám PdfLoadOptions třída, která umožňuje přesnější kontrolu nad načtením dokumentů PDF.
Většina nemovitostí zdědí nebo přetížení vlastnosti, které již existují v LoadOptions třída. Kromě nich je pro formát PDF uvedena řada vlastností. Například můžete použít page_count a page_index vlastnosti definovat rozsah stránek, které mají být načteny z PDF dokumentu, a skip_pdf_images vlastnosti pro kontrolu, zda by měly být obrázky při načítání PDF přeskočeny. Dalším podporovaným parametrem je password, které musí být poskytnuty pro dokumenty chráněné heslem.
Podporované PDF Obsah
PDF2Word plugin v současné době podporuje tyto datové typy:
- Textové odstavce
- Obrázky
- Tabulky
- Seznamy
- Hlavičky a zápatí
- Poznámky
- Čísla stránek
- Pravý až levý text (s určitými omezeními)
- Vyhledatelné PDF (přední obrázky budou odstraněny ve prospěch pozadí textu)
Plánované funkce
Některé prvky jsou stále v raném vývoji nebo jsou zahrnuty v plánu rozvoje:
- Obsah
- OCR pro vyhledávatelné a nevyhledatelné PDF
- Zpráva o pokroku
- Vícesloupný text
- Matematika vzorce
- Více automatických polí (besides
PAGE
a NUMPAGES)
PDF Výjimky z zatížení
Během konverze dokumentu PDF může nastat jedna z následujících výjimek:
Výjimka | Popis zboží |
---|---|
FileLoadException | Soubor PDF nelze z nějakého důvodu zpracovat.
Můžete nahlásit problém vývojovému týmu k podrobnému vyšetřování pomocí Technická podpora.
|
DrmProtectedFileException | Soubor PDF je chráněn Adobe DRM a nelze jej dekódovat pomocí Pdf2Word |
PasswordProtectedFileException | Pro PDF chráněný heslem musí být uvedeno správné heslo |