PDF omzetten naar andere documentformaten

Aspose.Words kan zelfs zo’n complex formaat als PDF laden. Dit opent nieuwe mogelijkheden: het is mogelijk om PDF te converteren naar Word of andere formaten die gebruikers ver vooruit brengen in het oplossen van veel toegepaste problemen.

PDF omzetten naar andere formaten

De meest populaire conversie van PDF is conversie naar Microsoft Word formaten zoals DOCX, DOC, evenals afbeeldingsformaten zoals JPG of PNG. Met dat gezegd, het omzetten van een document van het ene formaat naar het andere voert op een vertrouwde manier.

Het volgende voorbeeld van code laat zien hoe u een document van PDF naar DOCX kunt converteren:

Specificeer laadopties bij het importeren van PDF

Aspose.Words geeft u de PdfLoadOptions klasse, waardoor nauwkeurigere controle mogelijk is over hoe PDF-documenten worden geladen.

De meeste eigenschappen erven of overbelasting eigenschappen die al bestaan in de LoadOptions Klasse. Naast hen, een aantal eigenschappen zijn gespecificeerd voor PDF-formaat. U kunt bijvoorbeeld de page_count en page_index eigenschappen om het te laden paginabereik van een PDF-document te definiëren, en de skip_pdf_images eigenschappen om te bepalen of afbeeldingen moeten worden overgeslagen bij het laden van PDF. Een andere ondersteunde parameter is de password, die moeten worden verstrekt voor wachtwoord beveiligde documenten.

Ondersteunde PDF Inhoud

PDF2Word plugin ondersteunt momenteel de volgende data types:

  • Tekst paragrafen
  • Afbeeldingen
  • Tabellen
  • Lijsten
  • Headers en voetteksten
  • Voetnoten
  • Paginanummers
  • Rechts-naar-links tekst (met enkele beperkingen)
  • Doorzoekbare PDF’s (voorkant afbeeldingen worden verwijderd ten gunste van de achtergrond tekst)

Geplande functies

Sommige functies bevinden zich nog in de vroege ontwikkeling of zijn opgenomen in het ontwikkelingsmap:

  • Inhoudsopgave
  • OCR voor doorzoekbare en niet-zoekbare PDF’s
  • Voortgangsverslag
  • Multikolomtekst
  • Wiskunde formules
  • Meer automatische velden (naast PAGE En numpages)

PDF Uitzonderingen bij laden

Tijdens een PDF-documentconversie kan een van de volgende uitzonderingen worden gemaakt:

Vrijstelling Omschrijving
FileLoadException Een PDF-bestand kan om een of andere reden niet worden verwerkt.
DrmProtectedFileException Een PDF-bestand wordt beschermd door Adobe DRM en kan niet worden gedecodeerd door Pdf2Word
PasswordProtectedFileException Het juiste wachtwoord moet worden opgegeven voor een wachtwoord beveiligde PDF