Konvertieren Sie PDF in andere Dokumentformate

Aspose.Words kann sogar ein so komplexes Format wie PDF laden. Dies eröffnet neue Möglichkeiten: Es ist möglich, PDF in Word oder andere Formate zu konvertieren, die den Anwendern bei der Lösung vieler Anwendungsprobleme einen großen Vorsprung verschaffen.

Voraussetzungen

  • Verweis auf das Aspose.Words-Paket ODER zu Aspose.Words.Pdf2Word.dll hinzugefügt.
  • Mindestens .NET Framework 4.6.1 oder .NET Standard 2.0. Durch die Kompatibilität mit .NET Standard werden auch Ziele wie .NET Core 2.x oder 3.0, .NET 5 und Xamarin unterstützt.

Konvertieren Sie PDF in verschiedene {#convert-pdf-to-other-formats}-Formate

Die beliebteste Konvertierung von PDF ist die Konvertierung in Microsoft Word-Formate wie DOCX, DOC sowie Bildformate wie JPG oder PNG. Vor diesem Hintergrund erfolgt die Konvertierung eines Dokuments von einem Format in ein anderes auf die gewohnte Weise.

Das folgende Codebeispiel zeigt, wie man ein Dokument von PDF in DOCX konvertiert:

Geben Sie beim Importieren von PDF-{#specify-load-options-when-importing-pdf} Ladeoptionen an

Aspose.Words stellt Ihnen die PdfLoadOptions-Klasse zur Verfügung, die eine genauere Kontrolle darüber ermöglicht, wie PDF-Dokumente geladen werden.

Die meisten Eigenschaften erben oder überladen Eigenschaften, die bereits in der LoadOptions-Klasse vorhanden sind. Darüber hinaus werden für das PDF-Format eine Reihe von Eigenschaften angegeben. Beispielsweise können Sie die PageCount- und PageIndex-Eigenschaften verwenden, um den Seitenbereich zu definieren, der aus einem PDF-Dokument geladen werden soll, und die SkipPdfImages-Eigenschaften, um zu steuern, ob Bilder beim Laden von PDF übersprungen werden sollen. Ein weiterer unterstützter Parameter ist der Password, der für passwortgeschützte Dokumente bereitgestellt werden muss.

Unterstützte PDF-Inhalte

Das PDF2Word-Plugin unterstützt derzeit die folgenden Datentypen:

  • Textabsätze
  • Bilder
  • Tabellen
  • Listen
  • Kopf-und Fußzeilen
  • Fußnoten
  • Seitenzahlen
  • Von rechts nach links geschriebener Text (mit einigen Einschränkungen)
  • Durchsuchbare PDFs (Bilder auf der Vorderseite werden zugunsten von Hintergrundtext entfernt)

Zukünftige Funktionen

Einige Funktionen befinden sich noch in der frühen Entwicklung oder sind in der Entwicklungs-Roadmap enthalten:

  • Inhaltsverzeichnis
  • OCR für durchsuchbare und nicht durchsuchbare PDFs
  • Fortschrittsbericht
  • Mehrspaltiger Text
  • Mathematische Formeln
  • Weitere automatische Felder (außer PAGE und NUMPAGES)

Ausnahmen beim Laden von PDFs

Bei der Konvertierung eines PDF-Dokuments kann eine der folgenden Ausnahmen auftreten:

Ausnahme Beschreibung
FileLoadException Eine PDF-Datei kann aus irgendeinem Grund nicht verarbeitet werden.
-Datei dem Entwicklungsteam zur detaillierten Untersuchung melden
DrmProtectedFileException Eine PDF-Datei ist durch Adobe DRM geschützt und kann nicht von Pdf2Word dekodiert werden
PasswordProtectedFileException Für ein passwortgeschütztes PDF muss das korrekte Passwort angegeben werden

Siehe auch