Convertir un PDF en d'autres formats de documents
Aspose.Words peut charger même un format aussi complexe que PDF. Cela ouvre de nouvelles opportunités: il est possible de convertir des PDF en Word ou en d’autres formats, ce qui donne aux utilisateurs une longueur d’avance dans la résolution de nombreux problèmes appliqués.
Conditions préalables
- Ajout d’une référence au package Aspose.Words OU à Aspose.Words.Pdf2Word.dll.
- Au moins .NET Framework 4.6.1 ou .NET Standard 2.0. Les cibles telles que .NET Core 2.x ou 3.0, .NET 5 et Xamarin sont également prises en charge via la compatibilité avec .NET Standard.
Convertir un PDF en divers formats
La conversion la plus populaire à partir de PDF est la conversion vers les formats Microsoft Word tels que DOCX, DOC, ainsi que vers les formats d’image tels que JPG ou PNG. Cela dit, la conversion d’un document d’un format à un autre s’effectue de manière familière.
L’exemple de code suivant montre comment convertir un document PDF en DOCX:
Spécifier les options de chargement lors de l’importation de PDF
Aspose.Words vous fournit la classe PdfLoadOptions, qui permet un contrôle plus précis sur la façon dont les documents PDF sont chargés.
La plupart des propriétés héritent ou surchargent les propriétés qui existent déjà dans la classe LoadOptions
. En plus d’eux, un certain nombre de propriétés sont spécifiées pour le format PDF. Par exemple, vous pouvez utiliser les propriétés PageCount et PageIndex pour définir la plage de pages à charger à partir d’un document PDF, et les propriétés SkipPdfImages pour contrôler si les images doivent être ignorées lors du chargement du PDF. Un autre paramètre pris en charge est le Password, qui doit être fourni pour documents protégés par mot de passe.
Contenu PDF pris en charge
Le plugin PDF2Word prend actuellement en charge les types de données suivants:
- Paragraphes de texte
- Images
- Les tables
- Listes
- En-têtes et pieds de page
- Notes de bas de page
- Numéros de page
- Texte de droite à gauche (avec quelques limitations)
- PDF consultables (les images du recto seront supprimées au profit du texte d’arrière-plan)
Fonctionnalités futures
Certaines fonctionnalités sont encore en début de développement ou incluses dans la feuille de route de développement:
- Table des matières
- OCR pour les PDF consultables et non consultables
- Rapport d’étape
- Texte multicolonne
- Formules mathématiques
- Plus de champs automatiques (en plus de
PAGE
et NUMPAGES)
Exceptions de chargement de PDF
Lors d’une conversion de document PDF, l’une des exceptions suivantes peut se produire:
Exception | Description |
---|---|
FileLoadException |
Un fichier PDF ne peut pas être traité pour une raison quelconque.
Vous pouvez signaler le problème à l’équipe de développement pour une enquête détaillée à l’aide du fichier Soutien technique.
|
DrmProtectedFileException |
Un fichier PDF est protégé par Adobe DRM et ne peut pas être décodé par Pdf2Word |
PasswordProtectedFileException |
Le mot de passe correct doit être fourni pour un PDF protégé par mot de passe |