Convertir PDF en Word en Python
Convertir le PDF en DOC
L’une des fonctionnalités les plus populaires est la conversion de PDF en DOC Microsoft Word, ce qui facilite la gestion du contenu. Aspose.PDF for Python via .NET vous permet de convertir les fichiers PDF non seulement en DOC mais aussi au format DOCX, facilement et efficacement.
Utilisez la conversion Word lorsque vous devez réviser le texte, réutiliser le contenu dans les flux de travail de bureau ou déplacer le contenu PDF vers des documents DOC ou DOCX modifiables.
Le DocSaveOptions la classe fournit de nombreuses propriétés qui améliorent le processus de conversion des fichiers PDF en format DOC. Parmi ces propriétés, Mode vous permet de spécifier le mode de reconnaissance du contenu PDF. Vous pouvez spécifier n’importe quelle valeur de l’énumération RecognitionMode pour cette propriété. Chacune de ces valeurs présente des avantages et des limitations spécifiques :
Étapes : Convertir PDF en DOC avec Python
- Chargez le PDF dans un objet ‘ap.Document’.
- Créez une instance de ‘DocSaveOptions’.
- Définissez la propriété format sur ‘DocFormat.DOC’ pour garantir que la sortie soit au format .doc (format Word plus ancien).
- Enregistrez le PDF en tant que document Word en utilisant les options d’enregistrement spécifiées.
- Imprimez un message de confirmation.
from os import path
import aspose.pdf as ap
import sys
def convert_PDF_to_DOC(infile, outfile):
document = ap.Document(infile)
save_options = ap.DocSaveOptions()
save_options.format = ap.DocSaveOptions.DocFormat.DOC
document.save(outfile, save_options)
print(infile + " converted into " + outfile)
Essayez de convertir PDF en DOC en ligne
Aspose.PDF for Python vous présente une application en ligne “PDF en DOC”, où vous pouvez essayer d’examiner le fonctionnement et la qualité.
Convertir PDF en DOCX
Aspose.PDF for Python API vous permet de lire et de convertir des documents PDF en DOCX en utilisant Python via .NET. DOCX est un format bien connu pour les documents Microsoft Word dont la structure est passée d’un binaire simple à une combinaison de fichiers XML et binaires. Les fichiers DOCX peuvent être ouverts avec Word 2007 et les versions ultérieures, mais pas avec les versions antérieures de MS Word qui ne prennent en charge que les extensions de fichiers DOC.
L’extrait de code Python suivant montre le processus de conversion d’un fichier PDF en format DOCX.
Étapes : Convertir PDF en DOCX avec Python
- Chargez le PDF source en utilisant ‘ap.Document’.
- Créez une instance de ‘DocSaveOptions’.
- Définissez la propriété format sur ‘DocFormat.DOC_X’ pour générer un fichier .docx (format Word moderne).
- Enregistrez le PDF en tant que fichier DOCX avec les options d’enregistrement configurées.
- Imprimer un message de confirmation après la conversion.
from os import path
import aspose.pdf as ap
import sys
def convert_PDF_to_DOCX(infile, outfile):
document = ap.Document(infile)
save_options = ap.DocSaveOptions()
save_options.format = ap.DocSaveOptions.DocFormat.DOC_X
document.save(outfile, save_options)
Convertir le PDF en DOCX avec reconnaissance avancée de mise en page
Convertir un document PDF en fichier DOCX (Word) en utilisant Python et Aspose.PDF avec des paramètres de reconnaissance avancés. Il utilise le mode flux amélioré pour préserver la structure du document, rendant la sortie plus modifiable et plus proche de la mise en page originale.
from os import path
import aspose.pdf as ap
import sys
def convert_PDF_to_DOCX_advanced(infile, outfile):
document = ap.Document(infile)
save_options = ap.DocSaveOptions()
save_options.format = ap.DocSaveOptions.DocFormat.DOC_X
save_options.mode = ap.DocSaveOptions.RecognitionMode.ENHANCED_FLOW
document.save(outfile, save_options)
Le DocSaveOptions La classe possède une propriété nommée Format qui permet de spécifier le format du document résultant, c’est‑à‑dire DOC ou DOCX. Pour convertir un fichier PDF au format DOCX, veuillez passer la valeur Docx de l’énumération DocSaveOptions.DocFormat.
Essayez de convertir PDF en DOCX en ligne
Aspose.PDF for Python vous présente une application en ligne “PDF vers Word”, où vous pouvez essayer d’examiner le fonctionnement et la qualité.
Conversions associées
- Convertir le PDF en Excel pour les exportations orientées feuille de calcul.
- Convertir PDF en PowerPoint lorsque vous avez besoin de diapositives de présentation au lieu d’une sortie de traitement de texte.
- Convertir le PDF en HTML pour la publication web et les flux de travail de contenu basés sur le navigateur.
