Convertir HTML en DOCX – Exemples de code Python

Un fichier DOCX est un document Microsoft Word qui contient généralement du texte, mais qui peut contenir un large éventail de données, y compris des tableaux, des graphiques matriciels et vectoriels, des vidéos, des sons et des diagrammes. Le fichier DOCX est hautement modifiable, facile à utiliser et de taille raisonnable. Ce format est populaire en raison de la variété des options qu’il offre aux utilisateurs pour rédiger n’importe quel type de document.

L’utilisation des méthodes Converter.convert_html() est la manière la plus courante de convertir du code HTML dans différents formats. Avec Aspose.HTML for Python via .NET, vous pouvez convertir HTML au format DOCX de manière programmatique avec un contrôle total sur un large éventail de paramètres de conversion. Dans cet article, vous trouverez des informations sur la façon de convertir HTML en DOCX en utilisant les méthodes convert_html() de la classe Converter et sur la façon d’appliquer DocSaveOptions. Vous pouvez également essayer un convertisseur HTML en ligne pour tester les fonctionnalités d’Aspose.HTML et convertir du HTML à la volée.

Pour continuer à suivre ce tutoriel, installez et configurez Aspose.HTML for Python via .NET dans votre projet Python. Nos exemples de code vous aident à convertir HTML en DOCX à l’aide de la bibliothèque Python.

Convertisseur HTML en ligne

Vous pouvez tester la fonctionnalité d’Aspose.HTML for Python via l’API .NET et effectuer des conversions HTML en temps réel. Chargez un fichier HTML à partir de votre système local ou d’une URL, sélectionnez le format de sortie souhaité et exécutez l’exemple. Les options d’enregistrement par défaut sont appliquées et vous recevrez le fichier converti instantanément.

                
            

Convertir HTML en DOCX – Exemples de code Python

La conversion de HTML vers un autre format à l’aide de la méthode convert_html() est une séquence d’opérations parmi lesquelles le chargement et l’enregistrement de documents :

  1. Charge un fichier HTML à l’aide de la classe HTMLDocument.
  2. Créez un nouvel objet DocSaveOptions. La classe DocSaveOptions fournit de nombreuses propriétés qui vous donnent un contrôle total sur un large éventail de paramètres et améliorent le processus de conversion de HTML au format DOCX.
  3. Utilisez l’une des méthodes convert_html() pour sauvegarder le HTML en tant que fichier DOCX. Dans l’exemple suivant, vous devez passer les paramètres HTMLDocument, DocSaveOptions, et le chemin du fichier de sortie à la méthode convert_html().

HTML vers DOCX avec une ligne de code

Les méthodes statiques de la classe Converter sont principalement utilisées comme moyen le plus simple de convertir un code HTML dans différents formats. Vous pouvez convertir HTML en DOCX dans votre application Python littéralement avec une seule ligne de code !

1from aspose.html import *
2from aspose.html.converters import *
3from aspose.html.saving import *
4
5# Convert HTML to DOCX
6Converter.convert_html("document.html", DocSaveOptions(), "document.docx")

Convertir HTML en DOCX à l’aide de DocSaveOptions

Examinons l’extrait de code Python suivant, qui montre le processus de conversion de HTML en DOCX en spécifiant DocSaveOptions :

 1import os
 2from aspose.html import *
 3from aspose.html.saving import *
 4from aspose.html.drawing import *
 5from aspose.html.converters import *
 6from aspose.html.rendering.doc import *
 7
 8# Setup directories and define paths
 9output_dir = "output/"
10input_dir = "data/"
11if not os.path.exists(output_dir):
12    os.makedirs(output_dir)
13
14document_path = os.path.join(input_dir, "document.html")
15save_path = os.path.join(output_dir, "output1.docx")
16
17# Initialize an HTML document from the file
18document = HTMLDocument(document_path)
19
20# Initialize DocSaveOptions
21options = DocSaveOptions()
22
23# Customize save options for DOCX
24options.document_format.DOCX
25options.font_embedding_rule.FULL
26options.css.media_type.PRINT
27options.horizontal_resolution = Resolution.from_dots_per_inch(96.0)
28options.vertical_resolution = Resolution.from_dots_per_inch(96.0)
29
30# Convert HTML to DOCX
31Converter.convert_html(document, options, save_path)
32
33print(f"HTML document converted to DOCX successfully and saved to {save_path}")

Dans cet exemple, nous convertissons un document HTML en fichier DOCX à l’aide d’options d’enregistrement. Le processus consiste à initialiser le document HTML, à définir des options d’enregistrement personnalisées telles que le format du document, la règle d’intégration des polices, le type de média css et la résolution, puis à effectuer la conversion. Enfin, le fichier DOCX converti est enregistré dans un répertoire de sortie spécifié.

Options d’enregistrement – Classe DocSaveOptions

La classe DocSaveOptions est un outil de configuration puissant qui vous permet d’affiner la conversion des documents HTML au format DOCX. Certaines propriétés de cette classe héritent de propriétés de classes de base, telles que DocRenderingOptions ou RenderingOptions. DocSaveOptions est configuré pour enregistrer le document au format DOCX et comprend les propriétés suivantes :

Téléchargez la bibliothèque Aspose.HTML for Python via .NET pour convertir avec succès, rapidement et facilement vos documents HTML, MHTML, EPUB, SVG et Markdown vers les formats les plus populaires.

Aspose.HTML propose un Convertisseur HTML en DOCX gratuit en ligne qui convertit HTML en DOCX avec une grande qualité, facilement et rapidement. Il suffit de télécharger, de convertir vos fichiers et d’obtenir des résultats en quelques secondes !

Texte “Convertisseur HTML à DOCX”

Subscribe to Aspose Product Updates

Get monthly newsletters & offers directly delivered to your mailbox.