Convertir HTML en DOCX – Exemples de code Python
Un fichier DOCX est un document Microsoft Word qui contient généralement du texte, mais qui peut contenir un large éventail de données, y compris des tableaux, des graphiques matriciels et vectoriels, des vidéos, des sons et des diagrammes. Le fichier DOCX est hautement modifiable, facile à utiliser et de taille raisonnable. Ce format est populaire en raison de la variété des options qu’il offre aux utilisateurs pour rédiger n’importe quel type de document.
L’utilisation des méthodes
Converter.convert_html() est la manière la plus courante de convertir du code HTML dans différents formats. Avec Aspose.HTML for Python via .NET, vous pouvez convertir HTML au format DOCX de manière programmatique avec un contrôle total sur un large éventail de paramètres de conversion. Dans cet article, vous trouverez des informations sur la façon de convertir HTML en DOCX en utilisant les méthodes convert_html()
de la classe Converter et sur la façon d’appliquer
DocSaveOptions. Vous pouvez également essayer un convertisseur HTML en ligne pour tester les fonctionnalités d’Aspose.HTML et convertir du HTML à la volée.
Pour continuer à suivre ce tutoriel, installez et configurez Aspose.HTML for Python via .NET dans votre projet Python. Nos exemples de code vous aident à convertir HTML en DOCX à l’aide de la bibliothèque Python.
Convertisseur HTML en ligne
Vous pouvez tester la fonctionnalité d’Aspose.HTML for Python via l’API .NET et effectuer des conversions HTML en temps réel. Chargez un fichier HTML à partir de votre système local ou d’une URL, sélectionnez le format de sortie souhaité et exécutez l’exemple. Les options d’enregistrement par défaut sont appliquées et vous recevrez le fichier converti instantanément.
Convertir HTML en DOCX – Exemples de code Python
La conversion de HTML vers un autre format à l’aide de la méthode convert_html() est une séquence d’opérations parmi lesquelles le chargement et l’enregistrement de documents :
- Charge un fichier HTML à l’aide de la classe HTMLDocument.
- Créez un nouvel objet
DocSaveOptions. La classe
DocSaveOptions
fournit de nombreuses propriétés qui vous donnent un contrôle total sur un large éventail de paramètres et améliorent le processus de conversion de HTML au format DOCX. - Utilisez l’une des méthodes
convert_html() pour sauvegarder le HTML en tant que fichier DOCX. Dans l’exemple suivant, vous devez passer les paramètres
HTMLDocument
,DocSaveOptions
, et le chemin du fichier de sortie à la méthodeconvert_html()
.
HTML vers DOCX avec une ligne de code
Les méthodes statiques de la classe Converter sont principalement utilisées comme moyen le plus simple de convertir un code HTML dans différents formats. Vous pouvez convertir HTML en DOCX dans votre application Python littéralement avec une seule ligne de code !
1from aspose.html import *
2from aspose.html.converters import *
3from aspose.html.saving import *
4
5# Convert HTML to DOCX
6Converter.convert_html("document.html", DocSaveOptions(), "document.docx")
Convertir HTML en DOCX à l’aide de DocSaveOptions
Examinons l’extrait de code Python suivant, qui montre le processus de conversion de HTML en DOCX en spécifiant DocSaveOptions
:
1import os
2from aspose.html import *
3from aspose.html.saving import *
4from aspose.html.drawing import *
5from aspose.html.converters import *
6from aspose.html.rendering.doc import *
7
8# Setup directories and define paths
9output_dir = "output/"
10input_dir = "data/"
11if not os.path.exists(output_dir):
12 os.makedirs(output_dir)
13
14document_path = os.path.join(input_dir, "document.html")
15save_path = os.path.join(output_dir, "output1.docx")
16
17# Initialize an HTML document from the file
18document = HTMLDocument(document_path)
19
20# Initialize DocSaveOptions
21options = DocSaveOptions()
22
23# Customize save options for DOCX
24options.document_format.DOCX
25options.font_embedding_rule.FULL
26options.css.media_type.PRINT
27options.horizontal_resolution = Resolution.from_dots_per_inch(96.0)
28options.vertical_resolution = Resolution.from_dots_per_inch(96.0)
29
30# Convert HTML to DOCX
31Converter.convert_html(document, options, save_path)
32
33print(f"HTML document converted to DOCX successfully and saved to {save_path}")
Dans cet exemple, nous convertissons un document HTML en fichier DOCX à l’aide d’options d’enregistrement. Le processus consiste à initialiser le document HTML, à définir des options d’enregistrement personnalisées telles que le format du document, la règle d’intégration des polices, le type de média css et la résolution, puis à effectuer la conversion. Enfin, le fichier DOCX converti est enregistré dans un répertoire de sortie spécifié.
Options d’enregistrement – Classe DocSaveOptions
La classe
DocSaveOptions est un outil de configuration puissant qui vous permet d’affiner la conversion des documents HTML au format DOCX. Certaines propriétés de cette classe héritent de propriétés de classes de base, telles que
DocRenderingOptions ou RenderingOptions. DocSaveOptions
est configuré pour enregistrer le document au format DOCX et comprend les propriétés suivantes :
- page_setup – Cette propriété vous permet de définir la mise en page, y compris la taille de la page, les marges et d’autres aspects de la mise en page, afin que le document de sortie corresponde au format souhaité.
- horizontal_resolution – Cette propriété définit ou obtient la résolution horizontale des images internes en pixels par pouce. Par défaut, elle est de 300 dpi. Des résolutions plus élevées peuvent produire une meilleure qualité de rendu, mais des fichiers plus volumineux. Cette propriété vous permet de contrôler les compromis entre la qualité et la taille des fichiers.
- vertical_resolution – Cette propriété définit ou obtient la résolution verticale des images internes en pixels par pouce. Par défaut, elle est de 300 dpi. Comme pour `horizontal_resolution’, cette propriété contrôle la résolution verticale des documents, ce qui affecte leur clarté et leur taille globale.
- background_color – Cette propriété permet de définir la couleur d’arrière-plan du rendu. Si elle n’est pas définie, l’arrière-plan par défaut est transparent.
- css – Cette propriété récupère un objet CssOptions, qui est utilisé pour configurer le traitement des propriétés CSS. Par exemple, la propriété
css.media_type
spécifie différents styles pour différents types de médias, garantissant que les règles CSS correctes sont appliquées en fonction de la manière dont le document est rendu. - font_embedding_rule – Cette propriété définit la règle d’incorporation des polices et contrôle si et comment les polices sont incorporées dans le document de sortie. La valeur par défaut est
NONE
. - document_format – Cette propriété définit le format de fichier du document de sortie. Le format par défaut est DOCX.
Téléchargez la bibliothèque Aspose.HTML for Python via .NET pour convertir avec succès, rapidement et facilement vos documents HTML, MHTML, EPUB, SVG et Markdown vers les formats les plus populaires.
Aspose.HTML propose un Convertisseur HTML en DOCX gratuit en ligne qui convertit HTML en DOCX avec une grande qualité, facilement et rapidement. Il suffit de télécharger, de convertir vos fichiers et d’obtenir des résultats en quelques secondes !