Convertir MHTML en DOCX – Exemples de code Python
La conversion de MHTML en DOCX est souvent nécessaire pour tirer parti du format DOCX dans le cadre de tâches spécifiques. Aspose.HTML for Python via .NET fournit un moyen simple et efficace d’effectuer cette conversion en utilisant les méthodes convert_mhtml() de la classe Converter.
Dans cet article, vous trouverez des informations sur la manière de convertir MHTML en DOCX à l’aide de la bibliothèque Aspose.HTML Python et sur la manière d’appliquer DocSaveOptions.
Pour continuer à suivre ce tutoriel, installer et configurer Aspose.HTML for Python via .NET dans votre projet Python.
Convertisseur MHTML en ligne
Vous pouvez convertir MHTML en DOCX avec Aspose.HTML for Python via l’API .NET en temps réel. Chargez un fichier MHTML à partir d’un système de fichiers local, sélectionnez le format de sortie et exécutez l’exemple. La conversion sera effectuée avec les options d’enregistrement par défaut. Vous recevrez immédiatement le résultat de la conversion dans un fichier séparé.
Conversion de MHTML en DOCX à l’aide de DocSaveOptions
L’utilisation des méthodes convert_mhtml() est le moyen le plus courant de convertir du MHTML dans différents formats. Avec Aspose.HTML for Python via .NET, vous pouvez convertir du MHTML au format DOCX de manière programmatique, avec un contrôle total sur un large éventail de paramètres de conversion.
Pour convertir du MHTML en DOCX en spécifiant DocSaveOptions
, vous devez suivre quelques étapes :
- Ouvrir un fichier MHTML existant. Dans l’exemple, nous utilisons la méthode
open()
pour ouvrir et lire un fichier MHTML à partir d’un système de fichiers au chemin spécifié. - Créer une instance de la classe
DocSaveOptions. La classe DocSaveOptions fournit de nombreuses propriétés qui vous donnent un contrôle total sur un large éventail de paramètres et améliorent le processus de conversion du MHTML au format DOCX. Dans l’exemple, nous utilisons la propriété
page_setup
qui spécifie la taille de la page du document DOCX, les propriétésdocument_format
etcss.media_type
. - Utilisez l’une des méthodes
convert_mhtml() de la classe
Converter pour enregistrer du MHTML en tant que fichier DOCX. Dans l’exemple suivant, la méthode
convert_mhtml()
prend lestream
, lesoptions
, le chemin du fichier de sortiesave_path
et effectue l’opération de conversion.
L’exemple de code Python suivant montre comment convertir du MHTML en DOCX à l’aide de DocSaveOptions :
1import os
2from aspose.html import *
3from aspose.html.converters import *
4from aspose.html.saving import *
5from aspose.html.drawing import *
6
7# Setup directories and define paths
8output_dir = "output/"
9input_dir = "data/"
10if not os.path.exists(output_dir):
11 os.makedirs(output_dir)
12document_path = os.path.join(input_dir, "document.mht")
13save_path = os.path.join(output_dir, "document.docx")
14
15# Open an existing MHTML file for reading
16with open(document_path, "rb") as stream:
17
18 # Create an instance of DocSaveOptions
19 options = DocSaveOptions()
20 options.page_setup.any_page = Page(Size(400, 400), Margin(10, 10, 10, 10))
21 options.document_format.DOCX
22 options.css.media_type.SCREEN
23
24 # Convert MHTML to DOCX
25 Converter.convert_mhtml(stream, options, save_path)
Options d’enregistrement – Classe DocSaveOptions
Aspose.HTML for Python via .NET permet de convertir du MHTML en DOCX en utilisant des options d’enregistrement par défaut ou personnalisées. la classe DocSaveOptions est configurée pour enregistrer le document au format DOCX et comprend les propriétés suivantes :
- page_setup – Cette propriété vous permet de définir la mise en page, y compris la taille de la page, les marges et d’autres aspects de la mise en page, afin que le document de sortie corresponde au format souhaité.
- document_format – Cette propriété définit le format de fichier du document de sortie. Le format par défaut est DOCX.
- horizontal_resolution – Cette propriété définit ou obtient la résolution horizontale des images internes en pixels par pouce. Par défaut, elle est de 300 dpi. Des résolutions plus élevées peuvent produire une meilleure qualité de rendu, mais des fichiers plus volumineux. Cette propriété vous permet de contrôler les compromis entre la qualité et la taille des fichiers.
- vertical_resolution – Cette propriété définit ou obtient la résolution verticale des images internes en pixels par pouce. Par défaut, elle est de 300 dpi. Comme pour `horizontal_resolution’, cette propriété contrôle la résolution verticale des documents, ce qui affecte leur clarté et leur taille globale.
- background_color – Cette propriété permet de définir la couleur d’arrière-plan du rendu. Si elle n’est pas définie, l’arrière-plan par défaut est transparent.
- css – Cette propriété récupère un objet CssOptions, qui est utilisé pour configurer le traitement des propriétés CSS. Par exemple, la propriété
css.media_type
spécifie différents styles pour différents types de médias, garantissant que les règles CSS correctes sont appliquées en fonction de la manière dont le document est rendu. - font_embedding_rule – Cette propriété définit la règle d’incorporation des polices et contrôle si et comment les polices sont incorporées dans le document de sortie. La valeur par défaut est
NONE
.
Certaines propriétés de cette classe héritent de propriétés de classes de base, telles que DocRenderingOptions ou RenderingOptions.
Téléchargez la bibliothèque Aspose.HTML for Python via .NET pour convertir avec succès, rapidement et facilement vos documents HTML, MHTML, EPUB, SVG et Markdown vers les formats les plus populaires.
Aspose.HTML propose un Convertisseur MHTML vers DOCX gratuit en ligne qui convertit les fichiers MHTML en DOCX avec une grande qualité, facilement et rapidement. Il suffit de télécharger, de convertir vos fichiers et d’obtenir des résultats en quelques secondes !