Convertir MHTML en PDF
Dans ce guide, vous trouverez des informations sur la manière de convertir un document MHTML en un fichier Portable Document Format (PDF) à l’aide de la bibliothèque Aspose.HTML for Python via .NET. Nous allons voir en détail comment convertir un document MHTML en PDF en utilisant les méthodes convert_mhtml() de la classe Converter, et comment appliquer les PdfSaveOptions.
Pour continuer à suivre ce tutoriel, installez et configurez Aspose.HTML for Python via .NET dans votre projet Python. Nos exemples de code vous aident à convertir HTML en PDF et à générer des fichiers PDF à l’aide de la bibliothèque Python.
Convertisseur MHTML en ligne
Vous pouvez tester les fonctionnalités de l’API Python et convertir du MHTML en temps réel. Chargez un fichier MHTML depuis votre système de fichiers local, sélectionnez le format de sortie et exécutez l’exemple. La conversion sera effectuée avec les options d’enregistrement par défaut. Vous recevrez immédiatement le résultat sous la forme d’un fichier séparé.
Conversion de MHTML en PDF à l’aide de PdfSaveOptions
L’utilisation des méthodes Converter.convert_mhtml() est la manière la plus courante de convertir du code MHTML dans différents formats. Avec Aspose.HTML for Python via .NET, vous pouvez convertir du code MHTML au format PDF de manière programmatique, avec un contrôle total sur un large éventail de paramètres de conversion. Vous devez suivre quelques étapes :
- Ouvrir un fichier MHTML existant.
- Créer une instance de la classe
PdfSaveOptions. Le constructeur
PdfSaveOptions()
initialise une instanceoptions
qui est passée à la méthode convert_mhtml(). - Utilisez la méthode
convert_mhtml() pour enregistrer du MHTML en tant que fichier PDF. La méthode convert_mhtml() prend le
stream
, lesoptions
, le chemin du fichier de sortiesave_path
et effectue l’opération de conversion.
L’exemple de code Python suivant montre comment utiliser PdfSaveOptions et créer un fichier PDF avec des options d’enregistrement personnalisées :
1import os
2from aspose.html import *
3from aspose.html.converters import *
4from aspose.html.saving import *
5from aspose.html.drawing import *
6from aspose.pydrawing import *
7
8# Setup directories and define paths
9output_dir = "output/"
10input_dir = "data/"
11if not os.path.exists(output_dir):
12 os.makedirs(output_dir)
13document_path = os.path.join(input_dir, "document.mht")
14save_path = os.path.join(output_dir, "document.pdf")
15
16# Open an existing MHTML file for reading
17with open(document_path, "rb") as stream:
18
19 # Create an instance of PdfSaveOptions
20 options = PdfSaveOptions()
21 options.page_setup.any_page = Page(drawing.Size(800, 600), Margin(10, 10, 10, 10))
22 options.css.media_type.PRINT
23 options.jpeg_quality = 100
24
25 # Convert MHTML to PDF
26 Converter.convert_mhtml(stream, options, save_path)
Dans l’exemple ci-dessus, nous utilisons :
- la propriété
page_setup
permet de spécifier la taille de la page et les marges (haut, bas, gauche, droite) ; - la propriété
css.media_type
qui spécifie comment les requêtes de média CSS sont traitées pendant le processus de conversion ; - propriété
jpeg_quality
qui détermine la qualité de compression JPEG utilisée pour les images intégrées dans un document PDF.
Options d’enregistrement – Classe PdfSaveOptions
La classe
PdfSaveOptions fournit de nombreuses propriétés qui vous permettent de contrôler un large éventail de paramètres et d’améliorer le processus de conversion du MHTML au format PDF. Certaines propriétés de cette classe héritent de propriétés de classes de base, telles que
PdfRenderingOptions ou RenderingOptions. Voici une description des propriétés disponibles dans PdfSaveOptions
:
- page_setup – Cette propriété permet d’accéder à un objet PageSetup utilisé pour configurer la mise en page et les paramètres des pages PDF de sortie afin de répondre à des exigences spécifiques en matière d’impression ou d’affichage.
- horizontal_resolution – Cette propriété contrôle la résolution horizontale des images internes utilisées pendant le traitement et des images externes incluses dans le code HTML. Par défaut, elle est fixée à 300 dpi.
- vertical_resolution – Similaire à horizontal_resolution, cette propriété gère la résolution verticale des images internes et externes lors de la génération du PDF. Comme pour la résolution horizontale, la valeur par défaut est de 300 dpi.
- background_color – Cette propriété définit ou récupère la couleur d’arrière-plan qui remplit chaque page du document PDF. La valeur par défaut est transparente, mais elle peut être personnalisée en fonction des préférences de marque ou d’esthétique, afin d’assurer la cohérence entre toutes les pages.
- css – Cette propriété utilise un objet
CssOptions
pour configurer le traitement des propriétés CSS pendant la conversion HTML vers PDF. Elle permet un contrôle précis de la façon dont les styles du HTML sont interprétés et appliqués dans le PDF résultant. - jpeg_quality – Cette propriété détermine la qualité de compression JPEG utilisée pour les images intégrées dans un document PDF. La qualité par défaut est fixée à 95, ce qui offre un bon équilibre entre la fidélité de l’image et la taille du fichier. Le réglage de cette propriété vous permet d’optimiser la taille du fichier ou la qualité de l’image en fonction de vos besoins spécifiques.
- encryption – Cette propriété fournit des informations détaillées sur le cryptage des documents PDF, y compris la protection par mot de passe et les paramètres d’autorisation. Si elle n’est pas configurée, aucun cryptage n’est appliqué, mais la définition de cette propriété vous permet de distribuer et de contrôler l’accès au contenu PDF sensible en toute sécurité.
- document_info – Cette propriété contient des métadonnées et des informations sur le document PDF de sortie, telles que le titre, l’auteur, le sujet et les mots-clés. Ces métadonnées facilitent la gestion, l’indexation et la recherche de documents, en rendant le PDF plus informatif et mieux organisé.
- form_field_behaviour – Cette propriété spécifie le comportement des champs de formulaire interactifs dans le PDF généré.
- is_tagged_pdf – Lorsque la valeur est fixée à true, une mise en page balisée est créée dans le document PDF, ce qui améliore l’accessibilité pour les utilisateurs handicapés. Cela permet de s’assurer que le contenu est correctement structuré et navigable à l’aide d’une technologie d’assistance et qu’il respecte les normes d’accessibilité.
Comment convertir MHTML en XPS
Aspose.HTML for Python via .NET prend en charge la conversion MHTML vers XPS. Pour ce faire, vous devez utiliser
XpsSaveOptions pour obtenir un objet d’options de sauvegarde qui est transmis à la méthode convert_mhtml()
:
options = XpsSaveOptions()
L’utilisation de XpsSaveOptions vous permet de personnaliser le processus de rendu ; vous pouvez spécifier les propriétés page_setup, background_color, css, horizontal_resolution et vertical_resolution.
Téléchargez la bibliothèque Aspose.HTML for Python via .NET pour convertir avec succès, rapidement et facilement vos documents HTML, MHTML, EPUB, SVG et Markdown vers les formats les plus populaires.
Aspose.HTML propose un Convertisseur MHTML en PDF en ligne gratuit qui permet de convertir des fichiers MHTML en fichiers PDF de haute qualité, facilement et rapidement. Il suffit de télécharger, de convertir vos fichiers et d’obtenir des résultats en quelques secondes !