Convertir HTML en MHTML en Python

MHTML est un format d’archivage de pages web qui combine le code HTML et les ressources connexes, telles que les images, les feuilles de style et les scripts, dans un seul fichier. Ce format est particulièrement utile pour archiver ou partager des pages web dans un seul fichier. La conversion de HTML en MHTML préserve l’intégralité de la structure et du formatage de la page web telle qu’elle apparaît dans le navigateur, ce qui garantit la cohérence lorsque le fichier MHTML est ouvert. En outre, les fichiers MHTML permettent un accès hors ligne aux pages web, ce qui constitue un moyen pratique de visualiser le contenu sans connexion internet.

Dans cet article, vous trouverez des informations sur la manière de convertir HTML en MHTML et d’utiliser MHTMLSaveOptions.

Pour continuer à suivre ce tutoriel, installez et configurez Aspose.HTML for Python via .NET dans votre projet Python. Nos exemples de code vous aident à convertir HTML en MHTML et à générer des fichiers MHTML à l’aide de la bibliothèque Python.

Convertisseur HTML en ligne

Vous pouvez convertir HTML en MHTML avec Aspose.HTML for Python via l’API .NET en temps réel. Tout d’abord, chargez un fichier HTML à partir de votre disque local ou d’une URL et exécutez l’exemple. Cet exemple utilise les options d’enregistrement par défaut. Vous recevrez immédiatement le résultat de la conversion dans un fichier séparé.

                
            

Convertir HTML en MHTML

La conversion d’un fichier dans un autre format à l’aide de la méthode convert_html() est une séquence d’opérations parmi lesquelles le chargement et l’enregistrement de documents. L’exemple suivant explique comment convertir HTML en MHTML :

  1. Charger le fichier HTML à l’aide de la classe HTMLDocument.
  2. Créer une instance de la classe MHTMLSaveOptions pour contrôler les options de conversion HTML vers MHTML.
  3. Utilisez la méthode convert_html() de la classe Converter pour enregistrer un document HTML dans un fichier MHTML. La méthode prend le document, les options, le chemin du fichier de sortie save_path et effectue l’opération de conversion.

HTML à MHTML avec une ligne de code

Les méthodes de la classe Converter sont principalement utilisées comme le moyen le plus simple de convertir un code HTML dans différents formats. Vous pouvez convertir HTML en MHTML dans votre application Python littéralement avec une seule ligne de code !

1# Convert HTML to MHTML using Python
2
3import aspose.html.converters as conv
4import aspose.html.saving as sav
5
6# Convert HTML to MHTML
7conv.Converter.convert_html("document.html", sav.MHTMLSaveOptions(), "document.mht")

Convertir HTML en MHTML en utilisant MHTMLSaveOptions

Lors de la conversion de HTML en MHTML à l’aide de Aspose.HTML for Python via .NET, vous pouvez personnaliser le processus de conversion à l’aide de MHTMLSaveOptions. L’exemple de code Python suivant montre comment créer un fichier MHTML avec des options d’enregistrement personnalisées :

 1# Convert HTML to MHTML using Python
 2
 3import os
 4import aspose.html.converters as conv
 5import aspose.html.saving as sav
 6
 7# Prepare directories and paths
 8output_dir = "output/"
 9if not os.path.exists(output_dir):
10    os.makedirs(output_dir)
11
12# Prepare HTML code with a link to another file and save it to "document1.html"
13code = "<span>Hello, World!!</span> <a href='document2.html'>click</a>"
14with open("document1.html", "w") as file:
15    file.write(code)
16
17# Prepare HTML code and save it to "document2.html"
18code = "<span>Hello, World!!</span>"
19with open("document2.html", "w") as file:
20    file.write(code)
21
22save_path = os.path.join(output_dir, "output-options.mht")
23
24# Change the value of the resource linking depth to 1 in order to convert document with directly linked resources
25options = sav.MHTMLSaveOptions()
26options.resource_handling_options.max_handling_depth = 1
27
28# Convert HTML to MHTML
29conv.Converter.convert_html("document.html", options, save_path)

Dans l’exemple ci-dessus, nous utilisons la propriété max_handling_depth = 1, ce qui signifie que seules les pages directement référencées dans le document sauvegardé seront traitées.

Options de sauvegarde – Classe MHTMLSaveOptions

l’utilisation de MHTMLSaveOptions vous permet de personnaliser le processus de rendu. Sa propriété ResourceHandlingOptions est cruciale pour contrôler la façon dont les ressources externes référencées dans le document HTML sont gérées pendant le processus de conversion. Elle vous permet de spécifier des options telles que resource_url_restriction, page_url_restriction, max_handling_depth, etc.

PropertyDescription
page_url_restrictionThis property gets or sets restrictions applied to URLs of handled pages. The default value is ROOT_AND_SUB_FOLDERS.
resource_url_restrictionGets or sets restrictions applied to URLs of handled resources such as CSS, js, images, etc. The default is SAME_HOST.
max_handling_depthDetermines the maximum depth for handling linked resources. This is useful for ensuring that all necessary resources are embedded within the MHTML file, maintaining the integrity and appearance of the original HTML content.

Aspose.HTML propose un Convertisseur HTML en MHTML gratuit en ligne qui convertit HTML en MHTML avec une grande qualité, facilement et rapidement. Il suffit de télécharger, de convertir vos fichiers et d’obtenir des résultats en quelques secondes !

Texte “Convertisseur HTML à MHTML”

Subscribe to Aspose Product Updates

Get monthly newsletters & offers directly delivered to your mailbox.