Convertir HTML a MHTML en Python

MHTML es un formato de archivo de páginas web que combina código HTML y recursos relacionados, como imágenes, hojas de estilo y scripts, en un solo archivo. Esto es particularmente útil para archivar o compartir páginas web en un solo archivo. La conversión de HTML a MHTML conserva toda la estructura y el formato de la página web tal como aparece en el navegador, lo que garantiza la coherencia cuando se abre el archivo MHTML. Además, los archivos MHTML permiten el acceso sin conexión a páginas web, lo que proporciona una forma cómoda de ver contenido sin conexión a Internet.

En este artículo, encontrará información sobre cómo convertir HTML a MHTML y cómo utilizar MHTMLSaveOptions.

Para continuar siguiendo este tutorial, instale y configure Aspose.HTML for Python via .NET en su proyecto Python. Nuestros ejemplos de código le ayudan a convertir HTML a MHTML y generar archivos MHTML utilizando la biblioteca Python.

Convertidor HTML en línea

Puede convertir HTML a MHTML con Aspose.HTML for Python via .NET API en tiempo real. Primero, cargue un archivo HTML desde su unidad local o URL y ejecute el ejemplo. Este ejemplo utiliza las opciones de guardado predeterminadas. Recibirá inmediatamente el resultado de la conversión como un archivo separado.

                
            

Convertir HTML a MHTML

Convertir un archivo a otro formato usando el método convert_html() es una secuencia de operaciones entre las que se incluyen cargar y guardar documentos. El siguiente ejemplo explica cómo convertir HTML a MHTML:

  1. Cargue el archivo HTML usando la clase HTMLDocument.
  2. Cree una instancia de la clase MHTMLSaveOptions para controlar las opciones de conversión de HTML a MHTML.
  3. Utilice el método convert_html() de la clase Converter para guardar el documento HTML como un archivo MHTML. El método toma el document, las options, la ruta del archivo de salida save_path y realiza la operación de conversión.

HTML a MHTML mediante una sola línea de código

Los métodos de la clase Converter se utilizan principalmente como la forma más sencilla de convertir un código HTML a varios formatos. ¡Puedes convertir HTML a MHTML en tu aplicación Python literalmente con una sola línea de código!

1from aspose.html import *
2from aspose.html.converters import *
3from aspose.html.saving import *
4
5# Convert HTML to MHTML
6Converter.convert_html("document.html", MHTMLSaveOptions(), "document.mht")

Convierta HTML a MHTML usando MHTMLSaveOptions

Al convertir HTML a MHTML usando Aspose.HTML for Python via .NET, puede personalizar el proceso de conversión usando MHTMLSaveOptions. El siguiente ejemplo de código Python muestra cómo crear un archivo MHTML con opciones de guardado personalizadas:

 1import os
 2from aspose.html import *
 3from aspose.html.converters import *
 4from aspose.html.saving import *
 5
 6# Prepare directories and paths
 7output_dir = "output/"
 8if not os.path.exists(output_dir):
 9    os.makedirs(output_dir)
10
11# Prepare HTML code with a link to another file and save it to "document1.html"
12code = "<span>Hello, World!!</span> <a href="document2.html">click</a>"
13with open("document1.html", "w") as file:
14    file.write(code)
15
16# Prepare HTML code and save it to "document2.html"
17code = "<span>Hello, World!!</span>"
18with open("document2.html", "w") as file:
19    file.write(code)
20
21save_path = os.path.join(output_dir, "output-options.mht")
22
23# Change the value of the resource linking depth to 1 in order to convert document with directly linked resources
24options = MHTMLSaveOptions()
25options.resource_handling_options.max_handling_depth = 1
26
27# Convert HTML to MHTML
28Converter.convert_html("document.html", options, save_path)

En el ejemplo anterior, usamos la propiedad max_handling_depth = 1, lo que significa que solo se manejarán las páginas a las que se hace referencia directamente desde el documento guardado.

Opciones de guardado – Clase MHTMLSaveOptions

El uso de MHTMLSaveOptions le permite personalizar el proceso de renderizado. Su propiedad ResourceHandlingOptions es crucial para controlar cómo se administran los recursos externos a los que se hace referencia en el documento HTML durante el proceso de conversión. Le permite especificar opciones como resource_url_restriction, page_url_restriction, max_handling_depth, etc.

PropertyDescription
page_url_restrictionThis property gets or sets restrictions applied to URLs of handled pages. The default value is ROOT_AND_SUB_FOLDERS.
resource_url_restrictionGets or sets restrictions applied to URLs of handled resources such as CSS, js, images, etc. The default is SAME_HOST.
max_handling_depthDetermines the maximum depth for handling linked resources. This is useful for ensuring that all necessary resources are embedded within the MHTML file, maintaining the integrity and appearance of the original HTML content.

Aspose.HTML ofrece un Convertidor de HTML a MHTML en línea gratuito que convierte HTML a MHTML con alta calidad, fácil y rápido. ¡Simplemente cargue, convierta sus archivos y obtenga resultados en unos segundos!

Texto “Convertidor de HTML a MHTML”

Subscribe to Aspose Product Updates

Get monthly newsletters & offers directly delivered to your mailbox.