Convertir MHTML a DOCX en Python
A menudo se requiere la conversión de MHTML a DOCX para aprovechar el formato DOCX para tareas específicas. Aspose.HTML for Python via .NET proporciona una manera simple y eficiente de realizar esta conversión usando los métodos convert_mhtml() de la clase Converter.
En este artículo, encontrará información sobre cómo convertir MHTML a DOCX usando la biblioteca de Python Aspose.HTML y cómo aplicar DocSaveOptions.
Para continuar siguiendo este tutorial, instale y configure Aspose.HTML for Python via .NET en su proyecto Python.
Convertidor MHTML en línea
Puede convertir MHTML a DOCX con Aspose.HTML for Python via .NET API en tiempo real. Cargue un archivo MHTML desde un sistema de archivos local, seleccione el formato de salida y ejecute el ejemplo. La conversión se realizará con opciones de guardado predeterminadas. Recibirá inmediatamente el resultado de la conversión como un archivo separado.
Convierta MHTML a DOCX usando DocSaveOptions
Usar los métodos convert_mhtml() es la forma más común de convertir MHTML a varios formatos. Con Aspose.HTML for Python via .NET, puede convertir MHTML a formato DOCX mediante programación con control total sobre una amplia gama de parámetros de conversión.
Para convertir MHTML a DOCX con la especificación DocSaveOptions
, debe seguir algunos pasos:
- Abra un archivo MHTML existente. En el ejemplo, utilizamos el método
open()
para abrir y leer MHTML desde un sistema de archivos en la ruta especificada. - Cree una instancia de la clase
DocSaveOptions. La clase DocSaveOptions proporciona numerosas propiedades que le brindan control total sobre una amplia gama de parámetros y mejoran el proceso de conversión de MHTML a formato DOCX. En el ejemplo, utilizamos la propiedad
page_setup
que especifica el tamaño de página del documento DOCX, las propiedadesdocument_format
ycss.media_type
. - Utilice uno de los métodos
convert_mhtml() de la clase
Converter para guardar MHTML como un archivo DOCX. En el siguiente ejemplo, el método
convert_mhtml()
toma lastream
, lasoptions
, la ruta del archivo de salidasave_path
y realiza la operación de conversión.
El siguiente ejemplo de código Python muestra cómo convertir MHTML a DOCX usando DocSaveOptions:
1import os
2from aspose.html import *
3from aspose.html.converters import *
4from aspose.html.saving import *
5from aspose.html.drawing import *
6
7# Setup directories and define paths
8output_dir = "output/"
9input_dir = "data/"
10if not os.path.exists(output_dir):
11 os.makedirs(output_dir)
12document_path = os.path.join(input_dir, "document.mht")
13save_path = os.path.join(output_dir, "document.docx")
14
15# Open an existing MHTML file for reading
16with open(document_path, "rb") as stream:
17
18 # Create an instance of DocSaveOptions
19 options = DocSaveOptions()
20 options.page_setup.any_page = Page(Size(400, 400), Margin(10, 10, 10, 10))
21 options.document_format.DOCX
22 options.css.media_type.SCREEN
23
24 # Convert MHTML to DOCX
25 Converter.convert_mhtml(stream, options, save_path)
Opciones de guardado – Clase DocSaveOptions
Aspose.HTML for Python via .NET permite convertir MHTML a DOCX usando opciones de guardado predeterminadas o personalizadas. La clase DocSaveOptions está configurada para guardar el documento como DOCX e incluye las siguientes propiedades:
- page_setup: esta propiedad le permite definir el diseño de la página, incluido el tamaño de la página, los márgenes y otros aspectos del diseño, asegurando que el documento de salida coincida con el formato deseado.
- document_format: esta propiedad establece el formato de archivo del documento de salida. El valor predeterminado es DOCX.
- horizontal_resolution: esta propiedad establece u obtiene la resolución horizontal para imágenes internas en píxeles por pulgada. Por defecto, es 300 ppp. Las resoluciones más altas pueden producir una mejor calidad de renderizado pero tamaños de archivo más grandes. Esta propiedad le permite controlar las compensaciones entre calidad y tamaño de archivo.
- vertical_resolution: esta propiedad establece u obtiene la resolución vertical de las imágenes internas en píxeles por pulgada. Por defecto, es 300 ppp. Similar a
horizontal_resolution
, controla la resolución vertical de los documentos, lo que afecta su claridad y tamaño general. - background_color: esta propiedad le permite establecer el color de fondo para la salida renderizada. Si no se establece, el fondo predeterminado es transparente.
- css: esta propiedad obtiene un objeto CssOptions, que se utiliza para configurar el procesamiento de propiedades CSS. Por ejemplo, la propiedad
css.media_type
especifica diferentes estilos para diferentes tipos de medios, lo que garantiza que se apliquen las reglas CSS correctas en función de cómo se representa el documento. - font_embedding_rule: esta propiedad establece la regla para incrustar fuentes y controla si las fuentes se incrustan en el documento de salida y cómo. El valor predeterminado es
NONE
.
Algunas propiedades de esta clase heredan propiedades de las clases base, como DocRenderingOptions o RenderingOptions.
Descargue la biblioteca Aspose.HTML for Python via .NET para convertir exitosa, rápida y fácilmente sus documentos HTML, MHTML, EPUB, SVG y Markdown a los formatos más populares.
Aspose.HTML ofrece un Convertidor de MHTML a DOCX en línea gratuito que convierte archivos MHTML a DOCX con alta calidad, fácil y rápido. ¡Simplemente cargue, convierta sus archivos y obtenga resultados en unos segundos!