Convertir MHTML a PDF
En esta guía, encontrará información sobre cómo convertir un documento MHTML a un formato de archivo de formato de documento portátil (PDF) usando Aspose.HTML para Python a través de la biblioteca .NET. Vamos a cubrir en detalle cómo convertir MHTML a PDF usando los métodos convert_mhtml() de la clase Converter y cómo aplicar PdfSaveOptions.
Para continuar siguiendo este tutorial, instale y configure Aspose.HTML for Python via .NET en su proyecto Python. Nuestros ejemplos de código le ayudan a convertir HTML a PDF y generar archivos PDF utilizando la biblioteca Python.
Convertidor MHTML en línea
Puede probar la funcionalidad de la API de Python y convertir MHTML en tiempo real. Cargue un archivo MHTML desde su sistema de archivos local, seleccione el formato de salida y ejecute el ejemplo. La conversión se realizará con opciones de guardado predeterminadas. Recibirá inmediatamente el resultado en un archivo separado.
Convierta MHTML a PDF usando PdfSaveOptions
Usar los métodos Converter.convert_mhtml() es la forma más común de convertir código MHTML a varios formatos. Con Aspose.HTML for Python via .NET, puede convertir MHTML a formato PDF mediante programación con control total sobre una amplia gama de parámetros de conversión. Debes seguir algunos pasos:
- Abra un archivo MHTML existente.
- Cree una instancia de la clase
PdfSaveOptions. El constructor
PdfSaveOptions()
inicializa una instancia deoptions
que se pasa al método convert_mhtml(). - Utilice el método
convert_mhtml() para guardar MHTML como un archivo PDF. El método convert_mhtml() toma la
stream
, lasoptions
, la ruta del archivo de salidasave_path
y realiza la operación de conversión.
El siguiente ejemplo de código Python muestra cómo usar PdfSaveOptions y crear un archivo PDF con opciones de guardado personalizadas:
1import os
2from aspose.html import *
3from aspose.html.converters import *
4from aspose.html.saving import *
5from aspose.html.drawing import *
6from aspose.pydrawing import *
7
8# Setup directories and define paths
9output_dir = "output/"
10input_dir = "data/"
11if not os.path.exists(output_dir):
12 os.makedirs(output_dir)
13document_path = os.path.join(input_dir, "document.mht")
14save_path = os.path.join(output_dir, "document.pdf")
15
16# Open an existing MHTML file for reading
17with open(document_path, "rb") as stream:
18
19 # Create an instance of PdfSaveOptions
20 options = PdfSaveOptions()
21 options.page_setup.any_page = Page(drawing.Size(800, 600), Margin(10, 10, 10, 10))
22 options.css.media_type.PRINT
23 options.jpeg_quality = 100
24
25 # Convert MHTML to PDF
26 Converter.convert_mhtml(stream, options, save_path)
En el ejemplo anterior, usamos:
- Propiedad
page_setup
para especificar el tamaño de la página y los márgenes (superior, inferior, izquierda, derecha); - Propiedad
css.media_type
que especifica cómo se manejan las consultas de medios CSS durante el proceso de conversión; - Propiedad
jpeg_quality
que determina la calidad de compresión JPEG utilizada para las imágenes incrustadas en un documento PDF.
Opciones de guardado – Clase PdfSaveOptions
La clase
PdfSaveOptions proporciona numerosas propiedades que le brindan control total sobre una amplia gama de parámetros y mejoran el proceso de conversión de MHTML a formato PDF. Algunas propiedades de esta clase heredan propiedades de clases base, como
PdfRenderingOptions o RenderingOptions. Aquí hay una descripción de las propiedades disponibles en PdfSaveOptions
:
- page_setup: esta propiedad proporciona acceso a un objeto PageSetup utilizado para configurar el diseño y los ajustes de las páginas PDF de salida para ajustarse a requisitos específicos de impresión o visualización.
- horizontal_resolution: esta propiedad controla la resolución horizontal tanto para las imágenes internas utilizadas durante el procesamiento como para cualquier imagen externa incluida en el HTML. De forma predeterminada, está configurado en 300 ppp.
- vertical_resolution: similar a la resolución_horizontal, esta propiedad administra la resolución vertical de imágenes internas y externas durante la generación de PDF. Al igual que su contraparte horizontal, el valor predeterminado es 300 ppp.
- background_color: esta propiedad establece o recupera el color de fondo que llena cada página del documento PDF. El valor predeterminado es transparente, pero se puede personalizar para adaptarlo a las preferencias estéticas o de marca, lo que garantiza la coherencia en todas las páginas.
- css: esta propiedad utiliza un objeto
CssOptions
para configurar el procesamiento de propiedades CSS durante la conversión de HTML a PDF. Permite un control preciso sobre cómo se interpretan y aplican los estilos del HTML en el PDF resultante. - jpeg_quality: esta propiedad determina la calidad de compresión JPEG utilizada para las imágenes incrustadas en un documento PDF. La calidad predeterminada está establecida en 95, lo que proporciona un buen equilibrio entre la fidelidad de la imagen y el tamaño del archivo. Establecer esta propiedad le permite optimizar el tamaño del archivo o la calidad de la imagen según sus necesidades específicas.
- encryption: esta propiedad proporciona información detallada sobre el cifrado de documentos PDF, incluida la protección con contraseña y la configuración de permisos. Si no está configurado, no se aplica ningún cifrado, pero configurar esta propiedad le permite distribuir y controlar el acceso a contenido PDF confidencial de forma segura.
- document_info: esta propiedad contiene metadatos e información sobre el documento PDF de salida, como título, autor, tema y palabras clave. Estos metadatos ayudan a la gestión, indexación y búsqueda de documentos, lo que hace que el PDF sea más informativo y organizado.
- form_field_behaviour: esta propiedad especifica el comportamiento de los campos del formulario interactivo en el PDF generado.
- is_tagged_pdf: cuando se establece en verdadero, se crea un diseño etiquetado dentro del documento PDF, lo que mejora la accesibilidad para usuarios con discapacidades. Esto garantiza que el contenido esté estructurado adecuadamente y sea navegable utilizando tecnología de asistencia y cumpla con los estándares de accesibilidad.
Cómo convertir MHTML a XPS
Aspose.HTML for Python via .NET admite la conversión de MHTML a XPS. Para hacer esto, debes usar
XpsSaveOptions para obtener un objeto de opciones de guardado que se pasa al método convert_mhtml()
:
opciones = XpsSaveOptions()
El uso de XpsSaveOptions le permite personalizar el proceso de renderizado; puede especificar las propiedades page_setup, background_color, css, horizontal_resolution y vertical_resolution.
Descargue la biblioteca Aspose.HTML for Python via .NET para convertir exitosa, rápida y fácilmente sus documentos HTML, MHTML, EPUB, SVG y Markdown a los formatos más populares.
Aspose.HTML ofrece un Convertidor de MHTML a PDF gratuito en línea que convierte archivos MHTML a PDF con alta calidad, fácil y rápido. ¡Simplemente cargue, convierta sus archivos y obtenga resultados en unos segundos!