Convertir HTML a PDF en Python
Un archivo PDF es un documento de diseño fijo que incluye texto, gráficos, hipervínculos, botones, campos de formulario, multimedia y otra información necesaria para mostrar. Los archivos PDF son muy seguros y permiten protección con contraseña, cifrado y firmas digitales para salvaguardar la información confidencial. También son universalmente accesibles y fácilmente visibles en cualquier dispositivo sin software específico. Además, los archivos PDF son compactos y pueden comprimir archivos de alta calidad en tamaños más pequeños, lo que los hace ideales para compartirlos y almacenarlos.
En esta guía, encontrará información sobre cómo convertir un documento HTML a un formato de archivo de formato de documento portátil (PDF) usando Aspose.HTML for Python via .NET. Vamos a cubrir en detalle cómo convertir HTML a PDF usando los métodos convert_html() de la clase Converter y cómo aplicar PdfSaveOptions. Además, puede probar un convertidor HTML en línea para probar la funcionalidad Aspose.HTML y convertir HTML sobre la marcha.
Para continuar siguiendo este tutorial, instale y configure Aspose.HTML for Python via .NET en su proyecto Python. Nuestros ejemplos de código le ayudan a convertir HTML a PDF y generar archivos PDF utilizando la biblioteca Python.
HTML a PDF mediante una sola línea de código
Los métodos de la clase Converter se utilizan principalmente como la forma más sencilla de convertir un código HTML a varios formatos. ¡Puedes convertir HTML a PDF en tu aplicación Python literalmente con una sola línea de código!
1from aspose.html import *
2from aspose.html.converters import *
3from aspose.html.saving import *
4
5# Convert HTML to PDF
6Converter.convert_html("document.html", PdfSaveOptions(), "document.pdf")
Convertidor HTML en línea
Puede probar el poder de Aspose.HTML for Python via .NET y realizar la conversión HTML en tiempo real. Simplemente cargue un archivo HTML desde su sistema de archivos local o URL, seleccione el formato de salida deseado y ejecute el código de ejemplo proporcionado. El ejemplo utiliza las opciones de guardado predeterminadas, lo que permite un proceso de conversión simple. Una vez completado, recibirá instantáneamente el archivo convertido en el formato que elija.
Convierta HTML a PDF usando PdfSaveOptions
Con Aspose.HTML for Python via .NET, puede convertir archivos mediante programación con control total sobre una amplia gama de parámetros de conversión. Para convertir HTML a PDF con la especificación PdfSaveOptions
, debe seguir algunos pasos:
- Cargue un archivo HTML usando uno de los constructores HTMLDocument() de la clase HTMLDocument. En el ejemplo anterior, inicializamos un documento HTML a partir de un archivo.
- Cree un nuevo objeto
PdfSaveOptions y especifique las propiedades requeridas. La clase
PdfSaveOptions
proporciona numerosas propiedades que le brindan control total sobre una amplia gama de parámetros y mejoran el proceso de conversión de HTML a PDF. - Utilice el método
convert_html() de la clase Converter. En el siguiente ejemplo, debe pasar
HTMLDocument
,PdfSaveOptions
y la ruta del archivo de salida al métodoconvert_html()
.
El siguiente ejemplo de código Python muestra cómo usar PdfSaveOptions y crear un archivo PDF con opciones de guardado personalizadas:
1import os
2from aspose.html import *
3from aspose.html.converters import *
4from aspose.html.saving import *
5from aspose.html.drawing import *
6from aspose.html.rendering.pdf import *
7
8# Setup directories and define paths
9output_dir = "output/"
10input_dir = "data/"
11if not os.path.exists(output_dir):
12 os.makedirs(output_dir)
13
14document_path = os.path.join(input_dir, "aspose.html")
15save_path = os.path.join(output_dir, "aspose-output.pdf")
16
17# Initialize an HTML document from the file
18document = HTMLDocument(document_path)
19
20# Initialize PdfSaveOptions
21options = PdfSaveOptions()
22options.page_setup.any_page = Page(Size(680, 500), Margin(10, 10, 10, 10))
23options.css.media_type.PRINT
24
25# Convert HTML to PDF
26Converter.convert_html(document, options, save_path)
Convertimos un documento HTML a un archivo PDF usando las opciones de guardar en este ejemplo. El proceso implica inicializar el documento HTML, configurar opciones de guardado personalizadas, como el tamaño de página y css media_type, y luego realizar la conversión. Finalmente, el archivo PDF convertido se guarda en un directorio de salida específico.
Puede evaluar la calidad de la conversión probando nuestro producto. La siguiente figura muestra el resultado de convertir un archivo aspose.html a formato PDF:
Clase PdfSaveOptions
Aspose.HTML for Python via .NET proporciona la clase
PdfSaveOptions, que le brinda más control sobre cómo se guardan los documentos en formato PDF. Algunas propiedades de esta clase heredan propiedades de clases base, como
PdfRenderingOptions o RenderingOptions. El uso de PdfSaveOptions
le permite personalizar el proceso de renderizado; puede especificar el tamaño de la página, los márgenes, los permisos de los archivos, Css, etc. Aquí hay una descripción de las propiedades disponibles en PdfSaveOptions
:
- page_setup: esta propiedad proporciona acceso a un objeto PageSetup utilizado para configurar el diseño y los ajustes de las páginas PDF de salida para ajustarse a requisitos específicos de impresión o visualización.
- horizontal_resolution: esta propiedad controla la resolución horizontal tanto para las imágenes internas utilizadas durante el procesamiento como para cualquier imagen externa incluida en el HTML. De forma predeterminada, está configurado en 300 ppp.
- vertical_resolution: similar a la resolución_horizontal, esta propiedad administra la resolución vertical de imágenes internas y externas durante la generación de PDF. Al igual que su contraparte horizontal, el valor predeterminado es 300 ppp.
- background_color: esta propiedad establece o recupera el color de fondo que llena cada página del documento PDF. El valor predeterminado es transparente, pero se puede personalizar para adaptarlo a las preferencias estéticas o de marca, lo que garantiza la coherencia en todas las páginas.
- css: esta propiedad utiliza un objeto
CssOptions
para configurar el procesamiento de propiedades CSS durante la conversión de HTML a PDF. Permite un control preciso sobre cómo se interpretan y aplican los estilos del HTML en el PDF resultante. - document_info: esta propiedad contiene metadatos e información sobre el documento PDF de salida, como título, autor, tema y palabras clave. Estos metadatos ayudan a la gestión, indexación y búsqueda de documentos, lo que hace que el PDF sea más informativo y organizado.
- form_field_behaviour: esta propiedad especifica el comportamiento de los campos del formulario interactivo en el PDF generado.
- jpeg_quality: esta propiedad determina la calidad de compresión JPEG utilizada para las imágenes incrustadas en un documento PDF. La calidad predeterminada está establecida en 95, lo que proporciona un buen equilibrio entre la fidelidad de la imagen y el tamaño del archivo. Establecer esta propiedad le permite optimizar el tamaño del archivo o la calidad de la imagen según sus necesidades específicas.
- encryption: esta propiedad proporciona información detallada sobre el cifrado de documentos PDF, incluida la protección con contraseña y la configuración de permisos. Si no está configurado, no se aplica ningún cifrado, pero configurar esta propiedad le permite distribuir y controlar el acceso a contenido PDF confidencial de forma segura.
- is_tagged_pdf: cuando se establece en verdadero, se crea un diseño etiquetado dentro del documento PDF, lo que mejora la accesibilidad para usuarios con discapacidades. Esto garantiza que el contenido esté estructurado adecuadamente y sea navegable utilizando tecnología de asistencia y cumpla con los estándares de accesibilidad.
Conversión de HTML a PDF y PDF flattening
Aspose.HTML for Python via .NET ofrece la propiedad
form_field_behaviour de la clase PdfSaveOptions
para aplanar documentos PDF después de su conversión de HTML o MHTML. Esta propiedad se utiliza para especificar el comportamiento de los campos de formulario en un documento PDF. Si el valor se establece en FormFieldBehaviour.FLATTENED
, todos los campos del formulario en el documento PDF se aplanarán.
1import os
2from aspose.html import *
3from aspose.html.converters import *
4from aspose.html.saving import *
5from aspose.html.rendering.pdf import *
6
7# Setup directories and define paths
8data_dir = "data/"
9output_dir = "output/"
10if not os.path.exists(output_dir):
11 os.makedirs(output_dir)
12source_path = os.path.join(data_dir, "SampleHtmlForm.html")
13result_path = os.path.join(output_dir, "form-flattened.pdf")
14
15# Initialize an HTML document from the file
16document = HTMLDocument(source_path)
17
18# Prepare PDF save options
19options = PdfSaveOptions()
20options.form_field_behaviour = FormFieldBehaviour.FLATTENED
21
22# Convert HTML to PDF
23Converter.convert_html(document, options, result_path)
Cómo convertir HTML a XPS
Aspose.HTML for Python via .NET admite la conversión de HTML a XPS. Para hacer esto, debes usar
XpsSaveOptions para obtener un objeto de opciones de guardado que se pasa al método convert_html()
:
opciones = XpsSaveOptions()
El uso de XpsSaveOptions le permite personalizar el proceso de renderizado; puede especificar las propiedades página_configuración, background_color, css, horizontal_resolution y vertical_resolution.
Descargue la biblioteca Aspose.HTML for Python via .NET para convertir exitosa, rápida y fácilmente sus documentos HTML, MHTML, EPUB, SVG y Markdown a los formatos más populares.
Aspose.HTML ofrece un Convertidor de HTML a PDF gratuito en línea que convierte HTML a PDF con alta calidad, fácil y rápido. ¡Simplemente cargue, convierta sus archivos y obtenga el resultado en unos segundos!