Convertir EPUB a PDF en Python
EPUB es un formato abierto basado en XML para libros y publicaciones digitales diseñado para una visualización óptima en varios dispositivos. Fue creado por el Foro Internacional de Publicaciones Digitales ( IDPF) y ahora es compatible con muchos lectores electrónicos y aplicaciones de software. A menudo se requiere la conversión de EPUB a PDF para aprovechar el formato PDF. Con Aspose.HTML for Python via .NET, puede convertir EPUB a PDF mediante programación con control total sobre una amplia gama de parámetros de conversión.
En este artículo, encontrará información sobre cómo convertir EPUB a PDF usando los métodos convert_epub() de la clase Converter y cómo aplicar PdfSaveOptions.
Para continuar siguiendo este tutorial, instale y configure Aspose.HTML for Python via .NET en su proyecto Python.
Convertidor EPUB en línea
Puede comprobar la funcionalidad de Aspose.HTML for Python via .NET API y convertir EPUB en tiempo real. Cargue un archivo EPUB desde un sistema de archivos local o URL, seleccione el formato de salida y ejecute el ejemplo. En el ejemplo, las opciones de guardar están configuradas de forma predeterminada. Recibirá inmediatamente el resultado en un archivo separado.
Si desea convertir EPUB a PDF usando PdfSaveOptions
mediante programación, consulte el siguiente ejemplo de código Python.
Convertir EPUB a PDF
Usar los métodos convert_epub() es la forma más común de convertir archivos EPUB a varios formatos. Para convertir EPUB a PDF, debes seguir algunos pasos:
- Abra un archivo EPUB existente. En el ejemplo, utilizamos el método open() para abrir y leer un archivo EPUB del sistema de archivos en la ruta especificada.
- Cree una instancia de la clase PdfSaveOptions y especifique las opciones de guardado requeridas.
- Utilice uno de los métodos
convert_epub() de la clase
Converter para guardar EPUB como un archivo PDF. En el siguiente ejemplo, debe pasar la secuencia del archivo EPUB,
PdfSaveOptions
, y la ruta del archivo de salida aconvert_epub()
.
El siguiente ejemplo muestra cómo utilizar PdfSaveOptions y crear un archivo PDF con opciones de guardado personalizadas:
1import os
2from aspose.html import *
3from aspose.html.converters import *
4from aspose.html.saving import *
5from aspose.html.drawing import *
6
7# Setup directories and define paths
8output_dir = "output/"
9input_dir = "data/"
10if not os.path.exists(output_dir):
11 os.makedirs(output_dir)
12document_path = os.path.join(input_dir, "input.epub")
13save_path = os.path.join(output_dir, "output.pdf")
14
15# Open an existing EPUB file for reading
16with open(document_path, "rb") as stream:
17
18 # Create an instance of PdfSaveOptions
19 options = PdfSaveOptions()
20 options.page_setup.any_page = Page(Size(800, 600), Margin(10, 10, 10, 10))
21 options.css.media_type.PRINT
22
23 # Convert EPUB to PDF
24 Converter.convert_epub(stream, options, save_path)
En el ejemplo, abrimos y leemos archivos fuente del sistema de archivos en la ruta especificada. El constructor PdfSaveOptions()
inicializa una instancia de la clase PdfSaveOptions que se pasa al método convert_epub()
que toma la secuencia, las opciones, la ruta del archivo de salida save_path y realiza la operación de conversión. La clase DocSaveOptions proporciona numerosas propiedades que le brindan control total sobre una amplia gama de parámetros y mejoran el proceso de conversión de EPUB a formato PDF. En el ejemplo, usamos las propiedades page_setup
y css.media_type
.
Opciones de guardado – Clase PdfSaveOptions
Aspose.HTML for Python via .NET proporciona la clase
PdfSaveOptions, que le brinda más control sobre cómo se guardan los documentos en formato PDF. Algunas propiedades de esta clase heredan propiedades de clases base, como
PdfRenderingOptions o RenderingOptions. Aquí hay una descripción de las propiedades disponibles en PdfSaveOptions
:
- page_setup: esta propiedad proporciona acceso a un objeto PageSetup utilizado para configurar el diseño y los ajustes de las páginas PDF de salida para ajustarse a requisitos específicos de impresión o visualización.
- jpeg_quality: esta propiedad determina la calidad de compresión JPEG utilizada para las imágenes incrustadas en un documento PDF. La calidad predeterminada está establecida en 95, lo que proporciona un buen equilibrio entre la fidelidad de la imagen y el tamaño del archivo. Establecer esta propiedad le permite optimizar el tamaño del archivo o la calidad de la imagen según sus necesidades específicas.
- encryption: esta propiedad proporciona información detallada sobre el cifrado de documentos PDF, incluida la protección con contraseña y la configuración de permisos. Si no está configurado, no se aplica ningún cifrado, pero configurar esta propiedad le permite distribuir y controlar el acceso a contenido PDF confidencial de forma segura.
- horizontal_resolution: esta propiedad controla la resolución horizontal tanto para las imágenes internas utilizadas durante el procesamiento como para cualquier imagen externa incluida en el HTML. De forma predeterminada, está configurado en 300 ppp.
- vertical_resolution: similar a la resolución_horizontal, esta propiedad administra la resolución vertical de imágenes internas y externas durante la generación de PDF. Al igual que su contraparte horizontal, el valor predeterminado es 300 ppp.
- background_color: esta propiedad establece o recupera el color de fondo que llena cada página del documento PDF. El valor predeterminado es transparente, pero se puede personalizar para adaptarlo a las preferencias estéticas o de marca, lo que garantiza la coherencia en todas las páginas.
- css: esta propiedad utiliza un objeto
CssOptions
para configurar el procesamiento de propiedades CSS durante la conversión de HTML a PDF. Permite un control preciso sobre cómo se interpretan y aplican los estilos del HTML en el PDF resultante. - document_info: esta propiedad contiene metadatos e información sobre el documento PDF de salida, como título, autor, tema y palabras clave. Estos metadatos ayudan a la gestión, indexación y búsqueda de documentos, lo que hace que el PDF sea más informativo y organizado.
- form_field_behaviour: esta propiedad especifica el comportamiento de los campos del formulario interactivo en el PDF generado.
- is_tagged_pdf: cuando se establece en verdadero, se crea un diseño etiquetado dentro del documento PDF, lo que mejora la accesibilidad para usuarios con discapacidades. Esto garantiza que el contenido esté estructurado adecuadamente y sea navegable utilizando tecnología de asistencia y cumpla con los estándares de accesibilidad.
Descargue la biblioteca Aspose.HTML for Python via .NET para convertir exitosa, rápida y fácilmente sus documentos HTML, MHTML, EPUB, SVG y Markdown a los formatos más populares.
Aspose.HTML ofrece un Convertidor de EPUB a PDF en línea gratuito que convierte EPUB a PDF con alta calidad, fácil y rápido. ¡Simplemente cargue, convierta sus archivos y obtenga resultados en unos segundos!