Convertir otros formatos de archivo a PDF en Python

Este artículo explica cómo convertir varios otros tipos de formatos de archivo a PDF usando Python. Cubre los siguientes temas.

Convertir OFD a PDF

OFD significa Open Fixed-layout Document (también llamado formato Open Fixed Document). Es una norma nacional china (GB/T 33190-2016) para documentos electrónicos, introducida como una alternativa al PDF.

Pasos para convertir OFD a PDF en Python:

  1. Configura las opciones de carga OFD usando OfdLoadOptions().
  2. Cargar el documento OFD.
  3. Guardar como PDF.
from os import path, remove
import aspose.pdf as ap
import sys

def convert_OFD_to_PDF(infile, outfile):
    load_options = ap.OfdLoadOptions()
    document = ap.Document(infile, load_options)
    document.save(outfile)

    print(infile + " converted into " + outfile)

Convertir LaTeX/TeX a PDF

El formato de archivo LaTeX es un formato de archivo de texto con marcado en la derivada LaTeX de la familia de lenguajes TeX y LaTeX es un formato derivado del sistema TeX. LaTeX (\u02C8le\u026At\u025Bk/lay-tek o lah-tek) es un sistema de preparación de documentos y lenguaje de marcado de documentos. Se utiliza ampliamente para la comunicación y publicación de documentos científicos en muchos campos, incluidos matemáticas, física y ciencia de la computación. También desempeña un papel clave en la preparación y publicación de libros y artículos que contienen material multilingüe complejo, como coreano, japonés, caracteres chinos y árabe, incluidas ediciones especiales.

LaTeX utiliza el programa de composición tipográfica TeX para formatear su salida, y está escrito en el lenguaje macro de TeX.

Pasos para convertir TEX a PDF en Python:

  1. Configure las opciones de carga de LaTeX usando LatexLoadOptions().
  2. Cargar el documento LaTeX.
  3. Guardar como PDF.
from os import path, remove
import aspose.pdf as ap
import sys

def convert_TEX_to_PDF(infile, outfile):
    load_options = ap.LatexLoadOptions()
    document = ap.Document(infile, load_options)
    document.save(outfile)

    print(infile + " converted into " + outfile)

Convertir EPUB a PDF

Aspose.PDF for Python via .NET le permite simplemente convertir archivos EPUB al formato PDF.

EPUB (abreviatura de publicación electrónica) es un estándar de libros electrónicos gratuito y abierto del International Digital Publishing Forum (IDPF). Los archivos tienen la extensión .epub. EPUB está diseñado para contenido refluible, lo que significa que un lector EPUB puede optimizar el texto para un dispositivo de visualización particular.

EPUB también admite contenido de diseño fijo. El formato está pensado como un formato único que los editores y casas de conversión pueden usar internamente, así como para distribución y venta. Reemplaza el estándar Open eBook. La versión EPUB 3 también cuenta con el respaldo del Book Industry Study Group (BISG), una asociación líder en el comercio de libros para prácticas recomendadas estandarizadas, investigación, información y eventos, para el empaquetado de contenido.

Pasos para convertir EPUB a PDF en Python:

  1. Cargar documento EPUB con EpubLoadOptions().
  2. Convertir EPUB a PDF.
  3. Confirmación de impresión.

El siguiente fragmento de código le muestra cómo convertir archivos EPUB al formato PDF con Python.

from os import path, remove
import aspose.pdf as ap
import sys

def convert_EPUB_to_PDF(infile, outfile):
    load_options = ap.EpubLoadOptions()
    document = ap.Document(infile, load_options)

    document.save(outfile)
    print(infile + " converted into " + outfile)

Convertir Markdown a PDF

Esta característica es compatible con la versión 19.6 o superior.

Este fragmento de código de Aspose.PDF for Python via .NET ayuda a convertir archivos Markdown en PDFs, permitiendo una mejor compartición de documentos, preservación del formato y compatibilidad de impresión.o

El siguiente fragmento de código muestra cómo usar esta funcionalidad con la biblioteca Aspose.PDF:

from os import path, remove
import aspose.pdf as ap
import sys

def convert_MD_to_PDF(infile, outfile):
    load_options = ap.MdLoadOptions()
    document = ap.Document(infile, load_options)
    document.save(outfile)
    print(infile + " converted into " + outfile)

Convertir PCL a PDF

PCL (Printer Command Language) es un lenguaje de impresora de Hewlett-Packard desarrollado para acceder a funciones estándar de la impresora. Los niveles 1 a 5e/5c de PCL son lenguajes basados en comandos que utilizan secuencias de control que se procesan e interpretan en el orden en que se reciben. A nivel de consumidor, los flujos de datos PCL son generados por un controlador de impresión. La salida PCL también puede generarse fácilmente mediante aplicaciones personalizadas.

Para permitir la conversión de PCL a PDF, Aspose.PDF tiene la clase PclLoadOptions que se utiliza para inicializar el objeto LoadOptions. Más adelante, este objeto se pasa como argumento durante la inicialización del objeto Document y ayuda al motor de renderizado de PDF a determinar el formato de entrada del documento fuente.

El siguiente fragmento de código muestra el proceso de convertir un archivo PCL a formato PDF.

Pasos para convertir PCL a PDF en Python:

  1. Opciones de carga para PCL usando PclLoadOptions().
  2. Cargar el documento.
  3. Guardar como PDF.
from os import path, remove
import aspose.pdf as ap
import sys

def convert_PCL_to_PDF(infile, outfile):
    load_options = ap.PclLoadOptions()
    load_options.supress_errors = True

    document = ap.Document(infile, load_options)
    document.save(outfile)

    print(infile + " converted into " + outfile)

Convertir texto preformateado a PDF

Aspose.PDF for Python via .NET soporta la función de convertir texto plano y archivos de texto preformateado al formato PDF.

Convertir texto a PDF significa añadir fragmentos de texto a la página del PDF. En cuanto a los archivos de texto, tratamos con 2 tipos de texto: preformateado (por ejemplo, 25 líneas con 80 caracteres por línea) y texto no formateado (texto plano). Dependiendo de nuestras necesidades, podemos controlar esta adición nosotros mismos o confiarla a los algoritmos de la biblioteca.

Pasos Convertir TEXTO a PDF en Python:

  1. Lea el archivo de texto de entrada línea por línea.
  2. Configure una fuente monoespaciada (Courier New) para una alineación de texto coherente.
  3. Cree un nuevo PDF Document y añada la primera página con márgenes personalizados y configuraciones de Font.
  4. Iterar a través de líneas del archivo de texto Para simular la máquina de escribir, usamos la fuente ‘monospace_font’ y tamaño 12.
  5. Limitar la creación de páginas a 4 páginas.
  6. Guarda el PDF final en la ruta especificada.
from os import path, remove
import aspose.pdf as ap
import sys

def convert_TXT_to_PDF(infile, outfile):
    with open(infile, "r") as file:
        lines = file.readlines()

    monospace_font = ap.text.FontRepository.find_font("Courier New")

    document = ap.Document()
    page = document.pages.add()

    page.page_info.margin.left = 20
    page.page_info.margin.right = 10
    page.page_info.default_text_state.font = monospace_font
    page.page_info.default_text_state.font_size = 12
    count = 1
    for line in lines:
        if line != "" and line[0] == "\x0c":
            page = document.pages.add()
            page.page_info.margin.left = 20
            page.page_info.margin.right = 10
            page.page_info.default_text_state.font = monospace_font
            page.page_info.default_text_state.font_size = 12
            count = count + 1
        else:
            text = ap.text.TextFragment(line)
            page.paragraphs.add(text)

        if count == 4:
            break

    document.save(outfile)

    print(infile + " converted into " + outfile)

Convertir PostScript a PDF

Este ejemplo muestra cómo convertir un archivo PostScript en un documento PDF usando Aspose.PDF for Python via .NET.

  1. Crea una instancia de ‘PsLoadOptions’ para interpretar correctamente el archivo PS.
  2. Cargue el archivo ‘PostScript’ en un objeto Document usando las opciones de carga.
  3. Guarde el documento en formato PDF en la ruta de salida deseada.
from os import path, remove
import aspose.pdf as ap
import sys

def convert_PS_to_PDF(infile, outfile):
    load_options = ap.PsLoadOptions()

    document = ap.Document(infile, load_options)
    document.save(outfile)

    print(infile + " converted into " + outfile)

Convertir XPS a PDF

Aspose.PDF for Python via .NET admite la función de conversión XPS archivos al formato PDF. Consulta este artículo para resolver tus tareas.

El tipo de archivo XPS está principalmente asociado con la XML Paper Specification de Microsoft Corporation. La XML Paper Specification (XPS), anteriormente denominada con el nombre en código Metro y que engloba el concepto de marketing Next Generation Print Path (NGPP), es la iniciativa de Microsoft para integrar la creación y visualización de documentos en su sistema operativo Windows.

El siguiente fragmento de código muestra el proceso de convertir un archivo XPS al formato PDF con Python.

from os import path, remove
import aspose.pdf as ap
import sys

def convert_XPS_to_PDF(infile, outfile):
    load_options = ap.XpsLoadOptions()
    document = ap.Document(infile, load_options)
    document.save(outfile)

    print(infile + " converted into " + outfile)

Convertir XSL-FO a PDF

El siguiente fragmento de código puede usarse para convertir un XSLFO al formato PDF con Aspose.PDF for Python via .NET:

from os import path, remove
import aspose.pdf as ap
import sys

def convert_XSLFO_to_PDF(xsltfile, xmlfile, outfile):
    load_options = ap.XslFoLoadOptions(xsltfile)
    load_options.parsing_errors_handling_type = (
        ap.XslFoLoadOptions.ParsingErrorsHandlingTypes.THROW_EXCEPTION_IMMEDIATELY
    )
    document = ap.Document(xmlfile, load_options)
    document.save(outfile)

    print(xmlfile + " converted into " + outfile)

Convertir XML con XSLT a PDF

Este ejemplo muestra cómo convertir un archivo XML en un PDF al transformarlo primero en HTML usando una plantilla XSLT y luego cargar el HTML en Aspose.PDF.

  1. Cree una instancia de ‘HtmlLoadOptions’ para configurar la conversión de HTML a PDF.
  2. Cargue el archivo HTML transformado en un objeto Document de Aspose.PDF.
  3. Guarde el documento como un PDF en la ruta de salida especificada.
  4. Elimine el archivo HTML temporal tras una conversión exitosa.
from os import path, remove
import aspose.pdf as ap
import sys

def convert_XSLFO_to_PDF(xsltfile, xmlfile, outfile):
    load_options = ap.XslFoLoadOptions(xsltfile)
    load_options.parsing_errors_handling_type = (
        ap.XslFoLoadOptions.ParsingErrorsHandlingTypes.THROW_EXCEPTION_IMMEDIATELY
    )
    document = ap.Document(xmlfile, load_options)
    document.save(outfile)

    print(xmlfile + " converted into " + outfile)

Conversiones relacionadas