Convertir PDF a HTML en Python

Resumen

Este artículo explica cómo convertir PDF a HTML usando Python. Cubre estos temas.

Formato: HTML

Convertir PDF a HTML

Aspose.PDF para Python vía .NET ofrece muchas características para convertir varios formatos de archivo en documentos PDF y convertir archivos PDF en varios formatos de salida. Este artículo discute cómo convertir un archivo PDF en HTML. Puedes usar solo un par de líneas de código en Python para convertir PDF a HTML. Es posible que necesites convertir PDF a HTML si deseas crear un sitio web o agregar contenido a un foro en línea. Una forma de convertir PDF a HTML es usar Python de manera programática.

Pasos: Convertir PDF a HTML en Python

  1. Crea una instancia del objeto Document con el documento PDF de origen.
  2. Guárdalo en HtmlSaveOptions llamando al método save().

    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_html.html"
    # Abre el documento PDF
    document = ap.Document(input_pdf)

    # guarda el documento en formato HTML
    save_options = ap.HtmlSaveOptions()
    document.save(output_pdf, save_options)

Ver También

Este artículo también cubre estos temas. Los códigos son los mismos que arriba.

Formato: HTML