Eliminar Imágenes de un Archivo PDF usando Python

Hay muchas razones para eliminar todas o algunas imágenes de los PDFs.

A veces, un archivo PDF puede contener imágenes importantes que deben eliminarse para proteger la privacidad o prevenir el acceso no autorizado a cierta información.

Eliminar imágenes no deseadas o redundantes puede ayudar a reducir el tamaño del archivo, facilitando así compartir o almacenar los PDFs.

Si es necesario, puedes reducir el número de páginas eliminando todas las imágenes del documento. Además, eliminar imágenes del documento ayudará a preparar el PDF para la compresión o extracción de la información de texto.

Aspose.PDF para Python a través de .NET te ayudará con esta tarea.

Eliminar Imágenes del Archivo PDF

Para eliminar una imagen de un archivo PDF:

  1. Abre el Documento PDF existente.
  2. Elimina una imagen en particular.
  3. Guarda el archivo PDF actualizado.

El siguiente fragmento de código muestra cómo eliminar una imagen de un archivo PDF.


    import aspose.pdf as ap

    # Abrir documento
    document = ap.Document(input_file)

    # Eliminar imagen particular
    document.pages[2].resources.images.delete(1)

    # Guardar archivo PDF actualizado
    document.save(output_pdf)

Eliminar todas las imágenes del PDF de entrada


    import aspose.pdf as ap

    # Abrir documento
    document = ap.Document(input_file)

    # Eliminar todas las imágenes en todas las páginas
    for i in range(len(document.pages)):
        while len(document.pages[i + 1].resources.images) != 0:
            document.pages[i + 1].resources.images.delete(1)

    # Guardar archivo PDF actualizado
    document.save(output_file)