Eliminar Imágenes de un Archivo PDF usando Python
Hay muchas razones para eliminar todas o algunas imágenes de los PDFs.
A veces, un archivo PDF puede contener imágenes importantes que deben eliminarse para proteger la privacidad o prevenir el acceso no autorizado a cierta información.
Eliminar imágenes no deseadas o redundantes puede ayudar a reducir el tamaño del archivo, facilitando así compartir o almacenar los PDFs.
Si es necesario, puedes reducir el número de páginas eliminando todas las imágenes del documento. Además, eliminar imágenes del documento ayudará a preparar el PDF para la compresión o extracción de la información de texto.
Aspose.PDF para Python a través de .NET te ayudará con esta tarea.
Eliminar Imágenes del Archivo PDF
Para eliminar una imagen de un archivo PDF:
- Abre el Documento PDF existente.
- Elimina una imagen en particular.
- Guarda el archivo PDF actualizado.
El siguiente fragmento de código muestra cómo eliminar una imagen de un archivo PDF.
import aspose.pdf as ap
# Abrir documento
document = ap.Document(input_file)
# Eliminar imagen particular
document.pages[2].resources.images.delete(1)
# Guardar archivo PDF actualizado
document.save(output_pdf)
Eliminar todas las imágenes del PDF de entrada
import aspose.pdf as ap
# Abrir documento
document = ap.Document(input_file)
# Eliminar todas las imágenes en todas las páginas
for i in range(len(document.pages)):
while len(document.pages[i + 1].resources.images) != 0:
document.pages[i + 1].resources.images.delete(1)
# Guardar archivo PDF actualizado
document.save(output_file)