Eliminar tablas de documentos PDF existentes
Eliminar tabla de documento PDF
Aspose.PDF for Python le permite eliminar una tabla de un PDF. Abre un PDF existente, detecta la primera tabla en la primera página con TableAbsorber, elimina esa tabla usando remove(), y guarda el PDF actualizado en un nuevo archivo.
Utilice esta página cuando necesite limpiar PDFs con muchas tablas, eliminar contenido tabular desactualizado o simplificar documentos antes de redistribuirlos.
import aspose.pdf as ap
from os import path
import sys
def remove_one_table(infile: str, outfile: str) -> None:
# Load existing PDF document
document = ap.Document(infile)
# Create TableAbsorber object to find tables
absorber = ap.text.TableAbsorber()
# Visit first page with absorber
absorber.visit(document.pages[1])
# Get first table on the page
table = absorber.table_list[0]
# Remove the table
absorber.remove(table)
# Save PDF
document.save(outfile)
Eliminar todas las tablas del documento PDF
Con nuestra biblioteca, puedes eliminar todas las tablas de una página específica en un PDF. El código abre un PDF existente, detecta todas las tablas en la segunda página con TableAbsorber, recorre las tablas detectadas, elimina cada una y luego guarda el PDF modificado en un nuevo archivo. Es útil cuando necesitas eliminar en bloque las tablas de una página mientras dejas intacto el resto del contenido del PDF.
import aspose.pdf as ap
from os import path
import sys
def remove_all_tables(infile: str, outfile: str) -> None:
# Load existing PDF document
document = ap.Document(infile)
# Create TableAbsorber object to find tables
absorber = ap.text.TableAbsorber()
# Visit first page with absorber
absorber.visit(document.pages[1])
# Loop through the copy of collection and removing tables
tables = list(absorber.table_list)
for table in tables:
absorber.remove(table)
# Save document
document.save(outfile)