Supprimer les tableaux des documents PDF existants
Supprimer le tableau d’un document PDF
Aspose.PDF for Python vous permet de supprimer un tableau d’un PDF. Il ouvre un PDF existant, détecte le premier tableau de la première page avec TableAbsorber, supprime cette table en utilisant remove(), et enregistre le PDF mis à jour dans un nouveau fichier.
Utilisez cette page lorsque vous devez nettoyer des PDF contenant beaucoup de tableaux, supprimer du contenu tabulaire obsolète ou simplifier les documents avant redistribution.
import aspose.pdf as ap
from os import path
import sys
def remove_one_table(infile: str, outfile: str) -> None:
# Load existing PDF document
document = ap.Document(infile)
# Create TableAbsorber object to find tables
absorber = ap.text.TableAbsorber()
# Visit first page with absorber
absorber.visit(document.pages[1])
# Get first table on the page
table = absorber.table_list[0]
# Remove the table
absorber.remove(table)
# Save PDF
document.save(outfile)
Supprimer toutes les tables du document PDF
Avec notre bibliothèque, vous pouvez supprimer toutes les tables d’une page spécifique d’un PDF. Le code ouvre un PDF existant, détecte toutes les tables de la deuxième page avec TableAbsorber, parcourt les tables détectées, supprime chacune d’elles, puis enregistre le PDF modifié dans un nouveau fichier. Cela est utile lorsque vous devez supprimer en masse les tables d’une page tout en conservant le reste du contenu du PDF intact.
import aspose.pdf as ap
from os import path
import sys
def remove_all_tables(infile: str, outfile: str) -> None:
# Load existing PDF document
document = ap.Document(infile)
# Create TableAbsorber object to find tables
absorber = ap.text.TableAbsorber()
# Visit first page with absorber
absorber.visit(document.pages[1])
# Loop through the copy of collection and removing tables
tables = list(absorber.table_list)
for table in tables:
absorber.remove(table)
# Save document
document.save(outfile)