Remover Tabelas de Documentos PDF Existentes
Remover Tabela de documento PDF
Aspose.PDF for Python permite que você remova uma tabela de um PDF. Ele abre um PDF existente, detecta a primeira tabela na primeira página com TableAbsorber, exclui essa tabela usando remove(), e salva o PDF atualizado em um novo arquivo.
Use esta página quando precisar limpar PDFs com muitas tabelas, remover conteúdo tabular desatualizado ou simplificar documentos antes da redistribuição.
import aspose.pdf as ap
from os import path
import sys
def remove_one_table(infile: str, outfile: str) -> None:
# Load existing PDF document
document = ap.Document(infile)
# Create TableAbsorber object to find tables
absorber = ap.text.TableAbsorber()
# Visit first page with absorber
absorber.visit(document.pages[1])
# Get first table on the page
table = absorber.table_list[0]
# Remove the table
absorber.remove(table)
# Save PDF
document.save(outfile)
Remover todas as Tabelas do documento PDF
Com nossa biblioteca, você pode remover todas as tabelas de uma página específica em um PDF. O código abre um PDF existente, detecta todas as tabelas na segunda página com TableAbsorber, itera pelas tabelas detectadas, remove cada uma e, em seguida, salva o PDF modificado em um novo arquivo. É útil quando você precisa remover em massa tabelas de uma página enquanto mantém o restante do conteúdo do PDF intacto.
import aspose.pdf as ap
from os import path
import sys
def remove_all_tables(infile: str, outfile: str) -> None:
# Load existing PDF document
document = ap.Document(infile)
# Create TableAbsorber object to find tables
absorber = ap.text.TableAbsorber()
# Visit first page with absorber
absorber.visit(document.pages[1])
# Loop through the copy of collection and removing tables
tables = list(absorber.table_list)
for table in tables:
absorber.remove(table)
# Save document
document.save(outfile)