Remover Tabelas de Documentos PDF Existentes

Remover Tabela de documento PDF

Aspose.PDF for Python permite que você remova uma tabela de um PDF. Ele abre um PDF existente, detecta a primeira tabela na primeira página com TableAbsorber, exclui essa tabela usando remove(), e salva o PDF atualizado em um novo arquivo.

Use esta página quando precisar limpar PDFs com muitas tabelas, remover conteúdo tabular desatualizado ou simplificar documentos antes da redistribuição.

import aspose.pdf as ap
from os import path
import sys

def remove_one_table(infile: str, outfile: str) -> None:
    # Load existing PDF document
    document = ap.Document(infile)

    # Create TableAbsorber object to find tables
    absorber = ap.text.TableAbsorber()
    # Visit first page with absorber
    absorber.visit(document.pages[1])
    # Get first table on the page
    table = absorber.table_list[0]
    # Remove the table
    absorber.remove(table)
    # Save PDF
    document.save(outfile)

Remover todas as Tabelas do documento PDF

Com nossa biblioteca, você pode remover todas as tabelas de uma página específica em um PDF. O código abre um PDF existente, detecta todas as tabelas na segunda página com TableAbsorber, itera pelas tabelas detectadas, remove cada uma e, em seguida, salva o PDF modificado em um novo arquivo. É útil quando você precisa remover em massa tabelas de uma página enquanto mantém o restante do conteúdo do PDF intacto.

import aspose.pdf as ap
from os import path
import sys

def remove_all_tables(infile: str, outfile: str) -> None:
    # Load existing PDF document
    document = ap.Document(infile)

    # Create TableAbsorber object to find tables
    absorber = ap.text.TableAbsorber()
    # Visit first page with absorber
    absorber.visit(document.pages[1])
    #  Loop through the copy of collection and removing tables
    tables = list(absorber.table_list)
    for table in tables:
        absorber.remove(table)

    # Save document
    document.save(outfile)

Tópicos Relacionados à Tabela