Удалить таблицы из существующего PDF

Удалить таблицу из PDF‑документа

Aspose.PDF for Python позволяет удалить таблицу из PDF. Он открывает существующий PDF, обнаруживает первую таблицу на первой странице с помощью TableAbsorber, удаляет эту таблицу, используя remove_one_table. После сохранения обновлённого PDF в новый файл.

Используйте эту страницу, когда нужно очистить PDF, содержащие множество таблиц, удалить устаревшее табличное содержание или упростить документы перед повторным распространением.

import aspose.pdf as ap
from os import path
import sys

def remove_one_table(infile: str, outfile: str) -> None:
    # Load existing PDF document
    document = ap.Document(infile)

    # Create TableAbsorber object to find tables
    absorber = ap.text.TableAbsorber()
    # Visit first page with absorber
    absorber.visit(document.pages[1])
    # Get first table on the page
    table = absorber.table_list[0]
    # Remove the table
    absorber.remove(table)
    # Save PDF
    document.save(outfile)

Удалить все таблицы из PDF‑документа

С помощью нашей библиотеки вы можете удалить все таблицы с конкретной страницы в PDF. Код открывает существующий PDF, обнаруживает все таблицы на второй странице с помощью TableAbsorber, перебирает обнаруженные таблицы, удаляет каждую из них и затем сохраняет изменённый PDF в новый файл. Это полезно, когда необходимо массово удалить таблицы со страницы, оставив остальное содержание PDF нетронутым.

import aspose.pdf as ap
from os import path
import sys

def remove_all_tables(infile: str, outfile: str) -> None:
    # Load existing PDF document
    document = ap.Document(infile)

    # Create TableAbsorber object to find tables
    absorber = ap.text.TableAbsorber()
    # Visit first page with absorber
    absorber.visit(document.pages[1])
    #  Loop through the copy of collection and removing tables
    tables = list(absorber.table_list)
    for table in tables:
        absorber.remove(table)

    # Save document
    document.save(outfile)

Другие темы связанные с таблицами