Удалить таблицы из существующего PDF
Удалить таблицу из PDF‑документа
Aspose.PDF for Python позволяет удалить таблицу из PDF. Он открывает существующий PDF, обнаруживает первую таблицу на первой странице с помощью TableAbsorber, удаляет эту таблицу, используя remove_one_table. После сохранения обновлённого PDF в новый файл.
Используйте эту страницу, когда нужно очистить PDF, содержащие множество таблиц, удалить устаревшее табличное содержание или упростить документы перед повторным распространением.
import aspose.pdf as ap
from os import path
import sys
def remove_one_table(infile: str, outfile: str) -> None:
# Load existing PDF document
document = ap.Document(infile)
# Create TableAbsorber object to find tables
absorber = ap.text.TableAbsorber()
# Visit first page with absorber
absorber.visit(document.pages[1])
# Get first table on the page
table = absorber.table_list[0]
# Remove the table
absorber.remove(table)
# Save PDF
document.save(outfile)
Удалить все таблицы из PDF‑документа
С помощью нашей библиотеки вы можете удалить все таблицы с конкретной страницы в PDF. Код открывает существующий PDF, обнаруживает все таблицы на второй странице с помощью TableAbsorber, перебирает обнаруженные таблицы, удаляет каждую из них и затем сохраняет изменённый PDF в новый файл. Это полезно, когда необходимо массово удалить таблицы со страницы, оставив остальное содержание PDF нетронутым.
import aspose.pdf as ap
from os import path
import sys
def remove_all_tables(infile: str, outfile: str) -> None:
# Load existing PDF document
document = ap.Document(infile)
# Create TableAbsorber object to find tables
absorber = ap.text.TableAbsorber()
# Visit first page with absorber
absorber.visit(document.pages[1])
# Loop through the copy of collection and removing tables
tables = list(absorber.table_list)
for table in tables:
absorber.remove(table)
# Save document
document.save(outfile)