从现有 PDF 文档中删除表格
Contents
[
Hide
]
从 PDF 文档中删除表格
Aspose.PDF for Python 允许您从 PDF 中移除表格。它打开现有的 PDF,检测首页上的第一个表格,用 TableAbsorber,使用删除该表 remove(),并将更新后的 PDF 保存到一个新文件。
当您需要清理大量表格的 PDF、删除过时的表格内容,或在重新分发前简化文档时,请使用此页面。
import aspose.pdf as ap
from os import path
import sys
def remove_one_table(infile: str, outfile: str) -> None:
# Load existing PDF document
document = ap.Document(infile)
# Create TableAbsorber object to find tables
absorber = ap.text.TableAbsorber()
# Visit first page with absorber
absorber.visit(document.pages[1])
# Get first table on the page
table = absorber.table_list[0]
# Remove the table
absorber.remove(table)
# Save PDF
document.save(outfile)
从 PDF 文档中移除所有表格
使用我们的库,您可以从 PDF 的特定页面中移除所有表格。代码打开现有的 PDF,使用 TableAbsorber 检测第二页上的所有表格,遍历检测到的表格,逐一移除,然后将修改后的 PDF 保存为新文件。当您需要批量移除页面上的表格而保留 PDF 其余内容完整时,这非常有用。
import aspose.pdf as ap
from os import path
import sys
def remove_all_tables(infile: str, outfile: str) -> None:
# Load existing PDF document
document = ap.Document(infile)
# Create TableAbsorber object to find tables
absorber = ap.text.TableAbsorber()
# Visit first page with absorber
absorber.visit(document.pages[1])
# Loop through the copy of collection and removing tables
tables = list(absorber.table_list)
for table in tables:
absorber.remove(table)
# Save document
document.save(outfile)