从现有 PDF 中移除表格
Contents
[
Hide
]
Aspose.PDF for Python via .NET 提供在生成 PDF 文档时插入/创建表格的功能,您也可以在任何现有的 PDF 文档中添加表格对象。然而,您可能需要操作现有 PDF 中的表格,在这里您可以更新现有表格单元格中的内容。然而,您可能会遇到需要从现有 PDF 文档中移除表格对象的需求。
为了移除表格,我们需要使用 TableAbsorber 类来获取现有 PDF 中的表格,然后调用 remove()。
从 PDF 文档中移除表格
我们添加了新功能,即。 remove() 到现有的 TableAbsorber 类,以便从 PDF 文档中删除表格。一旦吸收器成功地在页面上找到表格,它就能够删除它们。请查看以下代码片段,了解如何从 PDF 文档中删除表格:
import aspose.pdf as ap
# 加载现有的 PDF 文档
pdf_document = ap.Document(input_file)
# 创建 TableAbsorber 对象以查找表格
absorber = ap.text.TableAbsorber()
# 用吸收器访问第一页
absorber.visit(pdf_document.pages[1])
# 获取页面上的第一个表格
table = absorber.table_list[0]
# 删除表格
absorber.remove(table)
# 保存 PDF
pdf_document.save(output_file)
从 PDF 文档中删除多个表格
有时,PDF 文档可能包含多个表格,您可能需要从中删除多个表格。 为了从PDF文档中删除多个表格,请使用以下代码片段:
import aspose.pdf as ap
# 加载现有的PDF文档
pdf_document = ap.Document(input_file)
# 创建TableAbsorber对象以查找表格
absorber = ap.text.TableAbsorber()
# 使用吸收器访问第二页
absorber.visit(pdf_document.pages[1])
# 获取表格集合的副本
tables = absorber.table_list
# 遍历集合的副本并删除表格
for table in tables:
absorber.remove(table)
# 保存文档
pdf_document.save(output_file)