从现有 PDF 中移除表格

Aspose.PDF for Python via .NET 提供在生成 PDF 文档时插入/创建表格的功能，您也可以在任何现有的 PDF 文档中添加表格对象。然而，您可能需要操作现有 PDF 中的表格，在这里您可以更新现有表格单元格中的内容。然而，您可能会遇到需要从现有 PDF 文档中移除表格对象的需求。

为了移除表格，我们需要使用 TableAbsorber 类来获取现有 PDF 中的表格，然后调用 remove()。

从 PDF 文档中移除表格

我们添加了新功能，即。 remove() 到现有的 TableAbsorber 类，以便从 PDF 文档中删除表格。一旦吸收器成功地在页面上找到表格，它就能够删除它们。请查看以下代码片段，了解如何从 PDF 文档中删除表格：


    import aspose.pdf as ap

    # 加载现有的 PDF 文档
    pdf_document = ap.Document(input_file)
    # 创建 TableAbsorber 对象以查找表格
    absorber = ap.text.TableAbsorber()
    # 用吸收器访问第一页
    absorber.visit(pdf_document.pages[1])
    # 获取页面上的第一个表格
    table = absorber.table_list[0]
    # 删除表格
    absorber.remove(table)
    # 保存 PDF
    pdf_document.save(output_file)

从 PDF 文档中删除多个表格

有时，PDF 文档可能包含多个表格，您可能需要从中删除多个表格。为了从PDF文档中删除多个表格，请使用以下代码片段：


    import aspose.pdf as ap

    # 加载现有的PDF文档
    pdf_document = ap.Document(input_file)
    # 创建TableAbsorber对象以查找表格
    absorber = ap.text.TableAbsorber()
    # 使用吸收器访问第二页
    absorber.visit(pdf_document.pages[1])
    # 获取表格集合的副本
    tables = absorber.table_list
    # 遍历集合的副本并删除表格
    for table in tables:
        absorber.remove(table)
    # 保存文档
    pdf_document.save(output_file)

操作现有PDF中的表格