从现有 PDF 中移除表格

为了移除表格,我们需要使用 TableAbsorber 类来获取现有 PDF 中的表格,然后调用 remove()

从 PDF 文档中移除表格

我们添加了新功能,即。 remove() 到现有的 TableAbsorber 类,以便从 PDF 文档中删除表格。一旦吸收器成功地在页面上找到表格,它就能够删除它们。请查看以下代码片段,了解如何从 PDF 文档中删除表格:


    import aspose.pdf as ap

    # 加载现有的 PDF 文档
    pdf_document = ap.Document(input_file)
    # 创建 TableAbsorber 对象以查找表格
    absorber = ap.text.TableAbsorber()
    # 用吸收器访问第一页
    absorber.visit(pdf_document.pages[1])
    # 获取页面上的第一个表格
    table = absorber.table_list[0]
    # 删除表格
    absorber.remove(table)
    # 保存 PDF
    pdf_document.save(output_file)

从 PDF 文档中删除多个表格

有时,PDF 文档可能包含多个表格,您可能需要从中删除多个表格。 为了从PDF文档中删除多个表格,请使用以下代码片段:


    import aspose.pdf as ap

    # 加载现有的PDF文档
    pdf_document = ap.Document(input_file)
    # 创建TableAbsorber对象以查找表格
    absorber = ap.text.TableAbsorber()
    # 使用吸收器访问第二页
    absorber.visit(pdf_document.pages[1])
    # 获取表格集合的副本
    tables = absorber.table_list
    # 遍历集合的副本并删除表格
    for table in tables:
        absorber.remove(table)
    # 保存文档
    pdf_document.save(output_file)