إزالة الجداول من مستندات PDF الموجودة

إزالة الجدول من وثيقة PDF

Aspose.PDF لبيثون يتيح لك إزالة جدول من PDF. يفتح ملف PDF موجودًا، ويكتشف الجدول الأول في الصفحة الأولى باستخدام TableAbsorber، يحذف هذا الجدول باستخدام remove()، ويحفظ ملف PDF المحدث إلى ملف جديد.

استخدم هذه الصفحة عندما تحتاج إلى تنظيف ملفات PDF ذات الجداول الثقيلة أو إزالة المحتوى الجدولي القديم أو تبسيط المستندات قبل إعادة التوزيع.

import aspose.pdf as ap
from os import path
import sys

def remove_one_table(infile: str, outfile: str) -> None:
    # Load existing PDF document
    document = ap.Document(infile)

    # Create TableAbsorber object to find tables
    absorber = ap.text.TableAbsorber()
    # Visit first page with absorber
    absorber.visit(document.pages[1])
    # Get first table on the page
    table = absorber.table_list[0]
    # Remove the table
    absorber.remove(table)
    # Save PDF
    document.save(outfile)

قم بإزالة جميع الجداول من وثيقة PDF

مع مكتبتنا، يمكنك إزالة جميع الجداول من صفحة معينة في PDF. يفتح الكود ملف PDF موجودًا، ويكتشف جميع الجداول في الصفحة الثانية باستخدام TableAbsorber، ويكرر الجداول المكتشفة، ويزيل كل منها، ثم يحفظ ملف PDF المعدل في ملف جديد. يكون مفيدًا عندما تحتاج إلى إزالة الجداول بشكل مجمّع من الصفحة مع ترك بقية محتوى PDF كما هو.

import aspose.pdf as ap
from os import path
import sys

def remove_all_tables(infile: str, outfile: str) -> None:
    # Load existing PDF document
    document = ap.Document(infile)

    # Create TableAbsorber object to find tables
    absorber = ap.text.TableAbsorber()
    # Visit first page with absorber
    absorber.visit(document.pages[1])
    #  Loop through the copy of collection and removing tables
    tables = list(absorber.table_list)
    for table in tables:
        absorber.remove(table)

    # Save document
    document.save(outfile)

موضوعات الجدول ذات الصلة