استخراج صفحات PDF في بايثون

استخراج صفحة واحدة من PDF

قم باستخراج صفحة معينة من وثيقة PDF وحفظها كملف جديد. باستخدام مكتبة Aspose.PDF، يقوم البرنامج النصي بنسخ الصفحة المطلوبة إلى PDF جديد، مع ترك المستند الأصلي بدون تغيير. هذا مفيد لتقسيم ملفات PDF أو عزل الصفحات المهمة للتوزيع.

  1. قم بتحميل ملف PDF المصدر باستخدام Document API (ap.Document()).
  2. قم بإنشاء ملف جديد Document للاحتفاظ بالصفحة المستخرجة.
  3. أضف المطلوب Page من المستند المصدر إلى PDF الجديد باستخدام مستند الوجهة PageCollection (dst_document.pages.add(...)).
    • في هذا المثال، يتم استخراج الصفحة 2 (الفهرسة المستندة إلى 1).
  4. احفظ الجديد Document مع الصفحة المستخرجة إلى ملف الإخراج المحدد.
import aspose.pdf as ap

def extract_page(input_file_name: str, output_file_name: str) -> None:
    src_document = ap.Document(input_file_name)
    dst_document = ap.Document()
    dst_document.pages.add(src_document.pages[2])
    dst_document.save(output_file_name)

استخراج صفحات متعددة من PDF

استخرج عدة صفحات محددة من وثيقة PDF واحفظها في ملف جديد. باستخدام مكتبة Aspose.PDF، يتم نسخ الصفحات المحددة إلى PDF جديد مع ترك المستند الأصلي كما هو. هذا مفيد لإنشاء ملفات PDF أصغر تحتوي فقط على الأقسام ذات الصلة من مستند أكبر.

  1. قم بتحميل ملف PDF المصدر باستخدام Document API (ap.Document()).
  2. قم بإنشاء ملف جديد Document للاحتفاظ بالصفحات المستخرجة.
  3. حدد الصفحات لاستخراجها (في هذا المثال، الصفحتان 2 و 3 باستخدام الفهرسة المستندة إلى 1).
  4. إضافة كل اختيار Page من المستند المصدر إلى ملف PDF الجديد باستخدام PageCollection.
  5. احفظ الجديد Document مع الصفحات المستخرجة إلى ملف الإخراج المحدد.
import aspose.pdf as ap

def extract_multiple_pages(input_file_name: str, output_file_name: str) -> None:
    document = ap.Document(input_file_name)
    pages = [2, 3]
    another_document = ap.Document()
    for page_index in pages:
        another_document.pages.add(document.pages[page_index])
    another_document.save(output_file_name)

موضوعات الصفحة ذات الصلة