تحويل PDF إلى Excel في Python

تحويل PDF إلى Excel في Python

Aspose.PDF for Python via .NET يدعم تحويل ملفات PDF إلى Excel وغيرها من صيغ جداول البيانات من خلال كود Python.

استخدم هذه الصفحة عندما تحتاج إلى تحويل ملف PDF إلى XLS أو XLSX أو CSV أو ODS لاستخراج الجداول، وإعادة استخدام التقارير، والترتيب، والتصفية، أو التحليل اللاحق. أثناء تحويل PDF إلى Excel، يمكن تحويل صفحات PDF الفردية إلى أوراق عمل Excel.

المثال الأول يحول ملف PDF إلى تنسيق XML لبرنامج Spreadsheet 2003. توضح الأقسام اللاحقة صيغ XLSX و XLSM و CSV و ODS وإخراج ورقة عمل واحدة.

تُظهر القطعة البرمجية التالية العملية لتحويل ملف PDF إلى تنسيق XLS أو XLSX باستخدام Aspose.PDF for Python via .NET.

الخطوات: تحويل ملف PDF إلى تنسيق Excel (XML Spreadsheet 2003)

  1. قم بتحميل مستند PDF.
  2. إعداد خيارات حفظ Excel باستخدام خيارات حفظ Excel.
  3. احفظ الملف المحول.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_spread_sheet2003(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

تحويل PDF إلى XLSX باستخدام بايثون

الخطوات: تحويل ملف PDF إلى تنسيق XLSX (Excel 2007+)

  1. قم بتحميل مستند PDF.
  2. إعداد خيارات حفظ Excel باستخدام خيارات حفظ Excel.
  3. احفظ الملف المحول.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

تحويل PDF إلى XLSX مع التحكم في الأعمدة

عند تحويل ملف PDF إلى تنسيق Excel، يمكن إضافة عمود فارغ كأول عمود في ملف الإخراج. استخدم insert_blank_column_at_first خيار الـ ExcelSaveOptions فئة للتحكم في هذا السلوك. القيمة الافتراضية لها هي true.

from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_control_column(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
    save_options.insert_blank_column_at_first = True
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

تحويل PDF إلى ورقة عمل Excel واحدة

يوضح Aspose.PDF for Python via .NET كيفية تحويل ملف PDF إلى ملف Excel (.xlsx) مع تمكين خيار ‘minimize_the_number_of_worksheets’.

الخطوات: تحويل PDF إلى XLS أو XLSX ورقة عمل واحدة في Python

  1. قم بتحميل مستند PDF.
  2. إعداد خيارات حفظ Excel باستخدام خيارات حفظ Excel.
  3. الخيار ‘minimize_the_number_of_worksheets’ يقلل عدد أوراق Excel عن طريق دمج صفحات PDF في أوراق عمل أقل (مثلاً، ورقة عمل واحدة للوثيقة بأكملها إذا كان ذلك ممكنًا).
  4. احفظ الملف المحول.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_single_excel_worksheet(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
    save_options.minimize_the_number_of_worksheets = True
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

تحويل PDF إلى Excel 2007 مع تمكين الماكرو (XLSM)

يعرض مثال بايثون هذا كيفية تحويل ملف PDF إلى ملف Excel بصيغة XLSM (مصنف Excel مع تمكين الماكرو).

from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_macro(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSM
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

تحويل إلى صيغ جداول بيانات أخرى

تحويل PDF إلى CSV

تقوم الدالة ‘convert_pdf_to_excel_2007_csv’ بأداء نفس العملية كما من قبل، ولكن هذه المرة يكون تنسيق الهدف هو CSV (القيم المفصولة بفواصل) بدلاً من XLSM.

الخطوات: تحويل PDF إلى CSV في Python

  1. إنشاء نسخة من مستند كائن مع مستند PDF المصدر.
  2. إنشاء نسخة من خيارات حفظ Excel مع ExcelSaveOptions.ExcelFormat.CSV
  3. احفظه بتنسيق CSV عن طريق الاستدعاء save()* الطريقة وتمريرها خيارات حفظ Excel.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_csv(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.CSV
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

تحويل PDF إلى ODS

الخطوات: تحويل PDF إلى ODS في Python

  1. إنشاء نسخة من مستند كائن مع مستند PDF المصدر.
  2. إنشاء نسخة من خيارات حفظ Excel مع ExcelSaveOptions.ExcelFormat.ODS
  3. احفظه إلى تنسيق ODS عن طريق الاستدعاء save() طريقة وتمريرها خيارات حفظ Excel.

يتم التحويل إلى تنسيق ODS بنفس الطريقة التي يتم بها التحويل إلى جميع الصيغ الأخرى.

from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_ods(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.ODS
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

التحويلات ذات الصلة