تحويل PDF إلى إكسيل في بايثون

تحويل PDF إلى إكسيل في بايثون

Aspose.pdf لبيثون عبر .NET يدعم تحويل ملفات PDF إلى Excel وتنسيقات جداول البيانات الأخرى من كود Python.

استخدم هذه الصفحة عندما تحتاج إلى تحويل PDF إلى XLS أو XLSX أو CSV أو ODS لاستخراج الجدول أو إعادة استخدام التقارير أو الفرز أو التصفية أو التحليل النهائي. أثناء تحويل PDF إلى Excel، يمكن عرض صفحات PDF الفردية كأوراق عمل Excel.

يقوم المثال الأول بتحويل ملف PDF إلى تنسيق XML لجدول البيانات 2003. تعرض الأقسام اللاحقة مخرجات XLSX و XLSM و CSV و ODS ومخرجات ورقة العمل الفردية.

يعرض مقتطف الشفرة التالي عملية تحويل ملف PDF إلى تنسيق XLS أو XLSX باستخدام Aspose.PDF لـ Python عبر .NET.

الخطوات: تحويل ملف PDF إلى تنسيق Excel (جدول بيانات XML 2003)

  1. قم بتحميل وثيقة PDF.
  2. قم بإعداد خيارات حفظ Excel باستخدام خيارات الحفظ في Excel.
  3. احفظ الملف المحول.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_spread_sheet2003(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

تحويل PDF إلى XLSX في بايثون

الخطوات: تحويل ملف PDF إلى تنسيق XLSX (Excel 2007+)

  1. قم بتحميل وثيقة PDF.
  2. قم بإعداد خيارات حفظ Excel باستخدام خيارات الحفظ في Excel.
  3. احفظ الملف المحول.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

تحويل PDF إلى XLSX باستخدام التحكم في العمود

عند تحويل PDF إلى تنسيق Excel، يمكن إضافة عمود فارغ كأول عمود في ملف الإخراج. استخدم insert_blank_column_at_first خيار من ExcelSaveOptions فئة للتحكم في هذا السلوك. قيمتها الافتراضية هي true.

from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_control_column(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
    save_options.insert_blank_column_at_first = True
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

تحويل PDF إلى ورقة عمل Excel واحدة

يُظهر ملف Aspose.PDF لبيثون عبر .NET كيفية تحويل ملف PDF إلى ملف Excel (.xlsx)، مع تمكين خيار «minimize_the_number_of_workets».

الخطوات: تحويل PDF إلى ورقة عمل XLS أو XLSX الفردية في بايثون

  1. قم بتحميل وثيقة PDF.
  2. قم بإعداد خيارات حفظ Excel باستخدام خيارات الحفظ في Excel.
  3. يعمل خيار «minimize_the_number_of_workets» على تقليل عدد أوراق Excel من خلال دمج صفحات PDF في عدد أقل من أوراق العمل (على سبيل المثال، ورقة عمل واحدة للمستند بأكمله إن أمكن).
  4. احفظ الملف المحول.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_single_excel_worksheet(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
    save_options.minimize_the_number_of_worksheets = True
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

تحويل ملفات PDF إلى إكسيل 2007 بتقنية الماكرو (XLSM)

يوضح مثال Python هذا كيفية تحويل ملف PDF إلى ملف Excel بتنسيق XLSM (مصنف Excel الذي يدعم ماكرو).

from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_macro(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSM
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

قم بالتحويل إلى تنسيقات جداول بيانات أخرى

تحويل ملفات PDF إلى CSV

تقوم الدالة ‘convert_pdf_to_excel_2007_csv’ بنفس العملية السابقة، ولكن التنسيق الهدف هذه المرة هو CSV (القيم المفصولة بفواصل) بدلاً من XLSM.

الخطوات: تحويل PDF إلى CSV في بايثون

  1. قم بإنشاء مثيل لـ مستند كائن مع مستند PDF المصدر.
  2. قم بإنشاء مثيل لـ خيارات الحفظ في Excel مع خيارات الحفظ في إكسل.excelformat.csv
  3. احفظه بتنسيقCSV عن طريق الاتصال حفظ ()* الطريقة وتمريرها خيارات الحفظ في Excel.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_csv(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.CSV
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

تحويل ملفات PDF إلى ODS

الخطوات: تحويل PDF إلى ODS في بايثون

  1. قم بإنشاء مثيل لـ مستند كائن مع مستند PDF المصدر.
  2. قم بإنشاء مثيل لـ خيارات الحفظ في Excel مع خيارات الحفظ في إكسل.excelformat.ods
  3. احفظه بتنسيقODS عن طريق الاتصال حفظ () الطريقة وتمريرها خيارات الحفظ في Excel.

يتم التحويل إلى تنسيق ODS بنفس الطريقة مثل جميع التنسيقات الأخرى.

from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_ods(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.ODS
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

التحويلات ذات الصلة