تحويل PDF إلى وورد في بايثون

تعرض هذه الصفحة كيفية تحويل PDF إلى Word في Python. استخدم هذه الأمثلة عندما تحتاج إلى إخراج DOC أو DOCX قابل للتحرير من ملف PDF للمراجعة أو إعادة الاستخدام أو عمليات سير عمل المستندات المكتبية.

تحويل PDF إلى DOC في بايثون

واحدة من أكثر الميزات شيوعًا هي تحويل PDF إلى Microsoft Word DOC، مما يجعل إدارة المحتوى أسهل. Aspose.pdf لبايثون عبر .NET يسمح لك بتحويل ملفات PDF ليس فقط إلى DOC ولكن أيضًا إلى تنسيق DOCX بسهولة وكفاءة.

استخدم تحويل Word عندما تحتاج إلى مراجعة النص أو إعادة استخدام المحتوى في عمليات سير عمل المكتب أو نقل محتوى PDF إلى مستندات DOC أو DOCX القابلة للتحرير.

ال خيارات حفظ المستندات توفر الفئة العديد من الخصائص التي تعمل على تحسين عملية تحويل ملفات PDF إلى تنسيق DOC. من بين هذه الخصائص، يتيح لك الوضع تحديد وضع التعرف على محتوى PDF. يمكنك تحديد أي قيمة من تعداد RecognitionMode لهذه الخاصية. لكل من هذه القيم مزايا وقيود محددة:

الخطوات: تحويل PDF إلى DOC في بايثون

  1. قم بتحميل ملف PDF إلى كائن «AP.Document».
  2. قم بإنشاء مثيل «DocSaveOptions».
  3. قم بتعيين خاصية التنسيق إلى ‘DocFormat.DOC’ للتأكد من أن الإخراج بتنسيق.doc (تنسيق Word الأقدم).
  4. احفظ PDF كمستند Word باستخدام خيارات الحفظ المحددة.
  5. اطبع رسالة تأكيد.
from os import path
import aspose.pdf as ap
import sys

def convert_PDF_to_DOC(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.DocSaveOptions()
    save_options.format = ap.DocSaveOptions.DocFormat.DOC
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

تحويل PDF إلى DOCX في بايثون

يتيح لك Aspose.PDF لواجهة برمجة تطبيقات Python قراءة مستندات PDF وتحويلها إلى DOCX باستخدام Python عبر .NET. DOCX هو تنسيق معروف لمستندات Microsoft Word التي تم تغيير هيكلها من ثنائي عادي إلى مزيج من ملفات XML والملفات الثنائية. يمكن فتح ملفات Docx باستخدام Word 2007 والإصدارات الجانبية ولكن ليس مع الإصدارات السابقة من MS Word التي تدعم امتدادات ملفات DOC.

يعرض مقتطف شفرة Python التالي عملية تحويل ملف PDF إلى تنسيق DOCX.

الخطوات: تحويل PDF إلى DOCX في بايثون

  1. قم بتحميل ملف PDF المصدر باستخدام «AP.document».
  2. قم بإنشاء مثيل لـ «DocSaveOptions».
  3. قم بتعيين خاصية التنسيق إلى «docformat.doc_x» لإنشاء ملف.docx (تنسيق Word الحديث).
  4. احفظ PDF كملف DOCX مع خيارات الحفظ المهيأة.
  5. اطبع رسالة تأكيد بعد التحويل.
from os import path
import aspose.pdf as ap
import sys

def convert_PDF_to_DOCX(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.DocSaveOptions()
    save_options.format = ap.DocSaveOptions.DocFormat.DOC_X
    document.save(outfile, save_options)

تحويل PDF إلى DOCX باستخدام التعرف المتقدم على التخطيط

قم بتحويل مستند PDF إلى ملف DOCX (Word) باستخدام Python و Aspose.PDF مع إعدادات التعرف المتقدمة. يستخدم وضع التدفق المحسن للحفاظ على بنية المستند، مما يجعل الإخراج أكثر قابلية للتحرير وأقرب إلى التخطيط الأصلي.

from os import path
import aspose.pdf as ap
import sys

def convert_PDF_to_DOCX_advanced(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.DocSaveOptions()
    save_options.format = ap.DocSaveOptions.DocFormat.DOC_X
    save_options.mode = ap.DocSaveOptions.RecognitionMode.ENHANCED_FLOW
    document.save(outfile, save_options)

ال خيارات حفظ المستندات تحتوي الفئة على خاصية تسمى Format والتي توفر القدرة على تحديد تنسيق المستند الناتج، أي DOC أو DOCX. من أجل تحويل ملف PDF إلى صيغة DOCX، يرجى تمرير قيمة Docx من تعداد DocSaveOptions.docFormat.

التحويلات ذات الصلة