تحويل ملفات PDF إلى مستندات Microsoft Word باستخدام بايثون

نظرة عامة

تشرح هذه المقالة كيفية تحويل PDF إلى مستندات Microsoft Word باستخدام بايثون. وهي تغطي هذه المواضيع.

تنسيق: DOC

تنسيق: DOCX

تنسيق: Word

تحويل PDF إلى DOC و DOCX باستخدام Python

من أكثر الميزات شهرة هي تحويل PDF إلى Microsoft Word DOC، مما يجعل إدارة المحتوى أسهل. Aspose.PDF for Python يتيح لك تحويل ملفات PDF ليس فقط إلى DOC بل أيضًا إلى تنسيق DOCX بسهولة وكفاءة.

تحويل ملف PDF إلى DOC (Word 97-2003)

قم بتحويل ملف PDF إلى تنسيق DOC بسهولة وتحكم كامل. Aspose.PDF for Python مرن ويدعم مجموعة واسعة من التحويلات. تحويل الصفحات من مستندات PDF إلى صور، على سبيل المثال، هو ميزة شائعة جدًا.

تحويل طلبه العديد من عملائنا هو PDF إلى DOC: تحويل ملف PDF إلى مستند Microsoft Word. العملاء يرغبون في ذلك لأن ملفات PDF لا يمكن تحريرها بسهولة، بينما يمكن تحرير مستندات Word. بعض الشركات ترغب في أن يتمكن مستخدموها من التعامل مع النصوص والجداول والصور في ملفات بدأت بصيغة PDF.

مع الحفاظ على تقليد جعل الأمور بسيطة ومفهومة، يتيح لك Aspose.PDF for Python تحويل ملف PDF المصدر إلى ملف DOC بسطرين من التعليمات البرمجية. لإتمام هذه الميزة، قمنا بإدخال تعداد يسمى SaveFormat وقيمته .Doc تتيح لك حفظ الملف المصدر بتنسيق Microsoft Word.

يُظهر مقتطف الكود البايثون التالي عملية تحويل ملف PDF إلى تنسيق DOC.

الخطوات: تحويل PDF إلى DOC في بايثون

  1. قم بإنشاء مثيل لكائن Document مع مستند PDF المصدر.
  2. احفظه بتنسيق SaveFormat عن طريق استدعاء طريقة save().

    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_doc.doc"
    # افتح مستند PDF
    document = ap.Document(input_pdf)
    # احفظ الملف بتنسيق مستند MS Word
    document.save(output_pdf, ap.SaveFormat.DOC)

استخدام فئة DocSaveOptions

توفر فئة DocSaveOptions العديد من الخصائص التي تحسن عملية تحويل ملفات PDF إلى تنسيق DOC. بين هذه الخصائص، تُمكنك وضعية Mode من تحديد وضع التعرف على محتوى PDF. يمكنك تحديد أي قيمة من تعداد RecognitionMode لهذه الخاصية. لكل واحدة من هذه القيم فوائد وقيود محددة:


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_doc_with_options.doc"
    # افتح مستند PDF
    document = ap.Document(input_pdf)

    save_options = ap.DocSaveOptions()
    save_options.format = ap.DocSaveOptions.DocFormat.DOC
    # قم بتعيين وضع التعرف كـ Flow
    save_options.mode = ap.DocSaveOptions.RecognitionMode.FLOW
    # قم بتعيين القرب الأفقي كـ 2.5
    save_options.relative_horizontal_proximity = 2.5
    # قم بتمكين القيمة للتعرف على النقاط أثناء عملية التحويل
    save_options.recognize_bullets = True

    # حفظ الملف بصيغة مستند MS Word
    document.save(output_pdf, save_options)

تحويل PDF إلى DOCX

تتيح لك Aspose.PDF لـ Python API قراءة وتحويل مستندات PDF إلى DOCX باستخدام Python عبر .NET. DOCX هو تنسيق معروف لمستندات Microsoft Word الذي تم تغيير هيكله من ثنائي عادي إلى مزيج من ملفات XML وثنائية. يمكن فتح ملفات Docx باستخدام Word 2007 والإصدارات الأحدث ولكن ليس مع الإصدارات السابقة من MS Word التي تدعم امتدادات ملفات DOC.

يوضح مقطع الكود التالي في Python عملية تحويل ملف PDF إلى تنسيق DOCX.

الخطوات: تحويل PDF إلى DOCX في Python

  1. قم بإنشاء مثيل لكائن Document مع مستند PDF المصدر.

  2. احفظه بصيغة SaveFormat عن طريق استدعاء طريقة save().


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_docx_options.docx"
    # افتح مستند PDF
    document = ap.Document(input_pdf)

    save_options = ap.DocSaveOptions()
    save_options.format = ap.DocSaveOptions.DocFormat.DOC_X
    # عيّن وضع التعرف كـ Flow
    save_options.mode = ap.DocSaveOptions.RecognitionMode.FLOW
    # عيّن القرب الأفقي كـ 2.5
    save_options.relative_horizontal_proximity = 2.5
    # تمكين القيمة للتعرف على النقاط أثناء عملية التحويل
    save_options.recognize_bullets = True

    # احفظ الملف بصيغة مستند MS Word
    document.save(output_pdf, save_options)

تحتوي فئة DocSaveOptions على خاصية تسمى Format والتي توفر القدرة على تحديد صيغة المستند الناتج، أي DOC أو DOCX. من أجل تحويل ملف PDF إلى تنسيق DOCX، يرجى تمرير قيمة Docx من تعداد DocSaveOptions.DocFormat.

انظر أيضًا

تغطي هذه المقالة أيضًا هذه المواضيع. الأكواد هي نفسها كما هو مذكور أعلاه.

التنسيق: Word

Format: DOCX