تحويل PDF إلى EPUB، LaTeX، نص، XPS باستخدام بايثون

تحويل PDF إلى EPUB

EPUB هو معيار مفتوح ومجاني للكتب الإلكترونية من منتدى النشر الرقمي الدولي (IDPF). الملفات لها الامتداد .epub.
تم تصميم EPUB للمحتوى القابل لإعادة التدفق، مما يعني أن قارئ EPUB يمكنه تحسين النص لجهاز عرض معين. كما يدعم EPUB المحتوى ذو التخطيط الثابت. يهدف التنسيق ليكون تنسيقًا واحدًا يمكن للناشرين وبيوت التحويل استخدامه داخليًا، وكذلك للتوزيع والبيع. يحل محل المعيار Open eBook.

يدعم Aspose.PDF for Python أيضًا إمكانية تحويل مستندات PDF إلى تنسيق EPUB. يحتوي Aspose.PDF for Python على فئة تسمى ‘EpubSaveOptions’ والتي يمكن استخدامها كالحجة الثانية لطريقة save()، لإنشاء ملف EPUB.
يرجى محاولة استخدام مقطع الشفرة التالي لتحقيق هذا المتطلب باستخدام بايثون.


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_epub.epub"
    # افتح مستند PDF
    document = ap.Document(input_pdf)

    # إنشاء خيارات حفظ EPUB
    save_options = ap.EpubSaveOptions()

    # تحديد التخطيط للمحتويات
    save_options.content_recognition_mode = ap.EpubSaveOptions.RecognitionMode.FLOW

    # احفظ مستند ePUB
    document.save(output_pdf, save_options)

تحويل PDF إلى LaTeX/TeX

Aspose.PDF for Python عبر .NET يدعم تحويل PDF إلى LaTeX/TeX. تنسيق ملف LaTeX هو تنسيق ملف نصي مع ترميز خاص ويُستخدم في نظام إعداد الوثائق المستند إلى TeX لتنسيق عالي الجودة.

لتحويل ملفات PDF إلى TeX، يحتوي Aspose.PDF على الفئة LaTeXSaveOptions التي توفر الخاصية OutDirectoryPath لحفظ الصور المؤقتة أثناء عملية التحويل.

يوضح الجزء التالي من الكود عملية تحويل ملفات PDF إلى تنسيق TEX باستخدام Python.


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_tex.tex"
    # فتح مستند PDF
    document = ap.Document(input_pdf)
    # إنشاء كائن من LaTeXSaveOptions
    saveOptions = ap.LaTeXSaveOptions()
    document.save(output_pdf, saveOptions)

تحويل PDF إلى نص

Aspose.PDF for Python يدعم تحويل مستند PDF بالكامل وصفحة واحدة إلى ملف نصي.

تحويل مستند PDF إلى ملف نص

يمكنك تحويل مستند PDF إلى ملف TXT باستخدام فئة ‘TextDevice’.

يوضح مقتطف الشيفرة التالي كيفية استخراج النصوص من كل الصفحات.


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf =  DIR_OUTPUT + "convert_pdf_to_txt.txt"
    # فتح مستند PDF
    document = ap.Document(input_pdf)

    # إنشاء جهاز نصي
    textDevice = ap.devices.TextDevice()

    # تحويل صفحة معينة وحفظها
    textDevice.process(document.pages[1], output_pdf)

حاول تحويل PDF إلى نص عبر الإنترنت

تحويل PDF إلى XPS

يوفر Aspose.PDF لـ Python إمكانية تحويل ملفات PDF إلى تنسيق XPS. دعنا نحاول استخدام مقتطف الشفرة المقدم لتحويل ملفات PDF إلى تنسيق XPS باستخدام Python.

نوع ملف XPS مرتبط بشكل أساسي بمواصفات ورق XML من قبل شركة Microsoft Corporation. مواصفات ورق XML (XPS)، التي كانت تحمل الاسم الرمزي Metro سابقًا وتشمل مفهوم التسويق Next Generation Print Path (NGPP)، هي مبادرة من Microsoft لدمج إنشاء المستندات وعرضها في نظام التشغيل Windows.

لتحويل ملفات PDF إلى XPS، يتوافر في Aspose.PDF الفئة XpsSaveOptions التي تُستخدم كحجة ثانية لطريقة save() لتوليد ملف XPS.

يظهر مقطع الشيفرة التالي عملية تحويل ملف PDF إلى تنسيق XPS.


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_xps.xps"
    # فتح مستند PDF
    document = ap.Document(input_pdf)

    # إنشاء خيارات الحفظ لـ XPS
    save_options = ap.XpsSaveOptions()

    # حفظ مستند XPS
    document.save(output_pdf, save_options)

تحويل PDF إلى XML

XML هي لغة ترميز وصيغة ملف لتخزين ونقل وإعادة بناء البيانات العشوائية.

يدعم Aspose.PDF لـ Python أيضًا ميزة تحويل مستندات PDF إلى صيغة XML. يحتوي Aspose.PDF لـ Python على فئة تُسمى ‘XmlSaveOptions’ والتي يمكن استخدامها كوسيط ثاني لطريقة save()، لإنشاء ملف XML. يرجى محاولة استخدام الجزء التالي من الشيفرة البرمجية لتحقيق هذا المتطلب باستخدام Python.


    import aspose.pdf as ap

    def convert_pdf_to_xml(self, infile, outfile):
        path_infile = self.dataDir + infile
        path_outfile = self.dataDir + outfile

        # فتح مستند PDF

        document = ap.Document(path_infile)

        # إنشاء خيارات حفظ XML
        save_options = ap.XmlSaveOptions()

        # حفظ مستند XML
        document.save(path_outfile, save_options)
        print(infile + " تم تحويله إلى " + outfile)