قم بتحويل ملفات PDF إلى EPUB والنص وXPS والمزيد في بايثون

تحويل ملفات PDF إلى EPUB

النشر الإلكتروني هو معيار الكتاب الإلكتروني المجاني والمفتوح من المنتدى الدولي للنشر الرقمي (IDPF). تحتوي الملفات على الامتداد.epub. تم تصميم EPUB للمحتوى القابل لإعادة التدفق، مما يعني أن قارئ EPUB يمكنه تحسين النص لجهاز عرض معين. يدعم EPUB أيضًا محتوى التخطيط الثابت. الغرض من التنسيق هو التنسيق الوحيد الذي يمكن للناشرين وبيوت التحويل استخدامه داخليًا، وكذلك للتوزيع والبيع. إنه يحل محل معيار الكتاب الإلكتروني المفتوح.

يدعم Aspose.PDF لـ Python أيضًا ميزة تحويل مستندات PDF إلى تنسيق EPUB. يحتوي Aspose.PDF لبيثون على فئة تسمى «ePubSaveOptions» والتي يمكن استخدامها كوسيطة ثانية لـ حفظ المستند () الطريقة، لإنشاء ملف EPUB. يرجى محاولة استخدام مقتطف الشفرة التالي لإنجاز هذا المطلب باستخدام Python.

import aspose.pdf as ap
from os import path
import sys

def convert_PDF_to_EPUB(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.EpubSaveOptions()
    save_options.content_recognition_mode = ap.EpubSaveOptions.RecognitionMode.FLOW
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

التحويلات ذات الصلة

تحويل PDF إلى لاتكس/تكس

Aspose.pdf لبيثون عبر .NET يدعم تحويل PDF إلى لاتكس/تكس. تنسيق ملف LaTeX هو تنسيق ملف نصي بترميز خاص ويستخدم في نظام إعداد المستندات المستند إلى TEX لتنضيد عالي الجودة.

لتحويل ملفات PDF إلى TeX، يحتوي Aspose.PDF على الفصل خيارات حفظ اللاتكس الذي يوفر الخاصية outDirectoryPath لحفظ الصور المؤقتة أثناء عملية التحويل.

يعرض مقتطف الشفرة التالي عملية تحويل ملفات PDF إلى تنسيق TEX باستخدام Python.

import aspose.pdf as ap
from os import path
import sys

def convert_PDF_to_TeX(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.LaTeXSaveOptions()
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

تحويل PDF إلى نص

Aspose.pdf لـ Python يدعم تحويل مستند PDF بالكامل وصفحة واحدة إلى ملف نصي. يمكنك تحويل مستند PDF إلى ملف TXT باستخدام فئة «TextDevice». يشرح مقتطف الشفرة التالي كيفية استخراج النصوص من جميع الصفحات.

import aspose.pdf as ap
from os import path
import sys

def convert_PDF_to_TXT(infile, outfile):
    document = ap.Document(infile)
    device = ap.devices.TextDevice()
    device.process(document.pages[1], outfile)

    print(infile + " converted into " + outfile)

تحويل ملفات PDF إلى XPS

aspose.pdf لبيثون يتيح إمكانية تحويل ملفات PDF إلى صيغة XPS. دعنا نحاول استخدام مقتطف الشفرة المقدم لتحويل ملفات PDF إلى تنسيق XPS باستخدام Python.

يرتبط نوع ملف XPS بشكل أساسي بمواصفات ورق XML من قبل شركة Microsoft Corporation. تعد مواصفات ورق XML (XPS)، التي كانت تُعرف سابقًا باسم Metro والتي تضم مفهوم تسويق مسار الطباعة من الجيل التالي (NGPP)، مبادرة Microsoft لدمج إنشاء المستندات وعرضها في نظام تشغيل Windows.

لتحويل ملفات PDF إلى XPS، يحتوي Aspose.PDF على الفئة خيارات الحفظ في XPS يتم استخدامها كحجة ثانية لـ حفظ المستند () طريقة لإنشاء ملف XPS.

يعرض مقتطف الشفرة التالي عملية تحويل ملف PDF إلى تنسيق XPS.

import aspose.pdf as ap
from os import path
import sys

def convert_PDF_to_XPS(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.XpsSaveOptions()
    save_options.use_new_imaging_engine = True
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

تحويل ملفات PDF إلى MD

يحتوي Aspose.PDF على فئة «MarkdownSaveOptions ()»، والتي تقوم بتحويل مستند PDF إلى تنسيق Markdown (MD) مع الحفاظ على الصور والموارد.

  1. قم بتحميل ملف PDF المصدر باستخدام «AP.document».
  2. قم بإنشاء مثيل لـ «خيارات MarkdownSaveOptions».
  3. قم بتعيين «resources_directory_name» إلى «الصور» - سيتم تخزين الصور المستخرجة في هذا المجلد.
  4. احفظ مستند Markdown المحول باستخدام الخيارات التي تم تكوينها.
  5. اطبع رسالة تأكيد بعد التحويل.
import aspose.pdf as ap
from os import path
import sys

def convert_PDF_to_MD(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.MarkdownSaveOptions()
    save_options.resources_directory_name = "images"
    save_options.use_image_html_tag = True
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

ملف Markdown يحتوي على نص وصور مرتبطة مخزنة في مجلد الصور المحدد.

تحويل ملفات PDF إلى موبيكسمل

تقوم هذه الطريقة بتحويل مستند PDF إلى تنسيق MOBI (MobiXML)، والذي يشيع استخدامه للكتب الإلكترونية على أجهزة Kindle.

  1. قم بتحميل مستند PDF المصدر باستخدام «AP.document».
  2. احفظ المستند بالتنسيق «AP.SaveFormat.mobi_XML».
  3. اطبع رسالة تأكيد بمجرد اكتمال التحويل.
import aspose.pdf as ap
from os import path
import sys

def convert_PDF_to_MobiXML(infile, outfile):
    document = ap.Document(infile)
    document.save(outfile, ap.SaveFormat.MOBI_XML)

    print(infile + " converted into " + outfile)