تحويل PDF إلى مستندات Microsoft Word في .NET

نظرة عامة

تشرح هذه المقالة كيفية تحويل PDF إلى مستندات Microsoft Word باستخدام C#. تغطي هذه المواضيع.

التنسيق: DOC

التنسيق: DOCX

التنسيق: Word

تعمل مقتطفات الكود التالية أيضًا مع مكتبة Aspose.PDF.Drawing.

تحويل PDF إلى DOC و DOCX

تعد ميزة تحويل PDF إلى Microsoft Word DOC واحدة من أكثر الميزات شعبية، مما يجعل إدارة المحتوى أسهل. Aspose.PDF for .NET يتيح لك تحويل ملفات PDF إلى تنسيق DOC و DOCX بسرعة وكفاءة.

تحويل PDF إلى ملف DOC (Microsoft Word 97-2003)

قم بتحويل ملفات PDF إلى تنسيق DOC بسهولة وبتحكم كامل. Aspose.PDF for .NET مرن ويدعم مجموعة واسعة من التحويلات. على سبيل المثال، يعد تحويل الصفحات من مستندات PDF إلى صور ميزة شائعة جدًا.

طلب العديد من عملائنا تحويل PDF إلى DOC: تحويل ملف PDF إلى مستند Microsoft Word. يرغب العملاء في ذلك لأن ملفات PDF لا يمكن تعديلها بسهولة، بينما يمكن تعديل مستندات Word. ترغب بعض الشركات في أن يتمكن مستخدموها من التلاعب بالنصوص والجداول والصور في الملفات التي بدأت كملفات PDF.

استمرارًا للتقليد المتمثل في جعل الأمور بسيطة ومفهومة، يتيح لك Aspose.PDF for .NET تحويل ملف PDF المصدر إلى ملف DOC في سطرين من التعليمات البرمجية. لتحقيق هذه الميزة، قدمنا تعدادًا يسمى SaveFormat وقيمته .Doc تتيح لك حفظ الملف المصدر بتنسيق Microsoft Word.

تظهر مقتطفات كود C# التالية كيفية تحويل ملف PDF إلى تنسيق DOC.

الخطوات: تحويل PDF إلى DOC في C#

  1. إنشاء مثيل من كائن Document مع مستند PDF المصدر.
  2. حفظه بتنسيق SaveFormat.Doc عن طريق استدعاء Document.Save().
// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ConvertPDFtoWord()
{
    // The path to the documents directory
    var dataDir = RunExamples.GetDataDir_AsposePdf();

    // Open PDF document
    usnig (var document = new Aspose.Pdf.Document(dataDir + "PDFToDOC.pdf"))
    {
        // Save the file into MS document format
        document.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);
    }
}

استخدام فئة DocSaveOptions

توفر فئة DocSaveOptions العديد من الخصائص التي تحسن تحويل ملفات PDF إلى تنسيق DOC. من بين هذه الخصائص، يتيح لك الوضع تحديد وضع التعرف على محتوى PDF. يمكنك اختيار أي قيمة من تعداد RecognitionMode لهذه الخاصية. كل من هذه القيم لها فوائد وقيود محددة:

  • وضع Textbox سريع وجيد للحفاظ على المظهر الأصلي لملف PDF، ولكن قابلية تعديل المستند الناتج قد تكون محدودة. يتم تحويل كل كتلة نصية مرئية في ملف PDF الأصلي إلى مربع نص في المستند الناتج. وهذا يحقق أقصى تشابه مع الأصل، لذا يبدو المستند الناتج جيدًا، لكنه يتكون بالكامل من مربعات نصية، والتي يمكن تعديلها في Microsoft Word، وهو أمر صعب للغاية.
  • Flow هو وضع التعرف الكامل، حيث يقوم المحرك بأداء التجميع والتحليل متعدد المستويات لاستعادة المستند الأصلي وفقًا لنية المؤلف مع إنتاج مستند سهل التعديل. القيود هي أن المستند الناتج قد يبدو مختلفًا عن الأصل.

يمكن استخدام خاصية RelativeHorizontalProximity للتحكم في القرب النسبي بين العناصر النصية. يعني ذلك أن المسافة يتم قياسها حسب حجم الخط. قد تحتوي الخطوط الأكبر على مسافات أكبر بين المقاطع ولا تزال تعتبر ككل واحد. يتم تحديدها كنسبة مئوية من حجم الخط؛ على سبيل المثال، 1 = 100%. وهذا يعني أن حرفين بحجم 12pt موضوعة على بعد 12 pt تعتبر قريبة.

  • يتم استخدام RecognitionBullets لتفعيل التعرف على النقاط أثناء التحويل.
// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ConvertPDFtoWordDocAdvanced()
{
    // The path to the documents directory
    var dataDir = RunExamples.GetDataDir_AsposePdf();
    
    // Open PDF document
    using (var document = new Aspose.Pdf.Document(dataDir + "PDF-to-DOC.pdf"))
    {
        var saveOptions = new Aspose.Pdf.DocSaveOptions
        {
            // Set format to save MS document
            Format = Aspose.Pdf.DocSaveOptions.DocFormat.Doc,
            // Set the recognition mode as Flow
            Mode = Aspose.Pdf.DocSaveOptions.RecognitionMode.Flow,
            // Set the Horizontal proximity as 2.5
            RelativeHorizontalProximity = 2.5f,
            // Enable the value to recognize bullets during the conversion process
            RecognizeBullets = true
        };
        // Save the file into MS document with save options
        document.Save(dataDir + "PDFtoDOC_out.doc", saveOptions);
    }
}

تحويل PDF إلى ملف DOCX (Microsoft Word 2007-2024)

تتيح لك واجهة برمجة التطبيقات Aspose.PDF for .NET قراءة وتحويل مستندات PDF إلى DOCX باستخدام C# وأي لغة .NET. DOCX هو تنسيق معروف لمستندات Microsoft Word الذي تم تغيير هيكله من ثنائي بسيط إلى مزيج من ملفات XML وملفات ثنائية. يمكن فتح ملفات Docx باستخدام Word 2007 والإصدارات الأحدث ولكن لا يمكن فتحها باستخدام الإصدارات السابقة من MS Word، التي تدعم امتدادات ملفات DOC.

تظهر مقتطفات كود C# التالية كيفية تحويل ملف PDF إلى تنسيق DOCX.

الخطوات: تحويل PDF إلى DOCX في C#

  1. إنشاء مثيل من كائن Document مع مستند PDF المصدر.
  2. حفظه بتنسيق SaveFormat.DocX عن طريق استدعاء Document.Save().
// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ConvertPDFtoWord_DOCX_Format()
{
    // The path to the documents directory
    var dataDir = RunExamples.GetDataDir_AsposePdf();
    // Open PDF document
    using (var document = new Aspose.Pdf.Document(dataDir + "PDFToDOC.pdf"))
    {
        // Save the file into MS document format
        document.Save(dataDir + "PDFtoDOC_out.docx", SaveFormat.DocX);
    }
}

تحويل PDF إلى DOCX في الوضع المحسن

للحصول على نتائج أفضل من تحويل PDF إلى DOCX، يمكنك استخدام وضع EnhancedFlow. الفرق الرئيسي بين Flow و Enhanced Flow هو أن الجداول (سواء كانت ذات حدود أو بدونها) يتم التعرف عليها كجداول حقيقية، وليس كنص مع صورة في الخلفية. هناك أيضًا التعرف على القوائم المرقمة والعديد من الأشياء الثانوية الأخرى.

// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ConvertPDFtoWord_Advanced_DOCX_Format()
{
    // The path to the documents directory
    var dataDir = RunExamples.GetDataDir_AsposePdf();
    // Open PDF document
    using (var document = new Aspose.Pdf.Document(dataDir + "PDFToDOC.pdf"))
    {
        // Instantiate DocSaveOptions object
        DocSaveOptions saveOptions = new Aspose.Pdf.DocSaveOptions
        {
            // Set format to save MS document
            Format = Aspose.Pdf.DocSaveOptions.DocFormat.DocX,
            // Set the recognition mode as EnhancedFlow
            Mode = Aspose.Pdf.DocSaveOptions.RecognitionMode.EnhancedFlow
        };

        // Save the file into MS document format
        document.Save(dataDir + "PDFToDOC_out.docx", saveOptions);
    }
}

انظر أيضًا

تغطي هذه المقالة أيضًا هذه المواضيع. الأكواد هي نفسها كما في الأعلى.

التنسيق: Word

التنسيق: DOC

التنسيق: DOCX