تحويل ملفات PDF إلى مستندات Microsoft Word في .NET

نظرة عامة

يشرح هذا المقال كيفية تحويل PDF إلى مستندات Microsoft Word باستخدام C#. يغطي المواضيع التالية.

الصيغة: DOC

الصيغة: DOCX

الصيغة: Word

يعمل الشفرة التالية أيضًا مع مكتبة Aspose.PDF.Drawing.

تحويل PDF إلى ملفات DOC و DOCX

إحدى الميزات الأكثر شعبية هي تحويل PDF إلى مستند Microsoft Word DOC، مما يجعل إدارة المحتوى أكثر سهولة. Aspose.PDF لـ .NET يتيح لك تحويل ملفات PDF إلى تنسيق DOC و DOCX بسرعة وكفاءة.

تحويل PDF إلى ملف DOC (Microsoft Word 97-2003)

قم بتحويل ملفات PDF إلى تنسيق DOC بكل سهولة وتحكم كامل. Aspose.PDF لـ .NET مرن ويدعم مجموعة واسعة من التحويلات. على سبيل المثال، تحويل صفحات من مستندات PDF إلى صور هو ميزة شائعة جدًا.

لقد طلب العديد من عملائنا تحويلًا من PDF إلى DOC: تحويل ملف PDF إلى مستند Microsoft Word. العملاء يريدون هذا لأن ملفات PDF لا يمكن تحريرها بسهولة، بينما يمكن تحرير مستندات Word. بعض الشركات تريد أن يتمكن مستخدموها من التعامل مع النصوص والجداول والصور في الملفات التي بدأت كملفات PDF.

مواصلة تقليد جعل الأمور بسيطة ومفهومة، يتيح لك Aspose.PDF لـ .NET تحويل ملف PDF مصدر إلى ملف DOC بسطرين من الكود. الحفاظ على تقليد تبسيط الأشياء وجعلها مفهومة، يتيح لك Aspose.PDF لـ .NET تحويل ملف PDF مصدر إلى ملف DOC بسطرين من الكود فقط.

الشفرة التالية بلغة C# تُظهر تحويل ملف PDF إلى صيغة DOC.

الخطوات: تحويل PDF إلى DOC في C#

  1. إنشاء مثيل من كائن Document بالمستند PDF المصدر.
  2. حفظه إلى صيغة SaveFormat.Doc بواسطة استدعاء طريقة Document.Save().
public static void ConvertPDFtoWord()
{
    // فتح مستند PDF المصدر
    Document pdfDocument = new Document(_dataDir + "PDFToDOC.pdf");
    // حفظ الملف بصيغة مستند MS
    pdfDocument.Save(_dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);

}

استخدام فئة DocSaveOptions

توفر فئة DocSaveOptions العديد من الخصائص التي تحسن من تحويل ملفات PDF إلى صيغة DOC.

فئة DocSaveOptions توفر العديد من الخصائص التي تحسن تحويل ملفات PDF إلى تنسيق DOC.

  • وضع Textbox سريع وجيد للحفاظ على المظهر الأصلي لملف PDF، ولكن قابلية تحرير الوثيقة الناتجة قد تكون محدودة. يتم تحويل كل كتلة نصية مجمعة بصرياً في PDF الأصلي إلى مربع نص في الوثيقة الناتجة. هذا يحقق أقصى تشابه مع الأصل، لذا تبدو الوثيقة الناتجة جيدة، ولكنها تتكون بالكامل من مربعات نصية، والتي قد تكون تحريرها في Microsoft Word تحديًا.
  • وضع Flow هو وضع التعرف الكامل، حيث يقوم المحرك بالتجميع والتحليل متعدد المستويات لاستعادة الوثيقة الأصلية كما قصدها المؤلف مع إنتاج وثيقة قابلة للتحرير بسهولة.
- [`Flow`](https://reference.aspose.com/pdf/net/aspose.pdf.docsaveoptions/recognitionmode) هو وضع التعرف الكامل، حيث يقوم المحرك بتجميع وتحليل متعدد المستويات لاستعادة الوثيقة الأصلية كما قصد المؤلف بينما ينتج وثيقة قابلة للتحرير بسهولة.

خاصية [`RelativeHorizontalProximity`](https://reference.aspose.com/pdf/net/aspose.pdf/docsaveoptions/properties/relativehorizontalproximity) يمكن استخدامها للتحكم في القرب النسبي بين العناصر النصية. وهذا يعني أن المسافة معيارية بحجم الخط. قد تحتوي الخطوط الأكبر على مسافات أكبر بين المقاطع ولا تزال تعتبر ككل واحد. يحدد كنسبة مئوية من حجم الخط؛ على سبيل المثال، 1 = 100%. هذا يعني أن حرفين بحجم 12 نقطة موضوعين على بعد 12 نقطة يعتبران قريبين.
- [`RecognitionBullets`](https://reference.aspose.com/pdf/net/aspose.pdf/docsaveoptions/properties/recognizebullets) يستخدم لتفعيل التعرف على الرصاصات أثناء التحويل.

```csharp
public static void ConvertPDFtoWordDocAdvanced()
{
    var pdfFile = Path.Combine(_dataDir, "PDF-to-DOC.pdf");
    var docFile = Path.Combine(_dataDir, "PDF-to-DOC.doc");
    Document pdfDocument = new Document(pdfFile);
    DocSaveOptions saveOptions = new DocSaveOptions
    {
        Format = DocSaveOptions.DocFormat.Doc,
        // تعيين وضع التعرف كـ Flow
        Mode = DocSaveOptions.RecognitionMode.Flow,
        // تعيين القرب الأفقي كـ 2.5
        RelativeHorizontalProximity = 2.5f,
        // تفعيل الخيار للتعرف على الرصاصات أثناء عملية التحويل
        RecognizeBullets = true
    };
    pdfDocument.Save(docFile, saveOptions);
}

تحويل PDF إلى ملف DOCX (Microsoft Word 2007-2021)

يتيح لك API Aspose.PDF لـ .NET قراءة وتحويل مستندات PDF إلى DOCX باستخدام C# وأي لغة .NET. DOCX هو تنسيق معروف لمستندات Microsoft Word تم تغيير هيكله من الثنائي العادي إلى مزيج من ملفات XML والثنائية. يمكن فتح ملفات Docx بواسطة Word 2007 والإصدارات الأحدث ولكن ليس بواسطة الإصدارات السابقة من MS Word، التي تدعم امتدادات ملفات DOC.

الكود التالي بلغة C# يظهر تحويل ملف PDF إلى تنسيق DOCX.

الخطوات: تحويل PDF إلى DOCX بلغة C#

  1. احفظه بتنسيق SaveFormat.DocX بواسطة استدعاء طريقة Document.Save().
public static void ConvertPDFtoWord_DOCX_Format()
{
    // فتح مستند PDF المصدر
    Document pdfDocument = new Document(_dataDir + "PDFToDOC.pdf");
    // حفظ الملف DOC الناتج
    pdfDocument.Save(_dataDir + "saveOptionsOutput_out.doc", SaveFormat.DocX);
}

تحويل PDF إلى DOCX بالوضع المحسن

للحصول على نتائج أفضل لتحويل PDF إلى DOCX، يمكنك استخدام وضع EnhancedFlow. الفرق الرئيسي بين الوضع العادي والوضع المحسن هو أن الجداول (سواء كانت مع حدود أو بدون) تتعرف كجداول حقيقية، وليس كنص مع صورة في الخلفية. هناك أيضا التعرف على القوائم المرقمة والعديد من الأمور الصغيرة الأخرى.

public static void ConvertPDFtoWord_Advanced_DOCX_Format()
{    
    // فتح مستند PDF المصدر
    Document pdfDocument = new Document(_dataDir + "PDFToDOC.pdf");

    // إنشاء كائن DocSaveOptions
    DocSaveOptions saveOptions = new DocSaveOptions
    {
        // تحديد تنسيق الإخراج كـ DOCX
        Format = DocSaveOptions.DocFormat.DocX
        // تعيين معاملات DocSaveOptions الأخرى
        Mode = DocSaveOptions.RecognitionMode.EnhancedFlow
    };
    // حفظ المستند بتنسيق docx
    pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);
}

انظر أيضا

هذا المقال يغطي أيضا هذه المواضيع. الأكواد هي نفسها كما في الأعلى.

التنسيق: Word

التنسيق: DOC

Format: DOCX