تحويل مستند إلى HTML أو MHTML أو EPUB

تحظى المستندات بتنسيقات تخطيط التدفق HTML وMHTML أيضًا بشعبية كبيرة ويمكن استخدامها على أي منصة ويب. لهذا السبب، يعد تحويل المستندات إلى HTML وMHTML ميزة مهمة في Aspose.Words.

EPUB (اختصار لـ “Electronic Publication”) هو تنسيق يعتمد على HTML يُستخدم بشكل شائع لتوزيع الكتب الإلكترونية. هذا التنسيق مدعوم بالكامل في Aspose.Words لتصدير الكتب الإلكترونية المتوافقة مع معظم أجهزة القراءة.

تحويل مستند

للتحويل البسيط إلى HTML أو MHTML أو EPUB، يتم استخدام أحد التحميلات الزائدة لأسلوب Save. يمكنك حفظ المستند في ملف أو دفق وتعيين تنسيق حفظ مستند الإخراج بشكل صريح أو تعريفه من ملحق اسم الملف.

يوضح المثال التالي كيفية تحويل DOCX إلى HTML مع تحديد تنسيق الحفظ:

.NET

// Load the document from disk.
Document doc = new Document(dataDir + "Test File.docx");

// Save the document into HTML.
doc.Save(dataDir + "Document", SaveFormat.Html);

لتحويل مستند إلى MHTML أو EPUB، استخدم SaveFormat.Mhtml أو SaveFormat.Epub على التوالي.

تحويل مستند يحتوي على معلومات ذهابًا وإيابًا

لا يدعم تنسيق HTML العديد من ميزات Microsoft Word، وإذا أردنا استعادة نموذج مستند أقرب إلى النموذج الأصلي قدر الإمكان، فسنحتاج إلى حفظ بعض المعلومات الإضافية داخل ملف HTML. وتسمى هذه المعلومات أيضًا “معلومات الرحلة ذهابًا وإيابًا”. ولهذا الغرض، يوفر Aspose.Words إمكانية تصدير معلومات ذهابًا وإيابًا عند الحفظ في HTML أو MHTML أو EPUB باستخدام خاصية ExportRoundtripInformation. يتيح حفظ معلومات الرحلة ذهابًا وإيابًا استعادة خصائص المستند مثل علامات التبويب والتعليقات والرؤوس والتذييلات أثناء تحميل مستندات التنسيقات المدرجة مرة أخرى في كائن Document.

القيمة الافتراضية هي true لـ HTML وfalse لـ MHTML وEPUB:

  • عند true، يتم تصدير معلومات الرحلة ذهابًا وإيابًا كـ - aw - * خصائص CSS لعناصر HTML المقابلة
  • عند استخدام false، لا توجد معلومات ذهابًا وإيابًا ليتم إخراجها إلى الملفات المنتجة

يوضح مثال التعليمات البرمجية التالي كيفية تصدير معلومات ذهابًا وإيابًا عند تحويل مستند من DOCX إلى HTML:

حدد خيارات الحفظ عند التحويل إلى HTML

يسمح Aspose.Words بتحويل مستند Word إلى HTML باستخدام خيارات الحفظ الافتراضية أو المخصصة. فيما يلي بعض الأمثلة على خيارات الحفظ المخصصة.

حدد مجلدًا لحفظ الموارد

باستخدام Aspose.Words، يمكننا تحديد مجلد فعلي حيث يتم حفظ جميع الموارد، مثل الصور والخطوط وCSS الخارجية، عند تحويل المستند إلى HTML. بشكل افتراضي، هذه سلسلة فارغة.

يعد تحديد خاصية ResourceFolder هو أبسط طريقة لتعيين المجلد الذي يجب كتابة جميع الموارد فيه. يمكننا استخدام خصائص فردية، مثل FontsFolder الذي يحفظ الخطوط في المجلد المحدد وImagesFolder الذي يحفظ الصور في مجلد محدد. عند تحديد مسار نسبي، يشير FontsFolder وImagesFolder إلى المجلد الذي يوجد به تجميع التعليمات البرمجية، ويشير ResourceFolder وCssStyleSheetFileName إلى مجلد الإخراج حيث يوجد مستند HTML.

في هذا المثال، يحدد ResourceFolder المسار النسبي. يشير هذا المسار إلى مجلد الإخراج حيث يتم حفظ مستند HTML. يتم استخدام قيمة خاصية ResourceFolderAlias لإنشاء عناوين URL لجميع الموارد.

يوضح مثال التعليمات البرمجية التالي كيفية العمل مع هذه الخصائص:

باستخدام خاصية ResourceFolderAlias، يمكننا أيضًا تحديد اسم المجلد المستخدم لإنشاء عناوين URI لجميع الموارد المكتوبة في مستند HTML. هذه هي أبسط طريقة لتحديد كيفية إنشاء معرفات URI لجميع ملفات الموارد. يمكن تحديد نفس المعلومات للصور والخطوط بشكل منفصل عبر خصائص ImagesFolderAlias وFontsFolderAlias، على التوالي.

ومع ذلك، لا توجد خاصية فردية لـ CSS. لم يتم تغيير سلوك خصائص FontsFolder وFontsFolderAlias وImagesFolder وImagesFolderAlias وCssStyleSheetFileName. لاحظ أن خاصية CssStyleSheetFileName تُستخدم لتحديد اسم المجلد واسم الملف.

  • يتمتع ResourceFolder بأولوية أقل من المجلدات المحددة عبر FontsFolder وImagesFolder وCssStyleSheetFileName. إذا كان المجلد المحدد في ResourceFolder غير موجود، فسيتم إنشاؤه تلقائيًا.
  • يتمتع ResourceFolderAlias بأولوية أقل من FontsFolderAlias وImagesFolderAlias. إذا كان ResourceFolderAlias فارغًا، فسيتم استخدام قيمة خاصية ResourceFolder لإنشاء معرفات URI للمورد. إذا تم تعيين ResourceFolderAlias على “.” (نقطة)، ستحتوي معرفات الموارد المنتظمة (URI) للمورد فقط على أسماء الملفات دون تحديد مسار.

تصدير موارد خطوط الترميز Base64

يوفر Aspose.Words القدرة على تحديد ما إذا كان يجب تضمين موارد الخطوط في HTML في ترميزات Base64. ولتنفيذ ذلك، استخدم خاصية ExportFontsAsBase64 - وهي امتداد لخاصية ExportFontResources. بشكل افتراضي، قيمته هي false، ويتم كتابة الخطوط في ملفات منفصلة. ولكن إذا تم تعيين هذا الخيار على true، فسيتم تضمين الخطوط في ملف CSS الخاص بالمستند بتشفير Base64. تؤثر خاصية تصدير الخطوط AsBase64 على تنسيق HTML فقط ولا تؤثر على EPUB وMHTML.

يوضح مثال التعليمات البرمجية التالي كيفية تصدير الخطوط المشفرة بـ Base64 إلى HTML:

حدد خيارات الحفظ عند التحويل إلى EPUB

يسمح Aspose.Words بتحويل مستند Word إلى تنسيق EPUB باستخدام خيارات الحفظ الافتراضية أو المخصصة. يمكنك تحديد عدد من الخيارات عن طريق تمرير مثيل HtmlSaveOptions إلى أسلوب Save.

يوضح مثال التعليمات البرمجية التالي كيفية تحويل مستند Word إلى EPUB مع تحديد بعض خيارات الحفظ المخصصة:

أنظر أيضا