Перетворіть документ на HTML, MHTML або EPUB

Документи у форматах flow-layout HTML та MHTML також дуже популярні і можуть використовуватися на будь-якій веб-платформі. З цієї причини перетворення документів у HTML та MHTML є важливою функцією Aspose.Words.

EPUB (скорочення від “електронна Публікація”) - це формат, заснований на HTML, який зазвичай використовується для розповсюдження електронних книг. Цей формат повністю підтримується в Aspose.Words для експорту електронних книг, сумісних з більшістю пристроїв для читання.

Перетворення документа

Для простого перетворення в HTML, MHTML або EPUB використовується одна з перевантажень методу Save. Ви можете зберегти документ у файл або потік і явно встановити формат збереження вихідного документа або визначити його з розширення імені файлу.

Наступний приклад показує, як перетворити DOCX на HTML із зазначенням формату збереження:

Щоб перетворити документ на MHTML або EPUB, Використовуйте SaveFormat.Mhtml або SaveFormat.Epub відповідно.

Перетворення документа з інформацією про повернення в обидва кінці

Формат HTML не підтримує багато функцій Microsoft Word, і якщо нам потрібно відновити модель документа, максимально наближену до оригіналу, нам потрібно зберегти деяку додаткову інформацію у файлі HTML. Така інформація також називається “інформація про повернення”. Для цієї мети Aspose.Words надає можливість експортувати інформацію про поїздку в обидва кінці при збереженні в HTML, MHTML або EPUB, використовуючи властивість ExportRoundtripInformation. Збереження зворотної інформації дозволяє відновити властивості документа, такі як вкладки, коментарі, верхні і нижні колонтитули, при завантаженні документів перерахованих форматів назад в об’єкт Document.

Значення за замовчуванням - true для HTML та false для MHTML та EPUB:

  • При значенні true інформація про маршрут в обидва кінці експортується у вигляді - aw - * CSS властивостей відповідних елементів HTML
  • При значенні false немає інформації про повернення в обидва кінці, яка повинна бути виведена в створені файли

Наступний приклад коду показує, як експортувати інформацію про доставку в обидва кінці під час перетворення документа з DOCX на HTML:

Вкажіть параметри збереження при перетворенні в HTML

Aspose.Words дозволяє перетворити документ з Word на HTML, використовуючи стандартні або спеціальні параметри збереження. Нижче описано кілька прикладів користувацьких параметрів збереження.

Вкажіть папку для збереження ресурсів

Використовуючи Aspose.Words, ми можемо вказати фізичну папку, в яку зберігаються всі ресурси, такі як зображення, шрифти та зовнішні CSS, при перетворенні документа в HTML. За замовчуванням це порожній рядок.

Вказівка властивості ResourceFolder - це найпростіший спосіб вказати папку, в яку повинні бути записані всі ресурси. Ми можемо використовувати окремі властивості, такі як FontsFolder, які зберігають шрифти у вказаній папці, та ImagesFolder, які зберігають зображення у вказаній папці. Коли вказано відносний шлях, FontsFolder і ImagesFolder вказують на папку, в якій знаходиться збірка коду, ResourceFolder і CssStyleSheetFileName вказують на вихідну папку, в якій знаходиться документ HTML.

У цьому прикладі ResourceFolder вказує відносний шлях. Цей шлях відноситься до вихідної папки, в якій збережено документ HTML. Значення властивості ResourceFolderAlias використовується для створення URLs для всіх ресурсів.

Наступний приклад коду показує, як працювати з цими властивостями:

Використовуючи властивість ResourceFolderAlias, ми також можемо вказати назву папки, яка використовується для створення URIs усіх ресурсів, записаних у документ HTML. Це найпростіший спосіб вказати, як URIs слід генерувати для всіх файлів ресурсів. Та ж інформація може бути вказана для зображень і шрифтів окремо через властивості ImagesFolderAlias і FontsFolderAlias відповідно.

Однак для CSS немає окремої властивості. Поведінка властивостей FontsFolder, FontsFolderAlias, ImagesFolder, ImagesFolderAlias і CssStyleSheetFileName не змінено. Зверніть увагу, що властивість CssStyleSheetFileName використовується як для вказівки імені папки, так і для вказівки імені файлу.

  • ResourceFolder має нижчий пріоритет, ніж папки, вказані за допомогою FontsFolder, ImagesFolder та CssStyleSheetFileName. Якщо папка, зазначена за допомогою ResourceFolder, не існує, вона буде створена автоматично.
  • ResourceFolderAlias має нижчий пріоритет, ніж FontsFolderAlias та ImagesFolderAlias. Якщо значення ResourceFolderAlias порожнє, то для створення ресурсу URIs буде використано значення властивості ResourceFolder. Якщо для параметра ResourceFolderAlias встановлено значення “.” (крапка), ресурс URIs міститиме лише імена файлів без вказівки шляху.

Експорт ресурсів шрифтів у кодуванні Base64

Aspose.Words надає можливість вказати, чи слід вбудовувати ресурси шрифту в HTML у кодуваннях Base64. Для цього використовуйте властивість ExportFontsAsBase64 – це розширення властивості ExportFontResources. За замовчуванням його значення дорівнює false, а шрифти записуються в окремі файли. Але якщо для цього параметра встановлено значення true, шрифти будуть вбудовані в CSS документа, кодованого Base64. Властивість ExportFontsAsBase64 впливає лише на формат HTML і не впливає на EPUB та MHTML.

Наступний приклад коду показує, як експортувати шрифти, закодовані Base64, у HTML:

Вкажіть параметри збереження при перетворенні в EPUB

Aspose.Words дозволяє перетворити документ Word у формат EPUB за допомогою стандартних або спеціальних параметрів збереження. Ви можете вказати кілька параметрів, передавши екземпляр HtmlSaveOptions методу Save.

Наступний приклад коду показує, як перетворити документ Word у документ EPUB із зазначенням деяких параметрів збереження користувача: