Конвертиране на документ в HTML, MHTML или EPUB

Документи в HTML и MHTML формати са също много популярни и могат да се използват на всяка уеб платформа. Поради тази причина конвертирането на документи в HTML и MHTML е важна характеристика на Aspose.Words.

EPUB (кратко за “Електронна публикация”) е HTML-базиран формат, който често се използва за електронно разпространение на книги. Този формат е напълно поддържан в Aspose.Words за износ на електронни книги, които са съвместими с повечето устройства за четене.

Конвертиране на документ

За просто преобразуване в HTML, MHTML или EPUB, един от Save метод претоварване се използва. Можете да запишете документа във файл или поток и изрично да зададете формата за запис на изходния документ или да го дефинирате от разширението на името на файла.

Следният пример показва как да конвертирате DOCX да HTML с посочване на формат за запис:

.NET

// Load the document from disk.
Document doc = new Document(dataDir + "Test File.docx");

// Save the document into HTML.
doc.Save(dataDir + "Document", SaveFormat.Html);

За да конвертирате документ в MHTML или EPUB, използвайте SaveFormat.Mhtml или SaveFormat.Epub съответно.

Конвертиране на документ с информация за Round-trip

HTML форматът не поддържа много Microsoft Word функции и ако трябва да възстановим модел на документ възможно най-близо до оригинала, трябва да запазим допълнителна информация в HTML файла. Тази информация също се нарича “информация за пътуване в кръг.” За тази цел, Aspose.Words осигурява възможност за експортиране на информация за кръгла обиколка при спестяване към HTML, MHTML или EPUB с помощта на ExportRoundtripInformation собственост. Запазването на информацията за обиколката позволява да се възстановят свойствата на документите, като например раздели, коментари, заглавни части, и footers по време на зареждане на документите на изброените формати обратно в a Document Възразявам.

По подразбиране стойността е true за HTML и false за MHTML и EPUB:

  • Кога true, информацията се изнася като - ав - * CSS свойства на съответните HTML елементи
  • Кога false, няма информация, която да бъде получена в произведени файлове

Следният пример с код показва как да се експортира информация с кръгла стъпка при конвертиране на документ от DOCX в HTML:

Посочване на настройките при преобразуване в HTML

Aspose.Words позволява конвертиране на Word документ в HTML чрез използване на опции по подразбиране или по поръчка. Няколко примера за потребителски опции за запис са описани по-долу.

Посочете папка за запазване на ресурси

Използване Aspose.Words можем да посочим физическа папка, където всички ресурси, като изображения, шрифтове и външни CSS, се съхраняват, когато документ се преобразува в HTML. По подразбиране, това е празен низ.

Определяне на ResourceFolder Имотът е най-простият начин да зададете папка, където всички ресурси трябва да бъдат написани. Можем да използваме индивидуални свойства, като FontsFolder което запазва шрифтове в посочената папка и ImagesFolder което запазва изображения в определена папка. Когато е определен относителен път, FontsFolder както и ImagesFolder се отнасят до папката, в която е разположен кодовият монтаж, ResourceFolder както и CssStyleSheetFileName се отнасят до изходната папка, където се намира HTML документ.

В този пример, ResourceFolder посочва относителния път. Този път се отнася до изходната папка, където се записва HTML документ. Стойността на ResourceFolderAlias имот се използва за създаване на URL адреси за всички ресурси.

Следният пример за код показва как да работите с тези свойства:

Използване на ResourceFolderAlias имот, можем също така да посочим името на папката, използвана за изграждане на URIs на всички ресурси, написани в HTML документ. Това е най-лесният начин да се уточни как URI трябва да се генерира за всички файлове с ресурси. Същата информация може да се посочи за изображения и шрифтове поотделно чрез ImagesFolderAlias както и FontsFolderAlias свойства, съответно.

Няма обаче индивидуално имущество за CSS. поведението на FontsFolder, FontsFolderAlias, ImagesFolder, ImagesFolderAlias както и CssStyleSheetFileName имотите не се променят. Имайте предвид, че CssStyleSheetFileName Имотът се използва както за определяне на името на папката, така и за името на файла.

  • ResourceFolder има по-нисък приоритет от посочените през FontsFolder, ImagesFolder, както и CssStyleSheetFileName. Ако папката е посочена в ResourceFolder не съществува, той ще бъде създаден автоматично.
  • ResourceFolderAlias има по-нисък приоритет от FontsFolderAlias както и ImagesFolderAlias. Ако ResourceFolderAlias е празна, стойността на ResourceFolder Имотът ще се използва за създаване на ресурс URIs. Ако ResourceFolderAlias е настроена на “.” (точка), ресурс URIs ще съдържа само имена на файлове, без да се посочва пътя.

Export Base64 Encoding Fonts Resources

Aspose.Words дава възможност да се уточни дали ресурсите на шрифта следва да бъдат вградени в HTML в базовите кодировки. За да извършите това, използвайте ExportFontsAsBase64 Недвижими имоти Това е продължение на ExportFontResources собственост. По подразбиране стойността му е false, и шрифтовете са написани в отделни файлове. Но ако тази опция е зададена true, шрифтовете ще бъдат вградени в CSS на документа в Base64 кодиране. На ExportFontsAsBase64 Имотът засяга само HTML формат и не засяга EPUB и MHTML.

Следният пример за код показва как да експортирате Base64 кодирани шрифтове в HTML:

Посочване на настройките при преобразуване в EPUB

Aspose.Words позволява конвертиране на Word документ във формат EPUB чрез опции по подразбиране или по поръчка. Можете да посочите няколко опции чрез преминаване на случай на HtmlSaveOptions до Save метод.

Следният пример за код показва как да конвертирате Word документ в EPUB с посочване на някои опции за запис по поръчка:

Вижте също