Конвертировать MHTML в DOCX – примеры C#
Преобразование MHTML в DOCX часто требуется, чтобы использовать преимущества формата DOCX для конкретных задач. DOCX – широко известный формат документов Microsoft Word. Он может содержать широкий спектр данных, включая текст, таблицы, растровую и векторную графику, видео, звуки и диаграммы. Этот формат популярен, потому что он поддерживает широкий спектр функций форматирования и предлагает пользователям множество вариантов для написания любого типа документа.
В этой статье вы найдете информацию о том, как преобразовать MHTML в DOCX с помощью методов ConvertMHTML() класса Converter и как применить DocSaveOptions и ICreateStreamProvider.
Онлайн MHTML Конвертер
Вы можете конвертировать MHTML в DOCX с помощью Aspose.HTML для .NET API в режиме реального времени. Загрузите файл MHTML из локальной файловой системы, выберите выходной формат и запустите пример. В этом примере параметры сохранения установлены по умолчанию. Вы сразу же получите результат конвертации в виде отдельного файла.
Если вы хотите программно преобразовать MHTML в DOCX, рассмотрим следующие примеры кода C#.
MHTML в DOCX двумя строками кода!
Статические методы класса Converter в основном используются как самый простой способ преобразования кода MHTML в различные форматы. Например, вы можете преобразовать MHTML в DOCX в своем приложении C# буквально с помощью двух строк кода!
1using System.IO;
2using Aspose.Html.Converters;
3using Aspose.Html.Saving;
4...
5 // Open an existing MHTML file for reading
6 using var stream = File.OpenRead(DataDir + "sample.mht");
7
8 // Invoke the ConvertMHTML() method to convert MHTML to DOCX
9 Converter.ConvertMHTML(stream, new DocSaveOptions(), Path.Combine(OutputDir, "convert-by-two-lines.docx"));
Конвертировать MHTML в DOCX
Использование методов Converter.ConvertMHTML() является наиболее распространенным способом преобразования кода MHTML в различные форматы. С помощью Aspose.HTML вы можете программно конвертировать MHTML в формат DOCX с полным контролем над широким диапазоном параметров преобразования.
В следующем фрагменте кода C# показано, как преобразовать MHTML в DOCX с помощью Aspose.HTML для .NET:
- Откройте существующий файл MHTML. В примере мы используем метод OpenRead() класса System.IO.FileStream для открытия и чтения файлов из файловой системы по указанному пути.
- Создайте экземпляр класса DocSaveOptions.
- Используйте метод ConvertMHTML() класса Converter для сохранения MHTML в виде файла DOCX. Вам необходимо передать файловый поток MHTML, DocSaveOptions и путь к выходному файлу методу ConvertMHTML() для преобразования MHTML в DOCX.
1using System.IO;
2using Aspose.Html.Converters;
3using Aspose.Html.Saving;
4...
5 // Open an existing MHTML file for reading
6 using var stream = File.OpenRead(DataDir + "sample.mht");
7
8 // Prepare a path to save the converted file
9 string savePath = Path.Combine(OutputDir, "sample-output.docx");
10
11 // Create an instance of DocSaveOptions
12 var options = new DocSaveOptions();
13
14 // Call the ConvertMHTML() method to convert MHTML to DOCX
15 Converter.ConvertMHTML(stream, options, savePath);
Вы можете скачать полные примеры и файлы данных с GitHub.
Параметры сохранения
Aspose.HTML позволяет конвертировать MHTML в DOCX, используя стандартные или пользовательские параметры сохранения. Использование DocSaveOptions позволяет настроить процесс рендеринга; вы можете указать размер страницы, поля, разрешение, CSS и т. д.
Property | Description |
---|---|
FontEmbeddingRule | This property gets or sets the font embedding rule. Available values are Full and None. The default value is None. |
Css | Gets a CssOptions object which is used for configuration of CSS properties processing. |
DocumentFormat | This property gets or sets the file format of the output document. The default value is DOCX. |
PageSetup | This property gets a page setup object and uses it for configuration output page-set. |
HorizontalResolution | Sets horizontal resolution for output images in pixels per inch. The default value is 300 dpi. |
VerticalResolution | Sets vertical resolution for output images in pixels per inch. The default value is 300 dpi. |
Чтобы узнать больше о DocSaveOptions, прочитайте статьи раздела Конвертеры тонкой настройки.
Конвертировать MHTML в DOCX с использованием DocSaveOptions
Чтобы преобразовать MHTML в DOCX с указанием DocSaveOptions, необходимо выполнить несколько шагов:
- Откройте существующий файл MHTML.
- Создайте новый объект DocSaveOptions и укажите параметры сохранения.
- Используйте метод ConvertMHTML(), чтобы сохранить MHTML в виде файла DOCX. Вам необходимо передать файловый поток MHTML, DocSaveOptions и путь к выходному файлу в метод ConvertMHTML() для преобразования MHTML в DOCX.
В следующем примере показано, как использовать DocSaveOptions и создать файл DOCX с настраиваемыми параметрами сохранения:
1using System.IO;
2using Aspose.Html;
3using Aspose.Html.Converters;
4using Aspose.Html.Saving;
5using Aspose.Html.Drawing;
6...
7 // Open an existing MHTML file for reading
8 using var stream = File.OpenRead(DataDir + "sample.mht");
9
10 // Prepare a path to save the converted file
11 string savePath = Path.Combine(OutputDir, "sample-options.docx");
12
13 // Create an instance of DocSaveOptions and set A5 as a page size.
14 var options = new DocSaveOptions();
15 options.PageSetup.AnyPage = new Page(new Aspose.Html.Drawing.Size(Length.FromInches(8.3f), Length.FromInches(5.8f)));
16
17 // Call the ConvertMHTML() method to convert MHTML to DOCX
18 Converter.ConvertMHTML(stream, options, savePath);
В примере мы используем метод OpenRead() класса System.IO.FileStream для открытия и чтения исходных файлов из файловой системы по указанному пути. Конструктор
DocSaveOptions() инициализирует экземпляр класса DocSaveOptions, который передается методу ConvertMHTML(). Метод ConvertMHTML() принимает stream
, options
, путь к выходному файлу savePath
и выполняет операцию преобразования. Класс DocSaveOptions предоставляет множество свойств, которые дают вам полный контроль над широким спектром параметров и улучшают процесс преобразования MHTML в формат DOCX. В примере мы используем свойство PageSetup, которое указывает размер страницы документа DOCX.
Output Stream Providers
Если требуется сохранять файлы в удаленном хранилище (например, в облаке, базе данных и т. д.), вы можете реализовать ICreateStreamProvider для ручного управления процессом создания файла. Этот интерфейс разработан как объект обратного вызова для создания потока в начале документа/страницы (в зависимости от выходного формата) и освобождения ранее созданного потока после рендеринга документа/страницы.
Aspose.HTML для .NET предоставляет различные типы выходных форматов для операций рендеринга. Некоторые из этих форматов создают один выходной файл (например, PDF, XPS), другие создают несколько файлов (форматы изображений JPG, PNG и т. д.).
В приведенном ниже примере показано, как реализовать и использовать собственный MemoryStreamProvider в приложении:
1using System.IO;
2using System.Collections.Generic;
3...
4 class MemoryStreamProvider : Aspose.Html.IO.ICreateStreamProvider
5 {
6 // List of MemoryStream objects created during the document rendering
7 public List<MemoryStream> Streams { get; } = new List<MemoryStream>();
8
9 public Stream GetStream(string name, string extension)
10 {
11 // This method is called when only one output stream is required, for instance for XPS, PDF or TIFF formats.
12 MemoryStream result = new MemoryStream();
13 Streams.Add(result);
14 return result;
15 }
16
17 public Stream GetStream(string name, string extension, int page)
18 {
19 // This method is called when the creation of multiple output streams are required. For instance, during the rendering HTML to list of image files (JPG, PNG, etc.)
20 MemoryStream result = new MemoryStream();
21 Streams.Add(result);
22 return result;
23 }
24
25 public void ReleaseStream(Stream stream)
26 {
27 // Here you can release the stream filled with data and, for instance, flush it to the hard-drive
28 }
29
30 public void Dispose()
31 {
32 // Releasing resources
33 foreach (var stream in Streams)
34 stream.Dispose();
35 }
36 }
1using System.IO;
2using Aspose.Html;
3using System.Linq;
4using Aspose.Html.Converters;
5using Aspose.Html.Saving;
6...
7 // Create an instance of MemoryStreamProvider
8 using var streamProvider = new MemoryStreamProvider();
9
10 // Open an existing MHTML file for reading
11 using var stream = File.OpenRead(DataDir + "sample.mht");
12
13 // Prepare a path to save the converted file
14 string savePath = Path.Combine(OutputDir, "stream-provider.docx");
15
16 // Convert MHTML to DOCX by using the MemoryStreamProvider class
17 Converter.ConvertMHTML(stream, new DocSaveOptions(), streamProvider);
18
19 // Get access to the memory stream that contains the result data
20 var memory = streamProvider.Streams.First();
21 memory.Seek(0, SeekOrigin.Begin);
22
23 // Flush the result data to the output file
24 using (FileStream fs = File.Create(savePath))
25 {
26 memory.CopyTo(fs);
27 }
Aspose.HTML предлагает бесплатный онлайн Конвертер MHTML в DOCX, который конвертирует файлы MHTML в DOCX качественно, легко и быстро. Просто загрузите, конвертируйте файлы и получите результат за несколько секунд!