Конвертировать MHTML в DOCX – примеры C#

Преобразование MHTML в DOCX часто требуется, чтобы использовать преимущества формата DOCX для конкретных задач. DOCX – широко известный формат документов Microsoft Word. Он может содержать широкий спектр данных, включая текст, таблицы, растровую и векторную графику, видео, звуки и диаграммы. Этот формат популярен, потому что он поддерживает широкий спектр функций форматирования и предлагает пользователям множество вариантов для написания любого типа документа.

В этой статье вы найдете информацию о том, как преобразовать MHTML в DOCX с помощью методов ConvertMHTML() класса Converter и как применить DocSaveOptions и ICreateStreamProvider.

Онлайн MHTML Конвертер

Вы можете конвертировать MHTML в DOCX с помощью Aspose.HTML for .NET API в режиме реального времени. Загрузите файл MHTML из локальной файловой системы, выберите выходной формат и запустите пример. В этом примере параметры сохранения установлены по умолчанию. Вы сразу же получите результат конвертации в виде отдельного файла.

                
            

Если вы хотите программно преобразовать MHTML в DOCX, рассмотрим следующие примеры кода C#.

MHTML в DOCX двумя строками кода!

Статические методы класса Converter в основном используются как самый простой способ преобразования кода MHTML в различные форматы. Например, вы можете преобразовать MHTML в DOCX в своем приложении C# буквально с помощью двух строк кода!

1// Open an existing MHTML file for reading
2using var stream = File.OpenRead(DataDir + "sample.mht");
3
4// Invoke the ConvertMHTML() method to convert MHTML to DOCX
5Converter.ConvertMHTML(stream, new DocSaveOptions(), Path.Combine(OutputDir, "convert-by-two-lines.docx"));

Конвертировать MHTML в DOCX

Использование методов Converter.ConvertMHTML() является наиболее распространенным способом преобразования кода MHTML в различные форматы. С помощью Aspose.HTML вы можете программно конвертировать MHTML в формат DOCX с полным контролем над широким диапазоном параметров преобразования.

В следующем фрагменте кода C# показано, как преобразовать MHTML в DOCX с помощью Aspose.HTML for .NET:

  1. Откройте существующий файл MHTML. В примере мы используем метод OpenRead() класса System.IO.FileStream для открытия и чтения файлов из файловой системы по указанному пути.
  2. Создайте экземпляр класса DocSaveOptions.
  3. Используйте метод ConvertMHTML() класса Converter для сохранения MHTML в виде файла DOCX. Вам необходимо передать файловый поток MHTML, DocSaveOptions и путь к выходному файлу методу ConvertMHTML() для преобразования MHTML в DOCX.
 1// Open an existing MHTML file for reading
 2using var stream = File.OpenRead(DataDir + "sample.mht");
 3
 4// Prepare a path to save the converted file
 5string savePath = Path.Combine(OutputDir, "sample-output.docx");
 6
 7// Create an instance of DocSaveOptions
 8var options = new DocSaveOptions();
 9
10// Call the ConvertMHTML() method to convert MHTML to DOCX
11Converter.ConvertMHTML(stream, options, savePath);

Вы можете скачать полные примеры и файлы данных с GitHub.

Параметры сохранения

Aspose.HTML позволяет конвертировать MHTML в DOCX, используя стандартные или пользовательские параметры сохранения. Использование DocSaveOptions позволяет настроить процесс рендеринга; вы можете указать размер страницы, поля, разрешение, CSS и т. д.

PropertyDescription
FontEmbeddingRuleThis property gets or sets the font embedding rule. Available values are Full and None. The default value is None.
CssGets a CssOptions object which is used for configuration of CSS properties processing.
DocumentFormatThis property gets or sets the file format of the output document. The default value is DOCX.
PageSetupThis property gets a page setup object and uses it for configuration output page-set.
HorizontalResolutionSets horizontal resolution for output images in pixels per inch. The default value is 300 dpi.
VerticalResolutionSets vertical resolution for output images in pixels per inch. The default value is 300 dpi.

Чтобы узнать больше о DocSaveOptions, прочитайте статьи раздела Конвертеры тонкой настройки.

Конвертировать MHTML в DOCX с использованием DocSaveOptions

Чтобы преобразовать MHTML в DOCX с указанием DocSaveOptions, необходимо выполнить несколько шагов:

  1. Откройте существующий файл MHTML.
  2. Создайте новый объект DocSaveOptions и укажите параметры сохранения.
  3. Используйте метод ConvertMHTML(), чтобы сохранить MHTML в виде файла DOCX. Вам необходимо передать файловый поток MHTML, DocSaveOptions и путь к выходному файлу в метод ConvertMHTML() для преобразования MHTML в DOCX.

В следующем примере показано, как использовать DocSaveOptions и создать файл DOCX с настраиваемыми параметрами сохранения:

 1// Open an existing MHTML file for reading
 2using var stream = File.OpenRead(DataDir + "sample.mht");
 3
 4// Prepare a path to save the converted file
 5string savePath = Path.Combine(OutputDir, "sample-options.docx");
 6
 7// Create an instance of DocxSaveOptions and set A5 as a page size 
 8var options = new DocSaveOptions();
 9options.PageSetup.AnyPage = new Page(new Aspose.Html.Drawing.Size(Length.FromInches(8.3f), Length.FromInches(5.8f)));            
10
11// Call the ConvertMHTML() method to convert MHTML to DOCX
12Converter.ConvertMHTML(stream, options, savePath);

В примере мы используем метод OpenRead() класса System.IO.FileStream для открытия и чтения исходных файлов из файловой системы по указанному пути. Конструктор DocSaveOptions() инициализирует экземпляр класса DocSaveOptions, который передается методу ConvertMHTML(). Метод ConvertMHTML() принимает stream, options, путь к выходному файлу savePath и выполняет операцию преобразования. Класс DocSaveOptions предоставляет множество свойств, которые дают вам полный контроль над широким спектром параметров и улучшают процесс преобразования MHTML в формат DOCX. В примере мы используем свойство PageSetup, которое указывает размер страницы документа DOCX.

Output Stream Providers

Если требуется сохранять файлы в удаленном хранилище (например, в облаке, базе данных и т. д.), вы можете реализовать ICreateStreamProvider для ручного управления процессом создания файла. Этот интерфейс разработан как объект обратного вызова для создания потока в начале документа/страницы (в зависимости от выходного формата) и освобождения ранее созданного потока после рендеринга документа/страницы.

Aspose.HTML for .NET предоставляет различные типы выходных форматов для операций рендеринга. Некоторые из этих форматов создают один выходной файл (например, PDF, XPS), другие создают несколько файлов (форматы изображений JPG, PNG и т. д.).

В приведенном ниже примере показано, как реализовать и использовать собственный MemoryStreamProvider в приложении:

 1class MemoryStreamProvider : Aspose.Html.IO.ICreateStreamProvider
 2{
 3    // List of MemoryStream objects created during the document rendering
 4    public List<MemoryStream> Streams { get; } = new List<MemoryStream>();
 5
 6    public Stream GetStream(string name, string extension)
 7    {
 8        // This method is called when only one output stream is required, for instance for XPS, PDF or TIFF formats
 9        MemoryStream result = new MemoryStream();
10        Streams.Add(result);
11        return result;
12    }
13
14    public Stream GetStream(string name, string extension, int page)
15    {
16        // This method is called when the creation of multiple output streams are required. For instance, during the rendering HTML to list of image files (JPG, PNG, etc.)
17        MemoryStream result = new MemoryStream();
18        Streams.Add(result);
19        return result;
20    }
21
22    public void ReleaseStream(Stream stream)
23    {
24        // Here you can release the stream filled with data and, for instance, flush it to the hard-drive
25    }
26
27    public void Dispose()
28    {
29        // Releasing resources
30        foreach (var stream in Streams)
31            stream.Dispose();
32    }
33}
 1// Create an instance of MemoryStreamProvider
 2using var streamProvider = new MemoryStreamProvider();
 3
 4// Open an existing MHTML file for reading
 5using var stream = File.OpenRead(DataDir + "sample.mht");
 6
 7// Prepare a path to save the converted file
 8string savePath = Path.Combine(OutputDir, "stream-provider.docx");
 9
10// Convert MHTML to DOCX by using the MemoryStreamProvider class
11Converter.ConvertMHTML(stream, new DocSaveOptions(), streamProvider);
12
13// Get access to the memory stream that contains the result data
14var memory = streamProvider.Streams.First();
15memory.Seek(0, SeekOrigin.Begin);
16
17// Flush the result data to the output file
18using (FileStream fs = File.Create(savePath))
19{
20    memory.CopyTo(fs);
21}

Aspose.HTML предлагает бесплатный онлайн Конвертер MHTML в DOCX, который конвертирует файлы MHTML в DOCX качественно, легко и быстро. Просто загрузите, конвертируйте файлы и получите результат за несколько секунд!

Text “Конвертер MHTML в DOCX”

Subscribe to Aspose Product Updates

Get monthly newsletters & offers directly delivered to your mailbox.