Конвертировать MHTML в DOCX – примеры C#

Преобразование MHTML в DOCX часто требуется, чтобы использовать преимущества формата DOCX для конкретных задач. DOCX – широко известный формат документов Microsoft Word. Он может содержать широкий спектр данных, включая текст, таблицы, растровую и векторную графику, видео, звуки и диаграммы. Этот формат популярен, потому что он поддерживает широкий спектр функций форматирования и предлагает пользователям множество вариантов для написания любого типа документа.

В этой статье вы найдете информацию о том, как преобразовать MHTML в DOCX с помощью методов ConvertMHTML() класса Converter и как применить DocSaveOptions и ICreateStreamProvider.

Онлайн MHTML Конвертер

Вы можете конвертировать MHTML в DOCX с помощью Aspose.HTML для .NET API в режиме реального времени. Загрузите файл MHTML из локальной файловой системы, выберите выходной формат и запустите пример. В этом примере параметры сохранения установлены по умолчанию. Вы сразу же получите результат конвертации в виде отдельного файла.

                
            

Если вы хотите программно преобразовать MHTML в DOCX, рассмотрим следующие примеры кода C#.

MHTML в DOCX двумя строками кода!

Статические методы класса Converter в основном используются как самый простой способ преобразования кода MHTML в различные форматы. Например, вы можете преобразовать MHTML в DOCX в своем приложении C# буквально с помощью двух строк кода!

1using System.IO;
2using Aspose.Html.Converters;
3using Aspose.Html.Saving;
4...
5     // Open an existing MHTML file for reading
6     using var stream = File.OpenRead(DataDir + "sample.mht");
7
8     // Invoke the ConvertMHTML() method to convert MHTML to DOCX
9     Converter.ConvertMHTML(stream, new DocSaveOptions(), Path.Combine(OutputDir, "convert-by-two-lines.docx"));

Конвертировать MHTML в DOCX

Использование методов Converter.ConvertMHTML() является наиболее распространенным способом преобразования кода MHTML в различные форматы. С помощью Aspose.HTML вы можете программно конвертировать MHTML в формат DOCX с полным контролем над широким диапазоном параметров преобразования.

В следующем фрагменте кода C# показано, как преобразовать MHTML в DOCX с помощью Aspose.HTML для .NET:

  1. Откройте существующий файл MHTML. В примере мы используем метод OpenRead() класса System.IO.FileStream для открытия и чтения файлов из файловой системы по указанному пути.
  2. Создайте экземпляр класса DocSaveOptions.
  3. Используйте метод ConvertMHTML() класса Converter для сохранения MHTML в виде файла DOCX. Вам необходимо передать файловый поток MHTML, DocSaveOptions и путь к выходному файлу методу ConvertMHTML() для преобразования MHTML в DOCX.
 1using System.IO;
 2using Aspose.Html.Converters;
 3using Aspose.Html.Saving;
 4...
 5     // Open an existing MHTML file for reading
 6     using var stream = File.OpenRead(DataDir + "sample.mht");
 7
 8     // Prepare a path to save the converted file 
 9     string savePath = Path.Combine(OutputDir, "sample-output.docx");
10
11     // Create an instance of DocSaveOptions
12     var options = new DocSaveOptions();
13
14     // Call the ConvertMHTML() method to convert MHTML to DOCX
15     Converter.ConvertMHTML(stream, options, savePath);

Вы можете скачать полные примеры и файлы данных с GitHub.

Параметры сохранения

Aspose.HTML позволяет конвертировать MHTML в DOCX, используя стандартные или пользовательские параметры сохранения. Использование DocSaveOptions позволяет настроить процесс рендеринга; вы можете указать размер страницы, поля, разрешение, CSS и т. д.

PropertyDescription
FontEmbeddingRuleThis property gets or sets the font embedding rule. Available values are Full and None. The default value is None.
CssGets a CssOptions object which is used for configuration of CSS properties processing.
DocumentFormatThis property gets or sets the file format of the output document. The default value is DOCX.
PageSetupThis property gets a page setup object and uses it for configuration output page-set.
HorizontalResolutionSets horizontal resolution for output images in pixels per inch. The default value is 300 dpi.
VerticalResolutionSets vertical resolution for output images in pixels per inch. The default value is 300 dpi.

Чтобы узнать больше о DocSaveOptions, прочитайте статьи раздела Конвертеры тонкой настройки.

Конвертировать MHTML в DOCX с использованием DocSaveOptions

Чтобы преобразовать MHTML в DOCX с указанием DocSaveOptions, необходимо выполнить несколько шагов:

  1. Откройте существующий файл MHTML.
  2. Создайте новый объект DocSaveOptions и укажите параметры сохранения.
  3. Используйте метод ConvertMHTML(), чтобы сохранить MHTML в виде файла DOCX. Вам необходимо передать файловый поток MHTML, DocSaveOptions и путь к выходному файлу в метод ConvertMHTML() для преобразования MHTML в DOCX.

В следующем примере показано, как использовать DocSaveOptions и создать файл DOCX с настраиваемыми параметрами сохранения:

 1using System.IO;
 2using Aspose.Html;
 3using Aspose.Html.Converters;
 4using Aspose.Html.Saving;
 5using Aspose.Html.Drawing;
 6...
 7    // Open an existing MHTML file for reading
 8    using var stream = File.OpenRead(DataDir + "sample.mht");
 9
10    // Prepare a path to save the converted file 
11    string savePath = Path.Combine(OutputDir, "sample-options.docx");
12    
13    // Create an instance of DocSaveOptions and set A5 as a page size. 
14    var options = new DocSaveOptions();
15    options.PageSetup.AnyPage = new Page(new Aspose.Html.Drawing.Size(Length.FromInches(8.3f), Length.FromInches(5.8f)));            
16    
17    // Call the ConvertMHTML() method to convert MHTML to DOCX
18    Converter.ConvertMHTML(stream, options, savePath); 

В примере мы используем метод OpenRead() класса System.IO.FileStream для открытия и чтения исходных файлов из файловой системы по указанному пути. Конструктор DocSaveOptions() инициализирует экземпляр класса DocSaveOptions, который передается методу ConvertMHTML(). Метод ConvertMHTML() принимает stream, options, путь к выходному файлу savePath и выполняет операцию преобразования. Класс DocSaveOptions предоставляет множество свойств, которые дают вам полный контроль над широким спектром параметров и улучшают процесс преобразования MHTML в формат DOCX. В примере мы используем свойство PageSetup, которое указывает размер страницы документа DOCX.

Output Stream Providers

Если требуется сохранять файлы в удаленном хранилище (например, в облаке, базе данных и т. д.), вы можете реализовать ICreateStreamProvider для ручного управления процессом создания файла. Этот интерфейс разработан как объект обратного вызова для создания потока в начале документа/страницы (в зависимости от выходного формата) и освобождения ранее созданного потока после рендеринга документа/страницы.

Aspose.HTML для .NET предоставляет различные типы выходных форматов для операций рендеринга. Некоторые из этих форматов создают один выходной файл (например, PDF, XPS), другие создают несколько файлов (форматы изображений JPG, PNG и т. д.).

В приведенном ниже примере показано, как реализовать и использовать собственный MemoryStreamProvider в приложении:

 1using System.IO;
 2using System.Collections.Generic;
 3...
 4    class MemoryStreamProvider : Aspose.Html.IO.ICreateStreamProvider
 5    {
 6        // List of MemoryStream objects created during the document rendering
 7        public List<MemoryStream> Streams { get; } = new List<MemoryStream>();
 8
 9        public Stream GetStream(string name, string extension)
10        {
11            // This method is called when only one output stream is required, for instance for XPS, PDF or TIFF formats.
12            MemoryStream result = new MemoryStream();
13            Streams.Add(result);
14            return result;
15        }
16
17        public Stream GetStream(string name, string extension, int page)
18        {
19            // This method is called when the creation of multiple output streams are required. For instance, during the rendering HTML to list of image files (JPG, PNG, etc.)
20            MemoryStream result = new MemoryStream();
21            Streams.Add(result);
22            return result;
23        }
24
25        public void ReleaseStream(Stream stream)
26        {
27            //  Here you can release the stream filled with data and, for instance, flush it to the hard-drive
28        }
29
30        public void Dispose()
31        {
32            // Releasing resources
33            foreach (var stream in Streams)
34                stream.Dispose();
35        }
36    }
 1using System.IO;
 2using Aspose.Html;
 3using System.Linq;
 4using Aspose.Html.Converters;
 5using Aspose.Html.Saving;
 6...
 7     // Create an instance of MemoryStreamProvider
 8     using var streamProvider = new MemoryStreamProvider();
 9
10     // Open an existing MHTML file for reading
11     using var stream = File.OpenRead(DataDir + "sample.mht");
12
13     // Prepare a path to save the converted file 
14     string savePath = Path.Combine(OutputDir, "stream-provider.docx");
15
16     // Convert MHTML to DOCX by using the MemoryStreamProvider class
17     Converter.ConvertMHTML(stream, new DocSaveOptions(), streamProvider);
18
19     // Get access to the memory stream that contains the result data
20     var memory = streamProvider.Streams.First();
21     memory.Seek(0, SeekOrigin.Begin);
22
23     // Flush the result data to the output file
24     using (FileStream fs = File.Create(savePath))
25     {
26         memory.CopyTo(fs);
27     }

Aspose.HTML предлагает бесплатный онлайн Конвертер MHTML в DOCX, который конвертирует файлы MHTML в DOCX качественно, легко и быстро. Просто загрузите, конвертируйте файлы и получите результат за несколько секунд!

Text “Баннер Конвертера MHTML в DOCX”

Subscribe to Aspose Product Updates

Get monthly newsletters & offers directly delivered to your mailbox.