Конвертировать HTML в DOCX | С#

Файл DOCX представляет собой документ Microsoft Word, который обычно содержит текст, но может содержать широкий спектр данных, включая таблицы, растровую и векторную графику, видео, звуки и диаграммы. Файл DOCX легко редактируется, прост в использовании и имеет удобный размер. Этот формат популярен из-за множества вариантов, которые он предлагает пользователям для написания документов любого типа. Этот формат файла является одним из наиболее широко используемых и доступен во многих программах.

Использование методов Converter.ConvertHTML() является наиболее распространенным способом преобразования HTML-кода в различные форматы. С помощью Aspose.HTML вы можете программно конвертировать HTML в формат DOCX с полным контролем над широким диапазоном параметров конвертации. В этой статье вы найдете информацию о том, как преобразовать HTML в DOCX с помощью методов ConvertHTML() класса Converter и как применить DocSaveOptions и параметры ICreateStreamProvider.

Онлайн HTML Конвертер

Вы можете проверить функциональность Aspose.HTML API и конвертировать HTML в режиме реального времени. Пожалуйста, загрузите HTML из локальной файловой системы, выберите выходной формат и запустите пример. В примере параметры сохранения установлены по умолчанию. Вы сразу получите результат в виде отдельного файла.

                
            

Если вы хотите программно преобразовать HTML в DOCX, давайте рассмотрим следующие примеры кода C#.

HTML в DOCX одной строкой кода

Статические методы класса Converter в основном используются как самый простой способ преобразования HTML-кода в различные форматы. Вы можете преобразовать HTML в DOCX в своем приложении C# буквально с помощью одной строки кода!

1using System.IO;
2using Aspose.Html.Converters;
3using Aspose.Html.Saving;
4...
5     // Invoke the ConvertHTML() method to convert HTML to DOCX
6     Converter.ConvertHTML(@"<h1>Convert HTML to DOCX!</h1>", ".", new DocSaveOptions(), Path.Combine(OutputDir, "convert-with-single-line.docx"));

Конвертировать HTML в DOCX

Преобразование файла в другой формат методом ConvertHTML() представляет собой последовательность операций, среди которых загрузка и сохранение документа:

  1. Загрузите файл HTML с помощью класса HTMLDocument.
  2. Создайте новый объект DocSaveOptions.
  3. Используйте метод ConvertHTML() класса Converter для сохранения HTML в виде файла DOCX. Вам необходимо передать HTMLDocument, DocSaveOptions и путь к выходному файлу методу ConvertHTML() для преобразования HTML в DOCX.

Просмотрите следующий фрагмент кода C#, в котором показан процесс преобразования HTML в DOCX с использованием Aspose.HTML для .NET.

 1using System.IO;
 2using Aspose.Html;
 3using Aspose.Html.Converters;
 4using Aspose.Html.Saving;
 5...
 6    // Prepare a path to a source HTML file
 7    string documentPath = Path.Combine(DataDir, "canvas.html");
 8
 9    // Prepare a path for converted file saving 
10    string savePath = Path.Combine(OutputDir, "canvas-output.docx");
11
12    // Initialize an HTML document from the file
13    using var document = new HTMLDocument(documentPath);
14
15    // Initialize DocSaveOptions 
16    var options = new DocSaveOptions();
17
18    // Convert HTML to DOCX
19    Converter.ConvertHTML(document, options, savePath);

Вы можете скачать полные примеры и файлы данных с GitHub.

Параметры Сохранения

Aspose.HTML позволяет конвертировать HTML в DOCX, используя стандартные или пользовательские параметры сохранения. Использование DocSaveOptions позволяет настроить процесс рендеринга; вы можете указать размер страницы, поля, разрешение, CSS и т. д.

PropertyDescription
FontEmbeddingRuleThis property gets or sets the font embedding rule. Available values are Full and None. The default value is None.
CssGets a CssOptions object which is used for configuration of CSS properties processing.
DocumentFormatThis property gets or sets the file format of the output document. The default value is DOCX.
PageSetupThis property gets a page setup object and uses it for configuration output page-set.
HorizontalResolutionSets horizontal resolution for output images in pixels per inch. The default value is 300 dpi.
VerticalResolutionSets vertical resolution for output images in pixels per inch. The default value is 300 dpi.

Чтобы узнать больше о DocSaveOptions, прочитайте статьи раздела Конвертеры тонкой настройки.

Конвертировать HTML в DOCX с использованием DocSaveOptions

Чтобы преобразовать HTML в DOCX с указанием DocSaveOptions, необходимо выполнить несколько шагов:

  1. Загрузите файл HTML с помощью одного из конструкторов HTMLDocument() класса HTMLDocument.
  2. Создайте новый объект DocSaveOptions. Конструктор DocSaveOptions() инициализирует экземпляр класса DocSaveOptions, который передается методу ConvertHTML().
  3. Используйте метод ConvertHTML() класса Converter для сохранения HTML в виде файла DOCX. Вам необходимо передать HTMLDocument, DocSaveOptions и путь к выходному файлу методу ConvertHTML() для преобразования HTML в DOCX.

В следующем примере показано, как использовать DocSaveOptions и создать файл DOCX с настраиваемыми параметрами сохранения:

 1using System.IO;
 2using Aspose.Html;
 3using Aspose.Html.Converters;
 4using Aspose.Html.Saving;
 5using Aspose.Html.Drawing;
 6...
 7    string documentPath = Path.Combine(OutputDir, "save-options.html");
 8    string savePath = Path.Combine(OutputDir, "save-options-output.docx");
 9
10    // Prepare HTML code and save it to a file
11    var code = "<h1>DocSaveOptions Class</h1>\r\n" +
12               "<p>Using DocSaveOptions Class, you can programmatically apply a wide range of conversion parameters.</p>\r\n";
13
14    File.WriteAllText(documentPath, code);
15
16    // Initialize an HTML Document from the html file
17    using var document = new HTMLDocument(documentPath);
18
19    // Initialize DocSaveOptions. Set A5 as a page-size 
20    var options = new DocSaveOptions();
21    options.PageSetup.AnyPage = new Page(new Aspose.Html.Drawing.Size(Length.FromInches(8.3f), Length.FromInches(5.8f)));
22
23    // Convert HTML to DOCX
24    Converter.ConvertHTML(document, options, savePath);

Класс DocSaveOptions предоставляет множество свойств, которые дают вам полный контроль над широким спектром параметров и улучшают процесс преобразования HTML в формат DOCX. В приведенном выше примере мы используем свойство PageSetup, которое указывает размер страницы документа DOCX.

Output Stream Providers

Если требуется сохранять файлы в удаленном хранилище (например, в облаке, базе данных и т. д.), вы можете реализовать ICreateStreamProvider для ручного управления процессом создания файла. Этот интерфейс разработан как объект обратного вызова для создания потока в начале документа/страницы (в зависимости от выходного формата) и освобождения ранее созданного потока после рендеринга документа/страницы.

Aspose.HTML для .NET предоставляет различные типы выходных форматов для операций рендеринга. Некоторые из этих форматов создают один выходной файл (например, PDF, XPS), другие создают несколько файлов (форматы изображений JPG, PNG и т. д.).

В приведенном ниже примере показано, как реализовать и использовать собственный MemoryStreamProvider в приложении:

 1using System.IO;
 2using System.Collections.Generic;
 3...
 4    class MemoryStreamProvider : Aspose.Html.IO.ICreateStreamProvider
 5    {
 6        // List of MemoryStream objects created during the document rendering
 7        public List<MemoryStream> Streams { get; } = new List<MemoryStream>();
 8
 9        public Stream GetStream(string name, string extension)
10        {
11            // This method is called when only one output stream is required, for instance for XPS, PDF or TIFF formats.
12            MemoryStream result = new MemoryStream();
13            Streams.Add(result);
14            return result;
15        }
16
17        public Stream GetStream(string name, string extension, int page)
18        {
19            // This method is called when the creation of multiple output streams are required. For instance, during the rendering HTML to list of image files (JPG, PNG, etc.)
20            MemoryStream result = new MemoryStream();
21            Streams.Add(result);
22            return result;
23        }
24
25        public void ReleaseStream(Stream stream)
26        {
27            //  Here you can release the stream filled with data and, for instance, flush it to the hard-drive
28        }
29
30        public void Dispose()
31        {
32            // Releasing resources
33            foreach (var stream in Streams)
34                stream.Dispose();
35        }
36    }
 1using System.IO;
 2using Aspose.Html;
 3using System.Linq;
 4using Aspose.Html.Converters;
 5using Aspose.Html.Saving;
 6...
 7    // Create an instance of MemoryStreamProvider
 8    using var streamProvider = new MemoryStreamProvider();
 9
10    // Initialize an HTML document
11    using var document = new HTMLDocument(@"<h1>Convert HTML to DOCX File Format!</h1>", ".");
12
13    // Convert HTML to DOCX using the MemoryStreamProvider
14    Converter.ConvertHTML(document, new DocSaveOptions(), streamProvider);
15
16    // Get access to the memory stream that contains the result data
17    var memory = streamProvider.Streams.First();
18    memory.Seek(0, SeekOrigin.Begin);
19
20    // Flush the result data to the output file
21    using (FileStream fs = File.Create(Path.Combine(OutputDir, "stream-provider.docx")))
22    {
23        memory.CopyTo(fs);
24    }

Загрузите нашу библиотеку Aspose.HTML для .NET, которая позволит вам успешно, быстро и легко конвертировать HTML, MHTML, EPUB, SVG и Markdown документы в самые популярные форматы.

Aspose.HTML предлагает бесплатный онлайн Конвертер HTML в DOCX, который конвертирует HTML в DOCX с высоким качеством, легко и быстро. Просто загрузите, конвертируйте свои файлы и получите результат за несколько секунд!

Text “Баннер Конвертера HTML в DOCX”

Subscribe to Aspose Product Updates

Get monthly newsletters & offers directly delivered to your mailbox.