Конвертировать HTML в DOCX на С#
Файл DOCX представляет собой документ Microsoft Word, который обычно содержит текст, но может содержать широкий спектр данных, включая таблицы, растровую и векторную графику, видео, звуки и диаграммы. Файл DOCX легко редактируется, прост в использовании и имеет удобный размер. Этот формат популярен из-за множества вариантов, которые он предлагает пользователям для написания документов любого типа. Этот формат файла является одним из наиболее широко используемых и доступен во многих программах.
Использование методов Converter.ConvertHTML() является наиболее распространенным способом преобразования HTML-кода в различные форматы. С помощью Aspose.HTML вы можете программно конвертировать HTML в формат DOCX с полным контролем над широким диапазоном параметров конвертации. В этой статье вы найдете информацию о том, как преобразовать HTML в DOCX с помощью методов ConvertHTML() класса Converter и как применить DocSaveOptions и параметры ICreateStreamProvider.
Онлайн HTML Конвертер
Вы можете проверить функциональность Aspose.HTML API и конвертировать HTML в режиме реального времени. Пожалуйста, загрузите HTML из локальной файловой системы, выберите выходной формат и запустите пример. В примере параметры сохранения установлены по умолчанию. Вы сразу получите результат в виде отдельного файла.
Если вы хотите программно преобразовать HTML в DOCX, давайте рассмотрим следующие примеры кода C#.
HTML в DOCX одной строкой кода
Статические методы класса Converter в основном используются как самый простой способ преобразования HTML-кода в различные форматы. Вы можете преобразовать HTML в DOCX в своем приложении C# буквально с помощью одной строки кода!
1// Convert HTML to DOCX in C#
2
3// Invoke the ConvertHTML() method to convert HTML to DOCX
4Converter.ConvertHTML(@"<h1>Convert HTML to DOCX!</h1>", ".", new DocSaveOptions(), Path.Combine(OutputDir, "convert-with-single-line.docx"));
Конвертировать HTML в DOCX
Преобразование файла в другой формат методом ConvertHTML() представляет собой последовательность операций, среди которых загрузка и сохранение документа:
- Загрузите файл HTML с помощью класса HTMLDocument.
- Создайте новый объект DocSaveOptions.
- Используйте метод ConvertHTML() класса Converter для сохранения HTML в виде файла DOCX. Вам необходимо передать HTMLDocument, DocSaveOptions и путь к выходному файлу методу ConvertHTML() для преобразования HTML в DOCX.
Просмотрите следующий фрагмент кода C#, в котором показан процесс преобразования HTML в DOCX с использованием Aspose.HTML for .NET.
1// Convert HTML to DOCX using C#
2
3// Prepare a path to a source HTML file
4string documentPath = Path.Combine(DataDir, "canvas.html");
5
6// Prepare a path to save the converted file
7string savePath = Path.Combine(OutputDir, "canvas-output.docx");
8
9// Initialize an HTML document from the file
10using HTMLDocument document = new HTMLDocument(documentPath);
11
12// Initialize DocSaveOptions
13DocSaveOptions options = new DocSaveOptions();
14
15// Convert HTML to DOCX
16Converter.ConvertHTML(document, options, savePath);
Вы можете скачать полные примеры и файлы данных с GitHub.
Параметры Сохранения
Aspose.HTML позволяет конвертировать HTML в DOCX, используя стандартные или пользовательские параметры сохранения. Использование DocSaveOptions позволяет настроить процесс рендеринга; вы можете указать размер страницы, поля, разрешение, CSS и т. д.
Property | Description |
---|---|
FontEmbeddingRule | This property gets or sets the font embedding rule. Available values are Full and None. The default value is None. |
Css | Gets a CssOptions object which is used for configuration of CSS properties processing. |
DocumentFormat | This property gets or sets the file format of the output document. The default value is DOCX. |
PageSetup | This property gets a page setup object and uses it for configuration output page-set. |
HorizontalResolution | Sets horizontal resolution for output images in pixels per inch. The default value is 300 dpi. |
VerticalResolution | Sets vertical resolution for output images in pixels per inch. The default value is 300 dpi. |
Чтобы узнать больше о DocSaveOptions, прочитайте статьи раздела Конвертеры тонкой настройки.
Конвертировать HTML в DOCX с использованием DocSaveOptions
Чтобы преобразовать HTML в DOCX с указанием DocSaveOptions, необходимо выполнить несколько шагов:
- Загрузите файл HTML с помощью одного из конструкторов HTMLDocument() класса HTMLDocument.
- Создайте новый объект DocSaveOptions. Конструктор DocSaveOptions() инициализирует экземпляр класса DocSaveOptions, который передается методу ConvertHTML().
- Используйте метод ConvertHTML() класса Converter для сохранения HTML в виде файла DOCX. Вам необходимо передать HTMLDocument, DocSaveOptions и путь к выходному файлу методу ConvertHTML() для преобразования HTML в DOCX.
В следующем примере показано, как использовать DocSaveOptions и создать файл DOCX с настраиваемыми параметрами сохранения:
1// Convert HTML to DOCX in C# with custom settings
2
3string documentPath = Path.Combine(OutputDir, "save-options.html");
4string savePath = Path.Combine(OutputDir, "save-options-output.docx");
5
6// Prepare HTML code and save it to a file
7string code = "<h1>DocSaveOptions Class</h1>\r\n" +
8 "<p>Using DocSaveOptions Class, you can programmatically apply a wide range of conversion parameters.</p>\r\n";
9
10File.WriteAllText(documentPath, code);
11
12// Initialize an HTML Document from the html file
13using HTMLDocument document = new HTMLDocument(documentPath);
14
15// Initialize DocSaveOptions. Set A5 as a page-size
16DocSaveOptions options = new DocSaveOptions();
17options.PageSetup.AnyPage = new Page(new Aspose.Html.Drawing.Size(Length.FromInches(8.3f), Length.FromInches(5.8f)));
18
19// Convert HTML to DOCX
20Converter.ConvertHTML(document, options, savePath);
Класс DocSaveOptions предоставляет множество свойств, которые дают вам полный контроль над широким спектром параметров и улучшают процесс преобразования HTML в формат DOCX. В приведенном выше примере мы используем свойство PageSetup, которое указывает размер страницы документа DOCX.
Output Stream Providers
Если требуется сохранять файлы в удаленном хранилище (например, в облаке, базе данных и т. д.), вы можете реализовать ICreateStreamProvider для ручного управления процессом создания файла. Этот интерфейс разработан как объект обратного вызова для создания потока в начале документа/страницы (в зависимости от выходного формата) и освобождения ранее созданного потока после рендеринга документа/страницы.
Aspose.HTML for .NET предоставляет различные типы выходных форматов для операций рендеринга. Некоторые из этих форматов создают один выходной файл (например, PDF, XPS), другие создают несколько файлов (форматы изображений JPG, PNG и т. д.).
В приведенном ниже примере показано, как реализовать и использовать собственный MemoryStreamProvider в приложении:
1// Implement a custom MemoryStream provider for advanced control over HTML rendering output streams
2
3class MemoryStreamProvider : Aspose.Html.IO.ICreateStreamProvider
4{
5 // List of MemoryStream objects created during the document rendering
6 public List<MemoryStream> Streams { get; } = new List<MemoryStream>();
7
8 public Stream GetStream(string name, string extension)
9 {
10 // This method is called when only one output stream is required, for instance for XPS, PDF or TIFF formats
11 MemoryStream result = new MemoryStream();
12 Streams.Add(result);
13 return result;
14 }
15
16 public Stream GetStream(string name, string extension, int page)
17 {
18 // This method is called when the creation of multiple output streams are required. For instance, during the rendering HTML to list of image files (JPG, PNG, etc.)
19 MemoryStream result = new MemoryStream();
20 Streams.Add(result);
21 return result;
22 }
23
24 public void ReleaseStream(Stream stream)
25 {
26 // Here you can release the stream filled with data and, for instance, flush it to the hard-drive
27 }
28
29 public void Dispose()
30 {
31 // Releasing resources
32 foreach (MemoryStream stream in Streams)
33 stream.Dispose();
34 }
35}
Следующий фрагмент кода демонстрирует, как преобразовать HTML-файл в DOCX-файл с использованием потока памяти.
1// Convert HTML to DOCX in C# using memory stream
2
3// Create an instance of MemoryStreamProvider
4using MemoryStreamProvider streamProvider = new MemoryStreamProvider();
5
6// Initialize an HTML document
7using HTMLDocument document = new HTMLDocument(@"<h1>Convert HTML to DOCX File Format!</h1>", ".");
8
9// Convert HTML to DOCX using the MemoryStreamProvider
10Converter.ConvertHTML(document, new DocSaveOptions(), streamProvider);
11
12// Get access to the memory stream that contains the result data
13MemoryStream memory = streamProvider.Streams.First();
14memory.Seek(0, SeekOrigin.Begin);
15
16// Flush the result data to the output file
17using (FileStream fs = File.Create(Path.Combine(OutputDir, "stream-provider.docx")))
18{
19 memory.CopyTo(fs);
20}
Загрузите нашу библиотеку Aspose.HTML for .NET, которая позволит вам успешно, быстро и легко конвертировать HTML, MHTML, EPUB, SVG и Markdown документы в самые популярные форматы.
Aspose.HTML предлагает бесплатный онлайн Конвертер HTML в DOCX, который конвертирует HTML в DOCX с высоким качеством, легко и быстро. Просто загрузите, конвертируйте свои файлы и получите результат за несколько секунд!