HTML Converter

В этой статье мы покажем вам, как использовать плагин PdfHtml, который может конвертировать PDF файлы в HTML файлы и обратно.

Предварительные требования

Вам понадобится следующее:

  • Visual Studio 2019 или новее
  • Aspose.PDF для .NET 21.1 или новее
  • Образец PDF файла и образец HTML файла

Вы можете скачать библиотеку Aspose.PDF для .NET на официальном сайте или установить её с помощью NuGet Package Manager в Visual Studio.

Шаги

Основные шаги для конвертации PDF файлов в HTML файлы и обратно с использованием плагина PdfHtml:

  1. Создайте объект класса PdfHtml
  2. Создайте объект класса PdfToHtmlOptions или HtmlToPdfOptions в зависимости от направления конвертации
  3. Добавьте в объект опций исходные и выходные данные

Шаг 1: Создайте объект класса PdfHtml

Класс PdfHtml - это основной класс, который предоставляет функциональность конвертации PDF файлов в HTML файлы и обратно. Для его использования вам нужно создать экземпляр с помощью конструктора по умолчанию:

// Создаем экземпляр плагина PdfHtml
var plugin = new PdfHtml();

Шаг 2: Создайте объект класса PdfToHtmlOptions или HtmlToPdfOptions в зависимости от направления конвертации

Классы PdfToHtmlOptions и HtmlToPdfOptions - это вспомогательные классы, которые позволяют указать различные опции и параметры для процесса конвертации, такие как формат вывода, диапазон страниц, кодировку, шрифты и т.д. Для использования этих классов вам нужно создать экземпляр соответствующего класса с помощью конструктора по умолчанию или передав некоторые параметры. Например, для конвертации PDF файла в HTML файл с встроенными ресурсами, вы можете использовать следующий код:

```cs
// Создать новый экземпляр класса PdfToHtmlOptions
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);

Для конвертации HTML файла в PDF файл с настройками по умолчанию, вы можете использовать следующий код:

// Создать новый экземпляр класса HtmlToPdfOptions
var options = new HtmlToPdfOptions();

Вы также можете установить другие параметры, такие как формат вывода, диапазон страниц, кодировка, шрифты и т.д., используя свойства классов параметров. Например, для конвертации PDF файла в HTML файл с кодировкой UTF-8 и шрифтом Arial, вы можете использовать следующий код:

// Создать новый экземпляр класса PdfToHtmlOptions
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);

// Установить кодировку в UTF-8
options.Encoding = Encoding.UTF8;

// Установить шрифт Arial
options.Font = "Arial";

Шаг 3: Добавить исходные и выходные данные в объект параметров

Исходные и выходные данные - это файлы PDF или HTML, которые вы хотите конвертировать и сохранить. Исходные и конечные данные представляют собой файлы PDF или HTML, которые вы хотите преобразовать и сохранить.

// Укажите пути к входному и выходному файлам
var inputPath = Path.Combine(@"C:\Samples\", "sample.pdf");
var outputPath = Path.Combine(@"C:\Samples\", "sample.html");

// Добавьте пути к входному и выходному файлам в параметры
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

Шаг 4: Запуск метода Process объекта PdfHtml

Последний шаг - запустить метод Process объекта PdfHtml, передав объект options в качестве параметра. Этот метод выполнит преобразование и вернет объект ResultContainer, который содержит результаты преобразования, такие как статус, сообщения, исходные данные и т.д. Вы можете получить доступ к результатам, используя свойства и методы класса ResultContainer. Например, чтобы получить первый результат из коллекции результатов и вывести его в консоль, можно использовать следующий код:

// Процесс конвертации и получение контейнера результатов
var resultContainer = plugin.Process(options);

// Получение первого результата из коллекции результатов
var result = resultContainer.ResultCollection[0];

// Вывод результата в консоль
Console.WriteLine(result);

Результат будет содержать информацию, такую как пути к файлам вывода.