HTML Converter
В этой статье мы покажем вам, как использовать плагин PdfHtml, который может конвертировать PDF файлы в HTML файлы и обратно.
Предварительные требования
Вам понадобится следующее:
- Visual Studio 2019 или новее
- Aspose.PDF для .NET 21.1 или новее
- Образец PDF файла и образец HTML файла
Вы можете скачать библиотеку Aspose.PDF для .NET на официальном сайте или установить её с помощью NuGet Package Manager в Visual Studio.
Шаги
Основные шаги для конвертации PDF файлов в HTML файлы и обратно с использованием плагина PdfHtml:
- Создайте объект класса PdfHtml
- Создайте объект класса PdfToHtmlOptions или HtmlToPdfOptions в зависимости от направления конвертации
- Добавьте в объект опций исходные и выходные данные
Шаг 1: Создайте объект класса PdfHtml
Класс PdfHtml - это основной класс, который предоставляет функциональность конвертации PDF файлов в HTML файлы и обратно. Для его использования вам нужно создать экземпляр с помощью конструктора по умолчанию:
// Создаем экземпляр плагина PdfHtml
var plugin = new PdfHtml();
Шаг 2: Создайте объект класса PdfToHtmlOptions или HtmlToPdfOptions в зависимости от направления конвертации
Классы PdfToHtmlOptions и HtmlToPdfOptions - это вспомогательные классы, которые позволяют указать различные опции и параметры для процесса конвертации, такие как формат вывода, диапазон страниц, кодировку, шрифты и т.д. Для использования этих классов вам нужно создать экземпляр соответствующего класса с помощью конструктора по умолчанию или передав некоторые параметры. Например, для конвертации PDF файла в HTML файл с встроенными ресурсами, вы можете использовать следующий код:
```cs
// Создать новый экземпляр класса PdfToHtmlOptions
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
Для конвертации HTML файла в PDF файл с настройками по умолчанию, вы можете использовать следующий код:
// Создать новый экземпляр класса HtmlToPdfOptions
var options = new HtmlToPdfOptions();
Вы также можете установить другие параметры, такие как формат вывода, диапазон страниц, кодировка, шрифты и т.д., используя свойства классов параметров. Например, для конвертации PDF файла в HTML файл с кодировкой UTF-8 и шрифтом Arial, вы можете использовать следующий код:
// Создать новый экземпляр класса PdfToHtmlOptions
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// Установить кодировку в UTF-8
options.Encoding = Encoding.UTF8;
// Установить шрифт Arial
options.Font = "Arial";
Шаг 3: Добавить исходные и выходные данные в объект параметров
Исходные и выходные данные - это файлы PDF или HTML, которые вы хотите конвертировать и сохранить. Исходные и конечные данные представляют собой файлы PDF или HTML, которые вы хотите преобразовать и сохранить.
// Укажите пути к входному и выходному файлам
var inputPath = Path.Combine(@"C:\Samples\", "sample.pdf");
var outputPath = Path.Combine(@"C:\Samples\", "sample.html");
// Добавьте пути к входному и выходному файлам в параметры
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
Шаг 4: Запуск метода Process объекта PdfHtml
Последний шаг - запустить метод Process объекта PdfHtml, передав объект options в качестве параметра. Этот метод выполнит преобразование и вернет объект ResultContainer, который содержит результаты преобразования, такие как статус, сообщения, исходные данные и т.д. Вы можете получить доступ к результатам, используя свойства и методы класса ResultContainer. Например, чтобы получить первый результат из коллекции результатов и вывести его в консоль, можно использовать следующий код:
// Процесс конвертации и получение контейнера результатов
var resultContainer = plugin.Process(options);
// Получение первого результата из коллекции результатов
var result = resultContainer.ResultCollection[0];
// Вывод результата в консоль
Console.WriteLine(result);
Результат будет содержать информацию, такую как пути к файлам вывода.