Конвертировать HTML из ZIP-архива в PDF – пример С#
В этой статье мы создадим собственный обработчик сообщений для выполнения конкретной задачи – преобразования HTML из ZIP-архива в PDF.
Есть много причин, по которым вам может понадобиться конвертировать HTML из ZIP-архива в формат PDF. PDF имеет много преимуществ, которых нет у других файлов. Например, многие программы и приложения поддерживают PDF-документы, большинство веб-браузеров, таких как Chrome и Firefox, могут отображать PDF-файлы. PDF-файлы оптимизированы для печати; они идеально подходят для создания физических копий ваших документов. PDF поддерживает множество алгоритмов сжатия. Вы можете настроить параметры безопасности для вашего PDF-файла и т. д.
Создайте собственный обработчик сообщений
Aspose.HTML for .NET предлагает функциональные возможности для создания пользовательских обработчиков сообщений. Давайте разработаем собственный обработчик, который мы можем использовать для работы с ZIP-архивами. Выполните следующие действия:
Используйте необходимое пространство имен, которым является Aspose.Html.Net. Это пространство имен представлено классами и интерфейсами, которые отвечают за упрощение сетевой обработки.
Чтобы создать собственный обработчик сообщений, вам необходимо определить собственный класс, который будет производным от класса MessageHandler. Класс MessageHandler представляет базовый тип для обработчиков сообщений. Наследование от IDisposable необходимо для обеспечения механизма детерминированного освобождения неуправляемых ресурсов.
1using Aspose.Html.Net;
2...
3
4 class ZipArchiveMessageHandler : MessageHandler, IDisposable
5 {
6 }
Итак, вы определили свой собственный класс ZipArchiveMessageHandler, теперь вам нужно проделать в нем некоторые операции.
- Инициализируйте экземпляр класса ZipArchiveMessageHandler и определите для него свойство Filter.
- Переопределите метод Invoke() класса MessageHandler для реализации пользовательского поведения обработчика сообщений.
1// This message handler prints a message about start and finish processing request
2class ZipArchiveMessageHandler : MessageHandler, IDisposable
3{
4 private string filePath;
5 private Archive archive;
6
7 // Initialize an instance of the ZipArchiveMessageHandler class
8 public ZipArchiveMessageHandler(string path)
9 {
10 this.filePath = path;
11 Filters.Add(new ProtocolMessageFilter("zip"));
12 }
13
14 // Override the Invoke() method
15 public override void Invoke(INetworkOperationContext context)
16 {
17 // Call the GetFile() method that defines the logic in the Invoke() method
18 var buff = GetFile(context.Request.RequestUri.Pathname.TrimStart('/'));
19 if (buff != null)
20 {
21 // Checking: if a resource is found in the archive, then return it as a Response
22 context.Response = new ResponseMessage(HttpStatusCode.OK)
23 {
24 Content = new ByteArrayContent(buff)
25 };
26 context.Response.Headers.ContentType.MediaType = MimeType.FromFileExtension(context.Request.RequestUri.Pathname);
27 }
28 else
29 {
30 context.Response = new ResponseMessage(HttpStatusCode.NotFound);
31 }
32
33 // Call the next message handler
34 Next(context);
35 }
36
37
38 byte[] GetFile(string path)
39 {
40 path = path.Replace(@"\", @"/");
41 var result = GetArchive().Entries.FirstOrDefault(x => path == x.Name);
42 if (result != null)
43 {
44 using (var fs = result.Open())
45 using (MemoryStream ms = new MemoryStream())
46 {
47 fs.CopyTo(ms);
48 return ms.ToArray();
49 }
50 }
51 return null;
52 }
53
54 Archive GetArchive()
55 {
56 return archive ??= new Archive(filePath);
57 }
58
59 public void Dispose()
60 {
61 archive?.Dispose();
62 }
63}
Давайте внимательно посмотрим на этот фрагмент кода:- Прежде всего, пользовательский ZipArchiveMessageHandler должен наследоваться от базового класса MessageHandler. Он имеет две переменные: архив и строковое представление пути к архиву.
Обработчик сообщений имеет концепцию фильтрации. В этом случае добавляется фильтр протокола (схемы); этот обработчик сообщений будет работать только с протоколом “zip”. То есть, если у ресурса протокол “zip”, то он будет обработан ZipArchiveMessageHandler.
Фильтрация сообщений по ресурсному протоколу реализована с помощью класса ProtocolMessageFilter. Конструктор ProtocolMessageFilter() инициализирует новый экземпляр класса ProtocolMessageFilter. Он принимает протоколы
"zip"
в качестве параметра.Метод Invoke() реализует поведение обработчика сообщений. Он вызывается для каждого обработчика в конвейере и принимает «контекст» в качестве параметра. Метод GetFile() определяет логику метода Invoke(). Он реализует цепочку обязанностей, после которой вызывается следующий обработчик Next(
context
). Метод GetFile() реализует поиск данных в виде байтового массива в zip-архиве на основе Request и формирует Response.context
предоставляет контекстную информацию для сетевых служб, через него проходит сущность операции и возвращается результат операции. В Aspose.HTML «контекст» реализуется интерфейсом INetworkOperationContext, который имеет два свойства (параметра) – Request и Response. Request получает или задает сообщение запроса, Response получает или задает ответное сообщение. Запрос содержит информацию для веб-запроса, например, URL-адрес – путь к ресурсу, заголовки и т. д. Response содержит ответ, который вернула конечная точка (Интернет).
Вы можете скачать полные примеры и файлы данных с GitHub.
Добавьте ZipArchiveMessageHandler в конвейер
Теперь вам нужно добавить ZipArchiveMessageHandler в конвейер. Используйте метод Add(), который принимает объект zip в качестве параметра и добавляет ZipArchiveMessageHandler в конец коллекции обработчиков сообщений.
Свойство INetworkService.MessageHandlers получает список экземпляров MessageHandler, которые будут вызываться как RequestMessage выполняется.
1// Add this line before you try to use the 'IBM437' encoding
2System.Text.Encoding.RegisterProvider(System.Text.CodePagesEncodingProvider.Instance);
3
4// Prepare path to a source zip file
5string documentPath = Path.Combine(DataDir, "test.zip");
6
7// Prepare path for converted file saving
8string savePath = Path.Combine(OutputDir, "zip-to-pdf.pdf");
9
10// Create an instance of ZipArchiveMessageHandler
11using var zip = new ZipArchiveMessageHandler(documentPath);
12
13// Create an instance of the Configuration class
14using var configuration = new Configuration();
15
16// Add ZipArchiveMessageHandler to the chain of existing message handlers
17configuration
18 .GetService<INetworkService>()
19 .MessageHandlers.Add(zip);
20
21// Initialize an HTML document with specified configuration
22using var document = new HTMLDocument("zip:///test.html", configuration);
23
24// Create the PDF Device
25using var device = new PdfDevice(savePath);
26
27// Render ZIP to PDF
28document.RenderTo(device);
В примере ZIP-архив (test.zip) содержит HTML-документ (test.html), в котором все связанные ресурсы имеют пути относительно HTML-документа.
Примечание. Конструктор
HTMLDocument(address, configuration
) принимает абсолютный путь к ZIP-архиву. Но все связанные ресурсы имеют относительные пути в документе HTML и в коде примера.
Прочтите статью
Fine-Tuning Convserters, чтобы узнать больше о преобразовании HTML в PDF с помощью
Renderto(device
).
Aspose.HTML предоставляет бесплатный онлайн-конвертер ZIP to PDF Converter, который позволяет быстро, легко и четко конвертировать ZIP в PDF. Загружайте, конвертируйте файлы и получайте результаты за считанные секунды. Никакого дополнительного программного обеспечения не требуется. Попробуйте наш надежный конвертер ZIP в PDF бесплатно прямо сейчас!