Конвертировать HTML из ZIP-архива в PDF – пример С#

В этой статье мы создадим собственный обработчик сообщений для выполнения конкретной задачи – преобразования HTML из ZIP-архива в PDF.

Есть много причин, по которым вам может понадобиться конвертировать HTML из ZIP-архива в формат PDF. PDF имеет много преимуществ, которых нет у других файлов. Например, многие программы и приложения поддерживают PDF-документы, большинство веб-браузеров, таких как Chrome и Firefox, могут отображать PDF-файлы. PDF-файлы оптимизированы для печати; они идеально подходят для создания физических копий ваших документов. PDF поддерживает множество алгоритмов сжатия. Вы можете настроить параметры безопасности для вашего PDF-файла и т. д.

Создайте собственный обработчик сообщений

Aspose.HTML for .NET предлагает функциональные возможности для создания пользовательских обработчиков сообщений. Давайте разработаем собственный обработчик, который мы можем использовать для работы с ZIP-архивами. Выполните следующие действия:

  1. Используйте необходимое пространство имен, которым является Aspose.Html.Net. Это пространство имен представлено классами и интерфейсами, которые отвечают за упрощение сетевой обработки.

  2. Чтобы создать собственный обработчик сообщений, вам необходимо определить собственный класс, который будет производным от класса MessageHandler. Класс MessageHandler представляет базовый тип для обработчиков сообщений. Наследование от IDisposable необходимо для обеспечения механизма детерминированного освобождения неуправляемых ресурсов.

1using Aspose.Html.Net;
2...
3
4	class ZipArchiveMessageHandler : MessageHandler, IDisposable
5	{
6	}

Итак, вы определили свой собственный класс ZipArchiveMessageHandler, теперь вам нужно проделать в нем некоторые операции.

  1. Инициализируйте экземпляр класса ZipArchiveMessageHandler и определите для него свойство Filter.
  2. Переопределите метод Invoke() класса MessageHandler для реализации пользовательского поведения обработчика сообщений.
 1// This message handler prints a message about start and finish processing request
 2class ZipArchiveMessageHandler : MessageHandler, IDisposable
 3{
 4    private string filePath;
 5    private Archive archive;
 6
 7    // Initialize an instance of the ZipArchiveMessageHandler class
 8    public ZipArchiveMessageHandler(string path)
 9    {
10        this.filePath = path;
11        Filters.Add(new ProtocolMessageFilter("zip"));
12    }
13
14    // Override the Invoke() method
15    public override void Invoke(INetworkOperationContext context)
16    {
17        // Call the GetFile() method that defines the logic in the Invoke() method
18        var buff = GetFile(context.Request.RequestUri.Pathname.TrimStart('/'));
19        if (buff != null)
20        {
21            // Checking: if a resource is found in the archive, then return it as a Response
22            context.Response = new ResponseMessage(HttpStatusCode.OK)
23            {
24                Content = new ByteArrayContent(buff)
25            };
26            context.Response.Headers.ContentType.MediaType = MimeType.FromFileExtension(context.Request.RequestUri.Pathname);
27        }
28        else
29        {
30            context.Response = new ResponseMessage(HttpStatusCode.NotFound);
31        }
32
33        // Call the next message handler
34        Next(context);
35    }           
36
37                
38    byte[] GetFile(string path)
39    {
40        path = path.Replace(@"\", @"/");
41        var result = GetArchive().Entries.FirstOrDefault(x => path == x.Name);
42        if (result != null)
43        {
44            using (var fs = result.Open())
45            using (MemoryStream ms = new MemoryStream())
46            {
47                fs.CopyTo(ms);
48                return ms.ToArray();
49            }
50        }
51        return null;
52    }
53
54    Archive GetArchive()
55    {
56        return archive ??= new Archive(filePath);
57    }
58
59    public void Dispose()
60    {
61        archive?.Dispose();
62    }          
63}

Давайте внимательно посмотрим на этот фрагмент кода:- Прежде всего, пользовательский ZipArchiveMessageHandler должен наследоваться от базового класса MessageHandler. Он имеет две переменные: архив и строковое представление пути к архиву.

Вы можете скачать полные примеры и файлы данных с GitHub.

Добавьте ZipArchiveMessageHandler в конвейер

Теперь вам нужно добавить ZipArchiveMessageHandler в конвейер. Используйте метод Add(), который принимает объект zip в качестве параметра и добавляет ZipArchiveMessageHandler в конец коллекции обработчиков сообщений.

Свойство INetworkService.MessageHandlers получает список экземпляров MessageHandler, которые будут вызываться как RequestMessage выполняется.

 1// Add this line before you try to use the 'IBM437' encoding
 2System.Text.Encoding.RegisterProvider(System.Text.CodePagesEncodingProvider.Instance);
 3
 4// Prepare path to a source zip file
 5string documentPath = Path.Combine(DataDir, "test.zip");
 6
 7// Prepare path for converted file saving
 8string savePath = Path.Combine(OutputDir, "zip-to-pdf.pdf");
 9
10// Create an instance of ZipArchiveMessageHandler
11using var zip = new ZipArchiveMessageHandler(documentPath);
12
13// Create an instance of the Configuration class
14using var configuration = new Configuration();
15
16// Add ZipArchiveMessageHandler to the chain of existing message handlers
17configuration
18    .GetService<INetworkService>()
19    .MessageHandlers.Add(zip);            
20
21// Initialize an HTML document with specified configuration
22using var document = new HTMLDocument("zip:///test.html", configuration);
23
24// Create the PDF Device  
25using var device = new PdfDevice(savePath);
26
27// Render ZIP to PDF
28document.RenderTo(device);

В примере ZIP-архив (test.zip) содержит HTML-документ (test.html), в котором все связанные ресурсы имеют пути относительно HTML-документа.

Примечание. Конструктор HTMLDocument(address, configuration) принимает абсолютный путь к ZIP-архиву. Но все связанные ресурсы имеют относительные пути в документе HTML и в коде примера.

Прочтите статью Fine-Tuning Convserters, чтобы узнать больше о преобразовании HTML в PDF с помощью Renderto(device).

Aspose.HTML предоставляет бесплатный онлайн-конвертер ZIP to PDF Converter, который позволяет быстро, легко и четко конвертировать ZIP в PDF. Загружайте, конвертируйте файлы и получайте результаты за считанные секунды. Никакого дополнительного программного обеспечения не требуется. Попробуйте наш надежный конвертер ZIP в PDF бесплатно прямо сейчас!

Text “Banner ZIP to PDF Converter”

Subscribe to Aspose Product Updates

Get monthly newsletters & offers directly delivered to your mailbox.