Конвертировать MHTML в PDF
В этом руководстве вы найдете информацию о том, как преобразовать документ MHTML в формат файла переносимого формата документа (PDF) с помощью библиотеки Aspose.HTML for Python via .NET. Мы подробно рассмотрим, как конвертировать MHTML в PDF с помощью методов convert_mhtml() класса Converter и как применять PdfSaveOptions.
Чтобы продолжить работу с этим руководством, установите и настройте Aspose.HTML for Python via .NET в своем проекте Python. Наши примеры кода помогут вам конвертировать HTML в PDF и создавать PDF-файлы с помощью библиотеки Python.
Онлайн-конвертер MHTML
Вы можете протестировать функциональность Python API и конвертировать MHTML в режиме реального времени. Загрузите файл MHTML из локальной файловой системы, выберите выходной формат и запустите пример. Преобразование будет выполнено с параметрами сохранения по умолчанию. Вы сразу получите результат в виде отдельного файла.
Конвертировать MHTML в PDF с указанием PdfSaveOptions
Использование методов Converter.convert_mhtml() – наиболее распространенный способ преобразования кода MHTML в различные форматы. С помощью Aspose.HTML for Python via .NET вы можете программно конвертировать MHTML в формат PDF с полным контролем над широким диапазоном параметров преобразования. Вам следует выполнить несколько шагов:
- Откройте существующий файл MHTML.
- Создайте экземпляр класса PdfSaveOptions. Конструктор PdfSaveOptions() инициализирует экземпляр options, который передается методу Convert_mhtml().
- Используйте метод convert_mhtml(), чтобы сохранить MHTML в виде файла PDF. Метод Convert_mhtml() принимает поток, параметры, путь к выходному файлу save_path и выполняет операцию преобразования.
В следующем примере кода Python показано, как использовать PdfSaveOptions и создать PDF-файл с настраиваемыми параметрами сохранения:
1import os
2from aspose.html import *
3from aspose.html.converters import *
4from aspose.html.saving import *
5from aspose.html.drawing import *
6from aspose.pydrawing import *
7
8# Setup directories and define paths
9output_dir = "output/"
10input_dir = "data/"
11if not os.path.exists(output_dir):
12 os.makedirs(output_dir)
13document_path = os.path.join(input_dir, "document.mht")
14save_path = os.path.join(output_dir, "document.pdf")
15
16# Open an existing MHTML file for reading
17with open(document_path, "rb") as stream:
18
19 # Create an instance of PdfSaveOptions
20 options = PdfSaveOptions()
21 options.page_setup.any_page = Page(drawing.Size(800, 600), Margin(10, 10, 10, 10))
22 options.css.media_type.PRINT
23 options.jpeg_quality = 100
24
25 # Convert MHTML to PDF
26 Converter.convert_mhtml(stream, options, save_path)
В приведенном выше примере мы используем:
- свойство
page_setup
для указания размера и полей страницы (сверху, снизу, слева, справа); - Свойство
css.media_type
, которое определяет, как обрабатываются медиа-запросы CSS в процессе преобразования; - свойство
jpeg_quality
, определяющее качество сжатия JPEG, используемое для изображений, встроенных в PDF-документ.
Параметры сохранения – класс PdfSaveOptions
Класс
PdfSaveOptions предоставляет множество свойств, которые дают вам полный контроль над широким диапазоном параметров и улучшают процесс преобразования MHTML в формат PDF. Некоторые свойства этого класса наследуют свойства базовых классов, например
PdfRenderingOptions или RenderingOptions. Вот описание свойств, доступных в PdfSaveOptions
:
- page_setup – это свойство обеспечивает доступ к объекту PageSetup, используемому для настройки макета и настроек выходных страниц PDF в соответствии с конкретными требованиями к печати или отображению.
- horizontal_resolution – это свойство контролирует горизонтальное разрешение как для внутренних изображений, используемых во время обработки, так и для любых внешних изображений, включенных в HTML. По умолчанию установлено значение 300 dpi.
- вертикальное_разрешение – аналогично свойству горизонтальное_разрешение, это свойство управляет вертикальным разрешением внутренних и внешних изображений во время создания PDF-файла. Как и его горизонтальный аналог, по умолчанию оно составляет 300 точек на дюйм.
- background_color – это свойство устанавливает или извлекает цвет фона, который заполняет каждую страницу PDF-документа. Значение по умолчанию – transparent, но его можно настроить в соответствии с брендингом или эстетическими предпочтениями, обеспечивая единообразие на всех страницах.
- css – это свойство использует объект CssOptions для настройки обработки свойств CSS во время преобразования HTML в PDF. Это позволяет точно контролировать, как стили HTML интерпретируются и применяются в конечном PDF-файле.
- jpeg_quality – это свойство определяет качество сжатия JPEG, используемое для изображений, встроенных в документ PDF. Качество по умолчанию установлено на 95, что обеспечивает хороший баланс между точностью изображения и размером файла. Установка этого свойства позволяет оптимизировать размер файла или качество изображения в соответствии с вашими конкретными потребностями.
- encryption – это свойство предоставляет подробную информацию о шифровании PDF-документа, включая защиту паролем и настройки разрешений. Если оно не настроено, шифрование не применяется, но установка этого свойства позволяет безопасно распространять и контролировать доступ к конфиденциальному содержимому PDF.
- document_info – это свойство содержит метаданные и информацию о выходном PDF-документе, такую как название, автор, тема и ключевые слова. Эти метаданные помогают управлять документами, индексировать их и обеспечивать возможность поиска, делая PDF-файл более информативным и организованным.
- form_field_behaviour – это свойство определяет поведение полей интерактивной формы в сгенерированном PDF-файле.
- is_tagged_pdf – если установлено значение true, в PDF-документе создается макет с тегами, что повышает доступность для пользователей с ограниченными возможностями. Это гарантирует, что контент правильно структурирован и доступен для навигации с использованием вспомогательных технологий, а также соответствует стандартам доступности.
Как конвертировать MHTML в XPS
Aspose.HTML for Python via .NET поддерживает преобразование MHTML в XPS. Для этого вам следует использовать
XpsSaveOptions, чтобы получить объект параметров сохранения, который передается методу convert_mhtml()
:
options = XpsSaveOptions()
Использование XpsSaveOptions позволяет настроить процесс рендеринга; вы можете указать свойства page_setup, background_color, css, horizontal_resolution и vertical_resolution.
Загрузите библиотеку Aspose.HTML for Python via .NET, чтобы успешно, быстро и легко конвертировать документы HTML, MHTML, EPUB, SVG и Markdown в самые популярные форматы.
Aspose.HTML предлагает бесплатный онлайн Конвертер MHTML в PDF, который конвертирует файлы MHTML в PDF с высоким качеством, просто и быстро. Просто загрузите, конвертируйте файлы и получите результаты через несколько секунд!