Конвертировать HTML в PDF на Python
PDF-файл – это документ с фиксированным макетом, который включает в себя текст, графику, гиперссылки, кнопки, поля формы, мультимедиа и другую информацию, необходимую для отображения. PDF-файлы имеют высокий уровень безопасности, что обеспечивает защиту паролем, шифрование и цифровые подписи для защиты конфиденциальной информации. Они также универсально доступны и легко просматриваются на любом устройстве без специального программного обеспечения. Кроме того, PDF-файлы компактны и позволяют сжимать файлы высокого качества в меньшие размеры, что делает их идеальными для совместного использования и хранения.
В этом руководстве вы найдете информацию о том, как преобразовать HTML-документ в формат файла переносимого формата документа (PDF) с помощью Aspose.HTML for Python via .NET. Мы подробно рассмотрим, как конвертировать HTML в PDF с помощью методов convert_html() класса Converter и как применять PdfSaveOptions. Кроме того, вы можете попробовать онлайн-конвертер HTML, чтобы протестировать функциональность Aspose.HTML и конвертировать HTML на лету.
Чтобы продолжить работу с этим руководством, установите и настройте Aspose.HTML for Python via .NET в своем проекте Python. Наши примеры кода помогут вам конвертировать HTML в PDF и создавать PDF-файлы с помощью библиотеки Python.
HTML в PDF с помощью одной строки кода
Методы класса Converter в основном используются как самый простой способ конвертировать HTML-код в различные форматы. Вы можете конвертировать HTML в PDF в своем приложении Python буквально с помощью одной строки кода!
1from aspose.html import *
2from aspose.html.converters import *
3from aspose.html.saving import *
4
5# Convert HTML to PDF
6Converter.convert_html("document.html", PdfSaveOptions(), "document.pdf")
Онлайн HTML Конвертер
Вы можете протестировать возможности Aspose.HTML for Python via .NET и выполнить преобразование HTML в реальном времени. Просто загрузите файл HTML из локальной файловой системы или URL, выберите нужный формат вывода и запустите предоставленный пример кода. В примере используются параметры сохранения по умолчанию. После завершения вы мгновенно получите преобразованный файл в выбранном вами формате.
Конвертировать HTML в PDF с указанием PdfSaveOptions
С помощью Aspose.HTML for Python via .NET вы можете конвертировать файлы программным способом с полным контролем над широким диапазоном параметров преобразования. Чтобы преобразовать HTML в PDF с указанием PdfSaveOptions, вам необходимо выполнить несколько шагов:
- Загрузите HTML-файл, используя один из конструкторов HTMLDocument() класса HTMLDocument. В приведенном выше примере мы инициализируем HTML-документ из файла.
- Создайте новый объект PdfSaveOptions и укажите необходимые свойства. Класс PdfSaveOptions предоставляет множество свойств, которые дают вам полный контроль над широким диапазоном параметров и улучшают процесс преобразования HTML в PDF.
- Используйте метод convert_html() класса Converter. В следующем примере вам необходимо передать HTMLDocument, PdfSaveOptions и путь к выходному файлу методу Convert_html().
В следующем примере кода Python показано, как использовать PdfSaveOptions и создать PDF-файл с настраиваемыми параметрами сохранения:
1import os
2from aspose.html import *
3from aspose.html.converters import *
4from aspose.html.saving import *
5from aspose.html.drawing import *
6from aspose.html.rendering.pdf import *
7
8# Setup directories and define paths
9output_dir = "output/"
10input_dir = "data/"
11if not os.path.exists(output_dir):
12 os.makedirs(output_dir)
13
14document_path = os.path.join(input_dir, "aspose.html")
15save_path = os.path.join(output_dir, "aspose-output.pdf")
16
17# Initialize an HTML document from the file
18document = HTMLDocument(document_path)
19
20# Initialize PdfSaveOptions
21options = PdfSaveOptions()
22options.page_setup.any_page = Page(Size(680, 500), Margin(10, 10, 10, 10))
23options.css.media_type.PRINT
24
25# Convert HTML to PDF
26Converter.convert_html(document, options, save_path)
В этом примере мы преобразуем документ HTML в файл PDF, используя параметры сохранения. Этот процесс включает в себя инициализацию HTML-документа, настройку пользовательских параметров сохранения, таких как размер страницы и css media_type, а затем выполнение преобразования. Наконец, преобразованный PDF-файл сохраняется в указанном выходном каталоге.
Оценить качество конвертации вы можете, попробовав наш продукт. На следующем рисунке показан результат преобразования файла aspose.html в формат PDF:
Класс PDFSaveOptions
Aspose.HTML for Python via .NET предоставляет класс
PdfSaveOptions, который дает вам больше контроля над сохранением документов в формате PDF. Некоторые свойства этого класса наследуют свойства базовых классов, например
PdfRenderingOptions или RenderingOptions. Использование PdfSaveOptions позволяет настроить процесс рендеринга; вы можете указать размер страницы, поля, права доступа к файлу, Css и т. д. Вот описание свойств, доступных в PdfSaveOptions
:
- page_setup – это свойство обеспечивает доступ к объекту PageSetup, используемому для настройки макета и настроек выходных страниц PDF в соответствии с конкретными требованиями к печати или отображению.
- horizontal_resolution – это свойство контролирует горизонтальное разрешение как для внутренних изображений, используемых во время обработки, так и для любых внешних изображений, включенных в HTML. По умолчанию установлено значение 300 dpi.
- vertical_resolution – аналогично свойству
horizontal_resolution
, это свойство управляет вертикальным разрешением внутренних и внешних изображений во время создания PDF-файла. Как и его горизонтальный аналог, по умолчанию оно составляет 300 точек на дюйм. - background_color – это свойство устанавливает или извлекает цвет фона, который заполняет каждую страницу PDF-документа. Значение по умолчанию – transparent, но его можно настроить в соответствии с брендингом или эстетическими предпочтениями, обеспечивая единообразие на всех страницах.
- css – это свойство использует объект CssOptions для настройки обработки свойств CSS во время преобразования HTML в PDF. Это позволяет точно контролировать, как стили HTML интерпретируются и применяются в конечном PDF-файле.
- document_info – это свойство содержит метаданные и информацию о выходном PDF-документе, такую как название, автор, тема и ключевые слова. Эти метаданные помогают управлять документами, индексировать их и обеспечивать возможность поиска, делая PDF-файл более информативным и организованным.
- form_field_behaviour – это свойство определяет поведение полей интерактивной формы в сгенерированном PDF-файле.
- jpeg_quality – это свойство определяет качество сжатия JPEG, используемое для изображений, встроенных в документ PDF. Качество по умолчанию установлено на 95, что обеспечивает хороший баланс между точностью изображения и размером файла. Установка этого свойства позволяет оптимизировать размер файла или качество изображения в соответствии с вашими конкретными потребностями.
- encryption – это свойство предоставляет подробную информацию о шифровании PDF-документа, включая защиту паролем и настройки разрешений. Если оно не настроено, шифрование не применяется, но установка этого свойства позволяет безопасно распространять и контролировать доступ к конфиденциальному содержимому PDF.
- is_tagged_pdf – если установлено значение true, в PDF-документе создается макет с тегами, что повышает доступность для пользователей с ограниченными возможностями. Это гарантирует, что контент правильно структурирован и доступен для навигации с использованием вспомогательных технологий, а также соответствует стандартам доступности.
Преобразование HTML в PDF с использованием свойства form_field_behaviour
Aspose.HTML for Python via .NET предлагает свойство form_field_behaviour класса PdfSaveOptions для выравнивания PDF-документов после их преобразования из HTML или MHTML. Это свойство используется для указания поведения полей формы в документе PDF. Если для параметра установлено значение FormFieldBehaviour.FLATTENED, все поля формы в PDF-документе будут сведены.
1import os
2from aspose.html import *
3from aspose.html.converters import *
4from aspose.html.saving import *
5from aspose.html.rendering.pdf import *
6
7# Setup directories and define paths
8data_dir = "data/"
9output_dir = "output/"
10if not os.path.exists(output_dir):
11 os.makedirs(output_dir)
12source_path = os.path.join(data_dir, "SampleHtmlForm.html")
13result_path = os.path.join(output_dir, "form-flattened.pdf")
14
15# Initialize an HTML document from the file
16document = HTMLDocument(source_path)
17
18# Prepare PDF save options
19options = PdfSaveOptions()
20options.form_field_behaviour = FormFieldBehaviour.FLATTENED
21
22# Convert HTML to PDF
23Converter.convert_html(document, options, result_path)
Как конвертировать HTML в XPS
Aspose.HTML for Python via .NET поддерживает преобразование HTML в XPS. Для этого вам следует использовать
XpsSaveOptions для получения объекта параметров сохранения, который передается методу convert_html()
:
options = XpsSaveOptions()
Использование XpsSaveOptions позволяет настроить процесс рендеринга; вы можете указать свойства page_setup, background_color, css, horizontal_resolution и vertical_resolution.
Загрузите библиотеку Aspose.HTML for Python via .NET, чтобы успешно, быстро и легко конвертировать документы HTML, MHTML, EPUB, SVG и Markdown в самые популярные форматы.
Aspose.HTML предлагает бесплатный онлайн Конвертер HTML в PDF, который конвертирует HTML в PDF с высоким качеством, просто и быстро. Просто загрузите, конвертируйте файлы и получите результат через несколько секунд!