Конвертировать HTML в PDF с помощью Python

Преобразование HTML в PDF с помощью Python

Aspose.PDF for Python via .NET позволяет конвертировать существующие HTML‑документы в PDF с гибкими параметрами рендеринга. Вы можете точно настроить процесс создания вывода, чтобы он соответствовал вашим требованиям к макету, стилизации, доступности и архивированию.

Преобразование HTML в PDF

Следующий пример на Python показывает основной рабочий процесс преобразования HTML‑документа в PDF.

  1. Создайте экземпляр HtmlLoadOptions класс.
  2. Инициализируйте a Document объект с исходным HTML‑файлом.
  3. Сохраните выходной PDF документ, вызвав document.save().
import aspose.pdf as ap
from os import path
import sys

def convert_HTML_to_PDF(infile, outfile):
    load_options = ap.HtmlLoadOptions()
    load_options.page_layout_option = ap.HtmlPageLayoutOption.SCALE_TO_PAGE_WIDTH
    document = ap.Document(infile, load_options)
    document.save(outfile)
    print(infile + " converted into " + outfile)

Связанные преобразования

Преобразование HTML в PDF с использованием типа медиа

Этот пример показывает, как преобразовать HTML‑файл в PDF с использованием конкретных параметров рендеринга.

  1. Создайте экземпляр HtmlLoadOptions() класс.
  2. Установите html_media_type для применения CSS-правил, предназначенных для экранных или печатных макетов, таких как HtmlMediaType.SCREEN или HtmlMediaType.PRINT.
  3. Загрузите HTML в ap.Document используя параметры загрузки.
  4. Сохраните документ в формате PDF.
import aspose.pdf as ap
from os import path
import sys

def convert_HTML_to_PDF_media_type(infile, outfile):
    load_options = ap.HtmlLoadOptions()
    load_options.html_media_type = ap.HtmlMediaType.SCREEN
    document = ap.Document(infile, load_options)
    document.save(outfile)
    print(infile + " converted into " + outfile)

Отдать приоритет CSS @page правилу при преобразовании HTML в PDF

Некоторые документы используют @page правило для макета страницы. Если эти стили конфликтуют с другими настройками, вы можете управлять приоритетом с помощью is_priority_css_page_rule.

  1. Создайте экземпляр HtmlLoadOptions класс.
  2. Установите is_priority_css_page_rule = False чтобы другие стили имели приоритет над @page правила.
  3. Загрузите HTML в ap.Document с настроенными параметрами.
  4. Сохраните документ в формате PDF.
import aspose.pdf as ap
from os import path
import sys

def convert_HTML_to_PDF_priority_css_page_rule(infile, outfile):
    load_options = ap.HtmlLoadOptions()
    load_options.is_priority_css_page_rule = False
    document = ap.Document(infile, load_options)
    document.save(outfile)
    print(infile + " converted into " + outfile)

Преобразование HTML в PDF с внедрёнными шрифтами

Этот пример показывает, как преобразовать HTML‑файл в PDF с внедрением шрифтов. Если вам требуется, чтобы итоговый PDF сохранял оригинальную типографику, установите is_embed_fonts к True.

  1. Создайте HtmlLoadOptions() для настройки конвертации HTML в PDF.
  2. Установите is_embed_fonts = True встроить шрифты, используемые в HTML, непосредственно в PDF.
  3. Загрузите HTML в ap.Document с этими параметрами.
  4. Сохраните документ в формате PDF.
import aspose.pdf as ap
from os import path
import sys

def convert_HTML_to_PDF_embed_fonts(infile, outfile):
    load_options = ap.HtmlLoadOptions()
    load_options.is_embed_fonts = True
    document = ap.Document(infile, load_options)
    document.save(outfile)
    print(infile + " converted into " + outfile)

Отобразить HTML‑контент на одной странице PDF

Этот пример демонстрирует, как преобразовать HTML‑файл в одностраничный PDF с использованием Aspose.PDF for Python via .NET. Используйте is_render_to_single_page свойство, когда вы хотите, чтобы весь HTML‑контент отображался на одной непрерывной странице.

  1. Создайте экземпляр HtmlLoadOptions() для настройки процесса конвертации.
  2. Включите is_render_to_single_page отобразить весь HTML‑контент на одной странице.
  3. Загрузите документ с настроенными параметрами в ap.Document.
  4. Сохраните результат как PDF‑файл.
import aspose.pdf as ap
from os import path
import sys

def convert_HTML_to_PDF_render_content_to_same_page(infile, outfile):
    options = ap.HtmlLoadOptions()
    options.is_render_to_single_page = True

    doc = ap.Document(infile, options)
    doc.save(outfile)

Преобразование MHTML в PDF

В этом примере показано, как преобразовать файл MHT или MHTML в PDF документ, используя Aspose.PDF for Python via .NET, с конкретными размерами страниц.

  1. Создайте экземпляр ap.MhtLoadOptions() для настройки обработки файлов MHTML.
  2. Установите различные параметры, такие как размер страницы.
  3. Инициализируйте документ с входным файлом и настроенными параметрами загрузки.
  4. Сохраните полученный документ в формате PDF.
import aspose.pdf as ap
from os import path
import sys

def convert_MHTML_to_PDF(infile, outfile):
    load_options = ap.MhtLoadOptions()
    load_options.page_info.width = 842
    load_options.page_info.height = 1191
    document = ap.Document(infile, load_options)
    document.save(outfile)
    print(infile + " converted into " + outfile)