Конвертировать HTML в MHTML на Python

MHTML – это формат архива веб-страниц, который объединяет HTML-код и связанные ресурсы, такие как изображения, таблицы стилей и сценарии, в один файл. Это особенно полезно для архивирования или совместного использования веб-страниц в одном файле. Преобразование HTML в MHTML сохраняет всю структуру и форматирование веб-страницы в том виде, в котором она отображается в браузере, обеспечивая согласованность при открытии файла MHTML. Кроме того, файлы MHTML обеспечивают автономный доступ к веб-страницам, предоставляя удобный способ просмотра контента без подключения к Интернету.

В этой статье вы найдете информацию о том, как преобразовать HTML в MHTML и как использовать MHTMLSaveOptions.

Чтобы продолжить работу с этим руководством, установите и настройте Aspose.HTML for Python via .NET в своем проекте Python. Наши примеры кода помогут вам конвертировать HTML в MHTML и создавать MHTML-файлы с помощью библиотеки Python.

Онлайн-конвертер HTML

Вы можете конвертировать HTML в MHTML с помощью Aspose.HTML for Python via .NET API в режиме реального времени. Сначала загрузите HTML-файл с локального диска или URL-адреса и запустите пример. В этом примере используются параметры сохранения по умолчанию. Вы сразу получите результат конвертации в виде отдельного файла.

                
            

Конвертировать HTML в MHTML

Преобразование файла в другой формат с помощью метода Convert_html() представляет собой последовательность операций, среди которых загрузка и сохранение документа. В следующем примере объясняется, как преобразовать HTML в MHTML:

  1. Загрузите файл HTML, используя класс HTMLDocument.
  2. Создайте экземпляр класса MHTMLSaveOptions для управления параметрами преобразования HTML в MHTML.
  3. Используйте метод convert_html() класса Converter, чтобы сохранить документ HTML в виде файла MHTML. Метод принимает document, options, путь к выходному файлу save_path и выполняет операцию преобразования.

HTML в MHTML с помощью одной строки кода

Методы класса Converter в основном используются как самый простой способ конвертировать HTML-код в различные форматы. Вы можете конвертировать HTML в MHTML в своем приложении Python буквально с помощью одной строки кода!

1from aspose.html import *
2from aspose.html.converters import *
3from aspose.html.saving import *
4
5# Convert HTML to MHTML
6Converter.convert_html("document.html", MHTMLSaveOptions(), "document.mht")

Конвертировать HTML to MHTML с указанием MHTMLSaveOptions

При преобразовании HTML в MHTML вы можете настроить процесс конвертации с помощью MHTMLSaveOptions. Следующий пример кода Python показывает, как создать файл MHTML с пользовательскими параметрами сохранения:

 1import os
 2from aspose.html import *
 3from aspose.html.converters import *
 4from aspose.html.saving import *
 5
 6# Prepare directories and paths
 7output_dir = "output/"
 8if not os.path.exists(output_dir):
 9    os.makedirs(output_dir)
10
11# Prepare HTML code with a link to another file and save it to "document1.html"
12code = "<span>Hello, World!!</span> <a href="document2.html">click</a>"
13with open("document1.html", "w") as file:
14    file.write(code)
15
16# Prepare HTML code and save it to "document2.html"
17code = "<span>Hello, World!!</span>"
18with open("document2.html", "w") as file:
19    file.write(code)
20
21save_path = os.path.join(output_dir, "output-options.mht")
22
23# Change the value of the resource linking depth to 1 in order to convert document with directly linked resources
24options = MHTMLSaveOptions()
25options.resource_handling_options.max_handling_depth = 1
26
27# Convert HTML to MHTML
28Converter.convert_html("document.html", options, save_path)

В приведенном выше примере мы используем свойство max_handling_length = 1, что означает, что будут обрабатываться только страницы, на которые есть прямые ссылки из сохраненного документа.

Параметры сохранения – класс MHTMLSaveOptions

Использование MHTMLSaveOptions позволяет настроить процесс рендеринга. Его свойство ResourceHandlingOptions имеет решающее значение для управления управлением внешними ресурсами, на которые есть ссылки в HTML-документе, в процессе преобразования. Он позволяет вам указать такие параметры, как resource_url_restriction, page_url_restriction, max_handling_length и т. д.

PropertyDescription
page_url_restrictionThis property gets or sets restrictions applied to URLs of handled pages. The default value is ROOT_AND_SUB_FOLDERS.
resource_url_restrictionGets or sets restrictions applied to URLs of handled resources such as CSS, js, images, etc. The default is SAME_HOST.
max_handling_depthDetermines the maximum depth for handling linked resources. This is useful for ensuring that all necessary resources are embedded within the MHTML file, maintaining the integrity and appearance of the original HTML content.

Aspose.HTML предлагает бесплатный онлайн Конвертер HTML в MHTML, который конвертирует HTML в MHTML с высоким качеством, просто и быстро. Просто загрузите, конвертируйте файлы и получите результаты через несколько секунд!

Текст «Конвертер HTML в MHTML»

Subscribe to Aspose Product Updates

Get monthly newsletters & offers directly delivered to your mailbox.