Конвертировать MHTML в DOCX на Python
Преобразование MHTML в DOCX часто требуется, чтобы использовать преимущества формата DOCX для конкретных задач. Aspose.HTML for Python via .NET предоставляет простой и эффективный способ выполнения этого преобразования с использованием методов convert_mhtml() класса Converter.
В этой статье вы найдете информацию о том, как преобразовать MHTML в DOCX с помощью библиотеки Python Aspose.HTML и как применить DocSaveOptions.
Чтобы продолжить работу с этим руководством, установите и настройте Aspose.HTML for Python via .NET в своем проекте Python.
Онлайн-конвертер MHTML
Вы можете конвертировать MHTML в DOCX с помощью Aspose.HTML for Python via .NET API в режиме реального времени. Загрузите файл MHTML из локальной файловой системы, выберите выходной формат и запустите пример. Преобразование будет выполнено с параметрами сохранения по умолчанию. Вы сразу получите результат конвертации в виде отдельного файла.
Конвертировать MHTML в DOCX с указанием DocSaveOptions
Использование методов convert_mhtml() – наиболее распространенный способ преобразования MHTML в различные форматы. С помощью Aspose.HTML for Python via .NET вы можете программно конвертировать MHTML в формат DOCX с полным контролем над широким диапазоном параметров преобразования.
Чтобы преобразовать MHTML в DOCX с указанием DocSaveOptions, вам необходимо выполнить несколько шагов:
- Откройте существующий файл MHTML. В этом примере мы используем метод
open()
для открытия и чтения MHTML из файловой системы по указанному пути. - Создайте экземпляр класса
DocSaveOptions. Класс DocSaveOptions предоставляет множество свойств, которые дают вам полный контроль над широким диапазоном параметров и улучшают процесс преобразования MHTML в формат DOCX. В этом примере мы используем свойство
page_setup
, которое определяет размер страницы документа DOCX, свойстваdocument_format
иcss.media_type
. - Используйте один из методов convert_mhtml() класса Converter, чтобы сохранить MHTML в виде файла DOCX. В следующем примере метод Convert_mhtml() принимает поток, параметры, путь к выходному файлу save_path и выполняет операцию преобразования.
В следующем примере кода Python показано, как преобразовать MHTML в DOCX с помощью DocSaveOptions:
1import os
2from aspose.html import *
3from aspose.html.converters import *
4from aspose.html.saving import *
5from aspose.html.drawing import *
6
7# Setup directories and define paths
8output_dir = "output/"
9input_dir = "data/"
10if not os.path.exists(output_dir):
11 os.makedirs(output_dir)
12document_path = os.path.join(input_dir, "document.mht")
13save_path = os.path.join(output_dir, "document.docx")
14
15# Open an existing MHTML file for reading
16with open(document_path, "rb") as stream:
17
18 # Create an instance of DocSaveOptions
19 options = DocSaveOptions()
20 options.page_setup.any_page = Page(Size(400, 400), Margin(10, 10, 10, 10))
21 options.document_format.DOCX
22 options.css.media_type.SCREEN
23
24 # Convert MHTML to DOCX
25 Converter.convert_mhtml(stream, options, save_path)
Параметры сохранения – класс DocSaveOptions
Aspose.HTML for Python via .NET позволяет конвертировать MHTML в DOCX, используя параметры сохранения по умолчанию или пользовательские. Класс DocSaveOptions настроен на сохранение документа в формате DOCX и включает в себя следующие свойства:
- page_setup – это свойство позволяет вам определить макет страницы, включая размер страницы, поля и другие аспекты макета, гарантируя, что выходной документ соответствует желаемому формату.
- document_format – это свойство устанавливает формат файла выходного документа. По умолчанию – DOCX.
- horizontal_resolution – это свойство устанавливает или получает горизонтальное разрешение для внутренних изображений в пикселях на дюйм. По умолчанию это 300 dpi. Более высокие разрешения могут обеспечить лучшее качество рендеринга, но больший размер файлов. Это свойство позволяет вам контролировать компромисс между качеством и размером файла.
- vertical_resolution – это свойство устанавливает или получает вертикальное разрешение для изображений в пикселях на дюйм. По умолчанию это 300 dpi. Подобно
horizontal_resolution
, он управляет вертикальным разрешением документов, влияя на их четкость и общий размер. - background_color – это свойство позволяет вам установить цвет фона для отображаемого вывода. Если не установлено, фон по умолчанию является прозрачным.
- css – это свойство получает объект CssOptions, который используется для настройки обработки свойств CSS. Например, свойство
css.media_type
определяет разные стили для разных типов мультимедиа, гарантируя применение правильных правил CSS в зависимости от того, как отображается документ. - font_embedding_rule – это свойство устанавливает правило внедрения шрифтов и контролирует, будут ли шрифты встроены в выходной документ и каким образом. Значение по умолчанию –
NONE
.
Некоторые свойства этого класса наследуют свойства базовых классов, например DocRenderingOptions или RenderingOptions.
Загрузите библиотеку Aspose.HTML for Python via .NET, чтобы успешно, быстро и легко конвертировать документы HTML, MHTML, EPUB, SVG и Markdown в самые популярные форматы.
Aspose.HTML предлагает бесплатный онлайн Конвертер MHTML в DOCX, который конвертирует файлы MHTML в DOCX с высоким качеством, просто и быстро. Просто загрузите, конвертируйте файлы и получите результаты через несколько секунд!