Конвертировать MHTML в DOCX – примеры кода Python
Преобразование MHTML в DOCX часто требуется, чтобы использовать преимущества формата DOCX для конкретных задач. Aspose.HTML for Python via .NET предоставляет простой и эффективный способ выполнения этого преобразования с использованием методов convert_mhtml() класса Converter.
В этой статье вы найдете информацию о том, как преобразовать MHTML в DOCX с помощью библиотеки Python Aspose.HTML и как применить DocSaveOptions.
Чтобы продолжить работу с этим руководством, установите и настройте Aspose.HTML for Python via .NET в своем проекте Python.
Онлайн-конвертер MHTML
Вы можете конвертировать MHTML в DOCX с помощью Aspose.HTML for Python via .NET API в режиме реального времени. Загрузите файл MHTML из локальной файловой системы, выберите выходной формат и запустите пример. Преобразование будет выполнено с параметрами сохранения по умолчанию. Вы сразу получите результат конвертации в виде отдельного файла.
Конвертировать MHTML в DOCX с указанием DocSaveOptions
Использование методов convert_mhtml() – наиболее распространенный способ преобразования MHTML в различные форматы. С помощью Aspose.HTML for Python via .NET вы можете программно конвертировать MHTML в формат DOCX с полным контролем над широким диапазоном параметров преобразования.
Чтобы преобразовать MHTML в DOCX с указанием DocSaveOptions, вам необходимо выполнить несколько шагов:
- Откройте существующий файл MHTML. В этом примере мы используем метод
open()для открытия и чтения MHTML из файловой системы по указанному пути. - Создайте экземпляр класса
DocSaveOptions. Класс DocSaveOptions предоставляет множество свойств, которые дают вам полный контроль над широким диапазоном параметров и улучшают процесс преобразования MHTML в формат DOCX. В этом примере мы используем свойство
page_setup, которое определяет размер страницы документа DOCX, свойстваdocument_formatиcss.media_type. - Используйте один из методов convert_mhtml() класса Converter, чтобы сохранить MHTML в виде файла DOCX. В следующем примере метод Convert_mhtml() принимает поток, параметры, путь к выходному файлу save_path и выполняет операцию преобразования.
В следующем примере кода Python показано, как преобразовать MHTML в DOCX с помощью DocSaveOptions:
1# Convert MHTML to DOCX using Python with custom settings
2
3import os
4import aspose.html.converters as conv
5import aspose.html.saving as sav
6import aspose.html.drawing as dr
7
8# Setup directories and define paths
9output_dir = "output/"
10input_dir = "data/"
11os.makedirs(output_dir, exist_ok=True)
12
13document_path = os.path.join(input_dir, "document.mht")
14save_path = os.path.join(output_dir, "document.docx")
15
16# Open an existing MHTML file for reading
17with open(document_path, "rb") as stream:
18
19 # Create an instance of DocSaveOptions
20 options = sav.DocSaveOptions()
21 options.page_setup.any_page.size = dr.Size(1000, 800)
22 options.document_format.DOCX
23 options.css.media_type.SCREEN
24
25 # Convert MHTML to DOCX
26 conv.Converter.convert_mhtml(stream, options, save_path)Параметры сохранения – класс DocSaveOptions
Aspose.HTML for Python via .NET позволяет конвертировать MHTML в DOCX, используя параметры сохранения по умолчанию или пользовательские. Класс DocSaveOptions настроен на сохранение документа в формате DOCX и включает в себя следующие свойства:
- page_setup – это свойство позволяет вам определить макет страницы, включая размер страницы, поля и другие аспекты макета, гарантируя, что выходной документ соответствует желаемому формату.
- document_format – это свойство устанавливает формат файла выходного документа. По умолчанию – DOCX.
- horizontal_resolution – это свойство устанавливает или получает горизонтальное разрешение для внутренних изображений в пикселях на дюйм. По умолчанию это 300 dpi. Более высокие разрешения могут обеспечить лучшее качество рендеринга, но больший размер файлов. Это свойство позволяет вам контролировать компромисс между качеством и размером файла.
- vertical_resolution – это свойство устанавливает или получает вертикальное разрешение для изображений в пикселях на дюйм. По умолчанию это 300 dpi. Подобно
horizontal_resolution, он управляет вертикальным разрешением документов, влияя на их четкость и общий размер. - background_color – это свойство позволяет вам установить цвет фона для отображаемого вывода. Если не установлено, фон по умолчанию является прозрачным.
- css – это свойство получает объект CssOptions, который используется для настройки обработки свойств CSS. Например, свойство
css.media_typeопределяет разные стили для разных типов мультимедиа, гарантируя применение правильных правил CSS в зависимости от того, как отображается документ. - font_embedding_rule – это свойство устанавливает правило внедрения шрифтов и контролирует, будут ли шрифты встроены в выходной документ и каким образом. Значение по умолчанию –
NONE.
Некоторые свойства этого класса наследуют свойства базовых классов, например DocRenderingOptions или RenderingOptions.
Загрузите библиотеку Aspose.HTML for Python via .NET, чтобы успешно, быстро и легко конвертировать документы HTML, MHTML, EPUB, SVG и Markdown в самые популярные форматы.
Aspose.HTML предлагает бесплатный онлайн Конвертер MHTML в DOCX, который конвертирует файлы MHTML в DOCX с высоким качеством, просто и быстро. Просто загрузите, конвертируйте файлы и получите результаты через несколько секунд!
