MHTML in DOCX konvertieren – Python Code Beispiele
Die Konvertierung von MHTML nach DOCX ist oft erforderlich, um die Vorteile des DOCX-Formats für bestimmte Aufgaben zu nutzen. Aspose.HTML for Python via .NET bietet eine einfache und effiziente Möglichkeit, diese Konvertierung mit den Methoden convert_mhtml() der Klasse Converter durchzuführen.
In diesem Artikel finden Sie Informationen zur Konvertierung von MHTML in DOCX mit der Aspose.HTML Python-Bibliothek und zur Anwendung von DocSaveOptions.
Um mit diesem Tutorial fortzufahren, installieren und konfigurieren Sie Aspose.HTML for Python via .NET in Ihrem Python-Projekt.
Online MHTML Konverter
Sie können MHTML mit Aspose.HTML for Python via .NET API in Echtzeit in DOCX konvertieren. Laden Sie eine MHTML-Datei aus einem lokalen Dateisystem, wählen Sie das Ausgabeformat und starten Sie das Beispiel. Die Konvertierung wird mit den Standard-Speicheroptionen durchgeführt. Sie erhalten das Konvertierungsergebnis sofort als separate Datei.
MHTML in DOCX umwandeln mit DocSaveOptions
Die Verwendung von convert_mhtml() Methoden ist der gängigste Weg, um MHTML in verschiedene Formate zu konvertieren. Mit Aspose.HTML for Python via .NET können Sie MHTML programmatisch in das DOCX-Format konvertieren und haben dabei die volle Kontrolle über eine Vielzahl von Konvertierungsparametern.
Um MHTML in DOCX zu konvertieren und dabei DocSaveOptions
anzugeben, sollten Sie einige Schritte befolgen:
- Öffnen Sie eine vorhandene MHTML-Datei. In diesem Beispiel verwenden wir die Methode
open()
, um MHTML aus einem Dateisystem unter dem angegebenen Pfad zu öffnen und zu lesen. - Erstellen Sie eine Instanz der Klasse
DocSaveOptions. Die Klasse DocSaveOptions bietet zahlreiche Eigenschaften, die Ihnen die volle Kontrolle über eine Vielzahl von Parametern geben und den Prozess der Umwandlung von MHTML in das DOCX-Format verbessern. In diesem Beispiel verwenden wir die Eigenschaft
page_setup
, die die Seitengröße des DOCX-Dokuments angibt, sowie die Eigenschaften “document_format” undcss.media_type
. - Verwenden Sie eine der Methoden
convert_mhtml() der Klasse
Converter, um MHTML als DOCX-Datei zu speichern. Im folgenden Beispiel nimmt die Methode
convert_mhtml()
die Parameterstream
,options
und den Pfad der Ausgabedateisave_path
und führt die Konvertierung durch.
Das folgende Python-Codebeispiel zeigt, wie man MHTML mit DocSaveOptions in DOCX konvertiert:
1import os
2from aspose.html import *
3from aspose.html.converters import *
4from aspose.html.saving import *
5from aspose.html.drawing import *
6
7# Setup directories and define paths
8output_dir = "output/"
9input_dir = "data/"
10if not os.path.exists(output_dir):
11 os.makedirs(output_dir)
12document_path = os.path.join(input_dir, "document.mht")
13save_path = os.path.join(output_dir, "document.docx")
14
15# Open an existing MHTML file for reading
16with open(document_path, "rb") as stream:
17
18 # Create an instance of DocSaveOptions
19 options = DocSaveOptions()
20 options.page_setup.any_page = Page(Size(400, 400), Margin(10, 10, 10, 10))
21 options.document_format.DOCX
22 options.css.media_type.SCREEN
23
24 # Convert MHTML to DOCX
25 Converter.convert_mhtml(stream, options, save_path)
Speicheroptionen – Klasse DocSaveOptions
Aspose.HTML for Python via .NET ermöglicht die Konvertierung von MHTML in DOCX mit Standard- oder benutzerdefinierten Speicheroptionen. die Klasse DocSaveOptions ist so konfiguriert, dass sie das Dokument als DOCX speichert, und sie enthält die folgenden Eigenschaften:
- page_setup – Mit dieser Eigenschaft können Sie das Layout der Seite definieren, einschließlich Seitengröße, Ränder und andere Layoutaspekte, um sicherzustellen, dass das Ausgabedokument dem gewünschten Format entspricht.
- document_format – Diese Eigenschaft legt das Dateiformat des Ausgabedokuments fest. Die Vorgabe ist DOCX.
- horizontal_resolution – Mit dieser Eigenschaft wird die horizontale Auflösung für interne Bilder in Pixeln pro Zoll festgelegt oder abgerufen. Standardmäßig beträgt sie 300 dpi. Höhere Auflösungen können eine bessere Rendering-Qualität, aber größere Dateigrößen erzeugen. Mit dieser Eigenschaft können Sie die Abwägung zwischen Qualität und Dateigröße steuern.
- vertical_resolution – Diese Eigenschaft legt die vertikale Auflösung für interne Bilder in Pixeln pro Zoll fest oder ruft sie ab. Standardmäßig beträgt sie 300 dpi. Ähnlich wie bei
horizontal_resolution
wird damit die vertikale Auflösung von Dokumenten gesteuert, was sich auf deren Klarheit und Gesamtgröße auswirkt. - background_color – Mit dieser Eigenschaft können Sie die Hintergrundfarbe für die gerenderte Ausgabe festlegen. Wenn sie nicht gesetzt ist, ist der Standardhintergrund transparent.
- css – Diese Eigenschaft ruft ein CssOptions-Objekt ab, das zur Konfiguration der Verarbeitung von CSS-Eigenschaften verwendet wird. Die Eigenschaft
css.media_type
legt beispielsweise unterschiedliche Stile für verschiedene Medientypen fest und stellt sicher, dass die richtigen CSS-Regeln je nach Art der Darstellung des Dokuments angewendet werden. - font_embedding_rule – Diese Eigenschaft legt die Regel für die Einbettung von Schriftarten fest und steuert, ob und wie Schriftarten in das Ausgabedokument eingebettet werden. Der Standardwert ist
NONE
.
Einige Eigenschaften dieser Klasse erben Eigenschaften von Basisklassen, wie DocRenderingOptions oder RenderingOptions.
Laden Sie die Bibliothek Aspose.HTML for Python via .NET herunter, um Ihre HTML-, MHTML-, EPUB-, SVG- und Markdown-Dokumente erfolgreich, schnell und einfach in die gängigsten Formate zu konvertieren.
Aspose.HTML bietet einen kostenlosen Online MHTML zu DOCX Konverter, der MHTML in DOCX Dateien mit hoher Qualität, einfach und schnell konvertiert. Einfach hochladen, Ihre Dateien konvertieren und in wenigen Sekunden Ergebnisse erhalten!