MHTML in PDF umwandeln
In diesem Handbuch finden Sie Informationen darüber, wie Sie ein MHTML-Dokument in ein Portable Document Format (PDF) konvertieren können, indem Sie Aspose.HTML for Python via .NET-Bibliothek verwenden. Wir werden im Detail behandeln, wie man MHTML in PDF konvertiert, indem man die convert_mhtml() Methoden der Converter Klasse benutzt und wie man PdfSaveOptions anwendet.
Um mit diesem Tutorial fortzufahren, installieren und konfigurieren Sie Aspose.HTML for Python via .NET in Ihrem Python-Projekt. Unsere Code-Beispiele helfen Ihnen, HTML in PDF zu konvertieren und PDF-Dateien mit Hilfe der Python-Bibliothek zu erzeugen.
Online MHTML Konverter
Sie können die Funktionalität der Python-API testen und MHTML in Echtzeit konvertieren. Laden Sie eine MHTML-Datei von Ihrem lokalen Dateisystem, wählen Sie das Ausgabeformat und führen Sie das Beispiel aus. Die Konvertierung wird mit den Standard-Speicheroptionen durchgeführt. Sie erhalten das Ergebnis sofort in einer separaten Datei.
MHTML in PDF umwandeln mit PdfSaveOptions
Die Verwendung der Methoden Converter.convert_mhtml() ist der gängigste Weg, um MHTML-Code in verschiedene Formate zu konvertieren. Mit Aspose.HTML for Python via .NET können Sie MHTML programmatisch in das PDF-Format konvertieren und haben dabei die volle Kontrolle über eine Vielzahl von Konvertierungsparametern. Sie sollten ein paar Schritte befolgen:
- Öffnen Sie eine vorhandene MHTML-Datei.
- Erstellen Sie eine Instanz der Klasse
PdfSaveOptions. Der Konstruktor
PdfSaveOptions()
initialisiert eine Instanz vonoptions
, die an die Methode convert_mhtml() übergeben wird. - Verwenden Sie die Methode
convert_mhtml(), um MHTML als PDF-Datei zu speichern. Die Methode convert_mhtml() übernimmt die Parameter
stream
,options
und den Pfad der Ausgabedateisave_path
und führt die Konvertierung durch.
Das folgende Python-Codebeispiel zeigt, wie man PdfSaveOptions verwendet und eine PDF-Datei mit benutzerdefinierten Speicheroptionen erstellt:
1import os
2from aspose.html import *
3from aspose.html.converters import *
4from aspose.html.saving import *
5from aspose.html.drawing import *
6from aspose.pydrawing import *
7
8# Setup directories and define paths
9output_dir = "output/"
10input_dir = "data/"
11if not os.path.exists(output_dir):
12 os.makedirs(output_dir)
13document_path = os.path.join(input_dir, "document.mht")
14save_path = os.path.join(output_dir, "document.pdf")
15
16# Open an existing MHTML file for reading
17with open(document_path, "rb") as stream:
18
19 # Create an instance of PdfSaveOptions
20 options = PdfSaveOptions()
21 options.page_setup.any_page = Page(drawing.Size(800, 600), Margin(10, 10, 10, 10))
22 options.css.media_type.PRINT
23 options.jpeg_quality = 100
24
25 # Convert MHTML to PDF
26 Converter.convert_mhtml(stream, options, save_path)
Im obigen Beispiel verwenden wir:
- eigenschaft
page_setup
zur Angabe der Seitengröße und der Ränder (oben, unten, links, rechts); css.media_type
-Eigenschaft, die angibt, wie CSS-Medienabfragen während des Konvertierungsprozesses behandelt werden;jpeg_quality
-Eigenschaft, die die JPEG-Komprimierungsqualität für in ein PDF-Dokument eingebettete Bilder bestimmt.
Speicheroptionen – Klasse PdfSaveOptions
Die Klasse
PdfSaveOptions bietet zahlreiche Eigenschaften, die Ihnen die volle Kontrolle über eine Vielzahl von Parametern geben und den Prozess der Konvertierung von MHTML in das PDF-Format verbessern. Einige Eigenschaften dieser Klasse erben Eigenschaften von Basisklassen, wie
PdfRenderingOptions oder RenderingOptions. Hier ist eine Beschreibung der Eigenschaften, die in PdfSaveOptions
verfügbar sind:
- page_setup – Diese Eigenschaft ermöglicht den Zugriff auf ein PageSetup-Objekt, das zur Konfiguration des Layouts und der Einstellungen der PDF-Ausgabeseiten verwendet wird, um bestimmte Druck- oder Anzeigeanforderungen zu erfüllen.
- horizontal_resolution – Diese Eigenschaft steuert die horizontale Auflösung sowohl für die internen Bilder, die während der Verarbeitung verwendet werden, als auch für alle externen Bilder, die im HTML-Code enthalten sind. Standardmäßig ist sie auf 300 dpi eingestellt.
- vertical_resolution – Ähnlich wie horizontal_resolution verwaltet diese Eigenschaft die vertikale Auflösung für interne und externe Bilder während der PDF-Erzeugung. Wie ihr horizontales Gegenstück ist sie standardmäßig auf 300 dpi eingestellt.
- background_color – Diese Eigenschaft legt die Hintergrundfarbe fest, die jede Seite des PDF-Dokuments füllt, oder ruft sie ab. Der Standardwert ist transparent, kann aber an das Branding oder ästhetische Vorlieben angepasst werden, um Konsistenz auf allen Seiten zu gewährleisten.
- css – Diese Eigenschaft verwendet ein
CssOptions
-Objekt, um die Verarbeitung von CSS-Eigenschaften während der Konvertierung von HTML in PDF zu konfigurieren. Sie ermöglicht eine genaue Kontrolle darüber, wie Stile aus dem HTML interpretiert und in der resultierenden PDF-Datei angewendet werden. - jpeg_quality – Diese Eigenschaft bestimmt die JPEG-Komprimierungsqualität, die für in ein PDF-Dokument eingebettete Bilder verwendet wird. Die Standardqualität ist auf 95 eingestellt und bietet ein gutes Gleichgewicht zwischen Bildtreue und Dateigröße. Wenn Sie diese Eigenschaft einstellen, können Sie die Dateigröße oder die Bildqualität je nach Ihren Anforderungen optimieren.
- encryption – Diese Eigenschaft liefert detaillierte Informationen über die Verschlüsselung von PDF-Dokumenten, einschließlich Passwortschutz und Berechtigungseinstellungen. Wenn sie nicht konfiguriert ist, wird keine Verschlüsselung angewandt. Wenn Sie diese Eigenschaft jedoch einstellen, können Sie den Zugriff auf sensible PDF-Inhalte sicher verteilen und kontrollieren.
- document_info – Diese Eigenschaft enthält Metadaten und Informationen über das PDF-Ausgabedokument, z. B. Titel, Autor, Thema und Schlüsselwörter. Diese Metadaten helfen bei der Dokumentenverwaltung, Indizierung und Durchsuchbarkeit und machen das PDF-Dokument informativer und übersichtlicher.
- form_field_behaviour – Diese Eigenschaft legt das Verhalten interaktiver Formularfelder in der generierten PDF-Datei fest.
- is_tagged_pdf – Wenn diese Option auf true gesetzt ist, wird im PDF-Dokument ein getaggtes Layout erstellt, das die Zugänglichkeit für Benutzer mit Behinderungen verbessert. Dadurch wird sichergestellt, dass der Inhalt ordnungsgemäß strukturiert und mit Hilfe von Hilfstechnologien navigierbar ist und den Zugänglichkeitsstandards entspricht.
Wie konvertiert man MHTML in XPS?
Aspose.HTML for Python via .NET unterstützt die Konvertierung von MHTML in XPS. Dazu sollten Sie
XpsSaveOptions verwenden, um ein Save Options-Objekt zu erhalten, das an die Methode convert_mhtml()
übergeben wird:
options = XpsSaveOptions()
Mit XpsSaveOptions können Sie den Rendering-Prozess anpassen; Sie können die Eigenschaften page_setup, background_color, css, horizontal_resolution und vertical_resolution angeben.
Laden Sie die Bibliothek Aspose.HTML for Python via .NET herunter, um Ihre HTML-, MHTML-, EPUB-, SVG- und Markdown-Dokumente erfolgreich, schnell und einfach in die gängigsten Formate zu konvertieren.
Aspose.HTML bietet einen kostenlosen Online- MHTML zu PDF Konverter, der MHTML in PDF-Dateien mit hoher Qualität, einfach und schnell umwandelt. Einfach hochladen, Ihre Dateien konvertieren und in wenigen Sekunden Ergebnisse erhalten!