HTML in PDF konvertieren in Python
Eine PDF-Datei ist ein Dokument mit festem Layout, das Text, Grafiken, Hyperlinks, Schaltflächen, Formularfelder, Multimedia und andere Informationen enthält, die zur Anzeige benötigt werden. PDF-Dateien sind äußerst sicher, da sie durch Passwortschutz, Verschlüsselung und digitale Signaturen geschützt sind. Außerdem sind sie universell zugänglich und können auf jedem Gerät ohne spezielle Software angezeigt werden. Darüber hinaus sind PDFs kompakt und können hochwertige Dateien in kleinere Formate komprimieren, was sie ideal für die gemeinsame Nutzung und Speicherung macht.
In diesem Handbuch finden Sie Informationen darüber, wie Sie ein HTML-Dokument mit Aspose.HTML for Python via .NET in das Dateiformat Portable Document Format (PDF) konvertieren. Wir werden im Detail behandeln, wie man HTML in PDF konvertiert, indem man die convert_html() Methoden der Converter Klasse benutzt und wie man PdfSaveOptions anwendet. Außerdem können Sie einen Online-HTML-Konverter ausprobieren, um die Aspose.HTML-Funktionalität zu testen und HTML on the fly zu konvertieren.
Um mit diesem Tutorial fortzufahren, installieren und konfigurieren Sie Aspose.HTML for Python via .NET in Ihrem Python-Projekt. Unsere Code-Beispiele helfen Ihnen, HTML in PDF zu konvertieren und PDF-Dateien mit Hilfe der Python-Bibliothek zu erzeugen.
HTML zu PDF mit einer einzigen Codezeile
Die Methoden der Klasse Converter dienen in erster Linie als einfachste Möglichkeit, einen HTML-Code in verschiedene Formate zu konvertieren. Sie können HTML in Ihrer Python-Anwendung buchstäblich mit einer einzigen Code-Zeile in PDF umwandeln!
1# Convert HTML to PDF using Python
2
3import aspose.html.converters as conv
4import aspose.html.saving as sav
5
6# Convert HTML to PDF
7conv.Converter.convert_html("document.html", sav.PdfSaveOptions(), "output.pdf")Online HTML-Konverter
Sie können die Leistungsfähigkeit von Aspose.HTML for Python via .NET testen und HTML-Konvertierungen in Echtzeit durchführen. Laden Sie einfach eine HTML-Datei von Ihrem lokalen Dateisystem oder einer URL, wählen Sie das gewünschte Ausgabeformat und führen Sie das mitgelieferte Codebeispiel aus. Das Beispiel verwendet die Standardspeicheroptionen, was einen einfachen Konvertierungsprozess ermöglicht. Nach Abschluss des Vorgangs erhalten Sie die konvertierte Datei sofort im Format Ihrer Wahl.
HTML in PDF konvertieren mit PdfSaveOptions
Mit Aspose.HTML for Python via .NET können Sie Dateien programmatisch konvertieren und haben dabei die volle Kontrolle über eine Vielzahl von Konvertierungsparametern. Um HTML in PDF mit PdfSaveOptions zu konvertieren, sollten Sie ein paar Schritte befolgen:
- Laden Sie eine HTML-Datei mit einem der HTMLDocument()-Konstruktoren der Klasse HTMLDocument. Im obigen Beispiel initialisieren wir ein HTML-Dokument aus einer Datei.
- Erstellen Sie ein neues
PdfSaveOptions Objekt und geben Sie die erforderlichen Eigenschaften an. Die Klasse
PdfSaveOptionsbietet zahlreiche Eigenschaften, die Ihnen die volle Kontrolle über eine breite Palette von Parametern geben und den Prozess der Konvertierung von HTML in PDF verbessern. - Verwenden Sie die Methode
convert_html() der Klasse Converter. Im folgenden Beispiel müssen Sie
HTMLDocument,PdfSaveOptionsund den Pfad der Ausgabedatei an die Methodeconvert_html()übergeben.
Das folgende Python-Codebeispiel zeigt, wie man PdfSaveOptions verwendet und eine PDF-Datei mit benutzerdefinierten Speicheroptionen erstellt:
1# Convert HTML to PDF in Python with custom settings
2
3import os
4import aspose.html as ah
5import aspose.html.converters as conv
6import aspose.html.saving as sav
7import aspose.html.drawing as dr
8import aspose.pydrawing as pd
9import aspose.html.rendering.pdf.encryption as rpe
10
11
12# Setup directories and define paths
13output_dir = "output/"
14input_dir = "data/"
15if not os.path.exists(output_dir):
16 os.makedirs(output_dir)
17document_path = os.path.join(input_dir, "document.html")
18save_path = os.path.join(output_dir, "document-options.pdf")
19
20# Load an HTML document from a file or URL
21doc = ah.HTMLDocument(document_path)
22
23# Initialize saving options
24options = sav.PdfSaveOptions()
25options.page_setup.any_page = dr.Page(dr.Size(800, 600), dr.Margin(10, 10, 10, 10))
26options.css.media_type.PRINT
27options.horizontal_resolution = dr.Resolution.from_dots_per_inch(100.0)
28options.vertical_resolution = dr.Resolution.from_dots_per_inch(100.0)
29options.background_color = pd.Color.bisque
30options.is_tagged_pdf = True
31options.jpeg_quality = 90
32
33doc_info = options.document_info
34doc_info.title = "Aspose HTML Example"
35doc_info.author = "Your Name"
36doc_info.subject = "PDF Conversion"
37doc_info.keywords = "Aspose, HTML, PDF"
38
39options.encryption = rpe.PdfEncryptionInfo(
40 user_password="user123",
41 owner_password="owner123",
42 permissions=rpe.PdfPermissions.PRINT_DOCUMENT | rpe.PdfPermissions.EXTRACT_CONTENT,
43 encryption_algorithm=rpe.PdfEncryptionAlgorithm.RC4_128
44)
45
46# Convert HTML to PDF
47conv.Converter.convert_html(doc, options, save_path)In diesem Beispiel wird ein HTML-Dokument mithilfe von Speicheroptionen in eine PDF-Datei konvertiert. Dazu wird das HTML-Dokument initialisiert, benutzerdefinierte Speicheroptionen wie Seitengröße und css media_type festgelegt und dann die Konvertierung durchgeführt. Abschließend wird die konvertierte PDF-Datei in einem angegebenen Ausgabeverzeichnis gespeichert.
Sie können die Qualität der Konvertierung beurteilen, indem Sie unser Produkt ausprobieren. Die folgende Abbildung zeigt das Ergebnis der Konvertierung einer aspose.html Datei in das PDF-Format:

PdfSaveOptions-Klasse
Aspose.HTML for Python via .NET bietet die Klasse
PdfSaveOptions, die Ihnen mehr Kontrolle darüber gibt, wie Dokumente im PDF-Format gespeichert werden. Einige Eigenschaften dieser Klasse erben Eigenschaften von Basisklassen, wie
PdfRenderingOptions oder RenderingOptions. die Verwendung von PdfSaveOptions ermöglicht es Ihnen, den Rendering-Prozess anzupassen; Sie können die Seitengröße, die Ränder, die Dateiberechtigungen, Css usw. angeben. Es folgt eine Beschreibung der in PdfSaveOptions verfügbaren Eigenschaften:
- page_setup – Diese Eigenschaft bietet Zugriff auf ein PageSetup-Objekt, das verwendet wird, um das Layout und die Einstellungen der PDF-Ausgabeseiten so zu konfigurieren, dass sie bestimmten Druck- oder Anzeigeanforderungen entsprechen.
- horizontal_resolution – Diese Eigenschaft steuert die horizontale Auflösung sowohl für die internen Bilder, die während der Verarbeitung verwendet werden, als auch für alle externen Bilder, die im HTML-Code enthalten sind. Standardmäßig ist sie auf 300 dpi eingestellt.
- vertical_resolution – Ähnlich wie horizontal_resolution verwaltet diese Eigenschaft die vertikale Auflösung für interne und externe Bilder während der PDF-Erzeugung. Wie ihr horizontales Gegenstück ist sie standardmäßig auf 300 dpi eingestellt.
- background_color – Diese Eigenschaft legt die Hintergrundfarbe fest, die jede Seite des PDF-Dokuments füllt, oder ruft sie ab. Der Standardwert ist transparent, kann aber an das Branding oder ästhetische Vorlieben angepasst werden, um Konsistenz auf allen Seiten zu gewährleisten.
- css – Diese Eigenschaft verwendet ein
CssOptions-Objekt, um die Verarbeitung von CSS-Eigenschaften während der Konvertierung von HTML in PDF zu konfigurieren. Sie ermöglicht eine genaue Kontrolle darüber, wie Stile aus dem HTML interpretiert und in der resultierenden PDF-Datei angewendet werden. - document_info – Diese Eigenschaft enthält Metadaten und Informationen über das PDF-Ausgabedokument, z. B. Titel, Autor, Thema und Schlüsselwörter. Diese Metadaten helfen bei der Dokumentenverwaltung, Indizierung und Durchsuchbarkeit und machen das PDF-Dokument informativer und übersichtlicher.
- form_field_behaviour – Diese Eigenschaft legt das Verhalten interaktiver Formularfelder in der generierten PDF-Datei fest.
- jpeg_quality – Diese Eigenschaft bestimmt die JPEG-Komprimierungsqualität, die für in ein PDF-Dokument eingebettete Bilder verwendet wird. Die Standardqualität ist auf 95 eingestellt und bietet ein gutes Gleichgewicht zwischen Bildtreue und Dateigröße. Wenn Sie diese Eigenschaft einstellen, können Sie die Dateigröße oder die Bildqualität je nach Ihren Anforderungen optimieren.
- encryption – Diese Eigenschaft liefert detaillierte Informationen über die Verschlüsselung von PDF-Dokumenten, einschließlich Passwortschutz und Berechtigungseinstellungen. Wenn sie nicht konfiguriert ist, wird keine Verschlüsselung angewandt. Wenn Sie diese Eigenschaft jedoch einstellen, können Sie den Zugriff auf sensible PDF-Inhalte sicher verteilen und kontrollieren.
- is_tagged_pdf – Bei true wird ein getaggtes Layout im PDF-Dokument erstellt, um die Zugänglichkeit für Benutzer mit Behinderungen zu verbessern. Dadurch wird sichergestellt, dass der Inhalt ordnungsgemäß strukturiert und mit Hilfe von Hilfstechnologien navigierbar ist und den Zugänglichkeitsstandards entspricht.
HTML-zu-PDF-Konvertierung und PDF-Flattening
Aspose.HTML for Python via .NET bietet die Eigenschaft
form_field_behaviour der Klasse PdfSaveOptions, um PDF-Dokumente nach ihrer Konvertierung aus HTML oder MHTML zu glätten. Diese Eigenschaft wird verwendet, um das Verhalten von Formularfeldern in einem PDF-Dokument festzulegen. Wenn der Wert auf FormFieldBehaviour.FLATTENED gesetzt ist, werden alle Formularfelder im PDF-Dokument reduziert.
1# Flatten PDF during HTML to PDF conversion using Python
2
3import os
4import aspose.html as ah
5import aspose.html.converters as conv
6import aspose.html.saving as sav
7import aspose.html.rendering.pdf as rp
8
9# Setup directories and define paths
10data_dir = "data/"
11output_dir = "output/"
12os.makedirs(output_dir, exist_ok=True)
13
14source_path = os.path.join(data_dir, "SampleHtmlForm.html")
15result_path = os.path.join(output_dir, "form-flattened.pdf")
16
17# Load an HTML document
18doc = ah.HTMLDocument(source_path)
19
20# Initialize PdfSaveOptions
21options = sav.PdfSaveOptions()
22options.form_field_behaviour = rp.FormFieldBehaviour.FLATTENED
23
24# Convert HTML to PDF
25conv.Converter.convert_html(doc, options, result_path)Wie konvertiert man HTML in XPS?
Aspose.HTML for Python via .NET unterstützt die Umwandlung von HTML in XPS. Dazu sollten Sie
XpsSaveOptions verwenden, um ein Save Options-Objekt zu erhalten, das an die Methode convert_html() übergeben wird:
optionen = XpsSaveOptions()`
Mit XpsSaveOptions können Sie den Rendering-Prozess anpassen; Sie können die Eigenschaften page_setup, background_color, css, horizontal_resolution und vertical_resolution angeben.
Laden Sie die Bibliothek Aspose.HTML for Python via .NET herunter, um Ihre HTML-, MHTML-, EPUB-, SVG- und Markdown-Dokumente erfolgreich, schnell und einfach in die gängigsten Formate zu konvertieren.
Aspose.HTML bietet einen kostenlosen Online HTML zu PDF Konverter, der HTML in PDF mit hoher Qualität, einfach und schnell konvertiert. Einfach hochladen, Ihre Dateien konvertieren und das Ergebnis in wenigen Sekunden erhalten!
