Hitung Artefak PDF dalam Python
Menghitung Artefak dari Tipe Tertentu
Periksa dan hitung artefak paginasi dalam PDF Document menggunakan Aspose.PDF for Python via .NET. Artefak paginasi mencakup elemen seperti watermark, latar belakang, header, dan footer yang diterapkan pada halaman untuk tujuan tata letak dan identifikasi. Dengan memfilter Artifact objek pada sebuah Page dan mengelompokkannya berdasarkan subtipe (Artifact.ArtifactSubtype), pengembang dapat dengan cepat menganalisis struktur dokumen dan memverifikasi keberadaan elemen tertentu.
Untuk menghitung jumlah total artefak dari tipe tertentu (misalnya, total watermark), gunakan kode berikut. Contoh ini memfilter halaman Artifacts koleksi (sebuah ArtifactCollection) oleh Artifact.ArtifactType dan kemudian menghitung subtipe (Artifact.ArtifactSubtype).
- Buka dokumen PDF (lihat
Document). - Filter artefak paginasi menggunakan halaman
Artifactskoleksi. - Hitung artefak berdasarkan subtipe (
Artifact.ArtifactSubtype). - Cetak hasil.
from os import path
from collections import Counter
import sys
import aspose.pdf as ap
def count_pdf_artifacts(infile):
"""Count and display artifacts of different types on the first page."""
with ap.Document(infile) as document:
pagination_artifacts = [
artifact
for artifact in document.pages[1].artifacts
if artifact.type == ap.Artifact.ArtifactType.PAGINATION
]
subtypes = [artifact.subtype for artifact in pagination_artifacts]
counts = Counter(subtypes)
print(f"Watermarks: {counts.get(ap.Artifact.ArtifactSubtype.WATERMARK, 0)}")
print(f"Backgrounds: {counts.get(ap.Artifact.ArtifactSubtype.BACKGROUND, 0)}")
print(f"Headers: {counts.get(ap.Artifact.ArtifactSubtype.HEADER, 0)}")
print(f"Footers: {counts.get(ap.Artifact.ArtifactSubtype.FOOTER, 0)}")