Hitung Artefak PDF dalam Python

Menghitung Artefak dari Tipe Tertentu

Periksa dan hitung artefak paginasi dalam PDF Document menggunakan Aspose.PDF for Python via .NET. Artefak paginasi mencakup elemen seperti watermark, latar belakang, header, dan footer yang diterapkan pada halaman untuk tujuan tata letak dan identifikasi. Dengan memfilter Artifact objek pada sebuah Page dan mengelompokkannya berdasarkan subtipe (Artifact.ArtifactSubtype), pengembang dapat dengan cepat menganalisis struktur dokumen dan memverifikasi keberadaan elemen tertentu.

Untuk menghitung jumlah total artefak dari tipe tertentu (misalnya, total watermark), gunakan kode berikut. Contoh ini memfilter halaman Artifacts koleksi (sebuah ArtifactCollection) oleh Artifact.ArtifactType dan kemudian menghitung subtipe (Artifact.ArtifactSubtype).

  1. Buka dokumen PDF (lihat Document).
  2. Filter artefak paginasi menggunakan halaman Artifacts koleksi.
  3. Hitung artefak berdasarkan subtipe (Artifact.ArtifactSubtype).
  4. Cetak hasil.

from os import path
from collections import Counter
import sys
import aspose.pdf as ap

def count_pdf_artifacts(infile):
    """Count and display artifacts of different types on the first page."""
    with ap.Document(infile) as document:
        pagination_artifacts = [
            artifact
            for artifact in document.pages[1].artifacts
            if artifact.type == ap.Artifact.ArtifactType.PAGINATION
        ]

        subtypes = [artifact.subtype for artifact in pagination_artifacts]
        counts = Counter(subtypes)

        print(f"Watermarks: {counts.get(ap.Artifact.ArtifactSubtype.WATERMARK, 0)}")
        print(f"Backgrounds: {counts.get(ap.Artifact.ArtifactSubtype.BACKGROUND, 0)}")
        print(f"Headers: {counts.get(ap.Artifact.ArtifactSubtype.HEADER, 0)}")
        print(f"Footers: {counts.get(ap.Artifact.ArtifactSubtype.FOOTER, 0)}")

Topik Artefak Terkait