عد مصنوعات PDF في بايثون

عد القطع الأثرية من نوع معين

فحص وإحصاء آثار ترقيم الصفحات في ملف PDF Document باستخدام Aspose.PDF لبيثون عبر.NET. تتضمن عناصر ترقيم الصفحات عناصر مثل العلامات المائية والخلفيات والرؤوس والتذييلات التي يتم تطبيقها على الصفحات لأغراض التخطيط والتعريف. عن طريق التصفية Artifact الكائنات الموجودة على Page وتجميعها حسب النوع الفرعي (Artifact.ArtifactSubtype)، يمكن للمطورين تحليل بنية المستند بسرعة والتحقق من وجود عناصر محددة.

لحساب العدد الإجمالي للقطع الأثرية من نوع معين (على سبيل المثال، العدد الإجمالي للعلامات المائية)، استخدم التعليمة البرمجية التالية. يقوم المثال بتصفية الصفحات Artifacts مجموعة (و) ArtifactCollection) بواسطة Artifact.ArtifactType ثم يحسب الأنواع الفرعية (Artifact.ArtifactSubtype).

  1. افتح وثيقة PDF (انظر Document).
  2. تصفية عناصر ترقيم الصفحات باستخدام الصفحة Artifacts مجموعة.
  3. عد القطع الأثرية حسب النوع الفرعي (Artifact.ArtifactSubtype).
  4. نتائج الطباعة.

from os import path
from collections import Counter
import sys
import aspose.pdf as ap

def count_pdf_artifacts(infile):
    """Count and display artifacts of different types on the first page."""
    with ap.Document(infile) as document:
        pagination_artifacts = [
            artifact
            for artifact in document.pages[1].artifacts
            if artifact.type == ap.Artifact.ArtifactType.PAGINATION
        ]

        subtypes = [artifact.subtype for artifact in pagination_artifacts]
        counts = Counter(subtypes)

        print(f"Watermarks: {counts.get(ap.Artifact.ArtifactSubtype.WATERMARK, 0)}")
        print(f"Backgrounds: {counts.get(ap.Artifact.ArtifactSubtype.BACKGROUND, 0)}")
        print(f"Headers: {counts.get(ap.Artifact.ArtifactSubtype.HEADER, 0)}")
        print(f"Footers: {counts.get(ap.Artifact.ArtifactSubtype.FOOTER, 0)}")

موضوعات القطع الأثرية ذات الصلة