파이썬에서 PDF 아티팩트 계산

특정 유형의 아티팩트 계산

PDF의 페이지 매김 아티팩트 검사 및 계산 Document .NET을 통해 파이썬용 Aspose.PDF 사용.페이지 매김 아티팩트에는 레이아웃 및 식별 목적으로 페이지에 적용되는 워터마크, 배경, 머리글, 바닥글과 같은 요소가 포함됩니다.필터링을 통해 Artifact a에 있는 객체 Page 하위 유형별로 그룹화 (Artifact.ArtifactSubtype) 를 통해 개발자는 문서의 구조를 빠르게 분석하고 특정 요소가 있는지 확인할 수 있습니다.

특정 유형의 아티팩트의 총 개수 (예: 워터마크의 총 수) 를 계산하려면 다음 코드를 사용하십시오.이 예제에서는 페이지의 내용을 필터링합니다. Artifacts 컬렉션 (또는 ArtifactCollection) 에 의해 Artifact.ArtifactType 그런 다음 하위 유형을 계산합니다 (Artifact.ArtifactSubtype).

  1. PDF 문서 열기 (참조 Document).
  2. 페이지를 사용하여 페이지 매김 아티팩트를 필터링합니다. Artifacts 컬렉션.
  3. 하위 유형별 아티팩트 수 계산 (Artifact.ArtifactSubtype).
  4. 결과를 인쇄합니다.

from os import path
from collections import Counter
import sys
import aspose.pdf as ap

def count_pdf_artifacts(infile):
    """Count and display artifacts of different types on the first page."""
    with ap.Document(infile) as document:
        pagination_artifacts = [
            artifact
            for artifact in document.pages[1].artifacts
            if artifact.type == ap.Artifact.ArtifactType.PAGINATION
        ]

        subtypes = [artifact.subtype for artifact in pagination_artifacts]
        counts = Counter(subtypes)

        print(f"Watermarks: {counts.get(ap.Artifact.ArtifactSubtype.WATERMARK, 0)}")
        print(f"Backgrounds: {counts.get(ap.Artifact.ArtifactSubtype.BACKGROUND, 0)}")
        print(f"Headers: {counts.get(ap.Artifact.ArtifactSubtype.HEADER, 0)}")
        print(f"Footers: {counts.get(ap.Artifact.ArtifactSubtype.FOOTER, 0)}")

관련 아티팩트 주제