Obtenir les métadonnées PDF

Contents
[ ]

Les documents PDF contiennent souvent des métadonnées précieuses qui décrivent le contenu du document, la paternité et les autorisations. Aspose.PDF fournit une API pratique pour récupérer à la fois les propriétés de métadonnées standard et personnalisées. Cet extrait de code montre comment utiliser le PdfFileInfo classe pour inspecter les fichiers PDF de manière programmatique, y compris des exemples détaillés en Python.

  1. Chargez le fichier PDF.
  2. Récupérer les métadonnées standard.
  3. Vérifier le statut du PDF et la sécurité.
  4. Récupérer les métadonnées personnalisées.
import aspose.pdf as ap
import aspose.pdf.facades as pdf_facades
from io import FileIO

import sys
from os import path

sys.path.append(path.join(path.dirname(__file__), ".."))

from config import set_license, initialize_data_dir


def get_pdf_metadata(infile):

    # Get and display PDF information
    pdf_info = pdf_facades.PdfFileInfo(infile)
    print(f"Subject: {pdf_info.subject}")
    print(f"Title: {pdf_info.title}")
    print(f"Keywords: {pdf_info.keywords}")
    print(f"Creator: {pdf_info.creator}")
    print(f"Creation Date: {pdf_info.creation_date}")
    print(f"Modification Date: {pdf_info.mod_date}")

    # Check PDF status
    print(f"Is Valid PDF: {pdf_info.is_pdf_file}")
    print(f"Is Encrypted: {pdf_info.is_encrypted}")
    print(f"Has Open Password: {pdf_info.has_open_password}")
    print(f"Has Edit Password: {pdf_info.has_edit_password}")
    print(f"Is Portfolio: {pdf_info.has_collection}")

    # Retrieve and display a specific custom attribute
    reviewer = pdf_info.get_meta_info("Reviewer")
    print(f"Reviewer: {reviewer if reviewer else 'No Reviewer metadata found.'}")