العمل مع البيانات الوصفية لملف PDF في Python
استخدم هذا الدليل عندما تحتاج إلى فحص خصائص المستند أو تحديث معلومات ملف PDF للبحث أو الفهرسة أو إدارة بيانات XMP الوصفية برمجيًا في Python.
احصل على معلومات ملف PDF
يوضح مقتطف الشفرة هذا كيفية استخراج البيانات الوصفية من مستند PDF باستخدام Aspose.PDF لـ Python عبر .NET. من خلال الوصول إلى خاصية المعلومات الخاصة بكائن المستند، فإنه يسترد المعلومات الأساسية مثل المؤلف وتاريخ الإنشاء والكلمات الأساسية وتاريخ التعديل والموضوع والعنوان. هذه الوظيفة ضرورية للتطبيقات التي تتطلب فهرسة المستندات أو تحسين البحث أو التحقق من خصائص المستند.
- افتح ملف PDF باستخدام فئة المستند
- استرجع البيانات الوصفية للمستند من خلال خاصية المعلومات
- عرض معلومات البيانات الوصفية. اطبع حقول البيانات الوصفية المطلوبة
import aspose.pdf as ap
import datetime
import sys
from os import path
def get_pdf_file_information(infile):
# Open PDF document
document = ap.Document(infile)
# Get document information
doc_info = document.info
# Display document information
print(f"Author: {doc_info.author}")
print(f"Creation Date: {doc_info.creation_date}")
print(f"Keywords: {doc_info.keywords}")
print(f"Modify Date: {doc_info.mod_date}")
print(f"Subject: {doc_info.subject}")
print(f"Title: {doc_info.title}")
قم بتعيين معلومات ملف PDF
يسمح لك Aspose.PDF لـ Python عبر .NET بتعيين معلومات خاصة بالملف لملف PDF ومعلومات مثل المؤلف وتاريخ الإنشاء والموضوع والعنوان. لتعيين هذه المعلومات:
- افتح ملف PDF باستخدام فئة المستند.
- قم بإنشاء معلومات المستند الكائن وتعيين خصائص البيانات الوصفية المطلوبة.
- احفظ التغييرات على ملف PDF جديد باستخدام طريقة الحفظ.
يوضح لك مقتطف الشفرة التالي كيفية تعيين معلومات ملف PDF.
import aspose.pdf as ap
import datetime
import sys
from os import path
def set_file_information(infile, outfile):
# Open PDF document
document = ap.Document(infile)
# Specify document information
doc_info = ap.DocumentInfo(document)
doc_info.author = "Aspose"
doc_info.creation_date = datetime.datetime.now()
doc_info.keywords = "Aspose.Pdf, DOM, API"
doc_info.mod_date = datetime.datetime.now()
doc_info.subject = "PDF Information"
doc_info.title = "Setting PDF Document Information"
doc_info.producer = "Custom producer"
doc_info.creator = "Custom creator"
# Save PDF document
document.save(outfile)
قم بتعيين بيانات XMP الأولية في ملف PDF
يوضح مقتطف الشفرة هذا كيفية تعيين بيانات XMP الوصفية أو تحديثها برمجيًا في مستند PDF باستخدام Aspose.PDF لـ Python عبر .NET. من خلال تعديل خصائص مثل XMP:createDate و XMP: الاسم المستعار والحقول المحددة حسب الطلب، يمكنك تضمين بيانات وصفية موحدة في ملفات PDF الخاصة بك. هذا الأسلوب مفيد بشكل خاص لتعزيز تنظيم المستندات وتسهيل إمكانية البحث ودمج المعلومات الأساسية مباشرة في الملف.
يسمح لك Aspose.PDF بتعيين البيانات الوصفية في ملف PDF. لتعيين البيانات الوصفية:
- افتح ملف PDF باستخدام مستند فئة.
- قم بتعديل بيانات XMP الأولية عن طريق تعيين قيم لمفاتيح محددة.
- احفظ مستند PDF المحدث.
يوضح لك مقتطف الشفرة التالي كيفية تعيين البيانات الوصفية في ملف PDF.
import aspose.pdf as ap
import datetime
import sys
from os import path
def set_xmp_metadata(infile, outfile):
# Open PDF document
document = ap.Document(infile)
# Set XMP metadata properties
document.metadata.add("xmp:CreateDate", datetime.datetime.now().isoformat())
document.metadata.add("xmp:Nickname", "Nickname")
document.metadata.add("xmp:CustomProperty", "Custom Value")
# Save the updated PDF document
document.save(outfile)
إدراج بيانات التعريف باستخدام البادئة
يحتاج بعض المطورين إلى إنشاء مساحة اسم بيانات تعريف جديدة باستخدام بادئة. يوضح مقتطف الشفرة التالي كيفية إدراج البيانات الوصفية بالبادئة.
import aspose.pdf as ap
import datetime
import sys
from os import path
def set_prefix_metadata(infile, outfile):
# Open PDF document
document = ap.Document(infile)
# Register a namespace URI for the 'xmp' prefix
document.metadata.register_namespace_uri("xmp", "http://ns.adobe.com/xap/1.0/")
# Set the metadata property using the registered prefix
document.metadata.add(
"xmp:ModifyDate", datetime.datetime.now().isoformat()
) # ISO 8601 format
# Save the updated PDF document
document.save(outfile)