تبدیل PDF به سایر فرمت های سند

Aspose.Words می تواند حتی فرمت پیچیده ای مانند PDF را بارگیری کند. این فرصت‌های جدیدی را باز می‌کند: امکان تبدیل PDF به Word یا فرمت‌های دیگر که کاربران را در حل بسیاری از مشکلات کاربردی بسیار جلوتر می‌آورد، وجود دارد.

پیش نیازها

  • ارجاع به بسته Aspose.Words یا به Aspose.Words.Pdf2Word.dll اضافه شد.
  • حداقل .NET Framework 4.6.1 یا .NET Standard 2.0. اهدافی مانند .NET Core 2.x یا 3.0، .NET 5 و Xamarin نیز از طریق سازگاری با .NET Standard پشتیبانی می شوند.

تبدیل PDF به فرمت های مختلف

محبوب ترین تبدیل از PDF تبدیل به فرمت های Microsoft Word مانند DOCX، DOC و همچنین فرمت های تصویر مانند JPG یا PNG است. با این گفته، تبدیل یک سند از یک فرمت به فرمت دیگر به روشی آشنا انجام می شود.

مثال کد زیر نحوه تبدیل یک سند از PDF به DOCX را نشان می دهد:

هنگام وارد کردن PDF {#specify-load-options-when-importing-pdf} گزینه های بارگذاری را مشخص کنید

Aspose.Words کلاس PdfLoadOptions را در اختیار شما قرار می دهد که امکان کنترل دقیق تری بر نحوه بارگذاری اسناد PDF را فراهم می کند.

اکثر ویژگی ها ویژگی هایی را که از قبل در کلاس LoadOptions وجود دارد به ارث می برند یا اضافه بار می کنند. علاوه بر آنها، تعدادی ویژگی برای فرمت PDF مشخص شده است. به عنوان مثال، می‌توانید از ویژگی‌های PageCount و PageIndex برای تعریف محدوده صفحه‌ای که باید از یک سند PDF بارگذاری شود، و از ویژگی‌های SkipPdfImages برای کنترل اینکه آیا تصاویر هنگام بارگیری PDF باید نادیده گرفته شوند یا خیر، استفاده کنید. یکی دیگر از پارامترهای پشتیبانی شده Password است که باید برای اسناد محافظت شده با رمز عبور ارائه شود.

محتوای PDF پشتیبانی شده

افزونه PDF2Word در حال حاضر از انواع داده های زیر پشتیبانی می کند:

  • پاراگراف متن
  • تصاویر
  • جداول
  • لیست ها
  • سرصفحه ها و پاورقی ها
  • پانویسها و منابع
  • شماره صفحات
  • متن از راست به چپ (با برخی محدودیت ها)
  • PDF های قابل جستجو (تصاویر جلویی به نفع متن پس زمینه حذف خواهند شد)

ویژگی های آینده

برخی از ویژگی ها هنوز در مراحل اولیه توسعه هستند یا در نقشه راه توسعه گنجانده شده اند:

  • فهرست مطالب
  • OCR برای PDF های قابل جستجو و غیر قابل جستجو
  • گزارش پیشرفت
  • متن چند ستونی
  • فرمول های ریاضی
  • فیلدهای خودکار بیشتر (علاوه بر PAGE و NUMPAGES)

استثناهای بارگذاری PDF

در طول تبدیل سند PDF، یکی از استثناهای زیر ممکن است رخ دهد:

استثنا شرح
FileLoadException فایل PDF به دلایلی قابل پردازش نیست.
مشکل را برای بررسی دقیق به تیم توسعه گزارش دهید
DrmProtectedFileException یک فایل PDF توسط Adobe DRM محافظت می شود و نمی تواند توسط Pdf2Word رمزگشایی شود
PasswordProtectedFileException رمز عبور صحیح باید برای PDF محافظت شده با رمز عبور ارائه شود

همچنین ببینید