تبدیل PDF به سایر فرمت های سند
Aspose.Words می تواند حتی فرمت پیچیده ای مانند PDF را بارگیری کند. این فرصتهای جدیدی را باز میکند: امکان تبدیل PDF به Word یا فرمتهای دیگر که کاربران را در حل بسیاری از مشکلات کاربردی بسیار جلوتر میآورد، وجود دارد.
پیش نیازها
- ارجاع به بسته Aspose.Words یا به Aspose.Words.Pdf2Word.dll اضافه شد.
- حداقل .NET Framework 4.6.1 یا .NET Standard 2.0. اهدافی مانند .NET Core 2.x یا 3.0، .NET 5 و Xamarin نیز از طریق سازگاری با .NET Standard پشتیبانی می شوند.
تبدیل PDF به فرمت های مختلف
محبوب ترین تبدیل از PDF تبدیل به فرمت های Microsoft Word مانند DOCX، DOC و همچنین فرمت های تصویر مانند JPG یا PNG است. با این گفته، تبدیل یک سند از یک فرمت به فرمت دیگر به روشی آشنا انجام می شود.
مثال کد زیر نحوه تبدیل یک سند از PDF به DOCX را نشان می دهد:
هنگام وارد کردن PDF {#specify-load-options-when-importing-pdf} گزینه های بارگذاری را مشخص کنید
Aspose.Words کلاس PdfLoadOptions را در اختیار شما قرار می دهد که امکان کنترل دقیق تری بر نحوه بارگذاری اسناد PDF را فراهم می کند.
اکثر ویژگی ها ویژگی هایی را که از قبل در کلاس LoadOptions
وجود دارد به ارث می برند یا اضافه بار می کنند. علاوه بر آنها، تعدادی ویژگی برای فرمت PDF مشخص شده است. به عنوان مثال، میتوانید از ویژگیهای PageCount و PageIndex برای تعریف محدوده صفحهای که باید از یک سند PDF بارگذاری شود، و از ویژگیهای SkipPdfImages برای کنترل اینکه آیا تصاویر هنگام بارگیری PDF باید نادیده گرفته شوند یا خیر، استفاده کنید. یکی دیگر از پارامترهای پشتیبانی شده Password است که باید برای اسناد محافظت شده با رمز عبور ارائه شود.
محتوای PDF پشتیبانی شده
افزونه PDF2Word در حال حاضر از انواع داده های زیر پشتیبانی می کند:
- پاراگراف متن
- تصاویر
- جداول
- لیست ها
- سرصفحه ها و پاورقی ها
- پانویسها و منابع
- شماره صفحات
- متن از راست به چپ (با برخی محدودیت ها)
- PDF های قابل جستجو (تصاویر جلویی به نفع متن پس زمینه حذف خواهند شد)
ویژگی های آینده
برخی از ویژگی ها هنوز در مراحل اولیه توسعه هستند یا در نقشه راه توسعه گنجانده شده اند:
- فهرست مطالب
- OCR برای PDF های قابل جستجو و غیر قابل جستجو
- گزارش پیشرفت
- متن چند ستونی
- فرمول های ریاضی
- فیلدهای خودکار بیشتر (علاوه بر
PAGE
و NUMPAGES)
استثناهای بارگذاری PDF
در طول تبدیل سند PDF، یکی از استثناهای زیر ممکن است رخ دهد:
استثنا | شرح |
---|---|
FileLoadException |
فایل PDF به دلایلی قابل پردازش نیست.
شما می توانید با استفاده از پشتیبانی فنی.
مشکل را برای بررسی دقیق به تیم توسعه گزارش دهید |
DrmProtectedFileException |
یک فایل PDF توسط Adobe DRM محافظت می شود و نمی تواند توسط Pdf2Word رمزگشایی شود |
PasswordProtectedFileException |
رمز عبور صحیح باید برای PDF محافظت شده با رمز عبور ارائه شود |