แปลง PDF เป็นรูปแบบเอกสารอื่น ๆ

Aspose.Words สามารถโหลดได้แม้กระทั่งรูปแบบที่ซับซ้อนเช่น PDF นี่เป็นการเปิดโอกาสใหม่: เป็นไปได้ที่จะแปลง PDF เป็น Word หรือรูปแบบอื่น ๆ ที่ทำให้ผู้ใช้ก้าวไปข้างหน้าในการแก้ปัญหาต่างๆ

ข้อกำหนดเบื้องต้น

  • เพิ่มการอ้างอิงถึงแพ็คเกจ Aspose.Words หรือ ไปยัง Aspose.Words.Pdf2Word.dll
  • อย่างน้อย .NET Framework 4.6.1 หรือ .NET Standard 2.0 เป้าหมายเช่น .NET Core 2.x หรือ 3.0, .NET 5 และ Xamarin ยังได้รับการสนับสนุนผ่านทางความเข้ากันได้กับ .NET Standard

แปลง PDF เป็นรูปแบบต่างๆ

การแปลงไฟล์ PDF ที่ได้รับความนิยมมากที่สุดคือการแปลงเป็นรูปแบบ Microsoft Word เช่น DOCX, DOC รวมถึงรูปแบบรูปภาพ เช่น JPG หรือ PNG ด้วยเหตุนี้ การแปลงเอกสารจากรูปแบบหนึ่งไปเป็นอีกรูปแบบหนึ่งจึงทำได้ในลักษณะที่คุ้นเคย

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงเอกสารจาก PDF เป็น DOCX:

ระบุตัวเลือกการโหลดเมื่อนำเข้า PDF

Aspose.Words มีคลาส PdfLoadOptions ให้คุณ ซึ่งช่วยให้คุณควบคุมวิธีการโหลดเอกสาร PDF ได้แม่นยำยิ่งขึ้น

คุณสมบัติส่วนใหญ่สืบทอดหรือโอเวอร์โหลดคุณสมบัติที่มีอยู่แล้วในคลาส LoadOptions นอกจากนั้น ยังมีการระบุคุณสมบัติจำนวนหนึ่งสำหรับรูปแบบ PDF ตัวอย่างเช่น คุณสามารถใช้คุณสมบัติ PageCount และ PageIndex เพื่อกำหนดช่วงหน้าที่จะโหลดจากเอกสาร PDF และคุณสมบัติ SkipPdfImages เพื่อควบคุมว่าควรข้ามรูปภาพเมื่อโหลด PDF หรือไม่ พารามิเตอร์ที่รองรับอีกตัวหนึ่งคือ Password ซึ่งต้องระบุสำหรับ เอกสารที่มีการป้องกันด้วยรหัสผ่าน

รองรับเนื้อหา PDF

ปัจจุบันปลั๊กอิน PDF2Word รองรับประเภทข้อมูลต่อไปนี้:

  • ย่อหน้าข้อความ
  • รูปภาพ
  • ตาราง
  • รายการ
  • ส่วนหัวและส่วนท้าย
  • เชิงอรรถ
  • หมายเลขหน้า
  • ข้อความจากขวาไปซ้าย (มีข้อจำกัดบางประการ)
  • PDF ที่ค้นหาได้ (ภาพด้านหน้าจะถูกลบออกเพื่อใช้ข้อความพื้นหลัง)

คุณสมบัติในอนาคต

คุณสมบัติบางอย่างยังอยู่ในช่วงเริ่มต้นของการพัฒนาหรือรวมอยู่ในแผนงานการพัฒนา:

  • สารบัญ
  • OCR สำหรับ PDF ที่ค้นหาได้และไม่สามารถค้นหาได้
  • รายงานความคืบหน้า
  • ข้อความหลายคอลัมน์
  • สูตรคณิตศาสตร์
  • ฟิลด์อัตโนมัติเพิ่มเติม (นอกเหนือจาก PAGE และ NUMPAGES)

ข้อยกเว้นในการโหลด PDF

ในระหว่างการแปลงเอกสาร PDF ข้อยกเว้นข้อใดข้อหนึ่งต่อไปนี้อาจเกิดขึ้น:

ข้อยกเว้น คำอธิบาย
FileLoadException ไม่สามารถประมวลผลไฟล์ PDF ได้ด้วยเหตุผลบางประการ
DrmProtectedFileException ไฟล์ PDF ได้รับการปกป้องโดย Adobe DRM และไม่สามารถถอดรหัสโดย Pdf2Word
PasswordProtectedFileException ต้องระบุรหัสผ่านที่ถูกต้องสำหรับ PDF ที่มีการป้องกันด้วยรหัสผ่าน

ดูสิ่งนี้ด้วย