「將 PDF 檔案轉換成其他文件格式」

「 Aspose.Words 可以載入甚至如此複雜的格式,如 PDF。」 「這開啟了新機會,可以將PDF轉換為Word或其他格式,讓使用者在解決許多應用問題時領先一步。」

先決條件

「* 已新增 Aspose.Words 套件 **「*OR」*** 的引用,給 Aspose.Words.Pdf2Word.dll。」

  • 至少 .NET Framework 4.6.1 或 .NET Standard 2.0。 「像 .NET Core 2.x 或 3.0、 .NET 5 和 Xamarin 等目標也支援,透過與 .NET Standard 的相容性。」

將 PDF 轉為各種格式

「最受歡迎的 PDF 轉換是將之轉換為 Microsoft Word 格式,例如 DOCX、DOC 等,以及圖像格式,例如 JPG 或 PNG。」 「因此,將一個檔案從一種格式轉換到另一种格式時,會以熟悉的方式進行。」

以下範例顯示如何將 PDF 文檔轉換為 DOCX:

在匯入PDF時指定負載選項

Aspose.Words為您提供 PdfLoadOptions 類別,讓您可以更精確地控制如何載入 PDF 文檔。

大多數屬性都從已存在於 LoadOptions 類別中的屬性中 thừa襲或過載。 除了他們之外,其他一些屬性也指定了 PDF 格式。 「例如,您可以將 PageCountPageIndex 屬性用於定義從 PDF 文檔中載入的頁面範圍,以及 SkipPdfImages 屬性用於控制在載入 PDF 時是否跳過圖像。」 「另一個支援的參數是 Password ,必須為 password-protected documents 提供。」

支援的 PDF 內容:

「PDF2Word插件目前支援以下數據類型:」

文字段落” 「 圖像」

  • 表格 「* 清單」
  • 標頭與尾部 「* 脚注」 “*頁碼” 「* 右到左的文字(有部分限制)」
  • 可搜索的PDF (前圖像會移除以取而代之背景文字)

未來功能

「有些功能仍處於早期開發階段或包含在開發路線圖中:」

  • 表格
  • 可搜索與不可搜索的 PDF
  • 進度報告
  • 多列文字 “*數學公式” *更多自動欄位(除了PAGE和NUMPAGES)

「PDF 讀取錯誤」

「在PDF文件轉換時,可能發生以下之一例外:」

例外 描述
FileLoadException 因為某些原因,PDF 檔案無法處理。
來將問題提交給開發團隊進行詳細調查。
DrmProtectedFileException 「PDF檔案受到Adobe DRM的保護,無法用Pdf2Word來解碼。」
PasswordProtectedFileException 為受密碼保護的 PDF 提供正確的密碼。

見也