將 PDF 檔案轉換成其他文件格式
Contents
[
Hide
]
Aspose.Words 可以載入甚至如此複雜的格式,如 PDF。 這開啟了新機會,可以將PDF轉換為Word或其他格式,讓使用者在解決許多應用問題時領先一步。
先決條件
- 已新增 Aspose.Words 套件 OR 的引用,給 Aspose.Words.Pdf2Word.dll。
- 至少 .NET Framework 4.6.1 或 .NET Standard 2.0。 像 .NET Core 2.x 或 3.0、 .NET 5 和 Xamarin 等目標也支援,透過與 .NET Standard 的相容性。
將 PDF 轉為各種格式
最受歡迎的 PDF 轉換是將之轉換為 Microsoft Word 格式,例如 DOCX、DOC 等,以及圖像格式,例如 JPG 或 PNG。 因此,將一個檔案從一種格式轉換到另一种格式時,會以熟悉的方式進行。
以下範例顯示如何將 PDF 文檔轉換為 DOCX:
在匯入PDF時指定負載選項
Aspose.Words為您提供 PdfLoadOptions 類別,讓您可以更精確地控制如何載入 PDF 文檔。
大多數屬性都從已存在於 LoadOptions
類別中的屬性中 thừa襲或過載。 除了他們之外,其他一些屬性也指定了 PDF 格式。 例如,您可以將 PageCount 和 PageIndex 屬性用於定義從 PDF 文檔中載入的頁面範圍,以及 SkipPdfImages 屬性用於控制在載入 PDF 時是否跳過圖像。 另一個支援的參數是 Password ,必須為 password-protected documents 提供。
支援的 PDF 內容:
PDF2Word插件目前支援以下數據類型:
“*文字段落”
- 圖像
- 表格
- 清單
- 標頭與尾部
- 脚注 “*頁碼”
- 右到左的文字(有部分限制)
- 可搜索的PDF (前圖像會移除以取而代之背景文字)
未來功能
有些功能仍處於早期開發階段或包含在開發路線圖中:
- 表格
- 可搜索與不可搜索的 PDF
- 進度報告
- 多列文字
“*數學公式”
*更多自動欄位(除了
PAGE
和NUMPAGES)
PDF 讀取錯誤
在PDF文件轉換時,可能發生以下之一例外:
例外 | 描述 |
---|---|
FileLoadException |
因為某些原因,PDF 檔案無法處理。
你可以使用 technical support.
來將問題提交給開發團隊進行詳細調查。 |
DrmProtectedFileException |
PDF檔案受到Adobe DRM的保護,無法用Pdf2Word來解碼。 |
PasswordProtectedFileException |
為受密碼保護的 PDF 提供正確的密碼。 |