Converti PDF in altri formati di documenti

Aspose.Words può caricare anche un formato complesso come PDF. Ciò apre nuove opportunità: è possibile convertire PDF in Word o altri formati che portano gli utenti molto più avanti nella risoluzione di molti problemi applicativi.

Prerequisiti

  • Aggiunto riferimento al pacchetto Aspose.Words O a Aspose.Words.Pdf2Word.dll.
  • Almeno .NET Framework 4.6.1 o .NET Standard 2.0. Anche target come .NET Core 2.x o 3.0, .NET 5 e Xamarin sono supportati tramite compatibilità con .NET Standard.

Converti PDF in vari formati

La conversione più popolare da PDF è la conversione in formati Microsoft Word come DOCX, DOC, nonché in formati immagine come JPG o PNG. Detto questo, la conversione di un documento da un formato a un altro funziona in modo familiare.

Il seguente esempio di codice mostra come convertire un documento da PDF a DOCX:

Specificare le opzioni di caricamento durante l’importazione di PDF

Aspose.Words fornisce la classe PdfLoadOptions, che consente un controllo più preciso sul modo in cui vengono caricati i documenti PDF.

La maggior parte delle proprietà eredita o esegue l’overload di proprietà già esistenti nella classe LoadOptions. Oltre a queste, per il formato PDF vengono specificate numerose proprietà. Ad esempio, puoi utilizzare le proprietà PageCount e PageIndex per definire l’intervallo di pagine da caricare da un documento PDF e le proprietà SkipPdfImages per controllare se le immagini devono essere saltate durante il caricamento del PDF. Un altro parametro supportato è Password, che deve essere fornito per documenti protetti da password.

Contenuto PDF supportato

Il plug-in PDF2Word attualmente supporta i seguenti tipi di dati:

  • Paragrafi di testo
  • Immagini
  • Tabelle
  • Elenchi
  • Intestazioni e piè di pagina *Note a piè di pagina *Numeri di pagina
  • Testo da destra a sinistra (con alcune limitazioni)
  • PDF ricercabili (le immagini frontali verranno rimosse a favore del testo di sfondo)

Funzionalità future

Alcune funzionalità sono ancora in fase di sviluppo iniziale o incluse nella roadmap di sviluppo:

  • Sommario
  • OCR per PDF ricercabili e non ricercabili
  • Rapporto sullo stato di avanzamento
  • Testo su più colonne
  • Formule matematiche
  • Più campi automatici (oltre a PAGE e NUMPAGES)

Eccezioni caricamento PDF

Durante la conversione di un documento PDF, potrebbe verificarsi una delle seguenti eccezioni:

Eccezione Descrizione
FileLoadException Per qualche motivo non è possibile elaborare un file PDF.
DrmProtectedFileException Un file PDF è protetto da Adobe DRM e non può essere decodificato da Pdf2Word
PasswordProtectedFileException Per un PDF protetto da password è necessario fornire la password corretta

Guarda anche