Converta PDF para outros formatos de documento

Aspose.Words pode carregar até mesmo um formato tão complexo como PDF. Isso abre novas oportunidades: é possível converter PDF para Word ou outros formatos que levam os usuários à frente na solução de muitos problemas aplicados.

Pré-requisitos

  • Adicionada referência ao pacote Aspose.Words OU para Aspose.Words.Pdf2Word.dll.
  • Pelo menos .NET Framework 4.6.1 ou .NET Standard 2.0. Destinos como .NET Core 2.x ou 3.0, .NET 5 e Xamarin também são suportados por compatibilidade com .NET Standard.

Converta PDF para vários formatos

A conversão mais popular de PDF é a conversão para formatos Microsoft Word, como DOCX, DOC, bem como formatos de imagem, como JPG ou PNG. Dito isso, a conversão de um documento de um formato para outro funciona de maneira familiar.

O exemplo de código a seguir mostra como converter um documento de PDF em DOCX:

Especifique as opções de carregamento ao importar PDF

Aspose.Words fornece a classe PdfLoadOptions, que permite um controle mais preciso sobre como os documentos PDF são carregados.

A maioria das propriedades herda ou sobrecarrega propriedades que já existem na classe LoadOptions. Além deles, várias propriedades são especificadas para o formato PDF. Por exemplo, você pode usar as propriedades PageCount e PageIndex para definir o intervalo de páginas a ser carregado de um documento PDF e as propriedades SkipPdfImages para controlar se as imagens devem ser ignoradas ao carregar o PDF. Outro parâmetro suportado é o Password, que deve ser fornecido para documentos protegidos por senha.

Conteúdo PDF suportado

O plugin PDF2Word atualmente suporta os seguintes tipos de dados:

  • Parágrafos de texto
  • Imagens
  • Tabelas
  • Listas
  • Cabeçalhos e rodapés
  • Notas de rodapé
  • Números de página
  • Texto da direita para a esquerda (com algumas limitações)
  • PDFs pesquisáveis (as imagens frontais serão removidas em favor do texto de fundo)

Recursos futuros

Alguns recursos ainda estão em desenvolvimento inicial ou incluídos no roteiro de desenvolvimento:

  • Índice
  • OCR para PDFs pesquisáveis e não pesquisáveis
  • Relatório de progresso
  • Texto multicoluna
  • Fórmulas matemáticas
  • Mais campos automáticos (além de PAGE e NUMPAGES)

Exceções de carregamento de PDF

Durante a conversão de um documento PDF, pode ocorrer uma das seguintes exceções:

Exceção Descrição
FileLoadException Um arquivo PDF não pode ser processado por algum motivo.
DrmProtectedFileException Um arquivo PDF é protegido pelo Adobe DRM e não pode ser decodificado pelo Pdf2Word
PasswordProtectedFileException A senha correta deve ser fornecida para um PDF protegido por senha

Veja também