Converta PDF para outros formatos de documento
Aspose.Words pode carregar até mesmo um formato tão complexo como PDF. Isso abre novas oportunidades: é possível converter PDF para Word ou outros formatos que levam os usuários à frente na solução de muitos problemas aplicados.
Pré-requisitos
- Adicionada referência ao pacote Aspose.Words OU para Aspose.Words.Pdf2Word.dll.
- Pelo menos .NET Framework 4.6.1 ou .NET Standard 2.0. Destinos como .NET Core 2.x ou 3.0, .NET 5 e Xamarin também são suportados por compatibilidade com .NET Standard.
Converta PDF para vários formatos
A conversão mais popular de PDF é a conversão para formatos Microsoft Word, como DOCX, DOC, bem como formatos de imagem, como JPG ou PNG. Dito isso, a conversão de um documento de um formato para outro funciona de maneira familiar.
O exemplo de código a seguir mostra como converter um documento de PDF em DOCX:
Especifique as opções de carregamento ao importar PDF
Aspose.Words fornece a classe PdfLoadOptions, que permite um controle mais preciso sobre como os documentos PDF são carregados.
A maioria das propriedades herda ou sobrecarrega propriedades que já existem na classe LoadOptions
. Além deles, várias propriedades são especificadas para o formato PDF. Por exemplo, você pode usar as propriedades PageCount e PageIndex para definir o intervalo de páginas a ser carregado de um documento PDF e as propriedades SkipPdfImages para controlar se as imagens devem ser ignoradas ao carregar o PDF. Outro parâmetro suportado é o Password, que deve ser fornecido para documentos protegidos por senha.
Conteúdo PDF suportado
O plugin PDF2Word atualmente suporta os seguintes tipos de dados:
- Parágrafos de texto
- Imagens
- Tabelas
- Listas
- Cabeçalhos e rodapés
- Notas de rodapé
- Números de página
- Texto da direita para a esquerda (com algumas limitações)
- PDFs pesquisáveis (as imagens frontais serão removidas em favor do texto de fundo)
Recursos futuros
Alguns recursos ainda estão em desenvolvimento inicial ou incluídos no roteiro de desenvolvimento:
- Índice
- OCR para PDFs pesquisáveis e não pesquisáveis
- Relatório de progresso
- Texto multicoluna
- Fórmulas matemáticas
- Mais campos automáticos (além de
PAGE
e NUMPAGES)
Exceções de carregamento de PDF
Durante a conversão de um documento PDF, pode ocorrer uma das seguintes exceções:
Exceção | Descrição |
---|---|
FileLoadException |
Um arquivo PDF não pode ser processado por algum motivo.
Você pode relatar o problema à equipe de desenvolvimento para uma investigação detalhada usando o Suporte técnico.
|
DrmProtectedFileException |
Um arquivo PDF é protegido pelo Adobe DRM e não pode ser decodificado pelo Pdf2Word |
PasswordProtectedFileException |
A senha correta deve ser fornecida para um PDF protegido por senha |