Converter PDF para TXT em Python
Contents
[
Hide
]
Converter PDF para TXT
Aspose.PDF para Python via C++ suporta a conversão de documentos PDF para um arquivo de texto seguindo os passos:
- Criar o caminho do arquivo de entrada e saída
- Criar uma instância da fachada do extrator de PDF com extractor_create
- Vincular o arquivo PDF ao extrator com extractor_bind_pdf
- Extrair o texto do arquivo PDF usando extractor_extract_text
- Escrever o texto extraído no arquivo de saída
- Salvar o PDF de saída com o método ‘document.save’.
O trecho de código abaixo mostra como converter uma imagem JPG para PDF usando Python via C++:
import AsposePDFPython as apCore
import os
import os.path
# Criando o caminho do diretório de dados
dataDir = os.path.join(os.getcwd(), "samples")
# Criando o caminho do arquivo de entrada
input_file = os.path.join(dataDir, "sample.pdf")
# Criando o caminho do arquivo de saída
output_file = os.path.join(dataDir, "results", "pdf-to-txt.txt")
# Criando uma instância da fachada do extrator de PDF
extactor = apCore.facades_pdf_extractor_create()
# Vinculando o arquivo PDF ao extrator
apCore.facades_facade_bind_pdf(extactor, input_file)
# Extraindo o texto do arquivo PDF
text = apCore.facades_pdf_extractor_extract_text(extactor)
# Escrevendo o texto extraído no arquivo de saída
with open(output_file, 'w') as f:
f.write(text)