Converter PDF para Texto em Python
Contents
[
Hide
]
Converter PDF para Texto
Aspose.PDF para Python oferece suporte à conversão de todo o documento PDF e de uma única página para um arquivo de Texto.
Converter documento PDF para arquivo de Texto
Você pode converter um documento PDF para um arquivo TXT usando a classe ‘TextDevice’.
-
Criando o caminho para o arquivo de entrada e saída
-
Criando uma instância da fachada do extrator de PDF com [extractor_create] (https://reference.aspose.com/pdf/python-cpp/core/extractor_create/)
-
Vinculando o arquivo PDF ao extrator com extractor_bind_pdf
-
Extraindo o texto do arquivo PDF usando extractor_extract_text
-
Escrevendo o texto extraído no arquivo de saída
-
Salve o PDF de saída com o método ‘document.save’.
O trecho de código a seguir explica como extrair os textos de todas as páginas.
from AsposePdfPython import *
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_txt.txt"
extactor = extractor_create()
extractor_bind_pdf(extactor,input_pdf)
text = extractor_extract_text(extactor)
with open(output_pdf, 'w') as f:
f.write(text)