Extraire un tableau d'un document PDF
Contents
[
Hide
]
Extraire un Tableau d’un PDF
Extraire des tableaux de PDFs en utilisant Python peut être extrêmement utile pour l’extraction et l’analyse de données. Avec la bibliothèque Aspose.PDF pour Python via .NET, vous pouvez travailler efficacement avec des tableaux intégrés dans des documents PDF pour diverses tâches liées aux données.
import aspose.pdf as ap
# Charger le document PDF source
pdf_document = ap.Document(input_file)
for page in pdf_document.pages:
absorber = ap.text.TableAbsorber()
absorber.visit(page)
for table in absorber.table_list:
for row in table.row_list:
for cell in row.cell_list:
text_fragment_collection = cell.text_fragments
for fragment in text_fragment_collection:
txt = ""
for seg in fragment.segments:
txt += seg.text
print(txt)