PDF 문서 파싱
Contents
[
Hide
]
PDF 파싱은 PDF 파일에서 다양한 정보를 추출하는 용어입니다. 이 섹션에서는 다음 방법을 다룹니다:
- PDF에서 텍스트 추출. 텍스트 파싱 또는 추출은 기성 PDF와 함께 가장 인기 있는 작업입니다. 전체 문서, 특정 페이지 또는 페이지의 특정 영역에서 텍스트를 파싱하는 방법을 배우게 됩니다.
- PDF에서 이미지 추출. 이미지 추출은 텍스트에 대한 위의 작업과 동일하게 이미지에 대해 수행됩니다.
- PDF에서 폰트 추출. 폰트 추출은 PDF 내의 폰트와 관련된 특정 작업입니다.
- 양식에서 데이터 추출.
- 양식에서 데이터 추출하기
- 스탬프에서 텍스트 추출하기
- 테이블에서 데이터 추출하기