PDF 문서 구문 분석
Contents
[
Hide
]
PDF 분석 문서는 PDF 파일에서 다양한 종류의 정보를 추출하는 것과 관련된 용어입니다.이 섹션에서는 다음과 같은 방법을 다룹니다.
- PDF에서 텍스트 추출.텍스트 파싱 또는 추출은 미리 만들어진 PDF에서 가장 많이 사용되는 작업입니다.전체 문서, 특정 페이지 또는 페이지의 특정 영역에서 텍스트 파싱에 대해 배우게 됩니다.
- PDF에서 이미지 추출.이미지 추출은 이미지에 대해 위의 텍스트 작업과 동일합니다.
- PDF에서 글꼴 추출.글꼴 추출은 PDF의 글꼴을 사용하는 특정 작업입니다.
- 양식에서 데이터 추출.Forms가 포함된 PDF 문서가 많은 경우 해당 양식에서 데이터를 가져와야 할 수도 있습니다.이 문서는.NET을 통해 파이썬용 Aspose.PDF 파일을 사용하여 AcroForms 데이터를 추출하는 방법을 이해하는 데 도움이 될 것입니다.
- 테이블에서 데이터 추출.PDF 문서의 테이블에서 데이터를 가져옵니다.
- PDF에서 벡터 데이터 추출.위치, 색상, 선폭 등과 같은 벡터 데이터 (경로, 다각형, 폴리라인) 를 가져올 수 있습니다.