PDF에서 태그가 있는 콘텐츠 추출
이 문서에서는 C#을 사용하여 태그가 있는 콘텐츠 PDF 문서를 추출하는 방법을 배웁니다.
다음 코드 스니펫은 Aspose.PDF.Drawing 라이브러리와 함께 작동합니다.
태그가 있는 PDF 콘텐츠 가져오기
태그가 있는 텍스트가 포함된 PDF 문서의 콘텐츠를 가져오기 위해 Aspose.PDF는 Document 클래스의 TaggedContent 속성을 제공합니다.
다음 코드 스니펫은 태그가 있는 텍스트가 포함된 PDF 문서의 콘텐츠를 가져오는 방법을 보여줍니다:
루트 구조 가져오기
태그가 있는 PDF 문서의 루트 구조를 가져오기 위해 Aspose.PDF는 ITaggedContent 인터페이스의 StructTreeRootElement 속성과 StructureElement를 제공합니다. 다음 코드 스니펫은 태그가 있는 PDF 문서의 루트 구조를 가져오는 방법을 보여줍니다:
자식 요소 접근하기
태그가 있는 PDF 문서의 자식 요소에 접근하기 위해 Aspose.PDF는 ElementList 클래스를 제공합니다. 다음 코드 스니펫은 태그가 있는 PDF 문서의 자식 요소에 접근하는 방법을 보여줍니다:
기존 PDF에서 이미지 태깅하기
기존 PDF 문서에서 이미지를 태깅하기 위해 Aspose.PDF는 StructureElement 클래스의 FindElements 메서드를 제공합니다. FigureElement 클래스의 AlternativeText 속성을 사용하여 그림에 대한 대체 텍스트를 추가할 수 있습니다.
다음 코드 스니펫은 기존 PDF 문서에서 이미지를 태깅하는 방법을 보여줍니다: