PDF를 다른 문서 형식으로 변환
Contents
[
Hide
]
Aspose.Words는 PDF와 같은 복잡한 형식도 로드할 수 있습니다. 이는 새로운 기회를 열어줍니다. PDF를 Word 또는 다른 형식으로 변환하여 사용자가 많은 응용 문제를 훨씬 앞서게 할 수 있습니다.
PDF를 다른 형식으로 변환
PDF에서 가장 널리 사용되는 변환은 DOCX, DOC와 같은 Microsoft Word 형식과 JPG 또는 PNG와 같은 이미지 형식으로의 변환입니다. 즉, 문서를 한 형식에서 다른 형식으로 변환하는 작업은 익숙한 방식으로 수행됩니다.
다음 코드 예제는 문서를 PDF에서 DOCX로 변환하는 방법을 보여줍니다
PDF {#specify-load-options-when-importing-pdf}를 가져올 때 로드 옵션 지정
Aspose.Words는 PDF 문서가 로드되는 방식을 보다 정확하게 제어할 수 있는 PdfLoadOptions 클래스를 제공합니다.
대부분의 속성은 LoadOptions 클래스에 이미 존재하는 속성을 상속하거나 오버로드합니다. 그 외에도 PDF 형식에 대한 여러 속성이 지정됩니다. 예를 들어, page_count 및 page_index 속성을 사용하여 PDF 문서에서 로드할 페이지 범위를 정의하고, skip_pdf_images 속성을 사용하여 PDF를 로드할 때 이미지를 건너뛸지 여부를 제어할 수 있습니다. 지원되는 또 다른 매개변수는 비밀번호로 보호된 문서에 제공되어야 하는 password입니다.
지원되는 PDF 콘텐츠
PDF2Word 플러그인은 현재 다음 데이터 유형을 지원합니다:
- 텍스트 단락
- 이미지
- 테이블
- 목록
- 머리글과 바닥글
- 각주
- 페이지 번호
- 오른쪽에서 왼쪽으로 쓰는 텍스트(일부 제한 있음)
- 검색 가능한 PDF(배경 텍스트를 위해 전면 이미지가 제거됨)
계획된 기능
일부 기능은 아직 초기 개발 단계에 있거나 개발 로드맵에 포함되어 있습니다
- 목차
- 검색 가능한 PDF와 검색 불가능한 PDF에 대한 OCR
- 진행 보고서
- 다중 열 텍스트
- 수학 공식
- 더 많은 자동 필드(
PAGE
및 NUMPAGES 제외)
PDF 로드 예외
PDF 문서 변환 중에 다음 예외 중 하나가 발생할 수 있습니다
예외 | 설명 |
---|---|
FileLoadException | 어떤 이유로 PDF 파일을 처리할 수 없습니다.
자세한 조사를 위해 기술적 지원.
을 사용하여 개발팀에 문제를 보고할 수 있습니다 |
DrmProtectedFileException | PDF 파일은 Adobe DRM으로 보호되며 Pdf2Word로 디코딩할 수 없습니다 |
PasswordProtectedFileException | 비밀번호로 보호된 PDF에는 올바른 비밀번호를 제공해야 합니다 |