PDF/A또는PDF/UA로 작업

PDF/A및PDF/UA형식은 워드 형식의 문서에서PDF로 자동 변환하는 동안 충족할 수 없는 문서 내용과 관련된 몇 가지 요구 사항을 부과합니다. 이러한 요구 사항은 변환 전 워드 문서 또는 변환 후PDF문서에서 확인되고 수정되어야 완전히PDF/A및PDF/UA호환 문서를 생성 할 수 있습니다.

기본 요구 사항은PDF/A및PDF/UA문서의 구조 또는 글꼴에 대한 것이며,다음 섹션에서 고려할 것입니다.

문서 구조 요구 사항

현재 요구 사항은PDF/A-1a, PDF/A-2a, PDF/A-4, 그리고PDF/UA-1형식.

다양한PDF형식 표준으로 변환 할 때Aspose.Words이 어떻게 작동하는지에 대한 몇 가지 뉘앙스가 있습니다. 예상된 결과 얻으려면 그들은 고려 되어야 합니다.

아래의 하위 섹션에서는 다양한PDF형식 표준 및 솔루션에 대한 옵션으로 변환 할 때Aspose.Words이 어떻게 작동하는지에 대한 뉘앙스를 설명합니다.

구조 유형

PDFAspose.Words내의 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

PDF문서는 제목,단락,표 등과 같은 일련의 블록입니다. 이 블록은 문서 구조를 강하게 또는 약하게 형성합니다.

강한 구조와 약한 구조는 모두PDF/A에 유효합니다. Microsoft Word문서는 설계 상 약한 구조를 가지며Aspose.Words은 각각 약한 구조로PDF을 생성하고 원본 문서의 단락의 개요 수준에 따라 제목을 생성합니다.

약한 구조를 가진PDF/UA-1문서의 경우,제목 번호가 빈틈 없이 순서대로 진행되어야 합니다.

올바른 출력을 보장하기 위해 사용자는 원본 문서 내용이 올바르게 구성되고 단락에 대한 개요 수준이 올바르게 지정되었는지 확인해야 합니다. 그렇지 않으면 출력PDF문서의 구조를 확인하고 수정해야 합니다.

콘텐츠를 아티팩트로 표시

PDFAspose.Words내의 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

현재Aspose.Words은 페이지 머리글과 바닥글,메모 구분 기호,반복되는 테이블 머리글 셀 및 장식 이미지를 아티팩트로 표시합니다. 이 목록은 향후 업데이트 될 수 있습니다.

문서에 아티팩트로 표시해야 하는 다른 콘텐츠가 포함되어 있거나 아티팩트된 콘텐츠가 실제 콘텐츠인 경우 고객은 출력PDF에서 이를 수정해야 합니다.

자연어 사양

PDFAspose.Words내의 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

텍스트 언어는 Microsoft Word 문서에 지정되어 있습니다. Aspose.Words는 지정된 언어를 marked-content 시퀀스 또는 Span 태그에 첨부된 Lang 속성을 사용하여 출력 PDF로 내보냅니다. 이는 ExportLanguageToSpanTag 속성으로 제어됩니다. 일반적으로 사용자가 Microsoft Word을 통해 텍스트를 입력할 때는 언어 문제가 없습니다. 그러나 텍스트가 자동으로 생성되는 경우 언어가 부정확할 가능성이 있습니다.

그림 캡션

PDFAspose.Words내의 표준 준수 수준 요구 사항의 존재
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Microsoft Word문서는 사용자가 그림 캡션을 추가 할 수 있습니다.

현재Aspose.Words은 캡션 태그로 캡션을 내보낼 수 없으므로 출력PDF에서 플래그를 지정해야 합니다.

대체 설명

PDFAspose.Words내의 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Word문서를 사용하면 이미지,도형 및 표에 대체 텍스트를 추가할 수 있습니다. Aspose.Words는 이러한 대체 텍스트를PDF출력으로 내보냅니다.

하이퍼링크에 대한 대체 설명

PDFAspose.Words내의 표준 준수 수준 요구 사항의 존재
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

이전 지점 외에도Microsoft Word문서를 통해 사용자는 하이퍼링크에 대체 텍스트를 추가할 수 있습니다. Aspose.Words는 이러한 대체 텍스트를PDF출력으로 내보냅니다.

불행히도 모든 응용 프로그램에서 대체 설명을 설정할 수있는 것은 아닙니다. 예를 들어Adobe Acrobat는 현재 하이퍼링크에 대해 이러한 설명을 설정할 수 없습니다. 그러나Microsoft Word에서는 다음과 같이 할 수 있습니다:

alternate-descriptions-hyperlinks-mw

때때로Microsoft WordGUI을 통해 목차(TOC)에서 자동 생성된 하이퍼링크에 대한 대체 텍스트를 설정할 수 없다는 문제가 있습니다. Aspose.Words는 이러한 필드를 업데이트하고 자체적으로 링크를 생성 할 수 있습니다.

코드 예제를 따라Aspose.Words문서 개체 모델(DOM)을 사용하여TOC필드를 업데이트합니다.:

Document doc = new Document(fileName);
ArrayList<FieldHyperlink> tocHyperLinks = new ArrayList<>();

for (Field field : doc.getRange().getFields()) {
    if (field.getType() == FieldType.FIELD_HYPERLINK) {
        FieldHyperlink hyperlink = (FieldHyperlink) field;
        if (hyperlink.getFieldCode().startsWith("#_Toc")) {
            tocHyperLinks.add(hyperlink);
        }
    }
}

for (FieldHyperlink link : tocHyperLinks)
    link.setScreenTip(link.getDisplayResult());

PdfSaveOptions opt = new PdfSaveOptions();
opt.setCompliance(PdfCompliance.PDF_UA_1);
opt.setDisplayDocTitle(true);
opt.setExportDocumentStructure(true);
opt.getOutlineOptions().setHeadingsOutlineLevels(3);
opt.getOutlineOptions().setCreateMissingOutlineLevels(true);

String outFile = fileName.substring(0,fileName.lastIndexOf('.')) + "_aw.pdf";
doc.save(outFile, opt);

테이블 헤더

PDFAspose.Words내의 표준 준수 수준 요구 사항의 존재
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

PDF/UA-1문서의 테이블에는 열,행 또는 둘 모두의 머리글이 있어야 합니다. PDF/A에는 추가 제한이 없는 표준 테이블 마크업만 필요합니다. Aspose.Words은 표준 테이블 태그를 자동으로 생성합니다.

대체 텍스트

PDFAspose.Words내의 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word문서는 사용자가 대체 텍스트를 설정할 수 없습니다. 그래서 이것은 검증되고 출력PDF에서 수정되어야 합니다.:

AcrobatReplacementText

약어 및 약어 확장

PDFAspose.Words내의 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word문서는 사용자가 약어 및 약어 확장을 설정할 수 없습니다. 그래서 이것은 검증되고 출력PDF에서 수정되어야 합니다.:

AcrobatSplitAddExpansionText

문서 제목

PDFAspose.Words내의 표준 준수 수준 요구 사항의 존재
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
PDF/UA-1의 문서에는 제목이 있어야 합니다.

글꼴 요구 사항

PDFAspose.Words내의 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

로 변환 할 때 글꼴 작업의 뉘앙스도있다PDF/A-1, PDF/A-2, PDF/A-4 또는Aspose.Words을 사용하는PDF/UA-1형식입니다. 출력 문서에 문제가 발생하지 않도록 하려면 이러한 문제를 고려해야 합니다.

아래 섹션에서는 솔루션에 대한 이러한 뉘앙스 및 옵션에 대해 설명합니다.

글꼴 법적 요구 사항

PDFAspose.Words내의 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words은 사용된 글꼴의 법적 제한을 확인하지 않습니다. 즉,사용자는Aspose.Words을 사용하여PDF변환에 부적절한 글꼴을 제공해서는 안 됩니다.

.Glyph

PDFAspose.Words내의 표준 준수 수준 요구 사항의 존재
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

.notdef글리프의 사용은 금지되어 있습니다. 문서에 선택한 글꼴에 없는 문자가 포함되어 있고 글꼴 대체 메커니즘을 통해 확인할 수 없는 경우.notdef글리프가 나타납니다.

개인 사용 영역(PUA)

PDFAspose.Words내의 표준 준수 수준 요구 사항의 존재
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1

개인 사용 영역(PUA)문자는 주로"기호",“윙딩”,“웹딩"등과 같은Windows기호 글꼴에 나타납니다. Microsoft Word형식은 문자에 대한 실제 텍스트를 저장하는 옵션을 제공하지 않습니다.

“세고UI기호"는 기호 글꼴의 대안으로 사용될 수 있는Windows유니코드 글꼴입니다.