PDF/A 또는 PDF/UA 작업

PDF/A 및 PDF/UA 형식은 Word 형식의 문서를 PDF로 자동 변환하는 동안 충족할 수 없는 문서 내용과 관련된 몇 가지 요구 사항을 부과합니다. PDF/A 및 PDF/UA와 완전히 호환되는 문서를 생성하려면 변환 전 Word 문서 또는 변환 후 PDF 문서에서 이러한 요구 사항을 확인하고 수정해야 합니다.

기본 요구 사항은 PDF/A 및 PDF/UA 문서의 구조 또는 글꼴에 대한 것이며, 다음 섹션에서 이에 대해 살펴보겠습니다.

문서 구조 요구 사항

현재 요구 사항은 PDF/A-1a, PDF/A-2a, PDF/A-4 및 PDF/UA-1 형식입니다.

다양한 PDF 형식 표준으로 변환할 때 Aspose.Words가 작동하는 방식에 약간의 차이가 있습니다. 예상되는 결과를 얻으려면 이를 고려해야 합니다.

아래 하위 섹션에서는 다양한 PDF 형식 표준으로 변환할 때 Aspose.Words가 작동하는 방식과 솔루션 옵션에 대한 미묘한 차이를 설명합니다.

구조 유형

Aspose.Words 내의 PDF 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

PDF 문서는 제목, 단락, 표 등과 같은 일련의 블록입니다. 이러한 블록은 강력하거나 약한 문서 구조를 형성합니다.

강한 구조와 약한 구조 모두 PDF/A에 유효합니다. Microsoft Word 문서는 설계상 약한 구조를 가지고 있는데, Aspose.Words는 각각 약한 구조로 PDF를 생성하고 소스 문서의 단락 개요 수준에 따라 제목도 생성합니다.

구조가 약한 PDF/UA-1 문서의 경우 제목 번호가 간격 없이 순서대로 배열되어야 합니다.

올바른 출력을 보장하려면 사용자는 소스 문서 내용이 적절하게 구성되어 있고 단락에 대한 개요 수준이 올바르게 지정되어 있는지 확인해야 합니다. 그렇지 않으면 사용자는 출력 PDF 문서의 구조를 확인하고 수정해야 합니다.

콘텐츠를 아티팩트로 표시

Aspose.Words 내의 PDF 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

현재 Aspose.Words는 페이지 머리글과 바닥글, 메모 구분 기호, 반복되는 테이블 머리글 셀, 장식 이미지를 아티팩트로 표시합니다. 이 목록은 향후 업데이트될 수 있습니다.

문서에 아티팩트로 표시되어야 하는 다른 콘텐츠가 포함되어 있거나 아티팩트된 콘텐츠가 실제 콘텐츠인 경우 고객은 출력 PDF에서 해당 내용을 수정해야 합니다.

자연어 사양

Aspose.Words 내의 PDF 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

텍스트 언어는 Microsoft Word 문서에 지정됩니다. Aspose.Words는 표시된 콘텐츠 시퀀스 또는 Span 태그에 첨부된 Lang 속성을 사용하여 지정된 언어를 출력 PDF로 내보냅니다. 이는 ExportLanguageToSpanTag 속성에 의해 제어됩니다. 일반적으로 사용자가 Microsoft Word를 통해 텍스트를 입력할 때 언어 문제는 없습니다. 하지만 자동으로 텍스트가 생성되면 언어가 정확하지 않을 가능성이 있습니다.

그림 설명

Aspose.Words 내의 PDF 표준 준수 수준 요구 사항의 존재
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Microsoft Word 문서를 통해 사용자는 그림 캡션을 추가할 수 있습니다.

현재 Aspose.Words는 Caption 태그가 있는 캡션을 내보낼 수 없으므로 출력 PDF에 플래그를 지정해야 합니다.

대체 설명

Aspose.Words 내의 PDF 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Word 문서를 통해 사용자는 이미지, 도형 및 표에 대체 텍스트를 추가할 수 있습니다. Aspose.Words는 이러한 대체 텍스트를 출력 PDF로 내보냅니다.

하이퍼링크에 대한 대체 설명

Aspose.Words 내의 PDF 표준 준수 수준 요구 사항의 존재
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

이전 사항 외에도 Microsoft Word 문서에서는 사용자가 하이퍼링크에 대체 텍스트를 추가할 수 있습니다. Aspose.Words는 이러한 대체 텍스트를 출력 PDF로 내보냅니다.

안타깝게도 모든 애플리케이션에서 대체 설명을 설정할 수 있는 것은 아닙니다. 예를 들어, Adobe Acrobat는 현재 하이퍼링크에 대한 설명을 설정할 수 없습니다. 하지만 Microsoft Word에서는 다음과 같이 할 수 있습니다

대체 설명-하이퍼링크-mw

가끔 Microsoft Word GUI를 통해 목차(TOC)의 자동 생성 하이퍼링크에 대한 대체 텍스트를 설정할 수 없는 문제가 있습니다. Aspose.Words는 이러한 필드를 업데이트하고 자체적으로 링크를 생성할 수 있습니다.

Aspose.Words Document Object Model(DOM)을 사용하여 TOC 필드를 업데이트하려면 코드 예제를 따르세요

Document doc = new Document(fileName);

	var tocHyperLinks = doc.Range.Fields
		.Where(f => f.Type == FieldType.FieldHyperlink)
		.Cast<FieldHyperlink>()
		.Where(f => f.HRef.StartsWith("#_Toc"));
	
	foreach (FieldHyperlink link in tocHyperLinks)
		link.ScreenTip = link.DisplayResult;
	
	PdfSaveOptions opt = new PdfSaveOptions()
	{
		Compliance = PdfCompliance.PdfUa1,
		DisplayDocTitle = true,
		ExportDocumentStructure = true,
	};
	opt.OutlineOptions.HeadingsOutlineLevels = 3;
	opt.OutlineOptions.CreateMissingOutlineLevels = true;
	
	var outFile = Path.ChangeExtension(fileName, "_aw.pdf");
	doc.Save(outFile, opt);

테이블 헤더

Aspose.Words 내의 PDF 표준 준수 수준 요구 사항의 존재
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

PDF/UA-1 문서의 표에는 열, 행 또는 둘 다의 헤더가 있어야 합니다. PDF/A에는 추가 제한이 없는 표준 테이블 마크업만 필요합니다. Aspose.Words는 표준 테이블 마크업을 자동으로 생성합니다.

대체 텍스트

Aspose.Words 내의 PDF 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word 문서에서는 사용자가 대체 텍스트를 설정할 수 없습니다. 따라서 출력 PDF에서 이를 확인하고 수정해야 합니다

곡예사교체텍스트

약어 및 두문자어 확장

Aspose.Words 내의 PDF 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word 문서에서는 사용자가 약어 및 두문자어 확장을 설정할 수 없습니다. 따라서 출력 PDF에서 이를 확인하고 수정해야 합니다

Acrobat분할추가확장텍스트

문서 제목

Aspose.Words 내의 PDF 표준 준수 수준 요구 사항의 존재
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
PDF/UA-1의 문서에는 제목이 있어야 합니다

글꼴 요구 사항

Aspose.Words 내의 PDF 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words를 사용하여 PDF/A-1, PDF/A-2, PDF/A-4 또는 PDF/UA-1 형식으로 변환할 때 글꼴 작업에는 여러 가지 미묘한 차이가 있습니다. 출력 문서에 발생할 수 있는 문제를 피하려면 이를 고려해야 합니다.

아래 섹션에서는 해당 솔루션의 미묘한 차이와 옵션을 설명합니다.

글꼴 법적 요구 사항

Aspose.Words 내의 PDF 표준 준수 수준 요구 사항의 존재
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words는 사용된 글꼴의 법적 제한을 확인하지 않으며 이는 사용자에게 달려 있습니다. 즉, 사용자는 Aspose.Words를 사용한 PDF 변환에 부적절한 글꼴을 제공해서는 안 됩니다.

.notdef Glyph

Aspose.Words 내의 PDF 표준 준수 수준 요구 사항의 존재
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1 tick

.notdef glyph의 사용은 금지됩니다. 문서에 선택한 글꼴에 없고 글꼴 대체 메커니즘을 통해 확인할 수 없는 문자가 포함된 경우 .notdef glyph가 나타납니다.

개인 사용 구역(PUA)

Aspose.Words 내의 PDF 표준 준수 수준 요구 사항의 존재
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1

PUA(Private Use Area) 문자는 주로 “Symbol”, “Wingdings”, “Webdings” 등과 같은 Windows 기호 글꼴에 나타납니다. Microsoft Word 형식은 문자의 실제 텍스트를 저장하는 옵션을 제공하지 않습니다.

“Segoe UI 기호"는 기호 글꼴의 대안으로 사용할 수 있는 Windows 유니코드 글꼴입니다.