PDF/A veya PDF/UA ile çalışmak

PDF/A ve PDF/UA formatı, otomatik olarak Word formatındaki bir belgeden PDF’ye dönüştürme sırasında yerine getirilemeyen belge içeriğine ilişkin birkaç gereksinim emreder. Bu gereksinimler, dönüştürmeden önce bir kelime belgesinde doğrulanmalı ve düzeltilmeli veya dönüştürükten sonra bir PDF belgesinde üretilmesi tam olarak PDF / A ve PDF / UA uyumlu bir belge için yapılmalıdır.

Temel gereksinimler bir PDF / A ve PDF / UA belgesi için yapıya veya yazı tiplerine ilişkin gereksinimlerdir, bunları aşağıdaki bölümler ele alacaktır.

Belge Yapısı Gereksinimleri

Geçerli gereksinimler, PDF/A-1a, PDF/A-2a, PDF/A-4 ve PDF/UA-1 biçimleri için gereklidir.

Çeşitli PDF biçim standartlarına dönüştürürken Aspose.Words’ın nasıl çalıştığına dair bazı nüanslar var. Onların hesap edilmesi istenen sonucu almak istiyorsan göz önünde bulundurulması gerekir.

Aşağıdaki alt bölümler, Aspose.Words çeşitli PDF biçim standartlarına dönüştürüldüğünde nasıl çalıştığına dair nüansları ve bunların çözümleri için seçenekleri açıklar.

Yapı Türü

PDF standart uyum düzeyleri içinde Aspose.Words İsteğin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Bir PDF belgesi başlıklar, paragraflar, tablolar ve diğerleri gibi blokların bir dizisidir. Bu bloklar bir belge yapısı oluşturur - güçlü veya zayıf.

Hem güçlü hem de zayıf yapılar PDF/A için geçerlidir. Microsoft Word belgeleri tasarım olarak zayıf bir yapıya sahiptir ve Aspose.Words kaynak belge içindeki paragrafların alt düzeylerine uygun başlıkları oluşturmak üzere zayıf bir yapıya sahip bir PDF oluşturur.

Zayıf bir yapısına sahip bir PDF/UA-1 belgesi için başlık numaralarının boşluklar olmadan sırayla gitmesi ek olarak gereklidir.

Doğru çıktıyı sağlamak için kullanıcıların kaynak belge içeriğinin düzgün bir şekilde organize edildiğini ve paragraflar için çıkış düzeylerinin doğru belirtildiğini sağlamaları gerekir. Aksi takdirde, kullanıcının çıktı PDF belgesinin yapısını doğrulaması ve onarması gerekir.

İçeriği Bir Artifak olarak İşaretleme

PDF standart uyum düzeyleri içinde Aspose.Words İsteğin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Şu anda Aspose.Words sayfa başlıkları ve alt yazılarına, not ayırıcılarına, tekrar eden tablo başlık hücresine ve süsleme resimleri olarak işaretler. Bu listenin gelecekte güncellenebileceğini not edin.

Eğer bir belge herhangi bir diğer içeriği, bir hazine olarak işaretlenmelidir ya da herhangi bir hazine içeriği gerçek içerik ise, müşteriler çıktıda bunu düzeltmelidir.

Doğal Dil Spesifikasyonu

PDF standart uyum düzeyleri içinde Aspose.Words İsteğin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Metin dili belirtilen Microsoft Word belgede yer alır. Aspose.Words belirtilen dili bir çıktı PDF’ye ekle ve belirtilen dil özniteliği bir işaretli içerik dizisine veya bir Span etiketi ile birlikte Lang etiketine bağlanır - bu, ExportLanguageToSpanTag özelliğine kontrol edilir. Genel olarak, metin kullanıcı tarafından girildiğinde dil sorunları yoktur Microsoft Word. Ancak otomatik metin oluşturulması durumunda dilin yanlış olması ihtimali var.

Şekil Açıklaması

PDF standart uyum düzeyleri içinde Aspose.Words Gereksinimin varlığı
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Microsoft Word belgeleri kullanıcıların bir figür başlığı eklemesine imkan tanır.

Şu anda Aspose.Words altyazıları Caption etiketiyle dışa aktaramaz, bu yüzden bunları çıktı PDF’sinde işaretlemek zorundadır.

Alternatif Açıklamalar

PDF standart uyum düzeyleri içinde Aspose.Words İsteğin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Word belgeleri kullanıcıların alternatif metinleri resimlere, şekillere ve tablolara eklemesine izin verir. Aspose.Words bu alternatif metni çıktı PDF’ine dışarı aktarır.

Hyperlinkler için Alternatif Tanımlar

PDF standart uyum düzeyleri içinde Aspose.Words İsteğin varlığı
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Önceki noktaya ek olarak Microsoft Word belgeleri kullanıcıların alternatif metni bağlantıya eklemesine izin verir. Aspose.Words böyle bir alternatif metni çıktı PDF’ine dışarı aktarır.

Ne yazık ki, her uygulama alternatif bir açıklama ayarlamanıza izin vermez. Örneğin, Adobe Acrobat şu anda böyle bir açıklamayı hiper bağlantılar için etkinleştirmemektedir. Fakat Microsoft Word’da bunu şu şekilde yapabilirsiniz:

alternate-descriptions-hyperlinks-mw

Bazen bir sorun ortaya çıkıyor, otomatik olarak oluşturulan bağlantılar için alt metin ayarlamak mümkün değil Microsoft Word GUI aracılığıyla, İçindekiler (TOC) tablosu Aspose.Words bu alanları kendisi güncelleyebilir ve bağlantıları üretebilir.

TOC alanlarını Aspose.Words Document Object Model kullanarak güncellemek için kod örneğini izleyin ( DOM ):

Document doc = new Document(fileName);
ArrayList<FieldHyperlink> tocHyperLinks = new ArrayList<>();

for (Field field : doc.getRange().getFields()) {
    if (field.getType() == FieldType.FIELD_HYPERLINK) {
        FieldHyperlink hyperlink = (FieldHyperlink) field;
        if (hyperlink.getFieldCode().startsWith("#_Toc")) {
            tocHyperLinks.add(hyperlink);
        }
    }
}

for (FieldHyperlink link : tocHyperLinks)
    link.setScreenTip(link.getDisplayResult());

PdfSaveOptions opt = new PdfSaveOptions();
opt.setCompliance(PdfCompliance.PDF_UA_1);
opt.setDisplayDocTitle(true);
opt.setExportDocumentStructure(true);
opt.getOutlineOptions().setHeadingsOutlineLevels(3);
opt.getOutlineOptions().setCreateMissingOutlineLevels(true);

String outFile = fileName.substring(0,fileName.lastIndexOf('.')) + "_aw.pdf";
doc.save(outFile, opt);

Masa Başlıkları

PDF standart uyum seviyeleri içinde Aspose.Words Gereksinim varlığı
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

PDF/UA-1 belgelerindeki tabloların başlıkları olmalı - sütun, satır veya her ikisi. PDF/A sadece standart tablo işaretlemesini gerektirir ki bu ek kısıtlamalar içermez. Not edin ki Aspose.Words standart tablo işaretlemesi otomatik olarak oluşturur.

Değiştirme Metni

PDF standart uyum düzeyleri içinde Aspose.Words Gereksinimin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word belgesi kullanıcıları yedekleme metni ayarlamasına izin vermez. Bu nedenle bu, çıktı PDF’de doğrulanması ve düzeltilmesi gerekir:

AcrobatReplacementText

Kısaltmalar ve Akronimler Genişlemeleri

PDF standart uyum düzeyleri içinde Aspose.Words Gereksinim varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word belgesi kullanıcıların kısaltma ve akronim genişlemeleri ayarlamasına izin vermez. Bu bu yüzden doğrulanmalı ve çıktı PDF’de düzeltilmeli:

AcrobatSplitAddExpansionText

Belge Başlığı

PDF standart uyum düzeyleri içinde Aspose.Words İsteğin varlığı
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
Belge PDF/UA-1 bir başlık içermelidir.

Font Gereksinimleri

PDF standart uyum düzeyleri içinde Aspose.Words Gereksinim varlığı
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

PDF/A-1, PDF/A-2, PDF/A-4 veya PDF/UA-1 formatlarına dönüştürürken Aspose.Words’ı kullanarak yazı tipleri ile çalışırken bir dizi ince ayar da vardır. Bu belgenin olası sorunlarla karşılaşmamak için dikkate alınmalıdırlar.

Aşağıdaki bölümler bu nüansları ve bunların çözümleri için seçenekleri açıklar.

Tip Yasal Gereksinimleri

PDF standart uyum düzeyleri içinde Aspose.Words'' Gereksinim varlığı
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words kullanılan yazı tiplerinin yasal kısıtlamalarını doğrulamaz – kullanıcılara kalmış. Başka bir deyişle, bir kullanıcı Aspose.Words’u kullanarak PDF dönüştürmesi için uygunsuz yazı tipleri sağlamamalı.

.notdef Glyph

PDF standart uyum düzeyleri içinde Aspose.Words Gereksinim varlığı
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Kullanımın .notdef glyph’i yasaklanmıştır. The .notdef glyph’s will appear if a document contains characters that are not present in the selected font, and is unable to resolve them through the Font Fallback mechanism.

Özel Kullanım Alanı (PUA)

PDF standart uyum düzeyleri içinde Aspose.Words İhtiyaç varlığı
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1

Özel Kullanım Alanı (PUA) karakterleri çoğunlukla Windows sembolik yazı tipleri için görünür, örneğin “Sembol”, “Kanat Çıkartmaları”, “Webdings” ve diğerleri. Microsoft Word formatları karakterlerin gerçek metni depolamak için bir seçenek sağlamaz.

“Segoe UI sembolü” Windows sembolik fontlara alternatif olarak kullanılabilir Unicode font.