PDF/A veya PDF/UA ile çalışmak

PDF/A ve PDF/UA biçimi, Word biçimindeki bir belgeden PDF biçimine otomatik dönüştürme sırasında yerine getirilemeyen belge içeriğiyle ilgili çeşitli gereksinimler getirir. Bu gereksinimler, tam olarak PDF/A ve PDF/UA uyumlu bir belge oluşturmak için dönüşümden önce bir Word belgesinde veya dönüşümden sonra bir PDF belgesinde doğrulanmalı ve düzeltilmelidir.

Temel gereksinimler, aşağıdaki bölümlerde ele alacağımız bir PDF/A ve PDF/UA belgesinin yapısı veya yazı tipleri içindir.

Belge Yapısı Gereksinimleri

Mevcut gereksinimler şunlar içindir PDF/A-1a, PDF/A-2a, PDF/A-4, ve PDF/UA-1 biçimleri.

Çeşitli PDF format standartlarına dönüştürülürken Aspose.Words ‘ın nasıl çalıştığına dair bazı nüanslar vardır. Beklenen sonucu elde etmek istiyorsanız bunlar dikkate alınmalıdır.

Aşağıdaki alt bölümler, çeşitli PDF format standartlarına dönüştürülürken Aspose.Words’ın nasıl çalıştığına dair nüansları ve bunların çözümü için seçenekleri açıklamaktadır.

Yapı Tipi

PDF Aspose.Words içindeki standart uyumluluk seviyeleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

PDF belgesi, başlıklar, paragraflar, tablolar ve diğerleri gibi bloklar dizisidir. Bu bloklar bir belge yapısı oluşturur - güçlü veya zayıf.

Hem güçlü hem de zayıf yapılar PDF/A için geçerlidir. Microsoft Word belgeler tasarım gereği zayıf bir yapıya sahiptir ve Aspose.Words sırasıyla zayıf yapıyla PDF oluşturur ve ayrıca kaynak belgedeki paragrafların anahat düzeylerine göre başlıklar oluşturur.

Zayıf bir yapıya sahip PDF/UA-1 bir belge için ayrıca başlık numaralarının boşluksuz sırayla gitmesi gerekir.

Doğru çıktıyı sağlamak için kullanıcıların kaynak belge içeriğinin düzgün bir şekilde düzenlendiğinden ve paragraflar için anahat düzeylerinin doğru bir şekilde belirtildiğinden emin olmaları gerekir. Aksi takdirde, kullanıcı çıktı PDF belgesinin yapısını doğrulamalı ve düzeltmelidir.

İçeriği Eser Olarak İşaretleme

PDF Aspose.Words içindeki standart uyumluluk seviyeleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Şu anda Aspose.Words sayfa üstbilgilerini ve altbilgilerini, not ayırıcılarını, tekrarlanan tablo üstbilgi hücrelerini ve dekoratif görüntüleri artefakt olarak işaretler. Bu listenin gelecekte güncellenebileceğini unutmayın.

Bir belge, eser olarak işaretlenmesi gereken başka bir içerik içeriyorsa veya yapay içeriklerden herhangi biri gerçek bir içerikse, müşteriler bunu PDF çıktısında düzeltmelidir.

Doğal Dil Özellikleri

PDF Aspose.Words içindeki standart uyumluluk seviyeleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Metin dili Microsoft Word belgelerinde belirtilmiştir. Aspose.Words belirtilen dili, işaretli içerik dizisine veya Yayılma Alanı etiketine eklenmiş Lang özniteliğine sahip bir PDF çıktısına dışa aktarır - bu, ExportLanguageToSpanTag özelliği tarafından kontrol edilir. Genellikle kullanıcı tarafından Microsoft Word aracılığıyla metin girildiğinde dil sorunu olmaz. Ancak, metin otomatik olarak oluşturulursa dilin yanlış olma olasılığı vardır.

Şekil Başlığı

PDF Aspose.Words içindeki standart uyumluluk seviyeleri Gereksinimin varlığı
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Microsoft Word belgeler, kullanıcıların şekil başlığı eklemelerine izin verir.

Şu anda Aspose.Words, Resim Yazısı etiketiyle resim yazıları dışa aktaramıyor, bu nedenle PDF çıktısında işaretlenmeleri gerekiyor.

Alternatif Açıklamalar

PDF Aspose.Words içindeki standart uyumluluk seviyeleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Word belgeler, kullanıcıların resimlere, şekillere ve tablolara alternatif metin eklemelerine olanak tanır. Aspose.Words böyle bir alternatif metni PDF çıktısına dışa aktarır.

Köprüler için Alternatif Açıklamalar

PDF Aspose.Words içindeki standart uyumluluk seviyeleri Gereksinimin varlığı
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Önceki noktaya ek olarak, Microsoft Word belgeler, kullanıcıların köprülere alternatif metin eklemelerine de izin verir. Aspose.Words böyle bir alternatif metni PDF çıktısına dışa aktarır.

Ne yazık ki, her uygulama alternatif bir açıklama ayarlamanıza izin vermez. Örneğin, Adobe Acrobat şu anda köprüler için böyle bir açıklama ayarlamayı etkinleştirmiyor. Ancak Microsoft Word ‘da bunu aşağıdaki gibi yapabilirsiniz:

alternate-descriptions-hyperlinks-mw

Bazen, içindekiler tablosundaki (TOC) otomatik oluşturulan köprüler için alt metnin Microsoft Word GUI aracılığıyla ayarlanmasının mümkün olmadığı bir sorun vardır. Aspose.Words bu tür alanları güncelleyebilir ve bağlantıları kendi başına oluşturabilir.

Aspose.Words Belge Nesne Modelini (DOM) kullanarak TOC alanlarını güncellemek için kod örneğini izleyin.:

auto doc = MakeObject<Document>(filename);
auto tocHyperLinks = doc->get_Range()->get_Fields()->
    LINQ_Where([](SharedPtr<Field> f) {return f->get_Type() == FieldType::FieldHyperlink; })->            
    LINQ_Where([](SharedPtr<FieldHyperlink> f) { return f->get_DisplayResult().StartsWith(u"#_Toc"); });

for (const auto& link : tocHyperLinks)
    link->set_ScreenTip(link->get_DisplayResult());

auto opt = MakeObject<PdfSaveOptions>();
opt->set_Compliance(PdfCompliance::PdfUa1);
opt->set_DisplayDocTitle(true);
opt->set_ExportDocumentStructure(true);
opt->get_OutlineOptions()->set_HeadingsOutlineLevels(3);
opt->get_OutlineOptions()->set_CreateMissingOutlineLevels(true);

auto outFile = filename.substr(0, filename.find_last_of('.')) + "_aw.pdf";
doc->Save(outFile, opt);

Tablo Başlıkları

PDF Aspose.Words içindeki standart uyumluluk seviyeleri Gereksinimin varlığı
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

PDF/UA-1 belgelerindeki tabloların başlıkları olmalıdır - sütun, satır veya her ikisi. PDF/A yalnızca ek kısıtlamaları olmayan standart tablo işaretlemesi gerektirir. Aspose.Words’ın standart tablo işaretlemesini otomatik olarak oluşturduğunu unutmayın.

Metni Değiştirme

PDF Aspose.Words içindeki standart uyumluluk seviyeleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word belge, kullanıcıların değiştirme metni ayarlamasına izin vermez. Yani bunun PDF çıktısında doğrulanması ve düzeltilmesi gerekiyor:

AcrobatReplacementText

Kısaltmalar ve Kısaltmalar Açılımları

PDF Aspose.Words içindeki standart uyumluluk seviyeleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word belge, kullanıcıların kısaltmalar ve kısaltmalar genişletmeleri ayarlamasına izin vermez. Yani bunun PDF çıktısında doğrulanması ve düzeltilmesi gerekiyor:

AcrobatSplitAddExpansionText

Belge Başlığı

PDF Aspose.Words içindeki standart uyumluluk seviyeleri Gereksinimin varlığı
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
PDF/UA-1 ‘deki belgenin bir başlığı olmalıdır.

Yazı Tipi Gereksinimleri

PDF Aspose.Words içindeki standart uyumluluk seviyeleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Dönüştürürken yazı tipleriyle çalışmanın bir takım nüansları da vardır PDF/A-1, PDF/A-2, PDF/A-4 veya PDF/UA-1 Aspose.Words kullanarak biçimlendirir. Çıktı belgesiyle ilgili olası sorunlardan kaçınmak istiyorsanız bunlar dikkate alınmalıdır.

Aşağıdaki bölümler, çözümleri için bu tür nüansları ve seçenekleri açıklamaktadır.

Yazı Tipi Yasal Gereklilikleri

PDF Aspose.Words içindeki standart uyumluluk seviyeleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words kullanılan fontların yasal kısıtlamalarını doğrulamaz - bu kullanıcılara bağlıdır. Başka bir deyişle, bir kullanıcı Aspose.Words kullanarak PDF dönüştürme için uygun olmayan yazı tipleri sağlamamalıdır.

.notdef Glyph

PDF Aspose.Words içindeki standart uyumluluk seviyeleri Gereksinimin varlığı
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

.notdef glifinin kullanılması yasaktır. Bir belge seçili yazı tipinde bulunmayan ve Yazı Tipi Geri Dönüş mekanizması aracılığıyla da çözülemeyen karakterler içeriyorsa .notdef glifi görünecektir.

Özel Kullanım Alanı (PUA)

PDF Aspose.Words içindeki standart uyumluluk seviyeleri Gereksinimin varlığı
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1

Özel Kullanım Alanı (PUA) karakterleri çoğunlukla “Symbol”, “Wingdings”, “Webdings” ve diğerleri gibi Windows sembolik yazı tipleri için görünür. Microsoft Word biçimler, karakterler için gerçek metni saklama seçeneği sağlamaz.

“Segoe UI Sembolü”, sembolik yazı tiplerine alternatif olarak kullanılabilecek bir Windows Unicode yazı tipidir.