PDF/A veya PDF/UA ile çalışmak
PDF/A ve PDF/UA biçimi, Word biçimindeki bir belgeden PDF biçimine otomatik dönüştürme sırasında yerine getirilemeyen belge içeriğiyle ilgili çeşitli gereksinimler getirir. Bu gereksinimler, tam olarak PDF/A ve PDF/UA uyumlu bir belge oluşturmak için dönüşümden önce bir Word belgesinde veya dönüşümden sonra bir PDF belgesinde doğrulanmalı ve düzeltilmelidir.
Temel gereksinimler, aşağıdaki bölümlerde ele alacağımız bir PDF/A ve PDF/UA belgesinin yapısı veya yazı tipleri içindir.
Belge Yapısı Gereksinimleri
Mevcut gereksinimler şunlar içindir PDF/A-1a, PDF/A-2a, PDF/A-4, ve PDF/UA-1 biçimleri.
Çeşitli PDF format standartlarına dönüştürülürken Aspose.Words ‘ın nasıl çalıştığına dair bazı nüanslar vardır. Beklenen sonucu elde etmek istiyorsanız bunlar dikkate alınmalıdır.
Şartname bize aşağıdakileri söyler (ayrıntıları görmek için genişletin):
Yazarların, uygun doğrulama olmadan otomatik süreçleri kullanarak yapısal veya anlamsal bilgiler üretmeleri önerilmez.
ISO 19005-2, 6.7.1
Aşağıdaki alt bölümler, çeşitli PDF format standartlarına dönüştürülürken Aspose.Words’ın nasıl çalıştığına dair nüansları ve bunların çözümü için seçenekleri açıklamaktadır.
Yapı Tipi
PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
PDF belgesi, başlıklar, paragraflar, tablolar ve diğerleri gibi bloklar dizisidir. Bu bloklar bir belge yapısı oluşturur - güçlü veya zayıf.
Hem güçlü hem de zayıf yapılar PDF/A için geçerlidir. Microsoft Word belgeler tasarım gereği zayıf bir yapıya sahiptir ve Aspose.Words sırasıyla zayıf yapıyla PDF oluşturur ve ayrıca kaynak belgedeki paragrafların anahat düzeylerine göre başlıklar oluşturur.
Zayıf bir yapıya sahip PDF/UA-1 bir belge için ayrıca başlık numaralarının boşluksuz sırayla gitmesi gerekir.
Şartname bize aşağıdakileri söyler (ayrıntıları görmek için genişletin):
Blok düzeyinde yapı, iki temel paradigmadan birini takip edebilir:
ISO-32000-1, 14.8.4.3.5
PDF/UA-1 belgeler için belirtim, başlık düzeyleriyle ilgili bir ekleme içerir (ayrıntıları görmek için genişletin):
Belge semantiği azalan bir başlık dizisi gerektiriyorsa, böyle bir sıra katı sayısal sırayla ilerler ve araya giren bir başlık seviyesini atlamaz. H1 H2 H3 izin verilirken H1 H3 izin verilmez.
ISO-14289-1, 7.4.2
Doğru çıktıyı sağlamak için kullanıcıların kaynak belge içeriğinin düzgün bir şekilde düzenlendiğinden ve paragraflar için anahat düzeylerinin doğru bir şekilde belirtildiğinden emin olmaları gerekir. Aksi takdirde, kullanıcı çıktı PDF belgesinin yapısını doğrulamalı ve düzeltmelidir.
Bu blokta örnekler görebilirsiniz: Microsoft Word 'da anahat düzeylerinin nasıl ayarlanacağı veya çıktı PDF belgesinin yapısının nasıl kontrol edilip düzeltileceği (ayrıntıları görmek için genişletin).
Microsoft Word 'da anahat düzeyini ayarlamak için varsayılan "Başlık X" stilleri kullanılabilir:
Ek olarak, anahat seviyesi "Paragraf" penceresinde kontrol edilebilir veya değiştirilebilir:
Acrobat'ta belge yapısı "Etiketler" bölmesinde kontrol edilebilir veya değiştirilebilir:
İçeriği Eser Olarak İşaretleme
PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
Şu anda Aspose.Words sayfa üstbilgilerini ve altbilgilerini, not ayırıcılarını, tekrarlanan tablo üstbilgi hücrelerini ve dekoratif görüntüleri artefakt olarak işaretler. Bu listenin gelecekte güncellenebileceğini unutmayın.
Şartname bize aşağıdakileri söyler (ayrıntıları görmek için genişletin):
Bir belgedeki grafik nesneleri iki sınıfa ayrılabilir:
ISO-32000-1, 14.8.2.2.1
Bir belge, eser olarak işaretlenmesi gereken başka bir içerik içeriyorsa veya yapay içeriklerden herhangi biri gerçek bir içerikse, müşteriler bunu PDF çıktısında düzeltmelidir.
Bu blokta örnekler görebilirsiniz: Microsoft Word 'da şekillerin dekoratif olarak nasıl işaretleneceği veya çıktı PDF belgesinde şeklin artefakt olarak nasıl işaretleneceği (ayrıntıları görmek için genişletin).
Örneğin, şekiller Microsoft Word 'da dekoratif olarak işaretlenebilir, böylece bir eser olarak PDF'e dışa aktarılırlar:
PDF çıktısında şekli artefakt olarak işaretleyebilirsiniz:
Ayrıca, bir başlıktaki metni eserden PDF çıktısındaki gerçek içeriğe geçirebilirsiniz:
Doğal Dil Özellikleri
PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
Metin dili Microsoft Word belgelerinde belirtilmiştir. Aspose.Words belirtilen dili, işaretli içerik dizisine veya Yayılma Alanı etiketine eklenmiş Lang özniteliğine sahip bir PDF çıktısına dışa aktarır - bu, ExportLanguageToSpanTag özelliği tarafından kontrol edilir. Genellikle kullanıcı tarafından Microsoft Word aracılığıyla metin girildiğinde dil sorunu olmaz. Ancak, metin otomatik olarak oluşturulursa dilin yanlış olma olasılığı vardır.
Şartname bize aşağıdakileri söyler (ayrıntıları görmek için genişletin):
Bir dosyadaki tüm metinler için varsayılan doğal dil, belgenin Katalog sözlüğündeki Lang girişi tarafından belirtilmelidir.
Varsayılan dilden farklı bir dosyadaki tüm metin içeriği, işaretli içerik dizisine eklenmiş bir `Lang` özelliğinin kullanılmasıyla veya bir yapı öğesi sözlüğündeki bir Lang girdisiyle belirtilmelidir...
ISO-19005-2, 6.7.4
Ayrıca PDF/UA-1 için belirtim bize aşağıdakileri söyler (ayrıntıları görmek için genişletin):
Doğal dil ilan edilecek ... Doğal dildeki değişiklikler ilan edilecek.
ISO-14289-1, 7.2
Bu blokta örnekler görebilirsiniz: dilin doğru şekilde belirtildiğinden nasıl emin olunur (ayrıntıları görmek için genişletin).
Kullanıcılar, dilin kaynak Word belgesinde doğru şekilde belirtildiğinden emin olmalıdır:
Veya çıktı PDF belgesi:
Şekil Başlığı
PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
Microsoft Word belgeler, kullanıcıların şekil başlığı eklemelerine izin verir.
Şartname bize aşağıdakileri söyler (ayrıntıları görmek için genişletin):
Bir şekle eşlik eden bir resim yazısı, bir Resim Yazısı etiketi ile etiketlenecektir.
ISO-14289-1, 7.3
Şu anda Aspose.Words, Resim Yazısı etiketiyle resim yazıları dışa aktaramıyor, bu nedenle PDF çıktısında işaretlenmeleri gerekiyor.
Bu blokta örnekler görebilirsiniz: resim yazısı nasıl eklenir (ayrıntıları görmek için genişletin).
Microsoft Word 'da, başlık içerik menüsünden eklenebilir:
Acrobat'ta resim yazısı `Object` Özellikler iletişim kutusu aracılığıyla eklenebilir veya değiştirilebilir:
Alternatif Açıklamalar
PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
Microsoft Word belgeler, kullanıcıların resimlere, şekillere ve tablolara alternatif metin eklemelerine olanak tanır. Aspose.Words böyle bir alternatif metni PDF çıktısına dışa aktarır.
Şartname bize aşağıdakileri söyler (ayrıntıları görmek için genişletin):
İçeriği önceden belirlenmiş doğal bir metinsel analoğa sahip olmayan tüm yapı öğeleri, örneğin görüntüler, formüller vb., yapı öğesi sözlüğündeki Alt girişini kullanarak alternatif bir metin açıklaması sağlamalıdır...
NOTE Alternatif açıklamalar, aksi takdirde opak metinsel olmayan içeriğin doğru yorumlanmasına yardımcı olan metinsel açıklamalar sağlar.
ISO-19005-2, 6.7.5
Bu blokta örnekler görebilirsiniz: tüm öğelerin alternatif bir metne sahip olduğundan nasıl emin olunur (ayrıntıları görmek için genişletin).
Kullanıcılar, tüm öğelerin kaynak Word belgesinde alternatif bir metne sahip olduğundan emin olmalıdır:
Veya çıktı PDF belgesi:
Köprüler için Alternatif Açıklamalar
PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
Önceki noktaya ek olarak, Microsoft Word belgeler, kullanıcıların köprülere alternatif metin eklemelerine de izin verir. Aspose.Words böyle bir alternatif metni PDF çıktısına dışa aktarır.
Ne yazık ki, her uygulama alternatif bir açıklama ayarlamanıza izin vermez. Örneğin, Adobe Acrobat şu anda köprüler için böyle bir açıklama ayarlamayı etkinleştirmiyor. Ancak Microsoft Word ‘da bunu aşağıdaki gibi yapabilirsiniz:
Bazen, içindekiler tablosundaki (TOC) otomatik oluşturulan köprüler için alt metnin Microsoft Word GUI aracılığıyla ayarlanmasının mümkün olmadığı bir sorun vardır. Aspose.Words bu tür alanları güncelleyebilir ve bağlantıları kendi başına oluşturabilir.
Aspose.Words Belge Nesne Modelini (DOM) kullanarak TOC
alanlarını güncellemek için kod örneğini izleyin.:
auto doc = MakeObject<Document>(filename);
auto tocHyperLinks = doc->get_Range()->get_Fields()->
LINQ_Where([](SharedPtr<Field> f) {return f->get_Type() == FieldType::FieldHyperlink; })->
LINQ_Where([](SharedPtr<FieldHyperlink> f) { return f->get_DisplayResult().StartsWith(u"#_Toc"); });
for (const auto& link : tocHyperLinks)
link->set_ScreenTip(link->get_DisplayResult());
auto opt = MakeObject<PdfSaveOptions>();
opt->set_Compliance(PdfCompliance::PdfUa1);
opt->set_DisplayDocTitle(true);
opt->set_ExportDocumentStructure(true);
opt->get_OutlineOptions()->set_HeadingsOutlineLevels(3);
opt->get_OutlineOptions()->set_CreateMissingOutlineLevels(true);
auto outFile = filename.substr(0, filename.find_last_of('.')) + "_aw.pdf";
doc->Save(outFile, opt);
Tablo Başlıkları
PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
PDF/UA-1 belgelerindeki tabloların başlıkları olmalıdır - sütun, satır veya her ikisi. PDF/A yalnızca ek kısıtlamaları olmayan standart tablo işaretlemesi gerektirir. Aspose.Words’ın standart tablo işaretlemesini otomatik olarak oluşturduğunu unutmayın.
Şartname bize aşağıdakileri söyler (ayrıntıları görmek için genişletin):
Tablolar başlıklar içermelidir ... Tablolar sütun başlıkları, satır başlıkları veya her ikisini birden içerebilir.
ISO-14289-1, 7.5
Bu blokta örnekler görebilirsiniz: tablo başlığının nasıl ayarlanacağı (ayrıntıları görmek için genişletin).
Tablo başlığı, kaynak Microsoft Word belgesinden biri olarak ayarlanabilir:
Veya çıktı PDF:
Metni Değiştirme
PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
Şartname bize aşağıdakileri söyler (ayrıntıları görmek için genişletin):
Şartname bize aşağıdakileri söyler:
Standart olmayan bir şekilde temsil edilen tüm metinsel yapı öğeleri, örneğin özel karakterler veya satır içi grafikler, yapı öğesi sözlüğündeki `ActualText` girişini kullanarak yedek metin sağlamalıdır...
ISO-19005-2, 6.7.7
Microsoft Word belge, kullanıcıların değiştirme metni ayarlamasına izin vermez. Yani bunun PDF çıktısında doğrulanması ve düzeltilmesi gerekiyor:
Kısaltmalar ve Kısaltmalar Açılımları
PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
Şartname bize aşağıdakileri söyler (ayrıntıları görmek için genişletin):
Metinsel içerikteki tüm kısaltma ve kısaltma örnekleri, E özelliği kısaltmanın veya kısaltmanın metinsel olarak genişletilmesini sağlayan bir Açıklık etiketine sahip işaretli bir içerik dizisine yerleştirilmelidir...
ISO-19005-2, 6.7.8
Microsoft Word belge, kullanıcıların kısaltmalar ve kısaltmalar genişletmeleri ayarlamasına izin vermez. Yani bunun PDF çıktısında doğrulanması ve düzeltilmesi gerekiyor:
Belge Başlığı
PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/A-4 | |
PDF/UA-1 |
PDF/UA-1 ‘deki belgenin bir başlığı olmalıdır. |
Şartname bize aşağıdakileri söyler (ayrıntıları görmek için genişletin):
Şartname bize aşağıdakileri söyler:
Belgenin katalog sözlüğündeki Meta Veri akışı bir dc: başlık girdisi içermelidir; burada dc, Dublin Çekirdek meta veri şeması için önerilen önektir…
ISO-14289-1, 7.1
Bu blokta örnekler görebilirsiniz: belge başlığının nasıl ayarlanacağı (ayrıntıları görmek için genişletin).
Belge başlığı, kaynak Microsoft Word belgesi olarak ayarlanabilir:
Veya çıktı PDF:
Yazı Tipi Gereksinimleri
PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2b | |
PDF/A-4 | |
PDF/UA-1 |
Dönüştürürken yazı tipleriyle çalışmanın bir takım nüansları da vardır PDF/A-1, PDF/A-2, PDF/A-4 veya PDF/UA-1 Aspose.Words kullanarak biçimlendirir. Çıktı belgesiyle ilgili olası sorunlardan kaçınmak istiyorsanız bunlar dikkate alınmalıdır.
Aşağıdaki bölümler, çözümleri için bu tür nüansları ve seçenekleri açıklamaktadır.
Yazı Tipi Yasal Gereklilikleri
PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2b | |
PDF/A-4 | |
PDF/UA-1 |
Aspose.Words kullanılan fontların yasal kısıtlamalarını doğrulamaz - bu kullanıcılara bağlıdır. Başka bir deyişle, bir kullanıcı Aspose.Words kullanarak PDF dönüştürme için uygun olmayan yazı tipleri sağlamamalıdır.
Şartname bize aşağıdakileri söyler (ayrıntıları görmek için genişletin):
Yalnızca sınırsız, evrensel işleme için bir dosyaya yasal olarak gömülebilir yazı tipi programları kullanılacaktır.
ISO-19005-2, 6.2.11.4.1; ISO-14289-1, 7.21.4.1 ( iki özellikte tam olarak aynı alıntılar)
.notdef Glyph
PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2b | |
PDF/A-4 | |
PDF/UA-1 |
.notdef
glifinin kullanılması yasaktır. Bir belge seçili yazı tipinde bulunmayan ve Yazı Tipi Geri Dönüş mekanizması aracılığıyla da çözülemeyen karakterler içeriyorsa .notdef
glifi görünecektir.
Şartname bize aşağıdakileri söyler (ayrıntıları görmek için genişletin):
Uygun bir belge, bir referans içermeyecektir.herhangi bir içerik akışında metin oluşturma modundan bağımsız olarak, işleçleri gösteren herhangi bir metinden glif tanımlamayın.
ISO-19005-2, 6.2.11.8; ISO-14289-1, 7.21.8 ( iki özellikte tam olarak aynı alıntılar)
Bu blokta örnekler görebilirsiniz: bu karakterlerin nasıl kaldırılacağı veya değiştirileceği (ayrıntıları görmek için genişletin).
Kullanıcılar bu karakterleri kaynak Word belgesinde kaldırmalı veya değiştirmelidir:
Veya "Edit PDF" aracını kullanarak çıktı PDF belgesi:
Özel Kullanım Alanı (PUA)
PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2b | |
PDF/A-4 | |
PDF/UA-1 |
Özel Kullanım Alanı (PUA) karakterleri çoğunlukla “Symbol”, “Wingdings”, “Webdings” ve diğerleri gibi Windows sembolik yazı tipleri için görünür. Microsoft Word biçimler, karakterler için gerçek metni saklama seçeneği sağlamaz.
Şartname bize aşağıdakileri söyler (ayrıntıları görmek için genişletin):
Yalnızca A Düzeyi uyumu için, herhangi bir karakter için... bu, Unicode Özel Kullanım Alanındaki (PUA) bir kod veya kodlarla, bir ActualText girdisiyle eşleştirilir... bu karakter veya böyle bir karakterin parçası olduğu bir karakter dizisi için mevcut olacaktır.
ISO-19005-2, 6.2.11.7.3
“Segoe UI Sembolü”, sembolik yazı tiplerine alternatif olarak kullanılabilecek bir Windows Unicode yazı tipidir.
Bu blokta örnekler görebilirsiniz: sembolik yazı tipleriyle sorunu çözmek için kullanıcının yapması gerekenler (ayrıntıları görmek için genişletin).
Kaynak Word belgesindeki simgesel yazı tipini Unicode olanla değiştirin:
Veya çıktı PDF belgesindeki sorunlu karakterlere bir ActualText girişi ekleyin: