Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.
PDF/A ve PDF/UA biçimi, Word biçimindeki bir belgeden PDF biçimine otomatik dönüştürme sırasında yerine getirilemeyen belge içeriğiyle ilgili çeşitli gereksinimler getirir. Bu gereksinimler, tam olarak PDF/A ve PDF/UA uyumlu bir belge oluşturmak için dönüşümden önce bir Word belgesinde veya dönüşümden sonra bir PDF belgesinde doğrulanmalı ve düzeltilmelidir.
Temel gereksinimler, aşağıdaki bölümlerde ele alacağımız bir PDF/A ve PDF/UA belgesinin yapısı veya yazı tipleri içindir.
Mevcut gereksinimler şunlar içindir PDF/A-1a, PDF/A-2a, PDF/A-4, ve PDF/UA-1 biçimleri.
Çeşitli PDF format standartlarına dönüştürülürken Aspose.Words ‘ın nasıl çalıştığına dair bazı nüanslar vardır. Beklenen sonucu elde etmek istiyorsanız bunlar dikkate alınmalıdır.
Yazarların, uygun doğrulama olmadan otomatik süreçleri kullanarak yapısal veya anlamsal bilgiler üretmeleri önerilmez.
ISO 19005-2, 6.7.1
Aşağıdaki alt bölümler, çeşitli PDF format standartlarına dönüştürülürken Aspose.Words’ın nasıl çalıştığına dair nüansları ve bunların çözümü için seçenekleri açıklamaktadır.
| PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
|---|---|
| PDF/A-1a |
|
| PDF/A-2a |
|
| PDF/UA-1 |
|
PDF belgesi, başlıklar, paragraflar, tablolar ve diğerleri gibi bloklar dizisidir. Bu bloklar bir belge yapısı oluşturur - güçlü veya zayıf.
Hem güçlü hem de zayıf yapılar PDF/A için geçerlidir. Microsoft Word belgeler tasarım gereği zayıf bir yapıya sahiptir ve Aspose.Words sırasıyla zayıf yapıyla PDF oluşturur ve ayrıca kaynak belgedeki paragrafların anahat düzeylerine göre başlıklar oluşturur.
Zayıf bir yapıya sahip PDF/UA-1 bir belge için ayrıca başlık numaralarının boşluksuz sırayla gitmesi gerekir.
Blok düzeyinde yapı, iki temel paradigmadan birini takip edebilir:
ISO-32000-1, 14.8.4.3.5
Belge semantiği azalan bir başlık dizisi gerektiriyorsa, böyle bir sıra katı sayısal sırayla ilerler ve araya giren bir başlık seviyesini atlamaz. H1 H2 H3 izin verilirken H1 H3 izin verilmez.
ISO-14289-1, 7.4.2
Doğru çıktıyı sağlamak için kullanıcıların kaynak belge içeriğinin düzgün bir şekilde düzenlendiğinden ve paragraflar için anahat düzeylerinin doğru bir şekilde belirtildiğinden emin olmaları gerekir. Aksi takdirde, kullanıcı çıktı PDF belgesinin yapısını doğrulamalı ve düzeltmelidir.
Microsoft Word 'da anahat düzeyini ayarlamak için varsayılan "Başlık X" stilleri kullanılabilir:
Ek olarak, anahat seviyesi "Paragraf" penceresinde kontrol edilebilir veya değiştirilebilir:
Acrobat'ta belge yapısı "Etiketler" bölmesinde kontrol edilebilir veya değiştirilebilir:
| PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
|---|---|
| PDF/A-1a |
|
| PDF/A-2a |
|
| PDF/UA-1 |
|
Şu anda Aspose.Words sayfa üstbilgilerini ve altbilgilerini, not ayırıcılarını, tekrarlanan tablo üstbilgi hücrelerini ve dekoratif görüntüleri artefakt olarak işaretler. Bu listenin gelecekte güncellenebileceğini unutmayın.
Bir belgedeki grafik nesneleri iki sınıfa ayrılabilir:
ISO-32000-1, 14.8.2.2.1
Bir belge, eser olarak işaretlenmesi gereken başka bir içerik içeriyorsa veya yapay içeriklerden herhangi biri gerçek bir içerikse, müşteriler bunu PDF çıktısında düzeltmelidir.
Örneğin, şekiller Microsoft Word 'da dekoratif olarak işaretlenebilir, böylece bir eser olarak PDF'e dışa aktarılırlar:
PDF çıktısında şekli artefakt olarak işaretleyebilirsiniz:
Ayrıca, bir başlıktaki metni eserden PDF çıktısındaki gerçek içeriğe geçirebilirsiniz:
| PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
|---|---|
| PDF/A-1a |
|
| PDF/A-2a |
|
| PDF/UA-1 |
|
Metin dili Microsoft Word belgelerinde belirtilmiştir. Aspose.Words belirtilen dili, işaretli içerik dizisine veya Yayılma Alanı etiketine eklenmiş Lang özniteliğine sahip bir PDF çıktısına dışa aktarır - bu, ExportLanguageToSpanTag özelliği tarafından kontrol edilir. Genellikle kullanıcı tarafından Microsoft Word aracılığıyla metin girildiğinde dil sorunu olmaz. Ancak, metin otomatik olarak oluşturulursa dilin yanlış olma olasılığı vardır.
Bir dosyadaki tüm metinler için varsayılan doğal dil, belgenin Katalog sözlüğündeki Lang girişi tarafından belirtilmelidir.
Varsayılan dilden farklı bir dosyadaki tüm metin içeriği, işaretli içerik dizisine eklenmiş bir `Lang` özelliğinin kullanılmasıyla veya bir yapı öğesi sözlüğündeki bir Lang girdisiyle belirtilmelidir...
ISO-19005-2, 6.7.4
Doğal dil ilan edilecek ... Doğal dildeki değişiklikler ilan edilecek.
ISO-14289-1, 7.2
Kullanıcılar, dilin kaynak Word belgesinde doğru şekilde belirtildiğinden emin olmalıdır:
Veya çıktı PDF belgesi:
| PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
|---|---|
| PDF/A-1a | |
| PDF/A-2a | |
| PDF/UA-1 |
|
Microsoft Word belgeler, kullanıcıların şekil başlığı eklemelerine izin verir.
Bir şekle eşlik eden bir resim yazısı, bir Resim Yazısı etiketi ile etiketlenecektir.
ISO-14289-1, 7.3
Şu anda Aspose.Words, Resim Yazısı etiketiyle resim yazıları dışa aktaramıyor, bu nedenle PDF çıktısında işaretlenmeleri gerekiyor.
Microsoft Word 'da, başlık içerik menüsünden eklenebilir:
Acrobat'ta resim yazısı `Object` Özellikler iletişim kutusu aracılığıyla eklenebilir veya değiştirilebilir:
| PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
|---|---|
| PDF/A-1a |
|
| PDF/A-2a |
|
| PDF/UA-1 |
|
Microsoft Word belgeler, kullanıcıların resimlere, şekillere ve tablolara alternatif metin eklemelerine olanak tanır. Aspose.Words böyle bir alternatif metni PDF çıktısına dışa aktarır.
İçeriği önceden belirlenmiş doğal bir metinsel analoğa sahip olmayan tüm yapı öğeleri, örneğin görüntüler, formüller vb., yapı öğesi sözlüğündeki Alt girişini kullanarak alternatif bir metin açıklaması sağlamalıdır...
NOTE Alternatif açıklamalar, aksi takdirde opak metinsel olmayan içeriğin doğru yorumlanmasına yardımcı olan metinsel açıklamalar sağlar.
ISO-19005-2, 6.7.5
Kullanıcılar, tüm öğelerin kaynak Word belgesinde alternatif bir metne sahip olduğundan emin olmalıdır:
Veya çıktı PDF belgesi:
| PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
|---|---|
| PDF/A-1a | |
| PDF/A-2a | |
| PDF/UA-1 |
|
Önceki noktaya ek olarak, Microsoft Word belgeler, kullanıcıların köprülere alternatif metin eklemelerine de izin verir. Aspose.Words böyle bir alternatif metni PDF çıktısına dışa aktarır.
Ne yazık ki, her uygulama alternatif bir açıklama ayarlamanıza izin vermez. Örneğin, Adobe Acrobat şu anda köprüler için böyle bir açıklama ayarlamayı etkinleştirmiyor. Ancak Microsoft Word ‘da bunu aşağıdaki gibi yapabilirsiniz:
Bazen, içindekiler tablosundaki (TOC) otomatik oluşturulan köprüler için alt metnin Microsoft Word GUI aracılığıyla ayarlanmasının mümkün olmadığı bir sorun vardır. Aspose.Words bu tür alanları güncelleyebilir ve bağlantıları kendi başına oluşturabilir.
Aspose.Words Belge Nesne Modelini (DOM) kullanarak TOC alanlarını güncellemek için kod örneğini izleyin.:
auto doc = MakeObject<Document>(filename);
auto tocHyperLinks = doc->get_Range()->get_Fields()->
LINQ_Where([](SharedPtr<Field> f) {return f->get_Type() == FieldType::FieldHyperlink; })->
LINQ_Where([](SharedPtr<FieldHyperlink> f) { return f->get_DisplayResult().StartsWith(u"#_Toc"); });
for (const auto& link : tocHyperLinks)
link->set_ScreenTip(link->get_DisplayResult());
auto opt = MakeObject<PdfSaveOptions>();
opt->set_Compliance(PdfCompliance::PdfUa1);
opt->set_DisplayDocTitle(true);
opt->set_ExportDocumentStructure(true);
opt->get_OutlineOptions()->set_HeadingsOutlineLevels(3);
opt->get_OutlineOptions()->set_CreateMissingOutlineLevels(true);
auto outFile = filename.substr(0, filename.find_last_of('.')) + "_aw.pdf";
doc->Save(outFile, opt);
| PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
|---|---|
| PDF/A-1a | |
| PDF/A-2a | |
| PDF/UA-1 |
|
PDF/UA-1 belgelerindeki tabloların başlıkları olmalıdır - sütun, satır veya her ikisi. PDF/A yalnızca ek kısıtlamaları olmayan standart tablo işaretlemesi gerektirir. Aspose.Words’ın standart tablo işaretlemesini otomatik olarak oluşturduğunu unutmayın.
Tablolar başlıklar içermelidir ... Tablolar sütun başlıkları, satır başlıkları veya her ikisini birden içerebilir.
ISO-14289-1, 7.5
Tablo başlığı, kaynak Microsoft Word belgesinden biri olarak ayarlanabilir:
Veya çıktı PDF:
| PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
|---|---|
| PDF/A-1a |
|
| PDF/A-2a |
|
| PDF/UA-1 |
Şartname bize aşağıdakileri söyler:
Standart olmayan bir şekilde temsil edilen tüm metinsel yapı öğeleri, örneğin özel karakterler veya satır içi grafikler, yapı öğesi sözlüğündeki `ActualText` girişini kullanarak yedek metin sağlamalıdır...
ISO-19005-2, 6.7.7
Microsoft Word belge, kullanıcıların değiştirme metni ayarlamasına izin vermez. Yani bunun PDF çıktısında doğrulanması ve düzeltilmesi gerekiyor:
| PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
|---|---|
| PDF/A-1a |
|
| PDF/A-2a |
|
| PDF/UA-1 |
Metinsel içerikteki tüm kısaltma ve kısaltma örnekleri, E özelliği kısaltmanın veya kısaltmanın metinsel olarak genişletilmesini sağlayan bir Açıklık etiketine sahip işaretli bir içerik dizisine yerleştirilmelidir...
ISO-19005-2, 6.7.8
Microsoft Word belge, kullanıcıların kısaltmalar ve kısaltmalar genişletmeleri ayarlamasına izin vermez. Yani bunun PDF çıktısında doğrulanması ve düzeltilmesi gerekiyor:
| PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
|---|---|
| PDF/A-1a | |
| PDF/A-2a | |
| PDF/A-4 | |
| PDF/UA-1 |
PDF/UA-1 ‘deki belgenin bir başlığı olmalıdır. |
Şartname bize aşağıdakileri söyler:
Belgenin katalog sözlüğündeki Meta Veri akışı bir dc: başlık girdisi içermelidir; burada dc, Dublin Çekirdek meta veri şeması için önerilen önektir…
ISO-14289-1, 7.1
Belge başlığı, kaynak Microsoft Word belgesi olarak ayarlanabilir:
Veya çıktı PDF:
| PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
|---|---|
| PDF/A-1a |
|
| PDF/A-1b |
|
| PDF/A-2a |
|
| PDF/A-2b |
|
| PDF/A-4 |
|
| PDF/UA-1 |
|
Dönüştürürken yazı tipleriyle çalışmanın bir takım nüansları da vardır PDF/A-1, PDF/A-2, PDF/A-4 veya PDF/UA-1 Aspose.Words kullanarak biçimlendirir. Çıktı belgesiyle ilgili olası sorunlardan kaçınmak istiyorsanız bunlar dikkate alınmalıdır.
Aşağıdaki bölümler, çözümleri için bu tür nüansları ve seçenekleri açıklamaktadır.
| PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
|---|---|
| PDF/A-1a |
|
| PDF/A-1b |
|
| PDF/A-2a |
|
| PDF/A-2b |
|
| PDF/A-4 |
|
| PDF/UA-1 |
|
Aspose.Words kullanılan fontların yasal kısıtlamalarını doğrulamaz - bu kullanıcılara bağlıdır. Başka bir deyişle, bir kullanıcı Aspose.Words kullanarak PDF dönüştürme için uygun olmayan yazı tipleri sağlamamalıdır.
Yalnızca sınırsız, evrensel işleme için bir dosyaya yasal olarak gömülebilir yazı tipi programları kullanılacaktır.
ISO-19005-2, 6.2.11.4.1; ISO-14289-1, 7.21.4.1 ( iki özellikte tam olarak aynı alıntılar)
| PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
|---|---|
| PDF/A-1a | |
| PDF/A-1b | |
| PDF/A-2a |
|
| PDF/A-2b |
|
| PDF/A-4 |
|
| PDF/UA-1 |
|
.notdef glifinin kullanılması yasaktır. Bir belge seçili yazı tipinde bulunmayan ve Yazı Tipi Geri Dönüş mekanizması aracılığıyla da çözülemeyen karakterler içeriyorsa .notdef glifi görünecektir.
Uygun bir belge, bir referans içermeyecektir.herhangi bir içerik akışında metin oluşturma modundan bağımsız olarak, işleçleri gösteren herhangi bir metinden glif tanımlamayın.
ISO-19005-2, 6.2.11.8; ISO-14289-1, 7.21.8 ( iki özellikte tam olarak aynı alıntılar)
Kullanıcılar bu karakterleri kaynak Word belgesinde kaldırmalı veya değiştirmelidir:
Veya "Edit PDF" aracını kullanarak çıktı PDF belgesi:
| PDF Aspose.Words içindeki standart uyumluluk seviyeleri | Gereksinimin varlığı |
|---|---|
| PDF/A-1a | |
| PDF/A-1b | |
| PDF/A-2a |
|
| PDF/A-2b |
|
| PDF/A-4 |
|
| PDF/UA-1 |
Özel Kullanım Alanı (PUA) karakterleri çoğunlukla “Symbol”, “Wingdings”, “Webdings” ve diğerleri gibi Windows sembolik yazı tipleri için görünür. Microsoft Word biçimler, karakterler için gerçek metni saklama seçeneği sağlamaz.
Yalnızca A Düzeyi uyumu için, herhangi bir karakter için... bu, Unicode Özel Kullanım Alanındaki (PUA) bir kod veya kodlarla, bir ActualText girdisiyle eşleştirilir... bu karakter veya böyle bir karakterin parçası olduğu bir karakter dizisi için mevcut olacaktır.
ISO-19005-2, 6.2.11.7.3
“Segoe UI Sembolü”, sembolik yazı tiplerine alternatif olarak kullanılabilecek bir Windows Unicode yazı tipidir.
Kaynak Word belgesindeki simgesel yazı tipini Unicode olanla değiştirin:
Veya çıktı PDF belgesindeki sorunlu karakterlere bir ActualText girişi ekleyin:
Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.