PDF/A veya PDF/UA ile çalışma

PDF/A ve PDF/UA formatı, Word formatındaki bir belgeden PDF’ye otomatik dönüştürme sırasında belge içeriğiyle ilgili olarak yerine getirilemeyen çeşitli gereksinimler getirir. Tamamen PDF/A ve PDF/UA uyumlu bir belge oluşturmak için bu gereksinimlerin dönüştürmeden önce bir Word belgesinde veya dönüştürme sonrasında bir PDF belgesinde doğrulanması ve düzeltilmesi gerekir.

Temel gereksinimler, aşağıdaki bölümlerde ele alacağımız PDF/A ve PDF/UA belgesinin yapısı veya yazı tipleri içindir.

Belge Yapısı Gereksinimleri

Mevcut gereksinimler PDF/A-1a, PDF/A-2a, PDF/A-4 ve PDF/UA-1 formatları içindir.

Aspose.Words’in çeşitli PDF formatı standartlarına dönüştürürken nasıl çalıştığına dair bazı nüanslar vardır. Beklenen sonucu elde etmek istiyorsanız bunların dikkate alınması gerekir.

Aşağıdaki alt bölümlerde, Aspose.Words’in çeşitli PDF formatı standartlarına dönüştürme sırasında nasıl çalıştığına ilişkin incelikler ve bunların çözüm seçenekleri açıklanmaktadır.

Yapı Tipi

Aspose.Words içindeki PDF standart uyumluluk düzeyleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Bir PDF belgesi, başlıklar, paragraflar, tablolar ve diğerleri gibi bir dizi bloktan oluşur. Bu bloklar güçlü veya zayıf bir belge yapısı oluşturur.

PDF/A için hem güçlü hem de zayıf yapılar geçerlidir. Microsoft Word belgeleri tasarım gereği zayıf bir yapıya sahiptir ve Aspose.Words sırasıyla zayıf yapıyla PDF oluşturur ve ayrıca kaynak belgedeki paragrafların anahat düzeylerine göre başlıklar oluşturur.

Yapısı zayıf olan bir PDF/UA-1 belgesi için ayrıca başlık numaralarının boşluksuz bir şekilde sıralanması gerekmektedir.

Doğru çıktıyı sağlamak için kullanıcıların kaynak belge içeriğinin düzgün bir şekilde organize edildiğinden ve paragraflar için anahat seviyelerinin doğru şekilde belirtildiğinden emin olması gerekir. Aksi takdirde kullanıcının çıktı PDF belgesinin yapısını doğrulaması ve düzeltmesi gerekir.

İçeriği Yapı Olarak İşaretleme

Aspose.Words içindeki PDF standart uyumluluk düzeyleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Şu anda Aspose.Words, sayfa üstbilgilerini ve altbilgilerini, not ayırıcılarını, yinelenen tablo üstbilgisi hücrelerini ve dekoratif görüntüleri yapay öğeler olarak işaretler. Bu listenin gelecekte güncellenebileceğini unutmayın.

Bir belgede yapay olarak işaretlenmesi gereken başka bir içerik varsa veya yapay içeriklerden herhangi biri gerçek bir içerikse, müşterilerin bunu çıktı PDF’sinde düzeltmesi gerekir.

Doğal Dil Belirtimi

Aspose.Words içindeki PDF standart uyumluluk düzeyleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Word belgelerinde metin dili belirtilir. Aspose.Words, belirtilen dili, işaretli içerik dizisine veya Span etiketine eklenen Lang özniteliğiyle birlikte bir çıktı PDF’sine aktarır; ExportLanguageToSpanTag özelliği tarafından kontrol edilir. Kullanıcı tarafından Microsoft Word aracılığıyla metin girildiğinde genellikle dil sorunu yaşanmaz. Ancak metnin otomatik olarak oluşturulması durumunda dilin hatalı olma ihtimali vardır.

Şekil Başlığı

Aspose.Words içindeki PDF standart uyumluluk düzeyleri Gereksinimin varlığı
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Microsoft Word belgeleri, kullanıcıların şekil başlığı eklemesine olanak tanır.

Şu anda Aspose.Words, Altyazı etiketini içeren altyazıları dışa aktaramaz, bu nedenle bunların çıktı PDF’sinde işaretlenmesi gerekir.

Alternatif Açıklamalar

Aspose.Words içindeki PDF standart uyumluluk düzeyleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Word belgeleri, kullanıcıların resimlere, şekillere ve tablolara alternatif metin eklemesine olanak tanır. Aspose.Words böyle bir alternatif metni çıktı PDF’sine aktarır.

Köprüler için Alternatif Açıklamalar

Aspose.Words içindeki PDF standart uyumluluk düzeyleri Gereksinimin varlığı
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Önceki noktaya ek olarak Microsoft Word belgeleri, kullanıcıların köprülere alternatif metin eklemesine de olanak tanır. Aspose.Words böyle bir alternatif metni çıktı PDF’sine aktarır.

Ne yazık ki her uygulama alternatif bir açıklama oluşturmanıza izin vermez. Örneğin, Adobe Acrobat şu anda köprüler için böyle bir açıklamanın ayarlanmasına olanak sağlamamaktadır. Ancak Microsoft Word’de bunu şu şekilde yapabilirsiniz:

alternatif-açıklamalar-köprüler-mw

Bazen, içindekiler tablosunda (TOC) Microsoft Word GUI aracılığıyla otomatik olarak oluşturulan köprüler için alternatif metin ayarlamanın mümkün olmaması gibi bir sorun olabilir. Aspose.Words bu tür alanları güncelleyebilir ve bağlantıları kendi başına oluşturabilir.

Aspose.Words Document Object Model’i (DOM) kullanarak TOC alanlarını güncellemek için kod örneğini izleyin:

Document doc = new Document(fileName);

	var tocHyperLinks = doc.Range.Fields
		.Where(f => f.Type == FieldType.FieldHyperlink)
		.Cast<FieldHyperlink>()
		.Where(f => f.HRef.StartsWith("#_Toc"));
	
	foreach (FieldHyperlink link in tocHyperLinks)
		link.ScreenTip = link.DisplayResult;
	
	PdfSaveOptions opt = new PdfSaveOptions()
	{
		Compliance = PdfCompliance.PdfUa1,
		DisplayDocTitle = true,
		ExportDocumentStructure = true,
	};
	opt.OutlineOptions.HeadingsOutlineLevels = 3;
	opt.OutlineOptions.CreateMissingOutlineLevels = true;
	
	var outFile = Path.ChangeExtension(fileName, "_aw.pdf");
	doc.Save(outFile, opt);

Tablo Başlıkları

Aspose.Words içindeki PDF standart uyumluluk düzeyleri Gereksinimin varlığı
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

PDF/UA-1 belgelerindeki tabloların başlıkları (sütun, satır veya her ikisi) bulunmalıdır. PDF/A yalnızca hiçbir ek kısıtlaması olmayan standart tablo işaretlemesini gerektirir. Aspose.Words’in standart tablo işaretlemesini otomatik olarak oluşturduğunu unutmayın.

Yedek Metin

Aspose.Words içindeki PDF standart uyumluluk düzeyleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word belgesi, kullanıcıların değiştirme metnini ayarlamasına izin vermez. Dolayısıyla bunun çıktı PDF’sinde doğrulanması ve düzeltilmesi gerekiyor:

AcrobatDeğiştirme Metni

Kısaltmalar ve Kısa Adlar Genişletmeler

Aspose.Words içindeki PDF standart uyumluluk düzeyleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word belgesi, kullanıcıların kısaltmalar ve kısaltma genişletmeleri ayarlamasına izin vermez. Dolayısıyla bunun çıktı PDF’sinde doğrulanması ve düzeltilmesi gerekiyor:

AcrobatSplitAddExpansionText

Belge başlığı

Aspose.Words içindeki PDF standart uyumluluk düzeyleri Gereksinimin varlığı
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
PDF/UA-1’deki belgenin bir başlığı olmalıdır

Yazı Tipi Gereksinimleri

Aspose.Words içindeki PDF standart uyumluluk düzeyleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words kullanarak PDF/A-1, PDF/A-2, PDF/A-4 veya PDF/UA-1 formatlarına dönüştürürken yazı tipleriyle çalışmanın da bazı incelikleri vardır. Çıktı belgesinde olası sorunlardan kaçınmak istiyorsanız bunların dikkate alınması gerekir.

Aşağıdaki bölümlerde bu tür nüanslar ve bunların çözümüne yönelik seçenekler açıklanmaktadır.

Yazı Tipi Yasal Gereksinimleri

Aspose.Words içindeki PDF standart uyumluluk düzeyleri Gereksinimin varlığı
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words, kullanılan yazı tiplerinin yasal kısıtlamalarını doğrulamaz; bu kullanıcılara bağlıdır. Başka bir deyişle, kullanıcı Aspose.Words kullanarak PDF dönüşümü için uygunsuz yazı tipleri sağlamamalıdır.

.notdef Glyph

Aspose.Words içindeki PDF standart uyumluluk düzeyleri Gereksinimin varlığı
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1 tick

.notdef glyph’nin kullanımı yasaktır. Bir belge, seçilen yazı tipinde bulunmayan ve ayrıca Yazı Tipi Geri Dönüş mekanizması aracılığıyla çözümlenemeyen karakterler içeriyorsa .notdef glyph görünecektir.

Özel Kullanım Alanı (PUA)

Aspose.Words içindeki PDF standart uyumluluk düzeyleri Gereksinimin varlığı
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1

Özel Kullanım Alanı (PUA) karakterleri çoğunlukla “Symbol”, “Wingdings”, “Webdings” ve diğerleri gibi Windows sembolik yazı tipleri için görünür. Microsoft Word formatları, karakterler için gerçek metni saklama seçeneği sunmaz.

“Segoe UI Sembolü”, sembolik yazı tiplerine alternatif olarak kullanılabilecek bir Windows Unicode yazı tipidir.