Werken met PDF/A of PDF/UA

De indeling PDF/A en PDF/UA legt verschillende vereisten op met betrekking tot de documentinhoud waaraan niet kan worden voldaan tijdens de automatische conversie van een document in de indeling Word naar PDF. Deze vereisten moeten worden gecontroleerd en gecorrigeerd in een Word document vóór conversie of in een PDF document na conversie om een volledig PDF/A en PDF/UA conform document te produceren.

De basisvereisten zijn voor de structuur of lettertypen van een PDF/A en PDF/UA document, die we in de volgende secties zullen bespreken.

Vereisten Voor Documentstructuur

De huidige eisen zijn:PDF/A-1a, PDF/A-2a, PDF/A-4, en PDF/UA-1 formaten.

Er zijn enkele nuances van hoe Aspose.Words werkt bij het converteren naar verschillende PDF - opmaakstandaarden. Er moet rekening mee worden gehouden als u het verwachte resultaat wilt krijgen.

De onderstaande subsecties beschrijven nuances van hoe Aspose.Words werkt bij het converteren naar verschillende PDF - formatstandaarden en opties voor hun oplossing.

Structuur Type

PDF standaard compliance niveaus binnen Aspose.Words Aanwezigheid van eis
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Een PDF document is een reeks blokken zoals koppen, alinea ' s, tabellen en andere. Deze blokken vormen een documentstructuur-sterk of zwak.

Zowel sterke als zwakke structuren zijn geldig voor PDF/A. Microsoft Word documenten hebben een zwakke structuur door het ontwerp, en Aspose.Words maakt respectievelijk PDF met de zwakke structuur en genereert ook koppen volgens de overzichtsniveaus van alinea ' s in het brondocument.

Voor een PDF/UA-1 - document met een zwakke structuur is het bovendien vereist dat de kopnummers zonder gaten in volgorde staan.

Om de juiste uitvoer te garanderen, moeten gebruikers ervoor zorgen dat de inhoud van het brondocument goed is georganiseerd en dat de overzichtsniveaus correct zijn gespecificeerd voor alinea ' s. Anders moet de gebruiker de structuur van het uitvoer PDF document verifiëren en repareren.

De inhoud markeren als een artefact

PDF standaard compliance niveaus binnen Aspose.Words Aanwezigheid van eis
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Op dit moment markeert Aspose.Words paginakoppen en voetteksten, notitiescheidingstekens, herhaalde tabelkopcellen en decoratieve afbeeldingen als artefacten. Deze lijst kan in de toekomst worden bijgewerkt.

Als een document andere inhoud bevat die moet worden gemarkeerd als een artefact, of als een van de artefacteerde inhoud een echte inhoud is, moeten klanten dat oplossen in de uitvoer PDF.

Natuurlijke Taalspecificatie

PDF standaard compliance niveaus binnen Aspose.Words Aanwezigheid van eis
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Teksttaal is opgegeven in Microsoft Word documenten. Aspose.Words exporteert de opgegeven taal naar een uitvoer PDF met het Lang attribuut gekoppeld aan een gemarkeerde-content sequentie of een Span tag – het wordt bestuurd door de ExportLanguageToSpanTag eigenschap. Over het algemeen zijn er geen taalproblemen wanneer tekst door de gebruiker wordt ingevoerd via Microsoft Word. Maar het is mogelijk dat de taal onnauwkeurig is als de tekst automatisch wordt gegenereerd.

Figuur Bijschrift

PDF standaard compliance niveaus binnen Aspose.Words Aanwezigheid van eis
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Met Microsoft Word documenten kunnen gebruikers figuurbijschriften toevoegen.

Op dit moment kan Aspose.Words bijschriften niet exporteren met de tag bijschrift, dus ze moeten worden gemarkeerd in de uitvoer PDF.

Alternatieve Beschrijvingen

PDF standaard compliance niveaus binnen Aspose.Words Aanwezigheid van eis
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Met Microsoft Word documenten kunnen gebruikers alternatieve tekst toevoegen aan afbeeldingen, vormen en tabellen. Aspose.Words exporteert zo ' n alternatieve tekst naar de output PDF.

PDF standaard compliance niveaus binnen Aspose.Words Aanwezigheid van eis
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Naast het vorige punt kunnen gebruikers in Microsoft Word - documenten ook alternatieve tekst toevoegen aan hyperlinks. Aspose.Words exporteert zo ' n alternatieve tekst naar de output PDF.

Helaas kunt u niet bij elke toepassing een alternatieve beschrijving instellen. Bijvoorbeeld, Adobe Acrobat is momenteel niet in staat om een dergelijke beschrijving voor hyperlinks in te stellen. Maar in Microsoft Word kunt u dit als volgt doen:

alternate-descriptions-hyperlinks-mw

Soms is er een probleem dat het niet mogelijk is om alternatieve tekst in te stellen voor automatisch gegenereerde hyperlinks in de inhoudsopgave (TOC) Via de Microsoft Word GUI. Aspose.Words kan dergelijke velden bijwerken en de koppelingen zelf genereren.

Volg het codevoorbeeld om TOC velden bij te werken met het Aspose.Words Document Object Model (DOM):

auto doc = MakeObject<Document>(filename);
auto tocHyperLinks = doc->get_Range()->get_Fields()->
    LINQ_Where([](SharedPtr<Field> f) {return f->get_Type() == FieldType::FieldHyperlink; })->            
    LINQ_Where([](SharedPtr<FieldHyperlink> f) { return f->get_DisplayResult().StartsWith(u"#_Toc"); });

for (const auto& link : tocHyperLinks)
    link->set_ScreenTip(link->get_DisplayResult());

auto opt = MakeObject<PdfSaveOptions>();
opt->set_Compliance(PdfCompliance::PdfUa1);
opt->set_DisplayDocTitle(true);
opt->set_ExportDocumentStructure(true);
opt->get_OutlineOptions()->set_HeadingsOutlineLevels(3);
opt->get_OutlineOptions()->set_CreateMissingOutlineLevels(true);

auto outFile = filename.substr(0, filename.find_last_of('.')) + "_aw.pdf";
doc->Save(outFile, opt);

Tabelkop

PDF standaard compliance niveaus binnen Aspose.Words Aanwezigheid van eis
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Tabellen in PDF/UA-1 documenten moeten kopteksten hebben-kolom, rij of beide. PDF/A vereist alleen standaard tabelmarkering, die geen extra beperkingen heeft. Merk op dat Aspose.Words automatisch de standaard tabelmarkering genereert.

Vervangende Tekst

PDF standaard compliance niveaus binnen Aspose.Words Aanwezigheid van eis
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word document staat gebruikers niet toe vervangende tekst in te stellen. Dus dit moet worden geverifieerd en opgelost in de output PDF:

AcrobatReplacementText

Afkortingen en acroniemen uitbreidingen

PDF standaard compliance niveaus binnen Aspose.Words Aanwezigheid van eis
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word document staat gebruikers niet toe afkortingen en acroniemen uitbreidingen in te stellen. Dus dit moet worden geverifieerd en opgelost in de output PDF:

AcrobatSplitAddExpansionText

Documenttitel

PDF standaard compliance niveaus binnen Aspose.Words Aanwezigheid van eis
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
Het Document in PDF/UA-1 moet een titel hebben.

Lettertypevereisten

PDF standaard compliance niveaus binnen Aspose.Words Aanwezigheid van eis
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Er zijn ook een aantal nuances van het werken met lettertypen bij het converteren naar PDF/A-1, PDF/A-2, PDF/A-4 of PDF/UA-1 opmaak met Aspose.Words. Hiermee moet rekening worden gehouden als u mogelijke problemen met het uitvoerdocument wilt voorkomen.

De onderstaande secties beschrijven dergelijke nuances en opties voor hun oplossing.

Font Wettelijke Vereisten

PDF standaard compliance niveaus binnen Aspose.Words Aanwezigheid van eis
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words controleert de wettelijke beperkingen van de gebruikte lettertypen niet – het is aan de gebruikers. Met andere woorden, een gebruiker moet geen ongeschikte lettertypen voor PDF conversie met behulp van Aspose.Words.

.notdef Glyph

PDF standaard compliance niveaus binnen Aspose.Words Aanwezigheid van eis
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Het gebruik van het .notdef glyf is verboden. De .notdef glyf wordt weergegeven als een document tekens bevat die niet aanwezig zijn in het geselecteerde lettertype en die ook niet kunnen worden opgelost via het font Fallback-mechanisme.

Ruimte Voor Privégebruik (PUA)

PDF standaard compliance niveaus binnen Aspose.Words Aanwezigheid van eis
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1

Ruimte voor privégebruik (PUA) tekens verschijnen meestal voor Windows symbolische lettertypes zoals “Symbol”, “Wingdings”, “Webdings” en anderen. Microsoft Word - indelingen bieden geen optie om echte tekst voor tekens op te slaan.

“Segoe UI Symbol” is een Windows Unicode-lettertype dat als alternatief voor symbolische lettertypen kan worden gebruikt.