Werk met PDF/A of PDF/UA

PDF/A en PDF/UA formaat stel verskeie vereistes wat verband hou met die dokumentinhoud wat nie tydens outomatiese omskakeling van’n dokument in Word-formaat na PDF vervul kan word nie. Hierdie vereistes moet geverifieer en reggestel word in’n Word-dokument voor omskakeling of in’n PDF - dokument na omskakeling om’n volledig PDF/A en PDF/UA - versoenbare dokument te produseer.

Basiese vereistes is vir die struktuur of lettertipes van’n PDF/A en PDF/UA dokument, wat ons in die volgende afdelings sal oorweeg.

Dokumentstruktuurvereistes

Die huidige vereistes is vir PDF/A-1a, PDF/A-2a, PDF/A-4, en PDF/UA-1 formate.

Daar is’n paar nuanses van hoe Aspose.Words werk wanneer omgeskakel word na verskillende PDF formaat standaarde. Hulle moet in ag geneem word as jy die verwagte resultaat wil kry.

Die onderstaande onderafdelings beskryf nuanses van hoe Aspose.Words werk wanneer dit omgeskakel word na verskillende PDF formaatstandaarde en opsies vir hul oplossing.

Struktuur Tipe

PDF standaard voldoeningsvlakke binne Aspose.Words Teenwoordigheid van vereiste
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

‘n PDF dokument is’n reeks blokke soos opskrifte, paragrawe, tabelle en ander. Hierdie blokke vorm’n dokumentstruktuur – sterk of swak.

Beide sterk en swak strukture is geldig vir PDF/A. Microsoft Word dokumente het’n swak struktuur deur ontwerp, en Aspose.Words skep PDF met die swak struktuur onderskeidelik en genereer ook opskrifte volgens die sketsvlakke van paragrawe in die brondokument.

Vir’n PDF/UA-1 dokument met’n swak struktuur, is dit ook nodig dat die kop nommers in volgorde gaan sonder gapings.

Om korrekte uitset te verseker, moet gebruikers verseker dat die inhoud van die brondokument behoorlik georganiseer is en dat die sketsvlakke korrek vir paragrawe gespesifiseer word. Andersins moet die gebruiker die struktuur van die uitset PDF dokument verifieer en regstel.

Merk Die Inhoud as’n Artefak

PDF standaard voldoeningsvlakke binne Aspose.Words Teenwoordigheid van vereiste
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Op die oomblik merk Aspose.Words bladsyopskrifte en-voetskrifte, nootskeiers, herhaalde tabelopskrifte en dekoratiewe beelde as artefakte. Let daarop dat hierdie lys in die toekoms opgedateer kan word.

As’n dokument enige ander inhoud bevat wat as’n artefak gemerk moet word, of as enige van die artefakte inhoud’n werklike inhoud is, moet kliënte dit in die uitset PDF regstel.

Natuurlike Taal Spesifikasie

PDF standaard voldoeningsvlakke binne Aspose.Words Teenwoordigheid van vereiste
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Teks taal word gespesifiseer in Microsoft Word dokumente. Aspose.Words voer die gespesifiseerde taal uit na’n uitset PDF met die Lang kenmerk wat aan’n gemerkte inhoud volgorde of’n Span tag gekoppel is-dit word beheer deur die ExportLanguageToSpanTag eienskap. Oor die algemeen is daar geen taalprobleme wanneer teks deur die gebruiker via Microsoft Word ingevoer word nie. Maar daar is’n moontlikheid dat die taal dalk onakkuraat is as die teks outomaties gegenereer word.

Figuur Onderskrif

PDF standaard voldoeningsvlakke binne Aspose.Words Teenwoordigheid van vereiste
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Microsoft Word dokumente laat gebruikers toe om figuur onderskrif by te voeg.

Tans kan Aspose.Words nie onderskrifte met die Onderskrif-etiket uitvoer nie, dus moet hulle in die uitset PDF gemerk word.

Alternatiewe Beskrywings

PDF standaard voldoeningsvlakke binne Aspose.Words Teenwoordigheid van vereiste
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Word dokumente laat gebruikers toe om alternatiewe teks by beelde, vorms en tabelle te voeg. Aspose.Words voer so’n alternatiewe teks uit na die uitset PDF.

Alternatiewe Beskrywings vir Hiperskakels

PDF standaard voldoeningsvlakke binne Aspose.Words Teenwoordigheid van vereiste
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Benewens die vorige punt, laat Microsoft Word dokumente gebruikers ook toe om alternatiewe teks by hiperskakels te voeg. Aspose.Words voer so’n alternatiewe teks uit na die uitset PDF.

Ongelukkig kan u nie elke toepassing’n alternatiewe beskrywing opstel nie. Byvoorbeeld, Adobe Acrobat maak dit tans nie moontlik om so’n beskrywing vir hiperskakels op te stel nie. Maar in Microsoft Word, kan jy dit doen soos volg:

alternate-descriptions-hyperlinks-mw

Soms is daar’n probleem dat dit nie moontlik is om alt teks vir outomaties gegenereerde hiperskakels in die inhoudsopgawe (TOC) deur die Microsoft Word GUI te stel nie. Aspose.Words kan sulke velde opdateer en die skakels op sy eie genereer.

Volg die kode voorbeeld om TOC velde op te dateer met behulp van die Aspose.Words Document Object Model (DOM):

auto doc = MakeObject<Document>(filename);
auto tocHyperLinks = doc->get_Range()->get_Fields()->
    LINQ_Where([](SharedPtr<Field> f) {return f->get_Type() == FieldType::FieldHyperlink; })->            
    LINQ_Where([](SharedPtr<FieldHyperlink> f) { return f->get_DisplayResult().StartsWith(u"#_Toc"); });

for (const auto& link : tocHyperLinks)
    link->set_ScreenTip(link->get_DisplayResult());

auto opt = MakeObject<PdfSaveOptions>();
opt->set_Compliance(PdfCompliance::PdfUa1);
opt->set_DisplayDocTitle(true);
opt->set_ExportDocumentStructure(true);
opt->get_OutlineOptions()->set_HeadingsOutlineLevels(3);
opt->get_OutlineOptions()->set_CreateMissingOutlineLevels(true);

auto outFile = filename.substr(0, filename.find_last_of('.')) + "_aw.pdf";
doc->Save(outFile, opt);

Tabelopskrifte

PDF standaard voldoeningsvlakke binne Aspose.Words Teenwoordigheid van vereiste
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Tabelle in PDF/UA-1 dokumente moet koptekste hê – kolom, ry of albei. PDF/A vereis slegs standaard tabel opmerkings, wat geen bykomende beperkings het nie. Let daarop dat Aspose.Words die standaard tabel merk outomaties genereer.

Vervangende Teks

PDF standaard voldoeningsvlakke binne Aspose.Words Teenwoordigheid van vereiste
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word dokument laat gebruikers nie toe om vervangende teks in te stel nie. So dit moet geverifieer en vasgestel word in die uitset PDF:

AcrobatReplacementText

Afkortings En Akronieme Uitbreidings

PDF standaard voldoeningsvlakke binne Aspose.Words Teenwoordigheid van vereiste
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word dokument laat gebruikers nie toe om afkortings en akronieme uitbreidings in te stel nie. So dit moet geverifieer en vasgestel word in die uitset PDF:

AcrobatSplitAddExpansionText

Dokument Titel

PDF standaard voldoeningsvlakke binne Aspose.Words Teenwoordigheid van vereiste
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
Dokument in PDF/UA-1 moet’n titel hê.

Skrif Tipe Vereistes

PDF standaard voldoeningsvlakke binne Aspose.Words Teenwoordigheid van vereiste
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Daar is ook’n aantal nuanses van die werk met lettertipes wanneer die omskakeling na PDF/A-1, PDF/A-2, PDF/A-4 of PDF/UA-1 formate met behulp van Aspose.Words. Hulle moet in ag geneem word as u moontlike probleme met die uitvoerdokument wil vermy.

Die onderstaande afdelings beskryf sulke nuanses en opsies vir hul oplossing.

Font Wetlike Vereistes

PDF standaard voldoeningsvlakke binne Aspose.Words Teenwoordigheid van vereiste
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words verifieer nie die wetlike beperkings van die gebruikte lettertipes nie – dit is aan gebruikers. Met ander woorde, ‘n gebruiker moet nie onvanpaste lettertipes vir PDF omskakeling met behulp van Aspose.Words verskaf nie.

.notdef Glyph

PDF standaard voldoeningsvlakke binne Aspose.Words Teenwoordigheid van vereiste
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Die gebruik van die .notdef glyf is verbode. Die .notdef glyf sal verskyn as’n dokument karakters bevat wat nie in die geselekteerde lettertipe voorkom nie en wat ook nie via die Lettertipe-Terugvalmeganisme opgelos kan word nie.

Privaat Gebruik Area (PUA)

PDF standaard voldoeningsvlakke binne Aspose.Words Teenwoordigheid van vereiste
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1

Private Gebruik Area (PUA) karakters verskyn meestal vir Windows simboliese lettertipes soos “Symbol”, “Wingdings”, “Webdings”, en ander. Microsoft Word formate bied nie’n opsie om werklike teks vir karakters te stoor nie.

“Segoe UI Symbol” is’n Windows Unicode lettertipe wat gebruik kan word as’n alternatief vir simboliese lettertipes.