Markdown vertalen naar Document Object Model (DOM)

Als u de inhoud en opmaak van een document programmatisch wilt lezen, bewerken en wijzigen, moet u het vertalen naar het Aspose.Words Document Object Model (DOM).

In tegenstelling tot Word documenten, is Markdown niet in overeenstemming met de DOM beschreven in de Aspose.Words Document Object Model (DOM) artikel. Aspose.Words biedt echter een eigen mechanisme voor het vertalen van Markdown documenten naar DOM en terug, zodat we met succes kunnen werken met hun elementen zoals tekstopmaak, tabellen, koppen en andere.

In dit artikel wordt uitgelegd hoe de verschillende markdown - functies kunnen worden vertaald in Aspose.Words DOM en terug naar Markdown - indeling.

Complexiteit van Vertaling Markdown – DOM – Markdown

De grootste moeilijkheid van dit mechanisme is niet alleen om Markdown te vertalen naar DOM, maar ook om de omgekeerde transformatie te doen – om het document terug te slaan naar Markdown - formaat met minimaal verlies. Er zijn elementen, zoals aanhalingstekens op meerdere niveaus, waarvoor de omgekeerde transformatie niet triviaal is.

Onze vertaalmachine stelt gebruikers niet alleen in staat om te werken met complexe elementen in een bestaand Markdown document, maar ook om hun eigen document in Markdown formaat te maken met de originele structuur vanaf nul. Als u verschillende elementen wilt maken, moet u stijlen met specifieke namen gebruiken volgens bepaalde regels die later in dit artikel worden beschreven. Dergelijke stijlen kunnen programmatisch worden gemaakt.

Gemeenschappelijke Vertaalbeginselen

We gebruiken Font opmaak voor inline blokken. Wanneer er geen directe overeenkomst is voor een Markdown functie in Aspose.Words DOM, gebruiken we een tekenstijl met een naam die begint met een aantal speciale woorden.

Voor containerblokken gebruiken we stijlovererving om geneste Markdown - kenmerken aan te geven. In dit geval, zelfs als er geen geneste functies zijn, gebruiken we ook alineastijlen met een naam die begint met een aantal speciale woorden.

Opsommingstekens en geordende lijsten zijn ook containerblokken in Markdown. Hun nesting wordt weergegeven in DOM op dezelfde manier als voor alle andere containerblokken met behulp van stijlovererving. Daarnaast hebben lijsten in DOM echter corresponderende nummeropmaak in lijststijl of alineaopmaak.

Inline Blokken

We gebruiken Font opmaak bij het vertalen van Bold, Italic of Strikethrough inline markdown functies.

Markdown functie Aspose.Words
Bold
**bold text**
get_Font()->set_Bold(true)
Italic
*italic text*
get_Font()->set_Italic(true)
Strikethrough
~Strikethrough text~
get_Font()->set_StrikeThrough(true)

We gebruiken een tekenstijl met een naam die begint met het woord InlineCode, gevolgd door een optionele punt (.) en een aantal backticks (`) voor de InlineCode functie. Als een aantal backticks wordt gemist, wordt standaard één backtick gebruikt.

Markdown functie Aspose.Words
InlineCode
**inline code**
get_Font()->set_StyleName(u"InlineCode[.][N]")
Autolink
<scheme://domain.com>
<email@domain.com>
De FieldHyperlink Klasse.
Link
[link text](url)
[link text](<url>"title")
[link text](url 'title')
[link text](url (title))
De FieldHyperlink Klasse.
Image
![](url)
![alt text](<url>"title")
![alt text](url ‘title’)
![alt text](url (title))
De Shape Klasse.

Container Blokken

Een document is een reeks containerblokken zoals koppen, alinea ' s, lijsten, aanhalingstekens en andere. Containerblokken kunnen worden onderverdeeld in 2 klassen: bladblokken en complexe Containers. Bladblokken kunnen alleen inline content bevatten. Complexe containers kunnen op hun beurt andere containerblokken bevatten, waaronder bladblokken.

Blad Blokken

De onderstaande tabel toont voorbeelden van het gebruik van Markdown bladblokken in Aspose.Words:

Markdown functie Aspose.Words
HorizontalRule
-----
Dit is een eenvoudige alinea met een overeenkomstige HorizontalRule vorm:
DocumentBuilder::InsertHorizontalRule()
ATX Heading
# H1, ## H2, ### H3…
get_ParagraphFormat()->set_StyleName(u"Heading N"), Waar (1<= En <= 9).
Dit wordt vertaald in een ingebouwde stijl en moet precies van het gespecificeerde patroon zijn (geen achtervoegsels of voorvoegsels zijn toegestaan).
Anders is het gewoon een gewone paragraaf met een overeenkomstige stijl.
Setext Heading
=== (if Heading level 1),
--- (if Heading level 2)
get_ParagraphFormat->set_StyleName(u"SetextHeading[some suffix]"), gebaseerd op' Heading N ' stijl.
Als (N >= 2), dan wordt ‘Heading 2’ gebruikt, anders ‘Heading 1’.
Elk achtervoegsel is toegestaan, maar Aspose.Words importeur gebruikt respectievelijk nummers “1” en “2”.
Indented Code get_ParagraphFormat->set_StyleName(u"IndentedCode[some suffix]")
Fenced Code
``` c#
if ()
then
else
```
get_ParagraphFormat()->set_StyleName(u"FencedCode[.][info string]")
de [.] en [info string] zijn optioneel.

Complexe Containers

De onderstaande tabel toont voorbeelden van het gebruik van Markdown complexe Containers in Aspose.Words:

Markdown functie Aspose.Words
Quote
> quote,
>> nested quote
get_ParagraphFormat()->set_StyleName(u"Quote[some suffix]")
het achtervoegsel in stijlnaam is optioneel, maar Aspose.Words importeur gebruikt de geordende nummers 1, 2, 3, …. in het geval van geneste citaten.
De nesting wordt gedefinieerd via de erfelijke stijlen.
BulletedList
- Item 1
- Item 2
- Item 2a
- Item 2b
Lijsten met opsommingstekens worden weergegeven met behulp van paragraafnummering:
get_ListFormat()->ApplyBulletDefault()
Er kunnen 3 soorten lijsten met opsommingstekens zijn. Ze zijn alleen diff in een nummering formaat van het allereerste niveau. Deze zijn: ‘-’, ‘+’ of ‘*’ respectievelijk.
OrderedList
1. Item 1
2. Item 2
1) Item 2a
2) Item 2b
Geordende lijsten worden weergegeven met behulp van paragraafnummering:
get_ListFormat()->ApplyNumberDefault()
Er kunnen 2 getalnotatiemarkeringen zijn: ‘.’ en ‘)’. De standaard marker is ‘.’.

Tabel

Aspose.Words maakt het ook mogelijk om tabellen te vertalen naar DOM, zoals hieronder getoond:

Markdown functie Aspose.Words
Table
a|b
-|-
c|d
Table, Row en Cell klassen.

Zie Ook