Vertalen Markdown tot Document Object Model (DOM)

Om de inhoud en opmaak van een document programmatisch te kunnen lezen, manipuleren en wijzigen, moet u het vertalen naar de Aspose.Words Document Object Model (DOM).

In tegenstelling tot Word-documenten, Markdown niet in overeenstemming is met de DOM beschreven in de Aspose.Words Document Object Model (DOM) artikel. Echter, Aspose.Words biedt een eigen vertaalmechanisme Markdown documenten DOM en terug, zodat we succesvol kunnen werken met hun elementen zoals tekstopmaak, tabellen, headers en anderen.

Dit artikel legt uit hoe de verschillende markdown functies kunnen worden vertaald in Aspose.Words DOM en terug naar Markdown formaat.

Complexiteit van de vertaling Markdown Wat? DOM Wat? Markdown

Het belangrijkste probleem van dit mechanisme is niet alleen het vertalen van Markdown tot DOM, maar ook om de omgekeerde transformatie doen om het document terug te slaan naar Markdown formaat met minimaal verlies. Er zijn elementen, zoals multilevel citaten, waarvoor de omgekeerde transformatie niet triviaal is.

Onze vertaalmachine laat gebruikers niet alleen werken met complexe elementen in een bestaande Markdown document, maar ook om hun eigen document aan te maken in Markdown formaat met de oorspronkelijke structuur vanaf nul. Om verschillende elementen te creëren, moet je stijlen met specifieke namen gebruiken volgens bepaalde regels die later in dit artikel worden beschreven. Dergelijke stijlen kunnen programmatisch worden gemaakt.

Algemene vertaling Beginselen

We gebruiken Font formatteren voor inline blokken. Wanneer er geen directe correspondentie voor een Markdown functie in Aspose.Words DOM, We gebruiken een karakter stijl met een naam die begint met een aantal speciale woorden.

Voor containerblokken gebruiken we stijlovererving om geneste aan te duiden Markdown Eigenschappen. In dit geval, zelfs als er geen geneste functies, gebruiken we ook alineastijlen met een naam die begint met een aantal speciale woorden.

Gekochte en bestelde lijsten zijn containerblokken in Markdown Ook. Hun nest is vertegenwoordigd in DOM op dezelfde manier als voor alle andere container blokken met behulp van stijl erfenis. Bovendien worden in DOM hebben overeenstemmende nummeropmaak in lijststijl of alineaopmaak.

Inline-blokken

We gebruiken Font formatteren bij vertalen Bold, Italic of Strikethroughinline markdown Eigenschappen.

Markdown functie Aspose.Words
Bold
{1}
Font.Bold = true
Italic
*italic text*
Font.Italic = true
Strikethrough
~Strikethrough text~
Font.StrikeThrough = true

We gebruiken een karakterstijl met een naam die begint met het woord <span notrans="<span notrans=" InlineCode"="">,"> gevolgd door een optionele stip (.) en een aantal backticks (`) voor de InlineCode feature. Als een aantal backticks wordt gemist, wordt standaard één backtick gebruikt.

Markdown functie Aspose.Words
InlineCode
{1}
Font.StyleName = “InlineCode[.][N]”
Autolink
<scheme://domain.com>
<email@domain.com>
De FieldHyperlink Klasse
Link
{1}
{2}
{3}
{4})
De FieldHyperlink Klasse
Image
{1}
{2}
{3}
{4})
De Shape Klasse

Containerblokken

Een document is een reeks containerblokken zoals rubrieken, paragrafen, lijsten, citaten en andere. Containerblokken kunnen in 2 klassen worden onderverdeeld: Bladblokken en complexe containers. Bladblokken kunnen alleen inline-inhoud bevatten. Complexe containers kunnen op hun beurt andere containerblokken bevatten, waaronder bladblokken.

Bladblokken

De onderstaande tabel toont voorbeelden van gebruik Markdown Bladblokken in Aspose.Words:

Markdown functie Aspose.Words
HorizontalRule
-----
Dit is een eenvoudige paragraaf met een overeenkomstige horizontale regel vorm:
DocumentBuilder.InsertHorizontalRule()
ATX Heading
# H1, ## H2, ### H3…
ParagraphFormat.StyleName = “Heading N”, waarbij (1< = N <= 9).
Dit wordt vertaald in een ingebouwde stijl en moet precies van het opgegeven patroon zijn (er zijn geen achtervoegsels of voorvoegsels toegestaan).
Anders wordt het gewoon een gewone paragraaf met een overeenkomstige stijl
Setext Heading
=== (voor rubriek 1),
--- (als rubriek 2)
ParagraphFormat.StyleName = “SetextHeading[some suffix]”, gebaseerd op “Heading N” stijl.
Als (N >= 2), dan “Heading 2” zal worden gebruikt, anders “Heading 1”.
Elk achtervoegsel is toegestaan, maar Aspose.Words De importeur gebruikt respectievelijk de nummers
Indented Code ParagraphFormat.StyleName = “IndentedCode[some suffix]”
Fenced Code
``` java
if ()
then
else
```
ParagraphFormat.StyleName = “FencedCode[.][info string]”
De [.] en [info string] zijn facultatief

Complexe containers

De onderstaande tabel toont voorbeelden van gebruik Markdown Complexe containers in Aspose.Words:

Markdown functie Aspose.Words
Quote
> quote,
>> nested quote
ParagraphFormat.StyleName = “Quote[some suffix]”
Het achtervoegsel in stijlnaam is optioneel, maar Aspose.Words importeur gebruikt de bestelde nummers 1, 2, 3, …. in het geval van geneste citaten.
Het nest wordt gedefinieerd via de geërfde stijlen
BulletedList
- Item 1
- Item 2
- Item 2a
- Item 2b
Gestichte lijsten zijn weergegeven met behulp van paragraafnummering:
ListFormat.ApplyBulletDefault()
Er kunnen drie soorten kogels zijn. Ze zijn slechts diff in een nummering formaat van het eerste niveau. Dit zijn: ‘-’, ‘+’ of ‘*’ respectievelijk
OrderedList
1. Item 1
2. Item 2
1) Item 2a
2) Item 2b
Geordende lijsten worden weergegeven aan de hand van paragraafnummering:
ListFormat.ApplyNumberDefault()
Er kunnen 2 nummer formaat markers zijn: De standaard marker is..

Tabellen

Aspose.Words maakt het ook mogelijk om tabellen te vertalen naar DOM, zoals hieronder aangegeven:

Markdown functie Aspose.Words
Table
b<br />-

Zie ook