Vertalen Markdown tot Document Object Model (DOM)
Om de inhoud en opmaak van een document programmatisch te kunnen lezen, manipuleren en wijzigen, moet u het vertalen naar de Aspose.Words Document Object Model (DOM).
In tegenstelling tot Word-documenten, Markdown niet in overeenstemming is met de DOM beschreven in de Aspose.Words Document Object Model (DOM) artikel. Echter, Aspose.Words biedt een eigen vertaalmechanisme Markdown documenten aan DOM en terug, zodat we succesvol kunnen werken met hun elementen zoals tekstopmaak, tabellen, headers en anderen.
Dit artikel legt uit hoe de verschillende markdown functies kunnen worden vertaald in Aspose.Words DOM en terug naar Markdown formaat.
Complexiteit van de vertaling Markdown Wat? DOM Wat? Markdown
De belangrijkste moeilijkheid van dit mechanisme is niet alleen het vertalen van Markdown tot DOM, maar ook om de omgekeerde transformatie te doen om het document terug te slaan naar Markdown formaat met minimaal verlies. Er zijn elementen, zoals multilevel citaten, waarvoor de omgekeerde transformatie niet triviaal is.
Onze vertaalmachine laat gebruikers niet alleen werken met complexe elementen in een bestaande Markdown document, maar ook om hun eigen document aan te maken in Markdown formaat met de oorspronkelijke structuur vanaf nul. Om verschillende elementen te creëren, moet je stijlen met specifieke namen gebruiken volgens bepaalde regels die later in dit artikel worden beschreven. Dergelijke stijlen kunnen programmatisch worden gemaakt.
Algemene vertaling Beginselen
We gebruiken Font formatteren voor inline blokken. Wanneer er geen directe correspondentie voor een Markdown functie in Aspose.Words DOM, We gebruiken een karakter stijl met een naam die begint met een aantal speciale woorden.
Voor containerblokken gebruiken we stijlovererving om geneste aan te duiden Markdown Eigenschappen. In dit geval, zelfs als er geen geneste functies, gebruiken we ook paragraafstijlen met een naam die begint met een aantal speciale woorden.
Gekochte en bestelde lijsten zijn containerblokken in Markdown Ook. Hun nest is vertegenwoordigd in DOM op dezelfde manier als voor alle andere container blokken met behulp van stijl erfenis. Bovendien worden de DOM hebben overeenstemmende nummeropmaak in lijststijl of alineaopmaak.
Inline-blokken
We gebruiken Font formatteren bij vertalen Bold, Italic of Strikethroughinline markdown Eigenschappen.
Markdown functie | Aspose.Words |
---|---|
Bold{1} |
Font.Bold = true |
Italic*italic text* |
Font.Italic = true |
Strikethrough~Strikethrough text~ |
Font.StrikeThrough = true |
|
We gebruiken een karakterstijl met een naam die begint vanaf het woord InlineCode
gevolgd door een optionele stip (.)
en een aantal backticks (`)
voor de InlineCode
feature. Als een aantal backticks wordt gemist, wordt standaard één backtick gebruikt.
Markdown functie | Aspose.Words |
---|---|
InlineCode{1} |
Font.StyleName = “InlineCode[.][N]” |
Autolink<scheme://domain.com> <email@domain.com> |
De FieldHyperlink Klasse |
Link{1} {2} {3} {4}) |
De FieldHyperlink Klasse |
Image{1} {2} {3} {4}) |
De Shape Klasse |
Containerblokken
Een document is een reeks containerblokken zoals rubrieken, paragrafen, lijsten, citaten en andere. Containerblokken kunnen in 2 klassen worden onderverdeeld: Bladblokken en complexe containers. Bladblokken kunnen alleen inline-inhoud bevatten. Complexe containers kunnen op hun beurt andere containerblokken bevatten, waaronder bladblokken.
Bladblokken
De tabel hieronder toont voorbeelden van gebruik Markdown Bladblokken in Aspose.Words:
Markdown functie | Aspose.Words |
---|---|
HorizontalRule----- |
Dit is een eenvoudige paragraaf met een overeenkomstige horizontale regel vorm:DocumentBuilder.InsertHorizontalRule() |
ATX Heading# H1, ## H2, ### H3… |
ParagraphFormat.StyleName = "Heading N" , waarbij (1< = N <= 9).Dit wordt vertaald in een ingebouwde stijl en moet precies van het opgegeven patroon zijn (er zijn geen achtervoegsels of voorvoegsels toegestaan). Anders wordt het gewoon een gewone paragraaf met een overeenkomstige stijl |
Setext Heading=== (voor rubriek 1),--- (als rubriek 2) |
ParagraphFormat.StyleName = “SetextHeading[some suffix]” , gebaseerd op ‘Heading N’ stijl.Indien (N >= 2), dan ‘Heading 2’ zal worden gebruikt, anders ‘Heading 1’. Elk achtervoegsel is toegestaan, maar Aspose.Words De importeur gebruikt respectievelijk de nummers |
|
|
Indented Code | ParagraphFormat.StyleName = “IndentedCode[some suffix]” |
Fenced Code
|
ParagraphFormat.StyleName = “FencedCode[.][info string]” De [.] en [info string] zijn facultatief |
Complexe containers
De tabel hieronder toont voorbeelden van gebruik Markdown Complexe containers in Aspose.Words:
Markdown functie | Aspose.Words |
---|---|
Quote> quote, >> nested quote |
ParagraphFormat.StyleName = “Quote[some suffix]” Het achtervoegsel in stijlnaam is optioneel, maar Aspose.Words importeur gebruikt de bestelde nummers 1, 2, 3, …. in het geval van geneste citaten. Het nest wordt gedefinieerd via de geërfde stijlen |
|
|
BulletedList- Item 1 - Item 2 - Item 2a - Item 2b |
De Bullet-lijsten worden weergegeven aan de hand van paragraafnummering:ListFormat.ApplyBulletDefault() Er kunnen drie soorten kogels zijn. Ze zijn alleen diff in een nummering formaat van het eerste niveau. Dit zijn: ‘-’ , ‘+’ of ‘*’ respectievelijk |
OrderedList1. Item 1 2. Item 2 1) Item 2a 2) Item 2b |
Geordende lijsten worden weergegeven aan de hand van paragraafnummering:ListFormat.ApplyNumberDefault() Er kunnen 2 nummer formaat markers zijn: De standaard marker is.. |
|
Tabellen
Aspose.Words ook kunt vertalen tabellen in DOM, zoals hieronder aangegeven:
Markdown functie | Aspose.Words |
---|---|
Table |
b<br /> - |
|