Przetłumacz Markdown na Document Object Model (DOM)
Aby programowo czytać, manipulować i modyfikować zawartość i formatowanie dokumentu, musisz przetłumaczyć go na format Aspose.Words Document Object Model (DOM).
W przeciwieństwie do dokumentów Worda, Markdown nie jest zgodny z formatem DOM opisanym w artykule Aspose.Words Document Object Model (DOM). Aspose.Words zapewnia jednak własny mechanizm tłumaczenia dokumentów Markdown na DOM i odwrotnie, dzięki czemu możemy z powodzeniem pracować z ich elementami, takimi jak formatowanie tekstu, tabele, nagłówki i inne.
W tym artykule wyjaśniono, jak różne funkcje markdown można przetłumaczyć na format Aspose.Words DOM i z powrotem na format Markdown.
Złożoność tłumaczenia Markdown – DOM – Markdown
Główną trudnością tego mechanizmu jest nie tylko przetłumaczenie Markdown na DOM, ale także wykonanie odwrotnej transformacji – zapisanie dokumentu z powrotem do formatu Markdown przy minimalnych stratach. Istnieją elementy, takie jak cudzysłowy wielopoziomowe, dla których odwrotna transformacja nie jest trywialna.
Nasz silnik tłumaczeniowy pozwala użytkownikom nie tylko pracować ze złożonymi elementami w istniejącym dokumencie Markdown, ale także stworzyć od podstaw własny dokument w formacie Markdown z oryginalną strukturą. Aby utworzyć różne elementy, należy użyć stylów o określonych nazwach, zgodnie z pewnymi zasadami opisanymi w dalszej części tego artykułu. Takie style można tworzyć programowo.
Wspólne zasady tłumaczeń
W przypadku bloków wbudowanych używamy formatowania Font. Jeśli nie ma bezpośredniego związku z funkcją Markdown w formacie Aspose.Words DOM, używamy stylu znakowego z nazwą rozpoczynającą się od specjalnych słów.
W przypadku bloków kontenerów używamy dziedziczenia stylów do oznaczenia zagnieżdżonych funkcji Markdown. W tym przypadku, nawet jeśli nie ma żadnych zagnieżdżonych funkcji, używamy również stylów akapitowych z nazwą zaczynającą się od specjalnych słów.
Listy wypunktowane i uporządkowane są również blokami kontenerów w Markdown. Ich zagnieżdżenie jest reprezentowane w DOM w taki sam sposób, jak w przypadku wszystkich innych bloków kontenerów wykorzystujących dziedziczenie stylów. Jednakże dodatkowo listom w formacie DOM odpowiada formatowanie liczb w stylu listy lub w formacie akapitu.
Bloki wbudowane
Używamy formatowania Font podczas tłumaczenia wbudowanych funkcji markdown w formacie Bold, Italic lub Przekreślenie.
Funkcja Markdown | Aspose.Words |
---|---|
Bold{1} |
Font.Bold = true |
Italic*italic text* |
Font.Italic = true |
Strikethrough~Strikethrough text~ |
Font.StrikeThrough = true |
|
Używamy stylu znakowego o nazwie rozpoczynającej się od słowa InlineCode
, po którym następuje opcjonalna kropka (.)
i pewna liczba tylnych znaków (`)
dla funkcji InlineCode
. Jeśli pominiesz kilka coknięć, domyślnie zostanie użyty jeden backtick.
Funkcja Markdown | Aspose.Words |
---|---|
InlineCode{1} |
Font.StyleName = “InlineCode[.][N]” |
Autolink<scheme://domain.com> <email@domain.com> |
Klasa FieldHyperlink |
Link{1} {2} {3} {4}) |
Klasa FieldHyperlink |
Image{1} {2} {3} {4}) |
Klasa Shape |
Bloki kontenerowe
Dokument to sekwencja bloków kontenerów, takich jak nagłówki, akapity, listy, cytaty i inne. Bloki kontenerów można podzielić na 2 klasy: bloki liści i kontenery złożone. Bloki liści mogą zawierać wyłącznie treść wbudowaną. Złożone kontenery mogą z kolei zawierać inne bloki kontenerów, w tym bloki Liści.
Bloki liści
Poniższa tabela pokazuje przykłady użycia bloków Markdown Leaf w Aspose.Words:
Funkcja Markdown | Aspose.Words |
---|---|
HorizontalRule----- |
To jest prosty akapit z odpowiadającym mu kształtem HorizontalRule:DocumentBuilder.InsertHorizontalRule() |
ATX Heading# H1, ## H2, ### H3… |
ParagraphFormat.StyleName = "Heading N" , gdzie (1≤ N ≤ 9).Jest to tłumaczone na styl wbudowany i powinno być dokładnie zgodne z określonym wzorcem (nie są dozwolone żadne przyrostki ani przedrostki). W przeciwnym razie będzie to zwykły akapit z odpowiednim stylem |
Setext Heading=== (jeśli poziom nagłówka 1),--- (jeśli poziom nagłówka 2) |
ParagraphFormat.StyleName = “SetextHeading[some suffix]” , oparty na stylu ‘Heading N’.Jeśli (N ≥ 2), wówczas zostanie użyty format ‘Heading 2’, w przeciwnym razie ‘Heading 1’. Dozwolony jest dowolny przyrostek, ale importer Aspose.Words używa odpowiednio cyfr “1” i “2” |
|
|
Indented Code | ParagraphFormat.StyleName = “IndentedCode[some suffix]” |
Fenced Code
|
ParagraphFormat.StyleName = “FencedCode[.][info string]” [.] i [info string] są opcjonalne |
Złożone kontenery
Poniższa tabela przedstawia przykłady użycia złożonych kontenerów Markdown w formacie Aspose.Words:
Funkcja Markdown | Aspose.Words |
---|---|
Quote> quote, >> nested quote |
ParagraphFormat.StyleName = “Quote[some suffix]” Sufiks w nazwie stylu jest opcjonalny, ale importer Aspose.Words używa uporządkowanych numerów 1, 2, 3,…. w przypadku zagnieżdżonych cudzysłowów. Zagnieżdżanie jest definiowane poprzez odziedziczone style |
|
|
BulletedList- Item 1 - Item 2 - Item 2a - Item 2b |
Listy punktowane są reprezentowane przy użyciu numeracji akapitów:ListFormat.ApplyBulletDefault() Istnieją 3 typy list punktowanych. Różnią się one jedynie formatem numeracji na pierwszym poziomie. Są to odpowiednio: ‘-’ , ‘+’ lub ‘*’ |
OrderedList1. Item 1 2. Item 2 1) Item 2a 2) Item 2b |
Uporządkowane listy są reprezentowane za pomocą numeracji akapitów:ListFormat.ApplyNumberDefault() Mogą występować 2 znaczniki formatu liczb: “.” I ‘)’. Domyślnym znacznikiem jest “.” |
|
Stoły
Aspose.Words umożliwia także tłumaczenie tabel na DOM, jak pokazano poniżej:
Funkcja Markdown | Aspose.Words |
---|---|
Table a|b -|- c|d |
Klasy Table, Row i Cell |
|