Traduc Markdown în Document Object Model (DOM)
Pentru a citi programatic, manipula și modifica conținutul și formatarea unui document, ai nevoie să-l traduci în Aspose.Words Document Object Model ( DOM ).
Spre deosebire de documentele Word, Markdown nu respectă DOM descris în Aspose.Words Document Object Model (DOM) articolul. Aspose.Words oferă însă propriul său mecanism de traducere a documentelor Markdown în DOM și înapoi, astfel încât putem lucra cu succes cu elementele lor, cum ar fi formatarea textului, tabelele, antetele și altele.
Acest articol explică modul în care diferite markdown caracteristici pot fi traduse în Aspose.Words DOM și înapoi la Markdown format.
Complexitatea traducerii Markdown - DOM - Markdown
Principala dificultate a acestui mecanism este nu doar să traducă Markdown în DOM, dar și să facă transformarea inversă – să salveze documentul înapoi la formatul Markdown cu pierderi minime. Există elemente, cum ar fi ghilimele cu niveluri multiple, pentru care transformarea inversă nu este triviantă.
“Motor de traducere permite utilizatorilor nu numai să lucreze cu elemente complexe într-un document existent în Markdown, dar și să creeze propriul document într-un format Markdown cu structura originală din greu.” Pentru a crea diverse elemente trebuie să folosiți stiluri cu nume specifice conform unor reguli descrise mai târziu în acest articol. Astfel de stiluri pot fi create programatic.
Principii de traducere obişnuite
Utilizăm formatarea Font pentru blocuri inline. Când nu există nici o corespondență directă pentru un Markdown caracteristică în Aspose.Words DOM, folosim un stil de caracter cu un nume care începe din unele cuvinte speciale.
Pentru blocuri de containere folosim moștenirea stilului pentru a denumi caracteristici închise Markdown. În acest caz, chiar și atunci când nu există caracteristici închise, folosim, de asemenea, stiluri de paragraf cu un nume care începe de la anumite cuvinte speciale.
Lista cu marcatori și lista numerotată sunt blocuri de containere în Markdown ca și. Aspirarea lor este reprezentată în DOM același mod ca și pentru toate celelalte blocuri de containere folosind moștenirea stilului. “Însă, în plus, liste DOM au corespondență formatare numerică în stil de listă sau formatare paragrafică.”
Blocuri în linie
Noi folosim Font formatare atunci când traducem Bold, Italic sau caracteristici markdown inline.
Markdown caracteristică | Aspose.Words |
---|---|
Bold{1} |
Font.Bold = true |
Italic*italic text* |
Font.Italic = true |
Strikethrough~Strikethrough text~ |
Font.StrikeThrough = true |
|
Utilizăm un stil de caracter cu un nume care începe cu cuvântul InlineCode
, urmat de o linie opțională (.)
și un număr de accente înapoi (`)
pentru caracteristica InlineCode
. Dacă se omite un număr de backtick-uri, atunci un singur backtick va fi folosit ca implicit.
Markdown caracteristică | Aspose.Words |
---|---|
InlineCode{1} |
Font.StyleName = “InlineCode[.][N]” |
Autolink<scheme://domain.com> <email@domain.com> |
Clasa. |
Link{1} {2} {3} {4}) |
Clasa. |
Image{1} {2} {3} {4}) |
Clasa. |
Blokuri de Container
Un document este o secvență de blocuri de containere, cum ar fi titluri, paragrafe, liste, citate și altele. Blocurile de container pot fi împărțite în 2 clase: blocuri de frunze și containere complexe. Blocurile de frunze pot conține doar conținut în linie. Container complexe pot conține la rândul lor alte blocuri de containere, inclusiv blocuri de frunze.
Blocuri de frunze
Tabelul de mai jos prezintă exemple de utilizare a Markdown blocuri Leaf în Aspose.Words:
Markdown caracteristică | Aspose.Words |
---|---|
HorizontalRule----- |
Aceasta este un paragraf simplu cu o formă HorizontalRule corespunzătoare:DocumentBuilder.InsertHorizontalRule() |
ATX Heading# H1, ## H2, ### H3… |
ParagraphFormat.StyleName = “Heading N” , unde (1<= N <=9). Acest lucru este tradus într-un stil încorporat și ar trebui să fie exact modelul specificat (nu se permit suffixe sau prefixe). Altfel, va fi doar un paragraf obișnuit cu un stil corespunzător. |
Setext Heading === (dacă nivel de antet 1), --- (dacă nivel de antet 2) |
ParagraphFormat.StyleName = “SetextHeading[some suffix]” , bazat pe “Heading N” stil.Dacă (N >= 2), atunci “Heading 2” va fi utilizat, altfel “Heading 1” .Orice sufix este permis, dar importatorul Aspose.Words folosește numerele “1” și “2” respectiv. |
|
|
Indented Code | ParagraphFormat.StyleName = “IndentedCode[some suffix]” |
Fenced Code
|
ParagraphFormat.StyleName = “FencedCode[.][info string]” < br /> The [.] și [info string] sunt opționale. |
Containere complexe
Tabelul de mai jos prezintă exemple de utilizare a Markdown Complex Containers în Aspose.Words:
Markdown caracteristică | Aspose.Words |
---|---|
Quote> quote, >> nested quote |
ParagraphFormat.StyleName = “Quote[some suffix]” Sufixul din numele stilului este opțional, dar Aspose.Words importatorul folosește numerele ordonate 1, 2, 3, … în cazul citatelor închise. Închiderea se definește prin stilurile moștenite. |
|
|
BulletedList- Item 1 - Item 2 - Item 2a - Item 2b |
Liste cu marcatori sunt reprezentate folosind numerotarea paragrafelor: ListFormat.ApplyBulletDefault() Pot exista 3 tipuri de liste cu marcatori. Ei sunt doar dif în formatul numerotării de foarte primul nivel. Acestea sunt: ‘-’ , ‘+’ sau ‘*’ respectiv. |
OrderedList1. Item 1 2. Item 2 1) Item 2a 2) Item 2b |
Liste ordonate sunt reprezentate folosind numerotarea paragrafelor:ListFormat.ApplyNumberDefault() Există 2 marcatori de formatare a numerelor: “.”, și “)”. Marcatorul implicit este “.”. |
|
Tablouri
“Aspose.Words permite, de asemenea, traducerea tabelelor în DOM, așa cum se arată mai jos:”
Markdown caracteristică | Aspose.Words |
---|---|
Table a|b -|- c|d |
Table, Row şi Cell clase. |
|