Traduceți Markdown în Document Object Model (DOM)
Pentru a citi, manipula și modifica în mod programatic conținutul și formatarea unui document, trebuie să îl traduceți în Aspose.Words Document Object Model (DOM).
Spre deosebire de documentele Word, Markdown nu este conform cu DOM descris în Aspose.Words Model Obiect Document (DOM) articolul. Cu toate acestea, Aspose.Words oferă propriul mecanism pentru traducerea documentelor Markdown în DOM și înapoi, astfel încât să putem lucra cu succes cu elementele lor, cum ar fi formatarea textului, tabele, anteturi și altele.
Acest articol explică modul în care diferitele caracteristici markdown pot fi traduse în Aspose.Words DOM și înapoi la formatul Markdown.
Complexitatea traducerii Markdown – DOM – Markdown
Principala dificultate a acestui mecanism nu este doar de a traduce Markdown în DOM, ci și de a face transformarea inversă – pentru a salva documentul înapoi în format Markdown cu pierderi minime. Există elemente, cum ar fi citatele pe mai multe niveluri, pentru care transformarea inversă nu este banală.
Motorul nostru de traducere permite utilizatorilor nu numai să lucreze cu elemente complexe într-un document Markdown existent, ci și să își creeze propriul document în format Markdown cu structura originală de la zero. Pentru a crea diverse elemente, trebuie să utilizați stiluri cu nume specifice conform anumitor reguli descrise mai târziu în acest articol. Astfel de stiluri pot fi create programatic.
Principii Comune De Traducere
Folosim formatarea Font pentru blocurile inline. Când nu există corespondență directă pentru o caracteristică Markdown în Aspose.Words DOM, folosim un stil de caractere cu un nume care începe de la câteva cuvinte speciale.
Pentru blocurile de containere, folosim moștenirea stilului pentru a denota caracteristicile imbricate Markdown. În acest caz, chiar și atunci când nu există caracteristici imbricate, folosim și stiluri de paragraf cu un nume care pornește de la câteva cuvinte speciale.
Listele cu marcatori și ordonate sunt și blocuri de containere în Markdown. Cuibul lor este reprezentat în DOM în același mod ca și pentru toate celelalte blocuri de containere care utilizează moștenirea stilului. Cu toate acestea, în plus, listele din DOM au corespuns formatării numerelor fie în stilul listei, fie în formatarea paragrafelor.
Blocuri Inline
Folosim formatarea Font atunci când traducem Bold, Italic sau Strikethrough în Linie markdown caracteristici.
Markdown caracteristică | Aspose.Words |
---|---|
Bold**bold text** |
get_Font()->set_Bold(true) |
Italic*italic text* |
get_Font()->set_Italic(true) |
Strikethrough~Strikethrough text~ |
get_Font()->set_StrikeThrough(true) |
Folosim un stil de caractere cu un nume care începe de la cuvântul InlineCode
, urmat de un punct opțional (.)
și un număr de backtick-uri (`)
pentru caracteristica InlineCode
. Dacă un număr de backtick-uri este ratat, atunci un backtick va fi utilizat în mod implicit.
Markdown caracteristică | Aspose.Words |
---|---|
InlineCode**inline code** |
get_Font()->set_StyleName(u"InlineCode[.][N]") |
Autolink<scheme://domain.com> <email@domain.com> |
Clasa FieldHyperlink. |
Link[link text](url) [link text](<url>"title") [link text](url 'title') [link text](url (title)) |
Clasa FieldHyperlink. |
Image![](url) ![alt text](<url>"title") ![alt text](url ‘title’) ![alt text](url (title)) |
Clasa Shape. |
Blocuri De Containere
Un document este o secvență de blocuri de containere, cum ar fi titluri, paragrafe, liste, citate și altele. Blocurile de containere pot fi împărțite în clase 2: blocuri de frunze și containere complexe. Blocurile de frunze pot conține doar conținut în linie. Containerele complexe, la rândul lor, pot conține alte blocuri de containere, inclusiv blocuri de frunze.
Blocuri De Frunze
Tabelul de mai jos prezintă exemple de utilizare a Markdown blocuri de frunze în Aspose.Words:
Markdown caracteristică | Aspose.Words |
---|---|
HorizontalRule----- |
Acesta este un paragraf simplu cu o formă corespunzătoare HorizontalRule:DocumentBuilder::InsertHorizontalRule() |
ATX Heading# H1, ## H2, ### H3… |
get_ParagraphFormat()->set_StyleName(u"Heading N") , unde (1<= N <= 9).Acest lucru este tradus într-un stil încorporat și ar trebui să fie exact din modelul specificat (nu sunt permise sufixe sau prefixe). În caz contrar, va fi doar un paragraf obișnuit cu un stil corespunzător. |
Setext Heading=== (if Heading level 1),--- (if Heading level 2) |
get_ParagraphFormat->set_StyleName(u"SetextHeading[some suffix]") , bazat pe stilul "Heading N" .Dacă (N > = 2), atunci "Heading 2" va fi folosit, altfel "Heading 1" .Orice sufix este permis, dar Aspose.Words importatorul folosește numerele “1” și “2” respectiv. |
Indented Code | get_ParagraphFormat->set_StyleName(u"IndentedCode[some suffix]") |
Fenced Code
|
get_ParagraphFormat()->set_StyleName(u"FencedCode[.][info string]") [.] și [info string] sunt opționale. |
Containere Complexe
Tabelul de mai jos prezintă exemple de utilizare a containerelor complexe Markdown în Aspose.Words:
Markdown caracteristică | Aspose.Words |
---|---|
Quote> quote, >> nested quote |
get_ParagraphFormat()->set_StyleName(u"Quote[some suffix]") sufixul din numele stilului este opțional, dar Aspose.Words importatorul folosește numerele ordonate1, 2, 3, …. în cazul cotațiilor imbricate. Cuibul este definit prin stilurile moștenite. |
BulletedList- Item 1 - Item 2 - Item 2a - Item 2b |
Listele cu marcatori sunt reprezentate folosind numerotarea paragrafelor:get_ListFormat()->ApplyBulletDefault() pot exista 3 tipuri de liste cu marcatori. Ele sunt diferite doar într-un format de numerotare de la primul nivel. Acestea sunt: ‘-’ , ‘+’ sau ‘*’ respectiv. |
OrderedList1. Item 1 2. Item 2 1) Item 2a 2) Item 2b |
Listele ordonate sunt reprezentate folosind numerotarea paragrafelor:get_ListFormat()->ApplyNumberDefault() pot exista 2 markeri de format numeric: ‘.’ și ‘)’. Marcatorul implicit este ‘.’. |
Tabele
Aspose.Words permite, de asemenea, traducerea tabelelor în DOM, după cum se arată mai jos:
Markdown caracteristică | Aspose.Words |
---|---|
Table a|b -|- c|d |
Table, Row și Cell clase. |