תרגם Markdown לתעד מודל אובייקט (DOM)

כדי לקרוא, לתפעל ולשנות באופן תכנותי את התוכן והעיצוב של מסמך, עליך לתרגם אותו למודל אובייקט המסמך Aspose.Words (DOM).

בניגוד למסמכים Word, Markdown אינו תואם את DOM המתואר ב Aspose.Words מודל אובייקט מסמך (DOM) סעיף. עם זאת, Aspose.Words מספק מנגנון משלו לתרגום Markdown מסמכים ל DOM ובחזרה, כך שנוכל לעבוד בהצלחה עם האלמנטים שלהם כגון עיצוב טקסט, טבלאות, כותרות ואחרים.

מאמר זה מסביר כיצד ניתן לתרגם את התכונות השונות markdown ל Aspose.Words DOM ובחזרה ל Markdown פוּרמָט.

מורכבות התרגום Markdown – DOM – Markdown

הקושי העיקרי של מנגנון זה הוא לא רק לתרגם Markdown ל DOM, אלא גם לבצע את השינוי ההפוך – לשמור את המסמך בחזרה לפורמט Markdown עם הפסד מינימלי. ישנם אלמנטים, כגון ציטוטים מדורגת, אשר השינוי ההפוך אינו טריוויאלי.

מנוע התרגום שלנו מאפשר למשתמשים לא רק לעבוד עם אלמנטים מורכבים במסמך Markdown קיים, אלא גם ליצור מסמך משלהם בפורמט Markdown עם המבנה המקורי מאפס. כדי ליצור אלמנטים שונים, עליך להשתמש בסגנונות עם שמות ספציפיים על פי כללים מסוימים המתוארים בהמשך מאמר זה. סגנונות כאלה ניתן ליצור באופן פרוגרמטי.

עקרונות תרגום נפוצים

אנו משתמשים בעיצוב Font עבור בלוקים מוטבעים. כאשר אין התאמה ישירה לתכונה Markdown ב Aspose.Words DOM, אנו משתמשים בסגנון תווים עם שם שמתחיל מכמה מילים מיוחדות.

עבור בלוקים של מכולות, אנו משתמשים בירושה בסגנון כדי לציין תכונות מקוננות Markdown. במקרה זה, גם כשאין תכונות מקוננות, אנו משתמשים גם בסגנונות פסקה עם שם שמתחיל מכמה מילים מיוחדות.

רשימות עם תבליטים ומסודרים הן גם בלוקים של מכולות ב - Markdown. הקינון שלהם מיוצג ב DOM באותו אופן כמו לכל שאר גושי המכולות המשתמשים בירושה בסגנון. עם זאת, בנוסף, רשימות ב DOM התאימו לעיצוב מספרים בסגנון רשימה או בעיצוב פסקה.

בלוקים מוטבעים

אנו משתמשים בעיצוב Font בעת תרגום Bold, Italic או Strikethrough תכונות מוטבעות markdown.

Markdown תכונה Aspose.Words
**bold text**
// Use a document builder to add content to the document.
auto builder = System::MakeObject<DocumentBuilder>();
// Make the text Bold.
builder->Writeln(u"This text will be Bold");
*italic text*
// Use a document builder to add content to the document.
auto builder = System::MakeObject<DocumentBuilder>();
// Make the text Italic.
builder->Writeln(u"This text will be Italic");
~Strikethrough text~
// Use a document builder to add content to the document.
auto builder = System::MakeObject<DocumentBuilder>();
// Make the text Strikethrough.
builder->Writeln(u"This text will be Strikethrough");

אנו משתמשים בסגנון תווים עם שם שמתחיל מהמילה InlineCode, ואחריו נקודה אופציונלית (.) ומספר נקודות גב (`) לתכונה InlineCode. אם מספר נקודות גב מפספסות, אז נקודת גב אחת תשמש כברירת מחדל.

Markdown תכונה Aspose.Words
**inline code**
// Use a document builder to add content to the document.
auto builder = System::MakeObject<DocumentBuilder>();
// Number of backticks is missed, one backtick will be used by default.
auto inlineCode1BackTicks = builder->get_Document()->get_Styles->Add(StyleType::Character, u"InlineCode");
builder->Writeln(u"Text with InlineCode style with 1 backtick");
// There will be 3 backticks.
auto inlineCode3BackTicks = builder->get_Document()->get_Styles->Add(StyleType::Character, u"InlineCode.3");
builder->Writeln(u"Text with InlineCode style with 3 backtick");
הכיתה FieldHyperlink.
[link text](url)
[link text](<url>"title")
[link text](url 'title')
[link text](url (title))
הכיתה FieldHyperlink.
![alt text](<url>"title")
![alt text](url ‘title’)
![alt text](url (title))
הכיתה Shape.
// Use a document builder to add content to the document.
auto doc = System::MakeObject<Document>();
auto builder = System::MakeObject<DocumentBuilder>(doc);
// Insert image.
auto shape = System::MakeObject<Shape>(doc, ShapeType::Image);

בלוקים מיכל

מסמך הוא רצף של בלוקים מיכל כגון כותרות, פסקאות, רשימות, ציטוטים, ואחרים. בלוקים מיכל ניתן לחלק 2 כיתות: בלוקים עלה מכולות מורכבות. גושי עלים יכולים להכיל רק תוכן מוטבע. מיכלים מורכבים, בתורם, יכולים להכיל גושי מיכל אחרים, כולל גושי עלים.

בלוקים עלים

הטבלה שלהלן מציגה דוגמאות לשימוש Markdown בלוקי עלים ב Aspose.Words:

Markdown תכונה Aspose.Words
זוהי פסקה פשוטה עם צורה מקבילה HorizontalRule:
// Use a document builder to add content to the document.
auto builder = System::MakeObject<DocumentBuilder>();
// Insert horizontal rule.
ATX Heading
# H1, ## H2, ### H3…
get_ParagraphFormat()->set_StyleName(u"Heading N"), איפה (1<= נ <= 9).
זה מתורגם לסגנון מובנה וצריך להיות בדיוק מהתבנית שצוינה (אין סיומות או קידומות מותרות).
אחרת, זה יהיה רק פסקה רגילה עם סגנון המתאים.
// Use a document builder to add content to the document.
auto builder = System::MakeObject<DocumentBuilder>();
// By default Heading styles in Word may have Bold and Italic formatting.
// If we do not want to be emphasized, set these properties explicitly to false.
builder->get_ParagraphFormat()->set_StyleName(u"Heading 1");
builder->Writeln(u"This is an H1 tag");
Setext Heading
=== (if Heading level 1),
--- (if Heading level 2)
get_ParagraphFormat->set_StyleName(u"SetextHeading[some suffix]"), מבוסס על סגנון' כותרת נ'.
אם (נ > = 2), אז' Heading 2 ‘ישמש, אחרת’Heading 1’.
כל תוספת מותרת, אבל Aspose.Words היבואן משתמש במספרים “1” ו “2” בהתאמה.
// Use a document builder to add content to the document.
auto doc = System::MakeObject<Document>();
auto builder = System::MakeObject<DocumentBuilder>(doc);
builder->get_ParagraphFormat()->set_StyleName(u"Heading 1");
builder->Writeln(u"This is an H1 tag");
// Reset styles from the previous paragraph to not combine styles between paragraphs.
auto setexHeading1 = builder->get_Document()->get_Styles->Add(StyleType::Paragraph, u"SetextHeading1");
doc->get_Styles()->idx_get(u"SetextHeading1")->set_BaseStyleName(u"Heading 1");
builder->Writeln(u"Setext Heading level 1");
builder->get_ParagraphFormat()->set_Style(doc->get_Styles()->idx_get(u"Heading 3"));
builder->Writeln(u"This is an H3 tag");
// Reset styles from the previous paragraph to not combine styles between paragraphs.
auto setexHeading2 = builder->get_Document()->get_Styles->Add(StyleType::Paragraph, u"SetextHeading2");
doc->get_Styles()->idx_get(u"SetextHeading2")->set_BaseStyleName(u"Heading 3");
// Setex heading level will be reset to 2 if the base paragraph has a Heading level greater than 2.
builder->Writeln(u"Setext Heading level 2");
Indented Code get_ParagraphFormat->set_StyleName(u"IndentedCode[some suffix]")
// Use a document builder to add content to the document.
auto doc = System::MakeObject<Document>();
auto builder = System::MakeObject<DocumentBuilder>(doc);
auto indentedCode = builder->get_Document()->get_Styles->Add(StyleType::Paragraph, u"IndentedCode");
builder->Writeln(u"This is an indented code");
Fenced Code
``` c#
if ()
get_ParagraphFormat()->set_StyleName(u"FencedCode[.][info string]")
[.] ו [info string] הם אופציונליים.
// Use a document builder to add content to the document.
auto doc = System::MakeObject<Document>();
auto builder = System::MakeObject<DocumentBuilder>(doc);
auto fencedCode = builder->get_Document()->get_Styles->Add(StyleType::Paragraph, u"FencedCode");
builder->Writeln(u"This is an fenced code");
auto fencedCodeWithInfo = builder->get_Document()->get_Styles->Add(StyleType::Paragraph, u"FencedCode.C#");
builder->Writeln(u"This is a fenced code with info string");

מכולות מורכבות

הטבלה שלהלן מציגה דוגמאות לשימוש Markdown מכולות מורכבות ב Aspose.Words:

Markdown תכונה Aspose.Words
> quote,
>> nested quote
get_ParagraphFormat()->set_StyleName(u"Quote[some suffix]")
הסיומת בשם הסגנון היא אופציונלית, אך Aspose.Words היבואן משתמש במספרים שהוזמנו 1, 2, 3, …. במקרה של ציטוטים מקוננים.
הקן מוגדר באמצעות הסגנונות המורשת.
// Use a document builder to add content to the document.
auto doc = System::MakeObject<Document>();
auto builder = System::MakeObject<DocumentBuilder>(doc);
// By default a document stores blockquote style for the first level.
// Create styles for nested levels through style inheritance.
auto quoteLevel2 = builder->get_Document()->get_Styles->Add(StyleType::Paragraph, u"Quote1");
builder->Writeln(u"1. Nested blockquote");
- Item 1
- Item 2
- Item 2a
- Item 2b
רשימות עם תבליטים מיוצגות באמצעות מספור פסקאות:
יכולים להיות 3 סוגים של רשימות תבליטים. הם נבדלים רק בפורמט מספור ברמה הראשונה. אלה הם: ‘-’, ‘+’ או ‘*’ בהתאמה.
// Use a document builder to add content to the document.
auto builder = System::MakeObject<DocumentBuilder>();
builder->Writeln(u"Item 1");
builder->Writeln(u"Item 2");
builder->Writeln(u"Item 2a");
builder->Writeln(u"Item 2b");
1. Item 1
2. Item 2
1) Item 2a
2) Item 2b
רשימות מסודרות מיוצגות באמצעות מספור פסקאות:
יכולים להיות 2 סמני פורמט מספרים: ‘.’ ו ‘)’. סמן ברירת המחדל הוא ‘.’.
// Use a document builder to add content to the document.
auto builder = System::MakeObject<DocumentBuilder>();
builder->get_ListFormat()->get_List()->get_ListLevels()->idx_get(0)->set_NumberFormat(System::String::Format(u"{0}.", (char16_t)0));
builder->get_ListFormat()->get_List()->get_ListLevels()->idx_get(1)->set_NumberFormat(System::String::Format(u"{0}.", (char16_t)1));
builder->Writeln(u"Item 1");
builder->Writeln(u"Item 2");
builder->Writeln(u"Item 2a");
builder->Writeln(u"Item 2b");


Aspose.Words מאפשר גם לתרגם טבלאות ל DOM, כפי שמוצג להלן:

Markdown תכונה Aspose.Words
Table, Row ו Cell כיתות.
// Use a document builder to add content to the document.
auto builder = System::MakeObject<DocumentBuilder>();
// Add the first row.
// Add the second row.

