Traducir Markdown al Modelo de Objetos de Documento (DOM)

Para leer, manipular y modificar mediante programación el contenido y el formato de un documento, debe traducirlo al Modelo de Objetos de Documento (DOM) Aspose.Words.

A diferencia de los documentos de Word, Markdown no se ajusta al DOM descrito en el Aspose.Words Modelo de Objetos de documento (DOM) artículo. Sin embargo, Aspose.Words proporciona su propio mecanismo para traducir documentos Markdown a DOM y viceversa, de modo que podamos trabajar con éxito con sus elementos, como formato de texto, tablas, encabezados y otros.

Este artículo explica cómo las diversas características de markdown se pueden traducir al DOM Aspose.Words y volver al formato Markdown.

Complejidad de la traducción Markdown – DOM - Markdown

La principal dificultad de este mecanismo no es solo traducir Markdown a DOM, sino también realizar la transformación inversa: guardar el documento nuevamente en formato Markdown con una pérdida mínima. Hay elementos, como las cotizaciones multinivel, para los que la transformación inversa no es trivial.

Nuestro motor de traducción permite a los usuarios no solo trabajar con elementos complejos en un documento Markdown existente, sino también crear su propio documento en formato Markdown con la estructura original desde cero. Para crear varios elementos, debe usar estilos con nombres específicos de acuerdo con ciertas reglas que se describen más adelante en este artículo. Dichos estilos se pueden crear mediante programación.

Principios Comunes de Traducción

Usamos formato Font para bloques en línea. Cuando no hay correspondencia directa para una característica Markdown en Aspose.Words DOM, usamos un estilo de carácter con un nombre que comienza con algunas palabras especiales.

Para los bloques contenedores, usamos herencia de estilo para denotar características Markdown anidadas. En este caso, incluso cuando no hay entidades anidadas, también usamos estilos de párrafo con un nombre que comienza con algunas palabras especiales.

Las listas ordenadas y con viñetas también son bloques contenedores en Markdown. Su anidamiento se representa en DOM de la misma manera que para todos los demás bloques contenedores que usan herencia de estilo. Sin embargo, además, las listas en DOM tienen un formato de número correspondiente en estilo de lista o formato de párrafo.

Bloques en Línea

Usamos el formato Font al traducir Bold, Italic o Strikethrough funciones markdown en línea.

Markdown característica Aspose.Words
Bold
**bold text**
get_Font()->set_Bold(true)
Italic
*italic text*
get_Font()->set_Italic(true)
Strikethrough
~Strikethrough text~
get_Font()->set_StrikeThrough(true)

Usamos un estilo de carácter con un nombre que comienza con la palabra InlineCode, seguido de un punto opcional (.) y una serie de comillas invertidas (`) para la función InlineCode. Si se omite un número de comillas invertidas, se utilizará una comilla invertida de forma predeterminada.

Markdown característica Aspose.Words
InlineCode
**inline code**
get_Font()->set_StyleName(u"InlineCode[.][N]")
Autolink
<scheme://domain.com>
<email@domain.com>
La clase FieldHyperlink.
Link
[link text](url)
[link text](<url>"title")
[link text](url 'title')
[link text](url (title))
La clase FieldHyperlink.
Image
![](url)
![alt text](<url>"title")
![alt text](url ‘title’)
![alt text](url (title))
La clase Shape.

Bloques de Contenedores

Un documento es una secuencia de bloques contenedores como encabezados, párrafos, listas, citas y otros. Los bloques contenedores se pueden dividir en 2 clases: Bloques hoja y Contenedores complejos. Los bloques hoja solo pueden contener contenido en línea. Los recipientes complejos, a su vez, pueden contener otros bloques de recipientes, incluidos bloques de hojas.

Bloques de Hojas

La siguiente tabla muestra ejemplos del uso de Markdown Bloques hoja en Aspose.Words:

Markdown característica Aspose.Words
HorizontalRule
-----
Este es un párrafo simple con la forma HorizontalRule correspondiente:
DocumentBuilder::InsertHorizontalRule()
ATX Heading
# H1, ## H2, ### H3…
get_ParagraphFormat()->set_StyleName(u"Heading N"), donde (1<= N <= 9).
Esto se traduce en un estilo incorporado y debe ser exactamente del patrón especificado (no se permiten sufijos ni prefijos).
De lo contrario, será solo un párrafo normal con el estilo correspondiente.
Setext Heading
=== (if Heading level 1),
--- (if Heading level 2)
get_ParagraphFormat->set_StyleName(u"SetextHeading[some suffix]"), basado en el estilo "Heading N".
Si (N > = 2), entonces se usará "Heading 2", de lo contrario "Heading 1".
Se permite cualquier sufijo, pero el importador Aspose.Words usa los números “1” y “2 " respectivamente..
Indented Code get_ParagraphFormat->set_StyleName(u"IndentedCode[some suffix]")
Fenced Code
``` c#
if ()
then
else
```
get_ParagraphFormat()->set_StyleName(u"FencedCode[.][info string]")
[.] y [info string] son opcionales.

Contenedores Complejos

La siguiente tabla muestra ejemplos del uso de Markdown Contenedores complejos en Aspose.Words:

Markdown característica Aspose.Words
Quote
> quote,
>> nested quote
get_ParagraphFormat()->set_StyleName(u"Quote[some suffix]")
El sufijo en el nombre del estilo es opcional, pero el importador Aspose.Words usa los números ordenados1, 2, 3, …. en caso de citas anidadas.
El anidamiento se define a través de los estilos heredados.
BulletedList
- Item 1
- Item 2
- Item 2a
- Item 2b
Las listas con viñetas se representan mediante numeración de párrafos:
get_ListFormat()->ApplyBulletDefault()
Puede haber 3 tipos de listas con viñetas. Solo difieren en un formato de numeración del primer nivel. Estos son: ‘-’, ‘+’ o ‘*’ respectivamente.
OrderedList
1. Item 1
2. Item 2
1) Item 2a
2) Item 2b
Las listas ordenadas se representan mediante numeración de párrafos:
get_ListFormat()->ApplyNumberDefault()
Puede haber 2 marcadores de formato numérico: ‘.’ y ‘)’. El marcador predeterminado es ‘.’.

Tablas

Aspose.Words también permite traducir tablas a DOM, como se muestra a continuación:

Markdown característica Aspose.Words
Table
a|b
-|-
c|d
Table, Row y Cell clases.

Véase También