Aspose.Words Document Object Model (DOM)

На Aspose.Words Document Object Model (DOM) е в памет представяне на документ Word. На Aspose.Words DOM ви позволява да програмно четене, манипулация и промяна на съдържанието и форматиране на Word документ.

Този раздел описва основните класове на Aspose.Words DOM и техните връзки. С помощта на Aspose.Words DOM класове, можете да получите програмен достъп до документи елементи и форматиране.

Създаване на Document Дърво на обект

Когато документ се чете в Aspose.Words DOM тогава е построен обект дърво и различни видове елементи на източника документ имат своя собствена DOM дървесни обекти с различни свойства.

Изграждане на документни възли Дърво

Кога Aspose.Words чете документ на Word в паметта, създава обекти от различни типове, които представляват различни елементи на документа. Всеки запис на текст, параграф, таблица или раздел е възел и дори самият документ е възел. Aspose.Words определя клас за всеки тип документен възел.

Дървото на документа в Aspose.Words Следва модела Composite Design:

  • Всички класове възел в крайна сметка произтичат от Node клас, който е базовият клас в Aspose.Words Document Object Model.
  • Възли, които могат да съдържат други възли, например, Section или Paragraph, ен CompositeNode клас, който от своя страна произтича от Node Клас.

На диаграмата по-долу е показано наследството между класовете възли на Aspose.Words Document Object Model (DOM). Имената на абстрактните класове са в Италия.

aspose-words-dom

Нека да разгледаме един пример. Следното изображение показва a Microsoft Word документ с различни видове съдържание.

document-example-aspose-words

При четене на горния документ в Aspose.Words DOM, дървото на обектите е създадено, както е показано в схемата по-долу.

dom-aspose-words

Document, Section, Paragraph, Table, Shape, Run, и всички други елипси на диаграмата са Aspose.Words обекти, които представляват елементи от документа Word.

Вземи Node Тип

Въпреки че Node Класът е достатъчен, за да различава различни възли един от друг, Aspose.Words осигурява NodeType изброяване за опростяване на някои API задачи, като например избор на възли от определен тип.

Видът на всеки възел може да бъде получен с помощта на NodeType собственост. Този имот връща a NodeType стойност на изброяването. Например, параграф възел, представен от Paragraph Връщане на класа NodeType.Paragraph, както и възел маса, представена от Table Връщане на класа NodeType.Table.

Следният пример показва как да получите тип възел с помощта на NodeType Изброяване:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc = new Document();
// Returns NodeType.Document
NodeType type = doc.NodeType;

Навигация на дървото на документа

Aspose.Words представлява документ като дърво възел, който ви позволява да се движите между възлите. Този раздел описва как да изследвате и навигирате дървото на документа в Aspose.Words.

Когато отворите примерния документ, представен по-рано, в документ Explorer, дървото се появява точно както е представен в Aspose.Words.

document-in-document-explorer

Връзка с документния възел

Възлите на дървото имат връзки между тях:

  • Възел, съдържащ друг възел е parent.
  • Възелът, който се съдържа в родителския възел е child. Детските възли на същия родител са sibling Възли.
  • На root Възелът винаги е Document Възел.

Възлите, които могат да съдържат други възли, произлизат от CompositeNode класа, и всички възли в крайна сметка произтичат от Node Клас. Тези два основни класа осигуряват общи методи и свойства за навигация и модификация на структурата на дървото.

Следната диаграма UML обект показва няколко възли на извадка документ и техните отношения един с друг чрез родител, дете, и брат свойства:

document-nodes-relationships-aspose-words

Документът е собственик на възел

Възелът винаги принадлежи към конкретен документ, дори ако е създаден или отстранен от дървото, тъй като жизненоважни структури като стилове и списъци се съхраняват в Document Възел. Например, не е възможно да имате Paragraph без Document защото всеки параграф има определен стил, който се определя глобално за документа. Това правило се използва при създаване на нови възли. Добавяне на нов Paragraph директно към DOM изисква документен обект, предаден на конструктора.

При създаване на нов параграф, използващ DocumentBuilder, Строителят винаги има Document клас, свързан с него чрез DocumentBuilder.Document собственост.

Следният пример за код показва, че при създаването на какъвто и да е възел винаги се определя документ, който ще притежава възела:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
// Open a file from disk.
Document doc = new Document();
// Creating a new node of any type requires a document passed into the constructor.
Paragraph para = new Paragraph(doc);
// The new paragraph node does not yet have a parent.
Console.WriteLine("Paragraph has no parent node: " + (para.ParentNode == null));
// But the paragraph node knows its document.
Console.WriteLine("Both nodes' documents are the same: " + (para.Document == doc));
// The fact that a node always belongs to a document allows us to access and modify
// Properties that reference the document-wide data such as styles or lists.
para.ParagraphFormat.StyleName = "Heading 1";
// Now add the paragraph to the main text of the first section.
doc.FirstSection.Body.AppendChild(para);
// The paragraph node is now a child of the Body node.
Console.WriteLine("Paragraph has a parent node: " + (para.ParentNode != null));

Родителски възел

Всеки възел има майка, посочена от ParentNode собственост. Възелът няма родителски възел. ParentNode е нула, в следните случаи:

  • Възелът току-що беше създаден и все още не е добавен към дървото.
  • Възелът е изваден от дървото.
  • Това е коренът. Document Възел, който винаги има нулев родителски възел.

Можете да премахнете възел от неговия родител като се обадите на Remove метод. Следният пример с код показва как да се влезе в базовия възел:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
// Create a new empty document. It has one section.
Document doc = new Document();
// The section is the first child node of the document.
Node section = doc.FirstChild;
// The section's parent node is the document.
Console.WriteLine("Section parent is the document: " + (doc == section.ParentNode));

Детски възли

Най-ефективният начин за достъп до детски възли на CompositeNode е през FirstChild както и LastChild свойства, които връщат съответно първите и последните детски възли. Ако няма детски възли, тези свойства се връщат null.

CompositeNode и осигурява GetChildNodes метод, позволяващ индексиран или изброен достъп до възлите на детето. На ChildNodes собственост е жива колекция от възли, което означава, че когато документът се променя, като например когато възлите се отстраняват или добавят, ChildNodes събирането се актуализира автоматично.

Ако възелът няма дете, тогава ChildNodes Имотът връща празна колекция. Можете да проверите дали CompositeNode съдържа всякакви детски възли с помощта на HasChildNodes собственост.

Следният пример с код показва как да се изброят незабавните детски възли на a CompositeNode използване на числителя, предоставен от ChildNodes събиране:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc = new Document();
Paragraph paragraph = (Paragraph)doc.GetChild(NodeType.Paragraph, 0, true);
NodeCollection children = paragraph.ChildNodes;
foreach (Node child in children)
{
// Paragraph may contain children of various types such as runs, shapes and so on.
if (child.NodeType.Equals(NodeType.Run))
{
// Say we found the node that we want, do something useful.
Run run = (Run)child;
Console.WriteLine(run.Text);
}
}

Следният пример с код показва как да се изброят незабавните детски възли на a CompositeNode използване на индексиран достъп:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc = new Document();
Paragraph paragraph = (Paragraph)doc.GetChild(NodeType.Paragraph, 0, true);
NodeCollection children = paragraph.ChildNodes;
for (int i = 0; i < children.Count; i++)
{
Node child = children[i];
// Paragraph may contain children of various types such as runs, shapes and so on.
if (child.NodeType.Equals(NodeType.Run))
{
// Say we found the node that we want, do something useful.
Run run = (Run)child;
Console.WriteLine(run.Text);
}
}

Родови възли

Можете да получите възела, който непосредствено предхожда или следва определен възел с помощта на PreviousSibling както и NextSibling свойства, съответно. Ако възелът е последното дете на своя родител, тогава NextSibling собствеността е null. Обратно, ако възелът е първото дете на неговия родител, PreviousSibling собствеността е null.

Следният пример за код показва как ефективно да посетите всички преки и непреки детски възли на композитен възел:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
public static void RecurseAllNodes()
{
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_WorkingWithNode();
// Open a document.
Document doc = new Document(dataDir + "Node.RecurseAllNodes.doc");
// Invoke the recursive function that will walk the tree.
TraverseAllNodes(doc);
}
/// <summary>
/// A simple function that will walk through all children of a specified node recursively
/// And print the type of each node to the screen.
/// </summary>
public static void TraverseAllNodes(CompositeNode parentNode)
{
// This is the most efficient way to loop through immediate children of a node.
for (Node childNode = parentNode.FirstChild; childNode != null; childNode = childNode.NextSibling)
{
// Do some useful work.
Console.WriteLine(Node.NodeTypeToString(childNode.NodeType));
// Recurse into the node if it is a composite node.
if (childNode.IsComposite)
TraverseAllNodes((CompositeNode)childNode);
}
}

Напечатан достъп до възли за деца и родители

Досега сме обсъждали свойствата, които връщат един от базовите типове. Node или CompositeNode. Но понякога има ситуации, в които може да се наложи да се хвърлят стойности към определен клас възел, като Run или Paragraph. Това означава, че не можете напълно да се измъкнете от кастинга, когато работите с Aspose.Words DOM, което е съставно.

За да се намали необходимостта от кастинг, повечето Aspose.Words класовете осигуряват свойства и колекции, които осигуряват силно напечатан достъп. Има три основни модела на типов достъп:

  • Родителски възел напечатан FirstXXX както и LastXXX имоти. Например, Document е FirstSection както и LastSection имоти. По същия начин, Table има свойства като FirstRow, LastRow, и други.
  • Родителски възел разкрива напечатана колекция от детски възли, като Document.Sections, Body.Paragraphs, и други.
  • Детски възел осигурява достъп до родителите си, като Run.ParentParagraph, Paragraph.ParentSection, и други.

Типираните свойства са просто полезни преки пътища, които понякога осигуряват по-лесен достъп от общите свойства, наследени от Node.ParentNode както и CompositeNode.FirstChild.

Следният пример за код показва как да се използват типирани свойства за достъп до възлите на дървото на документа:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc = new Document();
Section section = doc.FirstSection;
// Quick typed access to the Body child node of the Section.
Body body = section.Body;
// Quick typed access to all Table child nodes contained in the Body.
TableCollection tables = body.Tables;
foreach (Table table in tables)
{
// Quick typed access to the first row of the table.
if (table.FirstRow != null)
table.FirstRow.Remove();
// Quick typed access to the last row of the table.
if (table.LastRow != null)
table.LastRow.Remove();
}