Arbeiten mit Textdokumenten

In diesem Artikel erfahren wir, welche Optionen für die Arbeit mit einem Textdokument über Aspose.Words nützlich sein können. Bitte beachten Sie, dass dies keine vollständige Liste der verfügbaren Optionen ist, sondern nur ein Beispiel für die Arbeit mit einigen davon.

Fügen Sie bidirektionale Markierungen hinzu

Mit der AddBidiMarks-Eigenschaft können Sie festlegen, ob beim Exportieren im Nur-Text-Format vor jedem BiDi-Lauf bidirektionale Markierungen hinzugefügt werden sollen. Aspose.Words fügt vor jedem bidirektionalen Lauf im Text das Unicode-Zeichen “RIGHT-TO-LEFT MARK” (U+200F) ein. Diese Option entspricht der Option “Bidirektionale Markierungen hinzufügen” im Dialogfeld “MS Word-Dateikonvertierung”, wenn Sie in ein Nur-Text-Format exportieren. Beachten Sie, dass es im Dialog nur angezeigt wird, wenn in MS Word eine der Bearbeitungssprachen Arabisch oder Hebräisch hinzugefügt wird.

Das folgende Codebeispiel zeigt, wie die AddBidiMarks-Eigenschaft verwendet wird. Der Standardwert dieser Eigenschaft ist false:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc = new Document(dataDir + "Input.docx");
TxtSaveOptions saveOptions = new TxtSaveOptions();
saveOptions.AddBidiMarks = true;
dataDir = dataDir + "Document.AddBidiMarks_out.txt";
doc.Save(dataDir, saveOptions);

Listenelemente beim Laden von TXT erkennen

Aspose.Words kann Listenelemente einer Textdatei als Listennummern oder einfachen Text in sein Dokumentobjektmodell importieren. Mit der DetectNumberingWithWhitespaces-Eigenschaft können Sie angeben, wie nummerierte Listenelemente erkannt werden, wenn ein Dokument aus dem Nur-Text-Format importiert wird:

  • Wenn diese Option auf true eingestellt ist, werden Leerzeichen auch als Trennzeichen für Listennummern verwendet: Der Listenerkennungsalgorithmus für die Nummerierung im arabischen Stil (1., 1.1.2.) verwendet sowohl Leerzeichen als auch Punktsymbole (".").

  • Wenn diese Option auf false eingestellt ist, erkennt der Listenerkennungsalgorithmus Listenabsätze, wenn Listennummern mit einem Punkt, einer rechten Klammer oder einem Aufzählungszeichen enden (z. B. “•”, “*”, “-” oder “o”).

Das folgende Codebeispiel zeigt, wie diese Eigenschaft verwendet wird:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
TxtLoadOptions loadOptions = new TxtLoadOptions();
loadOptions.DetectNumberingWithWhitespaces = false;
Document doc = new Document(dataDir + "LoadTxt.txt", loadOptions);
dataDir = dataDir + "DetectNumberingWithWhitespaces_out.docx";
doc.Save(dataDir);

Behandeln Sie führende und nachfolgende Leerzeichen beim Laden von TXT

Sie können die Art und Weise steuern, wie führende und nachfolgende Leerzeichen beim Laden der TXT-Datei behandelt werden. Die führenden Leerzeichen könnten gekürzt, beibehalten oder in Einzüge umgewandelt werden, und nachfolgende Leerzeichen könnten gekürzt oder beibehalten werden.

Das folgende Codebeispiel zeigt, wie führende und nachfolgende Leerzeichen beim Importieren einer TXT-Datei entfernt werden:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
TxtLoadOptions loadOptions = new TxtLoadOptions();
loadOptions.LeadingSpacesOptions = TxtLeadingSpacesOptions.Trim;
loadOptions.TrailingSpacesOptions = TxtTrailingSpacesOptions.Trim;
Document doc = new Document(dataDir + "LoadTxt.txt", loadOptions);
dataDir = dataDir + "HandleSpacesOptions_out.docx";
doc.Save(dataDir);

Erkennen Sie die Textrichtung des Dokuments

Aspose.Words stellt die DocumentDirection-Eigenschaft in der TxtLoadOptions-Klasse bereit, um die Textrichtung (RTL/LTR) im Dokument zu erkennen. Diese Eigenschaft legt die in der DocumentDirection-Enumeration bereitgestellten Dokumenttextrichtungen fest oder ruft diese ab. Der Standardwert bleibt right.

Das folgende Codebeispiel zeigt, wie die Textrichtung des Dokuments beim Importieren einer TXT-Datei erkannt wird:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
TxtLoadOptions loadOptions = new TxtLoadOptions();
loadOptions.DocumentDirection = DocumentDirection.Auto;
Document doc = new Document(dataDir + "arabic.txt", loadOptions);
Paragraph paragraph = doc.FirstSection.Body.FirstParagraph;
Console.WriteLine(paragraph.ParagraphFormat.Bidi);
dataDir = dataDir + "DocumentDirection_out.docx";
doc.Save(dataDir);

Kopf- und Fußzeile in Ausgabe-TXT exportieren

Wenn Sie Kopf- und Fußzeilen in ein TXT-Ausgabedokument exportieren möchten, können Sie die ExportHeadersFootersMode-Eigenschaft verwenden. Diese Eigenschaft gibt an, wie Kopf- und Fußzeilen in das Nur-Text-Format exportiert werden.

Das folgende Codebeispiel zeigt, wie Kopf- und Fußzeilen in das Nur-Text-Format exportiert werden:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc = new Document(dataDir + "TxtExportHeadersFootersMode.docx");
TxtSaveOptions options = new TxtSaveOptions();
options.SaveFormat = SaveFormat.Text;
// All headers and footers are placed at the very end of the output document.
options.ExportHeadersFootersMode = TxtExportHeadersFootersMode.AllAtEnd;
doc.Save(dataDir + "outputFileNameA.txt", options);
// Only primary headers and footers are exported at the beginning and end of each section.
options.ExportHeadersFootersMode = TxtExportHeadersFootersMode.PrimaryOnly;
doc.Save(dataDir + "outputFileNameB.txt", options);
// No headers and footers are exported.
options.ExportHeadersFootersMode = TxtExportHeadersFootersMode.None;
doc.Save(dataDir + "outputFileNameC.txt", options);

Einrückung der Exportliste in Ausgabe-TXT

Aspose.Words hat die TxtListIndentation-Klasse eingeführt, mit der festgelegt werden kann, wie Listenebenen beim Exportieren in ein Nur-Text-Format eingerückt werden. Bei der Arbeit mit TxtSaveOption wird die ListIndentation-Eigenschaft bereitgestellt, um das Zeichen anzugeben, das zum Einrücken von Listenebenen verwendet werden soll, und um anzugeben, wie viele Zeichen pro Listenebene als Einrückung verwendet werden sollen.

Der Standardwert für die Zeicheneigenschaft ist “\0”, was bedeutet, dass keine Einrückung erfolgt. Für die count-Eigenschaft ist der Standardwert 0, was bedeutet, dass keine Einrückung erfolgt.

Tabulatorzeichen verwenden

Das folgende Codebeispiel zeigt, wie Listenebenen mithilfe von Tabulatorzeichen exportiert werden:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc = new Document("input_document");
TxtSaveOptions options = new TxtSaveOptions();
options.ListIndentation.Count = 1;
options.ListIndentation.Character = '\t';
doc.Save(dataDir + "output.txt", options);

Verwendung von Leerzeichen

Das folgende Codebeispiel zeigt, wie Listenebenen mithilfe von Leerzeichen exportiert werden:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc = new Document("input_document");
TxtSaveOptions options = new TxtSaveOptions();
options.ListIndentation.Count = 3;
options.ListIndentation.Character = ' ';
doc.Save(dataDir + "output.txt", options);

Verwenden der Standardeinrückung

Das folgende Codebeispiel zeigt, wie Listenebenen mithilfe der Standardeinrückung exportiert werden:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc1 = new Document("input_document");
doc1.Save(dataDir + "output1.txt");
Document doc2 = new Document("input_document");
TxtSaveOptions options = new TxtSaveOptions();
doc2.Save(dataDir + "output2.txt", options);