テキストドキュメントの操作

この記事では、Aspose.Words を介してテキスト ドキュメントを操作する場合に役立つオプションを学びます。これは利用可能なオプションの完全なリストではなく、それらの一部を使用した例にすぎないことに注意してください。

双方向マークの追加

AddBidiMarks プロパティを使用して、プレーン テキスト形式でエクスポートするときに各 BiDi を実行する前に双方向マークを追加するかどうかを指定できます。 Aspose.Words は、テキスト内の各双方向 Run の前に Unicode 文字「RIGHT-TO-LEFT MARK」(U+200F) を挿入します。このオプションは、プレーン テキスト形式にエクスポートする場合の MS Word ファイル変換ダイアログの [双方向マークを追加] オプションに対応します。 MS Word にアラビア語またはヘブライ語の編集言語が追加されている場合にのみ、ダイアログに表示されることに注意してください。

次のコード例は、AddBidiMarks プロパティの使用方法を示しています。このプロパティのデフォルト値は false です。

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc = new Document(dataDir + "Input.docx");
TxtSaveOptions saveOptions = new TxtSaveOptions();
saveOptions.AddBidiMarks = true;
dataDir = dataDir + "Document.AddBidiMarks_out.txt";
doc.Save(dataDir, saveOptions);

TXTのロード中にリスト項目を認識する

Aspose.Words は、テキスト ファイルのリスト項目をリスト番号またはプレーン テキストとしてドキュメント オブジェクト モデルにインポートできます。 DetectNumberingWithWhitespaces プロパティを使用すると、ドキュメントをプレーン テキスト形式からインポートするときに番号付きリスト項目をどのように認識するかを指定できます。

  • このオプションが true に設定されている場合、空白もリスト番号の区切り文字として使用されます。アラビア語形式の番号付け (1.、1.1.2.) のリスト認識アルゴリズムでは、空白とドット (「.」) 記号の両方が使用されます。

  • このオプションが false に設定されている場合、リスト認識アルゴリズムは、リスト番号がドット、右括弧、または箇条書き記号 (「•」、「*」、「-」、または「o」など) で終わる場合にリストの段落を検出します。

次のコード例は、このプロパティの使用方法を示しています。

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
TxtLoadOptions loadOptions = new TxtLoadOptions();
loadOptions.DetectNumberingWithWhitespaces = false;
Document doc = new Document(dataDir + "LoadTxt.txt", loadOptions);
dataDir = dataDir + "DetectNumberingWithWhitespaces_out.docx";
doc.Save(dataDir);

TXTのロード中に先頭と末尾のスペースを処理する

TXT ファイルのロード中に先頭と末尾のスペースを処理する方法を制御できます。先頭のスペースはトリミング、保存、またはインデントに変換でき、末尾のスペースはトリミングまたは保存できます。

次のコード例は、TXT ファイルのインポート中に先頭と末尾のスペースをトリミングする方法を示しています。

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
TxtLoadOptions loadOptions = new TxtLoadOptions();
loadOptions.LeadingSpacesOptions = TxtLeadingSpacesOptions.Trim;
loadOptions.TrailingSpacesOptions = TxtTrailingSpacesOptions.Trim;
Document doc = new Document(dataDir + "LoadTxt.txt", loadOptions);
dataDir = dataDir + "HandleSpacesOptions_out.docx";
doc.Save(dataDir);

ドキュメントのテキスト方向の検出

Aspose.Words は、ドキュメント内のテキストの方向 (RTL / LTR) を検出するために、TxtLoadOptions クラスに DocumentDirection プロパティを提供します。このプロパティは、DocumentDirection 列挙で提供されるドキュメント テキストの方向を設定または取得します。デフォルト値は right のままです。

次のコード例は、TXT ファイルのインポート中にドキュメントのテキストの方向を検出する方法を示しています。

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
TxtLoadOptions loadOptions = new TxtLoadOptions();
loadOptions.DocumentDirection = DocumentDirection.Auto;
Document doc = new Document(dataDir + "arabic.txt", loadOptions);
Paragraph paragraph = doc.FirstSection.Body.FirstParagraph;
Console.WriteLine(paragraph.ParagraphFormat.Bidi);
dataDir = dataDir + "DocumentDirection_out.docx";
doc.Save(dataDir);

出力TXTでヘッダーとフッターをエクスポート

出力 TXT ドキュメントのヘッダーとフッターをエクスポートする場合は、ExportHeadersFootersMode プロパティを使用できます。このプロパティは、ヘッダーとフッターをプレーン テキスト形式にエクスポートする方法を指定します。

次のコード例は、ヘッダーとフッターをプレーン テキスト形式にエクスポートする方法を示しています。

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc = new Document(dataDir + "TxtExportHeadersFootersMode.docx");
TxtSaveOptions options = new TxtSaveOptions();
options.SaveFormat = SaveFormat.Text;
// All headers and footers are placed at the very end of the output document.
options.ExportHeadersFootersMode = TxtExportHeadersFootersMode.AllAtEnd;
doc.Save(dataDir + "outputFileNameA.txt", options);
// Only primary headers and footers are exported at the beginning and end of each section.
options.ExportHeadersFootersMode = TxtExportHeadersFootersMode.PrimaryOnly;
doc.Save(dataDir + "outputFileNameB.txt", options);
// No headers and footers are exported.
options.ExportHeadersFootersMode = TxtExportHeadersFootersMode.None;
doc.Save(dataDir + "outputFileNameC.txt", options);

出力 TXT のエクスポート リストのインデント

Aspose.Words では、プレーン テキスト形式にエクスポートする際にリスト レベルのインデント方法を指定できる TxtListIndentation クラスが導入されました。 TxtSaveOption を操作する場合、リスト レベルのインデントに使用する文字を指定するための ListIndentation プロパティと、1 つのリスト レベルごとにインデントとして使用する文字数を指定する count が提供されます。

文字プロパティのデフォルト値は「\0」で、インデントがないことを示します。 count プロパティのデフォルト値は 0 で、インデントなしを意味します。

タブ文字の使用

次のコード例は、タブ文字を使用してリスト レベルをエクスポートする方法を示しています。

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc = new Document("input_document");
TxtSaveOptions options = new TxtSaveOptions();
options.ListIndentation.Count = 1;
options.ListIndentation.Character = '\t';
doc.Save(dataDir + "output.txt", options);

スペース文字の使用

次のコード例は、スペース文字を使用してリスト レベルをエクスポートする方法を示しています。

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc = new Document("input_document");
TxtSaveOptions options = new TxtSaveOptions();
options.ListIndentation.Count = 3;
options.ListIndentation.Character = ' ';
doc.Save(dataDir + "output.txt", options);

デフォルトのインデントの使用

次のコード例は、デフォルトのインデントを使用してリスト レベルをエクスポートする方法を示しています。

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc1 = new Document("input_document");
doc1.Save(dataDir + "output1.txt");
Document doc2 = new Document("input_document");
TxtSaveOptions options = new TxtSaveOptions();
doc2.Save(dataDir + "output2.txt", options);