使用文本文档

在本文中,我们将了解哪些选项可用于通过Aspose.Words处理文本文档。 请注意,这不是可用选项的完整列表,而只是使用其中一些选项的示例。

添加双向标记

您可以使用AddBidiMarks属性指定在以纯文本格式导出时是否在每次BiDi运行之前添加双向标记。 Aspose.Words插入Unicode字符’RIGHT-TO-LEFT MARK' (U+200F)在文本中每次双向运行之前。 此选项对应于导出为纯文本格式时MSWord文件转换对话框中的"添加双向标记"选项。 请注意,只有在MSWord中添加了任何阿拉伯语或希伯来语编辑语言时,它才会出现在对话框中。

下面的代码示例演示如何使用TxtSaveOptions.AddBidiMarks属性。 此属性的默认值为true:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
Document doc = new Document(dataDir + "Input.docx");
TxtSaveOptions saveOptions = new TxtSaveOptions();
//The default value is false.
saveOptions.setAddBidiMarks(true);
dataDir = dataDir + "Document.AddBidiMarks_out.txt";
doc.save(dataDir, saveOptions);

在加载TXT期间识别列表项

Aspose.Words可以在其文档对象模型中将文本文件的列表项导入为列表编号或纯文本。 DetectNumberingWithWhitespaces属性允许指定从纯文本格式导入文档时如何识别编号列表项:

  • 如果此选项设置为true,则空格也用作列表编号分隔符:阿拉伯语样式编号的列表识别算法(1。, 1.1.2.)同时使用空格和点(".")符号。
  • 如果此选项设置为false,列表识别算法将检测列表段落,当列表编号以点、右括号或项目符号(如"•", “*”, “-” 或"o")。

下面的代码示例演示如何使用此属性:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
TxtLoadOptions loadOptions = new TxtLoadOptions();
loadOptions.setDetectNumberingWithWhitespaces(false);
Document doc = new Document(dataDir + "LoadTxt.txt", loadOptions);
dataDir = dataDir + "DetectNumberingWithWhitespaces_out.docx";
doc.save(dataDir);

在加载TXT期间处理前导和尾随空格

您可以控制在加载TXT文件期间处理前导和尾随空格的方式。 前导空格可以被修剪、保留或转换为缩进,尾随空格可以被修剪或保留。

下面给出的代码示例演示如何在导入TXT文件时修剪前导和尾随空格:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
TxtLoadOptions loadOptions = new TxtLoadOptions();
loadOptions.setLeadingSpacesOptions(TxtLeadingSpacesOptions.TRIM);
loadOptions.setTrailingSpacesOptions(TxtTrailingSpacesOptions.TRIM);
Document doc = new Document(dataDir + "LoadTxt.txt", loadOptions);
dataDir = dataDir + "HandleSpacesOptions_out.docx";
doc.save(dataDir);

检测文档文本方向

Aspose.Words在TxtLoadOptions类中提供DocumentDirection属性来检测文档中的文本方向(RTL/LTR)。 此属性设置或获取DocumentDirection枚举中提供的文档文本方向。 默认值为从左到右。

下面的代码示例演示如何在导入TXT文件时检测文档的文本方向:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
TxtLoadOptions loadOptions = new TxtLoadOptions();
loadOptions.setDocumentDirection(DocumentDirection.AUTO);
Document doc = new Document(dataDir + "arabic.txt", loadOptions);
Paragraph paragraph = doc.getFirstSection().getBody().getFirstParagraph();
System.out.println(paragraph.getParagraphFormat().getBidi());
dataDir = dataDir + "DocumentDirection_out.docx";
doc.save(dataDir);

在输出TXT文件中导出页眉和页脚

如果要导出输出TXT文档中的页眉和页脚,可以使用ExportHeadersFootersMode属性。 此属性指定将页眉和页脚导出为纯文本格式的方式。

下面的代码示例演示如何将页眉和页脚导出为纯文本格式:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
Document doc = new Document(dataDir + "TxtExportHeadersFootersMode.docx");
TxtSaveOptions options = new TxtSaveOptions();
options.setSaveFormat(SaveFormat.TEXT);
// All headers and footers are placed at the very end of the output document.
options.setExportHeadersFootersMode(TxtExportHeadersFootersMode.ALL_AT_END);
doc.save(dataDir + "outputFileNameA.txt", options);
// Only primary headers and footers are exported at the beginning and end of each section.
options.setExportHeadersFootersMode(TxtExportHeadersFootersMode.PRIMARY_ONLY);
doc.save(dataDir + "outputFileNameB.txt", options);
// No headers and footers are exported.
options.setExportHeadersFootersMode(TxtExportHeadersFootersMode.NONE);
doc.save(dataDir + "outputFileNameC.txt", options);

输出TXT中的导出列表缩进

Aspose.Words引入了TxtListIndentation类,它允许指定在导出为纯文本格式时如何缩进列表级别。 在使用TxtSaveOption时,提供ListIndentation属性来指定用于缩进列表级别的字符,并计数指定每个列表级别使用多少个字符作为缩进。

Character属性的默认值为'\0',表示没有缩进。 对于count属性,默认值为0,这意味着没有缩进。

使用制表符

下面的代码示例演示如何使用制表符导出列表级别:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
Document doc = new Document(dataDir + "Input.docx");
TxtSaveOptions options = new TxtSaveOptions();
options.getListIndentation().setCount(1);
options.getListIndentation().setCharacter('\t');
doc.save(dataDir + "output.txt", options);

使用空格字符

下面的代码示例演示如何使用空格字符导出列表级别:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
Document doc = new Document(dataDir + "Input.docx");
TxtSaveOptions options = new TxtSaveOptions();
options.getListIndentation().setCount(3);
options.getListIndentation().setCharacter(' ');
doc.save(dataDir + "output.txt", options);

使用默认缩进

下面的代码示例演示如何使用默认缩进导出列表级别:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
Document doc = new Document(dataDir + "Input.docx");
doc.save(dataDir + "output1.txt");
Document doc2 = new Document("Input.docx");
TxtSaveOptions options = new TxtSaveOptions();
doc2.save(dataDir + "output2.txt", options);