Trabalhar com documento de texto

Neste artigo, aprenderemos quais opções podem ser úteis para trabalhar com um documento de texto via Aspose.Words. Observe que esta não é uma lista completa de opções disponíveis, mas apenas um exemplo de trabalho com algumas delas.

Adicionar Marcas Bidirecionais

Você pode usar a propriedade AddBidiMarks para especificar se deseja adicionar marcas bidirecionais antes de cada execução BiDi ao exportar em formato de texto simples. Aspose.Words insere caracteres Unicode’RIGHT-TO-LEFT MARK' (U + 200F) antes de cada execução bidirecional em texto. Esta opção corresponde à opção “Adicionar marcas bidirecionais” na caixa de diálogo de conversão de ficheiros do Word MS quando exporta para um formato de texto simples. Note que só aparece na caixa de diálogo se alguma das línguas de edição árabe ou hebraica for adicionada em MS palavra.

O exemplo de código a seguir mostra como usar a propriedade TxtSaveOptions.AddBidiMarks. O valor padrão desta propriedade é true:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
Document doc = new Document(dataDir + "Input.docx");
TxtSaveOptions saveOptions = new TxtSaveOptions();
//The default value is false.
saveOptions.setAddBidiMarks(true);
dataDir = dataDir + "Document.AddBidiMarks_out.txt";
doc.save(dataDir, saveOptions);

Reconhecer Itens Da Lista Durante O Carregamento TXT

Aspose.Words pode importar item de Lista de um arquivo de texto como números de lista ou texto simples em seu modelo de objeto de Documento. A propriedade DetectNumberingWithWhitespaces permite especificar como os itens de lista numerados são reconhecidos quando um documento é importado do formato de texto simples:

  • Se esta opção estiver definida como true, os espaços em branco também serão utilizados como delimitadores de número de lista: algoritmo de reconhecimento de lista para numeração de estilo árabe (1., 1.1.2.) usa espaços em branco e símbolos de ponto (".").
  • Se esta opção estiver definida como false, o algoritmo de reconhecimento de listas detecta parágrafos de lista, quando os números de lista terminam com símbolos de ponto, colchete direito ou Marcador (como “•”, “*”, “-” ou “o”).

O exemplo de código a seguir mostra como usar essa propriedade:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
TxtLoadOptions loadOptions = new TxtLoadOptions();
loadOptions.setDetectNumberingWithWhitespaces(false);
Document doc = new Document(dataDir + "LoadTxt.txt", loadOptions);
dataDir = dataDir + "DetectNumberingWithWhitespaces_out.docx";
doc.save(dataDir);

Manuseie os espaços à esquerda e à direita durante o carregamento TXT

Você pode controlar a maneira de lidar com espaços iniciais e finais durante o carregamento de arquivos TXT. Os espaços à esquerda poderiam ser aparados, preservados ou convertidos em travessão e os espaços à direita poderiam ser aparados ou preservados.

O exemplo de código dado abaixo mostra como cortar espaços à esquerda e à direita ao importar o arquivo TXT:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
TxtLoadOptions loadOptions = new TxtLoadOptions();
loadOptions.setLeadingSpacesOptions(TxtLeadingSpacesOptions.TRIM);
loadOptions.setTrailingSpacesOptions(TxtTrailingSpacesOptions.TRIM);
Document doc = new Document(dataDir + "LoadTxt.txt", loadOptions);
dataDir = dataDir + "HandleSpacesOptions_out.docx";
doc.save(dataDir);

Detectar A Direção Do Texto Do Documento

Aspose.Words fornece a propriedade DocumentDirection na classe TxtLoadOptions para detectar a direção do texto (RTL / LTR) no documento. Esta propriedade define ou obtém instruções de texto do documento fornecidas na enumeração DocumentDirection. O valor predefinido é da esquerda para a direita.

O exemplo de código a seguir mostra como detectar a direção do texto do documento ao importar o arquivo TXT:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
TxtLoadOptions loadOptions = new TxtLoadOptions();
loadOptions.setDocumentDirection(DocumentDirection.AUTO);
Document doc = new Document(dataDir + "arabic.txt", loadOptions);
Paragraph paragraph = doc.getFirstSection().getBody().getFirstParagraph();
System.out.println(paragraph.getParagraphFormat().getBidi());
dataDir = dataDir + "DocumentDirection_out.docx";
doc.save(dataDir);

Exportar cabeçalho e Rodapé no ficheiro de saída TXT

Se pretender exportar o cabeçalho e o rodapé no documento de saída TXT, pode utilizar a propriedade ExportHeadersFootersMode. Esta propriedade especifica a forma como os cabeçalhos e rodapés são exportados para o formato de texto simples.

O exemplo de código a seguir mostra como exportar cabeçalhos e rodapés para o formato de texto simples:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
Document doc = new Document(dataDir + "TxtExportHeadersFootersMode.docx");
TxtSaveOptions options = new TxtSaveOptions();
options.setSaveFormat(SaveFormat.TEXT);
// All headers and footers are placed at the very end of the output document.
options.setExportHeadersFootersMode(TxtExportHeadersFootersMode.ALL_AT_END);
doc.save(dataDir + "outputFileNameA.txt", options);
// Only primary headers and footers are exported at the beginning and end of each section.
options.setExportHeadersFootersMode(TxtExportHeadersFootersMode.PRIMARY_ONLY);
doc.save(dataDir + "outputFileNameB.txt", options);
// No headers and footers are exported.
options.setExportHeadersFootersMode(TxtExportHeadersFootersMode.NONE);
doc.save(dataDir + "outputFileNameC.txt", options);

Recuo da lista de exportação na saída TXT

Aspose.Words introduziu a classe TxtListIndentation que permite especificar como os níveis de lista são recuados ao exportar para um formato de texto simples. Ao trabalhar com TxtSaveOption, a propriedade ListIndentation é fornecida para especificar o caractere a ser usado para recuar níveis de lista e contar especificando quantos caracteres usar como recuo por um nível de lista.

O valor padrão para a propriedade character é ‘\0’, indicando que não há recuo. Para a propriedade count, o valor padrão é 0, o que significa que não há recuo.

Usando O Caractere De Tabulação

O exemplo de código a seguir mostra como exportar níveis de lista usando caracteres de tabulação:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
Document doc = new Document(dataDir + "Input.docx");
TxtSaveOptions options = new TxtSaveOptions();
options.getListIndentation().setCount(1);
options.getListIndentation().setCharacter('\t');
doc.save(dataDir + "output.txt", options);

Utilização De Caracteres De Espaço

O exemplo de código a seguir mostra como exportar níveis de lista usando caracteres de espaço:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
Document doc = new Document(dataDir + "Input.docx");
TxtSaveOptions options = new TxtSaveOptions();
options.getListIndentation().setCount(3);
options.getListIndentation().setCharacter(' ');
doc.save(dataDir + "output.txt", options);

Utilização Da Indentação Predefinida

O exemplo de código a seguir mostra como exportar níveis de lista usando recuo padrão:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
Document doc = new Document(dataDir + "Input.docx");
doc.save(dataDir + "output1.txt");
Document doc2 = new Document("Input.docx");
TxtSaveOptions options = new TxtSaveOptions();
doc2.save(dataDir + "output2.txt", options);