Trabajar con Documento de Texto
En este artículo, aprenderemos qué opciones pueden ser útiles para trabajar con un documento de texto a través de Aspose.Words. Tenga en cuenta que esta no es una lista completa de las opciones disponibles, sino solo un ejemplo de cómo trabajar con algunas de ellas.
Agregar Marcas Bidireccionales
Puede usar la propiedad AddBidiMarks para especificar si desea agregar marcas bidireccionales antes de cada ejecución de BiDi al exportar en formato de texto sin formato. Aspose.Words inserta caracteres Unicode’RIGHT-TO-LEFT MARK' (U + 200F) antes de cada ejecución bidireccional en texto. Esta opción corresponde a la opción" Agregar marcas bidireccionales " en el cuadro de diálogo Conversión de archivos de Word MS cuando exporta a un formato de texto sin formato. Tenga en cuenta que aparece en el cuadro de diálogo solo si se agrega cualquiera de los idiomas de edición árabe o hebreo en MS Word.
El siguiente ejemplo de código muestra cómo usar la propiedad TxtSaveOptions.AddBidiMarks
. El valor predeterminado de esta propiedad es true:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java | |
Document doc = new Document(dataDir + "Input.docx"); | |
TxtSaveOptions saveOptions = new TxtSaveOptions(); | |
//The default value is false. | |
saveOptions.setAddBidiMarks(true); | |
dataDir = dataDir + "Document.AddBidiMarks_out.txt"; | |
doc.save(dataDir, saveOptions); |
Reconocer Elementos De La Lista Durante La Carga TXT
Aspose.Words puede importar elementos de lista de un archivo de texto como números de lista o texto sin formato en su modelo de objetos de documento. La propiedad DetectNumberingWithWhitespaces permite especificar cómo se reconocen los elementos de la lista numerada cuando se importa un documento desde formato de texto sin formato:
- Si esta opción se establece en true, los espacios en blanco también se utilizan como delimitadores de números de lista: algoritmo de reconocimiento de listas para numeración al estilo árabe (1., 1.1.2.) usa espacios en blanco y símbolos de punto (".").
- Si esta opción se establece en false, el algoritmo de reconocimiento de listas detecta los párrafos de la lista, cuando los números de la lista terminan con símbolos de punto, corchete derecho o viñeta (como “•”, “*”, “-” o “o”).
El siguiente ejemplo de código muestra cómo usar esta propiedad:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java | |
TxtLoadOptions loadOptions = new TxtLoadOptions(); | |
loadOptions.setDetectNumberingWithWhitespaces(false); | |
Document doc = new Document(dataDir + "LoadTxt.txt", loadOptions); | |
dataDir = dataDir + "DetectNumberingWithWhitespaces_out.docx"; | |
doc.save(dataDir); |
Maneje los Espacios Iniciales y Finales durante la Carga TXT
Puede controlar la forma de manejar los espacios iniciales y finales durante la carga de archivos TXT. Los espacios iniciales podrían recortarse, conservarse o convertirse en sangría y los espacios finales podrían recortarse o conservarse.
El ejemplo de código que se muestra a continuación muestra cómo recortar los espacios iniciales y finales al importar el archivo TXT:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java | |
TxtLoadOptions loadOptions = new TxtLoadOptions(); | |
loadOptions.setLeadingSpacesOptions(TxtLeadingSpacesOptions.TRIM); | |
loadOptions.setTrailingSpacesOptions(TxtTrailingSpacesOptions.TRIM); | |
Document doc = new Document(dataDir + "LoadTxt.txt", loadOptions); | |
dataDir = dataDir + "HandleSpacesOptions_out.docx"; | |
doc.save(dataDir); |
Detectar la Dirección del Texto del Documento
Aspose.Words proporciona la propiedad DocumentDirection en la clase TxtLoadOptions para detectar la dirección del texto (RTL / LTR) en el documento. Esta propiedad establece u obtiene las instrucciones de texto del documento proporcionadas en la enumeración DocumentDirection. El valor predeterminado es de izquierda a derecha.
El siguiente ejemplo de código muestra cómo detectar la dirección del texto del documento al importar el archivo TXT:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java | |
TxtLoadOptions loadOptions = new TxtLoadOptions(); | |
loadOptions.setDocumentDirection(DocumentDirection.AUTO); | |
Document doc = new Document(dataDir + "arabic.txt", loadOptions); | |
Paragraph paragraph = doc.getFirstSection().getBody().getFirstParagraph(); | |
System.out.println(paragraph.getParagraphFormat().getBidi()); | |
dataDir = dataDir + "DocumentDirection_out.docx"; | |
doc.save(dataDir); |
Exportar Encabezado y Pie de página en el Archivo TXT de salida
Si desea exportar el encabezado y el pie de página en el documento TXT de salida, puede usar la propiedad ExportHeadersFootersMode. Esta propiedad especifica la forma en que los encabezados y pies de página se exportan al formato de texto sin formato.
El siguiente ejemplo de código muestra cómo exportar encabezados y pies de página a formato de texto sin formato:
Sangría de la Lista de Exportación en la salida TXT
Aspose.Words introdujo la clase TxtListIndentation que permite especificar cómo se sangran los niveles de lista al exportar a un formato de texto sin formato. Al trabajar con TxtSaveOption, se proporciona la propiedad ListIndentation para especificar el carácter que se utilizará para sangrar los niveles de la lista y count especificando cuántos caracteres se utilizarán como sangría por nivel de lista.
El valor predeterminado de la propiedad character es ‘\0’, lo que indica que no hay sangría. Para la propiedad count, el valor predeterminado es 0, lo que significa que no hay sangría.
Uso del Carácter de Tabulación
El siguiente ejemplo de código muestra cómo exportar niveles de lista usando caracteres de tabulación:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java | |
Document doc = new Document(dataDir + "Input.docx"); | |
TxtSaveOptions options = new TxtSaveOptions(); | |
options.getListIndentation().setCount(1); | |
options.getListIndentation().setCharacter('\t'); | |
doc.save(dataDir + "output.txt", options); |
Uso del Carácter de Espacio
El siguiente ejemplo de código muestra cómo exportar niveles de lista usando caracteres de espacio:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java | |
Document doc = new Document(dataDir + "Input.docx"); | |
TxtSaveOptions options = new TxtSaveOptions(); | |
options.getListIndentation().setCount(3); | |
options.getListIndentation().setCharacter(' '); | |
doc.save(dataDir + "output.txt", options); |
Uso de Sangría Predeterminada
El siguiente ejemplo de código muestra cómo exportar niveles de lista utilizando la sangría predeterminada:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java | |
Document doc = new Document(dataDir + "Input.docx"); | |
doc.save(dataDir + "output1.txt"); | |
Document doc2 = new Document("Input.docx"); | |
TxtSaveOptions options = new TxtSaveOptions(); | |
doc2.save(dataDir + "output2.txt", options); |