Travailler avec un document texte
Dans cet article, nous apprendrons quelles options peuvent être utiles pour travailler avec un document texte via Aspose.Words. Veuillez noter qu’il ne s’agit pas d’une liste complète des options disponibles, mais seulement d’un exemple de travail avec certaines d’entre elles.
Ajouter des marques bidirectionnelles
Vous pouvez utiliser la propriété AddBidiMarks pour spécifier s’il convient d’ajouter des marques bidirectionnelles avant chaque exécution de BiDi lors de l’exportation au format texte brut. Aspose.Words insère le caractère Unicode “MARQUE DE DROITE À GAUCHE” (U+200F) avant chaque exécution bidirectionnelle dans le texte. Cette option correspond à l’option “Ajouter des marques bidirectionnelles” dans la boîte de dialogue Conversion de fichier MS Word lorsque vous exportez au format texte brut. Notez qu’il apparaît dans le dialogue uniquement si l’une des langues d’édition arabe ou hébraïque est ajoutée dans MS Word.
L’exemple de code suivant montre comment utiliser la propriété AddBidiMarks. La valeur par défaut de cette propriété est false:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET | |
Document doc = new Document(dataDir + "Input.docx"); | |
TxtSaveOptions saveOptions = new TxtSaveOptions(); | |
saveOptions.AddBidiMarks = true; | |
dataDir = dataDir + "Document.AddBidiMarks_out.txt"; | |
doc.Save(dataDir, saveOptions); |
Reconnaître les éléments de la liste lors du chargement de TXT
Aspose.Words peut importer un élément de liste d’un fichier texte sous forme de numéros de liste ou de texte brut dans son modèle objet de document. La propriété DetectNumberingWithWhitespaces permet de spécifier comment les éléments de liste numérotés sont reconnus lorsqu’un document est importé à partir du format texte brut:
-
Si cette option est définie sur true, les espaces sont également utilisés comme délimiteurs de numéros de liste: l’algorithme de reconnaissance de liste pour la numérotation de style arabe (1., 1.1.2.) utilise à la fois les espaces et les symboles point ("").
-
Si cette option est définie sur false, l’algorithme de reconnaissance des listes détecte les paragraphes de la liste lorsque les numéros de liste se terminent par un point, un crochet droit ou des puces (tels que “•”, “*”, “-” ou “o”).
L’exemple de code suivant montre comment utiliser cette propriété:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET | |
TxtLoadOptions loadOptions = new TxtLoadOptions(); | |
loadOptions.DetectNumberingWithWhitespaces = false; | |
Document doc = new Document(dataDir + "LoadTxt.txt", loadOptions); | |
dataDir = dataDir + "DetectNumberingWithWhitespaces_out.docx"; | |
doc.Save(dataDir); |
Gérer les espaces de début et de fin pendant le chargement de TXT
Vous pouvez contrôler la manière de gérer les espaces de début et de fin lors du chargement du fichier TXT. Les espaces de début peuvent être coupés, conservés ou convertis en retrait et les espaces de fin peuvent être coupés ou conservés.
L’exemple de code suivant montre comment supprimer les espaces de début et de fin lors de l’importation d’un fichier TXT:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET | |
TxtLoadOptions loadOptions = new TxtLoadOptions(); | |
loadOptions.LeadingSpacesOptions = TxtLeadingSpacesOptions.Trim; | |
loadOptions.TrailingSpacesOptions = TxtTrailingSpacesOptions.Trim; | |
Document doc = new Document(dataDir + "LoadTxt.txt", loadOptions); | |
dataDir = dataDir + "HandleSpacesOptions_out.docx"; | |
doc.Save(dataDir); |
Détecter la direction du texte du document
Aspose.Words fournit la propriété DocumentDirection dans la classe TxtLoadOptions pour détecter le sens du texte (RTL/LTR) dans le document. Cette propriété définit ou obtient les instructions de texte du document fournies dans l’énumération DocumentDirection. La valeur par défaut est laissée à right.
L’exemple de code suivant montre comment détecter la direction du texte du document lors de l’importation du fichier TXT:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET | |
TxtLoadOptions loadOptions = new TxtLoadOptions(); | |
loadOptions.DocumentDirection = DocumentDirection.Auto; | |
Document doc = new Document(dataDir + "arabic.txt", loadOptions); | |
Paragraph paragraph = doc.FirstSection.Body.FirstParagraph; | |
Console.WriteLine(paragraph.ParagraphFormat.Bidi); | |
dataDir = dataDir + "DocumentDirection_out.docx"; | |
doc.Save(dataDir); |
Exporter l’en-tête et le pied de page dans la sortie TXT
Si vous souhaitez exporter l’en-tête et le pied de page dans le document TXT de sortie, vous pouvez utiliser la propriété ExportHeadersFootersMode. Cette propriété spécifie la manière dont les en-têtes et les pieds de page sont exportés au format texte brut.
L’exemple de code suivant montre comment exporter les en-têtes et les pieds de page au format texte brut:
Exporter l’indentation de la liste dans la sortie TXT
Aspose.Words a introduit la classe TxtListIndentation qui permet de spécifier comment les niveaux de liste sont indentés lors de l’exportation au format texte brut. Lorsque vous travaillez avec TxtSaveOption, la propriété ListIndentation est fournie pour spécifier le caractère à utiliser pour l’indentation des niveaux de liste et le nombre spécifiant le nombre de caractères à utiliser comme indentation pour un niveau de liste.
La valeur par défaut de la propriété caractère est “\0”, indiquant qu’il n’y a pas d’indentation. Pour la propriété count, la valeur par défaut est 0, ce qui signifie aucune indentation.
Utilisation du caractère de tabulation
L’exemple de code suivant montre comment exporter des niveaux de liste à l’aide de caractères de tabulation:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET | |
Document doc = new Document("input_document"); | |
TxtSaveOptions options = new TxtSaveOptions(); | |
options.ListIndentation.Count = 1; | |
options.ListIndentation.Character = '\t'; | |
doc.Save(dataDir + "output.txt", options); |
Utiliser le caractère espace
L’exemple de code suivant montre comment exporter des niveaux de liste à l’aide de caractères d’espace:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET | |
Document doc = new Document("input_document"); | |
TxtSaveOptions options = new TxtSaveOptions(); | |
options.ListIndentation.Count = 3; | |
options.ListIndentation.Character = ' '; | |
doc.Save(dataDir + "output.txt", options); |
Utilisation de l’indentation par défaut
L’exemple de code suivant montre comment exporter des niveaux de liste à l’aide de l’indentation par défaut:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET | |
Document doc1 = new Document("input_document"); | |
doc1.Save(dataDir + "output1.txt"); | |
Document doc2 = new Document("input_document"); | |
TxtSaveOptions options = new TxtSaveOptions(); | |
doc2.Save(dataDir + "output2.txt", options); |