Werken met tekstdocument
In dit artikel zullen we weten welke opties nuttig kunnen zijn voor het werken met een tekstdocument via Aspose.Words. Let op: dit is niet een volledige lijst van beschikbare opties, maar slechts een voorbeeld van werken met sommige van hen.
Bidirectionele toevoegen Merken
U kunt add_bidi_marks eigenschap om aan te geven of bidirectionele markeringen moeten worden toegevoegd voordat elke BiDi wordt uitgevoerd bij het exporteren in platte tekstformaat. Aspose.Words plaatst Unicode Karakter ‘RIGHT-TO-LEFT MARK’ (U+200F) voor elke bidirectionele Run in de tekst. Deze optie komt overeen met “Bidirectionele markeringen toevoegen” optie in MS Word File Conversie dialoog wanneer u exporteren naar een platte tekst formaat. Merk op dat het verschijnt in dialoog alleen als een van de Arabische of Hebreeuwse bewerken talen worden toegevoegd in MS Word.
Het volgende voorbeeld van code laat zien hoe te gebruiken add_bidi_marks eigendom. De standaardwaarde van deze eigenschap is False
# For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET | |
doc = aw.Document() | |
builder = aw.DocumentBuilder(doc) | |
builder.writeln("Hello world!") | |
builder.paragraph_format.bidi = True | |
builder.writeln("שלום עולם!") | |
builder.writeln("مرحبا بالعالم!") | |
saveOptions = aw.saving.TxtSaveOptions() | |
saveOptions.add_bidi_marks = True | |
doc.save(docs_base.artifacts_dir + "WorkingWithTxtSaveOptions.add_bidi_marks.txt", saveOptions) |
Lijstitems herkennen tijdens laden van TXT
Aspose.Words kan lijstitem van een tekstbestand importeren als lijstnummers of platte tekst in het documentobjectmodel. De detect_numbering_with_whitespaces eigenschap geeft aan hoe genummerde lijst items worden herkend wanneer een document wordt geïmporteerd uit platte tekst formaat:
- Als deze optie ingesteld is
, whitespaces worden ook gebruikt als lijstnummergrenzen: lijstherkenningsalgoritme voor Arabische stijlnummers (1., 1.1.2.) gebruikt zowel witruimtes als stip (".") symbolen. - Als deze optie ingesteld is
, lijsten van herkenningsalgoritmen detecteert lijst paragrafen, wanneer lijstnummers eindigen met ofwel punt, rechter beugel of kogelsymbolen (zoals “•,” “*,” “-” of “o”).
Het volgende voorbeeld van code laat zien hoe deze eigenschap te gebruiken:
# For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET | |
# Create a plaintext document in the form of a string with parts that may be interpreted as lists. | |
# Upon loading, the first three lists will always be detected by Aspose.words, | |
# and List objects will be created for them after loading. | |
textDoc = """Full stop delimiters:\n | |
1. First list item 1\n | |
2. First list item 2\n | |
3. First list item 3\n\n | |
Right bracket delimiters:\n | |
1) Second list item 1\n | |
2) Second list item 2\n | |
3) Second list item 3\n\n | |
Bullet delimiters:\n | |
• Third list item 1\n | |
• Third list item 2\n | |
• Third list item 3\n\n | |
Whitespace delimiters:\n | |
1 Fourth list item 1\n | |
2 Fourth list item 2\n | |
3 Fourth list item 3""" | |
# The fourth list, with whitespace inbetween the list number and list item contents, | |
# will only be detected as a list if "DetectNumberingWithWhitespaces" in a LoadOptions object is set to true, | |
# to avoid paragraphs that start with numbers being mistakenly detected as lists. | |
loadOptions = aw.loading.TxtLoadOptions() | |
loadOptions.detect_numbering_with_whitespaces = True | |
# Load the document while applying LoadOptions as a parameter and verify the result. | |
doc = aw.Document(io.BytesIO(textDoc.encode("utf-8")), loadOptions) | |
doc.save(docs_base.artifacts_dir + "WorkingWithTxtLoadOptions.detect_numbering_with_whitespaces.docx") |
Tijdens het laden van TXT lood- en trailruimtes hanteren
Tijdens het laden van TXT-bestand kunt u de manier van omgaan met toonaangevende en trailing spaties controleren. De openingsruimten kunnen worden gesnoeid, bewaard of omgezet in inspringruimtes en kunnen worden gesnoeid of bewaard.
Het volgende voorbeeld van code laat zien hoe te trimmen toonaangevende en trailing spaties tijdens het importeren van TXT-bestand:
# For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET | |
textDoc = " Line 1 \n" + " Line 2 \n" + " Line 3 " | |
loadOptions = aw.loading.TxtLoadOptions() | |
loadOptions.leading_spaces_options = aw.loading.TxtLeadingSpacesOptions.TRIM | |
loadOptions.trailing_spaces_options = aw.loading.TxtTrailingSpacesOptions.TRIM | |
f = io.BytesIO(textDoc.encode("utf-8")) | |
doc = aw.Document(f, loadOptions) | |
doc.save(docs_base.artifacts_dir + "WorkingWithTxtLoadOptions.handle_spaces_options.docx") |
Document detecteren Tekstrichting
Aspose.Words levert document_direction eigenschap in TxtLoadOptions klasse om de tekstrichting (RTL / LTR) in het document te detecteren. Deze eigenschap stelt of ontvangt tekstbeschrijvingen in DocumentDirection Lijst. De standaardwaarde is links naar rechts.
Het volgende voorbeeld van code laat zien hoe tekstrichting van het document te detecteren tijdens het importeren van TXT-bestand:
# For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET | |
loadOptions = aw.loading.TxtLoadOptions() | |
loadOptions.document_direction = aw.loading.DocumentDirection.AUTO | |
doc = aw.Document(docs_base.my_dir + "Hebrew text.txt", loadOptions) | |
paragraph = doc.first_section.body.first_paragraph | |
print(paragraph.paragraph_format.bidi) | |
doc.save(docs_base.artifacts_dir + "WorkingWithTxtLoadOptions.document_text_direction.docx") |
Header en Voettekst exporteren in uitvoerTXT
Als u header en footer wilt exporteren in uitvoer TXT-document, kunt u export_headers_footers_mode eigendom. Deze eigenschap specificeert de manier waarop headers en voetteksten worden geëxporteerd naar het platte tekstformaat.
Het volgende voorbeeld van code laat zien hoe je headers en footers naar platte tekst formaat exporteren:
doc = aw.Document(docs_base.my_dir + "Document.docx")
options = aw.saving.TxtSaveOptions()
options.save_format = aw.SaveFormat.TEXT
# All headers and footers are placed at the very end of the output document.
options.export_headers_footers_mode = aw.saving.TxtExportHeadersFootersMode.ALL_AT_END
doc.save(docs_base.artifacts_dir + "WorkingWithTxtSaveOptions.export_headers_footers_mode_A.txt", options)
# Only primary headers and footers are exported at the beginning and end of each section.
options.export_headers_footers_mode = aw.saving.TxtExportHeadersFootersMode.PRIMARY_ONLY
doc.save(docs_base.artifacts_dir + "WorkingWithTxtSaveOptions.export_headers_footers_mode_B.txt", options)
# No headers and footers are exported.
options.export_headers_footers_mode = aw.saving.TxtExportHeadersFootersMode.NONE
doc.save(docs_base.artifacts_dir + "WorkingWithTxtSaveOptions.export_headers_footers_mode_C.txt", options)
Lijst-inspringing exporteren in uitvoer-TXT
Aspose.Words ingevoerd TxtListIndentation klasse die aangeeft hoe lijstniveaus worden ingespringd tijdens het exporteren naar een platte tekstformaat. Tijdens het werken met TxtSaveOption, de list_indentation eigenschap wordt gegeven om het teken te specificeren dat moet worden gebruikt voor het inspringen van lijstniveaus en het tellen van het aantal tekens dat moet worden gebruikt als inspringing per één lijstniveau. De standaardwaarde voor karaktereigenschap is ‘\0’ wat aangeeft dat er geen inspringing is. Voor count property is de standaard waarde 0 wat betekent dat er geen inspringing is.
Gebruik van tabteken
Het volgende voorbeeld van code laat zien hoe u lijstniveaus kunt exporteren met tabtekens:
# For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET | |
doc = aw.Document() | |
builder = aw.DocumentBuilder(doc) | |
# Create a list with three levels of indentation. | |
builder.list_format.apply_number_default() | |
builder.writeln("Item 1") | |
builder.list_format.list_indent() | |
builder.writeln("Item 2") | |
builder.list_format.list_indent() | |
builder.write("Item 3") | |
saveOptions = aw.saving.TxtSaveOptions() | |
saveOptions.list_indentation.count = 1 | |
#saveOptions.list_indentation.character = '\t' | |
doc.save(docs_base.artifacts_dir + "WorkingWithTxtSaveOptions.use_tab_character_per_level_for_list_indentation.txt", saveOptions) |
Spatieteken gebruiken
Het volgende voorbeeld van code laat zien hoe u lijstniveaus kunt exporteren met behulp van spatietekens:
# For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET | |
doc = aw.Document() | |
builder = aw.DocumentBuilder(doc) | |
# Create a list with three levels of indentation. | |
builder.list_format.apply_number_default() | |
builder.writeln("Item 1") | |
builder.list_format.list_indent() | |
builder.writeln("Item 2") | |
builder.list_format.list_indent() | |
builder.write("Item 3") | |
saveOptions = aw.saving.TxtSaveOptions() | |
saveOptions.list_indentation.count = 3 | |
#saveOptions.list_indentation.character = ' ' | |
doc.save(docs_base.artifacts_dir + "WorkingWithTxtSaveOptions.use_space_character_per_level_for_list_indentation.txt", saveOptions) |