עבודה עם מסמך טקסט
במאמר זה נלמד אילו אפשרויות יכולות להיות מועילות לעבוד עם מסמך טקסט דרך Aspose.Words. שימו לב כי זו אינה רשימה מלאה של אפשרויות זמינות, אלא רק דוגמא לעבודה עם חלק מהן.
תגית: Bi-Directional מארקס
אתה יכול להשתמש AddBidiMarks נכס כדי לציין אם להוסיף סימנים דו-כי-כיוניים לפני כל BDi לרוץ כאשר ייצוא בפורמט טקסט רגיל. Aspose.Words הוסף את האופי Unicode “Rnight-TO-LEFT MARK” (U+200F) לפני כל ריצה דו-זמנית בטקסט. אפשרות זו תואמת את האפשרות “Add bi-directional” ב- MS Word Conversionשיח כאשר אתה מייצא לתבנית טקסט פשוטה. שימו לב כי הוא מופיע בדיאלוג רק אם אחת מהשפות הערביות או העבריות נוספו ב-MS Word.
דוגמה לקוד הבא מראה כיצד להשתמש TxtSaveOptions.AddBidiMarks
רכוש. ערך ברירת המחדל של הנכס הזה הוא true:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java | |
Document doc = new Document(dataDir + "Input.docx"); | |
TxtSaveOptions saveOptions = new TxtSaveOptions(); | |
//The default value is false. | |
saveOptions.setAddBidiMarks(true); | |
dataDir = dataDir + "Document.AddBidiMarks_out.txt"; | |
doc.save(dataDir, saveOptions); |
פריטים נבחרים במהלך טעינה
Aspose.Words ניתן לייבא פריט רשימה של קובץ טקסט כמספרי רשימה או טקסט פשוט במודל אובייקט המסמך שלה. The The The DetectNumberingWithWhitespaces הנכס מאפשר לציין כיצד פריטים ברשימה ממוספרים מוכרים כאשר מסמך מיובא מתבנית טקסט פשוטה:
- אם אפשרות זו נקבעת true, חללים לבנים משמשים גם כמספר מספר רשימה: אלגוריתם זיהוי רשימה לסגנון הערבי מספר (1., 1.1.2).
- אם אפשרות זו נקבעת false, אלגוריתם זיהוי הרשימות מזהה את סעיף פסקאות, כאשר מספרי רשימה מסתיים עם dot, הברכיט הנכון או סמלי כדורים (כגון “זה”, “או”).
דוגמה לקוד הבא מראה כיצד להשתמש בנכס זה:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java | |
TxtLoadOptions loadOptions = new TxtLoadOptions(); | |
loadOptions.setDetectNumberingWithWhitespaces(false); | |
Document doc = new Document(dataDir + "LoadTxt.txt", loadOptions); | |
dataDir = dataDir + "DetectNumberingWithWhitespaces_out.docx"; | |
doc.save(dataDir); |
מוביל וטיול חללים במהלך טעינה
אתה יכול לשלוט על הדרך של טיפול בחללים מובילים וכבישים במהלך טעינת קבצי TXT. החללים המובילים יכולים להיות מזורים, נשמרים או מומרים למקומות עכורים וכבישים יכולים להיות מפורצים או נשמרים.
דוגמה לקוד שניתן להלן מראה כיצד לקצץ חללים מובילים וכבישים תוך ייבוא קובץ TXT:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java | |
TxtLoadOptions loadOptions = new TxtLoadOptions(); | |
loadOptions.setLeadingSpacesOptions(TxtLeadingSpacesOptions.TRIM); | |
loadOptions.setTrailingSpacesOptions(TxtTrailingSpacesOptions.TRIM); | |
Document doc = new Document(dataDir + "LoadTxt.txt", loadOptions); | |
dataDir = dataDir + "HandleSpacesOptions_out.docx"; | |
doc.save(dataDir); |
מסמך Detect כיוון טקסט
Aspose.Words מספק DocumentDirection רכוש TxtLoadOptions שיעור כדי לזהות את כיוון הטקסט (RTL / LTR) במסמך. נכס זה קובע או מקבל הוראות טקסט מסמכים הניתנים ב DocumentDirection אזהרה. ערך ברירת המחדל נשאר נכון.
הדוגמה הבאה של הקוד מראה כיצד לזהות את כיוון הטקסט של המסמך תוך ייבוא קובץ TXT:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java | |
TxtLoadOptions loadOptions = new TxtLoadOptions(); | |
loadOptions.setDocumentDirection(DocumentDirection.AUTO); | |
Document doc = new Document(dataDir + "arabic.txt", loadOptions); | |
Paragraph paragraph = doc.getFirstSection().getBody().getFirstParagraph(); | |
System.out.println(paragraph.getParagraphFormat().getBidi()); | |
dataDir = dataDir + "DocumentDirection_out.docx"; | |
doc.save(dataDir); |
ייצוא Header and Footer in Output TXT File
אם אתה רוצה לייצא את Header ו Footer במסמך הפלט TXT, אתה יכול להשתמש ExportHeadersFootersMode רכוש. נכס זה מפרט את הדרך שבה ראשים והולכי רגל מיוצאים לתבנית טקסט פשוטה.
דוגמה הקוד הבא מראה כיצד לייצא ראשים והולכי רגל לתבנית טקסט פשוטה:
מכירת הרשימה ב Output TXT
Aspose.Words הציג TxtListIndentation שיעור המאפשר לציין כיצד רמות הרשימה מוזנחות תוך הייצוא לתבנית טקסט פשוטה. בזמן עבודה עם TxtSaveOption, The The ListIndentation הנכס מסופק כדי לציין את הדמות שיש להשתמש עבור רמות הרשימה indenting וספירה המציין כמה דמויות להשתמש כ indentation לרמה אחת של רשימה.
ערך ברירת המחדל לקניין אופי הוא ‘\0’ המציין כי אין רתיעה. עבור ספירת רכוש, ערך ברירת המחדל הוא 0, כלומר לא התמדה.
המונחים: tab Character
הדוגמה הבאה לקוד מראה כיצד לייצא את רמות הרשימה באמצעות דמויות לשוניות:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java | |
Document doc = new Document(dataDir + "Input.docx"); | |
TxtSaveOptions options = new TxtSaveOptions(); | |
options.getListIndentation().setCount(1); | |
options.getListIndentation().setCharacter('\t'); | |
doc.save(dataDir + "output.txt", options); |
שימוש בטבע
לדוגמה הקוד הבא מראה כיצד לייצא את רמות הרשימה באמצעות דמויות חלל:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java | |
Document doc = new Document(dataDir + "Input.docx"); | |
TxtSaveOptions options = new TxtSaveOptions(); | |
options.getListIndentation().setCount(3); | |
options.getListIndentation().setCharacter(' '); | |
doc.save(dataDir + "output.txt", options); |
המונחים: Default Indentation
הדוגמה הקודית הבאה מראה כיצד לייצא את רמות הרשימה באמצעות הסתה ברירת מחדל:
// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java | |
Document doc = new Document(dataDir + "Input.docx"); | |
doc.save(dataDir + "output1.txt"); | |
Document doc2 = new Document("Input.docx"); | |
TxtSaveOptions options = new TxtSaveOptions(); | |
doc2.save(dataDir + "output2.txt", options); |