Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.
При роботі з документами важливо легко витягти вміст з певного діапазону в межах документа. Однак зміст може складатися з складних елементів, таких як абзаци, таблиці, зображення тощо.
Незалежно від того, який вміст повинен бути вилучений, метод вилучення, який вміст завжди буде визначатися, за допомогою яких вузлів вибираються для отримання вмісту між. Це можуть бути всі текстові органи або прості текстові рядки.
Є багато можливих ситуацій і тому багато різних типів вузлів, щоб розглянути при вилучення вмісту. Наприклад, ви можете вилучити вміст:
У деяких ситуаціях, можливо, навіть потрібно об’єднати різні типи вузлів, такі як вилучення вмісту між абзацом і поле, або між забігом і закладкою.
Дана стаття забезпечує виконання коду для вилучення тексту між різними вузлами, а також прикладами поширених сценаріїв.
Часто мета вилучення змісту полягає в тому, щоб дублювати або зберегти його окремо в новому документі. Наприклад, ви можете отримати вміст і:
Це може бути легко досягнуто за допомогою Aspose.Words і виконання коду нижче.
Введіть номер мобільного, який Ви вказали при укладаннi договору з банком - для ідентифікації. Загальний контур цієї техніки передбачає:
1,1 км Зберігаючи вершини, які диктують область змісту, який буде вилучений з вашого документа. Виходячи з того, що вони хочуть бути вилучені. 1,1 км Передача цих вузлів до ExtractContent метод, передбачений нижче. Ви також повинні пройти boolean параметр, який стверджує, чи є ці вершини, діють як маркери, повинні бути включені до видобутку або ні. 1,1 км Відновлення списку клонованого вмісту (копійованих вузлів), зазначених для вилучення. Ви можете використовувати цей список вузлів в будь-який зручний спосіб, наприклад, створення нового документа, що містить тільки обраний вміст.
Щоб витягти вміст з вашого документа, потрібно викликати екстракт_content метод нижче і пропускають відповідні параметри. Основою даного методу передбачається пошук вузлів рівня блоків (парографії та таблиці) і скронювання їх для створення ідентичних копій. Якщо надійшла маркерна вершина, то метод здатний просто копіювати вміст на цьому рівні і додати його в масив.
Однак якщо маркерні вузли знаходяться в лінії (на дитину абзацу), то ситуація стає більш складною, так як необхідно розбити абзацу в інлайн-вузлі, будьте його забігом, закладками тощо. Контент у клонованих материнських вузлах не присутній між маркерами. Цей процес використовується для того, щоб вбудовані вузли ще зберігали форматування батьківського абзацу. Метод також буде виконувати перевірки на вузлах, які пропускаються як параметри, і кидає виключення, якщо або вузол недійсний. Параметри, які будуть передані в цей метод:
1,1 км Почати і ендНодй Першими двома параметрами є вершини, які визначають, де вилучення змісту є починати і закінчуватися відповідно. Ці вершини можуть бути як за рівнем блоку (Paragraph, Table або рівень inline (e.g) Run, FieldStart, BookmarkStart т.д.):
Реалізація реалізації екстракт_content метод можна знайти Головнай Цей метод буде зазначений у сценаріїв цієї статті.
Ми також визначаємо користувальницький метод, щоб легко створити документ з вилучених вузлів. Цей метод використовується в багатьох сценаріях нижче і просто створює новий документ і імпорт вилучення вмісту в нього.
Приклад коду показує, як взяти список вузлів і вставити їх в новий документ:
Це показує, як використовувати метод вище, щоб витягувати вміст між певними пунктами. У цьому випадку ми хочемо витягти тіло листа, знайденого в першій половині документа. Ми можемо сказати, що це між 7 і 11 абзац.
Код нижче виконує це завдання. Вилучення відповідних абзаців з використанням CompositeNode.get_child метод на документі і проходження зазначених показників. Потім ми проводимо ці вузли до екстракт_content метод і стан, які вони повинні бути включені в видобуток. Цей метод буде повернений вміст між цими вузлами, які потім вставляються в новий документ.
Приклад наступного коду показує, як витягти вміст між певними абзацами за допомогою екстракт_content метод вище:
Ми можемо вилучити вміст між будь-якими поєднаннями рівня блоку або внутрішніх вузлів. У цьому сценарії нижче ми виведемо вміст між першим абзацом та столиком у другому розділі включно. Ми отримуємо вузли маркерів за допомогою виклику Body.first_paragraph і CompositeNode.get_child метод на другий розділ документа для отримання відповідного Paragraph і Table вершини. Для легкої варіації, замість того, щоб дублювати вміст і вставити його нижче оригіналу.
Приклад наступного коду показує, як витягти вміст між абзацом та столиком за допомогою пункту екстракт_content метод:
Ви можете вилучити вміст між абзацами одного або іншого стилю, таких як між абзацами, позначеними стилями.
Код нижче показує, як досягти цього. Це простий приклад, який видобуває вміст між першим екземпляром стилів “Хайдінг 1” та “Хайдер 3” без вилучення заголовків. Для цього ми встановлюємо останній параметр до false, який визначає, що вузли маркера не повинні бути включені.
У правильному виконанні слід виконувати в петлі для вилучення вмісту між усіма пунктами цих стилів з документа. Вилучений вміст копіюється в новий документ.
Приклад наступного коду показує, як витягувати вміст між абзацами з певними стилями за допомогою екстракт_content метод:
Ви можете витягувати вміст між вузлами, такими як Run і Виконуються роботи з різних абзаців. Введіть номер мобільного, який Ви вказали при укладаннi договору з банком - для ідентифікації. Paragraph вузол.
Приклад наступного коду показує, як витягувати вміст між певними проходами одного абзацу за допомогою екстракт_content метод:
Для використання поля як маркер, FieldStart повинна бути передана вершина. Останній параметр до останнього параметра екстракт_content метод буде визначати, якщо вся поле повинна бути включена або ні. Додайте вміст поля злиття “Повний ім’я” та пункт у документі. Ми використовуємо DocumentBuilder.move_to_merge_field метод методу DocumentBuilder клас. Це повернеться FieldStart вершина з назви поля зливається до неї.
У нашому випадку ми встановимо останній параметр, який був переданий екстракт_content метод до False виключити поле з видобутку. Ми проведемо вилучення вмісту в PDF.
Приклад наступного коду показує, як витягувати вміст між певним полем та абзацом у документі з використанням екстракт_content метод:
У документі зміст, який визначається в межах закладки, акупсульований BookmarkStart і BookmarkEnd вершини. Зміст, знайдений між цими двома вузлами, складають закладку. Ви можете пройти або з цих вузлів, як будь-який маркер, навіть з різних зауважень, до тих пір, поки початковий маркер з’являється до закінчення маркеру в документі. Ми витягуємо цей вміст у новий документ, використовуючи код нижче. Про нас Інклюзив параметр показує, як зберігати або відкинути закладку.
Приклад наступного коду показує, як витягти вміст, довідкований закладок за допомогою закладки екстракт_content метод:
Коментар до проекту CommentRangeStart, CommentRangeEnd і Comment вершини. Всі ці вершини знаходяться в режимі онлайн. Перші два вузли захоплюють вміст у документі, який посилається коментарем, як показано на скріншоті нижче. Про нас Comment Сам вузол є InlineStory які можуть містити абзаци та пробіги. Це повідомлення про коментар, як видно як коментар бульбашки в оглядовому каструлі. Як це вершина інлайн і нащадок тіла ви також можете витягти вміст зсередини цього повідомлення.
Прокоментуйте заголовок, першу абзацу та таблицю у другому розділі. Додайте цей коментар у новий документ. Про нас Інклюзив варіант диктує, якщо сам коментар зберігається або відхилений.
Приклад наступного коду показує, як це зробити:
Способи отримання тексту з документа:
Р Документ Word може містити символи керування, які позначення спеціальних елементів, таких як поле, кінець комірки, кінець розділу тощо. Повний список можливих символів керування Word визначено в ControlChar клас. Про нас Node.get_text метод повертає текст з усіма символами керування, присутніми в вершині.
Дзвінки to_string повертає звичайне текстове представлення документа тільки без символів управління. Для отримання додаткової інформації про експорт як звичайний текст див. Використання SaveFormat.TEXTй
Приклад коду показує різницю між викликом get_text і to_string методи на вершині:
SaveFormat.TextЦей приклад зберігає документ наступним чином:
Приклад наступного коду показує, як зберегти документ у форматі TXT:
Ви можете вилучити зображення документів для виконання деяких завдань. Aspose.Words дозволяє зробити це і.
Приклад наступного коду показує, як витягти зображення з документа:
Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.