Найти и заменить

Вы можете легко перемещаться по документу с помощью клавиатуры и мыши, но если вам нужно пролистать много страниц, поиск определенного текста в длинном документе займет довольно много времени. Если вы захотите заменить определенные символы или слова, которые вы использовали в документе, это займет больше времени. Функция “Найти и заменить” позволяет вам найти последовательность символов в документе и заменить ее другой последовательностью символов.

Aspose.Words позволяет найти в документе определенную строку или шаблон регулярного выражения и заменить его альтернативным вариантом без установки и использования дополнительных приложений, таких как Microsoft Word. Это ускорит выполнение многих задач по набору текста и форматированию, что потенциально сэкономит вам часы работы.

В этой статье объясняется, как применять замену строк и регулярные выражения с поддержкой метасимволов.

Способы поиска и замены

Aspose.Words предоставляет два способа применить операцию поиска и замены, используя следующие:

  1. Simple string replacement – чтобы найти и заменить определенную строку на другую, вам необходимо указать строку поиска (буквенно-цифровые символы), которая будет заменена в соответствии со всеми появлениями другой указанной заменяющей строкой. Обе строки не должны содержать символов. Примите во внимание, что сравнение строк может быть чувствительным к регистру, или вы можете быть не уверены в правильности написания, или у вас может быть несколько похожих вариантов написания.
  2. Regular expressions – чтобы задать регулярное выражение для поиска точных совпадений строк и замены их в соответствии с вашим регулярным выражением. Обратите внимание, что слово определяется как состоящее только из буквенно-цифровых символов. Если при замене совпадают только целые слова, а входная строка содержит символы, то фразы найдены не будут.

Кроме того, вы можете использовать специальные метасимволы с простой заменой строк и регулярные выражения для указания разрывов в рамках операции поиска и замены.

В Aspose.Words функция поиска и замены представлена в виде IReplacingCallBack. В процессе поиска и замены вы можете работать со многими параметрами, используя класс FindReplaceOptions.

Найдите и замените текст с помощью простой замены строки

Вы можете использовать один из методов Replace, чтобы найти или заменить определенную строку и вернуть количество выполненных замен. В этом случае вы можете указать строку, подлежащую замене, строку, которая заменит все свои вхождения, будет ли замена чувствительна к регистру и будут ли затронуты только отдельные слова.

В следующем примере кода показано, как найти строку “CustomerName” и заменить ее строкой “James Bond”:

Вы можете заметить разницу между документами, прежде чем применять простую замену строк:

before-simple-string-replacement-aspose-words-java

И после применения простой замены строки:

after-simple-string-replacement-aspose-words-java

Поиск и замена текста с помощью регулярных выражений

Регулярное выражение (regex) - это шаблон, который описывает определенную последовательность текста. Предположим, вы хотите заменить все двойные вхождения слова одним вхождением слова. Затем вы можете применить следующее регулярное выражение для указания шаблона из двух слов: ([a-zA-Z]+) \1.

Используйте другой метод Replace для поиска и замены определенных комбинаций символов, установив параметр Regex в качестве шаблона регулярного выражения для поиска совпадений.

В следующем примере кода показано, как заменить строки, соответствующие шаблону регулярного выражения, указанной заменяющей строкой:

Вы можете заметить разницу между документами, прежде чем применять замену строк регулярными выражениями:

before-replacement-with-regular-expressions-aspose-words-java

И после применения замены строк регулярными выражениями:

after-replacement-with-regular-expressions-aspose-words-java

Найдите и замените строку с помощью метасимволов

Вы можете использовать метасимволы в строке поиска или в строке замены, если определенный текст или фраза состоят из нескольких абзацев, разделов или страниц. Некоторые из метасимволов включают &p для обозначения разрыва абзаца, &b для обозначения разрыва раздела, &m для обозначения разрыва страницы и &l для обозначения разрыва строки.

В следующем примере кода показано, как заменить текст абзацем и разрывом страницы:

Вы можете найти и заменить текст в верхнем и нижнем колонтитулах документа Word, используя класс HeaderFooter.

В следующем примере кода показано, как заменить текст раздела заголовка в вашем документе:

Вы можете заметить разницу между документами до применения замены строки заголовка:

before-applying-header-string-replacement-aspose-words-java

И после применения замены строки заголовка:

after-applying-header-string-replacement-aspose-words-java

Пример кода для замены текста нижнего колонтитула в вашем документе очень похож на предыдущий пример кода верхнего колонтитула. Все, что вам нужно сделать, это заменить следующие две строки:

HeaderFooter header = headersFooters.get(HeaderFooterType.HEADER_PRIMARY);
header.getRange().replace("Aspose.Words", "Remove", options);

Со следующим:

Вы можете заметить разницу между документами до того, как примените замену строки нижнего колонтитула:

before-applying-footer-string-replacement-aspose-words-java

И после применения замены строки нижнего колонтитула:

after-applying-footer-string-replacement-aspose-words-java

Игнорировать текст во время поиска и замены

Применяя операцию поиска и замены, вы можете игнорировать определенные фрагменты текста. Таким образом, определенные части текста могут быть исключены из поиска, а поиск и замена могут быть применены только к оставшимся частям.

Aspose.Words предоставляет множество свойств поиска и замены для игнорирования текста, таких как IgnoreDeleted, IgnoreFieldCodes, IgnoreFields, IgnoreFootnotes, и IgnoreInserted.

В следующем примере кода показано, как игнорировать текст внутри изменений удаления:

Настройка операции поиска и замены

Aspose.Words предоставляет множество различных properties способов поиска и замены текста, таких как применение определенного формата со свойствами ApplyFont и ApplyParagraphFormats, использование подстановок в шаблонах замены со свойством UseSubstitutions и другие.

В следующем примере кода показано, как выделить определенное слово в вашем документе:

Aspose.Words позволяет использовать интерфейс IReplacingCallback для создания и вызова пользовательского метода во время операции замены. У вас могут быть некоторые варианты использования, когда вам нужно настроить операцию поиска и замены, например, заменить текст, указанный в регулярном выражении, тегами HTML, поэтому в основном вы будете применять замену с помощью вставки HTML.

Если вам нужно заменить строку тегом HTML, примените интерфейс IReplacingCallback, чтобы настроить операцию поиска и замены таким образом, чтобы сопоставление начиналось в начале выполнения с узла сопоставления вашего документа. Приведем несколько примеров использования IReplacingCallback.

В следующем примере кода показано, как заменить текст, указанный на HTML:

В следующем примере кода показано, как выделить положительные числа зеленым цветом, а отрицательные - красным:

В следующем примере кода показано, как добавлять номер строки перед каждой строкой: