Tìm và thay thế

Bạn có thể dễ dàng điều hướng trong tài liệu của mình bằng bàn phím và chuột, nhưng nếu bạn có nhiều trang để cuộn qua, sẽ mất khá nhiều thời gian để tìm thấy văn bản cụ thể trong một tài liệu dài. Sẽ tốn nhiều thời gian hơn khi bạn muốn thay thế một số ký tự hoặc từ nào đó mà bạn đã sử dụng trong tài liệu của mình. Chức năng “Tìm và thay thế” cho phép bạn tìm một chuỗi ký tự trong tài liệu và thay thế nó bằng một chuỗi ký tự khác.

Aspose.Words cho phép bạn tìm một chuỗi hoặc mẫu biểu thức chính quy cụ thể trong tài liệu của mình và thay thế nó bằng một chuỗi thay thế mà không cần cài đặt và sử dụng các ứng dụng bổ sung như Microsoft Word. Điều này sẽ tăng tốc nhiều tác vụ đánh máy và định dạng, có khả năng giúp bạn tiết kiệm hàng giờ làm việc.

Bài viết này giải thích cách áp dụng thay thế chuỗi và biểu thức chính quy với sự hỗ trợ của siêu ký tự.

Các cách tìm và thay thế

Aspose.Words cung cấp hai cách để áp dụng thao tác tìm và thay thế bằng cách sử dụng như sau:

  1. Thay thế chuỗi đơn giản – để tìm và thay thế một chuỗi cụ thể bằng một chuỗi khác, bạn cần chỉ định chuỗi tìm kiếm (ký tự chữ và số) sẽ được thay thế theo tất cả các lần xuất hiện bằng một chuỗi thay thế được chỉ định khác. Cả hai chuỗi không được chứa ký hiệu. Hãy lưu ý rằng so sánh chuỗi có thể phân biệt chữ hoa chữ thường hoặc bạn có thể không chắc chắn về chính tả hoặc có một số cách viết tương tự.
  2. Biểu thức chính quy – để chỉ định một biểu thức chính quy nhằm tìm chuỗi khớp chính xác và thay thế chúng theo biểu thức chính quy của bạn. Lưu ý rằng một từ được định nghĩa là chỉ được tạo thành từ các ký tự chữ và số. Nếu việc thay thế được thực hiện chỉ với toàn bộ các từ được khớp và chuỗi đầu vào chứa các ký hiệu thì sẽ không tìm thấy cụm từ nào.

Ngoài ra, bạn có thể sử dụng các siêu ký tự đặc biệt với tính năng thay thế chuỗi đơn giản và các biểu thức thông thường để chỉ định dấu ngắt trong thao tác tìm và thay thế.

Aspose.Words trình bày chức năng tìm và thay thế bằng không gian tên Aspose.Words.Replacing. Bạn có thể làm việc với nhiều tùy chọn trong quá trình tìm và thay thế bằng cách sử dụng lớp FindReplaceOptions.

Tìm và thay thế văn bản bằng cách thay thế chuỗi đơn giản

Bạn có thể sử dụng một trong các phương thức Replace để tìm hoặc thay thế một chuỗi cụ thể và trả về số lần thay thế đã được thực hiện. Trong trường hợp này, bạn có thể chỉ định một chuỗi cần thay thế, một chuỗi sẽ thay thế tất cả các lần xuất hiện của nó, liệu việc thay thế có phân biệt chữ hoa chữ thường hay không và liệu chỉ các từ độc lập sẽ bị ảnh hưởng hay không.

Ví dụ về mã sau đây cho thấy cách tìm chuỗi “CustomerName” và thay thế nó bằng chuỗi “James Bond”:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
// Load a Word Docx document by creating an instance of the Document class.
Document doc = new Document();
DocumentBuilder builder = new DocumentBuilder(doc);
builder.Writeln("Hello _CustomerName_,");
// Specify the search string and replace string using the Replace method.
doc.Range.Replace("_CustomerName_", "James Bond", new FindReplaceOptions());
// Save the result.
doc.Save(dataDir + "Range.ReplaceSimple.docx");

Bạn có thể nhận thấy sự khác biệt giữa tài liệu trước khi áp dụng thay thế chuỗi đơn giản:

trước khi thay thế chuỗi đơn giản

Và sau khi áp dụng thay thế chuỗi đơn giản:

sau khi thay thế chuỗi đơn giản

Tìm và thay thế văn bản bằng biểu thức chính quy

Biểu thức chính quy (regex) là một mẫu mô tả một chuỗi văn bản nhất định. Giả sử bạn muốn thay thế tất cả các lần xuất hiện kép của một từ bằng một lần xuất hiện của một từ. Sau đó, bạn có thể áp dụng biểu thức chính quy sau để chỉ định mẫu từ kép: ([a-zA-Z]+) \1.

Sử dụng phương pháp Replace khác để tìm kiếm và thay thế các tổ hợp ký tự cụ thể bằng cách đặt tham số Regex làm mẫu biểu thức chính quy để tìm kết quả khớp.

Ví dụ về mã sau đây cho thấy cách thay thế các chuỗi khớp với mẫu biểu thức chính quy bằng chuỗi thay thế được chỉ định:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc = new Document();
DocumentBuilder builder = new DocumentBuilder(doc);
builder.Writeln("sad mad bad");
Assert.AreEqual("sad mad bad", doc.GetText().Trim());
// Replaces all occurrences of the words "sad" or "mad" to "bad".
doc.Range.Replace(new Regex("[s|m]ad"), "bad");
// Save the Word document.

Bạn có thể nhận thấy sự khác biệt giữa tài liệu trước khi áp dụng thay thế chuỗi bằng biểu thức chính quy:

before-thay thế-với biểu thức chính

Và sau khi áp dụng thay thế chuỗi bằng biểu thức chính quy:

sau khi thay thế bằng biểu thức chính

Tìm và thay thế chuỗi bằng siêu ký tự

Bạn có thể sử dụng siêu ký tự trong chuỗi tìm kiếm hoặc chuỗi thay thế nếu một văn bản hoặc cụm từ cụ thể bao gồm nhiều đoạn văn, phần hoặc trang. Một số siêu ký tự bao gồm &P cho dấu ngắt đoạn, &b cho dấu ngắt phần, &m cho dấu ngắt trang và &l cho dấu ngắt dòng.

Ví dụ mã sau đây cho biết cách thay thế văn bản bằng ngắt đoạn và ngắt trang:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc = new Document();
DocumentBuilder builder = new DocumentBuilder(doc);
builder.Font.Name = "Arial";
builder.Writeln("First section");
builder.Writeln(" 1st paragraph");
builder.Writeln(" 2nd paragraph");
builder.Writeln("Second section");
builder.Writeln(" 1st paragraph");
FindReplaceOptions options = new FindReplaceOptions();
options.ApplyParagraphFormat.Alignment = ParagraphAlignment.Center;
// Double each paragraph break after word "section", add kind of underline and make it centered.
int count = doc.Range.Replace("section&p", "section&p----------------------&p", options);
// Insert section break instead of custom text tag.
count = doc.Range.Replace("{insert-section}", "&b", options);
dataDir = dataDir + "ReplaceTextContaingMetaCharacters_out.docx";

Bạn có thể tìm và thay thế văn bản trong phần đầu trang/chân trang của tài liệu Word bằng lớp HeaderFooter.

Ví dụ về mã sau đây cho biết cách thay thế văn bản của phần tiêu đề trong tài liệu của bạn:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
// Open the template document, containing obsolete copyright information in the footer.
Document doc = new Document(dataDir + "HeaderFooter.ReplaceText.doc");
// Access header of the Word document.
HeaderFooterCollection headersFooters = doc.FirstSection.HeadersFooters;
HeaderFooter header = headersFooters[HeaderFooterType.HeaderPrimary];
// Set options.
FindReplaceOptions options = new FindReplaceOptions
MatchCase = false,
FindWholeWordsOnly = false
// Replace text in the header of the Word document.
header.Range.Replace("Aspose.Words", "Remove", options);
// Save the Word document.
doc.Save(dataDir + "HeaderReplace.docx");

Bạn có thể nhận thấy sự khác biệt giữa tài liệu trước khi áp dụng thay thế chuỗi tiêu đề:

trước khi áp dụng-tiêu đề-chuỗi-thay thế

Và sau khi áp dụng thay thế chuỗi tiêu đề:

sau khi áp dụng-tiêu đề-chuỗi-thay thế

Ví dụ về mã để thay thế văn bản của phần chân trang trong tài liệu của bạn rất giống với ví dụ về mã tiêu đề trước đó. Tất cả những gì bạn cần làm là thay thế hai dòng sau:

HeaderFooter header = headersFooters[HeaderFooterType.HeaderPrimary];
header.Range.Replace("Aspose.Words", "Remove", options);

Với những điều sau đây:

HeaderFooter footer = headersFooters[HeaderFooterType.FooterPrimary];
int currentYear = System.DateTime.Now.Year;
footer.Range.Replace("(C) 2006 Aspose Pty Ltd.", $"Copyright (C) {currentYear} by Aspose Pty Ltd.", options);

Bạn có thể nhận thấy sự khác biệt giữa tài liệu trước khi áp dụng thay thế chuỗi chân trang:

trước khi áp dụng-chân-chuỗi-thay thế

Và sau khi áp dụng thay thế chuỗi chân trang:

sau khi áp dụng-chân-chuỗi-thay thế

Bỏ qua văn bản trong khi tìm và thay thế

Trong khi áp dụng thao tác tìm và thay thế, bạn có thể bỏ qua một số đoạn văn bản nhất định. Vì vậy, một số phần nhất định của văn bản có thể bị loại khỏi tìm kiếm và tính năng tìm và thay thế chỉ có thể được áp dụng cho các phần còn lại.

Aspose.Words cung cấp nhiều thuộc tính tìm và thay thế để bỏ qua văn bản như IgnoreDeleted, IgnoreFieldCodes, IgnoreFields, IgnoreFootnotesIgnoreInserted.

Ví dụ mã sau đây cho thấy cách bỏ qua văn bản bên trong các bản sửa đổi xóa:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
Document doc = new Document();
DocumentBuilder builder = new DocumentBuilder(doc);
// Insert non-revised text.
// Remove first paragraph with tracking revisions.
doc.StartTrackRevisions("John Doe", DateTime.Now);
Regex regex = new Regex("e");
FindReplaceOptions options = new FindReplaceOptions();
// Replace 'e' in document while ignoring deleted text.
options.IgnoreDeleted = true;
doc.Range.Replace(regex, "*", options);
Assert.AreEqual(doc.GetText().Trim(), "Deleted\rT*xt");
// Replace 'e' in document while not ignoring deleted text.
options.IgnoreDeleted = false;
doc.Range.Replace(regex, "*", options);

Tùy chỉnh thao tác Tìm và Thay thế

Aspose.Words cung cấp nhiều properties khác nhau để tìm và thay thế văn bản, chẳng hạn như áp dụng định dạng cụ thể với các thuộc tính ApplyFontApplyParagraphFormats, sử dụng các thay thế trong các mẫu thay thế bằng thuộc tính UseSubstitutions và các thuộc tính khác.

Ví dụ về mã sau đây cho biết cách đánh dấu một từ cụ thể trong tài liệu của bạn:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
// Highlight word "the" with yellow color.
FindReplaceOptions options = new FindReplaceOptions();
options.ApplyFont.HighlightColor = Color.Yellow;
// Replace highlighted text.
doc.Range.Replace("Hello", "Hello", options);

Aspose.Words cho phép bạn sử dụng giao diện IReplacingCallback để tạo và gọi một phương thức tùy chỉnh trong quá trình thay thế. Bạn có thể gặp một số trường hợp sử dụng cần tùy chỉnh thao tác tìm và thay thế, chẳng hạn như thay thế văn bản được chỉ định bằng biểu thức chính quy bằng thẻ HTML, vì vậy về cơ bản bạn sẽ áp dụng thay thế bằng cách chèn HTML.

Nếu bạn cần thay thế một chuỗi bằng thẻ HTML, hãy áp dụng giao diện IReplacingCallback để tùy chỉnh thao tác tìm và thay thế để việc khớp bắt đầu khi bắt đầu chạy với nút khớp trong tài liệu của bạn. Hãy để chúng tôi cung cấp một số ví dụ về việc sử dụng IReplacingCallback.

Ví dụ mã sau đây cho thấy cách thay thế văn bản được chỉ định bằng HTML:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
public static void ReplaceWithHtml(string dataDir)
Document doc = new Document();
DocumentBuilder builder = new DocumentBuilder(doc);
builder.Writeln("Hello <CustomerName>,");
FindReplaceOptions options = new FindReplaceOptions();
options.ReplacingCallback = new ReplaceWithHtmlEvaluator(options);
doc.Range.Replace(new Regex(@" <CustomerName>,"), String.Empty, options);
// Save the modified document.
doc.Save(dataDir + "Range.ReplaceWithInsertHtml.doc");
private class ReplaceWithHtmlEvaluator : IReplacingCallback
internal ReplaceWithHtmlEvaluator(FindReplaceOptions options)
mOptions = options;
//This simplistic method will only work well when the match starts at the beginning of a run.
ReplaceAction IReplacingCallback.Replacing(ReplacingArgs args)
DocumentBuilder builder = new DocumentBuilder((Document)args.MatchNode.Document);
// Replace '<CustomerName>' text with a red bold name.
builder.InsertHtml("<b><font color='red'>James Bond, </font></b>"); args.Replacement = "";
return ReplaceAction.Replace;
private readonly FindReplaceOptions mOptions;

Ví dụ mã sau đây cho thấy cách đánh dấu số dương bằng màu xanh lá cây và số âm bằng màu đỏ:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
// Replace and Highlight Numbers.
internal class NumberHighlightCallback : IReplacingCallback
public NumberHighlightCallback(FindReplaceOptions opt)
mOpt = opt;
public ReplaceAction Replacing(ReplacingArgs args)
// Let replacement to be the same text.
args.Replacement = args.Match.Value;
int val = int.Parse(args.Match.Value);
// Apply either red or green color depending on the number value sign.
mOpt.ApplyFont.Color = (val > 0)
? Color.Green
: Color.Red;
return ReplaceAction.Replace;
private readonly FindReplaceOptions mOpt;

Ví dụ mã sau đây cho thấy cách thêm số dòng vào mỗi dòng:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-.NET
public void LineCounter()
// Create a document.
Document doc = new Document();
DocumentBuilder builder = new DocumentBuilder(doc);
// Add lines of text.
builder.Writeln("This is first line");
builder.Writeln("Second line");
builder.Writeln("And last line");
// Prepend each line with line number.
FindReplaceOptions opt = new FindReplaceOptions() { ReplacingCallback = new LineCounterCallback() };
doc.Range.Replace(new Regex("[^&p]*&p"), "", opt);
internal class LineCounterCallback : IReplacingCallback
public ReplaceAction Replacing(ReplacingArgs args)
args.Replacement = string.Format("{0} {1}", mCounter++, args.Match.Value);
return ReplaceAction.Replace;
private int mCounter = 1;