So sánh tài liệu

So sánh tài liệu là một quy trình xác định sự thay đổi giữa hai tài liệu và chứa đựng những thay đổi đó dưới dạng sửa đổi. Quá trình này so sánh bất kỳ hai tài liệu nào, bao gồm cả các phiên bản của một tài liệu cụ thể, sau đó sự thay đổi giữa cả hai tài liệu sẽ được hiển thị như những sửa đổi trong tài liệu đầu tiên.

Phương pháp so sánh đạt được bằng cách so sánh các từ ở mức ký tự hoặc ở mức từ. Nếu một từ chứa sự thay đổi ít nhất một ký tự, trong kết quả, sự khác biệt sẽ được hiển thị là sự thay đổi của toàn bộ từ, không phải một ký tự. Quá trình so sánh đó là một công việc thông thường trong ngành pháp lý và tài chính.

Thay vì tìm kiếm bằng tay sự khác biệt giữa các tài liệu hoặc giữa các phiên bản của chúng, bạn có thể sử dụng Aspose.Words để so sánh các tài liệu và nhận được thay đổi nội dung trong định dạng, tiêu đề/ chân trang, bảng và nhiều hơn nữa.

Bài viết này giải thích cách so sánh các tài liệu và cách xác định các thuộc tính so sánh nâng cao.

Hạn chế và Định dạng Tập tin Hỗ trợ

So sánh tài liệu là một tính năng rất phức tạp. Có nhiều phần khác nhau của kết hợp nội dung cần được phân tích để nhận ra tất cả những khác biệt. Lý do cho sự phức tạp này là bởi Aspose.Words nhằm mục đích có cùng kết quả so sánh với thuật toán so sánh Microsoft Word.

Hạn chế chung cho hai tài liệu được so sánh là chúng không thể có các sửa đổi trước khi gọi phương thức so sánh, hạn chế này tồn tại trong Microsoft Word.

So sánh Hai Tài liệu

Khi so sánh các tài liệu thì sự khác nhau của tài liệu sau với tài liệu trước được thể hiện dưới dạng sửa đổi cho tài liệu trước đó. Khi bạn sửa đổi một tài liệu, mỗi chỉnh sửa sẽ có phiên bản riêng sau khi chạy phương pháp so sánh.

Aspose.Words cho phép bạn xác định sự khác biệt của tài liệu bằng phương pháp Compare – điều này tương tự như tính năng so sánh tài liệu Microsoft Word. Nó cho phép bạn kiểm tra các tài liệu hoặc phiên bản tài liệu để tìm sự khác nhau và thay đổi, bao gồm những thay đổi định dạng như thay đổi phông chữ, khoảng cách thay đổi, thêm từ và đoạn.

Sau khi so sánh, các tài liệu có thể được xác định là bằng nhau hay không bằng nhau. Các tài liệu “bằng nhau” có nghĩa là phương pháp so sánh không thể biểu diễn những thay đổi như là sửa đổi. Điều này có nghĩa là cả văn bản tài liệu và định dạng văn bản đều giống nhau. Nhưng có thể có những khác biệt khác giữa các tài liệu. Ví dụ, Microsoft Word chỉ hỗ trợ phiên bản định dạng cho kiểu, và bạn không thể đại diện cho việc chèn/xóa kiểu. Vì vậy các tài liệu có thể có một bộ kiểu khác nhau và phương pháp Compare vẫn tạo ra không có bản sửa đổi.

Ví dụ sau cho thấy cách kiểm tra hai tài liệu có bằng nhau hay không

Mã ví dụ sau cho thấy cách áp dụng phương pháp Compare vào hai tài liệu đơn giản:

Chỉ định Tùy chọn so sánh nâng cao

Có rất nhiều thuộc tính khác nhau của lớp CompareOptions mà bạn có thể áp dụng khi bạn muốn so sánh các tài liệu.

Ví dụ như Aspose.Words cho phép bạn bỏ qua những thay đổi được thực hiện trong một hoạt động so sánh đối với một số loại đối tượng nhất định bên trong tài liệu gốc. Bạn có thể chọn thuộc tính phù hợp cho kiểu đối tượng, chẳng hạn như IgnoreHeadersAndFooters, IgnoreFormatting, IgnoreComments, và những cái khác bằng cách đặt chúng thành “true”.

Ngoài ra, Aspose.Words cung cấp thuộc tính Granularity mà bạn có thể chỉ định để theo dõi thay đổi bằng ký tự hay từ.

Một thuộc tính khác là lựa chọn tài liệu nào để hiển thị những thay đổi so sánh. Ví dụ, hộp thoại “So sánh tài liệu” trong Microsoft Word có tùy chọn “Hiển thị thay đổi trong” - điều này cũng ảnh hưởng đến kết quả so sánh. Aspose.Words cung cấp thuộc tính Target để đáp ứng mục đích này.

Mã ví dụ sau cho thấy cách đặt các thuộc tính so sánh nâng cao: