Документи
Порівняти документи – це процес, який визначає зміни між двома документами та містить зміни у вигляді джерел. Цей процес порівнює будь-які два документи, включаючи версії одного конкретного документа, після чого зміни між документами будуть показані як ревізії у першому документі.
Метод порівняння досягається шляхом порівняння слів на рівні символів або на рівні слово. Якщо слово містить зміну принаймні одного персонажа, в результаті різниця буде відображатися як зміна всього слова, а не символу. Цей процес порівняння є звичайним завданням в юридичній та фінансовій галузі.
Замість ручного пошуку відмінностей між документами або між різними версіями їх можна використовувати Aspose.Words для порівняння документів та отримання змін вмісту у форматі, заголовок/фут, таблиці тощо.
Ця стаття пояснює, як порівняти документи і як визначити розширені властивості порівняння.
Почати онлайн
Ви можете порівняти два документи онлайн, використовуючи Порівняння документів онлайн інструмент.
Зверніть увагу, що метод порівняння, описаний нижче, використовується в цьому інструменті для забезпечення отримання рівних результатів. Таким чином, ви отримаєте однакові результати навіть за допомогою інструменту порівняння онлайн або за допомогою методу порівняння Aspose.Wordsй
Обмеження та підтримка форматів файлів
Порівняти документи є дуже складною рисою. Розрізняються різні частини комбінації контенту, які потрібно аналізувати для розпізнавання всіх відмінностей. Причина такої складності обумовлена тим, що Aspose.Words мета, щоб отримати однакові результати порівняння, як Microsoft Word алгоритм порівняння.
Загальна обмеження для двох документів, що порівнюються, полягає в тому, що вони не повинні мати редакцій перед викликом методу порівняння, оскільки це обмеження існує в Microsoft Wordй
Порівняйте два документи
При порівнянні документів, відмінностей останнього документа від колишнього показаного доопрацювання. Коли ви зміните документ, кожен редагування буде мати власний ревізій після запуску методу порівняння.
Aspose.Words дозволяє визначити відмінності документів за допомогою compare метод – це схоже на Microsoft Word Функція порівняння документів. Ви можете перевірити документи або документи для пошуку відмінностей і змін, в тому числі форматування модифікацій, таких як зміни шрифтів, зміни стрибків, додавання слів і абзаців.
В результаті порівняння документів можна визначити як рівні, так і не рівні. Термін “equal” документів означає, що метод порівняння не здатний представляти зміни як ревізії. Це означає, що як текст документа, так і текстове форматування є однаковим. Але є інші відмінності між документами. Наприклад, Microsoft Word підтримує лише форматні версії для стилів, і ви не можете представляти вставку стилю / видалення. Отже, документи можуть мати різний набір стилів, і compare метод ще не виробляє ревізій.
Приклад коду показує, як перевірити, чи є два документи рівні або не:
# For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET | |
docA = aw.Document(docs_base.my_dir + "Document.docx") | |
docB = docA.clone().as_document() | |
# DocA now contains changes as revisions. | |
docA.compare(docB, "user", datetime.today()) | |
print("Documents are equal" if (docA.revisions.count == 0) else "Documents are not equal") |
Приклад наступного коду показує, як просто застосувати Compare
метод до двох документів:
# The source document doc1.
doc1 = aw.Document()
builder = aw.DocumentBuilder(doc1)
builder.writeln("This is the original document.")
# The target document doc2.
doc2 = aw.Document()
builder = aw.DocumentBuilder(doc2)
builder.writeln("This is the edited document.")
# If either document has a revision, an exception will be thrown.
if (doc1.revisions.count == 0 and doc2.revisions.count == 0) :
doc1.compare(doc2, "authorName", datetime.today())
# If doc1 and doc2 are different, doc1 now has some revisions after the comparison, which can now be viewed and processed.
self.assertEqual(2, doc1.revisions.count)
for r in doc1.revisions :
print(f"Revision type: {r.revision_type}, on a node of type \"{r.parent_node.node_type}\"")
print(f"\tChanged text: \"{r.parent_node.get_text()}\"")
# All the revisions in doc1 are differences between doc1 and doc2, so accepting them on doc1 transforms doc1 into doc2.
doc1.revisions.accept_all()
# doc1, when saved, now resembles doc2.
doc1.save(docs_base.artifacts_dir + "Document.Compare.docx")
doc1 = aw.Document(docs_base.artifacts_dir + "Document.Compare.docx")
self.assertEqual(0, doc1.revisions.count)
self.assertEqual(doc2.get_text().strip(), doc1.get_text().strip())
Вказати додаткові властивості порівняння
Є багато різних властивостей CompareOptions клас, який можна застосувати, коли потрібно порівнювати документи.
Наприклад, Aspose.Words дозволяє ігнорувати зміни, внесені під час операції порівняння за певними типами об’єктів в оригінальному документі. Ви можете вибрати відповідне майно для типу об’єкта, такі як ignore_headers_and_footers, ignore_formatting, ignore_comments, і інші, встановивши їх True
й
Додатково Aspose.Words забезпечує granularity майно, за допомогою якого можна вказати, чи слідкувати зміни за символом або словом.
Інша загальна властивість - це вибір, в якому документ, щоб показати зміни порівняння. Наприклад, діалогове вікно “Порівняти документи” Microsoft Word має опцію “Показати зміни” – це також впливає на результати порівняння. Aspose.Words забезпечує target властивість, яка служить цією метою.
Приклад коду показує, як встановити розширені властивості порівняння:
# For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET | |
docA = aw.Document(docs_base.my_dir + "Document.docx") | |
docB = docA.clone() | |
options = aw.comparing.CompareOptions() | |
options.ignore_formatting = True | |
options.ignore_headers_and_footers = True | |
options.ignore_case_changes = True | |
options.ignore_tables = True | |
options.ignore_fields = True | |
options.ignore_comments = True | |
options.ignore_textboxes = True | |
options.ignore_footnotes = True | |
docA.compare(docB, "user", datetime.today(), options) | |
print("Documents are equal" if (docA.revisions.count == 0) else "Documents are not equal") |