Oczyść dokument

Czasami może być konieczne usunięcie nieużywanych lub zduplikowanych informacji, aby zmniejszyć rozmiar dokumentu wyjściowego i czas przetwarzania.

Chociaż możesz znaleźć i usunąć nieużywane dane, takie jak style lub listy, lub ręcznie zduplikowane informacje, znacznie wygodniej będzie to zrobić, korzystając z funkcji i możliwości zapewnianych przez Aspose.Words.

Klasa CleanupOptions umożliwia określenie opcji czyszczenia dokumentów. Aby usunąć z dokumentu zduplikowane style lub po prostu nieużywane style lub listy, możesz użyć metody cleanup.

Usuń nieużywane informacje z dokumentu

Możesz użyć właściwości unused_styles i unused_builtin_styles, aby wykryć i usunąć style oznaczone jako “nieużywane”.

Za pomocą właściwości unused_lists można wykrywać i usuwać listy i definicje list oznaczone jako “nieużywane”.

Poniższy przykład kodu pokazuje, jak usunąć z dokumentu tylko nieużywane style:

# For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET
doc = aw.Document(docs_base.my_dir + "Unused styles.docx")
# Combined with the built-in styles, the document now has eight styles.
# A custom style is marked as "used" while there is any text within the document
# formatted in that style. This means that the 4 styles we added are currently unused.
print(f"Count of styles before Cleanup: {doc.styles.count}\n" +
f"Count of lists before Cleanup: {doc.lists.count}")
# Cleans unused styles and lists from the document depending on given CleanupOptions.
cleanupOptions = aw.CleanupOptions()
cleanupOptions.unused_lists = False
cleanupOptions.unused_styles = True
doc.cleanup(cleanupOptions)
print(f"Count of styles after Cleanup was decreased: {doc.styles.count}\n" +
f"Count of lists after Cleanup is the same: {doc.lists.count}")
doc.save(docs_base.artifacts_dir + "WorkingWithDocumentOptionsAndSettings.cleanup_unused_styles_and_lists.docx")

Usuń zduplikowane informacje z dokumentu

Możesz także użyć właściwości duplicate_style, aby zastąpić wszystkie zduplikowane style oryginalnym i usunąć duplikaty z dokumentu.

Poniższy przykład kodu pokazuje, jak usunąć zduplikowane style z dokumentu:

# For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET
doc = aw.Document(docs_base.my_dir + "Document.docx")
# Count of styles before Cleanup.
print(doc.styles.count)
# Cleans duplicate styles from the document.
options = aw.CleanupOptions()
options.duplicate_style = True
doc.cleanup(options)
# Count of styles after Cleanup was decreased.
print(doc.styles.count)
doc.save(docs_base.artifacts_dir + "WorkingWithDocumentOptionsAndSettings.cleanup_duplicate_style.docx")