ドキュメントをクリーンアップする

出力ドキュメントのサイズと処理時間を削減するために、未使用または重複した情報を削除する必要がある場合があります。

スタイルやリストなどの未使用のデータや重複した情報を手動で検索して削除することもできますが、Aspose.Words が提供する機能を使用してこれを行う方がはるかに便利です。

CleanupOptions クラスを使用すると、ドキュメント クリーニングのオプションを指定できます。重複したスタイル、または未使用のスタイルやリストのみをドキュメントから削除するには、cleanup メソッドを使用します。

ドキュメントから未使用の情報を削除する

unused_styles プロパティと unused_builtin_styles プロパティを使用すると、「未使用」としてマークされたスタイルを検出して削除できます。

unused_lists プロパティを使用すると、「未使用」としてマークされているリストおよびリスト定義を検出して削除できます。

次のコード例は、ドキュメントから未使用のスタイルのみを削除する方法を示しています。

# For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET
doc = aw.Document(docs_base.my_dir + "Unused styles.docx")
# Combined with the built-in styles, the document now has eight styles.
# A custom style is marked as "used" while there is any text within the document
# formatted in that style. This means that the 4 styles we added are currently unused.
print(f"Count of styles before Cleanup: {doc.styles.count}\n" +
f"Count of lists before Cleanup: {doc.lists.count}")
# Cleans unused styles and lists from the document depending on given CleanupOptions.
cleanupOptions = aw.CleanupOptions()
cleanupOptions.unused_lists = False
cleanupOptions.unused_styles = True
doc.cleanup(cleanupOptions)
print(f"Count of styles after Cleanup was decreased: {doc.styles.count}\n" +
f"Count of lists after Cleanup is the same: {doc.lists.count}")
doc.save(docs_base.artifacts_dir + "WorkingWithDocumentOptionsAndSettings.cleanup_unused_styles_and_lists.docx")

文書から重複情報を削除する

duplicate_style プロパティを使用して、重複するすべてのスタイルを元のスタイルに置き換えたり、ドキュメントから重複を削除したりすることもできます。

次のコード例は、ドキュメントから重複したスタイルを削除する方法を示しています。

# For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Python-via-.NET
doc = aw.Document(docs_base.my_dir + "Document.docx")
# Count of styles before Cleanup.
print(doc.styles.count)
# Cleans duplicate styles from the document.
options = aw.CleanupOptions()
options.duplicate_style = True
doc.cleanup(options)
# Count of styles after Cleanup was decreased.
print(doc.styles.count)
doc.save(docs_base.artifacts_dir + "WorkingWithDocumentOptionsAndSettings.cleanup_duplicate_style.docx")