ファイル形式と変換

さまざまなドキュメント形式を迅速かつ確実に高精度に変換する機能は、Aspose.Words の主力機能です。多くの場合、これは Python via .NET に Aspose.Words を選択する十分な理由になります。

Aspose.Words を使用すると、わずか 2 行のコードを使用して、ドキュメントをサポートされている読み込み形式からサポートされている保存形式に変換できます。

  1. ファイルまたはストリームからドキュメントをロードする
  2. サポートされている形式で保存します

次のコード例は、ドキュメントを変換する方法を示しています。

ドキュメントのロード、変換、保存の詳細については、「ロード、保存、変換」セクションを参照してください。

高忠実度

Aspose.Words の主な目標の 1 つは、ドキュメント形式間の高忠実度の変換を提供することです。 「高忠実度」という言葉は、出力ドキュメントが元のコンテンツとフォーマットをすべて保持する変換を表すために使用されます。

最新のワープロ文書形式は複雑で、何百もの機能が含まれています。場合によっては、ベンダーが自社のソリューションが特定のドキュメント形式をサポートしていると主張する場合、それは形式の基本機能のみがサポートされていることを意味します。たとえば、Microsoft Word ドキュメントには、脚注、テキスト ボックス、オートシェイプ、OLE オブジェクト、フィールド、高度な書式設定属性などの高度な機能があります。これらの要素の多くは、文書処理ライブラリでは無視されることがよくありますが、Aspose.Words では無視されません。

フォーマットサポートの拡大

Aspose.Words の明白な利点は、ほとんどのよく知られた形式を広範囲にサポートしていることです。他の場所で多くの重要な機能に対する同じレベルのサポートを見つけるのは困難または不可能です。

特定の形式をサポートするソリューションを購入する場合は、この形式の機能がどのレベルでサポートされているかを確認してください。テストするには、複雑なファイルを作成し、提案されたソリューションを通じて実行します。多くの文書要素や書式設定が失われることがよくあります。たとえば、DOC 形式の場合、図形、テキストボックス、フィールド、列、OLE オブジェクト、リビジョン、右から左へ記述するテキストが通常影響を受けます。

Aspose.Words Document Object Model (DOM) は、Microsoft Word ドキュメント形式を念頭に置いて設計されました。したがって、DOC、DOCX、RTF、WordprocessingML などの形式に対するサポートのレベルは前例のないものとなっています。これらの形式間のあらゆる方向の変換は高忠実度で行われます。

Aspose.Words を介して複雑なドキュメントを実行する場合、フォーマット実装の比類のない完全性をお楽しみください。

一般的な形式間の変換例

以下は、いくつかの一般的な形式間の変換の例です。 Aspose.Words がタスクにどの程度正確に対処するかを評価できます。


DOC から RTF へ – 高忠実度の変換:

doc-to-rtf-aspose-words-net-1doc-to-rtf-aspose-words-net-2


DOC から PDF – 高忠実度の変換:

doc-to-pdf-aspose-words-net-1doc-to-pdf-aspose-words-net-2

doc-to-pdf-aspose-words-net-3doc-to-pdf-aspose-words-net-4


DOC から ODT – 高忠実度の変換:

doc-to-odt-aspose-words-net-1doc-to-odt-aspose-words-net-2


DOC から XPS – 高忠実度の変換:

doc-to-xps-aspose-words-net-1doc-to-xps-aspose-words-net-2


DOC から PostScript へ – 高忠実度の変換:

doc-to-postscript-aspose-words-net-1doc-to-postscript-aspose-words-net-2


DOC から JPEG へ – 高忠実度の変換:

doc-to-jpeg-aspose-words-net-1

DOC から GIF – 高忠実度の変換:

doc-to-gif-aspose-words-net-1

RTF から TXT – 高忠実度の変換:

rtf-to-txt-aspose-words-net-1rtf-to-txt-aspose-words-net-2


Aspose.Words のコンバータはすべて優れていますが、異なる形式のドキュメントでは同じ外観を得ることができない場合があります。

たとえば、HTML ドキュメントと Microsoft Word ドキュメントのすべての機能を単純に 1 対 1 で一致させることはできません。 HTML にはヘッダー/フッター、セクション、フィールド、タブはありません。逆に、すべての CSS 属性とルールを Microsoft Word ドキュメントにマッピングできるわけではありません。

以下は DOC から HTML への変換の例です。


DOC から HTML – 高忠実度の変換:

doc-to-html-aspose-words-net-1doc-to-html-aspose-words-net-2

doc-to-html-aspose-words-net-3doc-to-html-aspose-words-net-4


高い拡張性

スケーラブルなサーバー側シナリオでは、主にそのシンプルでクリーンな設計のために Aspose.Words が使用されます。Aspose.Words はマルチスレッドをサポートしています。 Document オブジェクトは互いに独立しており、一度に 1 つのスレッドのみがドキュメントを変更できる限り (コレクション クラスの一般的な要件)、複数のスレッドで任意の数のドキュメントを同時に処理できます。

ハイパフォーマンス

Aspose.Wordsはドキュメントの読み込みや保存時に高いパフォーマンスを発揮します。テストでは、P4 3GHz マシンでは、サイズが 5Mb を超える DOC ファイルが 1 秒未満でロードされ、1 秒未満で保存されました。小さいファイルは毎分数千の速度で処理できます。

何度かお客様から、Aspose.Words の速度が信じられないという報告を受けました。彼らは、巨大なドキュメントをデバッガにロードするコード行をまたいで実行しましたが、その作業は非常に瞬時で、ファイルが Document オブジェクトにロードされたことが信じられないほどでした。