ファイル形式と変換

迅速かつ確実に精度の高い様々な文書フォーマットを変換する機能は、Aspose.Wordsの主力機能です。 多くの場合、これはJavaに対してAspose.Wordsを選択するのに十分な理由です。

Aspose.Wordsを使用すると、サポートされている任意のロード形式からサポートされている任意の保存形式にドキュメントを変換できます。:

  1. ファイルまたはストリームからドキュメントを読み込む
  2. サポートされている任意の形式に保存します

次のコード例は、ドキュメントを変換する方法を示しています:

ドキュメントの読み込み、変換、および保存の詳細については、次を参照してください 読み込み、保存、変換 セクション。

高忠実度

Aspose.Wordsの主な目的の1つは、ドキュメント形式間で高忠実度の変換を提供することです。 私たちは、出力文書が元のすべてのコンテンツと書式を保持する変換を記述するために、“高忠実度"という言葉を使用します。

現代のワープロ文書フォーマットは複雑で、何百もの機能が含まれています。 ベンダーがソリューションが特定のドキュメント形式をサポートしていると主張する場合、その形式の基本的な機能のみがサポートされていることを意味することがあります。 たとえば、Microsoft Wordドキュメントには、脚注、テキストボックス、自動図形、OLEオブジェクト、フィールド、高度な書式設定属性などの高度な機能があります。 これらの要素の多くは、ドキュメント処理ライブラリでは無視されることがよくありますが、Aspose.Wordsでは無視されます。

フォーマットのサポートのより大きい範囲

Aspose.Wordsの議論の余地のない利点は、よく知られている形式のほとんどのサポートの範囲が広いことです。 他の場所で多くの重要な機能に対して同じレベルのサポートを見つけることは困難または不可能です。

特定の形式をサポートするソリューションを購入するときは、この形式の機能がサポートされているレベルについて確認してください。 テストするには、複雑なファイルを作成し、提案されたソリューションを実行します。 多くの場合、多くのドキュメント要素と書式設定が失われることがあります。 たとえば、DOC形式では、図形、テキストボックス、フィールド、列、OLEオブジェクト、リビジョン、右から左へのテキストが通常使用されます。

Aspose.Wordsドキュメントオブジェクトモデル(DOM)はMicrosoft Wordドキュメント形式を念頭に置いて設計されました。 したがって、次のようなこれらの形式のサポートのレベルは、次のようになります。DOC, DOCX, RTF, またはWordprocessingMLは前例のないものです。 これらのフォーマット間の任意の方向への変換は、忠実度が高いです。

Aspose.Wordsを介して複雑な文書を実行する場合は、書式の実装の比類のない完全性をお楽しみください。

一般的な形式間の変換例

以下は、いくつかの一般的な形式間の変換の例です。 Aspose.Wordsがタスクにどれだけ正確に対応しているかを評価できます。


DOC to RTF – high-fidelity conversion:

doc-to-rtf-aspose-words-java-1 doc-to-rtf-aspose-words-java-2


DOC to PDF – high-fidelity conversion:

doc-to-pdf-aspose-words-java-1 doc-to-pdf-aspose-words-java-2

doc-to-pdf-aspose-words-java-3 doc-to-pdf-aspose-words-java-4


DOC to ODT – high-fidelity conversion:

doc-to-odt-aspose-words-java-1 doc-to-odt-aspose-words-java-2


DOC to XPS – high-fidelity conversion:

doc-to-xps-aspose-words-java-1 doc-to-xps-aspose-words-java-2


DOC to JPEG – high-fidelity conversion:

doc-to-jpg-aspose-words-java-1

RTF to TXT – high-fidelity conversion:

rtf-to-txt-aspose-words-java-1 rtf-to-txt-aspose-words-java-2


Aspose.Wordsのすべてのコンバーターは優れていますが、異なる形式のドキュメントで同じ外観を得ることができない場合があります。

たとえば、HTMLドキュメントとMicrosoft Wordドキュメントのすべての機能の間には、単純な一対一の一致はありません。 HTMLにはヘッダー/フッター、セクション、フィールド、タブはありません。 逆に、すべてのCSS属性とルールをMicrosoft Wordドキュメントにマップできるわけではありません。

以下は、DOCからHTMLへの変換の例です。


DOCからHTML–忠実度の高い変換:

doc-to-html-aspose-words-java-1 doc-to-html-aspose-words-java-2

doc-to-html-aspose-words-java-3 doc-to-html-aspose-words-java-4


高いスケーラビリティ

スケーラブルなサーバー側のシナリオでは、Aspose.Wordsは主にシンプルでクリーンな設計のために使用されます。Aspose.Wordsはマルチスレッドをサポートしています。 Documentオブジェクトは互いに独立しており、一度に1つのスレッドだけがドキュメントを変更できる限り(コレクションクラスの一般的な要件)、複数のス

ハイパフォーマンス

Aspose.Wordsドキュメントの読み込みと保存時に高いパフォーマンスを示します。 テストでは、サイズが5Mbを超えるDOCファイルが1秒未満でロードされ、P43GHzマシンに1秒未満で保存されました。 小さいファイルは、数千分の速度で処理できます。

いくつかの場面で、お客様はAspose.Wordsの速度を信じることができなかったと私たちに報告しています。 彼らは巨大なドキュメントをデバッガーにロードしていたコード行を踏み越え、ファイルがDocumentオブジェクトにロードされたとは信じられないほど瞬間的