入力および出力エンコーディング| Java用のAspose.TeX

キーボードにキーを押すと、特定の文字を表す数値コードが生成されます。入力エンコードは、文字を対応するコードにマッピングします。たとえば、ドイツのキーボードでは、アクセント付き文字(「a-umlaut」文字など)を、異なるオペレーティングシステムの下で異なるコードにマッピングできます。

コンピューターファイルに保存されているドキュメントには、文字コードのみが含まれていますが、入力エンコードに関する情報は明示的に含まれていません。したがって、ユナイテッドから英国に述べられているような別の環境にファイルを転送すると、入力エンコードについて間違った仮定を行うプログラムでファイルを表示すると、ドキュメントのドル記号が突然ポンド記号として解釈されることがわかります。

LaTex Projectチームによって開発された「Inputenc」パッケージは、入力エンコーディングの問題を支援することを目的としていました。ユーザーは、ドキュメントまたはドキュメントの一部に使用される入力エンコードを明示的に指定できます。このメカニズムにより、ドキュメントを1つのラテックスインストールから別のラテックスインストールに移転して、同一の印刷結果を達成できます。

「入力」パッケージは、ファイル内の文字コードを解釈し、それらを *内部ラテックス表現 *にマッピングします。これは、ラテックスで表現可能なすべての文字をカバーします。いくつかの補助ファイルへの書き込みなどのさらなる処理中、LaTexはこの内部表現を使用して、誤解を避けます。

ただし、遅かれ早かれ、LaTexはこれらの内部文字表現を * Glyphs *(特定のフォントの文字形状)に関連付ける必要があるため、別のマッピングが必要です。 Texフォントには最大256のグリフがあります。これらのグリフは名前ではなく、フォント内のグリフの位置を表す8ビットの数字で対処されます。これは、大きなユニークなネーミングスペースからいくつかの小さなスペースにマッピングする必要があることを意味し、これらのグリフ位置は大きく異なる場合がありますが、これは驚くことではありません。

したがって、外部ファイルからラテックスの内部へのドル記号の意味を保存していても、ドル記号が予約されていると仮定した位置に予期しないグリフがある印刷用のフォントを選択した場合、紙の上に間違った形状を見つけるかもしれません。 nfss(Latex’s 新しいフォント選択スキーム)のタスクの1つは、LaTex内部文字表現が適切にレンダリングされていること、またはそれが何らかの理由で不可能な場合、ユーザーが適切なエラーメッセージを受信することを確認することです。

フォントには、ベースキャラクターとアクセントのみではなく、個々のグリフとしてアクセントされたキャラクターが含まれている場合(Texは内部的にアクセントされたキャラクターを構築します)、これらのグリフを使用することが通常外観が良くなるため好ましいです。これらの複合グリフを使用する別の(技術的な)理由は、「\ accent」原始がハイフネーションを抑制することです。

さまざまなケースに合わせて、「\ ’e」(「e-acte」文字のラテックスの内部表現)のようなコマンドは、「\ accent」原始を含む複雑なアクションを開始する必要があり、時には現在のフォントの特定の slot(位置)からのグリフが必要であることを通知するだけです。

これはすべて、適切なグリフ位置またはグリフビルディングアクションのラテックスの内部文字表現のマッピングである *出力エンコーディング *の概念を通じて達成されます。

以下の記事では、1994年に標準のラテックスの一部となったNFSSのリリース2について説明しています。

Have any questions about Aspose.TeX?



Subscribe to Aspose Product Updates

Get monthly newsletters & offers directly delivered to your mailbox.