一般的なメール保存形式
MBOX
MBOX(Mailbox の略) は、何十年にもわたり広く利用されているメール保存形式です。単一ファイルにメールメッセージのコレクションを格納し、各メッセージは区切り行で区切られています。
MBOX は 1970 年代に初めて開発され、その後様々なバージョンや実装が登場しました。Unix mail、Mozilla Thunderbird、Eudora など多数のメールクライアントで実装されています。
主な機能:
- MBOX は Unix、Linux、macOS など幅広いプラットフォームでサポートされています。
- Mozilla Thunderbird、Apple Mail など多くのクライアントが MBOX ファイルを読み書きできます。
- プレーンテキスト形式のため、テキスト操作ツールで簡単に解析・処理できます。
- 構造がシンプルなため、MBOX はアーカイブやバックアップに広く利用されています。
- すべてのメールが単一ファイルに保存されるため、時間とともにファイルが非常に大きくなり、非効率になることがあります。
MBOX のバリエーション:
MBOX にはいくつかのバリエーションがあり、メッセージの処理方法に若干の違いがあります:
- MBOXO: 元の形式で、メール本文中の "From " 行が > 文字で引用されます。
- MBOXRD: MBOXO の引用方法をさらに拡張したバリアントです。
- MBOXCL: "Classic" MBOX バリアントで、各 "From " 行が ffrom 文字列で引用されます。
- MBOXCL2: "From " 行が二重にされ、区別できるようにした MBOXCL のバリエーションです。
MBOX 形式の技術的基盤
ファイル構造:
- MBOX ファイルは、複数の EML メッセージが連続して格納されたプレーンテキストファイルです。
- 各メッセージは "From " 行("From" の後にスペース)で始まり、通常送信者のメールアドレスと受信時刻が含まれます。
- 各メッセージは空行で区切られ、次のメッセージと分離されます。

例:
From user@example.com Fri Jan 01 00:00:00 2021
[Headers]
[Body]
From user2@example.com Fri Jan 01 00:01:00 2021
[Headers]
[Body]
PST/OST
Personal Storage Table (PST) と Offline Storage Table (OST) は、Microsoft Outlook がメール、カレンダーイベント、その他アイテムのコピーを保存するために使用するファイル形式です。
主な機能:
- PST ファイルは個人情報の保存に使用され、主に古いメールやデータのアーカイブに利用されます。主に個人ユーザーや小規模組織がメールメッセージ、連絡先、カレンダーイベントなどをローカルに保存するために使用します。
- OST ファイルはオフラインでのメールやその他データの保存と Exchange サーバとの同期に使用されます。主に Microsoft Exchange Server または Office 365 にアクセスするユーザーが利用します。
- ユーザーのコンピュータにローカルで保存されます。メールサーバに接続していなくてもアクセス可能です。
- PST ファイルは簡単にバックアップでき、他のコンピュータへ転送できます。ユーザーは PST ファイルを異なるシステムや Outlook バージョン間で転送できます。
- OST ファイルはサーバーデータの同期コピーであり、手動でのバックアップや転送を目的としていません。OST ファイルは特定のプロファイルに紐付いており、別のシステムへ簡単に移動できません。
OLM
Outlook for Mac アーカイブファイル (OLM) は、Microsoft Outlook for Mac がメールメッセージ、カレンダーイベント、連絡先、タスク、その他のアイテムを保存するために使用するファイル形式です。
主な機能:
- OLM ファイルは主に Mac 上でメールやその他の Outlook アイテムをアーカイブおよびバックアップするために使用されます。
- OLM ファイルはユーザーの Mac にローカルで保存されます。
- OLM ファイルは Microsoft Outlook for Mac で開いてアクセスできます。Outlook for Windows では直接互換性がなく、変換が必要です。
- Microsoft が OLM ファイルに対して固定のサイズ上限を設定しているわけではありませんが、ファイルが非常に大きくなるとパフォーマンスの問題が発生する可能性があります。ユーザーは通常、1 つの大きな OLM ファイルではなく、複数の小さなアーカイブに分けてサイズを管理します。
- バックアップ: OLM ファイルはローカルに保存されるため、外部ストレージデバイスにバックアップまたはコピーできます。
TGZ
TGZ(Zimbra のメールボックスバックアップファイルに使用) は、データをアーカイブおよび圧縮するためのファイル形式で、主に Unix や Linux システムで使用されます。"TGZ" という用語は、"tar"(Tape Archive) と "gzip" の 2 つのユーティリティの組み合わせを指します。.tar ファイル形式は複数のファイルやディレクトリを単一のアーカイブファイルにまとめます。ディレクトリ構造、ファイル権限、タイムスタンプなどのファイルシステム情報を保持します。.gz ファイル形式はデータを圧縮し、tar アーカイブを小さくして管理や転送を容易にします。TGZ の圧縮特性により、インターネット経由でメールアーカイブを転送したり、システム間で移動したりするのに適しています。
NSF
Notes Storage Facility (NSF) は、主に IBM Lotus Notes(現在は HCL Notes)で使用される独自のファイル形式で、メール、カレンダーイベント、タスク、その他のアプリケーションデータなどさまざまな種類のデータを保存します。NSF ファイルは NoSQL のドキュメント指向データベースモデルを使用しています。各データベースは拡張子 .nsf の単一ファイルとして保存されます。この拡張子は IBM Notes および Domino Server が使用するデータベース形式を表します。各メール、カレンダーエントリ、タスクは文書として保存され、テキスト、添付ファイル、リンク、リッチテキスト書式、メタデータなど様々なデータを含むことができます。