Formats de stockage d’e‑mail courants
MBOX
MBOX (abréviation de Mailbox) est un format de stockage d’e‑mail largement utilisé depuis plusieurs décennies. Il sert à stocker une collection de messages électroniques dans un seul fichier, chaque message étant concaténé et délimité par une ligne séparatrice.
MBOX a été développé pour la première fois dans les années 1970 et a depuis connu diverses versions et implémentations au fil des années. Il a été intégré dans de nombreux clients de messagerie tels que Unix mail, Mozilla Thunderbird, Eudora, et plus encore.
Fonctionnalités clés :
- MBOX est supporté sur un large éventail de plateformes, y compris Unix, Linux et macOS.
- Des clients comme Mozilla Thunderbird, Apple Mail et bien d’autres peuvent lire et écrire des fichiers MBOX.
- La nature texte brut du format le rend simple à analyser et à traiter à l’aide d’outils de manipulation de texte.
- En raison de sa structure simple, MBOX est largement utilisé pour l’archivage et les sauvegardes.
- Comme tous les e‑mails sont stockés dans un seul fichier, celui‑ci peut devenir très volumineux avec le temps, entraînant des inefficacités.
Variantes de MBOX :
MBOX existe en plusieurs variantes, chacune présentant de légères différences dans la façon dont elles gèrent les messages :
- MBOXO : Le format original où les lignes « From » dans le corps du e‑mail sont citées avec le caractère >.
- MBOXRD : Une variante de MBOXO qui étend davantage la méthode de citation des lignes « From ».
- MBOXCL : Introduit par la variante « Classic » de MBOX où chaque ligne « From » est citée avec une chaîne ffrom.
- MBOXCL2 : Une variante de MBOXCL où les lignes « From » sont doublées pour les distinguer.
Base technique du format MBOX
Structure du fichier :
- Un fichier MBOX est un fichier texte brut qui contient une série de messages EML.
- Chaque message commence par une ligne « From » (un espace après le mot « From ») qui inclut généralement l’adresse e‑mail de l’expéditeur et l’horodatage du moment où le message a été reçu.
- Chaque message est suivi d’une ligne vide pour le séparer du message suivant.

Exemple :
From user@example.com Fri Jan 01 00:00:00 2021
[Headers]
[Body]
From user2@example.com Fri Jan 01 00:01:00 2021
[Headers]
[Body]
PST/OST
Personal Storage Table (PST) et Offline Storage Table (OST) sont des formats de fichier utilisés par Microsoft Outlook pour stocker des copies d’e‑mails, d’événements de calendrier et d’autres éléments.
Fonctionnalités clés :
- Les fichiers PST sont utilisés pour stocker des informations personnelles et sont généralement utilisés pour archiver d’anciens e‑mails et données. Ils sont principalement employés par les utilisateurs domestiques et les petites organisations pour le stockage local des messages électroniques, contacts et événements de calendrier.
- Les fichiers OST sont utilisés pour le stockage hors ligne et la synchronisation des e‑mails et autres données avec le serveur Exchange. Ils sont principalement utilisés par les utilisateurs qui accèdent à Microsoft Exchange Server ou à Office 365.
- Stockés localement sur l’ordinateur d’un utilisateur. Accessibles même lorsque l’utilisateur n’est pas connecté au serveur de messagerie.
- Les fichiers PST peuvent être facilement sauvegardés et transférés vers d’autres ordinateurs. Les utilisateurs peuvent transférer les fichiers PST entre différents systèmes ou versions d’Outlook.
- Les fichiers OST ne sont pas destinés à une sauvegarde ou un transfert manuels puisqu’ils sont des copies synchronisées des données du serveur. Les fichiers OST sont associés à des profils spécifiques et ne peuvent pas être déplacés facilement vers d’autres systèmes.
OLM
Outlook for Mac Archive File (OLM) est un format de fichier utilisé par Microsoft Outlook pour Mac afin de stocker les messages électroniques, les événements de calendrier, les contacts, les tâches et d’autres éléments.
Fonctionnalités clés :
- Les fichiers OLM sont principalement utilisés pour archiver et sauvegarder les e‑mails et autres éléments Outlook sur les systèmes Mac.
- Les fichiers OLM sont stockés localement sur le Mac de l’utilisateur.
- Les fichiers OLM peuvent être ouverts et consultés via Microsoft Outlook pour Mac. Ils ne sont pas directement compatibles avec Outlook pour Windows sans conversion.
- Microsoft n’impose pas de limite de taille fixe aux fichiers OLM, mais des problèmes de performances peuvent survenir si le fichier devient très volumineux. Les utilisateurs gèrent généralement la taille en créant plusieurs archives plus petites plutôt qu’un seul gros fichier OLM.
- Sauvegarde : comme les fichiers OLM sont stockés localement, ils peuvent être sauvegardés ou copiés sur des périphériques de stockage externes.
TGZ
TGZ (utilisé par Zimbra pour le fichier de sauvegarde de boîte aux lettres) est un format de fichier utilisé pour l’archivage et la compression de données, couramment associé aux systèmes Unix et Linux. Le terme « TGZ » fait référence à une combinaison de deux utilitaires : « tar » (Tape Archive) et « gzip ». Le format de fichier .tar regroupe plusieurs fichiers et répertoires en un seul fichier d’archive. Il préserve les informations du système de fichiers telles que la structure des répertoires, les permissions et les horodatages. Le format .gz compresse les données, rendant l’archive tar plus petite et plus facile à gérer ou à transférer. La nature compressée de TGZ le rend adapté au transfert d’archives d’e‑mail sur Internet ou à leur déplacement entre systèmes.
NSF
Notes Storage Facility (NSF) est un format de fichier propriétaire utilisé principalement par IBM Lotus Notes (maintenant HCL Notes) pour stocker divers types de données, y compris les e‑mails, les événements de calendrier, les tâches et d’autres données d’application. Les fichiers NSF utilisent un modèle de base de données NoSQL, basé sur des documents. Chaque base de données est stockée sous la forme d’un seul fichier NSF avec l’extension .nsf. Cette extension représente un format de base de données utilisé par IBM Notes et Domino Server. Chaque e‑mail, entrée de calendrier ou tâche est stockée comme un document qui peut contenir différents types de données tels que du texte, des pièces jointes, des liens, du texte enrichi et même des métadonnées.