Allgemeine E‑Mail‑Speicherformate
MBOX
MBOX (Kurzform für Mailbox) ist ein weit verbreitetes E‑Mail‑Speicherformat, das seit mehreren Jahrzehnten genutzt wird. Es wird verwendet, um eine Sammlung von E‑Mail‑Nachrichten in einer einzigen Datei zu speichern, wobei jede Nachricht aneinandergereiht und durch eine Trennzeile abgegrenzt wird.
MBOX wurde in den 1970er‑Jahren entwickelt und hat seitdem verschiedene Versionen und Implementierungen erfahren. Es wurde in zahlreichen E‑Mail‑Clients wie Unix‑mail, Mozilla Thunderbird, Eudora und anderen implementiert.
Hauptmerkmale:
- MBOX wird auf einer breiten Palette von Plattformen unterstützt, darunter Unix, Linux und macOS.
- Clients wie Mozilla Thunderbird, Apple Mail und viele andere können MBOX‑Dateien lesen und schreiben.
- Die reine Textnatur des Formats ermöglicht ein einfaches Parsen und Verarbeiten mit Text‑Manipulationswerkzeugen.
- Aufgrund seiner einfachen Struktur wird MBOX häufig für Archivierungs‑ und Backup‑Zwecke verwendet.
- Da alle E‑Mails in einer einzigen Datei gespeichert werden, kann die Datei im Laufe der Zeit sehr groß werden, was zu Ineffizienzen führt.
Varianten von MBOX:
MBOX gibt es in mehreren Varianten, die jeweils leichte Unterschiede im Umgang mit Nachrichten aufweisen:
- MBOXO: Das Originalformat, bei dem "From "‑Zeilen im E‑Mail‑Body mit einem >‑Zeichen zitiert werden.
- MBOXRD: Eine Variante von MBOXO, die die Zitatmethode der "From "‑Zeilen weiter ausbaut.
- MBOXCL: Eingeführt von der „Classic“-MBOX-Variante, bei der jede "From "‑Zeile mit einem ffrom‑String zitiert wird.
- MBOXCL2: Eine Variante von MBOXCL, bei der "From "‑Zeilen verdoppelt werden, um sie zu unterscheiden.
Technische Grundlage des MBOX‑Formats
Dateistruktur:
- Eine MBOX‑Datei ist eine reine Textdatei, die eine Reihe von EML‑Nachrichten enthält.
- Jede Nachricht beginnt mit einer Zeile "From " (ein Leerzeichen nach dem Wort "From"), die typischerweise die E‑Mail‑Adresse des Absenders und den Zeitstempel enthält, wann die Nachricht empfangen wurde.
- Jede Nachricht wird von einer leeren Zeile gefolgt, um sie von der nächsten Nachricht zu trennen.

Beispiel:
From user@example.com Fri Jan 01 00:00:00 2021
[Headers]
[Body]
From user2@example.com Fri Jan 01 00:01:00 2021
[Headers]
[Body]
PST/OST
Personal Storage Table (PST) und Offline Storage Table (OST) sind Dateiformate, die von Microsoft Outlook zum Speichern von Kopien von E‑Mails, Kalendereinträgen und anderen Elementen verwendet werden.
Hauptmerkmale:
- PST‑Dateien dienen zur Speicherung persönlicher Informationen und werden typischerweise zum Archivieren älterer E‑Mails und Daten verwendet. Sie werden hauptsächlich von Privatanwendern und kleinen Organisationen für die lokale Speicherung von E‑Mail‑Nachrichten, Kontakten und Kalendereinträgen genutzt.
- OST‑Dateien werden für die Offline‑Speicherung und Synchronisierung von E‑Mails und anderen Daten mit dem Exchange‑Server verwendet. Sie werden hauptsächlich von Benutzern genutzt, die auf Microsoft Exchange Server oder Office 365 zugreifen.
- Lokal auf dem Computer eines Benutzers gespeichert. Kann auch ohne Verbindung zum E‑Mail‑Server abgerufen werden.
- PST‑Dateien können einfach gesichert und auf andere Computer übertragen werden. Benutzer können PST‑Dateien zwischen verschiedenen Systemen oder Outlook‑Versionen übertragen.
- OST‑Dateien sind nicht für manuelles Backup oder Transfer gedacht, da sie synchronisierte Kopien von Serverdaten sind. OST‑Dateien sind an bestimmte Profile gebunden und können nicht einfach auf andere Systeme verschoben werden.
OLM
Outlook for Mac Archive File (OLM) ist ein Dateiformat, das von Microsoft Outlook für Mac verwendet wird, um E‑Mail‑Nachrichten, Kalenderereignisse, Kontakte, Aufgaben und andere Elemente zu speichern.
Hauptmerkmale:
- OLM‑Dateien werden hauptsächlich zum Archivieren und Sichern von E‑Mails und anderen Outlook‑Elementen auf Mac‑Systemen verwendet.
- OLM‑Dateien werden lokal auf dem Mac des Benutzers gespeichert.
- OLM‑Dateien können mit Microsoft Outlook für Mac geöffnet und genutzt werden. Sie sind nicht ohne Konvertierung direkt mit Outlook für Windows kompatibel.
- Microsoft legt keine feste Größenbegrenzung für OLM‑Dateien fest, jedoch können Leistungsprobleme auftreten, wenn die Datei sehr groß wird. Benutzer verwalten die Größe typischerweise, indem sie mehrere kleinere Archive anstelle einer großen OLM‑Datei erstellen.
- Backup: Da OLM‑Dateien lokal gespeichert werden, können sie gesichert oder auf externe Speichermedien kopiert werden.
TGZ
TGZ (von Zimbra für Mailbox‑Backup‑Dateien verwendet) ist ein Dateiformat zum Archivieren und Komprimieren von Daten, das häufig mit Unix‑ und Linux‑Systemen in Verbindung gebracht wird. Der Begriff „TGZ“ bezeichnet die Kombination zweier Werkzeuge: „tar“ (Tape Archive) und „gzip“. Das .tar‑Format bündelt mehrere Dateien und Verzeichnisse in einer einzigen Archivdatei. Es bewahrt Dateisysteminformationen wie Verzeichnisstrukturen, Dateiberechtigungen und Zeitstempel. Das .gz‑Format komprimiert Daten, wodurch das Tar‑Archiv kleiner und leichter zu handhaben oder zu übertragen wird. Die komprimierte Natur von TGZ macht es geeignet für die Übertragung von E‑Mail‑Archiven über das Internet oder das Verschieben zwischen Systemen.
NSF
Notes Storage Facility (NSF) ist ein proprietäres Dateiformat, das hauptsächlich von IBM Lotus Notes (heute HCL Notes) verwendet wird, um verschiedene Arten von Daten zu speichern, einschließlich E‑Mails, Kalendereinträge, Aufgaben und andere Anwendungsdaten. NSF‑Dateien verwenden ein NoSQL‑, dokumentbasiertes Datenbankmodell. Jede Datenbank wird als einzelne NSF‑Datei mit der Endung .nsf gespeichert. Die Endung steht für ein Datenbankformat, das von IBM Notes und Domino‑Server verwendet wird. Jede E‑Mail, Kalendereintrag oder Aufgabe wird als Dokument gespeichert, das verschiedene Datentypen wie Text, Anhänge, Links, Rich‑Text‑Formatierung und sogar Metadaten enthalten kann.