Veelvoorkomende e‑mailopslagformaten

MBOX

MBOX (afkorting voor Mailbox) is een veelgebruikt e‑mailopslagformaat dat al tientallen jaren gangbaar is. Het wordt gebruikt om een collectie e‑mailberichten op te slaan in één enkel bestand, waarbij elk bericht wordt aaneengeschakeld en gescheiden door een scheidingslijn.

MBOX werd voor het eerst ontwikkeld in de jaren 70 en heeft sindsdien verschillende versies en implementaties gekend. Het is geïmplementeerd in talrijke e‑mailclients zoals Unix‑mail, Mozilla Thunderbird, Eudora en meer.

Belangrijkste functies:

  • MBOX wordt ondersteund op een breed scala aan platformen, waaronder Unix, Linux en macOS.
  • Clients zoals Mozilla Thunderbird, Apple Mail en vele anderen kunnen MBOX‑bestanden lezen en schrijven.
  • De platte‑tekst‑aard van het formaat maakt het eenvoudig te parseren en te verwerken met tekst‑manipulatie‑tools.
  • Door de eenvoudige structuur wordt MBOX veel gebruikt voor archivering en back‑up doeleinden.
  • Aangezien alle e‑mails in één enkel bestand worden opgeslagen, kan het bestand na verloop van tijd behoorlijk groot worden, wat leidt tot inefficiënties.

Varianten van MBOX:

MBOX bestaat in verschillende varianten, elk met lichte verschillen in hoe ze met berichten omgaan:

  • MBOXO: Het originele formaat waarbij "From "‑regels in de e‑mailinhoud worden geciteerd met een >‑teken.
  • MBOXRD: Een variant van MBOXO die de quotering van "From "‑regels verder uitbreidt.
  • MBOXCL: Geïntroduceerd door de "Classic" MBOX‑variant waarbij elke "From "‑regel wordt geciteerd met een ffrom‑string.
  • MBOXCL2: Een variant van MBOXCL waarbij "From "‑regels worden verdubbeld om ze te onderscheiden.

Technische basis voor het MBOX‑formaat

Bestandsstructuur:

  • Een MBOX‑bestand is een platte-tekst‑bestand dat een reeks EML‑berichten bevat.
  • Elk bericht begint met een "From "‑regel (een spatie na het woord "From") die doorgaans het e‑mailadres van de afzender en de tijdstempel van ontvangst bevat.
  • Elk bericht wordt gevolgd door een lege regel om het van het volgende bericht te scheiden.

MBOX‑opslagstructuur

Voorbeeld:

From user@example.com Fri Jan 01 00:00:00 2021
[Headers]
[Body]
From user2@example.com Fri Jan 01 00:01:00 2021
[Headers]
[Body]

PST/OST

Personal Storage Table (PST) en Offline Storage Table (OST) zijn bestandsformaten die door Microsoft Outlook worden gebruikt om kopieën van e‑mails, agenda‑gebeurtenissen en andere items op te slaan.

Belangrijkste functies:

  • PST‑bestanden worden gebruikt om persoonlijke informatie op te slaan en worden doorgaans gebruikt voor het archiveren van oudere e‑mails en gegevens. Voornamelijk gebruikt door thuisgebruikers en kleine organisaties voor lokale opslag van e‑mailberichten, contactpersonen en agenda‑gebeurtenissen.
  • OST‑bestanden worden gebruikt voor offline opslag en synchronisatie van e‑mails en andere gegevens met de Exchange‑server. Voornamelijk gebruikt door gebruikers die Microsoft Exchange Server of Office 365 benaderen.
  • Lokaal opgeslagen op de computer van een gebruiker. Kan worden benaderd zelfs wanneer de gebruiker niet met de e‑mailserver is verbonden.
  • PST‑bestanden kunnen eenvoudig worden geback‑up en overgebracht naar andere computers. Gebruikers kunnen PST‑bestanden tussen verschillende systemen of Outlook‑versies verplaatsen.
  • OST‑bestanden zijn niet bedoeld voor handmatige back‑up of overdracht aangezien ze gesynchroniseerde kopieën van servergegevens zijn. OST‑bestanden zijn gekoppeld aan specifieke profielen en kunnen niet gemakkelijk naar andere systemen worden verplaatst.

OLM

Outlook for Mac-archiefbestand (OLM) is een bestandsformaat dat wordt gebruikt door Microsoft Outlook voor Mac om e‑mailberichten, agenda‑gebeurtenissen, contactpersonen, taken en andere items op te slaan.

Belangrijkste functies:

  • OLM‑bestanden worden voornamelijk gebruikt voor het archiveren en back‑uppen van e‑mails en andere Outlook‑items op Mac‑systemen.
  • OLM‑bestanden worden lokaal opgeslagen op de Mac van de gebruiker.
  • OLM‑bestanden kunnen worden geopend en benaderd via Microsoft Outlook voor Mac. Ze zijn niet direct compatibel met Outlook voor Windows zonder conversie.
  • Er is geen vaste grootte‑limiet voor OLM‑bestanden opgelegd door Microsoft, maar prestatieproblemen kunnen optreden als het bestand erg groot wordt. Gebruikers beheren de grootte doorgaans door meerdere kleinere archieven te maken in plaats van één groot OLM‑bestand.
  • Back‑up: Aangezien OLM‑bestanden lokaal worden opgeslagen, kunnen ze worden geback‑up of gekopieerd naar externe opslagapparaten.

TGZ

TGZ (gebruikt door Zimbra voor mailbox‑back-upbestanden) is een bestandsformaat dat wordt gebruikt voor archiveren en comprimeren van gegevens, vaak geassocieerd met Unix‑ en Linux‑systemen. De term "TGZ" verwijst naar een combinatie van twee hulpprogramma’s: "tar" (Tape Archive) en "gzip". Het .tar‑formaat bundelt meerdere bestanden en mappen in één archiefbestand. Het behoudt bestandsysteem‑informatie zoals mapstructuren, bestandsrechten en tijdstempels. Het .gz‑formaat comprimeert data, waardoor het tar‑archief kleiner en makkelijker te beheren of over te dragen wordt. De gecomprimeerde aard van TGZ maakt het geschikt voor het overbrengen van e‑mailarchieven via internet of voor het verplaatsen tussen systemen.

NSF

Notes Storage Facility (NSF) is een propriëtair bestandsformaat dat voornamelijk wordt gebruikt door IBM Lotus Notes (nu HCL Notes) om diverse soorten gegevens op te slaan, waaronder e‑mail, agenda‑gebeurtenissen, taken en andere applicatiegegevens. NSF‑bestanden gebruiken een NoSQL, documentgebaseerd databasemodel. Elke database wordt opgeslagen als één enkel NSF‑bestand met de extensie .nsf. De extensie staat voor een database‑formaat dat wordt gebruikt door IBM Notes en Domino Server. Elke e‑mail, agenda‑item of taak wordt opgeslagen als een document dat verschillende soorten gegevens kan bevatten, zoals tekst, bijlagen, links, opmaak in rich‑text en zelfs metadata.