Běžné formáty úložiště e‑mailů
MBOX
MBOX (zkratka pro Mailbox) je široce používaný formát úložiště e‑mailů, který je rozšířen již několik desetiletí. Slouží k ukládání sbírky e‑mailových zpráv v jednom souboru, kde jsou zprávy spojeny a odděleny řádkem oddělovače.
MBOX byl poprvé vyvinut v 70. letech 20. století a od té doby prošel různými verzemi a implementacemi. Byl implementován v řadě e‑mailových klientů, jako je Unix mail, Mozilla Thunderbird, Eudora a další.
Klíčové funkce:
- MBOX je podporován na široké škále platforem, včetně Unix, Linux a macOS.
- Klienti jako Mozilla Thunderbird, Apple Mail a mnoho dalších dokážou číst i zapisovat soubory MBOX.
- Přirozená textová povaha formátu usnadňuje jeho parsování a zpracování pomocí nástrojů pro manipulaci s textem.
- Díky své jednoduché struktuře je MBOX populárně používán pro archivaci a zálohování.
- Protože jsou všechny e‑maily uloženy v jednom souboru, může soubor s časem narůst na značnou velikost, což vede k neefektivitě.
Varianty MBOX:
MBOX existuje v několika variantách, z nichž každá se mírně liší v tom, jak zachází se zprávami:
- MBOXO: Původní formát, kde jsou řádky "From " v těle e‑mailu citovány znakem >.
- MBOXRD: Varianta MBOXO, která dále rozšiřuje metodu citování řádků "From ".
- MBOXCL: Zavedena variantou "Classic" MBOX, kde je každý řádek "From " citován pomocí řetězce ffrom.
- MBOXCL2: Varianta MBOXCL, kde jsou řádky "From " zdvojené pro jejich odlišení.
Technické základy formátu MBOX
Struktura souboru:
- Soubor MBOX je textový soubor, který obsahuje sérii zpráv ve formátu EML.
- Každá zpráva začíná řádkem "From " (mezera po slově "From"), který obvykle obsahuje e‑mailovou adresu odesílatele a časové razítko, kdy byla zpráva přijata.
- Každá zpráva je následována prázdným řádkem, který ji odděluje od další zprávy.

Příklad:
From user@example.com Fri Jan 01 00:00:00 2021
[Headers]
[Body]
From user2@example.com Fri Jan 01 00:01:00 2021
[Headers]
[Body]
PST/OST
Personal Storage Table (PST) a Offline Storage Table (OST) jsou formáty souborů používané Microsoft Outlook k ukládání kopií e‑mailů, kalendářních událostí a dalších položek.
Klíčové funkce:
- Soubory PST slouží k ukládání osobních informací a typicky se používají k archivaci starších e‑mailů a dat. Primárně je využívají domácí uživatelé a malé organizace pro lokální úložiště e‑mailových zpráv, kontaktů a kalendářních událostí.
- Soubory OST slouží pro offline úložiště a synchronizaci e‑mailů a dalších dat se serverem Exchange. Primárně používají uživatelé, kteří přistupují k Microsoft Exchange Server nebo Office 365.
- Uloženy lokálně na počítači uživatele. Přístupné i když uživatel není připojen k e‑mailovému serveru.
- Soubory PST lze snadno zálohovat a přenést na jiné počítače. Uživatelé mohou přenášet soubory PST mezi různými systémy nebo verzemi Outlooku.
- Soubory OST nejsou určeny pro ruční zálohování nebo přenos, protože jsou synchronizovanými kopiemi dat ze serveru. Soubory OST jsou svázány s konkrétními profily a nelze je snadno přesunout na jiné systémy.
OLM
Outlook for Mac Archive File (OLM) je formát souboru používaný Microsoft Outlook pro Mac k ukládání e‑mailových zpráv, kalendářních událostí, kontaktů, úkolů a dalších položek.
Klíčové funkce:
- Soubory OLM se primárně používají k archivaci a zálohování e‑mailů a dalších položek Outlooku na systémech Mac.
- Soubory OLM jsou uloženy lokálně na Macu uživatele.
- Soubory OLM lze otevřít a přistupovat k nim pomocí Microsoft Outlook pro Mac. Není přímo kompatibilní s Outlookem pro Windows bez konverze.
- Microsoft neudává pevný limit velikosti souborů OLM, ale při velmi velkém souboru mohou nastat výkonnostní problémy. Uživatelé obvykle spravují velikost vytvořením několika menších archivů namísto jednoho velkého souboru OLM.
- Záloha: Vzhledem k tomu, že soubory OLM jsou uloženy lokálně, lze je zálohovat nebo zkopírovat na externí úložná zařízení.
TGZ
TGZ (používaný Zimbrou pro soubor zálohy poštovní schránky) je formát souboru používaný pro archivaci a kompresi dat, běžně spojený s Unix a Linux systémy. Termín "TGZ" označuje kombinaci dvou nástrojů: "tar" (Tape Archive) a "gzip". Formát .tar skládá více souborů a adresářů do jednoho archivu. Zachovává informace o souborovém systému, jako je struktura adresářů, oprávnění souborů a časová razítka. Formát .gz komprimuje data, čímž zmenšuje tar archiv a usnadňuje jeho správu či přenos. Komprimovaná povaha TGZ je vhodná pro přenos e‑mailových archivů přes internet nebo jejich přesun mezi systémy.
NSF
Notes Storage Facility (NSF) je proprietární formát souboru používaný převážně IBM Lotus Notes (nyní HCL Notes) k ukládání různých typů dat, včetně e‑mailů, kalendářních událostí, úkolů a dalších aplikací. Soubory NSF používají NoSQL databázový model založený na dokumentech. Každá databáze je uložena jako jeden soubor NSF s příponou .nsf. Tato přípona představuje databázový formát používaný IBM Notes a Domino Server. Každý e‑mail, kalendářová položka nebo úkol je uložen jako dokument, který může obsahovat různé typy dat, jako je text, přílohy, odkazy, formátování rich textu a dokonce i metadata.