Popularne formaty przechowywania e‑maili

MBOX

MBOX (skrót od Mailbox) jest powszechnie używanym formatem przechowywania e‑maili, który istnieje od kilku dekad. Służy do przechowywania kolekcji wiadomości e‑mail w jednym pliku, przy czym każda wiadomość jest połączona i oddzielona linią separatora.

MBOX został po raz pierwszy opracowany w latach 70. i od tego czasu pojawiły się różne wersje i implementacje. Został wdrożony w wielu klientach poczty, takich jak Unix mail, Mozilla Thunderbird, Eudora i inne.

Kluczowe funkcje:

  • MBOX jest obsługiwany na wielu platformach, w tym Unix, Linux i macOS.
  • Klienci tacy jak Mozilla Thunderbird, Apple Mail i wiele innych potrafią odczytywać i zapisywać pliki MBOX.
  • Prosty tekstowy charakter formatu ułatwia parsowanie i przetwarzanie przy użyciu narzędzi manipulacji tekstem.
  • Ze względu na prostą strukturę, MBOX jest powszechnie używany do archiwizacji i tworzenia kopii zapasowych.
  • Ponieważ wszystkie e‑maile są przechowywane w jednym pliku, plik może stać się dość duży z czasem, co prowadzi do nieefektywności.

Warianty MBOX:

MBOX występuje w kilku wariantach, każdy z niewielkimi różnicami w obsłudze wiadomości:

  • MBOXO: Oryginalny format, w którym wiersze "From " w ciele e‑maila są cytowane znakiem >.
  • MBOXRD: Wariant MBOXO, który dodatkowo rozszerza metodę cytowania wierszy "From ".
  • MBOXCL: Wprowadzony w wariancie "Classic" MBOX, w którym każdy wiersz "From " jest cytowany ciągiem ffrom.
  • MBOXCL2: Wariant MBOXCL, w którym wiersze "From " są podwajane, aby je odróżnić.

Techniczne podstawy formatu MBOX

Struktura pliku:

  • Plik MBOX to plik tekstowy zawierający serię wiadomości EML.
  • Każda wiadomość zaczyna się od wiersza "From " (spacja po słowie "From"), który zazwyczaj zawiera adres nadawcy oraz znacznik czasu otrzymania wiadomości.
  • Każda wiadomość jest zakończona pustą linią, oddzielającą ją od kolejnej wiadomości.

Struktura przechowywania MBOX

Przykład:

From user@example.com Fri Jan 01 00:00:00 2021
[Headers]
[Body]
From user2@example.com Fri Jan 01 00:01:00 2021
[Headers]
[Body]

PST/OST

Personal Storage Table (PST) i Offline Storage Table (OST) są formatami plików używanymi przez Microsoft Outlook do przechowywania kopii e‑maili, wydarzeń kalendarza i innych elementów.

Kluczowe funkcje:

  • Pliki PST służą do przechowywania danych osobistych i są zazwyczaj wykorzystywane do archiwizacji starszych e‑maili i danych. Głównie używane przez użytkowników domowych i małe organizacje do lokalnego przechowywania wiadomości e‑mail, kontaktów i wydarzeń kalendarza.
  • Pliki OST służą do przechowywania offline i synchronizacji e‑maili oraz innych danych z serwerem Exchange. Są używane głównie przez użytkowników korzystających z Microsoft Exchange Server lub Office 365.
  • Przechowywane lokalnie na komputerze użytkownika. Dostępne nawet gdy użytkownik nie jest podłączony do serwera poczty.
  • Pliki PST mogą być łatwo kopiowane i przenoszone na inne komputery. Użytkownicy mogą przenosić pliki PST pomiędzy różnymi systemami lub wersjami Outlooka.
  • Pliki OST nie są przeznaczone do ręcznego tworzenia kopii zapasowych ani przenoszenia, ponieważ są zsynchronizowanymi kopiami danych serwera. Pliki OST są powiązane z konkretnymi profilami i nie mogą być łatwo przenoszone na inne systemy.

OLM

Outlook for Mac Archive File (OLM) jest formatem pliku używanym przez Microsoft Outlook dla Mac do przechowywania wiadomości e‑mail, wydarzeń kalendarza, kontaktów, zadań i innych elementów.

Kluczowe funkcje:

  • Pliki OLM są głównie używane do archiwizacji i tworzenia kopii zapasowych e‑maili oraz innych elementów Outlooka w systemach Mac.
  • Pliki OLM są przechowywane lokalnie na komputerze Mac użytkownika.
  • Pliki OLM można otwierać i uzyskiwać do nich dostęp za pomocą Microsoft Outlook dla Mac. Nie są one bezpośrednio kompatybilne z Outlookiem dla Windows bez konwersji.
  • Microsoft nie narzuca stałego limitu rozmiaru plików OLM, ale mogą wystąpić problemy z wydajnością, jeśli plik stanie się bardzo duży. Użytkownicy zazwyczaj zarządzają rozmiarem, tworząc wiele mniejszych archiwów zamiast jednego dużego pliku OLM.
  • Kopia zapasowa: Ponieważ pliki OLM są przechowywane lokalnie, można je tworzyć kopie zapasowe lub kopiować na zewnętrzne nośniki.

TGZ

TGZ (używany przez Zimbra do plików backupu skrzynki pocztowej) jest formatem pliku służącym do archiwizacji i kompresji danych, powszechnie kojarzonym z systemami Unix i Linux. Termin "TGZ" odnosi się do połączenia dwóch narzędzi: "tar" (Tape Archive) i "gzip". Format .tar grupuje wiele plików i katalogów w jeden plik archiwum. Zachowuje informacje systemu plików, takie jak struktury katalogów, uprawnienia i znaczniki czasu. Format .gz kompresuje dane, co sprawia, że archiwum tar jest mniejsze i łatwiejsze do zarządzania lub przenoszenia. Kompresowany charakter TGZ czyni go odpowiednim do przesyłania archiwów e‑maili przez Internet lub przenoszenia ich między systemami.

NSF

Notes Storage Facility (NSF) jest własnościowym formatem pliku używanym głównie przez IBM Lotus Notes (obecnie HCL Notes) do przechowywania różnych typów danych, w tym e‑maili, wydarzeń kalendarza, zadań i innych danych aplikacji. Pliki NSF wykorzystują model bazy danych NoSQL oparty na dokumentach. Każda baza danych jest przechowywana jako pojedynczy plik NSF z rozszerzeniem .nsf. Rozszerzenie reprezentuje format bazy danych używany przez IBM Notes i serwer Domino. Każdy e‑mail, wpis kalendarza lub zadanie jest przechowywane jako dokument, który może zawierać różne typy danych, takie jak tekst, załączniki, linki, formatowanie tekstu sformatowanego oraz metadane.