Загальні формати зберігання електронної пошти

MBOX

MBOX (скорочено від Mailbox) — це широко використовуваний формат зберігання електронної пошти, який існує вже кілька десятиліть. Він використовується для збереження колекції листів у одному файлі, при цьому кожне повідомлення з’єднується та розділяється рядком‑розділювачем.

MBOX було вперше розроблено у 1970‑х роках і з того часу пройшло кілька версій та реалізацій. Він був впроваджений у багатьох поштових клієнтах, таких як Unix mail, Mozilla Thunderbird, Eudora та інші.

Ключові особливості:

  • MBOX підтримується на широкому спектрі платформ, включаючи Unix, Linux та macOS.
  • Клієнти, такі як Mozilla Thunderbird, Apple Mail та інші, можуть читати та записувати файли MBOX.
  • Природа формату як простого тексту спрощує його розбір та обробку за допомогою інструментів маніпуляції текстом.
  • Через свою просту структуру MBOX широко використовується для архівації та резервного копіювання.
  • Оскільки всі листи зберігаються в одному файлі, з часом файл може стати досить великим, що призводить до неефективності.

Варіанти MBOX:

MBOX існує в кількох варіантах, кожен із яких має незначні відмінності у обробці повідомлень:

  • MBOXO: Оригінальний формат, у якому рядки "From " у тілі листа цитуються символом >.
  • MBOXRD: Варіант MBOXO, який додатково розширює метод цитування рядків "From ".
  • MBOXCL: Запроваджений у "класичному" варіанті MBOX, де кожен рядок "From " цитується рядком ffrom.
  • MBOXCL2: Варіант MBOXCL, у якому рядки "From " подвоюються для їх розрізнення.

Технічна основа формату MBOX

Структура файлу:

  • Файл MBOX — це простий текстовий файл, що містить серію повідомлень у форматі EML.
  • Кожне повідомлення починається рядком "From " (пробіл після слова "From"), який зазвичай містить електронну адресу відправника та мітку часу отримання повідомлення.
  • Після кожного повідомлення йде порожній рядок, який розділяє його від наступного.

Структура зберігання MBOX

Приклад:

From user@example.com Fri Jan 01 00:00:00 2021
[Headers]
[Body]
From user2@example.com Fri Jan 01 00:01:00 2021
[Headers]
[Body]

PST/OST

Personal Storage Table (PST) та Offline Storage Table (OST) — це формати файлів, які використовує Microsoft Outlook для зберігання копій листів, подій календаря та інших елементів.

Ключові особливості:

  • Файли PST використовуються для зберігання особистої інформації і зазвичай застосовуються для архівування старих листів та даних. Переважно використовуються домашніми користувачами та малими організаціями для локального зберігання листів, контактів і подій календаря.
  • Файли OST використовуються для автономного зберігання та синхронізації електронної пошти та інших даних з сервером Exchange. Переважно використовуються користувачами, які працюють з Microsoft Exchange Server або Office 365.
  • Зберігаються локально на комп’ютері користувача. Доступні навіть коли користувач не підключений до серверу електронної пошти.
  • Файли PST легко резервуються та передаються на інші комп’ютери. Користувачі можуть переносити файли PST між різними системами або версіями Outlook.
  • Файли OST не призначені для ручного резервного копіювання або перенесення, оскільки це синхронізовані копії даних сервера. Файли OST прив’язані до конкретних профілів і не можуть бути легко перенесені на інші системи.

OLM

Outlook for Mac Archive File (OLM) — це формат файлу, який використовується Microsoft Outlook для Mac для зберігання електронних листів, подій календаря, контактів, завдань та інших елементів.

Ключові особливості:

  • Файли OLM переважно використовуються для архівування та резервного копіювання електронних листів і інших елементів Outlook на системах Mac.
  • Файли OLM зберігаються локально на Mac користувача.
  • Файли OLM можна відкривати та переглядати за допомогою Microsoft Outlook для Mac. Вони не сумісні безпосередньо з Outlook для Windows без конвертації.
  • Microsoft не встановлює фіксованого ліміту розміру для файлів OLM, проте можуть виникнути проблеми з продуктивністю, якщо файл стає дуже великим. Користувачі зазвичай керують розміром, створюючи кілька менших архівів замість одного великого файлу OLM.
  • Резервне копіювання: Оскільки файли OLM зберігаються локально, їх можна створювати резервні копії або копіювати на зовнішні пристрої зберігання.

TGZ

TGZ (використовується Zimbra для файлу резервної копії поштової скриньки) — це формат файлів, що застосовується для архівації та стискання даних, зазвичай пов’язаний з системами Unix та Linux. Термін "TGZ" означає комбінацію двох утиліт: "tar" (Tape Archive) та "gzip". Формат .tar об’єднує кілька файлів та каталогів в один архівний файл. Він зберігає інформацію файлової системи, таку як структура каталогів, права доступу та часові мітки. Формат .gz стискає дані, роблячи tar‑архів меншим і зручнішим для управління чи передачі. Стиснена природа TGZ робить його придатним для перенесення архівів електронної пошти через інтернет або між системами.

NSF

Notes Storage Facility (NSF) — це пропрієтарний формат файлів, який використовується переважно IBM Lotus Notes (тепер HCL Notes) для зберігання різних типів даних, включаючи електронну пошту, події календаря, завдання та інші дані застосунків. Файли NSF використовують NoSQL, документно-орієнтовану модель бази даних. Кожна база даних зберігається в одному файлі NSF з розширенням .nsf. Це розширення представляє формат бази даних, який використовується IBM Notes та Domino Server. Кожен лист, запис календаря або завдання зберігаються як документ, який може містити різноманітні типи даних, такі як текст, вкладення, посилання, форматування багатого тексту та навіть метадані.