Formatos comunes de almacenamiento de correo electrónico
MBOX
MBOX (abreviatura de Mailbox) es un formato de almacenamiento de correo electrónico ampliamente usado que ha sido prevalente durante varias décadas. Se utiliza para almacenar una colección de mensajes de correo electrónico en un solo archivo, con cada mensaje concatenado y demarcado por una línea separadora.
MBOX se desarrolló por primera vez en la década de 1970 y desde entonces ha visto varias versiones e implementaciones a lo largo de los años. Ha sido implementado en numerosos clientes de correo como Unix mail, Mozilla Thunderbird, Eudora y más.
Características clave:
- MBOX es compatible con una amplia gama de plataformas, incluyendo Unix, Linux y macOS.
- Clientes como Mozilla Thunderbird, Apple Mail y muchos otros pueden leer y escribir archivos MBOX.
- La naturaleza de texto plano del formato lo hace sencillo de analizar y procesar usando herramientas de manipulación de texto.
- Debido a su estructura simple, MBOX se usa popularmente para propósitos de archivado y respaldo.
- Dado que todos los correos se almacenan en un solo archivo, este puede volverse bastante grande con el tiempo, lo que genera ineficiencias.
Variantes de MBOX:
MBOX viene en varias variantes, cada una con ligeras diferencias en cómo manejan los mensajes:
- MBOXO: El formato original donde las líneas "From " en el cuerpo del correo están citadas con el carácter >.
- MBOXRD: Una variante de MBOXO que extiende aún más el método de citación de las líneas "From ".
- MBOXCL: Introducida por la variante "Classic" de MBOX donde cada línea "From " se cita con una cadena ffrom.
- MBOXCL2: Una variante de MBOXCL donde las líneas "From " se duplican para distinguirlas.
Base técnica del formato MBOX
Estructura del archivo:
- Un archivo MBOX es un archivo de texto plano que contiene una serie de mensajes EML.
- Cada mensaje comienza con una línea "From " (un espacio después de la palabra "From") que normalmente incluye la dirección de correo del remitente y la marca de tiempo cuando se recibió el mensaje.
- Cada mensaje es seguido por una línea en blanco para separarlo del siguiente mensaje.

Ejemplo:
From user@example.com Fri Jan 01 00:00:00 2021
[Headers]
[Body]
From user2@example.com Fri Jan 01 00:01:00 2021
[Headers]
[Body]
PST/OST
Personal Storage Table (PST) y Offline Storage Table (OST) son formatos de archivo utilizados por Microsoft Outlook para almacenar copias de correos electrónicos, eventos de calendario y otros elementos.
Características clave:
- Los archivos PST se usan para almacenar información personal y suelen utilizarse para archivar correos electrónicos y datos antiguos. Son utilizados principalmente por usuarios domésticos y pequeñas organizaciones para el almacenamiento local de mensajes de correo, contactos y eventos de calendario.
- Los archivos OST se utilizan para el almacenamiento fuera de línea y la sincronización de correos electrónicos y otros datos con el servidor Exchange. Se utilizan principalmente por usuarios que acceden a Microsoft Exchange Server o Office 365.
- Almacenados localmente en la computadora del usuario. Pueden accederse incluso cuando el usuario no está conectado al servidor de correo.
- Los archivos PST pueden respaldarse y transferirse fácilmente a otras computadoras. Los usuarios pueden trasladar archivos PST entre diferentes sistemas o versiones de Outlook.
- Los archivos OST no están destinados a copias de seguridad o transferencias manuales ya que son copias sincronizadas de los datos del servidor. Los archivos OST están vinculados a perfiles específicos y no pueden trasladarse fácilmente a diferentes sistemas.
OLM
Archivo de archivo de Outlook para Mac (OLM) es un formato de archivo usado por Microsoft Outlook para Mac para almacenar mensajes de correo electrónico, eventos de calendario, contactos, tareas y otros elementos.
Características clave:
- Los archivos OLM se utilizan principalmente para archivar y respaldar correos electrónicos y otros elementos de Outlook en sistemas Mac.
- Los archivos OLM se almacenan localmente en el Mac del usuario.
- Los archivos OLM pueden abrirse y accederse mediante Microsoft Outlook para Mac. No son directamente compatibles con Outlook para Windows sin conversión.
- No existe un límite de tamaño fijo para los archivos OLM impuesto por Microsoft, pero pueden presentarse problemas de rendimiento si el archivo se vuelve muy grande. Los usuarios generalmente gestionan el tamaño creando varios archivos de archivo más pequeños en lugar de un único archivo OLM grande.
- Respaldo: Dado que los archivos OLM se almacenan localmente, pueden respaldarse o copiarse a dispositivos de almacenamiento externos.
TGZ
TGZ (utilizado por Zimbra para archivos de copia de seguridad de buzón) es un formato de archivo usado para archivar y comprimir datos, asociado comúnmente con sistemas Unix y Linux. El término "TGZ" se refiere a una combinación de dos utilidades: "tar" (Tape Archive) y "gzip". El formato de archivo .tar agrupa múltiples archivos y directorios en un solo archivo de archivo. Preserva información del sistema de archivos como estructuras de directorios, permisos de archivos y marcas de tiempo. El formato .gz comprime los datos, haciendo que el archivo tar sea más pequeño y fácil de gestionar o transferir. La naturaleza comprimida de TGZ lo hace adecuado para transferir archivos de correo electrónico a través de internet o moverlos entre sistemas.
NSF
Notes Storage Facility (NSF) es un formato de archivo propietario utilizado principalmente por IBM Lotus Notes (ahora HCL Notes) para almacenar varios tipos de datos, incluidos correos electrónicos, eventos de calendario, tareas y otros datos de aplicaciones. Los archivos NSF utilizan un modelo de base de datos NoSQL basado en documentos. Cada base de datos se almacena como un único archivo NSF con extensión .nsf. La extensión representa un formato de base de datos utilizado por IBM Notes y Domino Server. Cada correo electrónico, entrada de calendario o tarea se almacena como un documento que puede contener diversos tipos de datos como texto, archivos adjuntos, enlaces, formato de texto enriquecido e incluso metadatos.