Lectura y escritura de archivos DBF

Introducción

DBF (DataBase File) es un formato de archivo de base de datos heredado introducido originalmente por dBASE a principios de la década de 1980. A pesar de la antigüedad del formato, los archivos DBF todavía se utilizan ampliamente en muchas industrias para almacenar datos estructurados, particularmente en contabilidad, SIG y otras aplicaciones especializadas. Aspose.Cells le permite integrar estos archivos heredados en flujos de trabajo modernos de hojas de cálculo de Python a través de .NET de forma fluida.

La biblioteca admite tanto la lectura como la escritura de archivos DBF, lo que le brinda la capacidad de:

  • Importar datos desde archivos DBF existentes a objetos Workbook de Aspose.Cells para su posterior procesamiento o conversión a otros formatos.
  • Crear nuevos archivos DBF desde cero o transformando datos desde otros formatos de hojas de cálculo.
  • Mantener las definiciones de campos, tipos de datos y estructuras de registros al transferir datos dentro y fuera del formato DBF.

Los archivos DBF también se pueden abrir directamente en Microsoft Excel y otras aplicaciones de hojas de cálculo, lo que los convierte en un puente conveniente entre los sistemas heredados y las herramientas modernas de hojas de cálculo.

Versiones y características de DBF compatibles

Aspose.Cells admite las siguientes versiones del formato DBF:

  • dBASE III — La variante original y más ampliamente compatible del formato DBF.
  • dBASE IV — Una versión extendida que admite tipos de datos adicionales y tamaños de campo más grandes.

Características compatibles

La biblioteca ofrece soporte integral para las siguientes operaciones:

  • Lectura de datos DBF en un objeto Workbook, con todos los registros y definiciones de campos conservados.
  • Escritura de datos del libro de trabajo de vuelta al formato DBF para exportarlos a aplicaciones compatibles con dBASE.
  • Manejo de tipos de datos comunes utilizados en archivos DBF, incluyendo campos de carácter, numéricos, de fecha y lógicos.
  • Preservación de las definiciones de campos, como el nombre del campo, el tipo y la longitud, durante las operaciones de lectura/escritura.

Limitaciones y consideraciones

Cuando trabaje con archivos DBF, tenga en cuenta las siguientes restricciones:

  • El número máximo de campos por archivo es 128.
  • El tamaño máximo de registro es 4000 bytes.
  • Los nombres de los campos están limitados a 10 caracteres, deben estar en mayúsculas y no pueden contener espacios.
  • Los valores de fecha en los archivos DBF se almacenan en formato YYYYMMDD.
  • La codificación de caracteres puede variar según la aplicación de origen (comúnmente Windows-1252 o páginas de códigos OEM).

Lectura de un archivo DBF

Aspose.Cells facilita la carga de datos desde un archivo DBF en un objeto Workbook. La biblioteca utiliza la clase LoadOptions para especificar el formato de origen, lo que garantiza que los datos se interpreten correctamente durante el proceso de carga.

Lectura de un archivo DBF con Aspose.Cells

Para leer un archivo DBF, necesita crear una instancia de LoadOptions, establecer su propiedad load_format en LoadFormat.DBF y pasarla al constructor de Workbook junto con la ruta del archivo. Una vez cargado, los datos se vuelven accesibles a través de la colección worksheets, donde puede iterar a través de las celdas, extraer valores o manipular los datos según sea necesario.

El siguiente ejemplo demuestra cómo cargar un archivo DBF existente en Aspose.Cells, acceder a su primera hoja de cálculo y leer los valores de las celdas.

import os
import aspose.cells as ac

data_dir = "Data/"
file_path = os.path.join(data_dir, "example.dbf")

load_options = ac.LoadOptions(ac.LoadFormat.DBF)

workbook = ac.Workbook(file_path, load_options)

worksheet = workbook.worksheets[0]

cells = worksheet.cells

lines = []

max_row = cells.max_data_row
max_col = cells.max_data_column

for i in range(max_row + 1):
    line_parts = []
    for j in range(max_col + 1):
        cell = cells[i, j]
        value = cell.string_value
        line_parts.append("|" + value)
    line_parts.append("|")
    lines.append("".join(line_parts))

result = "\n".join(lines) + ("\n" if lines else "")
print(result)

output_path = os.path.join(data_dir, "output.xlsx")
workbook.save(output_path, ac.SaveFormat.XLSX)

print("DBF file loaded successfully. Converted XLSX saved at: " + output_path)

Escritura de un archivo DBF

La escritura de datos en un archivo DBF sigue un patrón similar al de guardar cualquier otro formato de hoja de cálculo con Aspose.Cells. Crea o carga un Workbook, rellena la hoja de cálculo con datos y luego llama al método save especificando SaveFormat.DBF como formato de destino.

Escritura de un archivo DBF con Aspose.Cells

Para crear un archivo DBF, siga estos pasos:

  1. Cree una nueva instancia de Workbook.
  2. Acceda a la primera hoja de cálculo desde la colección worksheets.
  3. Rellene la hoja de cálculo con sus datos, incluyendo encabezados en la primera fila y registros en las filas siguientes.
  4. Llame al método Workbook.save, pasando la ruta del archivo y SaveFormat.DBF como parámetros.

El siguiente ejemplo demuestra cómo crear un nuevo archivo DBF desde cero. Rellena una hoja de cálculo con datos de muestra que contienen diferentes tipos de datos (cadenas, números y fechas) para ilustrar cómo se manejan los tipos de campo al exportar al formato DBF.

from datetime import datetime

outputDir = r"C:\Output\\"
filePath = os.path.join(outputDir, "output.dbf")

if not os.path.exists(outputDir):
    os.makedirs(outputDir, exist_ok=True)

workbook = ac.Workbook()
worksheet = workbook.worksheets[0]
cells = worksheet.cells

# Encabezados de columna
cells[0, 0].put_value("ID")
cells[0, 1].put_value("Name")
cells[0, 2].put_value("Department")
cells[0, 3].put_value("Salary")
cells[0, 4].put_value("HireDate")

# Fila de datos 1
cells[1, 0].put_value(101)
cells[1, 1].put_value("John Smith")
cells[1, 2].put_value("Engineering")
cells[1, 3].put_value(75000.50)
cells[1, 4].put_value(datetime(2020, 3, 15))

# Fila de datos 2
cells[2, 0].put_value(102)
cells[2, 1].put_value("Jane Doe")
cells[2, 2].put_value("Marketing")
cells[2, 3].put_value(68000.75)
cells[2, 4].put_value(datetime(2019, 7, 22))

# Fila de datos 3
cells[3, 0].put_value(103)
cells[3, 1].put_value("Bob Johnson")
cells[3, 2].put_value("Finance")
cells[3, 3].put_value(82000.00)
cells[3, 4].put_value(datetime(2021, 1, 10))

# Fila de datos 4
cells[4, 0].put_value(104)
cells[4, 1].put_value("Alice Brown")
cells[4, 2].put_value("Human Resources")
cells[4, 3].put_value(71000.25)
cells[4, 4].put_value(datetime(2018, 11, 5))

# Fila de datos 5
cells[5, 0].put_value(105)
cells[5, 1].put_value("Charlie Wilson")
cells[5, 2].put_value("Operations")
cells[5, 3].put_value(79500.80)
cells[5, 4].put_value(datetime(2022, 5, 30))

# Establecer anchos de columna para mejor legibilidad
worksheet.cells.set_column_width(0, 8)
worksheet.cells.set_column_width(1, 20)
worksheet.cells.set_column_width(2, 20)
worksheet.cells.set_column_width(3, 12)
worksheet.cells.set_column_width(4, 14)

workbook.save(filePath, ac.SaveFormat.Dbf)

Consideraciones sobre tipos de datos y formato

Al transferir datos entre Aspose.Cells y el formato DBF, es importante comprender cómo se asignan los tipos de datos entre los dos sistemas para garantizar la integridad de los datos.

Tipos de celda a tipos de campo DBF

Los valores de celda de Aspose.Cells se convierten automáticamente a los tipos de campo DBF apropiados al guardar:

  • Las cadenas se asignan a campos de carácter (C).
  • Los valores numéricos (enteros y decimales) se asignan a campos numéricos (N).
  • Los valores de fecha se asignan a campos de fecha (D) en formato YYYYMMDD.
  • Los valores booleanos se asignan a campos lógicos (L).

Codificación

Los archivos DBF pueden usar diferentes codificaciones de caracteres según la aplicación que los haya creado. Aspose.Cells maneja la codificación de forma transparente en la mayoría de los casos, pero si encuentra problemas de visualización de caracteres, es posible que necesite verificar la codificación del archivo de origen.

Reglas para nombres de campos

Los nombres de los campos DBF deben cumplir las siguientes reglas:

  • Longitud máxima de 10 caracteres.
  • Deben comenzar con una letra.
  • No pueden contener espacios ni caracteres especiales.
  • Se almacenan en mayúsculas independientemente del caso utilizado en la entrada.

Verificación de la salida

Después de escribir un archivo DBF, puede verificar el resultado abriéndolo en Microsoft Excel o en cualquier aplicación compatible con dBASE. Los datos deben aparecer en un diseño tabular con los nombres de los campos como encabezados de columna y los registros rellenados según los datos proporcionados.

Conversión entre DBF y otros formatos

Uno de los casos de uso más prácticos para la lectura y escritura de archivos DBF con Aspose.Cells es la conversión de datos entre el formato DBF y formatos modernos de hojas de cálculo como XLSX, XLS o CSV. Dado que Aspose.Cells admite una amplia gama de formatos, puede cargar fácilmente un archivo DBF y guardarlo en cualquier otro formato compatible, o viceversa.

Por ejemplo, puede leer un archivo DBF, aplicar formato o cálculos usando la API de Aspose.Cells y luego guardar el resultado como un archivo XLSX para distribuirlo a usuarios que trabajan con aplicaciones modernas de hojas de cálculo. Por el contrario, puede tomar datos de un archivo XLSX o CSV y exportarlos al formato DBF para integrarlos con sistemas heredados.