Чтение и запись файлов DBF

Введение

DBF (DataBase File) — это устаревший формат файлов баз данных, первоначально представленный dBASE в начале 1980-х годов. Несмотря на возраст формата, файлы DBF по-прежнему широко используются во многих отраслях для хранения структурированных данных, особенно в бухгалтерском учёте, ГИС и других специализированных приложениях. Aspose.Cells позволяет легко интегрировать эти устаревшие файлы в современные рабочие процессы работы с электронными таблицами на Java.

Библиотека поддерживает как чтение, так и запись файлов DBF, предоставляя вам возможность:

  • Импортировать данные из существующих файлов DBF в объекты Workbook Aspose.Cells для дальнейшей обработки или преобразования в другие форматы.
  • Создавать новые файлы DBF с нуля или путём преобразования данных из других форматов электронных таблиц.
  • Сохранять определения полей, типы данных и структуры записей при передаче данных в формат DBF и из него.

Файлы DBF также можно открывать непосредственно в Microsoft Excel и других приложениях для работы с электронными таблицами, что делает их удобным мостом между устаревшими системами и современными инструментами для работы с электронными таблицами.

Поддерживаемые версии и функции DBF

Aspose.Cells поддерживает следующие версии формата DBF:

  • dBASE III — оригинальный и наиболее широко поддерживаемый вариант формата DBF.
  • dBASE IV — расширенная версия, которая поддерживает дополнительные типы данных и поля большего размера.

Поддерживаемые функции

Библиотека обеспечивает комплексную поддержку следующих операций:

  • Чтение данных DBF в объект Workbook с сохранением всех записей и определений полей.
  • Запись данных рабочей книги обратно в формат DBF для экспорта в приложения, совместимые с dBASE.
  • Обработка общих типов данных, используемых в файлах DBF, включая символьные, числовые поля, поля даты и логические поля.
  • Сохранение определений полей, таких как имя поля, тип и длина, во время операций чтения/записи.

Ограничения и особенности

При работе с файлами DBF учитывайте следующие ограничения:

  • Максимальное количество полей в файле — 128.
  • Максимальный размер записи — 4000 байт.
  • Имена полей ограничены 10 символами, должны быть в верхнем регистре и не могут содержать пробелов.
  • Значения дат в файлах DBF хранятся в формате YYYYMMDD.
  • Кодировка символов может различаться в зависимости от исходного приложения (обычно Windows-1252 или OEM-кодировки).

Чтение файла DBF

Aspose.Cells упрощает загрузку данных из файла DBF в объект Workbook. Библиотека использует класс LoadOptions для указания исходного формата, обеспечивая правильную интерпретацию данных в процессе загрузки.

Чтение файла DBF с помощью Aspose.Cells

Чтобы прочитать файл DBF, необходимо создать экземпляр LoadOptions, установить его свойство LoadFormat в значение LoadFormat.Dbf и передать его в конструктор Workbook вместе с путём к файлу. После загрузки данные становятся доступными через коллекцию getWorksheets(), где вы можете перебирать ячейки, извлекать значения или обрабатывать данные по мере необходимости.

Следующий пример демонстрирует, как загрузить существующий файл DBF в Aspose.Cells, получить доступ к первому рабочему листу и прочитать значения ячеек.

import com.aspose.cells.*;
import java.io.File;

String dataDir = "Data/";
String filePath = new File(new File(dataDir), "example.dbf").getPath();

LoadOptions loadOptions = new LoadOptions(LoadFormat.DBF);

Workbook workbook = new Workbook(filePath, loadOptions);

Worksheet worksheet = workbook.getWorksheets().get(0);

Cells cells = worksheet.getCells();

StringBuilder sb = new StringBuilder();

int maxRow = cells.getMaxDataRow();
int maxCol = cells.getMaxDataColumn();

for (int i = 0; i <= maxRow; i++)
{
    for (int j = 0; j <= maxCol; j++)
    {
        Cell cell = cells.get(i, j);
        String value = cell.getStringValue();
        sb.append("|").append(value);
    }
    sb.append("|").append(System.lineSeparator());
}

System.out.println(sb.toString());

String outputPath = new File(new File(dataDir), "output.xlsx").getPath();
workbook.save(outputPath, SaveFormat.XLSX);

System.out.println("DBF file loaded successfully. Converted XLSX saved at: " + outputPath);

Запись файла DBF

Запись данных в файл DBF выполняется по тому же принципу, что и сохранение в любом другом формате электронных таблиц с помощью Aspose.Cells. Вы создаёте или загружаете Workbook, заполняете рабочий лист данными, а затем вызываете метод save, указывая SaveFormat.Dbf в качестве целевого формата.

Запись файла DBF с помощью Aspose.Cells

Чтобы создать файл DBF, выполните следующие шаги:

  1. Создайте новый экземпляр Workbook.
  2. Получите доступ к первому рабочему листу из коллекции getWorksheets().
  3. Заполните рабочий лист данными, включая заголовки в первой строке и записи в последующих строках.
  4. Вызовите метод Workbook.save, передав путь к файлу и SaveFormat.Dbf в качестве параметров.

Следующий пример демонстрирует, как создать новый файл DBF с нуля. Он заполняет рабочий лист образцами данных, содержащими различные типы данных (строки, числа и даты), чтобы показать, как обрабатываются типы полей при экспорте в формат DBF.

import com.aspose.cells.*;
import java.io.File;
import java.util.GregorianCalendar;

String outputDir = "C:\\Output\\";
String filePath = new File(new File(outputDir), "output.dbf").getPath();

if (!new File(outputDir).exists())
{
    new File(outputDir).mkdirs();
}

Workbook workbook = new Workbook();
Worksheet worksheet = workbook.getWorksheets().get(0);
Cells cells = worksheet.getCells();

// Заголовки столбцов
cells.get(0, 0).putValue("ID");
cells.get(0, 1).putValue("Name");
cells.get(0, 2).putValue("Department");
cells.get(0, 3).putValue("Salary");
cells.get(0, 4).putValue("HireDate");

// Строка данных 1
cells.get(1, 0).putValue(101);
cells.get(1, 1).putValue("John Smith");
cells.get(1, 2).putValue("Engineering");
cells.get(1, 3).putValue(75000.50);
cells.get(1, 4).putValue(new GregorianCalendar(2020, 2, 15).getTime());

// Строка данных 2
cells.get(2, 0).putValue(102);
cells.get(2, 1).putValue("Jane Doe");
cells.get(2, 2).putValue("Marketing");
cells.get(2, 3).putValue(68000.75);
cells.get(2, 4).putValue(new GregorianCalendar(2019, 6, 22).getTime());

// Строка данных 3
cells.get(3, 0).putValue(103);
cells.get(3, 1).putValue("Bob Johnson");
cells.get(3, 2).putValue("Finance");
cells.get(3, 3).putValue(82000.00);
cells.get(3, 4).putValue(new GregorianCalendar(2021, 0, 10).getTime());

// Строка данных 4
cells.get(4, 0).putValue(104);
cells.get(4, 1).putValue("Alice Brown");
cells.get(4, 2).putValue("Human Resources");
cells.get(4, 3).putValue(71000.25);
cells.get(4, 4).putValue(new GregorianCalendar(2018, 10, 5).getTime());

// Строка данных 5
cells.get(5, 0).putValue(105);
cells.get(5, 1).putValue("Charlie Wilson");
cells.get(5, 2).putValue("Operations");
cells.get(5, 3).putValue(79500.80);
cells.get(5, 4).putValue(new GregorianCalendar(2022, 4, 30).getTime());

// Установка ширины столбцов для лучшей читаемости
worksheet.getCells().setColumnWidth(0, 8);
worksheet.getCells().setColumnWidth(1, 20);
worksheet.getCells().setColumnWidth(2, 20);
worksheet.getCells().setColumnWidth(3, 12);
worksheet.getCells().setColumnWidth(4, 14);

workbook.save(filePath, SaveFormat.DBF);

Особенности типов данных и форматирования

При передаче данных между Aspose.Cells и форматом DBF важно понимать, как типы данных сопоставляются между двумя системами, чтобы обеспечить целостность данных.

Типы ячеек и типы полей DBF

Значения ячеек Aspose.Cells автоматически преобразуются в соответствующие типы полей DBF при сохранении:

  • Строки сопоставляются с символьными (C) полями.
  • Числовые значения (целые числа и десятичные дроби) сопоставляются с числовыми (N) полями.
  • Значения дат сопоставляются с полями даты (D) в формате YYYYMMDD.
  • Логические значения сопоставляются с логическими (L) полями.

Кодировка

Файлы DBF могут использовать различные кодировки символов в зависимости от приложения, в котором они были созданы. Aspose.Cells обрабатывает кодировку прозрачно в большинстве случаев, но если у вас возникают проблемы с отображением символов, может потребоваться проверить кодировку исходного файла.

Правила именования полей

Имена полей DBF должны соответствовать следующим правилам:

  • Максимальная длина — 10 символов.
  • Должны начинаться с буквы.
  • Не могут содержать пробелы или специальные символы.
  • Сохраняются в верхнем регистре независимо от регистра, использованного при вводе.

Проверка результата

После записи файла DBF вы можете проверить результат, открыв его в Microsoft Excel или любом приложении, совместимом с dBASE. Данные должны отображаться в табличном виде с именами полей в качестве заголовков столбцов и записями, заполненными в соответствии с предоставленными вами данными.

Преобразование между DBF и другими форматами

Одним из наиболее практичных вариантов использования чтения и записи файлов DBF с помощью Aspose.Cells является преобразование данных между форматом DBF и современными форматами электронных таблиц, такими как XLSX, XLS или CSV. Поскольку Aspose.Cells поддерживает широкий спектр форматов, вы можете легко загрузить файл DBF и сохранить его в любом другом поддерживаемом формате, или наоборот.

Например, вы можете прочитать файл DBF, применить форматирование или вычисления с помощью API Aspose.Cells, а затем сохранить результат в виде файла XLSX для распространения среди пользователей, работающих с современными приложениями для электронных таблиц. И наоборот, вы можете взять данные из файла XLSX или CSV и экспортировать их в формат DBF для интеграции с устаревшими системами.