Чтение CSV файла с несколькими кодировками

Contents
[ ]

Aspose.Cells предоставляет метод TxtLoadOptions.setMultiEncoded(), который нужно установить в true, чтобы правильно загрузить ваш CSV-файл с несколькими кодировками.

Ниже показан снимок экрана - образец файла CSV, содержащий две строки. Первая строка закодирована в ANSI, а вторая - в Unicode

Входной файл

todo:image_alt_text

Ниже показан снимок экрана - файл XLSX, преобразованный из вышеуказанного файла CSV без установки метода TxtLoadOptions.setMultiEncoded() в true. Как видно, Юникод-текст не был правильно преобразован.

Выходной файл 1: не сделано никаких упоров на несколько кодировок

todo:image_alt_text

Ниже показан снимок экрана - файл XSLX, преобразованный из вышеуказанного файла CSV после установки метода TxtLoadOptions.setMultiEncoded() в true. Как видно, Юникод-текст теперь преобразован правильно.

Выходной файл 2: IsMultiEncoded установлено в true

todo:image_alt_text

Ниже приведен образец кода, преобразующий вышеуказанный файл CSV в формат XLSX правильно.

Java

 String filePath = "F:\\Downloads\\MutliEncoded.csv";

//Set Multi Encoded Property to True

TxtLoadOptions options = new TxtLoadOptions();

options.setMultiEncoded(true);

//Load the CSV file into Workbook

Workbook workbook = new Workbook(filePath, options);

//Save it in XLSX format

workbook.save(filePath + ".out.xlsx", SaveFormat.XLSX);