Чтение CSV файла с несколькими кодировками

Contents
[ ]

Aspose.Cells предоставляет свойство TxtLoadOptions.is_multi_encoded, которое вам нужно установить в true, чтобы корректно загрузить ваш CSV-файл с несколькими кодировками.

На следующем скриншоте показан пример CSV-файла, который содержит две строки. Первая строка в кодировке ANSI, а вторая строка в кодировке Unicode.

Входной файл
todo:image_alt_text

На следующем скриншоте показано файл XLSX, преобразованный из указанного CSV-файла без установки свойства TxtLoadOptions.is_multi_encoded в true. Как видите, текст Unicode не был преобразован правильно.

Файл вывода 1: не предусмотрены множественные кодировки
todo:image_alt_text

Ниже показан снимок экрана XSLX-файла, преобразованного из приведенного выше CSV-файла после установки свойства TxtLoadOptions.is_multi_encoded в true. Как видите, Юникод-текст теперь конвертирован правильно.

Файл вывода 2: IsMultiEncoded установлен в true
todo:image_alt_text

Ниже приведен образец кода, преобразующий вышеуказанный файл CSV в формат XLSX правильно.

from aspose.cells import SaveFormat, TxtLoadOptions, Workbook
# For complete examples and data files, please go to https:# github.com/aspose-cells/Aspose.Cells-for-.NET
# The path to the documents directory.
dataDir = RunExamples.GetDataDir(".")
filePath = dataDir + "MultiEncoded.csv"
# Set Multi Encoded Property to True
options = TxtLoadOptions()
options.is_multi_encoded = True
# Load the CSV file into Workbook
workbook = Workbook(filePath, options)
# Save it in XLSX format
workbook.save(filePath + ".out.xlsx", SaveFormat.XLSX)