Разделение файлов Excel на несколько файлов
Введение
Существует множество реальных сценариев, в которых разработчику необходимо разбить один файл Excel на несколько более мелких файлов. Например, рабочая книга может содержать по одному рабочему листу на отдел, и каждому руководителю отдела нужно получить только свой лист. В других случаях вам может потребоваться извлечь определённую таблицу или блок данных из рабочего листа и отправить его как отдельный файл по электронной почте, не раскрывая остальную часть рабочей книги. Большие консолидированные рабочие книги также могут быть разделены на более мелкие части для облегчения обработки, ускорения загрузки или последующей обработки другими системами.
Aspose.Cells предоставляет два гибких подхода для решения этой задачи. Первый подход перебирает каждый рабочий лист в исходной рабочей книге и копирует его содержимое в совершенно новый экземпляр Workbook, сохраняя каждый в виде отдельного файла. Второй подход фокусируется на определённом диапазоне ячеек внутри рабочего листа и копирует только этот диапазон в новую рабочую книгу. В обоих случаях общий процесс одинаков: загрузить исходную рабочую книгу с помощью класса Workbook, получить доступ к соответствующим данным через объекты Worksheet и Cells, перенести содержимое в целевую Workbook, а затем сохранить целевую на диск.
Разделение файла Excel путём копирования каждого рабочего листа в новую рабочую книгу
Обзор подхода
В этом подходе исходная рабочая книга открывается один раз, а затем для каждого Worksheet в её коллекции Worksheets создаётся новая целевая Workbook. Содержимое исходного рабочего листа затем копируется в первый рабочий лист целевой рабочей книги, и целевая рабочая книга сохраняется как файл, имя которого формируется на основе имени исходного рабочего листа. Результатом является один выходной файл на каждый рабочий лист, при этом каждый выходной файл содержит данные одного исходного листа.
Этот метод является правильным выбором, когда каждый рабочий лист в вашей исходной рабочей книге представляет логически независимую единицу информации (например, отдел, регион, месяц или линейку продуктов), и вы хотите доставить или обработать каждую единицу отдельно.
Шаги
Следующие шаги описывают, как разделить файл Excel путём копирования каждого рабочего листа в новую рабочую книгу:
- Откройте исходный файл Excel, создав экземпляр объекта
Workbookи передав путь к файлу в его конструктор. - Переберите коллекцию
Workbook.Worksheetsс помощью циклаforилиforeach, чтобы был обработан каждыйWorksheetв исходном файле. - Внутри цикла создайте новый экземпляр целевой
Workbook(пустую рабочую книгу) для текущего рабочего листа. - Добавьте новый
Worksheetв целевую рабочую книгу (или используйте первый рабочий лист по умолчанию) и присвойте ему осмысленное имя, в идеале совпадающее со свойствомNameисходного рабочего листа. - Скопируйте содержимое исходного рабочего листа в целевой рабочий лист. Это можно сделать, перебирая ячейки коллекции
Cellsисходного рабочего листа и записывая их значения в соответствующие ячейки целевого рабочего листа, или используя методCells.copyдля переноса всего диапазона сразу. - Сформируйте путь к выходному файлу, включающий имя исходного рабочего листа (например,
dataDir + worksheet.Name + ".xls"), чтобы каждый сгенерированный файл имел уникальное имя. - Вызовите метод
Workbook.saveцелевой рабочей книги, чтобы записать файл на диск. - Повторяйте шаги с 3 по 7 для следующего рабочего листа, пока не будут обработаны все рабочие листы.
Пример кода
import jpype
import asposecells
jpype.startJVM()
from asposecells.api import Workbook
from asposecells.api import Workbook, Worksheet, Cells, Range, SaveFormat
dataDir = "data/"
workbook = Workbook(dataDir + "book1.xls")
for i in range(workbook.getWorksheets().getCount()):
sourceSheet = workbook.getWorksheets().get(i)
sheetName = sourceSheet.getName()
destWorkbook = Workbook()
destIndex = destWorkbook.getWorksheets().add()
destSheet = destWorkbook.getWorksheets().get(destIndex)
destSheet.setName(sheetName)
destSheet.copy(sourceSheet)
destFile = dataDir + sheetName + ".xls"
destWorkbook.save(destFile, SaveFormat.Excel97To2003)
jpype.shutdownJVM()
Ожидаемым результатом является набор новых файлов в каталоге данных, по одному файлу на каждый рабочий лист из исходной рабочей книги. Каждый файл назван в честь соответствующего исходного листа, и файл содержит данные (и при необходимости форматирование) этого единственного листа.
Разделение файла Excel путём копирования диапазона в новую рабочую книгу
Обзор подхода
Иногда данные, которые вам нужно разделить, соответствуют не всему рабочему листу, а определённой прямоугольной области рабочего листа, такой как A1:D10, или именованному диапазону, представляющему конкретную таблицу. В этих случаях копирование целых рабочих листов является расточительным, и требуется более точный подход: определите исходный диапазон, скопируйте только этот диапазон в новую рабочую книгу и сохраните новый файл.
Этот подход идеален, когда вы хотите извлечь одну таблицу, блок отчёта или область данных из большого рабочего листа, отбросив всё несвязанное содержимое. Он также полезен для экспорта выбранных пользователем областей листа в виде отдельных файлов.
Шаги
Следующие шаги описывают, как разделить файл Excel путём копирования определённого диапазона в новую рабочую книгу:
- Откройте исходный файл Excel, создав экземпляр объекта
Workbookс путём к файлу. - Получите целевой
Worksheet, содержащий диапазон, который вы хотите скопировать, либо по индексу (например, первый лист), либо по имени из коллекцииWorksheets. - Определите диапазон для копирования. Это может быть жёстко заданный диапазон ячеек, такой как
A1:C10, или именованный диапазон, полученный через коллекциюWorksheet.Cells, или диапазон, созданный с помощьюWorksheet.Cells.createRange. - Создайте новый экземпляр целевой
Workbook. - Получите доступ к первому
Worksheetцелевой рабочей книги (лист по умолчанию). - Скопируйте исходный диапазон в целевой рабочий лист, как правило, начиная с ячейки
A1. МетодCells.copyколлекцииCellsназначения может использоваться для копирования всего диапазона, или вы можете перебрать ячейки исходного диапазона и записать их значения в ячейки назначения с помощьюputValue. При необходимости могут быть предоставленыCopyOptionsдля управления тем, что переносится (только значения, значения и стили, формулы и так далее). - Сохраните целевую рабочую книгу по новому пути к файлу на диске с помощью метода
Workbook.save.
Пример кода
import jpype
import asposecells
jpype.startJVM()
from asposecells.api import Workbook
from asposecells.api import Workbook, Worksheet, Cells, Range, SaveFormat
# Определение директории данных и путей к файлам
dataDir = "data/"
sourcePath = dataDir + "book1.xls"
outputPath = dataDir + "outputrange.xls"
# Открытие исходного Excel-файла
sourceWorkbook = Workbook(sourcePath)
# Получение первого рабочего листа из исходной рабочей книги
sourceWorksheet = sourceWorkbook.getWorksheets().get(0)
# Определение исходного диапазона ячеек A1:C10 (10 строк, 3 столбца, начиная со строки 0, столбца 0)
sourceRange = sourceWorksheet.getCells().createRange(0, 0, 10, 3)
# Создание новой рабочей книги назначения
destWorkbook = Workbook()
# Доступ к первому рабочему листу в рабочей книге назначения
destWorksheet = destWorkbook.getWorksheets().get(0)
# Создание диапазона назначения в A1 с теми же размерами, что и исходный диапазон
destRange = destWorksheet.getCells().createRange(0, 0, 10, 3)
# Копирование исходного диапазона в диапазон назначения
destRange.copy(sourceRange)
# Сохранение рабочей книги назначения в новый файл .xls
destWorkbook.save(outputPath, SaveFormat.Excel97To2003)
jpype.shutdownJVM()
Ожидаемым результатом является один новый файл в каталоге данных, который содержит только значения (и при необходимости форматирование) указанного диапазона, извлечённого из исходной рабочей книги. Целевой файл не имеет связи с какими-либо другими данными в исходном файле; он содержит только извлечённый диапазон, начиная с ячейки A1 своего первого рабочего листа.