Разделение файлов Excel на несколько файлов
Введение
Существует множество реальных сценариев, в которых разработчику необходимо разбить один файл Excel на несколько файлов меньшего размера. Например, рабочая книга может содержать по одному рабочему листу на каждый отдел, и каждому руководителю отдела необходимо получить только свой собственный лист. В других случаях может потребоваться извлечь конкретную таблицу или блок данных из рабочего листа и отправить его как самостоятельный файл по электронной почте, не раскрывая остальную часть рабочей книги. Большие консолидированные рабочие книги также могут нуждаться в разделении на меньшие части для более удобной обработки, ускорения загрузки или дальнейшей обработки другими системами.
Aspose.Cells предоставляет два гибких подхода для решения этой задачи. Первый подход перебирает каждый рабочий лист в исходной рабочей книге и копирует его содержимое в совершенно новый экземпляр Workbook, сохраняя каждый из них в отдельный файл. Второй подход фокусируется на конкретном диапазоне ячеек внутри рабочего листа и копирует только этот диапазон в новую рабочую книгу. В обоих случаях общий поток одинаков: загрузите исходную рабочую книгу с помощью класса Workbook, получите доступ к нужным данным через объекты Worksheet и Cells, перенесите содержимое в целевую Workbook, а затем сохраните целевую книгу на диск.
Разделение файла Excel путём копирования каждого рабочего листа в новую рабочую книгу
Обзор подхода
В этом подходе исходная рабочая книга открывается один раз, а затем для каждого Worksheet в её коллекции worksheets создаётся новая целевая Workbook. Содержимое исходного рабочего листа затем копируется в первый рабочий лист целевой рабочей книги, и целевая рабочая книга сохраняется как файл, имя которого формируется на основе имени исходного рабочего листа. Результатом является один выходной файл на каждый рабочий лист, при этом каждый выходной файл содержит данные одного исходного листа.
Этот метод является правильным выбором, когда каждый рабочий лист в вашей исходной рабочей книге представляет логически независимую единицу информации (например, отдел, регион, месяц или линейку продуктов) и вы хотите доставить или обработать каждую единицу отдельно.
Шаги
Следующие шаги описывают, как разделить файл Excel путём копирования каждого рабочего листа в новую рабочую книгу:
- Откройте исходный файл Excel, создав экземпляр объекта
Workbookи передав путь к файлу в его конструктор. - Переберите коллекцию
Workbook.worksheetsс помощью циклаfor, чтобы обработать каждыйWorksheetв исходном файле. - Внутри цикла создайте новый экземпляр целевой
Workbook(пустую рабочую книгу) для текущего рабочего листа. - Добавьте новый
Worksheetв целевую рабочую книгу (или используйте первый рабочий лист по умолчанию) и присвойте ему осмысленное имя, в идеале совпадающее со свойствомnameисходного рабочего листа. - Скопируйте содержимое исходного рабочего листа в целевой рабочий лист. Это можно сделать, перебирая ячейки коллекции
Cellsисходного рабочего листа и записывая их значения в соответствующие ячейки целевого рабочего листа, или с помощью методаCells.copyдля переноса всего диапазона за один раз. - Сформируйте путь к выходному файлу, включающий имя исходного рабочего листа (например,
dataDir + worksheet.name + ".xls"), чтобы каждый сгенерированный файл имел уникальное имя. - Вызовите метод
Workbook.saveцелевой рабочей книги, чтобы записать файл на диск. - Повторяйте шаги с 3 по 7 для следующего рабочего листа, пока не будут обработаны все рабочие листы.
Пример кода
import aspose.cells as ac
import os
data_dir = "data/"
workbook = ac.Workbook(data_dir + "book1.xls")
for i in range(workbook.worksheets.count):
source_sheet = workbook.worksheets[i]
sheet_name = source_sheet.name
dest_workbook = ac.Workbook()
dest_index = dest_workbook.worksheets.add()
dest_sheet = dest_workbook.worksheets[dest_index]
dest_sheet.name = sheet_name
dest_sheet.copy(source_sheet)
dest_file = data_dir + sheet_name + ".xls"
dest_workbook.save(dest_file, ac.SaveFormat.EXCEL97_TO_2003)
Ожидаемый результат — набор новых файлов в каталоге данных, по одному файлу на каждый рабочий лист из исходной рабочей книги. Каждый файл назван в честь соответствующего исходного листа и содержит данные (и при необходимости форматирование) этого единственного листа.
Разделение файла Excel путём копирования диапазона в новую рабочую книгу
Обзор подхода
Иногда данные, которые необходимо разделить, соответствуют не всему рабочему листу, а определённой прямоугольной области рабочего листа, такой как A1:D10, или именованному диапазону, представляющему конкретную таблицу. В этих случаях копирование целых рабочих листов является расточительным, и требуется более точный подход: определите исходный диапазон, скопируйте только этот диапазон в новую рабочую книгу и сохраните новый файл.
Этот подход идеален, когда вы хотите извлечь одну таблицу, блок отчёта или область данных из большого рабочего листа, отбросив всё несвязанное содержимое. Он также полезен для экспорта выбранных пользователем областей листа в виде самостоятельных файлов.
Шаги
Следующие шаги описывают, как разделить файл Excel путём копирования определённого диапазона в новую рабочую книгу:
- Откройте исходный файл Excel, создав экземпляр объекта
Workbookс путём к файлу. - Получите целевой
Worksheet, содержащий диапазон, который вы хотите скопировать, либо по индексу (например, первый лист), либо по имени из коллекцииworksheets. - Определите диапазон для копирования. Это может быть жёстко заданный диапазон ячеек, такой как
A1:C10, или именованный диапазон, полученный через коллекциюWorksheet.cells, или диапазон, созданный с помощьюWorksheet.cells.create_range. - Создайте новый экземпляр целевой
Workbook. - Получите доступ к первому
Worksheetцелевой рабочей книги (лист по умолчанию). - Скопируйте исходный диапазон в целевой рабочий лист, как правило, начиная с ячейки
A1. МетодCells.copyколлекцииCellsцелевого листа может использоваться для копирования всего диапазона, или вы можете перебрать ячейки исходного диапазона и записать их значения в ячейки назначения с помощьюput_value. ДополнительныеCopyOptionsмогут быть переданы для управления тем, что переносится (только значения, значения и стили, формулы и т.д.). - Сохраните целевую рабочую книгу по новому пути к файлу на диске с помощью метода
Workbook.save.
Пример кода
import aspose.cells as ac
import os
# Определяем каталог данных и пути к файлам
dataDir = "data/"
sourcePath = os.path.join(dataDir, "book1.xls")
outputPath = os.path.join(dataDir, "outputrange.xls")
# Открываем исходный файл Excel
sourceWorkbook = ac.Workbook(sourcePath)
# Получаем первый рабочий лист из исходной книги
sourceWorksheet = sourceWorkbook.worksheets[0]
# Определяем исходный диапазон ячеек A1:C10 (10 строк, 3 столбца, начиная со строки 0, столбца 0)
sourceRange = sourceWorksheet.cells.create_range(0, 0, 10, 3)
# Создаем новую книгу назначения
destWorkbook = ac.Workbook()
# Получаем доступ к первому рабочему листу в книге назначения
destWorksheet = destWorkbook.worksheets[0]
# Создаем диапазон назначения в A1 с теми же размерами, что и исходный диапазон
destRange = destWorksheet.cells.create_range(0, 0, 10, 3)
# Копируем исходный диапазон в диапазон назначения
destRange.copy(sourceRange)
# Сохраняем книгу назначения в новый файл .xls
destWorkbook.save(outputPath, ac.SaveFormat.EXCEL97_TO2003)
Ожидаемый результат — один новый файл в каталоге данных, который содержит только значения (и при необходимости форматирование) указанного диапазона, извлечённого из исходной рабочей книги. Целевой файл не имеет связи с какими-либо другими данными в исходном файле; он содержит только извлечённый диапазон, начиная с ячейки A1 его первого рабочего листа.