将 Excel 文件拆分为多个文件
介绍
在许多实际场景中,开发人员需要将单个 Excel 文件拆分为几个较小的文件。例如,一个工作簿可能每个部门包含一个工作表,每个部门主管只需要接收他们自己的工作表。在其他情况下,您可能希望从工作表中提取特定的表格或数据块,并通过电子邮件将其作为独立文件发送,而不暴露工作簿的其余部分。大型合并工作簿也可能需要拆分为较小的部分,以便于处理、更快地加载,或由其他系统进行下游处理。
Aspose.Cells 为此任务提供了两种灵活的方法。第一种方法是迭代源工作簿中的每个工作表,并将其内容复制到一个全新的 Workbook 实例中,然后将每个工作表另存为一个单独的文件。第二种方法专注于工作表中的特定单元格区域,仅将该区域复制到一个新的工作簿中。在这两种情况下,一般流程是相同的:使用 Workbook 类加载源工作簿,通过 Worksheet 和 Cells 对象访问相关数据,将内容传输到目标 Workbook,然后将目标保存到磁盘。
通过将每个工作表复制到新工作簿来拆分 Excel 文件
方法概述
在这种方法中,源工作簿被打开一次,然后针对其 worksheets 集合中的每个 Worksheet,创建一个新的目标 Workbook。然后将源工作表的内容复制到目标工作簿的第一个工作表中,并将目标工作簿另存为一个文件名源自源工作表名称的文件。结果是每个工作表对应一个输出文件,每个输出文件包含单个源工作表的数据。
当源工作簿中的每个工作表代表一个逻辑上独立的信息单元(例如部门、地区、月份或产品线),并且您希望单独交付或处理每个单元时,此方法是正确的选择。
步骤
以下步骤描述了如何通过将每个工作表复制到新工作簿来拆分 Excel 文件:
- 通过实例化一个
Workbook对象并将文件路径传递给其构造函数来打开源 Excel 文件。 - 使用
for循环遍历Workbook.worksheets集合,以便处理源文件中的每个Worksheet。 - 在循环内部,为当前工作表创建一个新的目标
Workbook实例(一个空工作簿)。 - 向目标工作簿添加一个新的
Worksheet(或使用默认的第一个工作表),并为其分配一个有意义的名称,理想情况下与源工作表的name属性相同。 - 将源工作表的内容复制到目标工作表中。这可以通过迭代源工作表
Cells集合中的单元格并将其值写入目标工作表的相应单元格来完成,或者使用Cells.copy方法一次性传输整个区域。 - 构造一个包含源工作表名称的输出文件路径(例如
dataDir + worksheet.name + ".xls"),以便每个生成的文件具有唯一的名称。 - 调用目标的
Workbook.save方法将文件写入磁盘。 - 对下一个工作表重复步骤 3 至 7,直到处理完所有工作表。
代码示例
import aspose.cells as ac
import os
data_dir = "data/"
workbook = ac.Workbook(data_dir + "book1.xls")
for i in range(workbook.worksheets.count):
source_sheet = workbook.worksheets[i]
sheet_name = source_sheet.name
dest_workbook = ac.Workbook()
dest_index = dest_workbook.worksheets.add()
dest_sheet = dest_workbook.worksheets[dest_index]
dest_sheet.name = sheet_name
dest_sheet.copy(source_sheet)
dest_file = data_dir + sheet_name + ".xls"
dest_workbook.save(dest_file, ac.SaveFormat.EXCEL97_TO_2003)
预期输出是数据目录中的一组新文件,每个文件对应源工作簿中的一个工作表。每个文件以其对应的源工作表命名,文件包含该单个工作表的数据(以及可选的格式)。
通过将区域复制到新工作簿来拆分 Excel 文件
方法概述
有时您需要拆分的数据并不对应于整个工作表,而是对应于工作表中的特定矩形区域,例如 A1:D10 或代表特定表格的命名区域。在这些情况下,复制整个工作表是浪费的,需要更精确的方法:识别源区域,仅将该区域复制到一个新的工作簿中,然后保存新文件。
当您希望从较大的工作表中提取单个表格、报表块或数据区域,同时丢弃所有不相关的内容时,此方法是理想的选择。它还可用于将用户选择的区域作为独立文件导出。
步骤
以下步骤描述了如何通过将特定区域复制到新工作簿来拆分 Excel 文件:
- 通过使用文件路径实例化一个
Workbook对象来打开源 Excel 文件。 - 检索包含您要复制的区域的目标
Worksheet,可以通过索引(例如第一个工作表)或通过worksheets集合中的名称来获取。 - 识别要复制的区域。这可以是硬编码的单元格区域,例如
A1:C10,也可以是通过Worksheet.cells集合获取的命名区域,或者是通过Worksheet.cells.create_range创建的区域。 - 创建一个新的目标
Workbook实例。 - 访问目标工作簿的第一个
Worksheet(默认工作表)。 - 将源区域复制到目标工作表中,通常从单元格
A1开始。可以使用目标Cells集合上的Cells.copy方法来复制整个区域,或者您可以迭代源区域的单元格并使用put_value将其值写入目标单元格。可以提供可选的CopyOptions来控制传输的内容(仅值、值和样式、公式等)。 - 使用
Workbook.save方法将目标工作簿保存到磁盘上的新文件路径。
代码示例
import aspose.cells as ac
import os
# 定义数据目录和文件路径
dataDir = "data/"
sourcePath = os.path.join(dataDir, "book1.xls")
outputPath = os.path.join(dataDir, "outputrange.xls")
# 打开源 Excel 文件
sourceWorkbook = ac.Workbook(sourcePath)
# 从源工作簿中获取第一个工作表
sourceWorksheet = sourceWorkbook.worksheets[0]
# 定义源单元格区域 A1:C10(从第 0 行第 0 列开始的 10 行 3 列)
sourceRange = sourceWorksheet.cells.create_range(0, 0, 10, 3)
# 创建一个新的目标工作簿
destWorkbook = ac.Workbook()
# 访问目标工作簿中的第一个工作表
destWorksheet = destWorkbook.worksheets[0]
# 在 A1 位置创建与源区域相同尺寸的目标区域
destRange = destWorksheet.cells.create_range(0, 0, 10, 3)
# 将源区域复制到目标区域
destRange.copy(sourceRange)
# 将目标工作簿保存为新的 .xls 文件
destWorkbook.save(outputPath, ac.SaveFormat.EXCEL97_TO2003)
预期输出是数据目录中的一个新文件,其中仅包含从源工作簿中提取的指定区域的值(以及可选的格式)。目标文件与源文件中的任何其他数据没有关系;它仅包含提取的区域,从其第一个工作表的单元格 A1 开始。