Optimización del uso de memoria al trabajar con archivos grandes que contienen conjuntos de datos extensos
Al construir un libro de trabajo con grandes conjuntos de datos o al leer un archivo de Excel grande, la cantidad total de RAM que usará el proceso siempre es una preocupación. Hay medidas que se pueden adaptar para afrontar el desafío. Aspose.Cells para Python via .NET proporciona algunas opciones relevantes y llamadas a la API para reducir y optimizar el uso de memoria. Además, puede ayudar a que el proceso funcione de manera más eficiente y más rápido.
Utilice la opción MemorySetting.MEMORY_PREFERENCE para optimizar el uso de memoria para los datos de las celdas y disminuir el costo total de memoria. Al construir un conjunto de datos grande para las celdas, se puede ahorrar una cierta cantidad de memoria en comparación con el uso de la configuración predeterminada (MemorySetting.NORMAL).
Optimización de memoria
Lectura de archivos Excel grandes
El siguiente ejemplo muestra cómo leer un archivo grande de Microsoft Excel en modo optimizado.
from aspose.cells import LoadOptions, MemorySetting, Workbook | |
# For complete examples and data files, please go to https:# github.com/aspose-cells/Aspose.Cells-for-.NET | |
# The path to the documents directory. | |
dataDir = RunExamples.GetDataDir(".") | |
# Specify the LoadOptions | |
opt = LoadOptions() | |
# Set the memory preferences | |
opt.memory_setting = MemorySetting.MEMORY_PREFERENCE | |
# Instantiate the Workbook | |
# Load the Big Excel file having large Data set in it | |
wb = Workbook(dataDir + "Book1.xlsx", opt) |
Escribiendo Archivos de Excel Grandes
El siguiente ejemplo muestra cómo escribir un conjunto de datos grande en una hoja de trabajo en modo optimizado.
from aspose.cells import MemorySetting, Workbook | |
# For complete examples and data files, please go to https:# github.com/aspose-cells/Aspose.Cells-for-.NET | |
# The path to the documents directory. | |
dataDir = RunExamples.GetDataDir(".") | |
# Instantiate a new Workbook | |
wb = Workbook() | |
# Set the memory preferences | |
# Note: This setting cannot take effect for the existing worksheets that are created before using the below line of code | |
wb.settings.memory_setting = MemorySetting.MEMORY_PREFERENCE | |
# Note: The memory settings also would not work for the default sheet i.e., "Sheet1" etc. automatically created by the Workbook | |
# To change the memory setting of existing sheets, please change memory setting for them manually: | |
cells = wb.worksheets[0].cells | |
cells.memory_setting = MemorySetting.MEMORY_PREFERENCE | |
# Input large dataset into the cells of the worksheet. | |
# Your code goes here. | |
# ......... | |
# Get cells of the newly created Worksheet "Sheet2" whose memory setting is same with the one defined in WorkbookSettings: | |
cells = wb.worksheets.add("Sheet2").cells |
Precaución
La opción predeterminada, MemorySetting.NORMAL se aplica para todas las versiones. Para algunas situaciones, como construir una hoja de cálculo con un conjunto de datos grande para celdas, la opción MemorySetting.MEMORY_PREFERENCE puede optimizar el uso de memoria y disminuir el costo de memoria para la aplicación. Sin embargo, esta opción puede degradar el rendimiento en algunos casos especiales como los siguientes.
- Acceso a celdas de forma aleatoria y repetida: La secuencia más eficiente para acceder a la colección de celdas es celda por celda en una fila, y luego fila por fila. Especialmente, si accede a filas/celdas mediante el Enumerador adquirido de Cells, RowCollection y Row, el rendimiento será maximizado con MemorySetting.MEMORY_PREFERENCE.
- Insertar y Eliminar Celdas y Filas: Tenga en cuenta que si hay muchas operaciones de inserción/eliminación de Celdas/Filas, la degradación del rendimiento será notable para el modo de Preferencia de Memoria en comparación con el modo Normal.
- Operando en Diferentes Tipos de Celda: Si la mayoría de las celdas contienen valores de texto o fórmulas, el costo de memoria será el mismo que en el modo Normal, pero si hay muchas celdas vacías, o los valores de las celdas son numéricos, bool, etc., la opción MemorySetting.MEMORY_PREFERENCE dará mejor rendimiento.