
Python高效处理多个Excel文件:数据提取与整理
本文介绍如何使用Python脚本高效地处理多个Excel文件,将数据分别提取并保存到不同的表格中。我们将利用Python的openpyxl库实现此功能,该库功能强大且易于使用。
核心步骤及代码详解
本方法主要包含三个步骤:打开Excel文件、读取指定区域数据、将数据写入新文件。
立即学习“Python免费学习笔记(深入)”;
1. 读取Excel文件并指定数据区域:
我们使用openpyxl库的load_workbook函数打开Excel文件,并通过sheet.iter_rows方法迭代读取指定行和列的数据。
<code class="python">from openpyxl import load_workbook
def read_excel_range(filepath, sheet_name, start_row, end_row, start_col, end_col):
"""读取Excel指定区域的数据"""
try:
workbook = load_workbook(filepath, read_only=True) # read_only提高效率
sheet = workbook[sheet_name]
data = []
for row in sheet.iter_rows(min_row=start_row, max_row=end_row, min_col=start_col, max_col=end_col):
row_data = [cell.value for cell in row]
data.append(row_data)
workbook.close()
return data
except FileNotFoundError:
print(f"Error: File not found - {filepath}")
return None
except Exception as e:
print(f"Error reading Excel file: {e}")
return None</code>2. 创建并写入新的Excel文件:
使用openpyxl库的Workbook和write方法创建新的Excel文件并写入数据。
<code class="python">from openpyxl import Workbook
def write_excel(filepath, sheet_name, data):
"""将数据写入新的Excel文件"""
try:
workbook = Workbook()
sheet = workbook.create_sheet(sheet_name)
for row in data:
sheet.append(row)
workbook.save(filepath)
workbook.close()
except Exception as e:
print(f"Error writing to Excel file: {e}")
</code>3. 批量处理多个Excel文件:
使用循环处理多个文件,并调用上述函数完成数据提取和保存。
<code class="python">import os
def process_excel_files(input_dir, output_dir, sheet_name='Sheet1', start_row=1, end_row=100, start_col=1, end_col=10):
"""批量处理Excel文件"""
for filename in os.listdir(input_dir):
if filename.endswith(".xlsx") or filename.endswith(".xls"):
filepath = os.path.join(input_dir, filename)
data = read_excel_range(filepath, sheet_name, start_row, end_row, start_col, end_col)
if data:
output_filepath = os.path.join(output_dir, filename)
write_excel(output_filepath, sheet_name, data)
# 示例用法
input_directory = 'C:/path/to/excel/input/' # 替换成你的输入目录
output_directory = 'C:/path/to/excel/output/' # 替换成你的输出目录
process_excel_files(input_directory, output_directory)
</code>注意: 请替换代码中的'C:/path/to/excel/input/'和'C:/path/to/excel/output/'为你的实际输入和输出目录路径。 确保安装了openpyxl库 (pip install openpyxl)。 这个改进后的代码更加健壮,处理了文件不存在和读取错误等异常情况,并提高了效率。 通过read_only=True参数,load_workbook函数以只读模式打开文件,可以显著提升性能,尤其是在处理大量文件时。
以上就是如何使用Python循环读取多个Excel文件并分别将数据存入不同的表格?的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号