
pandas 读取所有 xlsx 文件时出现“excel 文件格式无法确定”错误
在使用 pandas 从文件夹中读取所有 xlsx 文件时,可能会遇到如下错误:
excel file format cannot be determined, you must specify an engine manually.
根源
此错误通常是由 ms excel 创建的隐藏临时文件引起的,这些文件会在打开 excel 文件时在同一目录中创建,文件名格式为:
~$datasheet.xlsx
解决方案
为了避免此错误,可以:
手动指定引擎:使用 engine 参数指定引擎,例如 openpyxl,如下所示:
df = pd.read_excel(f, engine="openpyxl")
注意事项
使用 openpyxl 引擎可能会导致另一个错误:“badzipfile: file is not a zip file”。这是因为 pandas 的旧版本(<=1.1.0)使用了一个过时的 openpyxl 版本,无法读取某些类型的 xlsx 文件。升级到 pandas 的最新版本或手动指定不同的引擎(如 xlrd)可以解决此问题。
以上就是如何解决 Pandas 读取 XLSX 文件出现的“Excel 文件格式无法确定”错误?的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号