使用xlrd读取xlsx文件时,会报错:XLRDError: Excel xlsx file; not supported

from xlrd import open_workbook
th = open_workbook(r'文件.xlsx')

是因为新版的xlrd不支持xlsx文件,只支持xls文件,xlrd 已删除了对 xls 文件以外的任何内容的支持。
1.如果想要使用xlrd读取xlsx文件,需要安装旧版xlrd

pip install xlrd==1.2.0

但是这种方法会遇到一些其他的问题,会有安全警告,并且在读取excel文件时会报错:
AttributeError: 'ElementTree' object has no attribute 'getiterator'
该类报错是因为在新版python3.9中,windows中使用的更新删除了getiterator方法,所以我们老版本的xlrd库调用getiterator方法时会报错,所以需要将老版本xlrd文件中的xlsx.py里的getiterator()改成iter()

如果知道自己的xlrd的安装路径可以直接打开,如果不知道,可以使用win +r,输入cmd,输入pip show xlrd
在这里插入图片描述
在这里插入图片描述
然后打开,查找getiterator并替换成iter即可。

2.如果嫌上面的步骤过于麻烦的话,还可以安装openpyxl指定engine为openpyxl
pip install openpyxl

df1 = pd.read_excel(
     os.path.join(APP_PATH, "Data", "aug_latest.xlsm"),
     engine='openpyxl',
)

参考来源

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐