UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xbf in position 0: invalid start byte处理

python读取csv文件时遇到的,之前遇到后解决了又忘了是在哪个程序,不好找,按照印象处理后,特此记录。
原代码是:
df = pd.read_csv(file_name, usecols=use_col)
运行出错:
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xbf in position 0: invalid start byte
应该是数据的字符编码问题,首先需要明确用的是什么编码:
右击需要处理的csv文件->打开方式->记事本->文件->另存为->如图看到红框处显示字符编码为’ANSI’

在这里插入图片描述然后修改文件读取代码,指定字符集类型为’ANSI’:
df = pd.read_csv(file_name, usecols=use_col, encoding=‘ANSI’)
运行成功。其他编码的问题没有遇到过,但是应该可以试一下相同的处理方式。

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐