UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xbf in position 0: invalid start byte处理
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xbf in position 0: invalid start byte处理python读取csv文件时遇到的,之前遇到后解决了又忘了是在哪个程序,不好找,按照印象处理后,特此记录。原代码是:df = pd.read_csv(file_name, usecols=use_col)运行出错:U
·
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xbf in position 0: invalid start byte处理
python读取csv文件时遇到的,之前遇到后解决了又忘了是在哪个程序,不好找,按照印象处理后,特此记录。
原代码是:
df = pd.read_csv(file_name, usecols=use_col)
运行出错:
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xbf in position 0: invalid start byte
应该是数据的字符编码问题,首先需要明确用的是什么编码:
右击需要处理的csv文件->打开方式->记事本->文件->另存为->如图看到红框处显示字符编码为’ANSI’
然后修改文件读取代码,指定字符集类型为’ANSI’:
df = pd.read_csv(file_name, usecols=use_col, encoding=‘ANSI’)
运行成功。其他编码的问题没有遇到过,但是应该可以试一下相同的处理方式。
更多推荐
已为社区贡献1条内容
所有评论(0)