Python Pandas 读取CSV文件 写入CSV文件 中文乱码问题
Pandas 读取、写入CSV文件 中文乱码问题
·
Pandas 读取CSV文件
import pandas as pd
df = pd.read_csv('property-data.csv',encoding="gbk")
# 用gbk来转化中文,用utf-8会报错
print(df.to_string())
property-data.csv文件可以在菜鸟教程中下载,我在最后一列添加了中文,用来测试中文乱码问题
https://www.runoob.com/pandas/pandas-cleaning.html
结果:
用utf-8会出现报错:
‘utf-8’ codec can’t decode byte 0xd3 in position 98: invalid continuation byte
Pandas 写入CSV文件
import pandas as pd
df = pd.read_csv('property-data.csv',encoding="gbk")
#写入数据用utf-8-sig
df.to_csv("newproperty-data.csv",index=False,encoding="utf_8_sig")#
df = pd.read_csv("newproperty-data.csv")
print(df.to_string())
结果:
保存csv文件时,去除索引index = None/False
如果不用的话会在新文件存一列索引,再次用read_csv()读取时会又添加新的索引
不写index = None/False 时结果如下图:
更多推荐
已为社区贡献1条内容
所有评论(0)