pandas读取csv文件时 不带第一列编号
pandas读取csv文件不带第一行第一列
·
pandas读取csv文件时 不带第一列编号
在读取kaggle Diamonds数据集的时候,发现把csv文件中自带的 第一列的编号读进来了:
Diamonds_data = pd.read_csv(file_name)
pd.set_option('display.max_columns', 11)
print(Diamonds_data.head())
打印结果:
Unnamed: 0 carat cut color clarity depth table price x y \
0 1 0.23 Ideal E SI2 61.5 55.0 326 3.95 3.98
1 2 0.21 Premium E SI1 59.8 61.0 326 3.89 3.84
2 3 0.23 Good E VS1 56.9 65.0 327 4.05 4.07
3 4 0.29 Premium I VS2 62.4 58.0 334 4.20 4.23
4 5 0.31 Good J SI2 63.3 58.0 335 4.34 4.35
z
0 2.43
1 2.31
2 2.31
3 2.63
4 2.75
上面 Unnamed:0 这一列就是源文件的编号列。
处理方法是,指定参数index_col=0,即如下:
Diamonds_data = pd.read_csv(file_name, index_col=0)
carat cut color clarity depth table price x y z
1 0.23 Ideal E SI2 61.5 55.0 326 3.95 3.98 2.43
2 0.21 Premium E SI1 59.8 61.0 326 3.89 3.84 2.31
3 0.23 Good E VS1 56.9 65.0 327 4.05 4.07 2.31
4 0.29 Premium I VS2 62.4 58.0 334 4.20 4.23 2.63
5 0.31 Good J SI2 63.3 58.0 335 4.34 4.35 2.75
回顾:不读取csv源文件的列名
这里不读取列名的意思是,不将csv文件中的第一行当作dataframe的columns。所以,csv文件从第一行开始,就是Dataframe的第一行数据。
指定参数header = None.
Diamonds_data = pd.read_csv(r"D:\someDatasetsForML\diamonds.csv", index_col=0,header=None)
1 2 3 4 5 6 7 8 9 10
0
NaN carat cut color clarity depth table price x y z
1.0 0.23 Ideal E SI2 61.5 55 326 3.95 3.98 2.43
2.0 0.21 Premium E SI1 59.8 61 326 3.89 3.84 2.31
3.0 0.23 Good E VS1 56.9 65 327 4.05 4.07 2.31
4.0 0.29 Premium I VS2 62.4 58 334 4.2 4.23 2.63
更多推荐
已为社区贡献1条内容
所有评论(0)