这个暑假接触了一个项目,要用python处理数据。虽然之前有上过课,但用它来数据处理这块几乎是从0开始。网上有很多的学习资料,也有系统的python操作,但我想用自己的方式对我所学和正在学习的内容做一个整理,也算是督促自己继续学习吧!话不多说,开干!

在数据处理中,常用的文件格式有xlsx/csv/txt,下面一一讲解对应的文件读入和输出Python的方法。

1、Excel

import pandas as pd  # 导入pandas包,用于读取文件

data = pd.read_excel('XXX.xlsx')  # 读取文件名为XXX的文件
# data = pd.read_excel(r'XXX.xlsx')  # 这行代码上行效果相同,r代表read读取文件,默认是r

data.head()  # 查看数据  
# data.head(6)  # 查看前6行数据
data.to_excel('XXX.xlsx', index=False)  # 将data数据集导出至名为XXX的文件中

2、csv

csv文件的读取和导出与Excel极其类似,只需一些小小的变动:

import pandas as pd  # 导入pandas包,用于读取文件

data = pd.read_csv('XXX.xlsx')  # 读取文件名为XXX的文件

data.head()  # 查看数据  
# data.head(6)  # 查看前6行数据
data.to_csv('XXX.csv', index=False)  # 将data数据集导出至名为XXX的文件中

3、txt

txt文件的读取和导出略微复杂:

with open(r'XXX.txt', encoding='utf-8') as f:  # 读取名为XXX的文件
        txt = f.readlines()  # 按行读取所有文件内容,以列表的形式展示
      # txt = f.read()  # 读取所有的内容,将文件内容放在''内展示
        txt=f.readline()  # 读取一行数据,遇到'\n'停止,()内若填了数字,则代表读取几个字符

# txt1=txt[1:]  # 除去标题行   
f.close()  # 关闭文件 读取txt文件完后要及时关闭,以防后续操作会有问题

txt1  # 展示读取结果

with open('XXX.txt','w') as f:  # w代表write,表示输出到名为XXX的txt文件中
   f.write(test)  # test可以是文字、要保存的数据等,但对数组不适用
f.close()


# 将数组输出至txt文件中
import numpy as np  # 导入numpy包,用于对数组的处理

np.savetxt('XXX.txt',data,fmt='%d')  # 将数组data导出

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐