python对excel数据分析常用功能(一文学会如何用Python实现excel基础功能)
python对excel数据分析常用功能(一文学会如何用Python实现excel基础功能)本文主要应用pandas包完成,先加载pandas包import pandas as pd1、excel数据读取data = pd.read_excel(r"C:\\Users\\Desktop\\test.xlsx")data = pd.read_csv(r"C:\\Users\\Desktop\\tes
·
python实现excel数据分析常用功能
(一文学会如何用Python实现excel基础功能)
本文主要应用pandas包完成,先加载pandas包
import pandas as pd
1、excel数据读取
data = pd.read_excel(r"C:\\Users\\Desktop\\test.xlsx")
data = pd.read_csv(r"C:\\Users\\Desktop\\test.csv")
路径采用 “\ \” 分隔符可以增加可读性
带有变量的数据载入
day = 6.15
data = pd.read_excel(r"C:\\Users\\Desktop\\" + day + "test.xlsx")
#载入该路径下文件名为:6.15test 的表格
2、数据处理
将导入数据变成数据框,方便调用
data = pd.DataFrame(data)
替换空值
data.fillna(value='none_value', inplace=True)
参数释义:
参数名 | 释义 |
---|---|
value= | 接上想要替换空缺值的内容 |
inplace= | True为在原数据上替换空缺值 |
去除空值
names = [data['name']_ for data['name']_ in data['name'] if data['name']_ == data['name']_]
去重
data.drop_duplicates(subset='name', keep='first')
参数释义:
参数名 | 释义 |
---|---|
subset= | 接上想要去重的列名 |
keep= | first为保留重复数据的第一个,last为保留重复数据的最后一个,FALSE为把重复数据全部删除 |
重新排序索引
data.reset_index(drop=True)
去重之后会有一些索引缺失,以上代码可以重新定义索引
3、数据调用
data1 = data['name'] #调用列名为‘name’的列
data2 = data[['name', 'age']] #调用列名为‘name’和‘age’的列
4、表格合并
merge函数可以进行表格的横向合并(可替代excel中的VLOOKUP函数)
data = pd.merge(left=data1, right=data2, how='left', left_on='name', right_on='name')
参数名 | 释义 |
---|---|
left= | 放在左边的预合并表 |
right= | 放在右边的预合并表 |
how= | ’left‘即以左边表关键字为准,’right‘以右边为准,’outer‘以关键字并集为准,’inner‘以关键字交集为准 |
left_on= | 指定左边表关键字列 |
right_on= | 指定右边表关键字列 |
concat函数可以进行表格的纵向合并
data = pd.concat([data, data2], axis=0)
参数名 | 释义 |
---|---|
[ , ] | 需要进行合并的表格 |
axis= | 0表示纵向合并 |
5、数据计算
两列对应相加减乘除可以直接计算
data3 = data['age']*data['score']
列中每个数同时加减乘除同一常数,需要先进行列表解析,再进行计算
data4 = pd.Series(data['score'])*5.6
#Series函数对列表进行解析
学会以上规则,再善用循环和条件语句就能轻松利用Python实现excel的基本功能~
更多推荐
已为社区贡献1条内容
所有评论(0)