python实现excel数据分析常用功能

(一文学会如何用Python实现excel基础功能)

本文主要应用pandas包完成,先加载pandas包

import pandas as pd

1、excel数据读取

data = pd.read_excel(r"C:\\Users\\Desktop\\test.xlsx")
data = pd.read_csv(r"C:\\Users\\Desktop\\test.csv")

路径采用 “\ \” 分隔符可以增加可读性

带有变量的数据载入
day = 6.15
data = pd.read_excel(r"C:\\Users\\Desktop\\" + day + "test.xlsx")
#载入该路径下文件名为:6.15test 的表格

2、数据处理

将导入数据变成数据框,方便调用
data = pd.DataFrame(data)
替换空值
data.fillna(value='none_value', inplace=True)

参数释义:

参数名释义
value=接上想要替换空缺值的内容
inplace=True为在原数据上替换空缺值
去除空值
names = [data['name']_ for data['name']_ in data['name'] if data['name']_ == data['name']_]
去重
data.drop_duplicates(subset='name', keep='first')

参数释义:

参数名释义
subset=接上想要去重的列名
keep=first为保留重复数据的第一个,last为保留重复数据的最后一个,FALSE为把重复数据全部删除
重新排序索引
data.reset_index(drop=True)

去重之后会有一些索引缺失,以上代码可以重新定义索引

3、数据调用

data1 = data['name']  #调用列名为‘name’的列
data2 = data[['name', 'age']]  #调用列名为‘name’和‘age’的列

4、表格合并

merge函数可以进行表格的横向合并(可替代excel中的VLOOKUP函数)

data = pd.merge(left=data1, right=data2, how='left', left_on='name', right_on='name')
参数名释义
left=放在左边的预合并表
right=放在右边的预合并表
how=’left‘即以左边表关键字为准,’right‘以右边为准,’outer‘以关键字并集为准,’inner‘以关键字交集为准
left_on=指定左边表关键字列
right_on=指定右边表关键字列

concat函数可以进行表格的纵向合并

data = pd.concat([data, data2], axis=0)
参数名释义
[ , ]需要进行合并的表格
axis=0表示纵向合并

5、数据计算

两列对应相加减乘除可以直接计算

data3 = data['age']*data['score']

列中每个数同时加减乘除同一常数,需要先进行列表解析,再进行计算

data4 = pd.Series(data['score'])*5.6
#Series函数对列表进行解析

学会以上规则,再善用循环和条件语句就能轻松利用Python实现excel的基本功能~

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐