pandas read_excel 参数及使用

pandas read_excel 参数及使用

change_fate

5795人浏览 · 2022-07-27 13:57:26

change_fate · 2022-07-27 13:57:26 发布

pandas.read_excel(io, sheet_name…)

参数说明

io: 文件路径
sheet_name 列名，默认为0，可以是数字/列名/list(数字、列名)
header 标题行，默认第一行，可以是数字/list
names 补充列名， names元素的个数必须和dataframe的列数一致，name=[0,1,2…]: 0,1,2将作为列名
index_col 指定行索引, 默认None，可以是数字/list
usecols: 指定读取列，
usecols=[1,2,3] # 读取2-4列
usecols=None, #读取所有列
squeeze：如果源数据只有一列， squeeze=False为DataFrame，squeeze=True时为Series
converters={
‘收入’ lambda x: x/100 # 收入除以100
}
skiprows：省略指定行数据，第一行开始
skipfooter：省略指定行数据，最后一行开始
dtype: dtype={
‘grade’: np.float32
} # 读取为类型数据

使用

创建一个Excel文件
fakeExcel.xlsx

import pandas as pd
import numpy as np

# 指定索引列
pd.read_excel('./fakeExcel.xlsx', index_col=0) # 第0列作为标题

在这里插入图片描述

pd.read_excel('fakeExcel.xlsx',  header=0) # 指定表头行

在这里插入图片描述

# 指定读取格式转换
# 适合数据处理精度要求比较高或者速度要求比较快的情况
pd.read_excel('fakeExcel.xlsx', dtype={
  'grade': np.float32
}) # 指定表头列

在这里插入图片描述

# 自定义缺失值， 如年龄为负数时，清空,显示NAN
pd.read_excel('fakeExcel.xlsx', na_values={
  'title': 'aa'
})

在这里插入图片描述

# 处理注释行

pd.read_excel('fakeExcel.xlsx', sheet_name=1, comment='#')

在这里插入图片描述

# 列操作， 列减少2
data['grade'] = data['grade'] - 2
data

在这里插入图片描述

# 删除列：
# 改变内存数据
# 建议使用不改变内存的函数， 通过赋值修改原数据
if True:
  del data["a"]
# 不改变内存数据(返回新数据)
else:
  data = data.drop('a', axis=1)
data

在这里插入图片描述

# 重命令列
data.rename(columns={ 'grade': 'grade2' })
# 或者
data.columns = ['b', 'title', 'grade2']

在这里插入图片描述

# 保留指定的列
data[['title',	'grade']]

在这里插入图片描述

# 过滤数据
data[data['grade'] > 60]

在这里插入图片描述

data[data['title'] == 'bb']

在这里插入图片描述

# 值排序
data.sort_values('grade', ascending = True)

在这里插入图片描述

# names 参数的作用， 相当于rename
pd.read_excel('fakeExcel.xlsx', header=0, names=[0,1,2])

在这里插入图片描述

# 删除指定字符串的行

data.drop(data.index[(newData['line3'] == '--')], inplace=True) # inplace是否直接替换原数据

# 显示所有的行
pd.set_option('display.max_rows',None)
# 显示所有的列
pd.set_option('display.max_columns',None)
# 显示部分
pd_data.head()

华为开发者空间

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

cover

一文解读GaussDB(DWS)监控运维诊断优化能力

华为开发者空间

cover

GaussDB技术解读——GaussDB架构介绍（四）

华为开发者空间

cover

华为云数据仓库专业级开发者认证重磅发布

华为开发者空间

所有评论(0)

查看更多评论

change_fate

已为社区贡献4条内容