1.DataFrame介绍
一个Datarame表示一个表格,类似电子表格的数据结构,包含一个经过排序的列表集,它的每一列都可以有不同的类型值(数字,字符串,布尔等等)。Datarame有行和列的索引;它可以被看作是一个Series的字典(Series们共享一个索引)。与其它你以前使用过的(如 R 的 data.frame )类似Datarame的结构相比,在DataFrame里的面向行和面向列的操作大致是对称的。在底层,数据是作为一个或多个二维数组存储的,而不是列表,字典,或其它一维的数组集合。

import pandas as pd
import numpy as np

data = {'name': ['zhangsan', 'lisi', 'wangwu', 'niuniu', 'Nevada'],
        'birth_year': [2000, 2001, 2002, 2001, np.nan],  # np.nan表示NA
        'grade': [1.5, 1.7, 3.6, 2.4, 2.9]}

# index=['a','b','c','d','e']
# index = range(5)
# 默认生成整数索引, 字典的键作列,值作行
print(pd.DataFrame(data))

输出

       name  birth_year  grade
0  zhangsan      2000.0    1.5
1      lisi      2001.0    1.7
2    wangwu      2002.0    3.6
3    niuniu      2001.0    2.4
4    Nevada         NaN    2.9

进程已结束,退出代码 0


Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐