pandas.DataFrame.select_dtypes的用法
做数据分析时,需要对特征进行归类–类别型还是数值型,pandas提供了select_dtypes函数,函数原型:DataFrame.select_dtypes(include=None, exclude=None)示例:df = pd.DataFrame({'a': [1, 2] * 3,'b': [True, False] * 3,'c': [1.0, 2.0] * 3,.
·
做数据分析时,需要对特征进行归类–类别型还是数值型,pandas提供了select_dtypes函数,函数原型:
DataFrame.select_dtypes(include=None, exclude=None)
示例:
df = pd.DataFrame({
'a': [1, 2] * 3,
'b': [True, False] * 3,
'c': [1.0, 2.0] * 3,
'd': ['1','2']*3
})
df.info()
数值型特征: 包括int64,float64
df.select_dtypes(include = ['int64','float64'])
仅int型的:
df.select_dtypes(include = 'int64')
类别型特征(object):
df.select_dtypes(include = 'object')
布尔型特征(bool):
df.select_dtypes(include = 'bool')
除了布尔型以外的所有特征:
df.select_dtypes(exclude = 'bool')
这样得到的结果是DataFrame类型数据,下面将想要的特征名称取出来:
numerical_fea = list(df.select_dtypes(include = 'int64').columns)
numerical_fea
numerical_fea = list(df.select_dtypes(include =['int64','float64']).columns)
numerical_fea
总结:对于特征数目少的数据,函数体现不出来优势,当特征数目达到数以千计时,往往能体现出这个函数的便捷之处。
更多推荐
已为社区贡献1条内容
所有评论(0)