在这里插入图片描述
做数据分析时,需要对特征进行归类–类别型还是数值型,pandas提供了select_dtypes函数,函数原型:
DataFrame.select_dtypes(include=None, exclude=None)
示例:

df = pd.DataFrame({
                    'a': [1, 2] * 3,
                    'b': [True, False] * 3,
                    'c': [1.0, 2.0] * 3,
                    'd': ['1','2']*3
                  })
df.info()

在这里插入图片描述
数值型特征: 包括int64,float64

df.select_dtypes(include = ['int64','float64'])

在这里插入图片描述

仅int型的:

df.select_dtypes(include = 'int64')

在这里插入图片描述

类别型特征(object):

df.select_dtypes(include = 'object')

在这里插入图片描述

布尔型特征(bool):

df.select_dtypes(include = 'bool')

除了布尔型以外的所有特征:

df.select_dtypes(exclude = 'bool')

在这里插入图片描述
这样得到的结果是DataFrame类型数据,下面将想要的特征名称取出来:

numerical_fea = list(df.select_dtypes(include = 'int64').columns)
numerical_fea

在这里插入图片描述

numerical_fea = list(df.select_dtypes(include =['int64','float64']).columns)
numerical_fea

在这里插入图片描述

总结:对于特征数目少的数据,函数体现不出来优势,当特征数目达到数以千计时,往往能体现出这个函数的便捷之处。

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐