pandas.DataFrame.select_dtypes的用法

做数据分析时，需要对特征进行归类–类别型还是数值型，pandas提供了select_dtypes函数,函数原型:DataFrame.select_dtypes(include=None, exclude=None)示例:df = pd.DataFrame({'a': [1, 2] * 3,'b': [True, False] * 3,'c': [1.0, 2.0] * 3,.

他说民谣很穷

13967人浏览 · 2021-03-30 15:36:06

他说民谣很穷 · 2021-03-30 15:36:06 发布

在这里插入图片描述
做数据分析时，需要对特征进行归类–类别型还是数值型，pandas提供了select_dtypes函数,函数原型:
DataFrame.select_dtypes(include=None, exclude=None)
示例:

df = pd.DataFrame({
                    'a': [1, 2] * 3,
                    'b': [True, False] * 3,
                    'c': [1.0, 2.0] * 3,
                    'd': ['1','2']*3
                  })
df.info()

在这里插入图片描述
数值型特征: 包括int64,float64

df.select_dtypes(include = ['int64','float64'])

在这里插入图片描述

仅int型的:

df.select_dtypes(include = 'int64')

在这里插入图片描述

类别型特征(object):

df.select_dtypes(include = 'object')

在这里插入图片描述

布尔型特征(bool):

df.select_dtypes(include = 'bool')

除了布尔型以外的所有特征:

df.select_dtypes(exclude = 'bool')

在这里插入图片描述
这样得到的结果是DataFrame类型数据，下面将想要的特征名称取出来:

numerical_fea = list(df.select_dtypes(include = 'int64').columns)
numerical_fea

在这里插入图片描述

numerical_fea = list(df.select_dtypes(include =['int64','float64']).columns)
numerical_fea

在这里插入图片描述

总结:对于特征数目少的数据，函数体现不出来优势，当特征数目达到数以千计时，往往能体现出这个函数的便捷之处。

华为开发者空间

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

华为开发者空间云开发环境（容器）操作指导

华为开发者空间

【openGauss】Oracle与openGauss/GaussDB数据一致性高效核对方案

华为开发者空间

【GaussDB】在逻辑复制中剔除指定用户的事务

基于逻辑复制标签实现过滤，技术上可行，但打标签这个附加操作需要在执行sql前执行（除非使用触发器，但触发器属于高风险操作，不建议使用），如果漏执行，将会存在错误覆盖目标库的风险。历史表归档方案通过在源库建立历史表存储归档数据，配置复制规则排除历史表的删除操作，虽然会增加IO开销，但实现简单、安全性高，避免了事务过滤可能带来的风险。虽然插入历史表会产生额外IO，可能使数据归档操作时间翻倍，但相比剔除