sklearn.datasets.load_iris函数

函数说明Iris数据集是常用的分类实验数据集，由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集，是一类多重变量分析的数据集。数据集包含150个数据样本，分为3类，每类50个数据，每个数据包含4个属性（分别是：花萼长度，花萼宽度，花瓣长度，花瓣宽度）。可通过这4个属性预测鸢尾花卉属于（Setosa，Versicolour，Virginica）三个种类的鸢尾花中的哪一类。Iris里有两个

不负韶华ღ

11646人浏览 · 2022-06-07 12:28:59

不负韶华ღ · 2022-06-07 12:28:59 发布

函数原型

sklearn.datasets.load_iris(*, return_X_y=False, as_frame=False)

函数说明

Iris数据集是常用的分类实验数据集，由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集，是一类多重变量分析的数据集。数据集包含150个数据样本，分为3类，每类50个数据，每个数据包含4个属性（分别是：花萼长度，花萼宽度，花瓣长度，花瓣宽度）。可通过这4个属性预测鸢尾花卉属于（Setosa，Versicolour，Virginica）三个种类的鸢尾花中的哪一类。
Iris里有两个属性iris.data，iris.target。data是一个矩阵，每一列代表了萼片或花瓣的长宽，一共4列，每一列代表某个被测量的鸢尾植物，一共有150条记录。

参数return_X_y如果为True，则返回一个(data, target)元组类型的数据；如果为False，则返回一个类似字典的Bunch对象。as_frame如果为True，则表示返回的data、target类型为DataFrame类型；如果为False，则返回的类型为ndarray数组类型。

函数使用

>>> dataset = datasets.load_iris()
# 返回Bunch对象
>>>> type(dataset)
<class 'sklearn.utils.Bunch'>
>>> type(dataset["data"])
<class 'numpy.ndarray'>

>>> dataset = datasets.load_iris(return_X_y=True)
# 返回元组(data, target)
>>> type(dataset)
<class 'tuple'>
# data是一个ndarray数组
>>> type(dataset[0])
<class 'numpy.ndarray'>

>>> dataset = datasets.load_iris(as_frame=True)
>>> type(dataset)
<class 'sklearn.utils.Bunch'>
# data是一个DataFrame对象
>>> type(dataset["data"])
<class 'pandas.core.frame.DataFrame'>