函数原型
sklearn.datasets.load_iris(*, return_X_y=False, as_frame=False)
函数说明

Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个属性(分别是:花萼长度,花萼宽度,花瓣长度,花瓣宽度)。可通过这4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类的鸢尾花中的哪一类。
Iris里有两个属性iris.data,iris.target。data是一个矩阵,每一列代表了萼片或花瓣的长宽,一共4列,每一列代表某个被测量的鸢尾植物,一共有150条记录。

参数return_X_y如果为True,则返回一个(data, target)元组类型的数据;如果为False,则返回一个类似字典的Bunch对象。as_frame如果为True,则表示返回的data、target类型为DataFrame类型;如果为False,则返回的类型为ndarray数组类型。

函数使用
>>> dataset = datasets.load_iris()
# 返回Bunch对象
>>>> type(dataset)
<class 'sklearn.utils.Bunch'>
>>> type(dataset["data"])
<class 'numpy.ndarray'>

>>> dataset = datasets.load_iris(return_X_y=True)
# 返回元组(data, target)
>>> type(dataset)
<class 'tuple'>
# data是一个ndarray数组
>>> type(dataset[0])
<class 'numpy.ndarray'>

>>> dataset = datasets.load_iris(as_frame=True)
>>> type(dataset)
<class 'sklearn.utils.Bunch'>
# data是一个DataFrame对象
>>> type(dataset["data"])
<class 'pandas.core.frame.DataFrame'>
Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐