1、箱型图构成

箱线图是由5部分组成,分别是最小值、中位数、最大值和两个四分位数。第一个”四分位数Q1“:又称下四分位数,等于该样本中所有数值由小到大排列后第25%的数字。中位数F:又称第二四分位数(Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。第三四分位数:又称“上四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。

 箱型图:又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图
- 包含一组数据的:最大值、最小值、中位数、上四分位数(Q3)、下四分位数(Q1)、异常值
1.中位数 → 一组数据平均分成两份,中间的数
2.上四分位数Q1 → 是将序列平均分成四份,计算(n+1)/4与(n-1)/4两种,一般使用(n+1)/4
3.下四分位数Q3 → 是将序列平均分成四份,计算(1+n)/4*3=6.75
4.内限 → T形的盒须就是内限,最大值区间Q3+1.5IQR,最小值区间Q1-1.5IQR (IQR=Q3-Q1)
5.外限 → T形的盒须就是内限,最大值区间Q3+3IQR,最小值区间Q1-3IQR (IQR=Q3-Q1)
6.异常值 → 内限之外 - 中度异常,外限之外 - 极度异常

2、代码

fig,axes = plt.subplots(1,3,figsize = (10,4))
data.boxplot(column =['口味'], ax = axes[0])
data.boxplot(column = ['人均消费'] , ax = axes[1])
data.boxplot(column = ['性价比'] ,ax =axes[2])

 计算四分位数

q1 = data['口味'].quantile(q = 0.25)  # 下四分位数
q3 = data['口味'].quantile(q = 0.75)  # 上四分位数
q = q3 - q1  #四分位差

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐