以鸢尾花数据集为例,记录常用的数据可视化方法。

使用plt.rcParams 方法解决PyCharm所创建图表中中文无法显示的问题。

1、柱状图

通常使用柱状图分析单个变量的分布情况

# -*- coding: utf-8 -*-
# @Time    : 2022/7/5 9:12
# @Author  : Wang Yong



import matplotlib.pyplot as plt
## 忽略提醒
import pandas as pd
import seaborn as sns
import missingno as msno

import warnings

warnings.filterwarnings("ignore")

plt.rcParams['font.sans-serif'] = ['SimHei']  # 显示中文
plt.rcParams['axes.unicode_minus'] = False  # 正常显示负号

## 读取鸢尾花数据集
Iris = pd.read_csv("D:\\Py_ML\\data\\Iris.csv")
Iris2 = Iris.drop(["Id", "Species"], axis=1)
print(Iris2.head())

print("均值:\n", Iris2.mean())
print("中位数:\n", Iris2.median())


#柱状图:单个数据变量分布情况使用

plt.figure(figsize=(10,6))
plt.hist(Iris2.PetalLengthCm,bins=30, color="blue")
plt.xlabel("PetalLengthCm")
plt.ylabel("PetalLengthCm的分布")
plt.title("Hist")


2 热力图

通常使用热力图,分析多个变量之间的相关性:

#热力图:了解变量之间的相关性
iriscorr = Iris2.corr(method="pearson")
#使用热力图可视化

plt.figure(figsize=(8,6))
ax = sns.heatmap(iriscorr, fmt = ".3f", annot = True, cmap = "YlGnBu")
ax.set_yticklabels(iriscorr.index.values,va="center")
plt.title("Iris HeatMap")

Fig 1 热力图

图中数值范围为[-1,1],数值越接近1,表示两个变量越正相关,反之,越接近-1,说明连个变量越负相关。

3 散点图


# 散点图:两个变量之间的关系
plt.figure(figsize=(10, 6))
sns.scatterplot(x="SepalLengthCm", y="SepalWidthCm", data=Iris2, s=50)
plt.title('散点图')
plt.grid()

Fig 3 散点图

  

4 气泡图

气泡图用于表示三个变量之间的关系,横、纵坐标和气泡的大小,各表示一个变量。

## 气泡散点图:观察三个变量之间的关系
plt.figure(figsize = (12,8))
sns.scatterplot(x = "PetalWidthCm",y = "SepalWidthCm",data = Iris2,
                size = "SepalLengthCm",sizes = (20,400))
plt.title("buble")
plt.legend(loc="center right",bbox_to_anchor=(1.3, 0.5))

Fig 4   气泡图

5 分组箱体图

表示多个变量之间的分布情况的对比,主要看是否存在异常值。

#分组箱线图:观察多个数据的异常值分布情况
print(Iris.head())
print("\nIrislong")
Irislong=Iris.melt(["Id","Species"],var_name="Measurement_type",value_name="value")
plt.figure(figsize=(10,6))
sns.boxplot(data = Irislong,x = "Measurement_type",y = "value",hue = "Species")
plt.legend(loc = 1)
plt.title("分组箱线图")
print(Irislong.head())
plt.show()

Fig 5 分组箱体图 

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐