在数据分析时,经常会针对两个变量进行相关性分析。在Python中主要用到的方法是pandas中的corr()方法。
corr():如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度,返回DataFrame

# -*- coding: utf-8 -*-
# 导入包
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus']=False

# 导入数据
df = pd.read_csv('./data2.txt', sep='\t')
df_coor = df.corr()
print(df_coor)

fig, ax = plt.subplots(figsize=(6, 6),facecolor='w')
# 指定颜色带的色系
sns.heatmap(df.corr(),annot=True, vmax=1, square=True, cmap="Blues", fmt='.2g')
plt.title('相关性热力图')
plt.show()

fig.savefig('./df_corr.png',bbox_inches='tight',transparent=True)



运行结果:

                      shu_liao_temperature  aqc_temperature  wind_volume
shu_liao_temperature              1.000000         0.413273     0.012092
aqc_temperature                   0.413273         1.000000    -0.316703
wind_volume                       0.012092        -0.316703     1.000000

Process finished with exit code 0

在这里插入图片描述

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐