散点图

散点图是指在回归分析中,数据点在直角坐标系平面上的分布图,散点图表示因变量随自变量而变化的大致趋势。在数据分析可视化时,一般会先绘制散点图,初步了解自变量和应变量之间的关系,通过散点图查看变量之间是否存在数量关联趋势等。

散点图的分类

散点图矩阵
当欲同时考察多个变量间的相关关系时,若一一绘制它们间的简单散点图,十分麻烦。此时可利用散点图矩阵来同时绘制各自变量间的散点图,这样可以快速发现多个变量间的主要相关性,这一点在进行多元线性回归时显得尤为重要。
三维散点图
在散点图矩阵中虽然可以同时观察多个变量间的联系,但是两两进行平面散点图的观察的,有可能漏掉一些重要的信息。三维散点图就是在由3个变量确定的三维空间中研究变量之间的关系,由于同时考虑了3个变量,常常可以发现在两维图形中发现不了的信息。
ArcGIS散点图
散点图使用数据值作为 x,y 坐标来绘制点。它可以揭示格网上所绘制的值之间的关系,还可以显示数据的趋势。当存在大量数据点时,散点图的作用尤为明显。散点图与折线图相似,而不同之处在于折线图通过将点或数据点相连来显示每一个变化。

散点图的优势

散点图的优势是揭示数据间的关系,发觉变量与变量之间的关联。它可以很直观的看出变量之间是否存在数量关联趋势,如果存在关联趋势,是线性还是曲线的。如果有某一个点或者某几个点偏离大多数点,也就是离群值,通过散点图可以一目了然。从而可以进一步分析这些离群值是否可能在建模分析中对总体产生很大影响。

绘制散点图

import matplotlib.pyplot as plt
import numpy as np
import random


# 散点图
X = [random.randint(0, 50) for _ in range(10)]  # 随机生成10个50以内的点的横坐标
Y = [random.randint(0, 50) for _ in range(10)]  # 随机生成10个50以内的点的纵坐标
plt.scatter(X, Y, s=50)  # 绘图,s为点的大小
plt.show()

在这里插入图片描述

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐