相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。
 

相关分析是不考虑变量之间的因果关系而只研究分析变量之间的相关关系的一种统计分析方法,包括简单相关分析、偏相关分析、距离分析等。


下面我们主要从下面四个方面来解说:
 

  • 实际应用
  • 理论思想
  • 操作过程
  • 分析结果


 

一、实际应用


 

相关性不等于因果性,也不是简单的个性化,相关性所涵盖的范围和领域几乎覆盖了我们所见到的方方面面,相关性在不同的学科里面的定义也有很大的差异。


1、简单相关分析
 

生活中常需要我们对两个变量间的相关关系进行分析,即通过计算两个变量之间的相关系数,是否显著相关作出判断。

2、偏相关分析
相关分析通过计算两个变量之间的相关系数分析变量间线性相关的程度。在多元相关分析中,由于受到其他变量的影响,两变量相关系数只是从表面上反映了两个变量的性质,往往不能真实地反映变量间的线性相关程度,此时就需要用到偏相关分析,这时候就需要把其他变量控制住,然后输出控制其他变量影响后的相关系数,得以从中剔除其他变量的线性影响3、距离分析
偏相关分析通过控制一些被认为次要的变量的影响得到两个变量间的实际相关系数,但实际问题中,变量可能会多到无法一一关心的地步,每个变量都携带了一定的信息,但彼此又有所重叠,此时最直接的方法就是将所有变量按照一定的标准进行分类,即进行聚类分析。



 



 

二、理论思想



相关分析研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向及相关程度,是研究随机变量之间相关关系的一种统计方法。

现象与现象之间的依存关系,从数量联系上看,可以分为两种不同的类型,即函数关系和相关关系。


 

函数关系是从数量上反映现象间严格的依存关系,即当一个或几个变量取一定的值时,另一个变量有确定值与之相对应。相关关系是现象间不严格的依存关系,即各变量之间不存在确定性的关系。


 

在相关关系中,当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量值也相应发生变化,但其关系值不是固定的,往往按照某种规律在一定的范围内变化。


 

回归方程的确定系数在一定程度上反映了两个变量之间关系的密切程度,并且确定系数的平方根就是相关系数。但确定系数一般是在拟合回归方程之后计算的,如果两个变量间的相关程度不高,拟合回归方程便没有意义,因此相关分析往往在回归分析前进行。


 

对不同类型的变量,相关系数的计算公式也不同。在相关分析中,常用的相关系数主要有皮尔逊简单相关系数、斯皮尔曼等级相关系数、肯德尔等级相关系数和偏相关系数。


 

皮尔逊简单相关系数适用于等间隔测度,而斯皮尔曼等级相关系数和肯德尔等级相关系数都是非参测度。一般用ρr分别表示总体相关系数和样本相关系数。


1)皮尔逊简单相关系数简单相关系数r有如下性质:-1≤r≤1r绝对值越大,表明两个变量之间的相关程度越强。0<r≤1,表明两个变量之间存在正相关。若r=1,则表明变量间存在着完全正相关的关系。-1≤r<0,表明两个变量之间存在负相关。r=-1表明变量间存在着完全负相关的关系。r=0,表明两个变量之间无线性相关。应该注意的是,简单相关系数所反映的并不是任何一种确定关系,而仅仅是线性关系。另外,相关系数所反映的线性关系并不一定是因果关系。
(2)斯皮尔曼等级相关系数        等级相关用来考察两个变量中至少有一个为定序变量时的相关系数,例如,学历与收入之间的关系。
(3)肯德尔等级相关系数       肯德尔等级相关系数利用变量等级计算一致对数目U和非一致对数目V,采用非参数检验的方法度量定序变量之间的线性相关关系
若p值小于显著性水平,则拒绝原假设,即认为两个变量之间的相关关系显著;否则,接受原假设,即认为变量之间不存在显著相关性。




 

三、操作过程


相关分析的数据条件:

  • 条件宽松


偏相关分析案例:

题目:随机抽取的山东省某学校的12名学生的IQ值、语文成绩和数学成绩。因为语文成绩和数学成绩都受IQ的影响,所以试用偏相关分析研究学生语文成绩和数学成绩的相关关系。


一、数据输入

二、操作步骤
1、进入SPSS,打开相关数据文件,选择分析”|“相关”|“偏相关命令2、选择进行偏相关分析的变量和控制变量。在偏相关性对话框的左侧列表框中,同时选中语文成绩数学成绩进入变量列表框,然后选中IQ进入控制列表框。

3、设置显著性检验的类型。在显著性检验选项组中选中双尾单选按钮。
 

4选择是否标记显著性相关性,也就是是否在输出结果中把有统计学意义的结果用“*”表示出来。这里我们选中标记显著性相关性复选框。

5、选择相关统计量的输出和缺失值的处理方法。单击偏相关性对话框中的选项按钮。选中”统计”选项组中的“平均值和标准差”和“零阶相关性”两个复选框缺失值选项组中选中成对排除个案单选按钮。也就是说,如果我们在分析时遇到缺失值的情况就将缺失值排除在数据分析之外。设置完毕后,单击继续按钮返回偏相关性对话框。
 

6、其余设置采用系统默认值即可。单击“确定”按钮,等待输出结果。



 

四、结果分析



1、描述性统计量表参与偏相关分析的两个变量的样本数都是12,语文成绩的平均值是77.50,标准差是19.019,数学成绩的平均值是76.17,标准差是22.811,IQ的平均值是98.33,标准差是22.960。

2、偏相关分析结果表不控制IQ时语文成绩和数学成绩的相关系数为0.991,显著性水平为0.000,小于0.01,控制IQ后语文成绩和数学成绩的相关系数为0.893,显著性水平也为0.000,所以语文成绩和数学成绩的相关关系为正向且相关性很强。

分析结论:综上所述,通过控制IQ,语文成绩和数学成绩的相关系数为0.893,显著性水平也为0.000远远小于0.01,拒绝原假设,语文成绩和数学成绩的相关关系为正向且相关性很强。

(获取更多知识,前往gz号程式解说)

原文来自:https://mp.weixin.qq.com/s/g8ttH9LDunqKYTuFs_k7nw

 

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐