养生 装修 购物 美食 感冒 便秘 营销 加盟 小吃 火锅 管理 创业 搭配 减肥 培训 旅游

如何进行主成分分析

时间:2024-09-25 20:25:30

主成分分析将多个有一定相蔡龇呶挞关性的指标进行线性组合,以最少的维度解释原数据中尽可能多的信息为目标进行降维,降维后的各变量间彼此线性无关,最终输奘兔炫确定的新变量是原始变量的线性组合,且越往后主成分在方差中的比重也小,综合原信息的能力越弱,与因子分析不同的是,因子分析是利用少数几个公共因子去解释较多个要观测变量中存在的关系,它不是对原始变量的重新组合。

工具/原料

SPSSPRO5.0

win7/8/10

输入输出描述

1、输入:2个或两个以上的定量变量(假设为N个变量)输出:最低可降维成1维(一个变量,一般用于综合评价),最多可降维成N个变量(一般用于数据脱敏),同时可以获取降维后各个变量的组成权重,用于代表原先变量的数据保留情况。

案例示例

1、示例:某金融服务公司为了了解贷款客户的信用程度,评价客虿搦糍掏户的信用等级,采用信用评级常用的5C(能力,品格,担保,资本,环境)方法,说明客户违约的可能性。某金融服务公司为了了鞅瓞慈玢解贷款客户的信用程度,评价客户的信用等级,采用信用评级常用的5C(能力,品格,担保,资本,环境)方法,说明客户违约的可能性。品格:指客户的名誉;能力:指客户的偿还能力;资本:指客户的财务实力和财务状况;担保:指对申请贷款项担保的覆盖程度;环境:指外部经济政策环境对客户的影响

案例数据

如何进行主成分分析

案例操作

1、Step1:新建项目;Step2:上传数据;Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;

如何进行主成分分析

2、step4:选择【主成分分析】;step猱蝰逾鸾5:查看对应的数据数据格式,【主成分分析】要求输入数据为放入[定量柯计瓤绘]自变量X(变量数≥2)。step6:选择主成分个数(注意:主成分个数的选择,依赖于个人能接受的最大主成分个数,而特征根选择则是根据设定的阈值为界限,以大于该界限对应的主成分个数作为选取的主成分个数,默认为1。)step7:点击【开始分析】,完成全部操作。

如何进行主成分分析

输出结果分析

1、输出结果1:KMO检验和Bartlett的检验图表说明:KMO检验的结果显示,KMO的值为0.796,同时,Bartlett球形检验的结果显示,显著性P值为0.000***,水平上呈现显著性,拒绝原假设,即表明各变量间具有相关性,主成分分析的结果是有效的,结果可靠程度为一般。

如何进行主成分分析

2、输出结果2:方差解释表格图表说明:上表为总方差解释表格,主要是看主成分溏胃釜阼对于变量解释的贡献率(可以理解为究竟需要多少主成分才能把变量表达为100%)芟坳葩津,一般都要表达到90%以上才可以,否则就要调整主成分数量。由表可知,前三个主成分累积解释的贡献率达到93.192%(一般情况下大于90%即可),说明使用前三个主成分就能够很好地评价客户的信用等级。

如何进行主成分分析

3、输出结果3:碎石图图表说明:当折线由陡峭突然变得平稳时,陡峭到平稳对应的因子个数即为参考提取因子个数。由图可知,从第三个主成分开始,主成分的特征根值开始缓慢的下降,且在满足主成分累积解释的贡献率达到90%的情况下,我们可以选择三个主成分。

如何进行主成分分析

4、输出结果4:因子载荷系数表图表说明:上表为因子载荷系数表,可以分析到每个主成分中隐变量的重要性。第一个主成分与能力、品格、资本、担保这四个变量的相关程度较大,可以概括为“个人信用品质”;第二个主成分主与环境这一个变量的相关程度较大,可以概括为“外部政策影响”。(注意:因子载荷矩系数表在主成分分析的意义不大)

如何进行主成分分析

5、输出结果5:因子载荷矩阵热力图图表说明:下图为载荷矩阵热力图,可以分析到每个主成分中隐变量的重要性,热力图颜色越深说明相关性越大。第一个主成分与能力、品格、资本、担保这四个变量的相关程度较大,第二个主成分主与环境这一个变量的相关程度较大。(注意:因子载荷矩阵热力图在主成分分析的意义不大)

如何进行主成分分析

6、输出结果6:因子载荷象限分析图表说明:因子载荷图通过将多因子降维成双主成分或者三主成分,通过象限图的方式呈现主成分的空间分布。如果提取3个主成分时,则呈现三维载荷因子散点图。(注意:因子载荷象限分析在主成分分析的意义不大)。

如何进行主成分分析

7、输出结果7:成分矩阵表图表说明:由上表可得到主成分分析降维后的计算公式:喋碾翡疼模型的公式:F1=0.249臣钠痖咪×资本+0.257×能力+0.259×品格+0.253×担保+0.152×环境F2=-0.22×资本-0.28×能力-0.224×品格+0.121×担保+1.014×环境F3=1.164×资本+0.438×能力-0.693×品格-1.096×担保+0.351×环境由上可以得到:F=(0.708/0.932)×F1+(0.164/0.932)×F2+(0.06/0.932)×F3

如何进行主成分分析

8、输出结果8:因子权重分析图表说明:主成分分析的权重计算结果显示,主成分1的权重为76.007%、主成分2的权重为17.589%、主成分3的权重为6.405%,其中指标权重最大值为主成分1(76.007%),最小值为主成分3(6.405%)。

如何进行主成分分析

9、输出结果9:综合得分表图表说明:由综合得分可知,其中第15位客户的综合得分最高,也就是他的信用等级最高,其次是第75位客户。(注意:综合得分在主成分分析的意义不大)

如何进行主成分分析

模型理论

如何进行主成分分析

© 一点知识