Ⅰ 如何理解主成分分析的主成分得分
比如你想评价学生的总成绩(绩点),自变量是一些科目:数学、物理、化学、语文、政治、历史。比如主成分合并后:将数学、物理、化学、合并为理科;将语文、政治、历史合并为文科。那么主成分得分,就是理科(综合)得分、文科(综合)得分最终目的当然是为了计算总成绩(绩点)。
主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。
名词解释:
在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。
主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。
Ⅱ 主成分中的综合得分是用来干嘛的,为什么要算这个,请简单举例分析
0.这是原始数据,以备检验
90342.0052455.00101091.0019272.0082.0016.10197435.000.17
4903.001973.002035.0010313.0034.207.10592077.000.00
6735.009.003767.001780.0036.108.20726396.000.00
49454.0036241.0081557.0022504.0098.1025.90348226.000.98
139190.00203505.00215898.0010609.0093.2012.60139572.000.63
12215.0016219.0010351.006382.0062.508.70145818.000.07
2372.006572.008103.0012329.00184.4022.2020921.000.15
11062.0023078.0054935.0023804.00370.4041.0065486.000.26
17111.0023907.0052108.0021796.00221.5021.5063806.000.28
1206.003930.006126.0015586.00330.4029.501840.000.44
2150.005704.006200.0010870.00184.2012.008913.000.27
5251.006155.0010383.0016875.00146.4027.5078796.000.15
14341.0013203.0019396.0014691.0094.6017.806354.001.57
1.这是原始数据的标准化结果
1.5010.384740.93440.7508-0.62952-0.314630.056399-0.47047
-0.53684-0.55797-0.68672-0.6214-1.0781-1.21691.7483-0.8466
-0.49314-0.20006-0.65838-1.9283-1.0603-1.10662.3242-0.8466
0.525790.0819540.614711.2458-0.478420.667820.702881.339
2.66623.20552.8133-0.57606-0.52441-0.66551-0.191680.54443
-0.36243-0.29194-0.55063-1.2235-0.81253-1.0565-0.1649-0.70638
-0.59721-0.47209-0.58742-0.312620.331510.2969-0.70037-0.51498
-0.38993-0.163850.179021.44492.07712.1816-0.5093-0.26793
-0.24565-0.148370.132761.13740.67970.22672-0.51651-0.239
-0.62502-0.52143-0.619770.186231.70171.0287-0.782170.11933
-0.6025-0.4883-0.61856-0.536080.32963-0.72566-0.75185-0.24345
-0.52854-0.47988-0.55010.38366-0.0251230.82822-0.45224-0.5172
-0.31172-0.34826-0.40260.049154-0.51127-0.14421-0.762822.6499
2.这是原始数据的相关系数矩阵
10.919620.962010.10887-0.28858-0.166320.00671920.21396
0.9196210.94676-0.055032-0.19728-0.17094-0.0149260.18553
0.962010.9467610.23295-0.103610.0041839-0.0780940.24666
0.10887-0.0550320.2329510.559860.78087-0.449680.30089
-0.28858-0.19728-0.103610.5598610.82664-0.60877-0.029523
-0.16632-0.170940.00418390.780870.826641-0.492150.17422
0.0067192-0.014926-0.078094-0.44968-0.60877-0.492151-0.29986
0.213960.185530.246660.30089-0.0295230.17422-0.299861
3.这是原始数据的特征值(降序排列):
3.10492.89740.930220.642120.304080.0865980.0321840.0024418
4.这是原始数据的特征向量,每列为对应于上面相应特征值的向量:
0.476650.295990.104190.0453030.184220.0658540.757620.245
0.472810.277890.16298-0.17443-0.305450.048451-0.518410.52711
0.423850.377950.156260.05867-0.017475-0.099048-0.17404-0.78054
-0.212890.45141-0.00854430.516090.53941-0.28786-0.249430.22013
-0.388460.330940.3-0.19942-0.4499-0.582290.232970.030623
-0.352430.402740.145140.27926-0.316840.713570.056436-0.042355
0.21483-0.377410.140460.75817-0.4182-0.193590.0528420.04116
0.0550340.27274-0.891160.071855-0.3222-0.122170.067111-0.0032996
5.这是判别结果,依次为:特征值,累计百分率,主成分表达式
Lamda(1)=3.1049;PerCent=38.81%;Y(1)=0.4767*X1+0.4728*X2+0.4238*X3-0.2129*X4-0.3885*X5-0.3524*X6+0.2148*X7+0.0550*X8
Lamda(2)=2.8974;PerCent=75.03%;Y(2)=0.2960*X1+0.2779*X2+0.3780*X3+0.4514*X4+0.3309*X5+0.4027*X6-0.3774*X7+0.2727*X8
Lamda(3)=0.9302;PerCent=86.66%;Y(3)=0.1042*X1+0.1630*X2+0.1563*X3-0.0085*X4+0.3211*X5+0.1451*X6+0.1405*X7-0.8912*X8
Lamda(4)=0.6421;PerCent=94.68%;Y(4)=0.0453*X1-0.1744*X2+0.0587*X3+0.5161*X4-0.1994*X5+0.2793*X6+0.7582*X7+0.0719*X8
Lamda(5)=0.3041;PerCent=98.48%;Y(5)=0.1842*X1-0.3054*X2-0.0175*X3+0.5394*X4-0.4499*X5-0.3168*X6-0.4182*X7-0.3222*X8
Lamda(6)=0.0866;PerCent=99.57%;Y(6)=0.0659*X1+0.0485*X2-0.0990*X3-0.2879*X4-0.5823*X5+0.7136*X6-0.1936*X7-0.1222*X8
Lamda(7)=0.0322;PerCent=99.97%;Y(7)=0.7576*X1-0.5184*X2-0.1740*X3-0.2494*X4+0.2330*X5+0.0564*X6+0.0528*X7+0.0671*X8
Lamda(8)=0.0024;PerCent=100.00%;Y(8)=0.2450*X1+0.5271*X2-0.7805*X3+0.2201*X4+0.0306*X5-0.0424*X6+0.0412*X7-0.0033*X8
6.这是各主成分向量、每个样本的主成分综合计算得分、排序
SAMPLE11.47520.75860.53800.48981.0586-0.00260.39490.00440.99102
SAMPLE20.4982-2.59160.22830.85190.1606-0.2911-0.12720.0669-0.647911
SAMPLE31.0564-3.22550.40940.5825-0.93000.05940.0822-0.0240-0.698213
SAMPLE40.45991.1836-0.99771.59960.01140.0746-0.0086-0.05200.62073
SAMPLE54.52852.26240.4676-0.7581-0.49630.0191-0.12110.02262.55141
SAMPLE60.3300-1.77360.0311-0.93800.36890.2062-0.0273-0.0668-0.569810
SAMPLE7-1.1025-0.31790.2818-0.69170.09140.3033-0.0051-0.0350-0.55919
SAMPLE8-2.19502.24411.09920.5568-0.57190.0113-0.0399-0.05240.11164
SAMPLE9-0.84120.89570.35290.12850.5266-0.4687-0.2882-0.00090.06315
SAMPLE10-2.03190.82520.2311-0.5141-0.6475-0.17860.27940.0727-0.52958
SAMPLE11-0.7133-0.7556-0.1226-1.11100.2343-0.38220.0178-0.0295-0.649112
SAMPLE12-1.20140.03030.28700.08170.37040.6423-0.16930.0786-0.39507
SAMPLE13-0.26300.4643-2.8063-0.2779-0.17660.00710.01250.0154-0.28916
根据排序得分,可以进行判断重要性啊或者主要问题所在啊。
Ⅲ 建模里的主成分分析法的综合得分指什么
是指用每个主成分乘以它们相对应的方差贡献率,得到综合主成分值。很多主成分分析最后都是比较综合主成分值,来确定排名。
Ⅳ 主成分分析法综合评价得分怎样计算
1输入数据。
2点Analyze 下拉菜单,选Data Rection 下的Factor 。
3打开Factor Analysis后,将数据变量逐个选中进入Variables 对话框中。
4单击主对话框中的Descriptive按扭,打开Factor Analysis: Descriptives子对话框,在Statistics栏中选择Univariate Descriptives项要求输出个变量的均值与标准差,在Correlation Matrix 栏内选择Coefficients项,要求计算相关系数矩阵,单击Continue按钮返回Factor Analysis主对话框。
5单击主对话框中的Extraction 按钮,打开如下图所示的Factor Analysis: Extraction 子对话框。在Method列表中选择默认因子抽取方法——Principal Components,在Analyze 栏中选择默认的Correlation Matrix 项要求从相关系数矩阵出发求解主成分,在Exact 栏中选择Number of Factors;6, 要求显示所有主成分的得分和所能解释的方差。单击Continue按钮返回Factor Analysis主对话框。
6单击主对话框中的OK 按钮,输出结果。
统计专业研究生工作室原创,请勿复杂粘贴
Ⅳ 如何用主成分分析法确定指标权重
在SPSS中,主成分分析是通过设置因子分析中的抽取方法实现的,如果设置的抽取方法是主成分,那么计算的就是主成分得分,另外,因子分析和主成分分析尽管原理不同,但是两者综合得分的计算方法是一致的。
层次分析法根据问题的性质和要达到的总目标,将问题分解为不同的组成因素,并按照因素间的相互关联影响以及隶属关系将因素按不同层次聚集组合,
形成一个多层次的分析结构模型,从而最终使问题归结为最低层(供决策的方案、措施等)相对于最高层(总目标)的相对重要权值的确定或相对优劣次序的排定。
(5)股票综合得分的主成分分析扩展阅读:
主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,
使之指向样本点散布最开的p 个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。
Ⅵ 你好,请教一下,主成分分析中,综合得分都是负值怎么比较
我已经两年多没碰过统计学的东西了。
你是用什么软件操作?
SPSS中,主成分分析实现是利用因子分析,只要累计方差贡献率达到80%以上即可,你说的综合得分指的是因子分析的得分?
Ⅶ 主成分分析法综合得分为什么有负的
因为做主成分分析时spss会直接将数据标准化。
所以完全有可能出现负值,而且关键是,主成分分析得到的是几组向量,可能第一主成分的某个值是负的,那么第二主成分它就可能是个正的很大的值,所以不用担心。
Ⅷ 主成分分析综合得分结果解读
一般都是需要通过每个主成分乘以各自权重值得到综合得分的,而不是直接把几个主成分相加,因为这样就默认几个主成分的权重都是一样的了.我们通常以各个主成分的方差贡献率作为各自的权重值,也可以通过其他方法计算得到权重值.
Ⅸ 综合主成分值的意义
得分原理是在SPSS中,主成分分析是通过设置因子分析中的抽取方法实现的,
如果设置的抽取方法是主成分,那么计算的就是主成分得分,
另外,因子分析和主成分分析尽管原理不同,但是两者综合得分的计算方法是一致的。
确定数据的权重也是进行数据分析的重要前提。可以利用SPSS的因子分析方法来确定权重。主要步骤是:
(1)首先将数据标准化,这是考虑到不同数据间的量纲不一致,因而必须要无量纲化。
(2)对标准化后的数据进行因子分析(主成分方法),使用方差最大化旋转。
(3)写出主因子得分和每个主因子的方程贡献率。
Fj =β1j*X1 +β2j*X2 +β3j*X3 + ??+ βnj*Xn ; Fj 为主成分(j=1、2、??、m),X1、X2 、X3 、??、Xn 为各个指标,β1j、β2j、β3j、??、βnj为各指标在主成分Fj 中的系数得分,用ej表示Fj的方程贡献率。
(4)求出指标权重。 ωi=[(m∑j)βij*ej]/[(n∑i)(m∑j)βij*ej],ωi就是指标Xi的权重。
因子分析应用在评价指标权重确定中,通过主成分分析法得到的各指标的公因子方差,其值大小表示该项指标对总体变异的贡献,通过计算各个公因子方差占公因子方差总和的百分数。
Ⅹ 主成分分析综合得分,急求
在线分析软件spssau可以直接保存综合得分,分析前勾选“综合得分”即可保存综合得分。