Ⅰ 如何理解主成分分析的主成分得分
比如你想評價學生的總成績(績點),自變數是一些科目:數學、物理、化學、語文、政治、歷史。比如主成分合並後:將數學、物理、化學、合並為理科;將語文、政治、歷史合並為文科。那麼主成分得分,就是理科(綜合)得分、文科(綜合)得分最終目的當然是為了計算總成績(績點)。
主成分分析(Principal Component Analysis,PCA), 是一種統計方法。通過正交變換將一組可能存在相關性的變數轉換為一組線性不相關的變數,轉換後的這組變數叫主成分。
在實際課題中,為了全面分析問題,往往提出很多與此有關的變數(或因素),因為每個變數都在不同程度上反映這個課題的某些信息。
名詞解釋:
在用統計分析方法研究多變數的課題時,變數個數太多就會增加課題的復雜性。人們自然希望變數個數較少而得到的信息較多。在很多情形,變數之間是有一定的相關關系的,當兩個變數之間有一定相關關系時,可以解釋為這兩個變數反映此課題的信息有一定的重疊。
主成分分析是對於原先提出的所有變數,將重復的變數(關系緊密的變數)刪去多餘,建立盡可能少的新變數,使得這些新變數是兩兩不相關的,而且這些新變數在反映課題的信息方面盡可能保持原有的信息。
Ⅱ 主成分中的綜合得分是用來幹嘛的,為什麼要算這個,請簡單舉例分析
0.這是原始數據,以備檢驗
90342.0052455.00101091.0019272.0082.0016.10197435.000.17
4903.001973.002035.0010313.0034.207.10592077.000.00
6735.009.003767.001780.0036.108.20726396.000.00
49454.0036241.0081557.0022504.0098.1025.90348226.000.98
139190.00203505.00215898.0010609.0093.2012.60139572.000.63
12215.0016219.0010351.006382.0062.508.70145818.000.07
2372.006572.008103.0012329.00184.4022.2020921.000.15
11062.0023078.0054935.0023804.00370.4041.0065486.000.26
17111.0023907.0052108.0021796.00221.5021.5063806.000.28
1206.003930.006126.0015586.00330.4029.501840.000.44
2150.005704.006200.0010870.00184.2012.008913.000.27
5251.006155.0010383.0016875.00146.4027.5078796.000.15
14341.0013203.0019396.0014691.0094.6017.806354.001.57
1.這是原始數據的標准化結果
1.5010.384740.93440.7508-0.62952-0.314630.056399-0.47047
-0.53684-0.55797-0.68672-0.6214-1.0781-1.21691.7483-0.8466
-0.49314-0.20006-0.65838-1.9283-1.0603-1.10662.3242-0.8466
0.525790.0819540.614711.2458-0.478420.667820.702881.339
2.66623.20552.8133-0.57606-0.52441-0.66551-0.191680.54443
-0.36243-0.29194-0.55063-1.2235-0.81253-1.0565-0.1649-0.70638
-0.59721-0.47209-0.58742-0.312620.331510.2969-0.70037-0.51498
-0.38993-0.163850.179021.44492.07712.1816-0.5093-0.26793
-0.24565-0.148370.132761.13740.67970.22672-0.51651-0.239
-0.62502-0.52143-0.619770.186231.70171.0287-0.782170.11933
-0.6025-0.4883-0.61856-0.536080.32963-0.72566-0.75185-0.24345
-0.52854-0.47988-0.55010.38366-0.0251230.82822-0.45224-0.5172
-0.31172-0.34826-0.40260.049154-0.51127-0.14421-0.762822.6499
2.這是原始數據的相關系數矩陣
10.919620.962010.10887-0.28858-0.166320.00671920.21396
0.9196210.94676-0.055032-0.19728-0.17094-0.0149260.18553
0.962010.9467610.23295-0.103610.0041839-0.0780940.24666
0.10887-0.0550320.2329510.559860.78087-0.449680.30089
-0.28858-0.19728-0.103610.5598610.82664-0.60877-0.029523
-0.16632-0.170940.00418390.780870.826641-0.492150.17422
0.0067192-0.014926-0.078094-0.44968-0.60877-0.492151-0.29986
0.213960.185530.246660.30089-0.0295230.17422-0.299861
3.這是原始數據的特徵值(降序排列):
3.10492.89740.930220.642120.304080.0865980.0321840.0024418
4.這是原始數據的特徵向量,每列為對應於上面相應特徵值的向量:
0.476650.295990.104190.0453030.184220.0658540.757620.245
0.472810.277890.16298-0.17443-0.305450.048451-0.518410.52711
0.423850.377950.156260.05867-0.017475-0.099048-0.17404-0.78054
-0.212890.45141-0.00854430.516090.53941-0.28786-0.249430.22013
-0.388460.330940.3-0.19942-0.4499-0.582290.232970.030623
-0.352430.402740.145140.27926-0.316840.713570.056436-0.042355
0.21483-0.377410.140460.75817-0.4182-0.193590.0528420.04116
0.0550340.27274-0.891160.071855-0.3222-0.122170.067111-0.0032996
5.這是判別結果,依次為:特徵值,累計百分率,主成分表達式
Lamda(1)=3.1049;PerCent=38.81%;Y(1)=0.4767*X1+0.4728*X2+0.4238*X3-0.2129*X4-0.3885*X5-0.3524*X6+0.2148*X7+0.0550*X8
Lamda(2)=2.8974;PerCent=75.03%;Y(2)=0.2960*X1+0.2779*X2+0.3780*X3+0.4514*X4+0.3309*X5+0.4027*X6-0.3774*X7+0.2727*X8
Lamda(3)=0.9302;PerCent=86.66%;Y(3)=0.1042*X1+0.1630*X2+0.1563*X3-0.0085*X4+0.3211*X5+0.1451*X6+0.1405*X7-0.8912*X8
Lamda(4)=0.6421;PerCent=94.68%;Y(4)=0.0453*X1-0.1744*X2+0.0587*X3+0.5161*X4-0.1994*X5+0.2793*X6+0.7582*X7+0.0719*X8
Lamda(5)=0.3041;PerCent=98.48%;Y(5)=0.1842*X1-0.3054*X2-0.0175*X3+0.5394*X4-0.4499*X5-0.3168*X6-0.4182*X7-0.3222*X8
Lamda(6)=0.0866;PerCent=99.57%;Y(6)=0.0659*X1+0.0485*X2-0.0990*X3-0.2879*X4-0.5823*X5+0.7136*X6-0.1936*X7-0.1222*X8
Lamda(7)=0.0322;PerCent=99.97%;Y(7)=0.7576*X1-0.5184*X2-0.1740*X3-0.2494*X4+0.2330*X5+0.0564*X6+0.0528*X7+0.0671*X8
Lamda(8)=0.0024;PerCent=100.00%;Y(8)=0.2450*X1+0.5271*X2-0.7805*X3+0.2201*X4+0.0306*X5-0.0424*X6+0.0412*X7-0.0033*X8
6.這是各主成分向量、每個樣本的主成分綜合計算得分、排序
SAMPLE11.47520.75860.53800.48981.0586-0.00260.39490.00440.99102
SAMPLE20.4982-2.59160.22830.85190.1606-0.2911-0.12720.0669-0.647911
SAMPLE31.0564-3.22550.40940.5825-0.93000.05940.0822-0.0240-0.698213
SAMPLE40.45991.1836-0.99771.59960.01140.0746-0.0086-0.05200.62073
SAMPLE54.52852.26240.4676-0.7581-0.49630.0191-0.12110.02262.55141
SAMPLE60.3300-1.77360.0311-0.93800.36890.2062-0.0273-0.0668-0.569810
SAMPLE7-1.1025-0.31790.2818-0.69170.09140.3033-0.0051-0.0350-0.55919
SAMPLE8-2.19502.24411.09920.5568-0.57190.0113-0.0399-0.05240.11164
SAMPLE9-0.84120.89570.35290.12850.5266-0.4687-0.2882-0.00090.06315
SAMPLE10-2.03190.82520.2311-0.5141-0.6475-0.17860.27940.0727-0.52958
SAMPLE11-0.7133-0.7556-0.1226-1.11100.2343-0.38220.0178-0.0295-0.649112
SAMPLE12-1.20140.03030.28700.08170.37040.6423-0.16930.0786-0.39507
SAMPLE13-0.26300.4643-2.8063-0.2779-0.17660.00710.01250.0154-0.28916
根據排序得分,可以進行判斷重要性啊或者主要問題所在啊。
Ⅲ 建模里的主成分分析法的綜合得分指什麼
是指用每個主成分乘以它們相對應的方差貢獻率,得到綜合主成分值。很多主成分分析最後都是比較綜合主成分值,來確定排名。
Ⅳ 主成分分析法綜合評價得分怎樣計算
1輸入數據。
2點Analyze 下拉菜單,選Data Rection 下的Factor 。
3打開Factor Analysis後,將數據變數逐個選中進入Variables 對話框中。
4單擊主對話框中的Descriptive按扭,打開Factor Analysis: Descriptives子對話框,在Statistics欄中選擇Univariate Descriptives項要求輸出個變數的均值與標准差,在Correlation Matrix 欄內選擇Coefficients項,要求計算相關系數矩陣,單擊Continue按鈕返回Factor Analysis主對話框。
5單擊主對話框中的Extraction 按鈕,打開如下圖所示的Factor Analysis: Extraction 子對話框。在Method列表中選擇默認因子抽取方法——Principal Components,在Analyze 欄中選擇默認的Correlation Matrix 項要求從相關系數矩陣出發求解主成分,在Exact 欄中選擇Number of Factors;6, 要求顯示所有主成分的得分和所能解釋的方差。單擊Continue按鈕返回Factor Analysis主對話框。
6單擊主對話框中的OK 按鈕,輸出結果。
統計專業研究生工作室原創,請勿復雜粘貼
Ⅳ 如何用主成分分析法確定指標權重
在SPSS中,主成分分析是通過設置因子分析中的抽取方法實現的,如果設置的抽取方法是主成分,那麼計算的就是主成分得分,另外,因子分析和主成分分析盡管原理不同,但是兩者綜合得分的計算方法是一致的。
層次分析法根據問題的性質和要達到的總目標,將問題分解為不同的組成因素,並按照因素間的相互關聯影響以及隸屬關系將因素按不同層次聚集組合,
形成一個多層次的分析結構模型,從而最終使問題歸結為最低層(供決策的方案、措施等)相對於最高層(總目標)的相對重要權值的確定或相對優劣次序的排定。
(5)股票綜合得分的主成分分析擴展閱讀:
主成分分析法是一種降維的統計方法,它藉助於一個正交變換,將其分量相關的原隨機向量轉化成其分量不相關的新隨機向量,這在代數上表現為將原隨機向量的協方差陣變換成對角形陣,在幾何上表現為將原坐標系變換成新的正交坐標系,
使之指向樣本點散布最開的p 個正交方向,然後對多維變數系統進行降維處理,使之能以一個較高的精度轉換成低維變數系統,再通過構造適當的價值函數,進一步把低維系統轉化成一維系統。
Ⅵ 你好,請教一下,主成分分析中,綜合得分都是負值怎麼比較
我已經兩年多沒碰過統計學的東西了。
你是用什麼軟體操作?
SPSS中,主成分分析實現是利用因子分析,只要累計方差貢獻率達到80%以上即可,你說的綜合得分指的是因子分析的得分?
Ⅶ 主成分分析法綜合得分為什麼有負的
因為做主成分分析時spss會直接將數據標准化。
所以完全有可能出現負值,而且關鍵是,主成分分析得到的是幾組向量,可能第一主成分的某個值是負的,那麼第二主成分它就可能是個正的很大的值,所以不用擔心。
Ⅷ 主成分分析綜合得分結果解讀
一般都是需要通過每個主成分乘以各自權重值得到綜合得分的,而不是直接把幾個主成分相加,因為這樣就默認幾個主成分的權重都是一樣的了.我們通常以各個主成分的方差貢獻率作為各自的權重值,也可以通過其他方法計算得到權重值.
Ⅸ 綜合主成分值的意義
得分原理是在SPSS中,主成分分析是通過設置因子分析中的抽取方法實現的,
如果設置的抽取方法是主成分,那麼計算的就是主成分得分,
另外,因子分析和主成分分析盡管原理不同,但是兩者綜合得分的計算方法是一致的。
確定數據的權重也是進行數據分析的重要前提。可以利用SPSS的因子分析方法來確定權重。主要步驟是:
(1)首先將數據標准化,這是考慮到不同數據間的量綱不一致,因而必須要無量綱化。
(2)對標准化後的數據進行因子分析(主成分方法),使用方差最大化旋轉。
(3)寫出主因子得分和每個主因子的方程貢獻率。
Fj =β1j*X1 +β2j*X2 +β3j*X3 + ??+ βnj*Xn ; Fj 為主成分(j=1、2、??、m),X1、X2 、X3 、??、Xn 為各個指標,β1j、β2j、β3j、??、βnj為各指標在主成分Fj 中的系數得分,用ej表示Fj的方程貢獻率。
(4)求出指標權重。 ωi=[(m∑j)βij*ej]/[(n∑i)(m∑j)βij*ej],ωi就是指標Xi的權重。
因子分析應用在評價指標權重確定中,通過主成分分析法得到的各指標的公因子方差,其值大小表示該項指標對總體變異的貢獻,通過計算各個公因子方差占公因子方差總和的百分數。
Ⅹ 主成分分析綜合得分,急求
在線分析軟體spssau可以直接保存綜合得分,分析前勾選「綜合得分」即可保存綜合得分。