您的位置:新文秘網>>畢業(yè)相關/畢業(yè)論文/文教論文/統(tǒng)計/財稅統(tǒng)計/電信/通信/科學發(fā)展/>>正文

畢業(yè)論文:多元統(tǒng)計分析及其應用——2010年我國各省份電信業(yè)發(fā)展水平的分析及應用

發(fā)表時間:2013/9/18 12:03:33
目錄/提綱:……
(一)主成分分析法的原理
(二)主成分的推導及其性質
(三)主成分的計算步驟
(四)主成分的分析過程
(五)主成分分析確定權數的優(yōu)點
(一)因子分析模型建立
(二)因子分析的步驟
(三)因子分析的計算過程
(四)因子分析方法的優(yōu)點
(一)原始數據標準化
(二)計算標準化數據的相關系數矩陣
(三)求相關系數矩陣特征值,方差貢獻率,累計方差貢獻率和主成分負荷
(四)確定主成分
(五)主成分得分
(六)結果分析
(一)評價指標的選擇
(二)將原始數據標準化,以消除變量間在數量級和量綱上的不同
(三)求標準化矩陣的方差—協方差矩陣,即原始矩陣的相關系數矩陣
(六)求出各因子得分
(七)畫出雙重信息圖biplot
……

本 科 畢 業(yè) 論 文
題目:多元統(tǒng)計分析及其應用——2010年我國各省份電信業(yè)發(fā)展水平的分析及應用

學 院: 數學科學學院學院
年 級: 2008級
專 業(yè): 數學與應用數學

多元統(tǒng)計分析及其應用
——2010年我國各省份電信業(yè)發(fā)展水平的分析及應用

摘要 本文應用多元統(tǒng)計分析的方法對2010年我國各省份的電信業(yè)發(fā)展水平進行綜合評價,建立評價指標體系。首先,用主成分分析對原始數據進行分析處理,得出評價電信業(yè)發(fā)展水平的綜合指標。同時用因子分析方法對各地區(qū)電信業(yè)發(fā)展水平進行分析作為驗證。探索了引起我國各省份電信業(yè)發(fā)展水平的差異性的主要因素,并對如何提高各地區(qū)的電信業(yè)綜合實力提出建議,以實現各省份的共同發(fā)展。

關鍵詞 多元統(tǒng)計分析 主成分分析 因子分析


Multivariate Statistical Analysis and Its Applications
——Based on the Developmental Level of Telecom Industry in Each Province of China in 2010

Abstract: This article conducts an overall evaluation of the developmental level of telecom industry in each province of China in 2010 based on the method of Multivariate Statistical Analysis aiming at establishing a system of evaluation inde*. First of all, the initial data are analyzed and processed by the use of Principal Component Analysis to obtain the overall evaluation inde*. Meanwhile, the overall evaluation inde* is verified by applying Factor Analysis to analyze the developmental level of telecom industry in each province. This article e*plores the major factors causing the developmental differences of telecom industry in each province and gives suggestions on how to improve the general strength of telecom indu
……(新文秘網http://120pk.cn省略2009字,正式會員可完整閱讀)…… 
作出一個整體性的規(guī)劃,因此多元統(tǒng)計分析方法得到了普及與應用。在構造綜合評價指標中,如何科學客觀地將多個復雜指標綜合成少數幾個簡單指標,也就是降維處理,這就是我們所要解決的問題之一。我們知道已經有很多這樣的降維方法,比如層次分析法,模糊綜合評價法等。但是這些方法都有一個共同的缺點就是帶有人為主觀性,都需要專家評價,然后我們再進行信息處理。而主成分分析法則采用了一種完全不同的思路,倍受青睞,它避免了主觀評分。在實際生活中,比如學生成績的評價、物價指數、生活費用指數、商業(yè)活動指數、企業(yè)經濟效益的分析等等,這都用到了多指標的統(tǒng)計分析方法。對于這些實際問題進行評價時,顯然需要選取很多指標,而各指標之間往往又相互影響、具有相關性,關系相當復雜,給統(tǒng)計分析工作帶來很大困難。因此,我們要通過降維技術,科學客觀的選擇一組相互無關的綜合指標,這就使得主成分分析法成為一種廣受歡迎的綜合評價方法。
主成分分析(簡記PCA)是將多指標化為少數幾個綜合指標的一種統(tǒng)計分析方法,是由英國生物統(tǒng)計學家Kart Pearson于1901年首次提出的,后來又由Hotelling于1933年發(fā)展起來。這一方法在處理解決多指標的統(tǒng)計分析中得到廣泛應用,是一種很常用的、行之有效的多元統(tǒng)計分析方法。

(一)主成分分析法的原理
主成分分析法是通過恰當的數學變換,使新變量主成分成為原變量的線性組合,并選取少數幾個方差累積量所占比例較大的主成分,主成分在方差總和中的比例越大,它在綜合評價中的作用就越大。也可以說,在多維幾何空間中,首先,把高維橢球的各個主軸找出來,對主軸作適當正交(垂直)旋轉,再用代表大多數數據信息的最長的幾個軸作為新變量,這些相互正交的新變量是原先變量的線性組合,就是主成分。
主成分分析的成分 和原來變量 之間的關系(假定原先有 個變量):

這里, 為第 個成分 和第 個原先的變量 之間的線性相關系數。
分別叫第一主成分,第二主成分,…,第 主成分,而總和的特性也就是用這些線性關系式的系數 來表示的。其中,在選擇加權數 時要使 能得到最大解釋變異能力,即要使 能得到最大的變異數,而 則是對原始資料中尚未被 解釋的變異部分擁有最大解釋能力,若以此類推,我們可以找到 個 出來( ),通常原始數據有 個 變量時,經過轉換后,仍可找到 個 出來。然而我們最多只選擇 個 ( = ),希望此愈小愈好,但解釋能力卻能達到80%以上。除此之外, 個 與原來 個變量 的最大差別是:原始變量中多為彼此相關的變量,經過線性轉換后所產生的 個 則為彼此不相關的新變量。

(二)主成分的推導及其性質

其中, 求主成分就是尋求 的線性函數 ,使相應的方差達到最大,即 達到最大,且 (目的是使 唯一)。此處, 的協防差矩陣。
定理1 設 為非負定對稱矩陣, 是它的 個不相同的特征根,相應的特征向量 相互正交,記 = ,則 可表示為 = ,稱為 的譜分解。即存在一個正交陣 ,使 = , 的列向量為相應的特征向量。
設 特征根為 ,相應的單位特征向量為 ,令 ,則 ,即 為一正交陣,且:

因此 。
于是 。
當取 時, 。于是 就是第一主成分,它的方差最大, = = 。
同理, = = 。
另外,
該定理表明:變量 的主成分 是以 特征向量為系數的線性組合,他們是互不相關,方差為 特征根。而 特征根 ,所以有: 。
性質:(1) = ,這里, 為 的協方差陣的特征向量組成的正交陣。
(2) 的 個分量 之間是互不相關的。
(3) 的 個分量 是按方差大小由大到小排列的。
(4) 的協方差陣是對角陣。
(5) ,這里, 。
此處定義 為第 個主成分 的方差貢獻率,第一個主成分的貢獻率最大,表明 綜合原始變量 的能力最強,而 的綜合能力依次遞減。若只取 (< )個主成分,則稱 為主成分 的累計方差貢獻率,它表明 的綜合 的能力,通常取 使得累計貢獻率不低于80%即可。
(6) ,這里, 。
這里, 表示第 個成分 和第 個原先的變量 的相關系數,也稱為主成分負荷(loadings,在因子分析中稱之為因子負荷),矩陣 稱為因子載荷矩陣。在實際中,通常用 代替 作為主成分系數,因為他們標準化系數,能反映變量影響大小。

(三)主成分的計算步驟
(1)設有 個樣品, 個指標將原始數據標準化,得到標準化數據矩陣:
。
(2)建立變量的相關系數陣: 。
(3)求 的特征值 及相應的單位特征向量:
, ,…, 。
(4)寫出主成分:
, 。

(四)主成分的分析過程
(1)將原始數據的標準化,以消除變量之間在數量級和量綱上的不同。
設有 個樣本, 項指標,可得數據矩陣 表示 個樣本, 表示 個指標, 表示第 個樣本的第 項指標值。
用 法對數據進行標準化變換:
式中 。
(2)求標準化數據的相關矩陣 。
其中: 為指標 與指標 的相關系數
,
即 有 , 。
(3)求相關矩陣 的特征值和特征向量。
由特征方程式 ,可求得 個特征根 ,將其按大小順序排列為 ,它是主成分的方差,它的大小描述了各個主成分在描述被評價對象上所起作用的大小。由特征方程式,每一個特征根對應一個特征向量
, 。
(4)求方差貢獻率,方差累計貢獻率,確定主成分個數。
一般主成分個數等于原始指標個數,如果原始指標個數比較多,進行綜合評價時就比較麻煩。主成分分析法就是選取盡量少的 個主成分 來進行綜合評價,同時還要使損失的信息量盡可能少。設 為 個主成分, 的值由累計方差貢獻率 決定,取前 個主成分來反映原評價對象。
(5)用原指標的線性組合來計算各主成分得分:以各主成分對原指標的相關系數(即載荷系數)為權,將各主成分表示為原指標的線性組合,而主成分的經濟意義則由各線性組合中權數較大的指標的綜合意義來確定,即
, 。
(6)綜合得分:以各主成分的方法貢獻率為權,將其線性組合得到綜合評價函數。
。
(7)得分排名:利用總得分可以得到得分名次。

(五)主成分分析確定權數的優(yōu)點
(1)可消除評價指標之間的具有相關關系的影響。由于主成分分析在對原指標變量進行變換后形成了彼此相互獨立的主成分,并且實踐證明指標間相關程度越低,主成分分析效果越好。
(2)可減少指標選擇的工作量,對于其它評價方法,由于難以消除評價指標間的相關影響, 所以選擇指標時要花費不少精力,而主成分分析由于可以消除這種相關影響,所以在指標選擇上相對容易些。
(3)主成分分析中各主成分是按方差大小依次排列順序的,在分析問題時,可以舍棄一部分主成分,只取前后方差較大的幾個主成分來代表原變量,從而減少了計算工作量。
1.3 因子分析法

因子分析是主成分分析的推廣,它也是一種把多個變量化為少數幾個綜合變量的多元統(tǒng)計分析方法,但其目的是用有限個不可測的隱變量來解釋原變量之間的相關關系。主成分分析通過線性組合將原變量綜合成幾個主成分,用較少的綜合指標來代替原來較多的指標(變量)。在多元統(tǒng)計分析中,變量間往往存在相關性,是什么原因使得變量間有關系呢?是否存在不能直接觀測到的但影響可測變量變化的公共因子呢?因子分析就是尋找這些公共因子的統(tǒng)計分析方法,它是在主成分的基礎上構筑若干意義較為明確的公因子,以它們?yōu)榭蚣芊纸庠兞,以此考慮原變量間的聯系與區(qū)別。
因子分析就是以最小的信息損失,將眾多的原始變量濃縮成為少數幾個因子變量,使得變量具有更高的可解釋性的一種數據縮減方法,是多變量分析的主干技術之一。因子分析法是從研究變量內部相關的依賴關系出發(fā),把一些具有錯綜復雜關系的變量歸結為少數幾個綜合因子的一種多變量統(tǒng)計分析方法。它的基本思想是將觀測變量進行分類,將相關性較高,即聯系比較緊密的分在同一類中,而不同類變量之間的相關性則較低,那么每一類變量實際上代表了一個基本結構,即公共因子。對于所研究的問題,試圖用最少個數的不可測的公共因子的線性函數與特殊因子之和來描述原來觀測的每一分量。研究樣本間的相互關系的因子分析稱為 型因子分析,而研究變量間的相互關系的因子分析稱為 型因子分析,下面主要討論并運用的是 型因子分析。

(一)因子分析模型建立
(1)求解初始因子載荷矩陣 ,也即 。
(2)建立因子模型 。
也即為下式表達:
,


,
其矩陣形式為: ,其中:
① 是可觀測隨機向量,均值向量 ,協方差陣 。且協方差陣 相關矩陣 相等(只要將變量標準化即可實現)。
② 是不可測的向量,其均值向量 ,協方差矩陣 ,即向量的各分量是相互獨立的。
③ 與 相互獨立,且 的協方差陣 對角陣,即各分量 之間是相互獨立的。
④ 。
⑤ 即 和 是不相關的。
⑥ ,即 不相關,且方差均為1。
,即 不相關,且方差不同,分別 , , 。
我們把 稱為 的公共因子或潛在因子,矩陣 稱為因子載荷矩陣, 稱為 的特殊因子。 為因子載荷。數學上可以證明,因子載荷 就是第 個變量與第 個因子的相關系數,反映第 個變量在第 個因子上的重要性。

(二)因子分析的步驟
(1)確認待分析的原變量是否適合作因子分析。
(2)構造因子變量。
(3)利用旋轉方法使因子變量更具有可解釋性。
(4)計算因子變量得分。

(三)因子分析的計算過程
(1)將原始數據進行標準化處理,即將統(tǒng)一變量減去其均值再除以標準差,以消除量綱的影響,記為 。
(2)計算相關系數據矩陣 。
(3)求相關系數矩陣 的特征向量 和特征值 。
(4)計算方差貢獻率與累計貢獻率。
(5)確定公共因子的個數,設 為 個因子,其中前 個因子包含的數據信息總量(即其累計貢獻率 )不低于80%時,可取前 個因子來反映原評價指標。
(6)因子旋轉:若所得的 個因子無法確定或其實際意義不是很明顯,這時需要將因子進行旋轉以獲得較為明顯的實際含義的新的因子載荷矩陣 。
(7)用原指標的線性組合來求各因子得分:采用回歸估計法、Bartlet ……(未完,全文共31368字,當前僅顯示5642字,請閱讀下面提示信息。收藏《畢業(yè)論文:多元統(tǒng)計分析及其應用——2010年我國各省份電信業(yè)發(fā)展水平的分析及應用》