多元統計分析范文
時間:2023-03-18 13:24:02
導語:如何才能寫好一篇多元統計分析,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
關鍵詞:盈利能力;運營能力;償債能力;多元統計分析;財務分析
近些年來,隨著經濟的迅猛發展,無論是一個小企業,還是一個跨國大企業,甚至是一個國家,進行財務分析都是當前工作的重中之重。因此,將多元統計分析應用于財務分析中是很重要的。
1常用的評價指標
目前,我們對財務進行分析時主要有三個常用的指標——盈利能力、營運能力和償債能力。但是這三個指標各有自己的優、缺點。1.1盈利能力盈利能力,也叫收益能力,指的是企業資金、資本的增值能力。簡單地說,就是指企業的獲利能力。盈利能力一般表現為:企業獲得利潤數額的多少以及獲利水平的高低。這一指標是企業股東最為關注的。因為企業運營的主要目的就是盈利。如果經營者即將上線的一個項目的利潤率很低或者很難盈利,那就要調整企業的經營中心,轉變企業的生產目標,以扭轉當前面臨的不利局面。因此,這一指標是進行財務分析時最直觀的一個指標。但是值得注意的一點是,盈利能力是在企業正常營業的情況下計算的。因此,在實際分析中,我們要排除一些非正常的營業情況。例如:重大意外事故、國家法律變更、國家財務制度變化等。
1.2償債能力
償債能力,顧名思義,指的是企業償還債務的能力。這種債務包括短期債務和長期債務另種。企業有無償還債務的能力,是判斷一個企業可否繼續生存、發展的關鍵。也是反映企業財務情況的一個直觀指標。償債能力分為靜態和動態兩種。靜態指的是企業用固有資產清償債務的能力。動態指的是企業用經營過程中的盈利來償還債務的能力。所以在計算企業的償債能力是必須以企業的可持續發展為基礎。不然我們得到的只是企業清償債務的能力。
1.3營運能力
營運能力,指的是企業運營的能力。簡單地說,營運能力是指企業綜合運用各種資產獲取盈利的能力。它直觀的反映了企業經營、管理資本的效率。企業資金運轉周期越短,資金的流動性就越高,企業的償債能力就越高,獲利速度就越快。因此,營運能力在一定程度上決定企業的獲利和償債能力,是一個財務分析的核心部分。上述三個標準相互聯系,又相互影響。單獨使用哪一個,都有一定的偏頗,都不能充分展示企業整體的財務情況。因此,要綜合運用這些指標,在財務分析中進行多元統計分析。
2多元統計分析的運用
多元統計分析,是在傳統統計學基礎上發展起來的一個重要分支。它實際上是一種綜合分析方法。它可以在多個對象、多個指標相聯系、糾纏的情況下,綜合運用多種方式,分析多個指標,揭示它們之間深藏的統計規律。上文我們已經提到,營運能力在一定程度上決定企業的獲利和償債能力。由此可見,財務分析的各部分是相互聯系的。因此,多元統計分析很適合應用于財務分析之中。多元統計分析在財務分析中的運用主要有幾下幾方面:
2.1選取樣本、變量
分析企業的財務狀況離不開建模,而建模的關鍵就是樣本和變量的選取。一般而言,我們主要采取隨機抽樣、對應樣本法兩種方法進行選取。一份財務分析往往包括很多變量,例如:銷售凈利率、凈資產收益率、總資產周轉率等。這些變量越多,可供選擇的余地就越大,建立的模型也就越好。
2.2判別分析
在建模過程中,要對樣本和變量進行分析。這就需要運用多元統計分析的知識。我們一般采用Fisher線性判別函數進行判別分析。
2.3分析主要成分
分析主成分也是財務分析的一種常用方式。它的實現也主要依托于建模,但與上文提到的建模有明顯的區別。在這種方式中,監測的指數、指標是有基本規定的。當變量過多時,對樣本進行研究是很困難的。這時可以采用主成分分析法,使建模過程簡單化。隨著經濟的發展,上到一個國家,下到一個小企業,財務分析都是很必要的。目前,我們常用的財務分析的指標主要有三個,分別是:盈利能力、償債能力和營運能力。盈利能力主要體現企業的利潤率;償債能力主要體現企業償還債務的能力;營運能力主要體現企業運用資本獲取收益的能力。這三者各有優點,但又相互牽連。因此,我們可以借鑒多元統計分析的知識對財務進行進一步的分析。它可以幫助我們在建模的過程中更好的選擇樣本和變量,對這些樣本和變量進行判別分析。如果變量過多,還可以采用主成分分析法,以簡化建模過程。
作者:高雅 單位:沈陽師范大學
參考文獻:
[1]李杰,王蔚佳,劉興智.多元統計分析在企業財務危機預警中的應用[J].重慶建筑大學報,2004(5).
[2]薛薇.統計分析與SPSS的應用[M].北京:中國人民大學出版社,2001.
篇2
醫用多元統計分析屬于應用性的方法學科,課程性質要求學生在學習多元統計方法之后,要具備將各種多元統計分析方法應用到醫療衛生領域數據中的能力。培養學生的實踐能力,僅從理論授課上下功夫提高學生實踐能力是遠遠不夠的,必須在理論授課、實驗教學和課程考核等各個教學環節中都不脫離實踐能力培養的主線。在理論課上講授的內容一般包括原理方面的知識和如何分析實際數據兩個方面。提高學生實踐能力要求教學過程中淡化數學原理方面的知識,而將重點放置在如何分析實際數據上,即該多元統計分析方法使用的前提條件是什么,如何使用該方法以及分析結果如何解讀,在具體研究的醫學問題中此結果具有什么樣的意義。盡管在現代教學方法中有體驗式教學的滲入,但相對于實驗課的實際體驗來講,學生對于數據何時采用、如何采用某種多元統計分析方法,還是保持在似乎知道,但又不完全明確的模糊階段。很多原理方面的知識,盡管不是重點,但也需要學生了解一下,才能有助于把握整體脈絡、合理應用,通過實驗課的親身體驗,能直觀觀察到相對模糊的原理知識得到驗證的過程,從而心服口服地從心底接受沒有經過手工計算而呈現的分析結果。并且多元統計分析的實驗課本身就是讓學生去體驗各多元統計分析方法怎樣應用于實際數據的過程,從而使學生實踐能力大大提高。一般課程考試比較側重理論原理的考核,而醫用多元統計分析授課的目的就是給學生講授多元統計方法應用于醫藥衛生領域數據的實踐過程,學習課程之后學生必須具備這種實踐能力,否則就根本沒有實現開設這門課程的初衷,沒有達到教學目的。因此,課程考試也應側重在學生實踐能力的考核上。課程考核一般有試卷考核、平時實驗成績和上機考核三種形式,而以試卷考核的形式居多。對于醫用多元統計分析課程,平時實驗成績考核和上機考核也應該是必須選擇的考核形式,除此以外,在試卷考核中也可通過適當的題型體現對學生實踐能力的考查。比如,將多元數據分析的結果展示在試卷上,讓學生回答此分析結果對于研究目的反映出什么;或者指出研究目的,讓學生回答選用何種多元統計分析方法,為何選用這種方法;或者從展現的結果讓學生判斷是否適用某種多元統計分析方法等多種題型來考查學生的實踐能力。通過考核反饋出實踐能力欠缺的部分,從而給予相應的應對措施。
2通過教學軟件提高教學效率多元統計分析
建模一般都要經過逆矩陣、相關系數矩陣的計算,求解特征根與特征向量等過程,這些過程沒有扎實的數學功底是根本不可能完成的。即便能完成這些運算,但也是相當耗時的過程。就運算相對簡單的多元統計分析方法而言,如果采用人工計算器計算的話,也需要大約五個學時的時間才能完成,復雜的多元統計方法需要學時數就更多了。假定學校能夠安排充分的學時數,學生也必須有足夠的能力和耐心去完成這些運算。可見,統計軟件和多元統計分析方法教學的結合是非常必要的。目前,常用的統計分析軟件有SAS、SPSS和STATA。對于醫學專業本科生和研究生的統計分析要求來講,簡單掌握每個軟件基本功能就可以滿足數據分析的需求,但對統計學專業的研究生而言,一般需要用到可編寫程序的SAS軟件,并且要深入學習,進行數據的模型擬合分析。各醫學院校可根據自己的辦學條件、師資力量、教材的情況、授課對象等因素綜合考慮本院校采用醫用多元統計分析的軟件。借助軟件在很短的時間能完成模型的建立、模型擬合檢驗等分析過程,通過分析結果中呈現的模型建立中間步驟,了解矩陣運算,求解特征根與特征向量的信息,把握前因后果、各步驟間的相互關系,大量時間的節余可用在多元統計分析方法的專業應用上。
3通過適宜教材激發學習興趣多元統計分析
原理部分的繁瑣復雜性對該課程的學習形成很大阻礙,且原理部分又不是醫學專業學生學習的重點,這提示了教材選擇的重要性。合適的教材不應該花費很大的篇幅在理論推導和模型建立的過程上,否則只會增加學生對該課程的畏懼心理。教材應當側重于多元統計方法的應用部分,應用部分和學生專業的相關性越強,就越容易激發學生學習興趣。上文中提到學習醫用多元統計分析教學要結合統計分析軟件,因此,教材中最好在每個多元統計方法的介紹之后都安排一個章節,說明這種多元統計方法通過統計分析軟件如何實現,以及軟件運行結果如何解讀。醫學各專業學生一般都未經過系統的統計軟件的學習,因此,教材中軟件相關內容的安排就尤其重要,不僅要有這樣的章節,而且要通俗易懂,適合醫學專業學生的初次統計軟件學習,在每一種多元分析方法數據集的錄入、軟件實現的步驟、一些常用選擇項的介紹、軟件運行結果的每個部分的解讀以及結合專業知識后的結論等各個方面都要有詳盡的解釋。醫學可以劃分成很多不同的專業,如公共衛生、醫藥和臨床專業等,就公共衛生專業又可以進一步詳細劃分成勞動衛生、兒少衛生和營養等專業。目前的醫用多元統計分析教材沒有具體針對各個專業的多元統計分析教材,能選擇到和醫學專業接近的教材充其量也就是醫用多元分析的教材了,因此,通過教材提高學習的積極性還是存在一定的局限性,但這種局限可以通過案例教學來彌補。在授課過程中,授課教師可能通過案例式教學,選擇和授課學生專業休戚相關的例子來進行講解,就格外能吸引學生的注意力。
4通過教學設計引導學生主動學習多媒體技術
在教學中的應用極大優化了教學過程。隨著多媒體技術的發展,教學過程中“傳統的PPT教學”逐漸形成新的多媒體教學形式——微課件。微課件是指使用多媒體技術在五分鐘內就一個知識點進行針對性講解的一段視頻或音頻。基于教學設計,微課件可用于難點講解、內容小結等各個環節。如在教學導入階段,教師根據新課知識點設計新穎的問題,通過簡短的視頻的形式展現。微課件以視頻的形式吸引學生的注意力的同時,將教學問題引入,讓學生帶著問題去聽完一堂課,從而起到引導學生主動學習、增強聽課效果的作用。布置課后作業也是一種很好的引導學生主動學習的途徑。以往教學中教師一般也布置作業,但布置的作業大多是多元分析方法基本思想和原則之類的思考題。筆者在教學實踐中,將課后布置作業題目設定為“收集適用本次理論課醫用多元分析方法的自己專業相關數據,并預計數據分析后可能的結果”。學生在收集數據的過程中,就必須去主動思考這種多元統計分析方法的基本思想、適用原則等問題,并且會進一步產生通過軟件分析此數據的欲望。在實習課上,除了教師規定的實習題目之外,學生一般都會主動完成自己專業數據的分析,和教師探討此數據分析的結果和對專業的指導意義。
5總結
篇3
【關鍵詞】SPSS軟件 多元統計分析 實驗
【中圖分類號】G30-03 【文獻標識碼】A 【文章編號】1674-4810(2012)21-0093-01
一 前言
“概率論與數理統計”是大學數學本科階段課程設置中的一門課程,主要講述一元隨機變量的統計規律,但在社會生活及自然現象中,有很多現象需要同時觀察多項指標,如研究一個地區經濟發展的情況,就需要考慮當地的物價、信貸、稅收、總產值、利潤、固定資產、流動資金等,每一項指標都可看成一隨機變量,如果只對某一項指標進行研究,結果可能是不準確的,因為各個指標之間是有聯系的,可能存在相關性,單獨分析某一個變量,可能丟失部分固有的信息,因而需要對多個指標(變量)進行整體研究,以發現其內部規律,“多元統計分析”就是研究多個變量相互關系及內在統計規律的一門學科,它起源于1928年Wishart發表的論文《多元正態總體樣本協差陣的精確分布》,20世紀40年代,在心理、教育方面有一定的應用,但由于其計算量太大,發展受到一定的制約,到了20世紀50年代,由于電子計算機的發展,“多元統計分析”的方法才在社會各行各業得到迅猛發展,目前其研究工作已取得顯著成績,作為數學專業的學生,掌握該門課程的理論及實驗(軟件的應用)顯得非常必要,但怎樣使理論和實驗教學并舉呢,我們有必要對此問題做進一步的探討。
二 Spss軟件簡介
Spss是Statistical Package for the social sciences的縮寫,意思是社會統計軟件包,是世界上最早的統計軟件,由美國斯坦福大學三位研究生研制。如今,Spss已在銀行、證劵、保險、教育教學、科研市場調查研究、商業、醫療、通訊等多個領域得到廣泛的應用,更為有趣的是,在國際學術交流中,有不成文的規定,凡是用Spss軟件做出的計算結果,可以不必說明算法,由此可見其影響和信譽都是非常高的。Spss的基本功能和特點是數據管理、統計分析、圖表分析、輸出管理等。另外,Spss還具有操作界面友好,輸出結果美觀且清晰直觀的特點。
三 多元統計中Spss軟件的輔助作用
1.實驗設備
一般情況下,Spss運算的數據量非常龐大,因此對用戶的計算機操作系統、CPU、內存、顯卡、磁盤空間等做了最基本的要求,例如:操作系統要求為Windows98或者WindowsXP(2003)等;CPU要求為Premium 133MHz;內存要求為128MB……
2.教學內容和實驗的安排
在本科低年級,學生已經掌握計算機基礎及數據庫技術,因此對Spss的教學以自學為主,講解為輔,提供網上教學網址,督促學生在一段時間內必須自學的內容,輔以作業進行自學效果的測試,作業形式與多元統計分析的教學內容一致。因而,我們只需要掌握多元統計分析的基本原理、方法,了解其計算過程,應用Spss,就可以節省計算所花費的大量時間,把更多的時間、精力用于統計原理的學習和研究。
四 實驗
在研究具體問題時,面臨的是一些雜亂無章的情景或雜亂無章的數據,我們的任務是從這些雜亂無章的數據中發現規律。首先是對雜亂無章的情景進行資料量化處理,如對學習的態度是端正或不端正,要使其量化才能用統計軟件進行分析,因此需要對資料進行編碼。當資料實現量化后,就可以在Spss中錄入數據,進行計算了。
在教學過程中,提供一個實際問題,如研究影響學生學習成績的主要因素是什么?要求學生自己設計問卷調查,這樣學生就必須學會查閱資料,進行實驗設計,然后還需要認真思考,具體地去實施,得到實驗結果所需要的數據,再整理這些資料、數據。錄入Spss進行計算,看懂分析結果,得到答案,形成自己的研究報告。
通過合理安排實驗與理論教學,學以致用,教學目的也就達到了。
參考文獻
[1]張立軍、任華英.多元統計分析實驗[M].北京:中國統計出版社,2009
[2]于秀林、任雪松.多元統計分析[M].北京:中國統計出版社,1999
[3]劉寶權、席仲恩.Spss在英語試卷統計分析中的應用[J].外語電化教學,2004(2)
篇4
【中圖分類號】R2-0【文獻標識碼】A【文章編號】1007-8517(2010)08-021-1
多元統計分析是數理統計學多年來迅速發展起來的一個分支,已廣泛應用到各個領域。該方法能夠在不損失信息的情況下,通過變換和構造模型,剔除指標間相互制約的成分,使復雜數據簡單化[1-4]。在中藥研究中,過去傳統的鑒定技術有一定的局限性[5]。因此,為了更準確全面地反應出它的特征,就應考慮到與其有關的多方面的因素,進行綜合分析和評價。
多元統計分析包括多元回歸、主成分分析、因子分析和聚類分析等方法。利用這些方法可以進行中藥材質量與生態環境的相關性分析、篩選影響中藥材質量的生態主導因子和限制因子、研究影響中藥材質量的綜合作用及動態變化規律等方面的問題[4]。
多元回歸分析已經被廣泛地應用于研究環境因素對中藥生長的影響及研究作物穩定性,對不同生境與銀杏葉黃酮積累的關系的分析[6]以及對盾葉薯蕷皂素含量與氣候生態因子的關系分析[7]就應用了這種分析方法。
主成分分析應用于南蒼術揮發油[8]分析、山藥的道地性分析[9]、不同種類石斛的相關性研究[10]等,為建立一種客觀的中藥質量評價手段提供參考。
應用因子分析對105味植物類中藥所含有的15種稀土元素[11]進行研究,為正確收購及選拔優質藥材提供資料,道地性鑒別提供新的思路和方法。
采用聚類分析方法進行枸杞[12]、關黃柏[13]、延胡索[14]、黃芪[15]等中藥的研究,微量元素或特征性成分含量與中藥藥性的相關性研究[16],正品和非正品黃芩[17]、不同產地枸杞[18]、黃精屬17種藥用植物[19]等的對比研究,均表明聚類分析可用于輔助鑒別中藥的正品和偽品,探討中藥各類群間的系統親緣關系,評價中藥材的來源等。
綜上所述,多元回歸、主成分分析、因子分析和聚類分析已經被廣泛地應用于中藥研究中。但中藥資源種類多、基源復雜、分布廣、成分變化,藥材質量良莠不齊,導致中藥研究受很多因素的影響,使用單一的某種數理統計方法難以對中藥材做出合理的評價,必須根據需要,合理配合上述幾種統計方法一起使用,對赤芍[20]、武漢市水生態系統[21]分析均是幾種方法綜合應用的結果。
多變量統計分析方法在鑒定中藥的真偽和質量優劣、影響中藥材生長發育和品質形成的生態主導因子、限制因子以及這些生態因子的動態變化規律等方面已經取得了可喜的進展。將多變量統計分析結合中藥的特殊性和中藥的特色[22],運用現代的spss等分析軟件研究影響中藥材的生態環境因素、對中藥材復雜成分進行分析,將成為中藥分析研究的發展趨勢。
參考文獻
[1] 左瑞瓊.多元統計分析方法介紹及在經濟中的應用[J].時代經貿,2007,
5(78):23.
[2] RichardA.Johnson,DeanW.Wichem.實用多元統計分析[M].北京:清華大學出版社,2003:347.
[3] 林和平,楊晨.模糊主成分分析方法的研究與分析[J].航空計算技術,2006,36(6):16.
[4] 何曉群.多元統計分析[M].北京:中國人民大學出版社,2004:135.
[5] 陳月娥,姚小華.中藥鑒定新技術的發展概況[J].廣州中醫藥大學學報,
2007,24(4):346.
[6] 孫視,劉晚茍.生態條件對銀杏葉黃酮積累的影響[J].植物資源與環境,1998,7(3):1.
[7] 懷志萍,丁志遵,賀善安,等.盾葉薯蕷皂苷元含量與氣候因素的相關性研究[J].藥學學報,1989,24(9):702.
[8] 郭蘭萍,劉俊英,吉力,等.茅蒼術道地藥材的揮發油組成特征分析[J].中國中藥雜志,2002,27(11):814.
[9] 徐永群,孫素琴,袁子民,等.紅外光譜結合主成分分析鑒別道地山藥[J].分析化學,2002,30(10):1231.
[10] 呂獻康,程存歸,楊國平,等.11種石斛植物的FTIR直接測定和主成分分析[J].中國中藥雜志,2005,30(10):768.
[11] 祁俊生,徐輝碧.稀土元素與中藥藥性關系研究[J].計算與應用化學,2000,17(1):181.
[12] 常璇,胡奇林.用聚類分析方法對寧夏中寧縣和平羅縣枸杞中6種元素綜合指標的比較研究[J].寧夏大學學報(自然科學版),2006,27(3):248.
[13] 張水寒,郭偉偉,蔡光先.I-IPLC指紋圖譜結合系統聚類法對不同產地關黃柏藥材的分析研究[J].科技導報,2006,24(9):53.
[14] 成則豐,李丹婷,李花瓊,等.FIIR聚類分析結合差熱分析法應用于中藥延胡索表征的研究[J].理化檢驗化學分冊,2006,42(8):601.
[15] 沈文英,陳銘華.不同產地黃芪的聚類分析[J].廣東微量元素科學,1999,6(10):49.
[16] 祁俊生,徐輝碧.植物類中藥中微量元素的因子分析和聚類分析[J].分析化學,1998,26(11):1309.
[17] 蘇薇薇.聚類分析法在黃芩鑒別分類中的應用[J].中國中藥雜志,1991,
16(10):579.
[18] 周群,孫素琴,梁曦云,等.枸杞產地的紅外指紋圖譜與聚類分析法研究[J].光譜學與光譜分析,2003,23(3):509.
[19] 林琳,林壽全.黃精屬藥用植物聚類分析[J].中藥材,1994,17(6):12.
[20] 徐永群,黃吳,周群,等.紅外指紋圖譜和聚類分析法在赤芍產域分類鑒別中的應用[J].分析化學,2003,31(1):5.
篇5
摘 要:該文以安徽省上市公司財務數據作為研究對象,依據國內外已有的分析研究結果,輔之主成分分析方法確定股票市場投資價值評價指標體系,通過運用多元統計分析方法,對其綜合實力進行排名,實證結果顯示三七互娛的綜合實力位居榜首。
關鍵詞:多元統計分析 Spss 股票價值
中圖分類號:F832.51 文獻標識碼:A 文章編號:1672-3791(2016)07(a)-0076-02
證券投資是狹義概念上的投資,是投資者通過購買有價的證券,以獲得收益的行為,從中獲取利息或差價,是一種直接形式的投資行為。多元統計分析所研究的內容和方法主要包括數據化簡、分類和分組、研究變量間的依賴關系和多元數據的統計推斷。隨著電子計算機的出現和發展,多元統計分析便開始在醫學、經濟學、文學、氣象等方面得到廣泛的應用。
選取安徽省上市公司進行分析,原有89只股票,剔除了數據不可得和特殊處理的股票,最后得到有效股票70只分別用 ,來代替。首先,經過主成分分析篩選最終確定凈資產收益率、每股收益、每股主營業務收入、應收賬款周轉率、存貨周轉率、流動資產周轉率、主營業務收入增長率、凈利潤增長率、凈資產增長率、速動比率、利息支付倍數、資產負債率、現金流量比率。用,表示。
70家上市公司13個財務指標組成的矩陣的特征值以及累積貢獻率情況參見表1。通過觀察表,人們發現一共有5個特征值大于1。它們共同解釋了安徽省上市公司綜合業績標準差的77.66%(累計貢獻率)。說明這5個公共因子基本上能夠代表原始數據包含的大部分信息。
由于因子載荷矩陣得到的未旋轉的公共因子的實際意義不好解釋,因此,對公共因子進行方差最大化正交旋轉(Varimax),得到旋轉后的因子載荷矩陣。令成長因子為,營運因子為,盈利因子為,償債因子為,現金因子為,原變量可由各因子表示為:
其余變量依次類推。計算各因子的方差貢獻率占5個因子總方差貢獻率的比重,5個因子的比重分別為:29.33%、20.567%、20.13%、17.80%、12.17%。由此可以看出,成長能力因子的比重最大,現金能力因子的比重最小。最后,以各因子的方差貢獻率占5個因子總方差貢獻率的比重作為權重進行加權匯總,得出綜合得分F,即
在財務績效的得分中,因子得分的正、負代表該公司的財務績效與新疆地區平均水平的位置關系,把安徽的平均水平算作零點,這是數據標準化處理后的結果,不會影響可比性。
綜合排名表明了其財務的整體績效,整體財務績效好的公司并不是其財務績效的各個方面都表現較好。如排在首位的三七互娛,發展能力排名第一;營運能力排名靠前,盈利能力、償債能力和現金能力排名卻是排在后面。說明三七互娛目前發展良好,企業擴大規模;壯大實力的潛力強勁,但資產管理效率低下,企業應加強各項資產的管理和提高經濟效益。通過上面分析可以全面反映上市公司的成長性和盈利能力,有利于縮小投資范圍,確定投資價值,降低投資風險。文章的分析方法對指導證券投資提供了一條有效的途徑。
參考文獻
[1] 丁浩.數據挖掘技術在證券分析中的應用研究[D].武漢理工大學,2008.
[2] 馬躍.基于因子分析和投資組合理論的股票投資分析[J].市場觀察,2015(A1):318.
篇6
[關鍵詞]上市銀行;聚類分析;判別分析;主成分分析
1數據來源及模型假設
文章選取 16 家上市銀行為研究對象,對其2016年第三季度財務報表進行整理分析,獲得所需數據。為了便于解決和研究問題,提出以下幾條假設:①假設16 家上市銀行的年報真實可信;②假設上市銀行在編制年報時使用會計記賬方式等一致;③假設設置的變量取值都有實際意義且數據記錄準確規范。
2數據指標的構建
文章從公司規模、盈利能力、償還能力、成長能力、營運能力五個方面選取19個量化指標,分別為基本每股收益、主營業務收入、主營業務利潤、營業利潤、投資收益、利潤總額、凈利潤、經營活動產生的現金流量凈額、總資產、總負債、股東權益(不含少數股東權益)、凈資產收益率加權、凈資產收益率、凈資產報酬率、非主營比重、凈利潤增長率、資產的經營現金流量回報率、經營現金凈流量與凈利潤比率、經營現金凈流量對負債比率。
3聚類分析
31變量分類
第一類中的五個指標是對銀行收益進行刻畫的指標:第二類中的八個指標是對利潤、資產、負債和所有者權益的表現;第三類的兩個指標是對銀行其他業務的收入的刻畫;第四類的四個指標是對銀行現金流量的反映。
32樣品分類
通過最遠鄰元素、Ward法和K-均值聚類法三種分類結果比較,民生銀行、南京銀行、寧波銀行分類結果不一致,因而采用判別分析繼續研究。
4判別分析
判別分析選用方法:貝葉斯判別。根據分類函數系數表可以得出三組判別函數的表達式。
將各銀行數據進行回判結果如下。
回判結果表明:總的回代判對率為100%。待判銀行:民生銀行、南京銀行、寧波銀行,其判別結果如下:
民生銀行、南京銀行屬于第二類,寧波銀行屬于第一類。
5主成分分析
51主成分分析過程
(1)將原始數據標準化。
(2)建立變量的相關系數陣。
(3)求相關系數陣的特征根和相應的單位特征向量。
(4)主成分函數。
在第一主成分表達式中,主營業務收入、主營業務利潤、營業利潤、利潤總額、凈利潤、總資產、總負債、股東權益(不含少數股東權益)的系數較大,這八個指標起主要作用,可以把第一主成分看作收入、利潤、資產、負債、所有者權益的銀行總體規模的綜合指標。同理,可以把第二主成分看作銀行營運能力的指標,把第三主成分看作利潤成長能力的指標,把第四主成分看作非主營業務收入能力的指標。
52樣品主成分得分結果
綜合排名前四名是建設銀行、工商銀行、農業銀行和中國銀行,對應聚類分析結果的第三類。國有的四大銀行在總體規模、營運能力、利潤成長能力、非主營收入能力四方面的綜合能力都有著顯著的優勢。
在y行總體規模方面,四大國有銀行的總體規模比較是:工商銀行>建設銀行>農業銀行>中國銀行。在銀行營運能力方面,建設銀行>農業銀行>工商銀行>中國銀行,說明建設銀行和農業銀行的運轉出色。在利潤成長能力方面,建設銀行>工商銀行>農業銀行>中國銀行,建設銀行實現了較高的利潤水平。在非主營收入能力方面,中國銀行>建設銀行>農業銀行>工商銀行,中國銀行和建設銀行優化了收入結構,中間業務收入占總收入的比重加大,拓寬了利潤空間。
綜合排名在第五名到第十一名的銀行均是在2016年第三季度業績優良的商業銀行。利用同樣的分析方法得出:在銀行總體規模方面,民生銀行與交通銀行的總體實力較強。在銀行營運能力方面,民生銀行與寧波銀行的營運能力較好。在利潤成長能力方面,招商銀行與浦發銀行的利潤成長能力較強。在非主營收入方面,民生銀行與寧波銀行的中間收入較高,突破了傳統收入的局限,拓寬了利潤渠道。總體來講,這七家銀行各有各的優勢,也各有各的不足,水平相當。
剩余五家銀行:平安銀行、華夏銀行、北京銀行、南京銀行、光大銀行總體業績較差,總體規模較小,營運能力較差,沒有自己突出的優勢,因此整體業績落后于其他銀行。
篇7
關鍵詞:主成分分析;累計貢獻率;衛Ⅷ項目
中圖分類號:94 文獻標識碼:A1概述
近幾年來,醫療問題一直是媒介探討的熱點,因為醫療涉及民生,是老百姓所最為關心的切實問題,尤其是對于廣大的中國農村來說。農村人民看病難,看病貴,最主要的原因在于醫療衛生條件差,特別是農村貧困地區的基本衛生服務。中國農村貧困地區基本衛生服務關系到廣大貧困人口的生命健康,改善農村貧困地區衛生服務提供能力和提高衛生服務利用水平,保證當地居a民獲得基本醫療衛生保健服務,是國家醫療改革的基礎,也是重點項目。而所有這些改善必須對農村現有醫療水平條件進行充分的統計、分析、論證,形成標準,才能進行具體的改革措施。本文選用了河南省的十個貧困縣:固始縣、南召縣、寧陵縣、商城縣、嵩縣、臺前縣、息縣縣、淅川縣、伊川縣和宜陽縣。對各縣的各項衛生服務指標進行綜合評價、監督,以此為農村的醫療條件健康改善的可持續性發展策略提供依據。由于該項研究所涉監督評價指標多達23個,一般的方法分析起來比較復雜,且不夠清晰,所以本文利用主成分分析方法,對2010年河南省十個項目縣的有關監督評價指標進行綜合分析。
2 項目縣的各項衛生服務條件的主成分分析
2.1 項目縣的各項衛生服務指標及變量表示
項目縣的各項衛生服務指標及變量表示如表1:
2.2 用SAS軟件求23個變量X1-X23的相關系數陣
用SAS軟件求23個變量X1-X23的相關系數陣,結果如表2:
2.3 特征值柱形圖及說明
用SAS軟件對23個變量X1-X23的相關系數陣做主成分分析,得到九個特征值、積累貢獻率如下:
從上面的圖和表中可以看出:前三個主成分的積累貢獻率已達74%,前五個主成分的積累貢獻率已達89%,前三個、五個主成分分別提取了原信息的百分之七十四、百分之八十九的信息,因此,可以分別用三個、五個主成分指標對十個項目縣的各項衛生服務狀況進行排序和評價。
2.4 按前三個主成分得分將十個項目縣排序
2.4.1 九個特征值對應的九個單位特征向量如表4:
2.4.2 前三個主成分分別為:
Z1=0.142496x1+0.088717x2-0.022254x3-0.132704x4-0.056289x5-0.121313x6+0.199755x7+0.244042x8+0.253440x9+0.277611x10+0.262456x11+0.293805x12+0.321268x13+0.315522x14+0.266463x15-0.001035x16+0.293805x17+0.288888x18+0.157569x19-0.120195x20-.138887x21+0.007701x22+0.194162x23
Z2=0.103055x1+0.123117x2+0.418256x3+0.383862x4+0.408780x5+0.356531x6-0.079160x7+0.007741x8-0.004320x9+0.157139x10+0.090258x11+0.030071x12-0.048633x13-0.029880x14+0.012669x15+0.165422x16+0.030071x17+0.067026x18+0.213974x19-0.306342x20+0.152238x21-0.337493x22-0.068864x23
Z3=0.442950x1+0.485939x2+0.011525x3-0.009673x4+0.105397x5-0.106250x6+0.064607x7+0.191700x8-0.292611x9+0.186519x10-0.201969x11-0.240587x12+0.089550x13+0.126841x14+0.114173x15+0.006817x16-0.240587x17-0.191868x18+0.141740x19+0.086677x20-0.176106x21+0.232383x22-0.201305x23
其中x1,x2,…,x23是標準化后的數據。
2.4.3前三個主成分得分:(表5)
表5:前三個主成分得分表6:按前三個主成分綜合得分的排序結果
2.4.4按前三個主成分綜合得分的排序(表6)
2.5按前五個主成分得分將十個項目縣排序
2.5.1第四、第五主成分分別為:
Z4=0.114497x1-0.116340x2-0.089872x3-0.087571x4-0.005349x5+0.232200x6+0.381680x7+0.400498x8-0.292611x9-0.078958x10-0.036921x11+0.064448x12+0.033396x13+0.015480x14-0.194447x15+0.539327x16-0.064448x17+0.060082x18-0.233232x19+0.303830x20+0.136652x21-0.187477x22-0.020050x23
Z5=0.295989x1-0.061444x2+0.008347x3-0.045274x4-0.120288x5-0.078114x6+0.326381x7-0.118721x8+0.102858x9+0.045083x10-0.045521x11-0.10002012+0.034516x13-0.012080x14-0.358669x15-0.080845x16-0.100020x17-0.172009x18+0.271956x19-0.197948x20+0.518829x21+0.120428x220+0.409487x23
其中x1,x2,…,x23是標準化后的數據。
2.5.2前五個主成分得分(表7)
2.5.3按前五個主成分綜合得分的排序(表8)
總結
在第一主成分的表達式中第十二,十三,十四,十七項指標的系數較大,這四個指標起主要作用,我們可以把第一主成分看成是由縣衛生局認可與縣級機構建立有效轉診、縣衛生局認可與縣級機構建立督導制度、使用標準臨床規范、使用基本藥物目錄的綜合指標。因此,第一主成分主要反映了各個縣的醫療衛生制度實施狀況,該主成分的得分越高,說明該縣的醫療衛生制度實施狀況越好。因此通過對第一主成分的排序可以很直觀的看出各縣的醫療衛生制度實施情況好壞。
在第二主成分的表達式中第三,四,五,六項指標的系數較大,這四個指標起主要作用,我們可以把第二主成分看成是鄉衛生院出院病人數和床位使用率(%)的綜合指標。因此,第二主成分主要提取的是鄉衛生院的治愈率和就診率的信息,該主成分的得分情況反映了基層醫院的醫療水平狀況。
在第三主成分中,第一,第二項指數影響較大,遠超過其他指標,可看成是鄉衛生院門急診人次數的影響。因此該主成分的得分反映的基層人民的就診能力狀況。
在第四主成分中,第七、第八、第十六項指標的系數較大,可看成是鄉衛生院平均每名衛技人員日門急診人次數、符合國家X線防護要求的綜合指標。
在第五主成分中,第二十一、第二十三項指標的系數較大,可看成是非住院分娩新法接生率、特困人口救助注冊人數占農業人口的比例的綜合指標。
參考文獻
[1]何曉群.多元統計分析[M].北京:中國人民大學出版社,2004年4月.
[2]王學民.應用多元統計分析(第二版)[M].上海:上海財經大學出版社,2004年1月.
[3]高惠璇.應用多元統計分析[M].北京:北京大學出版社,2005年1月.
[4]喬峰,姚儉.時序全局主成分分析在經濟發展動態描繪中的應用[M].北京:北京科技大學學報,2003年10月.
篇8
【關鍵詞】城市交通運輸;逐步線性回歸;系統聚類分析
1.引言
城市作為政治、經濟、文化中心,在國家發展中發揮著重要作用。20世紀80年代開始,學者開展了一系列對中國城市的研究,如提出中國的城市影響域系統,并評價中國城市的影響力。根據因子分析方法,對中國城市進行綜合實力的評價,建立綜合評價體系,分析中國地級以上城市綜合競爭力,以及中國城市人口可比增長速度的空間差異。根據城市網絡圖探討新城在城市網絡中的作用以及城市網絡對新城發展的影響;運用層次分析和多指標加權法對中國城市科教職能進行等級劃分及空間分布研究。
國外關于城市交通運輸的研究集中在城市交通運輸與城市空間、居民出行、城市交通問題及其相關政策等方面,區域中的城市交通運輸研究主要是城際問的客貨流變化等問題,以及城市交通運輸結構變化引發的交通運輸問題,例如對尼日利亞、捷克斯洛伐克、印度、巴西、英國等國家的研究;Sylvie選取中國24個省區為基本分析單元,以鐵路、公路和水運路網的密度為指標,研究中國省際交通網絡發展水平的差異,結果表明交通網絡密度較高的省份集中于東部沿海地區,西部地區則較低上述分析基本上是以城市的總體發展或者以人口和土地等要素為主來進行的,在分析中也涉及到了城市交通運輸的一些方面。
本文研究的城市交通運輸既包括城市對外交通運輸發展,也包括城市內部交通運輸發展兩個部分。城市交通運輸發展水平主要表現為城市交通設施的發展和運輸能力,主要包括道路面積和車輛、客運量和貨運量等。本文在總結上述研究經驗的基礎上,主要根據城市在城市體系、區域及國家發展中的重要性,資料信息的完備性、可比性及其獲取的可能性,確定以2010年的279個地級以上城市的城市交通運輸為研究對象和評價目標。
2.指標選取
在前人研究的基礎上,本文將影響城市交通運輸的因素歸結為:貨運總量、客運總量、城市GDP、城市產業結構、城市人口、城市道路面積、城市汽(電)車營運數量、城市出租車數量等。鑒于數據獲取的有限性和分析的可靠性,本文選取客運總量、貨運總量、城市GDP、城市產業結構中的第二產業占GDP中的比重以及第三產業占GDP中的比重、城市人口、城市道路面積、城市汽(電)車營運數量和城市出租車數量9個指標作為研究城市交通運輸的影響因素。
(1)客運、貨運總量
客運和貨運總量是衡量一個城市對內對外交通運輸發展的總量指標,通過這個指標可以得出一個城市的城市交通運輸發展狀況,它包括城市鐵路運輸量、公路運輸量、水路運輸量、航空運輸量等。
(2)城市GDP
即城市市轄區內年生產總值,是衡量一個城市經濟發展水平的最重要指標,GDP總量大意味著經濟發展水平高。
(3)城市產業結構
城市社會再生產過程中形成的各產業之間及其內部各行業之間的比例關系和結合狀況,由于各個城市的自然條件和社會經濟條件不同,引起國民經濟部門配置和發展規模不同,因而不同城市的轉出產業的差別較大。就城市本身而言,第二產業占GDP的比重越高表明城市工業和制造業越發達;而第三產業占GDP的比重越高表明城市服務水平越高。
(4)城市人口
衡量一個城市社會發展水平的指標,一般情況下城市人口越多,表明這個城市對于人口的吸引力越強,城市的社會發展水平越高。
(5)城市道路面積
城市道路面積對一個城市來說極其重要,是衡量一個城市發展的重要指標。
(6)城市汽(電)車營運數量
城市汽(電)車是城市居民主要的出行交通工具,是城市公共交通最主要的衡量指標。
(7)城市出租車數量
城市車租車也是城市居民較為主要的出行交通工具,但其價格比汽(電)車昂貴。城市出租車數量也是城市公共交通最主要的衡量指標。
將以上指標假設如表1。
本文研究分析我國地級以上281個城市2010年城市交通運輸的多元回歸分析和系統聚類分析,其數據來源于2011年《中國統計城市統計年鑒》。
3.城市交通運輸多元回歸分析
城市交通運輸發展水平與城市經濟發展、城市社會發展以及城市交通基礎設施規模是否存在線性關系,下面分別通過逐步回歸的方法建立城市客運總量與假設的其余指標之間的線性函數,城市貨運總量與假設的其余指標之間的線性函數,旨在通過建立函數揭示城市交通運輸發展的影響因素和預測未來城市交通運輸的發展趨勢。
3.1 以城市客運總量為因變量的逐步回歸分析
將客運總量與GDP(當年價格萬元)、第二產業占GDP中的比重(市轄區)、第三產業占GDP中的比重(市轄區)、城市市轄區人口(萬人)、城市道路面積(萬平方米)、城市公共汽(電)車營運數量(量)和城市出租車數量(量)輸入統計軟件SPSS中,以客運總量為因變量,其他的為自變量,得出如下表2結果:
注:逐步回歸進入的自變量為X8, X9, X9, X3, X7;因變量為X1
篇9
Abstract: According to the university scientific research data in nearly ten years, the factor analysis and cluster analysis statistical methods in the multivariate statistical analysis are used to carry out the comprehensive evaluation analysis of the college scientific research status and put forward a method for evaluating the state of the research. Research shows that, in some colleges, the first factor is very high, indicating that these colleges in cutting-edge academic research achievements. But at the same time, the third factor is low, indicating that these colleges and enterprises to contact the lack of scientific research. In other colleges, the second factor is very high, indicating that these colleges in the per capita contribution rate, C class paper per capita contribution rate and other aspects to do better. In addition, some of the college's third factor is very high, indicating that these colleges are closely related to the enterprise's scientific research and cooperation. The results of the subsequent cluster analysis also confirmed the rationality of the conclusion of the comprehensive evaluation analysis. Through the study of this paper, it provides a theoretical basis for the scientific management system and evaluation system of scientific research achievements.
關鍵詞: 高校;科研狀況;因子分析;聚類分析;評價
Key words: colleges and universities;research status;factor analysis;cluster analysis;evaluate
中圖分類號:G463 文獻標識碼:A 文章編號:1006-4311(2016)31-0015-04
0 引言
科研能力是衡量一所高校科教水平的重要標志。某高校作為省重點高校有著悠久的辦學歷史,科研水平在省內也是名列前茅,本文針對該高校20個學院的各項科研指標進行多元統計分析,建立了描述科研水平的各類變量,包括各類科研項目的經費總額、各類論文的發表數量、論著發表數量,投入科研人員數量等。但由于各學院規模不一,各學院科研性質也不盡相同,為了保證研究結果的平衡性,本文采用對科研成果人均貢獻率的方式進行研究。然而進行統計分析時,并非變量收集的越多越有利,變量間信息的高度相關、高度重疊會給統計方法的應用帶來許多困難,因此本文借助SPSS統計分析軟件,采用因子分析方法,在眾多變量中提取影響各學院科研狀況的主要因子對問題進行分析,最后通過因子變量的聚類分析對評價結果進行驗證。國內學者目前主要集中對我國體育事業進行科研狀況分析,如賈志強、鄭巖平對我國1995-2000年籃球科研狀況作了分析。張金、夏秀榮對我國1994-2003年排球科研狀況作了分析。在高校科研狀況分析方面,孟學英、陳春華利用調查問卷方式對我國部分高職院校教師科研狀況做了調查分析。同時國內對多元統計方法的應用也主要集中在醫療、經濟方面,如孟瑩、謝守祥等利用多元統計分析方法對江蘇省經濟差異化做了分析。王曦、宋劍南利用多元統計分析方法對影響中醫癥候的主要因素做了研究。利用多元統計分析方法結合高效科研狀況評價分析還鮮有研究。本文結合多元統計分析分析方法對某高校科學地建立高校科研業績的管理體系及評價體系提供了理論依據。
1 因子分析方法簡介
因子分析是利用降維的思想,由研究原始變量相關矩陣內部的依賴關系出發,把一些具有錯綜復雜關系的變量歸結為少數幾個綜合因子的一種多變量統計分析方法。因子分析的基本思想是根據相關性大小把原始變量分組,使得同組內的變量之間相關性較高,而不同組的變量之間的相關性則較低。每組變量代表一個基本結構,并用一個不可觀測的綜合變量表示,這個基本結構就稱為公共因子。對于所研究問題的某一具體問題,原始變量可以分解成兩部分之和的形式,一部分是少數幾個不可測的所謂公共因子的線性函數,另一部分是與公共因子無關的特殊因子。進行因子分析的步驟如下:①根據研究問題選取原始變量。②對原始變量進行標準化并求其相關陣,分析變量之間的相關性。③求解初始公共因子及因子載荷矩陣。④因子旋轉。⑤因子得分。⑥根據因子得分值進行進一步分析。
2 各學院科研狀況的因子分析
2.1 數據分析和指標選取
本文選用的數據來源于某高校2006年至2015年的統計數據。設定數據中8個指標變量分別是X1:2006-2015年橫向項目金額人均貢獻率(萬元/人);X2:2006-2015年市校級項目金額人均貢獻率(萬元/人);X3:2006-2015年省部級項目金額人均貢獻率(萬元/人);X4:2006-2015年國家級項目金額人均貢獻率(萬元/人);X5:A類論文人均貢獻率(篇/人);X6:B類論文人均貢獻率(篇/人);X7:C類論文人均貢獻率(篇/人);X8:論著數量人均貢獻率(項/人)。數據詳情見表1。
在進行數據分析前,進行KMO檢驗,P值為0.000,檢驗結果是顯著的,同時KMO值達到0.577,結果見表2,表明數據之間具有一定的相關性,可進行因子分析。
從表3變量共同度表中可以看出因子分析的變量共同度均較高,表明變量中的大部分信息均被因子所提取,說明因子分析的結果是有效的。
2.2 因子提取和因子解釋
現應用主成分分析法來進行因子提取和因子個數的確定,從表4中可以看出只有前三個因子特征根大于1,并且前三個因子特征值之和接近80%,故提取前三個因子基本包含了全部測評指標的絕大部分信息,因子分析效果較理想。
由于初始載荷陣結構不夠清晰,不便于對因子進行解釋,因此對因子載荷矩陣實行旋轉,達到簡化結構的目的,使各變量在某些因子上有較高載荷,而在其余因子上只有小到中等的載荷。這里采用方差最大正交旋轉法進行因子旋轉。結果見表5。
從旋轉后的因子載荷矩陣來看,第一個主因子在省部級項目金額人均貢獻率、國家級項目金額人均貢獻率、A類論文人均貢獻率、B類論文人均貢獻率上具有較高載荷,第二個主因子在C類論文人均貢獻率、論著數量人均貢獻率上具有較高載荷,第三個主因子在橫向項目金額人均貢獻率、市校級項目金額人均貢獻率上具有較高載荷。
2.3 因子得分和因子變量
本文采用回歸法估計因子得分系數,并輸出因子得分系數矩陣見表6。
根據表6可寫出以下因子得分函數:F1=-0.014橫向項目金額人均貢獻率-0.078市校級項目金額人均貢獻率+0.263省部級項目金額人均貢獻率+0.293國家級項目金額人均貢獻率+0.178A類論文人均貢獻率+0.508B類論文人均貢獻率+0.021C類論文人均貢獻率+0.174論著人均貢獻率(1);F2=-0.159橫向項目金額人均貢獻率+0.065市校級項目金額人均貢獻率+0.00省部級項目金額人均貢獻率-0.057國家級項目金額人均貢獻率-0.235A類論文人均貢獻率+0.393B類論文人均貢獻率+0.328C類論文人均貢獻率+0.570論著人均貢獻率(2);F3=0.442橫向項目金額人均貢獻率+0.582市校級項目金額人均貢獻率+0.123省部級項目金額人均貢獻率+0.010國家級項目金額人均貢獻率-0.076A類論文人均貢獻率-0.219B類論文人均貢獻率+0.384C類論文人均貢獻率-0.010論著人均貢獻率(3)
通過上述公式(1)、公式(2)和公式(3)可得到各個學院的因子得分。從而獲得三個因子變量,由于這三個因子變量是線性無關的。因此,可以利用它們對各個學院的科研狀況做統計分析。
3 各學院科研狀況的綜合評價分析
下面利用三個因子變量對2006年-2015年該高校各學院科研狀況做多元統計分析,并對各學院近10年來科研狀況進行綜合評價。
首先畫出三因子變量的散點圖,對各學院近10年來科研狀況做對比分析。以第一因子變量為橫坐標,第二因子變量為縱坐標,第三因子變量為豎坐標的三維散點圖如圖1所示。
從圖1中可以看出P學院、O學院、M學院等的第一因子很高。說明這些學院在國家級項目人均貢獻率、省部級項目人均貢獻率、A類論文人均貢獻率、B類論文人均貢獻率上成績突出,但在橫向項目人均貢獻率上稍顯不足,這些學院應該在保持尖端學術科研的前提下,多加強與企業的合作,創造更多產業應用成果。L學院、R學院、N學院等的第二因子很高,說明這些學院在論著人均貢獻率、C類論文人均貢獻率上成績突出,這與這些學院的科研性質是密不可分的,第二因子很高的學院可以在保持自己科研特色的前提下,多關注學術前沿的相關信息,爭取在尖端科研中有更大的突破。如B學院、I學院等的第三因子很高,說明這些學院在橫向項目人均貢獻率上成績突出,這些學院可以在緊密保持與企業的科研聯系的基礎上,加強自己在學科特色科研中的研究,多出一些基礎研究方面的尖端科研學術成果,增強學院在科研創新中的能力。
最后利用系統聚類分析法對各學院科研狀況進行聚類分析,即利用三因子變量對20個學院進行聚類,結果如表7所示,M學院、P學院、O學院和J學院為一類,B學院、I學院為一類,其它學院為一類。這個結果與散點圖分析的情況基本類似。
4 結束語
本文針對某高校各學院科研狀況進行綜合評價分析,通過對高校近十年科研指標數據進行因子分析,將八個指標變量分為三個科研因子,分別是高端科研因子、校企合作科研因子、基礎科研因子,并給出了因子得分模型,對各學院近十年的科研狀況給出了分析,最終的聚類分析結果也對各學院科研狀況做了驗證說明。論文的研究成果為科學地建立高校科研業績的管理體系及評價體系提供了理論依據。
從分析結果來看,因學院科研特色不同,導致各個學院在學術科研這個萬花筒中所扮演的角色也各不相同,但各學院之間還是應當加強科研合作,取他人之長補己之短,這樣才能為該高校向科研大校、科研強校的進軍道路上打下堅實的基礎。
參考文獻:
[1]薛薇.SPSS 統計分析方法及應用[M].二版.北京:電子工業出版社,2006:303-349.
[2]張文彤.SPSS11統計分析教程―高級篇[M].北京:北京希望電子出版社,2002:166-210.
[3]李衛東.應用多元統計分析[M].北京:北京大學出版社,2008:226-240.
[4]閻慈琳.關于主成分分析做綜合評價的若干問題[J].數理統計與管理,1998(2):22-24.
[5]胡永宏,賀思輝.綜合評價方法[M].北京:經濟科學出版社, 2000.
[6]何曉群.現代統計分析方法與應用[M].北京:中國人民大學出版社,2003,8:15-18.
篇10
關鍵詞 地理信息系統,圖象處理,圖象分析.
多源圖象處理與分析系統的主要研究目的是為了解決柵格化的二維空間分布數據的處理和分析.柵格化的二維空間分布數據包括各種遙感數據、航測數據、航空雷達數據、各種攝影的圖象數據,以及通過數據化和網格化的地質圖、地形圖、各種地球物理、地球化學數據和其他專業圖象數據.多源圖象處理與分析系統研究的意義是在微機上實現多源圖象數據的快速處理和分析,為柵格型地理信息系統的實現開辟一條新的途徑.
1 系統總體設計思想和原則
(1)多源圖象處理與分析系統的設計應遵循軟件工程學的原理,采取模塊化的方法來進行設計;對軟件的各個底層模塊要求具有可移植性和可維護性,以便于在多種軟件和硬件平臺上進行移植;對WINDOWS操作系統環境的系統高層模塊要求具有高度的可移植性和與硬件平臺的無關性;在多源圖象處理與分析系統和WINDOWS操作系統的功能分工上,主張應由操作系統完成的工作由操作系統去完成為原則;對操作界面則是依照人機工程學的觀點來進行設計,以操作使用方便為原則;系統采用C語言進行編程.
(2)多源圖象處理與分析系統的設計目標之一是能處理和分析數據量在幾百兆到幾千兆的大圖象,所以系統的設計必須以大圖象作為出發點,在數據結構的定義上、算法的實現上以及在系統的軟硬件平臺的選擇上都必須給予充分的考慮.而多源圖象處理與分析系統的功能設計則應建立在系統的數據結構上,在數據結構定義好的前提下,功能可多可少,以形成開放性的系統.
(3)作為專業的圖象信息系統,必須具備對各類專業數據進行處理和分析的能力.在分析和總結各專業領域的數據類型后,多源圖象處理與分析系統引入了以下圖象類型:二值圖、灰度圖、256色索引和分類圖(單字節圖)、64K的高彩圖(索引圖、分類圖和整數專業數據)(雙字節圖)、RGB真彩色圖(3字節圖)、RGBP透明真彩色疊加圖(4字節圖)、4字節浮點數據圖(用于各種頻域變換和各種專業圖象數據以及圖象計算的中間結果)和復數(用于頻域變換).
(4)雖然多源圖象處理與分析系統是以柵格數據為主的空間信息系統,單作為地理信息系統MAPGIS的一部分,必須支持柵格圖、矢量圖混合顯示、綜合處理、綜合分析等功能.
(5)圖層作為當代地理信息系統的核心數據結構,對數據的組織、管理,數據的疊加分析以及綜合處理都具有重要的意義.多源圖象處理與分析系統中引入了圖層的思想(支持1024層或256層(WIN 32S)),以動態透明地疊加顯示各個圖層的柵格或矢量圖,進行綜合動態比較、分析.
(6)建立彩色數據庫,以支持RGB,HLS和HSV的選色及色彩的調節和配準,優化的236色調色板以支持256色顯示器模擬真彩色顯示(建立RGB到236色的索引表);建立HLS,HSV的色庫,建立一些常用連續色調的彩色數據以表示數據連續且有大小意義的圖象.
(7)圖象和圖象、圖象和圖形間的處理、分析、疊加比較、疊加分析、鑲嵌等操作均需要各個圖象、圖形具有統一的坐標,支持各種投影變換及幾何校正(建立統一的地理坐標系).
(8)在圖象分析的高級和智能化階段,圖象聚類、圖象分割、圖象自動識別是圖象處理和分析的主要任務,在這類處理、分析的結果圖象上就存在不確定的數據,支持未定義數據以及保留數據位(以表示未定義數據以及保留數據位……)應是多源圖象處理與分析系統的一個重點.
(9)作為人機交互界面的彩色顯示器將各個圖象、圖形等信息以紅綠藍(RGB)彩色點的形式傳遞給人.RGB彩色模型是一個客觀彩色模型,對硬件而言這是很好的彩色模型;但對人來說RGB彩色模型就很難控制和掌握.要對RGB彩色模型進行控制,就需要引入一個更適合人的中間彩色模型.雙六棱錐彩色模型[1]和單六棱錐彩色模型[1](HLS和HSV)就是其中的兩個適用的主觀彩色模型.這是多源圖象處理與分析系統的彩色合成、彩色分解、彩色調節、彩色自動賦值的理論基礎.
(10)作為人機交互界面的彩色顯示器以及人眼的輸入與輸出的響應都是非線性系統,支持顯示器的伽瑪校正及色度校正[2],使多源圖象處理與分析系統能更好地進行彩色設計.
(11)柵格圖象數據量往往很大,而用戶的目標區可能很小,同時為支持小區的試錯操作,多源圖象處理與分析系統支持選區操作和裁剪區操作,支持局部操作,缺省選區為全圖.
(12)為了顯示系統工作狀態,引入狀態提示行以顯示注釋信息并引入等待光標;在窗口標題中放入圖象信息;顯示光標的客戶區坐標、圖象位置坐標、圖象地理坐標.
(13)支持多類多文檔子窗口,包括圖象(圖象和圖形)、文本、表格.
(14)為支持大圖象和節省內存空間,客戶區的顯示內容應是動態生成的.
(15)由于對整數專業數據圖、4字節浮點數據圖不能直接顯示,可以考慮設定一個參數以表示如何顯示這個圖象數據.
(16)對二值圖與256色、64K編碼圖而言,其彩色值表示類,可以直接通過彩色值查找類別及其面積、方差等,還可以進行膨脹、中值濾波、十字中值濾波、最頻值濾波.
(17)數據進入多源圖象處理與分析系統前需進行格式轉換,系統內部只支持自己的數據格式,其他數據格式需通過轉換程序轉換,這樣可以簡化多源圖象處理與分析系統的設計和編程.
(18)引入數據庫工程和數據庫項目的概念,在工程、項目的概念和圖層的概念間建立一種關系,以簡化系統文件的管理機制.
2 系統總體結構的設計
系統總體結構的設計采用了WINDOWS的多文檔窗口界面技術、WINDOWS的虛擬內存管理技術[3]、WINDOWS的內存映射文件技術和多源圖象處理與分析系統定義文件系統.在多文檔窗口界面的控制下,每個圖象對應的各類數據文件通過內存映射文件技術和虛擬內存管理技術建立一個子圖象文檔窗口,并在多文檔窗口界面的控制下,實現各菜單命令和消息通訊.
多文檔界面(MDI)是Microsoft WINDOWS處理文本的應用程序規范[4,5].該規范描述了窗口結構和允許用戶在單個應用程序中使用多文檔的用戶界面.利用MDI技術,我們可以打開和生成任意幅圖象(只要內存和虛擬內存允許),每個圖象作為一個文檔,這些文檔可同時保留在客戶區域內.
利用虛擬內存管理[3],系統可以得到2GB的地址空間,這使得多源圖象處理與分析首次擺脫了DOS和WINDOWS 3.1在內存分配上的分段機制,使得多 源圖象處理與分析在微機上實現成為可能.
內存映射文件技術是WINDOWS NT提供的一種新的文件數據存取機制.利用內存映射文件技術,系統可以在2GB的地址空間中為文件保留一部分空間,并將文件映射到這塊保留空間.一旦文件被映射之后,WINDOWS NT將仔細管理頁映射、緩沖以及高速緩沖等任務.
3 系統功能的設計
多源圖象處理與分析系統的功能設計是建立在系統的數據結構上,在數據結構定義好的前提下,功能可多可少,以形成開放性的系統.目前設計的功能如下.
(1)輸入輸出功能.包括各種格式、各種類型數據的輸入輸出,以及向量、柵格、表格數據的相互轉換和注字輸出功能(TIGAR,BMP,TIFF,RAW,PCX,GIF柵格格式,WMF,MAPGIS矢量格式,FOXPRO數據庫表格).
(2)矢量操作功能.支持各種矢量數據的柵格化,包括線段矢量圖、多邊形矢量圖、點表圖的柵格化(用于MAPGIS矢量圖向柵格圖轉變).
(3)圖象顯示功能.支持彩色查找表的檢索和修改(用于256色、64K索引圖、分類圖),屏幕柵格圖拷貝、剪切、粘貼,象素信息檢索(分類圖的分類信息包括彩色、面積、類別),三維透視顯示(利用DEM生成),立體象對生成(利用DEM生成),視域圖生成(利用DEM生成),光標、坐標輸入的空間查詢,三維立體地形顯示,最佳路徑圖生成,密度切片圖、密度剖面圖、直方圖顯示,圖象加網格(公里網、經緯網),平面等值線圖、矢量立體透視圖繪制,圖象自動漫游,圖象注記,光照陰影圖、浮雕立體圖的生成及圖象多層覆蓋操作.
(4)空間分析功能.包括多幅圖象的自定義宏運算,交叉混合,區域編號,距離圖生成,插值柵格化(等值線插值、點插值、柵格重采樣),多平臺數據配準及重采樣,圖象地理坐標參照(加坐標、幾何變換、圖象配準、幾何校正、比例尺及地圖投影變換),距離量算,面積統計,邊界提取,指定屬性的空間分布,紋理特征提取,編碼圖象的空間分析(空間邏輯運算、二值圖象的位邏輯運算、共現指數圖象生成、圖象形態學分析(開、閉、擊中、膨脹、腐蝕等操作)),緩沖區分析,三維立體的剖切分析,圖象相關矩陣分析和比值分析功能.