數理統計課程應用統計學探討

時間:2022-10-18 10:35:09

導語:數理統計課程應用統計學探討一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

數理統計課程應用統計學探討

摘要:本文旨在對應用統計學專業中數理統計課程的現狀進行分析,針對目前該課程教學過程中存在的問題,通過引入Python軟件對各主要知識點內容進行實現,并從教師隊伍、實踐教學和過程化考核等方面給出課程改革的幾點探索,以提高學生學習興趣、加深學生對知識內涵的理解、培養學生實踐和解決實際問題的能力,更高質量地落實應用型人才的培養。

關鍵詞:數理統計;應用統計學;Python程序設計語言;人才培養

隨著科技的快速發展,數理統計在自然科學、工程技術、管理科學及人文社會科學中得到越來越廣泛應用。對于該課程傳統的重理論輕應用的教學模式已不能適應時代的發展和社會對人才的需求。應用型人才的培養已成為新時代人才培養的風向標,結合大數據時代現狀的發展需要,培養數理統計分析處理方面的人才更是大勢所趨。數理統計作為數學的一個分支,其以概率論為基礎,研究大量隨機現象的統計規律性,由于計算機的廣泛應用使得數理統計在理論研究和應用已滲透到許多科學領域,并已成為科學研究不可缺少的工具[1]。但是,當前數理統計課程教學過程中與計算機技術的結合卻存在嚴重的問題。為了提高教學效果、培養學生動手操作能力,將當前主流計算機語言用于在應用層面揭示各數理統計知識點的內涵,并使得學生能夠熟練使用計算工具處理具體的數理統計問題,進而對該課程的教學改革進行探索,以實現應用型人才的全面培養是當前該課程面對的首要問題。

一、數理統計課程現狀分析

本文以應用統計學專業為例,結合多年教學經驗對數理統計課程、教學現狀、課程工具以及存在的問題進行簡單介紹分析。

(一)數理統計課程簡介

數理統計課程作為應用統計學專業的學科基礎與專業核心課程是多元統計分析、貝葉斯統計、非參數統計和數據挖掘技術與應用等課程的基礎。應用統計學專業旨在培養人格健全、統計學基礎知識與基本方法理論扎實、數據處理實踐能力強、勇于創新,能在工程、經濟、管理、商務等領域從事數據采集、清洗、整理等實際工作,解決數據挖掘與分析中涉及的復雜統計方法問題的高素質應用型人才。而該課程是在概率論的基礎上對于統計知識的深入詳細講解,主要涉及統計量與抽樣分布、點估計、區間估計、假設檢驗和分布的檢驗等內容。該課程主要是為了使學生了解并掌握數理統計學的基本思想、理論和方法,初步學會在實際工作中實現對數據的處理與分析。

(二)數理統計課程現狀

該課程是數據統計分析的基礎,大多數高校的相關專業針對學生數據統計分析知識的傳授和能力的培養主要通過概率論與數理統計這一門課來實現基礎內容的講解,而將概率論(48學時)和數理統計(48學時)分別單獨課設主要在統計學相關專業居多。不論是從課程的單獨開設,還是課時的安排都足以體現出該課程對于統計學專業學生的重要性。但是在高校的教學過程中發現,學生對該課程重要性的認識不足,僅把該課程看作是一般的公共類數學課,對自己的要求只是考試通過的層面,并沒有把該課程當成統計專業的重要基礎課程,也并未意識到該課程的內容會高頻率的出現在后續的專業課中,從而很大程度上影響了學生的學習熱情和積極性。另外,由于該課程內容抽象,且包含了大量的復雜理論,使得教學難度較大,并且學生的數學基礎較差,理解能力也存在差異,從而加大了學生的學習難度。并且,大多數該課程的教學只是對理論知識進行講解,雖然也有很多人意識到需要將計算機軟件實現和應用環節的教學相關結合,但是在實際教學過程中并未真正落實。依然給學生留下了枯燥乏味的印象,使得學生無法直觀形象的理解知識點的本質內容和應用場景,也不利于應用型人才的培養。

(三)課程工具使用情況

雖然當今國內眾多高校在教學過程中逐漸意識到,理論性較強的專業基礎課的重要性,并且想要實現快速計算、良好的可視化和教學效果,必須將其與實際應用背景以及較好的計算工具相結合,以提高學生學習興趣的同時,使得學生深刻理解知識點的應用場景和具體操作。但是,對于數理統計相關知識的教學較多的仍然在使用SPSS、Mathematica、MATLAB和R等傳統統計工具和分析軟件[2-5],也有部分教師考慮到Python軟件的簡潔清晰,功能強大且容易上手,可視化功能強大等優勢,將其用于教學活動作為計算工具[6],但是其重點卻在概率論部分。

二、Python在課程教學過程中的作用

在應用統計學人才培養方案中,Python程序設計語言是在數理統計課程之前課設的計算機語言課程,并已成為應用統計學專業所需的主流語言軟件,該軟件工具廣泛應用于統計分析、數據挖掘、機器學習和大數據可視化等專業方向課程內容的實現,在應用統計學專業人才培養過程中起著重要的作用。并且將數理統計課程與Python和應用統計學專業方向課程有效接軌,培養學生的學習熱情、激發學生的學習興趣,使學生能更好地理解數理統計知識并能熟練使用Python實現相關統計問題,從而保證人才培養過程的延續性。

(一)Python語言的特點

Python程序設計語言作為數據統計分析的流行語言,其在數據挖掘和機器學習等數據統計分處理方面有著很好的優勢,其主要特點有:(1)Python是一門跨平臺、開源、免費的解釋型高級動態編程語言,是一種通用編程語言;(2)Python語言語法簡潔清晰,功能強大且易學,最重要的是擁有大量的幾乎支持所有領域應用開發的成熟擴展庫;(3)Python語言除了可以解釋執行以外,還支持命令式編程和函數式編程兩種方式,完全支持面向對象程序設計;(4)Python功能強大,可以實現C、C++和Matlab等多種不同語言的程序融合到一起實現無縫拼接,更好地發揮不同語言和工具的優勢,以滿足不同應用場景的需求。鑒于Python程序設計語言的各種優勢,已廣泛應用于統計分析、科學計算可視化、人工智能、機器學習、數據爬取與大數據處理等多個專業和領域。

(二)Python在數理統計課程教學過程中的應用

Python作為一種被廣泛使用的免費開源軟件,將其應用于數理統計教學全過程,對各個知識點內容進行實現,使得學生更好理解知識點的內涵本質。(1)統計量與抽樣分布:當講授統計量時,可以通過Python語言導入第三方numpy模塊重命名為np,即命令:importnumpyasnp,并調用函數np.mean()、np.var()、np.std()、np.corr()求得總體或者樣本均值、方差、標準差、相關系數矩陣等,編程實現不僅可以提高計算效率還可以加深學生的理解。也可導入matplotlib.pyplot模塊對于常見抽樣分布作圖,使學生直觀感受分布的特點。(2)點估計:主要包括:矩估計、極大似然估計,可通過自定義函數實現極大似然估計的求解,例如設總體X~Nμ,σ2(),x1,x2,…,xn()是來自總體X的一組樣本值,可通過Python模擬服正態分布的數據,然后使用sympy庫和numpy中prod函數得到似然函數,并通過sympy.log()去自然對數、sympy.diff()求偏導數,然后求解sympy.diff()得到總體中參數μ,σ的極大似然估計。(3)區間估計:對于參數的區間估計,其本質是希望給出參數取值的一個范圍,并確定該范圍包含參數真值的可靠程度,該范圍通常以區間形式給出。因此,對于不同的正態分布、T分布和χ2分布均可調用scipy.stats.norm.interval(confidence,loc=sample_mean,scale=sample_std)實現,其中輸入參數包括置信度(confidence)、樣本均值(loc)、樣本標準差(scale)和自由度(df)可根據具體分布確定是否省略。(4)假設檢驗:關于假設檢驗問題主要包括:步驟1:確定問題,其中包括確定原假設(H0)與備選假設(H1),然后根據問題背景和樣本數據特點判斷假設檢驗類型,進一步根據抽樣分布類型和假設檢驗的方向;步驟2:在原假設成立的情形下,計算所選的檢驗統計量和p值;步驟3:根據顯著性水平α大小以及檢驗方向,做出是否接受原假設的判斷。例如方差σ2未知時,均值的單邊檢驗問題,即H0:μμ0,H1:μ<μ0,可考慮使用統計模塊(stats),并調用單獨樣本t檢驗函數stats.ttest_1samp(data,pop_mean),其中輸入參數data表示樣本數據集,pop_mean表示總體均值μ0,該函數將返回輸出參數t表示檢驗統計量的值和雙尾檢驗的p值,進而確定單位檢驗的p值與顯著性水平α進行比較,從而做出判斷。(5)方差分析:方差分析(AnalysisofVariance,ANOVA)又稱“變異數分析”或“F檢驗”,是由Fisher提出的用于兩個及兩個以上樣本均數差別的顯著性檢驗,其原理是認為不同處理組的均數間的差別基本來源于組間差異和組內差異。對單因素方差分析,在滿足獨立、正態、方差齊性的前提條件下,可用scipy庫,并通過輸入參數為樣本數據的函數stats.f_oneway(),可得到F值和p值,然后與查表得到的原假設下檢驗問題的臨界值作比較,若F值大于等于檢驗臨界值,則拒絕原假設H0,否則接受H0;對于雙因素方差分析,基本思想和方法與單因素的方差分析相似,在同樣的前提條件下,可從statsmodels.stats.anova中導入用于多因素方差分析的函數anova_lm()可得到方差分析表,進而用于對檢驗進行判斷。

三、課程教學改革

在數理統計課程中引入Python軟件對重要知識點進行實現是應用統計學專業課程改革的一部分,關于該課程更全面高效的改革還可從以下幾個方面開展:

(一)教師隊伍改革

應用統計學專業人才培養過程中不僅要加深學生對理論知識的理解,更要注重對學生利用所學方法解決實際問題的能力的培養,重點在應用能力和創新能力的培養。因此,在此基礎上加強統計學專業教師隊伍建設工作,特別是Python軟件操作能力,案例挖掘能力和數理統計知識點與Python軟件的融合能力等方面的改革工作,應多鼓勵教師隊伍走出去多與企業多交流,了解企業對人才的需求進一步調整改革教學及學生技能培訓的側重點。另外,引入新的教學方法和先進教學理念,以提高課堂教學的質量真正將應用型人才培養落到實處。

(二)加強實踐教學改革

根據人才培養方案的要求,學生不僅要掌握數理統計課程中的理論知識,更重要的是要能夠將所學知識用于解決實際問題。因此,為了更好地實現教學目標,適量增加上機實驗課對培養學生利用Python軟件解決實際問題的同時,還能培養學生的動手能力,為后續專業方向類課程打好堅實基礎。

(三)優化考核方法

數理統計課程的期末考核方法目前大多數都是閉卷考試,其中主要題型包括:選擇題、填空題、簡答題和應用題。學生的最終成績由平時成績(30%)和期末卷面成績(70%)。為了實現科學且過程化考核,考核可細分為平時成績(30%)、實驗成績(20%)和期末卷面成績(50%),其中實驗成績部分主要考查學生的實驗操作技能的掌握、操作的規范性、實驗報告格式的規范性、結果的正確性和描述的嚴謹性。通過全過程化考核方式既能考查學生的平時課堂表現,也能通過實驗課程成績評價學生使用Python軟件解決實際的能力,還能客觀公正地評價學生對理論知識的理解和應用能力。

四、結語

數理統計課程作為應用統計學專業的基礎課在整個人才培養中有著重要的地位。因此,本文主要通過引入Python軟件實現對數理統計課程的教學改革,首先對該課程的特點、現狀以及教學過程中存在的問題進行簡單分析;然后,對Python軟件的特點以及結合教學過程中的經驗對Python軟件與知識點的融入進行了詳細的介紹,給出課堂教學改革的切入點和問題求解的過程;最后,從教師隊伍建設、實踐教學改革和課程考核方式等方面給出該課程的改革意見。通過一系列的改革舉措的落實提高學生學習興趣的同時,加深學生對知識理解,培養學生的應用能力和操作能力,從而真正落實應用型人才的培養。

參考文獻:

[1]陳希孺.本世紀以來數理統計發展的歷史和現狀的若干問題[J].華中師院學報(自然科學版),1980(01):83-89.

[2]李榮華,姜英,呂煒,等.變量間的相關系數及其SPSS中計算[J].教育現代化,2020,7(21):107-108.

[3]解博麗,雷英杰,楊麗,等.概率論與數理統計引入MATLAB實驗教學手段的必要性[J].教育教學論壇,2020(23):280-282.

[4]章美月.基于Mathematica的《概率論與數理統計》課程教學改革探索與實踐[J].大學數學,2020,36(05):49-56.

[5]汪浩,李瑩.大數據/人工智能背景下IT專業基于R的概率論與數理統計教學改革[J].計算機教育,2021(03):180-184.

[6]王福順,董淑芬,孫小華,等.Python賦能概率論與數理統計教學與實踐[J].中國多媒體與網絡教學學報(上旬刊),2021(03):218-220.

作者:丁毅濤 任水利 單位:西京學院理學院