大數(shù)據(jù)分析技術(shù)在教育教學(xué)的應(yīng)用
時(shí)間:2022-10-14 10:47:37
導(dǎo)語(yǔ):大數(shù)據(jù)分析技術(shù)在教育教學(xué)的應(yīng)用一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
在教育信息化2.0時(shí)代把智能和信息化技術(shù)融入日常教學(xué),實(shí)現(xiàn)教學(xué)信息化、學(xué)習(xí)智能化的新型教育體系一直是教學(xué)改革的重要方向。目前,部分高校已經(jīng)開始智慧校園建設(shè),通過大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)等新興技術(shù),建立數(shù)據(jù)共享平臺(tái),打通數(shù)據(jù)孤島。學(xué)校把校內(nèi)數(shù)據(jù)匯總起來,構(gòu)建教學(xué)診改系統(tǒng),用于診斷教學(xué)中存在的問題,借助融課堂平臺(tái)時(shí)刻關(guān)注學(xué)生學(xué)習(xí)軌跡、任務(wù)完成情況以及學(xué)生的校內(nèi)外活動(dòng)軌跡等,實(shí)現(xiàn)了在線數(shù)據(jù)的智能化使用及開發(fā)。
(一)何謂“大數(shù)據(jù)”。目前,“大數(shù)據(jù)”雖然沒有一個(gè)十分精準(zhǔn)的定義,但是,學(xué)界普遍認(rèn)為,“大數(shù)據(jù)”指的是海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。這也是信息化時(shí)代的產(chǎn)物,數(shù)據(jù)的來源多、增速快促成了大數(shù)據(jù)時(shí)代的到來。一般來說,大數(shù)據(jù)可以和任何行業(yè)實(shí)現(xiàn)無縫對(duì)接,如大數(shù)據(jù)融入金融就是金融大數(shù)據(jù),融入教育就成為教育大數(shù)據(jù),它的誕生使?jié)摬赜跀?shù)據(jù)深處的價(jià)值得以挖掘,使原本看似無用的數(shù)據(jù)為企業(yè)和社會(huì)帶來效益,更促進(jìn)了日常生活、企業(yè)管理、教育教學(xué)的智能化。(二)何謂大數(shù)據(jù)技術(shù)。大數(shù)據(jù)技術(shù)是指對(duì)龐大的潛在數(shù)據(jù)進(jìn)行專業(yè)化處理的手段。飛速增長(zhǎng)的數(shù)據(jù)不是簡(jiǎn)單的數(shù)據(jù)處理工具就能解決的,需要憑借分布式數(shù)據(jù)存儲(chǔ)器、Hadoop集群平臺(tái)、數(shù)據(jù)采集技術(shù)、數(shù)據(jù)清洗工具、數(shù)據(jù)挖掘算法等等一系列的專業(yè)化技術(shù)手段進(jìn)行存儲(chǔ)、處理和分析,更需要一些大數(shù)據(jù)技術(shù)與應(yīng)用的專業(yè)人才去管理、維護(hù)、使用、開發(fā),從而形成大數(shù)據(jù)集成平臺(tái)。
二、當(dāng)前教學(xué)現(xiàn)狀
隨著高校學(xué)生規(guī)模的擴(kuò)大,教師除線上線下授課、批改作業(yè)、輔導(dǎo)學(xué)生外,還要擔(dān)負(fù)繁重的科研任務(wù)。傳統(tǒng)的教學(xué)模式使教師分身乏術(shù),教學(xué)效果和輸出質(zhì)量不盡如人意。于是,很長(zhǎng)一段時(shí)間,人們一直在呼吁智慧辦公、智慧校園等,希望可以通過科技的手段減少工作負(fù)荷。因此,將大數(shù)據(jù)技術(shù)融入校園,融入教育教學(xué),提高教學(xué)質(zhì)量,滿足學(xué)生需求,已經(jīng)成為大勢(shì)所趨。近年來,河南機(jī)電職業(yè)學(xué)院對(duì)大數(shù)據(jù)人工智能技術(shù)的應(yīng)用進(jìn)行了積極探索,構(gòu)建數(shù)據(jù)中心,打通數(shù)據(jù)孤島,進(jìn)行智慧校園建設(shè),對(duì)學(xué)生和教師的日常學(xué)習(xí)、教學(xué)、活動(dòng)等情況進(jìn)行分析,從而為教學(xué)改革提供決策依據(jù)。今年突發(fā)肺炎疫情,教學(xué)模式由之前的線上加線下全部改為線上進(jìn)行。學(xué)校利用大數(shù)據(jù)技術(shù)對(duì)線上教學(xué)進(jìn)行多維度分析,并對(duì)學(xué)生的學(xué)習(xí)狀態(tài)進(jìn)行跟蹤分析,實(shí)現(xiàn)了“停課不停學(xué)”,高質(zhì)量、高標(biāo)準(zhǔn)、高要求地開展教學(xué)活動(dòng)。
三、大數(shù)據(jù)技術(shù)在教育教學(xué)中的應(yīng)用
(一)采集以學(xué)生活動(dòng)為主題的數(shù)據(jù)。隨著教學(xué)改革的不斷深入,在高校對(duì)學(xué)生的評(píng)價(jià)主要側(cè)重于對(duì)學(xué)生綜合素質(zhì)進(jìn)行分析,其中包括學(xué)生成績(jī)的對(duì)比分析、學(xué)生校內(nèi)外活動(dòng)軌跡的分析,以及影響學(xué)生職業(yè)素養(yǎng)和綜合素質(zhì)因素的分析等。以河南機(jī)電職業(yè)學(xué)院為例,大數(shù)據(jù)技術(shù)與應(yīng)用專業(yè)以800名學(xué)生為樣本進(jìn)行分析,學(xué)生的學(xué)習(xí)軌跡主要體現(xiàn)在線場(chǎng)課堂平臺(tái)上,活動(dòng)軌跡主要體現(xiàn)在學(xué)生管理平臺(tái)上。通過建立中間庫(kù),學(xué)校將學(xué)生日常產(chǎn)生的學(xué)習(xí)和活動(dòng)碎片進(jìn)行收集整理,采集到大數(shù)據(jù)中心的分布式存儲(chǔ)器上,并進(jìn)行實(shí)時(shí)更新。具體采集數(shù)據(jù)的步驟如下:1.創(chuàng)建一個(gè)學(xué)生成績(jī)分析項(xiàng)目,并選擇EXCEL數(shù)據(jù)源,添加所要分析的數(shù)據(jù),部分?jǐn)?shù)據(jù)可以通過連接數(shù)據(jù)庫(kù),輕松導(dǎo)入所要分析的數(shù)據(jù)。2.連接數(shù)據(jù)源“大數(shù)據(jù)專業(yè)成績(jī)表.xls”,對(duì)數(shù)據(jù)類型進(jìn)行格式變更,進(jìn)入數(shù)據(jù)預(yù)覽的頁(yè)面,將“snumb”“ternumb”“clanumb”設(shè)置為字符串類型,命名為“高校大數(shù)據(jù)班學(xué)生成績(jī)分析”。這一步主要是將所獲得的數(shù)據(jù)統(tǒng)一類型,以便進(jìn)行下一步詳細(xì)的數(shù)據(jù)處理。通過創(chuàng)建的MySQL數(shù)據(jù)庫(kù),我們將所需要的數(shù)據(jù)分類導(dǎo)入學(xué)生數(shù)據(jù)庫(kù)。(二)清洗獲取到的數(shù)據(jù)。數(shù)據(jù)清洗是指找出并改正數(shù)據(jù)源中不正確數(shù)據(jù),如檢查數(shù)據(jù)的一致性,處理無用值和殘缺值等。由于匯聚到的數(shù)據(jù)是從不同系統(tǒng)獲得的,系統(tǒng)的開發(fā)商各不相同,導(dǎo)致各個(gè)系統(tǒng)的數(shù)據(jù)格式及命名規(guī)范參差不齊。在拿到數(shù)據(jù)之后,數(shù)據(jù)清洗的工作量很大,數(shù)據(jù)清洗是否完整、是否正確,將直接影響分析結(jié)果的精確度。數(shù)據(jù)清洗的方法有很多種,如編寫SQL語(yǔ)句、使用Python中的數(shù)據(jù)清洗庫(kù)、利用八爪魚工具等。本案例主要是在搭建好的Hadoop集群平臺(tái)上實(shí)現(xiàn)數(shù)據(jù)的清洗,結(jié)合魔鏡平臺(tái)編寫SQL語(yǔ)句來實(shí)現(xiàn)數(shù)據(jù)的清洗功能。數(shù)據(jù)清洗是數(shù)據(jù)分析當(dāng)中至關(guān)重要的一步,數(shù)據(jù)清洗得是否徹底直接影響數(shù)據(jù)分析的準(zhǔn)確性。經(jīng)過數(shù)據(jù)清洗之后,一些格式不統(tǒng)一、殘缺、無價(jià)值及干擾項(xiàng)便不復(fù)存在,新生成的數(shù)據(jù)源則用于下一步的數(shù)據(jù)分析及可視化。(三)挖掘產(chǎn)生的數(shù)據(jù)。數(shù)據(jù)挖掘是指通過一系列的算法對(duì)處理過的數(shù)據(jù)進(jìn)行分析,尋找數(shù)據(jù)中隱含的價(jià)值,常見的算法有聚類算法、關(guān)聯(lián)規(guī)則算法、基因算法等。數(shù)據(jù)挖掘的過程就是從這些龐大的數(shù)據(jù)中找出潛在的、未知的、對(duì)決策有幫助的關(guān)系、模式和趨勢(shì),并建立決策支持模型的過程。本文主要采用的是聚類和關(guān)聯(lián)規(guī)則算法。聚類算法,即根據(jù)已經(jīng)設(shè)定好的規(guī)則,對(duì)數(shù)據(jù)進(jìn)行分門別類的處理,如將學(xué)生群體分為熟手、生手和能手;關(guān)聯(lián)規(guī)則算法,即探究?jī)煞N及以上事物之間的關(guān)聯(lián)關(guān)系,如每天學(xué)習(xí)Python課程的學(xué)生也會(huì)去學(xué)習(xí)PHP。(四)大數(shù)據(jù)分析。大數(shù)據(jù)分析是指利用大數(shù)據(jù)技術(shù)手段,在對(duì)匯聚到數(shù)據(jù)庫(kù)里面的數(shù)據(jù)經(jīng)過數(shù)據(jù)挖掘之后,根據(jù)實(shí)際需求以數(shù)據(jù)分析報(bào)告或者儀表盤形式,將分析結(jié)果可視化地展示出來,使分析結(jié)果清晰明了,并可以實(shí)時(shí)更新,便于分析、決策。根據(jù)處理過后的數(shù)據(jù),教師可以對(duì)學(xué)生各科成績(jī)的數(shù)據(jù)和學(xué)生活動(dòng)情況進(jìn)行關(guān)聯(lián)分析,找出影響學(xué)生成績(jī)的因素,并將分析結(jié)果展示出來。確定成績(jī)影響因素后,便于學(xué)校今后教學(xué)工作的順利開展,有的放矢地進(jìn)行教育教學(xué)改革。其具體分析步驟如下:1.分析學(xué)生在課堂學(xué)習(xí)以外的活動(dòng)數(shù)據(jù),如兼職、寒期打工、大學(xué)生社團(tuán)、學(xué)生會(huì)等校內(nèi)外活動(dòng),并分析該活動(dòng)的所占比重。2.對(duì)融課程、騰訊會(huì)議等教學(xué)平臺(tái)產(chǎn)生的教學(xué)數(shù)據(jù)和學(xué)生的學(xué)習(xí)軌跡數(shù)據(jù)進(jìn)行收集,經(jīng)過處理后在Hadoop集群平臺(tái)進(jìn)行處理、分析。3.對(duì)學(xué)生學(xué)習(xí)、活動(dòng)所產(chǎn)生的數(shù)據(jù)進(jìn)行整合,綜合分析出學(xué)生的成績(jī)波動(dòng)情況及影響學(xué)生成績(jī)的存在因素,并對(duì)預(yù)處理后產(chǎn)生的數(shù)據(jù)進(jìn)行可視化分析,其分析結(jié)果如上所示。我們通過一系列的分析得出結(jié)論,學(xué)生的成績(jī)和參與活動(dòng)的類型及時(shí)間有一定的關(guān)系,比如數(shù)學(xué)和閱讀類的課程,需要付出較多時(shí)間和精力,不參與校內(nèi)外活動(dòng)的學(xué)生大多成績(jī)偏中上等,參與學(xué)生會(huì)、校外兼職的學(xué)生成績(jī)普遍偏低。而對(duì)于偏科學(xué)類和通識(shí)類的課程,需要學(xué)生具有豐富的生活閱歷,參加校內(nèi)外活動(dòng)多的同學(xué)大多成績(jī)處于中上等,成績(jī)和課外活動(dòng)呈正相關(guān)。通過這個(gè)分析,我們也發(fā)現(xiàn)大部分學(xué)生喜歡閱讀武俠小說,對(duì)于編程類的課程喜愛度次之,對(duì)于拔高性質(zhì)的、難度系數(shù)較大的課程則興趣又不大。學(xué)生的個(gè)人發(fā)展不能靠單一的考試成績(jī)來判定,要想滿足企業(yè)實(shí)際需求,成為適應(yīng)企業(yè)需要的具有職業(yè)素養(yǎng)的人才,就必須實(shí)現(xiàn)德智體美勞全面發(fā)展。通過此次分析,我們發(fā)現(xiàn),學(xué)生的培養(yǎng)計(jì)劃需要改變,培養(yǎng)模式需要改革,找出學(xué)習(xí)時(shí)間和課外活動(dòng)的均衡點(diǎn)尤為重要,確保學(xué)生可以在不影響學(xué)習(xí)的前提下能夠全面均衡發(fā)展。同時(shí),對(duì)分析出的個(gè)別孤立點(diǎn)的學(xué)生,要采取差異化對(duì)待,實(shí)現(xiàn)“一生一課表”“一生一方案”,不遺漏任何一位學(xué)生,全面提高整體教學(xué)質(zhì)量。
作者:王歡歡 范桂丹 單位:河南機(jī)電職業(yè)學(xué)院