語音識別技術范文10篇
時間:2024-04-28 08:14:01
導語:這里是公務員之家根據多年的文秘經驗,為你推薦的十篇語音識別技術范文,還可以咨詢客服老師獲取更多原創文章,歡迎參考。
語音識別技術在電網的應用
摘要:語音識別技術在車載等領域得到了廣泛的應用,隨著智能電網建設推進,基于智能化的語音識別技術也將得到重點研究。闡述了語音識別的基本原理,分析了語音識別技術在電力調度、設備巡檢等領域的應用情況。
關鍵詞:語音識別;電網應用;深度學習;電力生產
語言是人類社會中交流的重要手段,也是最為有效的途徑之一,而語音是語言的聲學表征,從20世紀50年代開始,語音識別技術概念被提出并得到重視,隨著計算機技術的快速發展與深入應用,同機器開展語音交流成為現實。到20世紀90年代后期,人工神經網絡的應用使得語音識別系統真正開始實用化,通過對人類語音的容錯性與自適應識別,使得計算機認知人的真實意圖,從而完成一系列的相關執行動作[1]。近些年車載語音識別技術得到了較為廣泛的開發與應用,也使得語音識別向其他行業逐漸擴展開來。對于電力系統而言,盡管語音告警、語音合成等帶有語音的相關技術應用時間較長,但是針對語音識別技術的應用與開發同其他成熟行業相比來說,還較為淺顯。隨著智能電網建設的快速推進,語音識別技術這一具有明顯智能特征的前端技術,必將在電網應用中得到較為廣泛的應用與研究。
一、語音識別原理
從淺顯角度上來看,語音識別就是人的聲音信號轉換為文字或者指令的相關過程[2],是語音信號處理的重要研究方向之一,它不僅是人工智能單個方向,是綜合了微機技術、信號分析處理、模式識別、聲學等多個學科的綜合研究方向。針對不同限制條件下的相關領域,語音識別系統可劃分為孤立詞、連接詞以及連續語音識別方式,而根據對語音產生對象的依賴程度,可劃分為特定人以及非特定人兩個層次,根據對語音詞匯量的程度,可劃分為小級別、中等級別、大級別以及無限制等多種程度的語音識別系統。從本質原理上,語音識別系統的基礎主要為統計模式識別,綜合了語音學以及語言學的大量信息,將語音輸入對象特征向量序列進行一系列的轉化,形成待處理的聲學模型。在建立模型之后,開展相關的特征提取、模型搜索求解等相關操作。簡單來說,就是將獲取的語音信息進行模塊處理,對相關的語音特征參數結合數據塊進行模塊匹配并識別,最終輸出相應的識別結果,開展下一步的應用分析。根據語音識別的基本步驟分析,一般分為語音信號的獲取、預處理、特征提取、相似性度量與模塊匹配、數據后處理、識別結果輸出等多個基本步驟。由于語音信號本質上屬于非平穩信號,目前對語音信號的分析是建立在短時平穩性假設之上的,同時聲學模型又是系統中最為重要的部分之一,主要存在建模單元選擇、狀態聚類、參數估計等多個方面。隨著語音識別系統研究逐步深入,現階段對于,基于深度學習的聲學模型結構,基于深度學習的聲學模型訓練效率優化,基于深度學習的聲學模型說話人自適應和基于深度學習的端到端語音識別均得到了重點關注[3]。
二、語音識別在電網中應用分析
語音識別研究論文
摘要:語音識別技術是一門涉及面很廣的交叉學科。隨著新理論的提出和應用,語音識別技術取得了很大的進步,許多產品已經得以實際的應用,但在其進一步的發展進程中,還有許多棘手的問題有待解決。
關鍵詞:語音識別;動態時間規整算法;人工神經元網絡
1背景介紹
語言是人類特有的功能,是人們思維最重要的寄托體,是人類交流最主要的途徑。語音是語言的聲學表現,是人類交流信息最自然、最有效、最方便的手段。語言和語音與人類社會科學文化發展緊密相連。
語音識別技術是讓機器接收,識別和理解語音信號,并將其轉換成相應的數字信號的技術。它是一門交叉學科,涉及到語音語言學、數理統計、計算機、信號處理等一系列學科。
2發展歷史
廣播電視音頻監測技術研究
廣播電視的不問斷和安全播出始終是廣播電視機構要完成的首要任務。隨著基于電子管、晶體管等設備的退役和計算機軟硬件技術、微電子技術和數字化技術的應用普及,廣播電視設備的故障率已經降到了非常低的水平,在節目播出過程中由于設備故障造成的停播、錯播現象已很少發生。近年來,信號的安全播出問題,尤其是信號的被干擾、被破壞和被插播的現象屢見不鮮。廣播電視的安全監測技術逐漸成為廣播電視制播技術的研究焦點。本文將針對以上問題加以探討,并對解決問題所用到的關鍵技術和算法進行簡要的分析和論述。
1監測業務和技術的現狀及分類
目前國內大多數廣播電視臺站的自動監測系統都只針對音頻信號的質量好壞和信號的有無進行監測,而對于音頻信號的來源及內容等安全方面的監測任務則更多地采用循環播放、人工監聽的方式…。人工方式不僅效率低,而且不及時。應州于廣播電視安全監測系統的音頻信號監測技術從業務層面上可分為音頻的內容監測和音頻的質量監測。音頻的內容監測主要是對采集的信息的收集、整理、解析和應用等過程中所出現的錯誤、疏漏、不當及不和諧、敏感信息的檢查和把關,它關注的是音頻所表述的具體內容。音頻的質量監測主要是對已經制作完成的廣播電視節目在音頻信號的生成、處理、傳輸和收發過程中出現的干擾、噪聲、電平過低、中斷和信源突變等狀況所進行的實時監控和更正,它注重的是音頻信號的質量及來源的正確性。二者雖然針對的業務層面不同,卻彼此依賴相互聯系。音頻內容的好壞會直接影響到音頻質量的高低,音頻質量的高低也會直接影響終端聽眾對信息內容的獲取量和正確率。總之,對音頻內容和質量的監測都是為了保證聽眾能收到正確、優質和不間斷的音頻信號。目前,可應用于音頻信號監測任務的技術可分為音頻比對技術、音頻識別技術、數字水印技術這三大類。
2音頻比對技術
音頻比對技術是利用數字音頻的時域或頻域特征或屬性來分析兩段音頻序列的相似度,再相似度的大小來判斷這兩段音頻序列播放的是否是相同或相似的內容。其大概流程如圖1所示。首先,將要處理的2路音頻序列通過多路音頻采集卡采集到設備中,并進行濾波、增益補償等處理;其次,將得到的2路音頻信號進行模數轉換,再對得到的數字信號進行壓縮處理;然后,提取2路信號的特征參數或者屬性;最后,比較提取出來的參數或者屬性,得出2路音頻信號的相似度,再由相似度來判斷2路信號是否相同或者相似。濾波和增益補償等預處理是為了濾除音頻中的噪盧、干擾脈沖及平衡音頻的電平差等。
壓縮處理是為了減少音頻中相關性較低和不相關的參數,減少后續工作量,提高處理的實時性(目前比較流行的壓縮算法是利用小波函數壓縮)。參數和屬性的提取是從音頻流中以幀為單位提取出2路音頻的質心、均方根、Mel倒譜系數以及音高、振幅、帶寬、能量等。音頻比對是利用上一步提取的參數或屬性進行計算和比較,將比較結果同預先設定的閾值進行對比,得出最終結果。音頻比對技術在實現時不考慮音頻的具體內容,它只注重音頻序列的關鍵參數和屬性的相似度。目前對音頻技術的應用需求更多的還是涉及到音頻的語意和具體內容方面,這項技術的適用領域相對來說比較小,但是它基本上能滿足廣播電視的質量監測的任務需求。
單片機控制智能語音刷卡系統設計探討
摘要:闡述STM32單片機控制的智能語音刷卡系統中的內部結構、語音識別功能,智能語音刷卡系統的功能模塊,包括中央控制系統、語音識別模塊、電平串口模塊、藍牙模塊、顯示模塊、刷卡模塊、供電模塊,探討智能語音刷卡系統的程序設計。
關鍵詞:STM32單片機,智能語音控制,程序設計,語音識別
STM32單片機控制的智能語音刷卡系統當前被越來越多的應用于各個領域,該系統能夠在消費者進行刷卡消費時使用語音功能輸入消費價格,在使用過程中更加方便快捷。該系統主要具有強大的語音識別功能和刷卡功能,在執行語音功能時可以將其懸掛在腰間,或者其他位置。語音系統內部結構包括一個麥克風以及連接線,系統主要是通過掛在腰間的語音識別裝置進行語音識別和轉換,然后將信息上傳至系統內部,從而智能控制刷卡機達到語音識別目的。本系統可以在刷卡成功后通過電子屏顯示消費者銀行卡的余額等信息,通過對這一系統的推廣和應用極大地提高了商場等收銀工作的工作效率以及準確率,減少誤差。本文通過對STM32單片機控制的智能語音刷卡系統的運行原理、結構分析和討論,希望能夠更好地將該系統推廣到各個領域當中,提高其使用價值。
1研究背景
以STM32單片機控制裝置為主要部分的智能語音刷卡系統,能夠更好地施展其語音識別功能,該系統是通過內部特殊裝置來對語音進行分析和定位,最終完成識別工作,然后將識別后的信息傳送至中央系統,通過中央系統對刷卡裝置發送指令最終完成語音刷卡任務。這一系列的操作過程都要利用電腦程序編排,只有經過軟件對該系統進行科學合理的編程,對STM32單片機裝置進行嚴謹的數據分析和處理,才能夠是中樞控制系統接收到準確無誤的信息數據,從而保證系統能夠更好地完成刷卡任務。我國STM32單片機智能語音刷卡系統應用已經十分普遍,各大商場甚至中小私營門面都引進該系統,用于店鋪收銀工作,該系統具有生產成本低,操作簡單,小巧方便便于攜帶等諸多優點。因此,為了更好地將該系統應用在各個領域當中,我們應該更加清晰明了的掌握該系統的內部結構以及運行理論,充分的改進和完善該系統,使其能夠更好地為我們提供服務。
2STM32單片機控制的智能刷卡系統
智能語音識別在廣播電視監測的應用
摘要:隨著媒體深度融合不斷推進,各類新興媒體持續涌現、遍地開花,廣播電視內容監測從傳統的廣播、電視頻道監測擴展到了互聯網新興媒體視聽內容。海量、多元的互聯網視聽內容給監測監管工作帶來了巨大的挑戰,如何適應這一新形勢是各級監管機構面臨的共性問題。本文旨在探討將自動語音識別和智能語義分析技術結合起來應用到監測監管工作中的可行性及優勢。
關鍵詞:智能語義分析;自動語音識別;內容監測
1引言
隨著互聯網技術的發展普及,手機、電腦逐漸成為了人們獲取信息、學習娛樂的主要渠道,與之對應的各類互聯網新媒體傳播平臺(短視頻、直播、視頻網站等)不斷涌現,海量的網絡視頻、網絡廣播等互聯網視聽內容都成為了廣播電視監測監管對象,使得監測監管工作變得更加艱巨和復雜,對監測監管從業人員的專業素質和監測技術手段提出了更高的要求。傳統廣播電視內容監測是將音視頻節目錄像先存貯,再通過圖像識別、關鍵幀對比、語音特征識別等技術手段進行監測監管,存在監測時效性差、計算存貯資源需求高、違規識別準確率低等問題。隨著互聯網視聽監測業務的不斷拓展,這些劣勢越發凸顯,實現快速、實時、準確的對巨量、多元的互聯網視聽內容進行監測監管的需求變得越來越迫切。
2自動語音識別和智能語義分析技術
2.1自動語音識別。語音識別(ASR)是語音交互中最基礎的一個AI技術環節,就是將一段語音信號轉換成相對應的文本信息,系統主要包含特征提取、聲學模型、語言模型以及字典與解碼四大部分。此外,為了更有效地提取特征,往往還需要對所采集到的聲音信號進行濾波、分幀等音頻數據預處理工作,將需要分析的音頻信號從原始信號中合適地提取出來。特征提取工作將聲音信號從時域轉換到頻域,為聲學模型提供合適的特征向量;聲學模型再根據聲學特性計算每一個特征向量在聲學特征上的得分;而語言模型則根據語言學相關的理論,計算該聲音信號對應可能詞組序列的概率;最后根據已有的字典,對詞組序列進行解碼,得到最后可能的文本表示,連續語音識別原理框圖如圖1所示。當前,該技術發展已非常成熟,車載語音助手、智能語音輸入等都已經普及在我們的各種生活場景中。2.2智能語義分析。智能語義分析是自然語言理解(NLP)的關鍵,自然語言理解是人工智能領域中的核心課題之一。當前,智能語義分析可以對文本進行自動化處理,主要應用于要素抽取、智能審核、輿情分析、知識搜索、自動寫作等,在分析歧義、詞語省略、代詞所指、意圖識別等的理解方面依然存在不足。但是,隨著近年來人工智能技術的迅猛發展,經過不斷的演化迭代,其智能化、類人化的理解能力已經越來越高,按照這個趨勢,未來計算機一定能夠逐步接近甚至達到類人自然語言處理能力。通過以上介紹不難發現,將語音自動識別和智能語義分析結合起來,運用到廣播電視內容監測中,從技術實現上來說已經沒有障礙,首先通過自動語音識別將音視頻內容文本化,然后再利用智能語義分析對文本化的音視頻內容進行分析監測,輸出監測預警信息。當前,語音識別速度和準確率早已達到應用層面的標準,為音視頻內容文本化的準確率提供了保障,通過樣本庫關鍵詞句進行文本檢索,就可以快速準確識別一般違規信息,這只是快速發現的第一步。對于較為復雜的違規信息,智能語義分析系統在不斷的使用優化過程中,通過長期連續的神經網絡訓練和人工糾偏,逐步提高對長文本、復雜結構句式、特殊發聲等各種定制監測需求違規信息的理解識別準確率,由文本內容檢索逐步進化到擬人化的感知思考,應用前景明朗。
計算機人工智能識別關鍵技術探討
受社會經濟水平提升的影響,計算機技術的開發越來越深入,尤其是人工智能識別技術的開發與應用,應用范圍越來越廣,真正提高了生活與工作的便捷性。當前人工智能技術已經在機器人、智能語音識別、人工神經等多個領域得到運用,充分發揮計算機技術的優勢提高計算機人工智能識別水平。下面重點圍繞計算機人工智能識別關鍵技術的應用展開分析。
1計算機人工智能識別技術
所謂智能識別技術,即立足于計算機系統、掃描設備、照相機技術等先進技術的基礎上,對目標指令、數據信息展開智能識別,提高識別準確性與效率,從而滿足目前社會發展過程中對智能識別提出的嚴格要求。人工智能識別技術是在語音識別技術的基礎上延伸而來,語音識別技術主要是在手機控制中得到運用,為人民群眾的生活提供高質量服務。隨后技術人員開發了人工智能識別技術,在運行過程中更多利用語音識別,語音內容、手機發出的指令比對之后展開分析,從而保證選擇的有效性。在實際應用中滲透人工智能識別技術,能夠真正減少工作量,提高工作效率,這對于社會的飛速發展有重要作用。
2計算機人工智能識別關鍵技術現狀
目前我國人工智能識別技術的研發、應用依然處于發展階段,與國外對比還沒有非常完善且成熟的技術體系。同時,各個國家就人工智能識別技術展開交流與合作,這為我國研發人工智能識別技術新的機遇。通過不斷實踐與研發,人工智能識別技術水平顯著提升,同時也為人們的工作與生活帶來諸多便利。改善了生活條件。同時,我國相關部門對人工智能識別技術給予足夠的重視,投入大量資金,市場規模不斷擴大。2016年市場規模為16億元,2017年增加到21億元,2018年為26億元,預計2019年和2020年有望突破40億元。但是,人工智能識別技術在實踐應用的過程中依然面臨問題,和國外整體發展水平有一些差距,以上便是目前需要解決的解決重點問題。
3計算機人工智能識別關鍵技術運用
AI在安全播出領域的應用
摘要:隨著互聯網和大數據的發展,人工智能技術(AI)得到了高速和深入的發展。在有線電視安全播出領域運用AI技術,將會顯著提升安全播出工作效果。本文對安全播出中的內容安全審播現狀進行了總結,對AI技術發展進行了介紹,并對如何將AI應用于安全播出領域進行了詳細分析,提出具體技術部署方案和相關建議,對AI技術運用于數字電視安全播出具有啟示價值。
關鍵詞:AI;安全播出;大數據
1引言
隨著我國經濟發展和社會進步,人民群眾對精神文化生活的需求日益增長。廣播電視播出機構通過不斷增加播出頻道數量和節目內容來滿足用戶這方面需求,這對作為廣播電視產業發展的基礎和廣播電視工作生命線的安全播出工作提出了更高要求。在我國,廣播電視承擔了黨、政府和人民宣傳喉舌的特殊功能,是輿論引導的主要工具。安全播出是廣播電視運營商的首要任務,而內容安全是安全播出的重點之一,特別是涉及政治、外交、軍事、國計民生大政方針等內容時,更加不能有絲毫差錯。
2內容安全審核與播出現狀
對于有線電視運營商來說,安全播出包括電視節目的播出、傳輸與覆蓋等網絡傳輸環節,也包括點播形式的媒資和頁面海報等內容呈現環節。其中,媒資內容安全涉及意識形態和輿論導向,是安全播出重中之重的環節。針對媒資內容的安全播出措施主要包括播出前審核和播出過程中監聽監看。目前,對媒資內容的審核由審核專家采取人工方式進行,人工審核的特點是審核效率有限。播出過程中對媒資內容進行監聽監看以人工方式為主,但這種方式存在明顯不足:第一,對內容安全的認知取決于人員業務素質、主客觀判斷等因素,不同人員對同樣內容的認知結果存在差異;第二,欄目數量和點播媒資內容日益增多,需要增加具備安全播出業務素質的人員數量,相應的人力成本也會大幅增加;第三,監聽監看人員值守期間安播壓力大,精神高度緊張,工作體驗不佳,專業人員流失嚴重。針對內容審核以人工方式為主存在的問題,通過引入AI技術,基于智能算法,輔助內容安全審核,可以大幅度減輕目前內容安全審核壓力,提升安全播出的工作效果。
計算機人工智能識別技術應用思考
摘要:隨著計算機、人工智能技術的快速發展和普及,計算機人工智能識別技術也不斷地推陳出新,并在許多領域得到了推廣和應用,為人們的生活和工作帶來了極大的便利。對計算機人工智能識別技術進行了闡述,并就當前的技術應用實踐展開分析,對其應用瓶頸和解決對策給予分析和探討。
關鍵詞:計算機;人工智能識別技術;應用實踐;瓶頸
目前,計算機人工智能識別技術的應用范圍較廣,比如無生命特征的技術實踐領域有二維碼識別、機器翻譯和基于神經網絡的類型識別等;有生命特征的技術實踐領域誕生了語音識別、面部識別和指紋識別等。這些技術的應用滿足了現代社會發展的相關需求。但計算機人工智能識別技術誕生較近,技術還不夠成熟,所以在應用中存在一些亟需突破的瓶頸問題。突破這些瓶頸以促使該技術得到更好的發展和應用,將是該領域未來發展的重中之重。
1計算機人工智能識別技術
計算機人工智能識別技術的核心是用計算機對人類智能進行模擬,進而促使計算機通過模仿人類的判別思維來達成識別的目的。例如人類看到了一個熟悉的面孔,會通過大腦的思維判別,自主識別出對方的身份,而利用人工智能技術進行面部識別與之類似,也是通過掃描被識別者的面部信息,然后將其與已納入面部模型庫中的“熟悉面孔”進行對比,進而實現身份的識別確認。將計算機人工智能識別技術廣泛應用于生活和工作,可以實現對人力資源的解放,很多識別確認類的工作交由系統自動完成,極大地提升了工作質量和效率。與歐美等發達國家相比,我國對計算機人工智能識別技術的研究起步較晚,但因為國家和相關企業高度重視,目前我國在該技術的研究方面,尤其是在實踐應用領域取得了很多積極成果,推動了該技術在我國的應用水平的提升。但目前該技術在應用過程中還存在一些瓶頸和難點,比如成本較高、可靠性不足等等,對技術的應用深化形成了一定的阻礙,也是現階段亟待解決和攻克的問題。
2計算機人工智能識別技術的應用實踐
多媒體技術的應用與發展前景
1多媒體技術涉及的內容
多媒體是一種較為泛泛的稱呼,其主要是通過計算機的交互式綜合技術以及數字通信網絡處理技術等多種科技手段,將多種形式的信息集中在一起,從而形成一種交互式的系統。通過多媒體技術,人們能夠對生活中的多種工作進行更加方便的執行。目前,多媒體技術主要涉及以下一些方面,且在這些方面中具有非常廣闊的應用前景:首先是對圖像信息的處理,通過多媒體的壓縮功能,能夠將圖像信息進行各種形式之間的轉換,從而保證圖像信息的傳遞性。然后是對音頻信息的處理,多媒體技術能夠通過音頻的合成產生人們需要的一些特定語音信息,此外,當前非常流行的語音轉換功能能夠實現語音信息和文本信息之間的良好轉換,從而大大方便了人們的生活和工作。還有多媒體的數據庫和著作工具等,通過這些多媒體技術,能夠使人們的生活和學生更加簡單便捷,提高人們的生活質量。
2多媒體技術的應用現狀
2.1多媒體數據處理技術的應用
對于計算機多媒體技術來說,其包含的內容非常豐富,像文字、圖像和聲音等的處理等,通過多媒體技術能夠對各種數據進行快速的轉換,滿足人們工作學習的需要,且多媒體在進行信息轉換時能夠大批量的進行,從而更好的解決了當前存在的存儲器存儲容量問題等。對于多媒體數據處理技術來說,其涉及的技術和內容非常多,主要包含以下幾種:第一,視頻技術。視頻技術主要由兩個方面組成,分別是視頻的數字化和視頻的編碼兩種,所謂的視頻數字化指的是多媒體能夠將得到的模擬視頻信號經過內部的轉換系統,使其變為能夠被計算機讀取和存儲的數字信號,然后通過計算機對該數字信號進行其他的一些處理,使其便于存儲和使用。而視頻的編碼技術則是針對數字化的視頻信號的一種處理手段,其將轉換完成的數字信號進行編碼處理,使其變為能夠被計算機進行再處理的視頻信號,像錄制和播放等,根據其應用環境的不同,可以將其分為不同的編碼技術,比較常見的有電視廣播中的廣播編碼,其能夠將視頻信號變為能夠被所有用戶接收的視頻信號。第二,音頻技術。音頻信號是人們日常生活中最常見的信息,其包含的內容非常豐富,比較常見的音頻技術主要有以下幾種:音頻的數字化、語音信息的處理、語音識別功能以及最后的語音合成功能。音頻技術的發展遠遠早于視頻技術,因此,目前已經具有非常多的音頻產品,并進入了量產化。隨著計算機技術的不斷發展,音頻技術在存儲和傳輸方面迎來了一個新的發展高潮,為人們日常生活中的音頻信息傳遞提供了更加簡便的方式。當前,人們正在逐漸嘗試實現語音的識別,將簡單的語音信息輸入給電腦,使其能夠按照人們的思想進行運行,這是人類長久以來的美好夢想。伴隨著計算機技術的成熟和普及,越來越多的人將計算機當做日常生活中的一種重要交流工具,因此,如何使不熟悉計算機的人能夠正常使用計算機,正在逐漸成為人們感興趣的話題之一,而語音識別技術的出現,為人們的夢想實現提供了一種有效的手段。目前,語音識別技術正在迅速發展,但由于這一技術出現的時間較短,大部分的研究還在試驗階段,出現了非常多的新思想和新算法,為這一技術的發展提供了廣闊的空間。另外,語音識別技術的研究正處在一個重要的瓶頸期,世界各國的研究人員正在嘗試將計算機的語音識別功能推廣到所有人都能使用,且對于一些大量的詞匯或者連續的語音都能進行很好地識別,實現人們期望的語音識別技術的真正應用,提高人們的生活水平和質量。目前,對于一些世界應用較多的語言,語音識別技術已經進行了簡單的應用,該技術的使用在許多領域取得了較好的成果。第三,數據壓縮技術。數據壓縮技術主要是通過對圖像和視頻等信號的處理,將其進行壓縮和存儲,這是實現計算機圖像處理的最基礎內容,且是當前進行圖像處理的熱點技術之一。目前,比較常見的圖像壓縮技術有兩種,分別是JPEG和MPEG,這是ISO制定的兩個重要標準,大部分的圖像處理都是通過這兩種方式。另外,壓縮技術還在音頻的處理和視頻的處理上具有重要的應用,通過這種處理方式,能夠將具有較高質量的音頻和視頻信息進行播放,滿足人們的日常生活需要。
2.2計算機多媒體通信技術的應用
人工智能在外語教學的應用
一、引言
人工智能(ArtificialIntelligence,簡稱AI)近年來成為了人們關注的焦點,最初這個概念是在1956年達特茅斯會議上提出,并被正式確立為一門學科,歷經三次高潮三次低谷的發展。1997年,IBM開發的人工智能“深藍”打敗人類的國際象棋冠軍。2016年3月,谷歌開發的AlphaGo以4:1的明顯優勢戰勝多次榮獲世界冠軍的李世石。自此人工智能在學術研究、行業發展和資本市場表現活躍。伴隨神經網絡、腦科學研究的迅速進步,人工智能在云計算和大數據等相關技術的支持下,迅速被運用到各個領域。以人工智能為核心的新技術與教學融合將成為下一個核心驅動力。在2018年的《人工智能發展白皮書》[1]中,提到教育智能化將會成為教育領域的發展方向,人工智能將會引發教育理念和教育生態的深刻變革。全球主要發達國家當前都在加速教育教學創新,積極開發教育新產品,推進教育教學創新。2018年4月,《高等學校人工智能創新行動計劃》[2]提出了未來的人才培養新模式,要增設“人工智能+X”的復合專業培養,眾高校也相繼成立了人工智能學院和相關專業,如南京大學、中國科學院大學、西安電子科技大學、上海交通大學等,結合近幾年教育部“新工科”教育改革的背景,為外語教學與研究帶來了新的契機。傳統的外語教學中一直存在教學質量和效果不理想的困境,我們要充分利用日趨成熟的人工智能技術開展一場深層次的變革,重塑外語教育的時代性、個性化的新形態。人工智能在神經網絡、深度學習和蒙特卡洛數搜索法等技術使用后,逐步形成神經網絡“大腦”來進行復雜精準的數據處理,初步有了人類高級智能的“學習能力”。人工智能在教育中所需用到的技術主要包括[3]:①自然語言理解技術,這讓計算機與人之間能用自然語言來有效溝通,包括機器理解、機器翻譯等。②人機交互技術,包括語音識別、語音合成、情感交互等。③知識圖譜技術,指建立語義網絡,使用網絡中的關系來分析解決問題。④生物特征識別技術,包括指紋識別、語音識別、人臉識別等。
二、人工智能支持下的外語教學改革
我國外語教學的整體效率近年來一直不高,大學生的英語學習效果主要是通過全國大學生四六級考試的成績來體現,雖然近年來加入了口語考試,但是學生的英語溝通交流水平總體還是令人擔憂,應用能力遠沒有達到熟練實用水平。大學英語的發展方向是要提高質量,增強實效。大學英語的改革目標是要將人文性、實效性、數字化與工具性相結合。隨著00后即將成為大學校園的主力軍,他們在學習和認知模式、信息技術運用習慣方面有著鮮明的特色,技術、閱圖、創新、急切成為了他們的標識,被認為是“數字原住民”[4],他們更傾向于用智能化方式去獲取數字化資源學習。但是面對海量且品種繁多的外語學習資源,如何滿足個性化學習需求,提高學習效率,重構有效適切的外語教學新模式成為了外語教師們探索科研的新目標。目前市場上比較普遍的在線教育大多是一對一視頻,或者把一些教師的課做成視頻放在線上播放,這其實只是教學場所的改變,教育方式并沒有發生本質變化,如果學生不自覺,效果有時候還沒有線下的實體課程好。人工智能則可以使用語音識別和自然語言處理技術來解決口語語音和文本的詞法、語法分析和語義理解,增加多元交互的學習環境,極大提升學習效果[5]。隨著人工智能研究的日益成熟,“智慧學習”和“深度學習”被賦予了新的內涵,智慧學習以建構主義、混合學習和現代教學學習理論為理論基礎,整合增強現實、云計算、移動通信、大數據等先進信息技術的增強型數字學習[6]。深度學習可以通過神經網絡來模擬人腦的學習過程來抽象表達現實世界的大量數據。目前典型的深度學習模型有遞歸神經網絡(RNN,RecurrentNeuralNetworks)、卷積神經網絡(CNN,ConvolutionalNeuralNetworks)以及深度信念網絡(DBN,DeepBeliefNet-works)等,其中由于RNN多用于處理時間序列,所以其較多應用在口語訓練、口語測試等方面[7]。近幾年,從市場中已知的人工智能運用于外語教育的產品來看,主要分為幾類:英語語音測評、智能批改+習題推薦、教育機器人、智能陪練,其中前三類較多,而分級閱讀和智能陪練的較少。比如語音測評類的有科大訊飛、流利說、馳聲、朗播網等,智能批改類的有極智批改、批改網、作業盒子、貍米教育等,教育機器人類的有寒武紀智能、UBTECH、LEZHI、好兒優等。1.英語語音評測———AI口語老師和智能口語考試系統。英語口語學習與測評是我國英語教育中的重要組成部分。為了測評學習者的口語語音語調、標準度、流利度以及口頭表達能力,通過NLP(自然語言處理)以及語音識別等技術開發,外語教學市場上出現兩類“英語語音評測”的產品:AI口語老師和智能口語考試系統。這兩類產品可以替代教師對學生的口語陪練、口語考試測評及評分統計等相關工作,通過機器輔助學習,極大提高了教師的工作效率,同時實現了口語自適應學習。人工測評往往伴隨著一些主觀因素,智能評測可以有效地避免這類問題,更具客觀性、穩定性,高效完成自動評分和成績統計以及學情分析任務。從目前英語語音測評產品的現狀來看,優點是分析結果相對準確,覆蓋多種口語類型,從發音到對話、朗讀涵蓋多種口語學習和考試類型,包括音標發音、短文朗讀、看圖說話、口頭作文等。短時間可以做出反饋,快速給出評分,同時給出精細的分析。當然,這類產品也會有一定不足,受口語發音本身的不確定性和語音采集的設備條件等因素的影響,英語語音測評結果會出現一定的偏差,但總體結果相對準確。現階段此類產品的測試結果是反饋學生發音中的單詞讀錯、遺漏或者語法有誤等問題,但是無法檢測出學習者的語調和連讀等錯誤。這類產品雖然會根據學生口語情況進行個性化教學和測評,但互動性仍不足,模式化明顯,長時間練習只是幾種方案方式在循環,多樣性和互動性還有待提高。以目前市場上較為知名的英語流利說為例,流利說開發了世界領先的多粒度和多維度的實時語音識別和評估引擎和游戲化教學,讓各水平語言愛好者輕松練口語。每日更新地道美語對話提供好玩上癮的對話闖關游戲,通過硅谷的實時語音分析技術,讓用戶輕松愉快練口語。目前有超過3000萬人使用流利說,積累了中國人2.75億分鐘口語數據。2.智能批改+習題推薦。智能批改如圖1所示,可以部分減輕教師批改作業的繁重任務。完整的流程是教師先從線上布置作業,系圖1智能批改圖統地利用豐富的語料庫資源,使用自然語言處理、圖像識別以及數據挖掘等人工智能技術把學習者的作業與語料庫進行檢測對比,進行自動批改,給出個性化的學情分析報告,對拼寫、語法、句型和搭配方面能夠迅速地標注錯誤部分和錯誤原因,在作業量巨大的情況下,會比教師的批改結果更為細致,教師和家長能在學習者的作業提交后馬上得到反饋并了解最新的學習進展,并據此來實時調整學習進度和難度并推薦合適的習題。當然,也會有一些美中不足,如學生作業的主題相關性、篇章結構和內在邏輯性、思想的創新性等方面提示還略有欠缺。iWrite2.0英語寫作與評閱系統,通過在大型語料庫中來挖掘聯想詞庫,運用大數據技術,同時探索基于人工神經網絡的深度學習來提高作文評閱的智能程度[8]。科大訊飛開發的產品在2015年某國家級英語考試中在翻譯題和作文題的評分準確度比大多數專家教師的評分準確度還要高,同時評卷系統還指出具體語法格式錯誤和措辭不當等問題。3.分級閱讀。英語分級閱讀,可以根據學生的不同認知水平來選擇階梯式的讀物,匹配適合學生個人的書目,解決了學生閱讀太難的書會失去閱讀興趣、閱讀難度低的書無法提升閱讀能力的問題,使其感受閱讀的樂趣。全世界時下有幾種熱門的閱讀分類體系:藍思分級(Lexile)、AR分級法(AcceleratedReader)、A-Z分級法(GRL/GuidedReadingLevel)。國內目前在分級閱讀方面的產品主要有:ReadingPro、新東方旗下的多納學英語、嘰里呱啦、英語總動員、巴布閱讀等,各有其產品的優勢和不足。在國外,以美國為例,已有70%的美國公辦學校使用Newsela,有40萬教師和超過400萬學生用戶,閱讀文章數超過5700萬。Newsela通過自適應的真實內容分級閱讀將新聞聚合并分級,為不同閱讀水平的學生提供閱讀內容。人工智能的分級閱讀相較于傳統分級閱讀,可更為高效地測定分析,依據不同學生的興趣愛好和閱讀能力的學習數據挖掘行個性化精準閱讀,使學生閱讀興趣明顯提高,學生閱讀習慣大為改進,大大提高了教師的工作效率,把教師從收集和推薦書目,閱讀監督學生等大量機械式重復性工作解放出來,同時實現了學生自適應閱讀,達到了分級閱讀的核心目的。教師和家長也可快捷精準地全方位監測分析學生的學習情況。4.智能學情分析和智能情緒識別。智能學情分析是指在積累了學生學習成績、學習進度、學習習慣等數據后,對其進行智能分析,并給出分析報告,協助教師對學生學習情況進行管理,設計個性化教學方案,為學生量身定制不同于他人的學習策略和學習方法,讓孩子更為有效地學習。做智能學情分析的如極客大數據的“極課EI(EducationIntelligence)”是采用“IPH適應性教學模型”和“集中式動態學業檔案管理”兩大專利技術,采集作業和考試中動態化的海量數據并進行大數據智能算法分析,基于行為和關系數據的知識圖譜來制定學生的具體自適應學習方案[9]。根據官方數據,“極客大數據”的活躍使用學校已超過1800所,收集3200萬份學生作業考試數據,180萬教師、學生及家長的使用習慣。每個孩子都是與眾不同的,有自己獨特的天賦特性、偏好和天生優勢,也有不同于別人的弱點。解決孩子的學習問題,應當用個性化的方法適應其在學習上的要求。因而這種學習活動對于每個學生而言都是有意義的,因為是由學生自發的興趣來驅動的。智能情緒識別目前主要由教育培訓機構和技術公司合作開發,如好未來、VIPKID,通過人工智能圖像識別技術,智能情緒識別可以識別學生課堂表情來判斷學生學習的興趣、困難點和集中度。2018年10月,新東方正式的首款AI類教育產品BlingABC“AI班主任”[10],可以通過人臉屬性分析和檢測、語音識別、NLP(NaturalLanguageProcessing)等人工智能技術來發現學生在語言學習中的問題,根據學生上課時的參與度、回答時長、情緒表現和學習結果來進行量化分析。5.教育機器人。教育機器人除了在科學、技術、工程和數學(STEM)教育方面起著重要作用,在外語教學中的應用也越來越普遍。機器人可以根據學生的認知能力來為其定制學習內容,引導互動學習來營造母語式的外語學習環境,在潛移默化中提高外語語言能力。從早期2016年簡單的聊天學習機器人如著名語言學習AppDuolingo(多鄰國)的永久免費的外語學習chatbox[11],開始只允許用戶打字對話,到擁有智能復雜功能的機器人,如科大訊飛的“阿爾法大蛋”,好未來旗下勵步英語聯合機器人領域領先的ROOBO公司推出的小布機器人[12],與此配套的Let’sChat系統,可以進行進行語音識別、口語評測、繪本伴讀等功能,能夠智能適配學生的學習水平來進行因人施教。通過教育機器人的輔導和在線教育的講解,可以精準定位學生的薄弱知識點到納米級別來實現因材施教的“智適應”的理想學習方式[13]。借助自然語言處理和情感機器人,通過陪伴學生的成長來增加其對人的關懷[14]。
三、人工智能在外語教育中的研究熱點方向
查閱各種資料發現,人工智能近幾年在外語教育中的研究熱點方向主要有:①知識表示與教育知識圖譜,其研究熱點是以知識點及課程為中心的圖譜和以教學及資源為中心的圖譜。②認知診斷,其研究熱點是使用大數據分析技術彌補傳統IRT模型的不足。③學習者建模,其研究熱點是針對學習主體對象的學習者進行建模,對學習者知識狀態的識別和診斷。④教育試題資源表征,其研究熱點是使用深度學習模型對多源異構教育資源進行深度表征。⑤機器閱讀理解與批閱,其研究熱點是基于深度學習的機器閱讀理解。⑥智能教育系統,其研究熱點是教育機器人、游戲化教學、對話形式的學習,建立動態模型。⑦腦科學與教育的結合,其研究熱點是交叉學科研究,教師對“神經神話”的認知,對腦科學的信念,以及教師自身的腦科學素養。人工智能在外語教育中的運用將推動外語學習的精準測評、個性教學和因材施教。配合直播、游戲、VR等技術的教育人工智能可以極大提高學生的興趣,提高外語的學習效率,有著巨大的應用發展空間。如何融合教育測量、教育理論與人工智能,分析學生的學習效率、能力和水平及目前的知識狀態將成為教師學習研究的方向。