語音遙控器研究論文

時間:2022-03-05 02:16:00

導語:語音遙控器研究論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

語音遙控器研究論文

1系統組成

目前所設計的空調語音遙控器,主要由鍵盤輸入、MIC輸入、溫度采集、語音輸出、紅外發射電路組成。按鍵用來完成按鍵遙控功能------保留按鍵功能、語音報溫、報時;SPCE061A有一路專用于語音信號采集的A/D轉換電路(MIC輸入),可以用來進行語音識別、錄音等的語音信號輸入,本遙控器用來采集語音信號,進行語音識別;SPCE061A有7路A/D,選其中1路進行溫度采集,由按鍵控制溫度播報;SPCE061A有豐富的時基信號,采用2Hz進行計數,并進行萬年歷計算,由按鍵控制播報時間。系統組成如圖1所示。

2硬件組成

硬件電路如圖2所示:

共設計了13個按鍵,采用4×4的行列式鍵盤輸入,IOA0---IOA3設置成輸入口,IOA8---IOA11設置成輸出口,預留3個按鍵作為備用。

語音識別的硬件電路比較簡單,MIC選用駐極體話筒,駐極體話筒具有結構簡單、重量輕、體積小、無方向性、頻率響應寬、保真度好等優點。駐極體話筒的偏壓由SPCE500A的VMIC腳提供。

SPCE061A提供雙通道10位D/A輸出AUD1、AUD2,其中每個DAC通道的輸出能力為3mA,用于輸出語音信號,考慮功耗問題,采用單通道AUD1輸出。

利用SPCE061A的IOB8輸出的PWM信號(IOB8、IOB9口的特殊功能)可以作為紅外載波信號,載波頻率由可編程定時器TimerA(或TimerB)的溢出頻率決定。本遙控器用IOB8產生紅外載波信號。

溫度傳感器采用普通負溫度系數熱敏電阻,熱敏電阻靈敏度高、價格便宜。(''''nSP(tm)內核是一個通用的核結構。除此之外的其它功能模塊均為可選結構,亦即這種結構可大可小或可有可無。借助這種通用結構附加可選結構的積木式的構成,便可形成各種不同系列派生產品,以適合不同的應用場合。這樣做無疑會使每一種派生產品具有更強的功能和更低的成本。

3軟件設計

軟件采用模塊化程序結構,程序模塊包括初始化、鍵盤掃描、溫度采集、溫度播報、萬年歷時間計算、萬年歷播報、紅外發射、語音識別、語音播放模塊等,程序流程見圖3所示:

圖3流程圖

系統初始化包括系統時鐘、IO口、萬年歷初始值、中斷(打開按鍵喚醒和2Hz中斷),然后掃描按鍵,有按鍵進行相應處理,無按鍵進入睡眠,萬年歷計算在2Hz中斷服務程序中進行。

語音播放采用凌陽科技公司提供的音頻編碼算法,先在PC機上錄好提示語音文件(WAV文件),并經凌陽公司提供的壓縮工具壓縮處理成二進制文件加載到用戶程序,編譯鏈接后存儲到單片機FLASH中,播放時再解壓縮送D/A還原出語音。用于u''''nSPTM內核的SPCE系列芯片,凌陽科技公司提供三種不同壓縮率的算法,下表是各種壓縮算法名稱及編碼率類型。

壓縮算法名稱

語音壓縮編碼率類型

SACM_A200016KBits/s、20KBits/s、24KBits/sSACM_S4804.8KBits/s、7.2KBits/sSACM_S2402.4KBits/s

這三種壓縮算法的區別在于壓縮率不同、音質也不同。SACM_A2000壓縮率相對較小,音質較好,相應的資源占用較多。SACM_S240的壓縮率最大,音質相對較差。SACM_S480介于這兩者之間。每種算法都有完整的庫函數供程序調用,軟件編寫非常方便。本語音遙控器采用SACM_S480算法。

語音識別分為特定發音人識別(SpeakerDependent)和非特定發音人識別(SpeakerIndependent)兩種方式。

特定發音人識別是指語音樣板由單個人訓練,對訓練人的語音命令識別準確率較高,而其他人的語音命令識別準確率較低或不識別。非特定發音人識別是指語音樣板由不同年齡、不同性別、不同口音的人進行訓練,可以識別一群人的命令。語音樣板的提取非常重要。語音遙控器就是采用非特定發音人識別方式。

語音識別分為語音樣板訓練和語音識別兩個過程。我們將標準模式的存儲空間稱之為“詞庫”,而把標準模式稱之為“樣板”。所謂語音樣板訓練,就是將待識別的命令進行頻譜分析,提取特征參數作為識別的標準模式。語音識別的過程就是提取語音命令的

特征參數,與詞庫中的樣板比較,取相似度最好的樣板命令序號作為識別結果。凌陽科技公司提供語音樣板訓練工具和語音識別庫函數,每次可以識別30條語音命令,命令較多的話可以分多組進行,語音識別流程見圖4所示:

上面介紹了采用SPCE061A來完成紅外遙控、語音識別、語音報溫、報時等綜合功能的語音遙控器,系統只用了單顆芯片來完成語音處理和控制功能,與專用的語音處理芯片相比,具有結構簡單、成本低、易實現的特點,并且凌陽科技公司提供了豐富的C函數庫和語音處理函數庫,供用戶調用,縮短了開發周期。本品稍作改動,就可用來控制空調機、錄像機等電器;利用SPCE061A的語音處理優勢可組成語音應答系統、語音合成系統、互動式玩具等,具有廣闊的市場前景。