語音合成技術(shù)范文
時(shí)間:2023-03-15 13:26:55
導(dǎo)語:如何才能寫好一篇語音合成技術(shù),這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
關(guān)鍵字語音合成,文語轉(zhuǎn)換,語音人機(jī)界面
1引言
由人工通過一定的機(jī)器設(shè)備產(chǎn)生出語音稱為語音合成(SpeechSynthesis)。語音合成是人機(jī)語音通信的一個(gè)重要組成部分。語音合成研究的目的是制造一種會說話的機(jī)器,它解決的是如何讓機(jī)器象人那樣說話的問題,使一些以其它方式表示或存儲的信息能轉(zhuǎn)換為語音,讓人們能通過聽覺而方便地獲得這些信息。
語音合成從技術(shù)方式講可分為波形編輯合成、參數(shù)分析合成以及規(guī)則合成等三種。
波形編輯合成,這種合成方式以語句、短語、詞或音節(jié)為合成單元,這些單元被分別錄音后直接進(jìn)行數(shù)字編碼,經(jīng)適當(dāng)?shù)臄?shù)據(jù)壓縮,組成一個(gè)合成語音庫。重放時(shí),根據(jù)待輸出的信息,在語料庫中取出相應(yīng)單元的波形數(shù)據(jù),串接或編輯在一起,經(jīng)解碼還原出語音。這種合成方式,也叫錄音編輯合成,合成單元越大,合成的自然度越好,系統(tǒng)結(jié)構(gòu)簡單,價(jià)格低廉,但合成語音的數(shù)碼率較大,存儲量也大,因而合成詞匯量有限。
參數(shù)分析合成,這種合成方式多以音節(jié)、半音節(jié)或音素為合成單元。首先,按照語音理論,對所有合成單元的語音進(jìn)行分析,提取有關(guān)語音參數(shù),這些參數(shù)經(jīng)編碼后組成一個(gè)合成語音庫;輸出時(shí),根據(jù)待合成的語音的信息,從語音庫中取出相應(yīng)的合成參數(shù),經(jīng)編輯和連接,順序送入語音合成器。在合成器中,通過合成參數(shù)的控制,將語音波形重新還原出來。
規(guī)則合成,這種合成方式通過語音學(xué)規(guī)則來產(chǎn)生目標(biāo)語音。規(guī)則合成系統(tǒng)存儲的是較小的語音單位(如音素、雙音素、半音節(jié)或音節(jié))的聲學(xué)參數(shù),以及由音素組成音節(jié)、再由音節(jié)組成詞或句子的各種規(guī)則。當(dāng)輸入字母符號時(shí),合成系統(tǒng)利用規(guī)則自動(dòng)地將它們轉(zhuǎn)換成連續(xù)的語音波形。由于語音中存在協(xié)同發(fā)音效應(yīng),單獨(dú)存在的元音和輔音與連續(xù)發(fā)音中的元音和輔音不同,所以,合成規(guī)則是在分析每一語音單元出現(xiàn)在不同環(huán)境中的協(xié)同發(fā)音效應(yīng)后,歸納其規(guī)律而制定的如共振峰頻率規(guī)則、時(shí)長規(guī)則、聲調(diào)和語調(diào)規(guī)則等。由于語句中的輕重音,還要?dú)w納出語音減縮規(guī)則。
現(xiàn)在展開大量研究和實(shí)用的是文語轉(zhuǎn)換系統(tǒng)[1](Text-To-SpeechSystem,TTSSystem),它是一種以文字串為輸入的語音合成系統(tǒng)。其輸入的是通常的文本字串,系統(tǒng)中的文本分析器首先根據(jù)發(fā)音字典,將輸入的文字串分解為帶有屬性標(biāo)記的詞及其讀音符號,再根據(jù)語義規(guī)則和語音規(guī)則,為每一個(gè)詞、每一個(gè)音節(jié)確定重音等級和語句結(jié)構(gòu)及語調(diào),以及各種停頓等。這樣文字串就轉(zhuǎn)變?yōu)榉柎a串。根據(jù)前面分析的結(jié)果,生成目標(biāo)語音的韻律特征,采用前面介紹的合成技術(shù)的一種或者是幾種的結(jié)合,合成出輸出語音。
本文所討論的語音合成應(yīng)用系統(tǒng)就是一種面向TTS應(yīng)用的語音系統(tǒng)。該系統(tǒng)的設(shè)計(jì)目標(biāo)是作為人機(jī)交互的一種反饋手段,用于將計(jì)算機(jī)中的數(shù)據(jù)或狀態(tài)以語音的形式加以輸出。該系統(tǒng)的應(yīng)用背景是作為衛(wèi)星測試系統(tǒng)的一個(gè)子系統(tǒng)用于增強(qiáng)人機(jī)交互能力。通過引入語音合成技術(shù),將原本需要測試人員主動(dòng)觀察的數(shù)據(jù)、狀態(tài)或指令等內(nèi)容以語音的形式即時(shí)播報(bào)出來,相應(yīng)的測試人員只需被動(dòng)收聽即可,只有在敏感內(nèi)容出現(xiàn)時(shí)才加以主動(dòng)觀察,從而降低測試人員的工作強(qiáng)度,改善工作環(huán)境和條件。在這樣的應(yīng)用背景下,對語音合成系統(tǒng)的要求是響應(yīng)速度快,計(jì)算復(fù)雜度和存儲空間復(fù)雜度低,具有良好的可擴(kuò)展性和合成語音清晰度高、可懂性強(qiáng),適于科學(xué)術(shù)語、符號和單位的發(fā)音合成等。基于以上系統(tǒng)需求,我們開發(fā)了專門針對科學(xué)應(yīng)用特別是航空航天領(lǐng)域內(nèi)常見的科學(xué)術(shù)語、符號、計(jì)量單位和數(shù)學(xué)公式等文本分析模塊,以及新型的基于規(guī)則和參數(shù)的語音合成技術(shù)。
2系統(tǒng)結(jié)構(gòu)
圖1中給出了本文討論的語音合成系統(tǒng)的結(jié)構(gòu)框圖。
從外部接口上看,該系統(tǒng)的輸入為文本輸入接口,用戶將要發(fā)聲的文本內(nèi)容通過此接口送入系統(tǒng),輸入的文本不需特別的格式;輸出為音頻輸出接口,系統(tǒng)將合成的聲音以某種編碼方式由此輸出;此外系統(tǒng)中所有語音信息模型均存儲于語音模型庫文件中,各種符號、單位標(biāo)注、單詞字母以及詞匯的發(fā)音等均存儲于詞庫文件中,這些庫文件作為語音合成系統(tǒng)的內(nèi)部輸入。
圖1語音合成系統(tǒng)結(jié)構(gòu)
從內(nèi)部結(jié)構(gòu)上看,輸入的文本主要通過規(guī)范化處理和符號轉(zhuǎn)化,將其中的特殊符號、縮寫、英文單詞以及計(jì)量單位等轉(zhuǎn)換為可識別的發(fā)聲單元標(biāo)識。在分詞模型中,對輸入的文本按預(yù)置的分詞規(guī)律進(jìn)行單詞的劃分,通過分詞處理就基本確定了句子的韻律結(jié)構(gòu)以及多音字的發(fā)音。韻律預(yù)測決定各詞發(fā)音;協(xié)同發(fā)音決定了各詞之間的連接關(guān)系。選詞模塊按照韻律要求及詞的發(fā)音在詞庫中選擇最優(yōu)的發(fā)音,經(jīng)過語音重構(gòu)將波形恢復(fù)出來。各詞的語音波形經(jīng)過拼接模塊在拼接參數(shù)的控制下完成最終語句的合成。
3聲學(xué)單元的選擇及生成
為使合成語音具有較高的清晰度、可懂度以及自然度,通常采取基于波形的語音合成技術(shù)。波形拼接語音合成中的合成單元是從原始自然語音中切分出來的,保留了自然語音的一些韻律特征。根據(jù)自然語言的語音和韻律規(guī)律,存儲適當(dāng)?shù)恼Z音基元,使這些單元在確定的存貯容量下具有最大的語音和韻律覆蓋率。合成時(shí)經(jīng)過聲學(xué)單元選擇、波形拼接、平滑處理等步驟后輸出語音。通過精心設(shè)計(jì)語料庫,并根據(jù)語音和韻律規(guī)則從音庫中挑出最適合的聲學(xué)單元,使系統(tǒng)輸出高質(zhì)量的語音。
常見的語音單元候選可以有詞組、音節(jié)、音素和雙音素等。就詞組而言,無論是中文還是西方語系,都和確定的語義相對應(yīng),因此使用詞組作為聲學(xué)單元可以比較容易的解決合成語音的可懂度問題[2],但是由于詞組的類別非常多,而且在不同韻律環(huán)境下有著明顯不同的表現(xiàn),這樣會造成所需的聲學(xué)單元趨向于無窮大。所謂音節(jié),一般都是由元音和輔音構(gòu)成的,元音是音節(jié)的主干部分[3]。以漢語為代表的一些東方語系,音節(jié)數(shù)目較少,而且音節(jié)基本上是“輔音-元音”結(jié)構(gòu),但是對于一些西方語言,音節(jié)數(shù)目較多,結(jié)構(gòu)比較復(fù)雜,而且使用它并不但不能避免大多數(shù)協(xié)同發(fā)音的影響,而且會引起音庫容量的急劇增大。音素是最小發(fā)音單位,可以使語料庫設(shè)計(jì)時(shí)的靈活性好,但由于音素受相鄰語音環(huán)境的協(xié)同發(fā)音影響很大,對這些影響考慮的不合理時(shí),就會造成音庫在語音和韻律上的不平衡。另外在挑選單元時(shí),由于音素的聲學(xué)變體很多,所選擇的樣本不合適時(shí),會導(dǎo)致相鄰音素間存在基頻和共振峰上不連續(xù),需要采用譜平滑法進(jìn)行處理,這必然會降低合成音質(zhì)。
綜合上述對音節(jié)、詞組、音素的分析可以知道,它們各有優(yōu)缺點(diǎn),因此在構(gòu)造波形拼接所需要的語料庫時(shí),可以結(jié)合不同類型樣本的優(yōu)缺點(diǎn),例如對于自然語流中經(jīng)常出現(xiàn)的一些協(xié)同發(fā)音強(qiáng)的音素、音節(jié)組合,在通過波形拼接形成目標(biāo)語音時(shí),應(yīng)該盡量避免在這些協(xié)同發(fā)音影響大的音素組合之間進(jìn)行拼接,否則單元挑選的稍有不合適,就會造成聽覺上的難以接受。所以在構(gòu)造實(shí)用合成系統(tǒng)時(shí)所采取的聲學(xué)單元的類型和長度都將是不固定的[4]。
在選擇聲學(xué)單元構(gòu)造語音庫時(shí),通常利用某種損失度函數(shù)來描述具有相同大小語音庫的合成能力。一個(gè)典型的損失度函數(shù)可以表達(dá)為:
(1)
其中f為當(dāng)前聲學(xué)單元的詞頻,d為聲學(xué)單元的預(yù)測時(shí)長,c為該單元中所包含的音素之間協(xié)同發(fā)音的大小[4]。在不考慮韻律條件下,構(gòu)造由聲學(xué)單元組成的語音庫時(shí),應(yīng)使由(1)表示的損失度函在該語音庫上的取值最小為目標(biāo)。用于拼接的聲學(xué)單元通常由連續(xù)語流中切分獲得。通過檢索含有大量航天、電子通信、計(jì)算機(jī)以及衛(wèi)星領(lǐng)域內(nèi)關(guān)鍵字的文獻(xiàn),并通過對這些文獻(xiàn)進(jìn)行文本處理,將文獻(xiàn)切分成詞和句。通過對詞匯的統(tǒng)計(jì)可以得到詞頻信息,并在詞頻信息的指導(dǎo)下挑選由文獻(xiàn)獲得的句子,使得選出的句子對高頻詞具有較好的覆蓋,這些挑選出來的句子成為稍后需要錄制的腳本。
挑選合適的播音員,對照腳本進(jìn)行合理朗讀,并且錄音。將錄音所得的語音波形數(shù)據(jù)按腳本以及聲學(xué)單元的劃分進(jìn)行切分,通常對于漢語可以切分為詞、字(CV結(jié)構(gòu))而英文通常需要切分到詞以及少量音素或雙音素,從而構(gòu)成發(fā)聲單元庫。對切分得到的聲學(xué)單元按其在原句子中的位置(前中后)以及前后相連的字詞進(jìn)行標(biāo)注。這些標(biāo)注信息對選詞模塊的判決提供依據(jù)。
4韻律的生成
韻律的聲學(xué)參數(shù)一般包括基頻、時(shí)長、能量,對于一個(gè)TTS系統(tǒng),韻律生成和控制是十分重要的。韻律參數(shù)對于控制合成語音的節(jié)奏、語氣語調(diào)、情感等具有重要意義,而對漢譜普通話,基頻是和聲調(diào)直接相關(guān)的物理參數(shù)。漢語的構(gòu)成原則可歸結(jié)如下:由音素構(gòu)成聲母或韻母,韻母帶上聲調(diào)后成為調(diào)母,由單個(gè)調(diào)母或由聲母與調(diào)母拼接成為音節(jié)。漢語有陰平、陽平、上聲、去聲、輕聲5個(gè)調(diào),1200多個(gè)有調(diào)音節(jié)。一個(gè)音節(jié)就是一個(gè)字的音,即音節(jié)字。由音節(jié)字構(gòu)成詞,最后再由詞構(gòu)成句子[5]。
基于規(guī)則的韻律生成。通過對漢語語音學(xué)和語言學(xué)的研究總結(jié)一些通用的韻律規(guī)則,利用這些先驗(yàn)知識,可以建立一個(gè)基于規(guī)則的韻律生成系統(tǒng)。通常規(guī)則系統(tǒng)包括兩個(gè)方面:一是通用規(guī)則,比如四個(gè)調(diào)的基本形狀,上聲連接的變調(diào)規(guī)則,時(shí)長變化,語氣語調(diào)的音高變化等;二是目標(biāo)說話人的特定韻律規(guī)則,比如個(gè)人的基本調(diào)高、調(diào)域、語速和停頓等。此外在連續(xù)語流中,每個(gè)字的發(fā)音是會相互影響的,連續(xù)語流中一個(gè)字的發(fā)音的聲調(diào)與這個(gè)字單獨(dú)發(fā)音時(shí)的聲調(diào)會有所不同,在合成的連續(xù)語流中,只有具有這種聲調(diào)變化才能使合成的語音具有較好的可懂度,否則將只會是單字語音的生硬連接。漢語普通話語句中的變調(diào)以二字詞的變調(diào)最為主,因?yàn)槎衷~所占比例約為74.3%。它的調(diào)型基本上是兩個(gè)原調(diào)型的相連的序列,但受連讀影響使前后兩調(diào)或縮短、或變低。
基于機(jī)器學(xué)習(xí)的韻律生成。雖然目前已經(jīng)得到了許多關(guān)于韻律的規(guī)則,但這些規(guī)則對于形成非常貼近自然的韻律還相差很遠(yuǎn)。為能夠發(fā)覺隱藏而且難以描述的韻律規(guī)則通常利用機(jī)器學(xué)習(xí)的方法來實(shí)現(xiàn)韻律的生成。常用的算法模型有隱馬爾可夫模型(HMM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)(SVM)以及決策樹等[5][6]。
基于參數(shù)化模型的韻律生成。基于機(jī)器學(xué)習(xí)的韻律模型提取一些人工無法分析的細(xì)則,大人降低人工參與分析的工作量,但這種方法同時(shí)也存在如下問題:首先,一般的學(xué)習(xí)算法都要求比較多的數(shù)據(jù)資源,特別是屬性特征比較多的時(shí)候;其次,如果己有數(shù)據(jù)資源分布不均勻,將造成訓(xùn)練的整體偏差,影響分析結(jié)果;再次,專家知識沒有很好的結(jié)合利用進(jìn)來,是一種信息浪費(fèi);第四,訓(xùn)練模型沒有和語言特征和人的感知掛鉤,無法進(jìn)行轉(zhuǎn)移和調(diào)整。基頻和時(shí)長是影響人的韻律聽感的直接聲學(xué)參數(shù),兩者都是隨時(shí)間變化和環(huán)境變化的。參數(shù)模型利用先驗(yàn)知識,先分析基頻時(shí)長和語言特征、人的聽感的關(guān)系,對此關(guān)系建摸,提取基頻時(shí)長和語言特征及人的聽感直接相關(guān)的參數(shù)。這樣的模型有效利用了專家知識,就可以用不多的數(shù)據(jù)訓(xùn)練出文本語言特征和參數(shù)的關(guān)系,同時(shí)通過調(diào)整模型參數(shù)就可以達(dá)到改變聽感的韻律特征的目的[7]。
Fujisaki模型是一種廣泛使用的基頻參數(shù)化模型[8][9],它主要通過模擬人的發(fā)音機(jī)理來預(yù)測基頻的變化。Fujisaki認(rèn)為基頻的改變主要有兩個(gè)原因:韻律短語邊界(Phrase)的影響和音節(jié)調(diào)(Accent)的影響。基頻曲線的產(chǎn)生是按照聲帶振動(dòng)的機(jī)理,以Phrase和Accent作為預(yù)測系統(tǒng)的輸入,以基頻曲線作為系統(tǒng)的輸入,其中以脈沖信號的形式產(chǎn)生Phrase形狀,以階梯函數(shù)產(chǎn)生Accent形狀。在該模型下基頻曲線可以表示為:
(2)
其中函數(shù)Gpi(t)以及Gaj(t)的表達(dá)式分別為:
(3)
(4)
在表達(dá)式(2)、(3)及(4)中各參數(shù)含義如表1中所示。
表1Fujisaki韻律模型參數(shù)
Fmin基頻最小值αi第i個(gè)Phrase命令控制系數(shù)
IPhrase元素?cái)?shù)量βj第j個(gè)Accent命令控制系數(shù)
JAccent元素?cái)?shù)量θAccent命令最大值參數(shù)
T0i第i個(gè)Phrase命令的時(shí)間標(biāo)記Api第i個(gè)Phrase命令幅度
T1j第j個(gè)Accent命令開始時(shí)間Aaj第j個(gè)Accent命令幅度
T2j第j個(gè)Accent命令結(jié)束時(shí)間
Fujisaki模型的機(jī)理很簡單,對于每個(gè)phrase命令,就是以一個(gè)脈沖信號通過phrase濾波器,相應(yīng)的基頻值上升到最大點(diǎn),然后逐漸衰減。對于連續(xù)的phrase命令,基頻曲線則產(chǎn)生連續(xù)的波動(dòng)。Accent命令由一個(gè)階梯函數(shù)初始化,因?yàn)閍ccent濾波器的參數(shù)α遠(yuǎn)大于β,使得Accent元素很快達(dá)到其最大值,然后迅速衰減。
5系統(tǒng)實(shí)現(xiàn)及應(yīng)用
整個(gè)語音合成系統(tǒng)由一系列動(dòng)態(tài)鏈接庫構(gòu)成,分別對應(yīng)圖2中的各組成部分,各動(dòng)態(tài)庫由C語言書寫。這種動(dòng)態(tài)庫的使用方便未來對局部進(jìn)行修改。通過對動(dòng)態(tài)庫的加載,可以方便的將該語音合成系統(tǒng)集成到任何應(yīng)用環(huán)境中。該合成系統(tǒng)輸入以漢語為主,允許混合少量英文單詞、希臘字母以及其它通用符號。
聲學(xué)庫中的語音波形分別采樣AMR及MFCC兩種編碼方式,此外MFCC編碼后再進(jìn)行矢量量化處理,由此形成多種碼率的聲學(xué)單元庫。采用不同的單元庫將獲得不同音質(zhì)的合成結(jié)果輸出。系統(tǒng)的錄音為女聲,可以通過一定的算法,如基音同步疊加技術(shù)(PitchSynchronousOverlapAdd,PSOLA)算法,在輸出端對音色進(jìn)行修改。
該系統(tǒng)作為我所研制的衛(wèi)星測試系統(tǒng)的一個(gè)關(guān)鍵技術(shù)在實(shí)際應(yīng)用中取得了良好的效果。通過該系統(tǒng)所構(gòu)造的VoiceUI提供了一種全新的人機(jī)界面。計(jì)算機(jī)通過語音將衛(wèi)星的實(shí)時(shí)狀態(tài)匯報(bào)給監(jiān)視人員,極大的降低了監(jiān)視人員的觀察強(qiáng)度,提高了人機(jī)系統(tǒng)的工作效率。
參考文獻(xiàn)
[1]D.H.Klatt,Reviewoftext-to-speechconversionforEnglish,J.Acoust.Soc.Am.,82(3):737-793,1987
[2]R.Linggard,ElectronicSynthesisofSpeech,CambridgeUniversityPress,Cambridge.1985
[3]J.Allen,M.S.HunnicuttandD.Klatt,F(xiàn)romTexttoSpeech:TheMITalkSystem,CambridgeUniversityPress,Cambridge,1987
[4]陳永彬,王仁華.語言信號處理.中國科學(xué)技術(shù)大學(xué)出版社,1990
[5]陶建華,蔡蓮紅.漢語TTS系統(tǒng)中可訓(xùn)練韻律模型的研究.聲學(xué)學(xué)報(bào),2001
[6]初敏.自然言語的韻律組織中的不確定性及其在語音合成中的應(yīng)用.第七屆人機(jī)語音通訊學(xué)術(shù)會議,廈門,2003
[7]倪晉富,王仁華.模型化F0曲線中的升降模式控制機(jī)制.聲學(xué)學(xué)報(bào),1996
篇2
關(guān)鍵詞 廣播節(jié)目采訪;音頻技術(shù);制作與合成;措施
中圖分類號:TN931 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-7597(2014)10-0105-01
質(zhì)量優(yōu)良的采訪類廣播節(jié)目不僅要求工作人員充分發(fā)揮自身專業(yè)特長,還要了解各項(xiàng)采訪設(shè)施的特性及功效。在采訪節(jié)目的錄制過程中,各工作人員應(yīng)默契配合、各司其職,更好地提高采訪類廣播節(jié)目的錄制質(zhì)量。
1 優(yōu)化廣播節(jié)目采訪中音頻技術(shù)的必要性
在采訪類廣播節(jié)目的錄制過程中,優(yōu)秀的音頻技術(shù)是整個(gè)節(jié)目質(zhì)量的重要保障。科技的不斷發(fā)展,促使音頻技術(shù)的處理對象由模擬信號轉(zhuǎn)變成數(shù)字信號,傳統(tǒng)的音頻技術(shù)已無法很好地滿足現(xiàn)階段的廣播節(jié)目需求。目前各國都在積極優(yōu)化廣播音頻的制作與合成技術(shù),我國在這一方面的技術(shù)水平相對落后。因此,應(yīng)積極優(yōu)化采訪類廣播節(jié)目的音頻制作與合成技術(shù),從錄制過程入手,提高原始音頻的錄制質(zhì)量,更好地實(shí)現(xiàn)廣播節(jié)目采訪中音頻制作與合成技術(shù)的優(yōu)化。
2 錄音設(shè)施的合理使用
1)話筒的正確使用。高質(zhì)量的原始音源是采訪類廣播節(jié)目成功的關(guān)鍵性因素,性能優(yōu)良、使用方法正確的話筒是原始音源質(zhì)量的重要設(shè)施基礎(chǔ)。在現(xiàn)場錄制過程中,若話筒使用不當(dāng),易出現(xiàn)音頻嚴(yán)重失真現(xiàn)象及噪音過大等問題,從而對原始聲源的質(zhì)量產(chǎn)生不利影響。而原始聲源的質(zhì)量問題,在后期的修飾加工過程中是無法彌補(bǔ)的,因此在采訪過程中正確使用話筒,對于提高音頻質(zhì)量具有重要意義。
一方面,采訪人員應(yīng)充分了解不同話筒的方向性、靈敏度等性能特征,根據(jù)實(shí)際采訪環(huán)境選擇合適的話筒。例如在進(jìn)行一對一采訪過程中,應(yīng)采用清晰度較高的單指向性話筒。另一方面,在話筒使用過程中,“噴口”現(xiàn)象明顯,即由于話筒過于接近口部,導(dǎo)致說話產(chǎn)生的氣流沖擊話筒振膜而發(fā)出“噗”聲,對錄音質(zhì)量產(chǎn)生較嚴(yán)重影響。為了避免這一現(xiàn)象,采訪人員在采訪過程中,可將話筒保持在離口部15-20 cm距離處,并使聲音氣流與話筒軸部偏離10-15°;也可以采取在話筒上添加泡沫防風(fēng)罩的措施,杜絕“噴口”現(xiàn)象的發(fā)生,從而提高原始聲源質(zhì)量。
2)周邊錄音設(shè)備的輔助功能。在采訪類廣播節(jié)目的制作合成過程中,應(yīng)根據(jù)實(shí)際節(jié)目要求,利用各種聲音調(diào)節(jié)設(shè)備,對采訪過程中的聲音素材進(jìn)行同步處理和加工。可利用均衡器對采訪者、被采訪者及解說人員的語言進(jìn)行美化、修飾,加強(qiáng)聲音的感染力,進(jìn)而提高采訪類廣播節(jié)目的影響力。例如在進(jìn)行室外采訪過程中,不同場景環(huán)境和不同采訪對象可能會導(dǎo)致聲音的頻率過低、音色不清晰,節(jié)目錄制人員應(yīng)使用調(diào)音臺等錄音設(shè)施,遵循“降低低頻、提升中高頻”的調(diào)節(jié)原則,對音質(zhì)進(jìn)行一定程度的修飾。聲音制作者應(yīng)了解不同頻率的聲音特性,例如調(diào)整4 kHz以上的高頻可提高聲音的表現(xiàn)力,調(diào)整30 Hz-650 Hz的中低頻可有效加強(qiáng)聲音力度。在節(jié)目制作過程中,工作人員應(yīng)及時(shí)觀察音量表,根據(jù)音量表上的顯示指標(biāo)對音頻進(jìn)行調(diào)節(jié)。若音量表指針進(jìn)入紅線區(qū),表明聲音失真。廣電總局頒布的《節(jié)目錄制技術(shù)質(zhì)量要求》中明確表示,聲音質(zhì)量的標(biāo)準(zhǔn)參數(shù)為:語言類音頻的電平范圍為-8-4VU,音樂及其他聲音效果的電平范圍為-7-0VU。
3 錄音制作與合成技術(shù)的應(yīng)用
1)復(fù)接技術(shù)的應(yīng)用。復(fù)接技術(shù)是廣播節(jié)目制作與合成的最基本技術(shù)要求,也是廣播制作人多年經(jīng)驗(yàn)的具體體現(xiàn),一部質(zhì)量優(yōu)良的廣播節(jié)目往往需要經(jīng)過幾十項(xiàng)復(fù)接操作才得以完成。近年來多種錄音高新技術(shù)的應(yīng)用,為聲音的制作與合成提供了更多便捷。復(fù)接技術(shù)的核心要求在于合適的錄音電平。若原始采訪的音頻母帶電平高,則信噪比相對較高,聲音信號容易出現(xiàn)失真現(xiàn)象,對這類聲源采取復(fù)接操作,會導(dǎo)致節(jié)目的音量出現(xiàn)較大差異。因此,應(yīng)找準(zhǔn)母帶音頻的切入點(diǎn),對原始音頻素材進(jìn)行加工操作,使原始聲音素材的電平與其他音頻保持一致,從而提高采訪類廣播節(jié)目的音頻質(zhì)量。
2)充分利用音頻工作站。在完成對采訪音頻的初步制作與合成后,音頻制作人員應(yīng)按照一定的處理原則將采訪所得的音頻素材輸入到音頻工作站中,進(jìn)一步對其進(jìn)行加工處理。對采訪音頻素材采取剪接、復(fù)制、修改、粘貼等處理手段后,音頻制作者可試聽合成的音頻,根據(jù)自身的試聽感受對現(xiàn)有合成音頻進(jìn)行調(diào)整,不斷采用淡入淡出、混合合成等無損操作方法,使整個(gè)音頻作品更好滿足試聽要求。只有這樣才能確保整個(gè)采訪節(jié)目的連貫性和完整性,為聽眾提供優(yōu)質(zhì)的聽覺體驗(yàn)。
3)做好審核工作。采訪工作及音頻處理工作的最終目的,在于制作一部優(yōu)質(zhì)的采訪類廣播節(jié)目。因此,有關(guān)節(jié)目制作人員和音頻處理技術(shù)人員應(yīng)確保各項(xiàng)工作的質(zhì)量。最終的作品審核人員應(yīng)樹立良好的把關(guān)意識,以認(rèn)真負(fù)責(zé)的工作態(tài)度對合成節(jié)目進(jìn)行檢查審核,以保證節(jié)目質(zhì)量。在節(jié)目輸出過程中,應(yīng)選擇合適的設(shè)備參數(shù)指標(biāo),避免在音頻輸出過程中可能出現(xiàn)的信息缺失現(xiàn)象,進(jìn)一步保證采訪類廣播節(jié)目的整體質(zhì)量。
4 結(jié)束語
廣播節(jié)目采訪過程中音頻技術(shù)的制作與合成,是理論指導(dǎo)和實(shí)踐經(jīng)驗(yàn)相結(jié)合的產(chǎn)物。節(jié)目制作者應(yīng)充分考慮各方面問題,從錄音設(shè)施、錄音過程中的設(shè)備及音頻的后期處理加工等方面入手,全面提高采訪類廣播節(jié)目的整體質(zhì)量。在音頻素材的制作與合成過程中,應(yīng)保證合成音頻的完整性與流暢性,為聽眾提供優(yōu)質(zhì)的聽覺體驗(yàn)。
參考文獻(xiàn)
[1]孫樹國.淺談廣播節(jié)目的采訪與制作合成經(jīng)驗(yàn)探討[J].黑龍江科學(xué),2013(06):81.
[2]雒仲楠.基于數(shù)字音頻技術(shù)的廣播音頻編輯軟件構(gòu)建研究[J].藝術(shù)科技,2013(02):8.
[3]紀(jì)迎龍.新媒體環(huán)境下計(jì)算機(jī)音樂制作技術(shù)的應(yīng)用與發(fā)展[D].東北師范大學(xué),2011.
[4]李曉東.淺談廣播語言節(jié)目的外采錄制技巧――以經(jīng)濟(jì)之聲《報(bào)時(shí)中國經(jīng)濟(jì)》為例[J].中國廣播,2012(06):58-60.
篇3
關(guān)鍵詞:計(jì)算機(jī)音樂;課程整合;創(chuàng)新
計(jì)算機(jī)音樂技術(shù)是計(jì)算機(jī)技術(shù)與音樂藝術(shù)相結(jié)合的產(chǎn)物,它充分利用信息技術(shù)中的事件分離特點(diǎn),把音樂音響的諸多屬性分離呈現(xiàn),使我們能夠?qū)?gòu)成音樂的各要素進(jìn)行單獨(dú)處理。這一先天優(yōu)勢在對音樂作品、音樂音響進(jìn)行分析的時(shí)候表現(xiàn)得特別充分。各種音色、不同音區(qū)和力度等對作品產(chǎn)生的影響都可以馬上呈現(xiàn)出來,鮮明的對比效果鞏固和強(qiáng)化了學(xué)生的認(rèn)知,課堂教學(xué)效率得到大幅提升。
但是,我們從事的是師范教育工作,計(jì)算機(jī)音樂更多的是應(yīng)用在專業(yè)音樂創(chuàng)作領(lǐng)域,把它引進(jìn)到音樂教育領(lǐng)域并開設(shè)成為一門課程,其目的和意義是什么?它能對我們的培養(yǎng)對象產(chǎn)生哪些積極的影響?計(jì)算機(jī)音樂是現(xiàn)代電子技術(shù)與音樂藝術(shù)結(jié)合的產(chǎn)物,作為一種現(xiàn)代化的音樂創(chuàng)作手段,怎樣使計(jì)算機(jī)音樂和普通音樂教育很好的結(jié)合?我們的教學(xué)投入和人才的產(chǎn)出是否成正比?能否將計(jì)算機(jī)音樂技術(shù)的諸多優(yōu)點(diǎn)應(yīng)用于音樂專業(yè)其它課程的教學(xué)呢?帶著這樣的疑問和憧憬,1997年5月,經(jīng)過兩個(gè)多月的準(zhǔn)備,當(dāng)時(shí)的師專音樂系成立了“音樂與電腦”課題研究小組,主要進(jìn)行計(jì)算機(jī)與音樂教育相結(jié)合的探索。課題組先后在《音樂欣賞》、《基本樂理》、《基礎(chǔ)和聲》、《合唱與指揮》、《學(xué)科教學(xué)法》和《視唱練耳》等6門課程中運(yùn)用了計(jì)算機(jī)輔助教學(xué),計(jì)算機(jī)音樂的教學(xué)形式也從講座推進(jìn)到課堂,并納入了三年制專科和四年制本科的教學(xué)計(jì)劃,從2000學(xué)年度開始,正式將《計(jì)算機(jī)音樂基礎(chǔ)》開設(shè)為一門專業(yè)基礎(chǔ)課程。隨著課程建設(shè)的深入,我們從基礎(chǔ)理論、核心技能和知識拓展三個(gè)方面構(gòu)建了比較完善的計(jì)算機(jī)音樂課程教學(xué)體系,并在實(shí)踐中不斷完善和進(jìn)步。學(xué)校也逐年加大教學(xué)硬件的投入力度,截至目前,已建立起2間計(jì)算機(jī)音樂專業(yè)實(shí)驗(yàn)室,2間數(shù)碼鋼琴教室,1間電子打擊樂教室,1間雙排鍵電子琴教室、1間全數(shù)字化高精度錄音棚、1間遵循音頻行業(yè)國際標(biāo)準(zhǔn)構(gòu)建的蘋果計(jì)算機(jī)系統(tǒng)錄音實(shí)驗(yàn)室,這樣的規(guī)模和水平,在省內(nèi)乃至全國同級院校中都是比較領(lǐng)先的。
一、目前高師計(jì)算機(jī)音樂課程教學(xué)的普遍方式及其局限性
計(jì)算機(jī)音樂作為一門新興的學(xué)科,自從二十多年前引進(jìn)到中國以后,就一直沒有停下其發(fā)展和普及的步伐。據(jù)了解,目前全國高等師范院校里的音樂專業(yè),幾乎都不同程度開設(shè)了計(jì)算機(jī)音樂的相關(guān)課程。部分學(xué)校甚至在師資、硬件等條件尚不具備的情況下也跟風(fēng)開設(shè)。而且,絕大多數(shù)院校都把計(jì)算機(jī)音樂作為一種技術(shù)操作性的課程開設(shè),主要教授計(jì)算機(jī)音樂的制作技巧。這樣的教學(xué)模式,無異于對學(xué)生進(jìn)行軟件操作培訓(xùn),一旦不進(jìn)行操作實(shí)踐,學(xué)生很快就忘記了,甚至軟件升級后就不知就里。
計(jì)算機(jī)音樂之所以能夠產(chǎn)生和發(fā)展,是有著重要的理論和實(shí)踐基礎(chǔ)的。它首先是與音樂的緊密結(jié)合,其次利用計(jì)算機(jī)音樂技術(shù)可以開發(fā)很多教育功能。因此,它與音樂學(xué)科的很多課程都有千絲萬縷的聯(lián)系。如果我們離開這些聯(lián)系孤立的開設(shè)這門課程,其結(jié)果就會變成職業(yè)技能培訓(xùn)。
著名學(xué)者李開復(fù)曾說過:“如果我們將學(xué)過的東西忘得一干二凈時(shí),最后剩下來的東西就是教育的本質(zhì)了。所謂‘剩下來的東西’,其實(shí)就是自學(xué)的能力,也就是舉一反三或無師自通的能力。大學(xué)不是職業(yè)培訓(xùn)班,而是一個(gè)讓學(xué)生適應(yīng)社會,適應(yīng)不同工作崗位的平臺。在大學(xué)期間,學(xué)習(xí)專業(yè)知識固然重要,但更重要的還是要學(xué)習(xí)獨(dú)立思考的方法,培養(yǎng)舉一反三的能力,只有這樣,大學(xué)畢業(yè)生才能適應(yīng)瞬息萬變的未來世界。”這段話,完全可以成為計(jì)算機(jī)音樂這類課程開設(shè)的指導(dǎo)性原則。
我認(rèn)為,作為一種新的音樂創(chuàng)作手段,我們有必要讓學(xué)生了解并初步掌握其基本理論和基本技能,但是更重要的是,我們要給學(xué)生指出該學(xué)科可能的發(fā)展方向和最新的前沿成果,特別是該學(xué)科與其它學(xué)科的聯(lián)系,這對我們培養(yǎng)一專多能的中小學(xué)音樂師資具有重要的意義。我們的培養(yǎng)目標(biāo)是合格的中小學(xué)音樂教師,而合格的標(biāo)準(zhǔn),是要與時(shí)俱進(jìn)、逐步提高的。21世紀(jì)的音樂教育工作者,應(yīng)該是復(fù)合型人才,而復(fù)合型人才必須在知識結(jié)構(gòu)、能力結(jié)構(gòu)、教學(xué)內(nèi)容以及教學(xué)手段等方面優(yōu)化、更新的前提下才能培養(yǎng)出來。如果不大膽改革傳統(tǒng)的教學(xué)方法,這只能是一句空話。因此,把革新教學(xué)手段、積極探索計(jì)算機(jī)音樂技術(shù)與音樂傳統(tǒng)學(xué)科的教法整合作為計(jì)算機(jī)音樂基礎(chǔ)課程的發(fā)展方向,成為綿陽師范學(xué)院計(jì)算機(jī)音樂課程建設(shè)與改革的必然之選。
篇4
關(guān)鍵詞:課程整合; 多媒體教學(xué); 網(wǎng)絡(luò); 信息化處理; 知識重構(gòu)
中圖分類號:G623.71 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-3315(2012)06-017-001
關(guān)于信息技術(shù)與課程整合,華南師范大學(xué)教育技術(shù)研究所李克東教授給它定義為:信息技術(shù)與課程整合是指在課程教學(xué)過程中把信息技術(shù)、信息資源、信息方法、人力資源和課程內(nèi)容有機(jī)結(jié)合,共同完成課程教學(xué)任務(wù)的一種新型的教學(xué)方式。
本文就信息技術(shù)與高中音樂課程整合的應(yīng)用與創(chuàng)新,進(jìn)行了研究和論述。
一、在以多媒體和網(wǎng)絡(luò)基礎(chǔ)的信息化環(huán)境中實(shí)施課程教學(xué)活動(dòng)
1.多媒體教學(xué)的應(yīng)用與創(chuàng)新
多媒體技術(shù)是視頻圖像、音響、圖形和文本借助于計(jì)算機(jī)硬件和軟件而實(shí)現(xiàn)的有機(jī)結(jié)合,能充分發(fā)揮學(xué)生的多種感官機(jī)能。在音樂課上,充分合理地運(yùn)用多媒體技術(shù),通過語言、圖像和聲音的同時(shí)作用于學(xué)生的多種感官,讓他們左右腦并用,充分調(diào)動(dòng)學(xué)生學(xué)習(xí)音樂的積極性,從而使學(xué)生的聽、唱、看等綜合能力得到進(jìn)一步的提高。
例如:鑒賞聆聽《山林的呼喚》時(shí),結(jié)合南方山林圖片的滾動(dòng)出現(xiàn),實(shí)現(xiàn)音畫結(jié)合,幫助學(xué)生感悟音樂之美、自然風(fēng)光之美,了解抒情、寫意型的音樂;播放交響樂隊(duì)演奏的《1812年序曲》的視頻,學(xué)習(xí)管弦樂隊(duì)的配置,了解各種西洋樂器的形制和音色,想象1812年那場著名的俄法之戰(zhàn),了解敘事、描述型的音樂。
運(yùn)用多媒體進(jìn)行教學(xué)優(yōu)勢很多,可是也應(yīng)該避免濫用。如:將整堂課的教學(xué)內(nèi)容都用多媒體展示,上課的流程完全依賴于多媒體,教師充當(dāng)“解說員”,學(xué)生充當(dāng)聽眾,這就違背了學(xué)生為主體的教學(xué)原則,缺少了師生互動(dòng)和交流,學(xué)生學(xué)習(xí)的主動(dòng)性和創(chuàng)新能力沒有得到提高;課件做得太花哨,致使學(xué)生的注意力完全被花哨的畫面和制作技巧所吸引,導(dǎo)致不能集中注意力聽課,這就本末倒置了。
刻意地追求信息技術(shù)與課程的整合,完全否定傳統(tǒng)的教學(xué)方式也是不可取的。如果音樂教學(xué)中,教師運(yùn)用語言或范唱范奏就可以達(dá)到很好的效果時(shí),就可以不使用信息技術(shù)。比如:老師深情并茂地演唱往往最能打動(dòng)學(xué)生,產(chǎn)生情感上的共鳴和拉近師生之間的距離,同時(shí)教師的演唱演奏,展示了教師的基本功,也是讓學(xué)生信服于你的一個(gè)很好的渠道。這就遠(yuǎn)比一些教師花費(fèi)大把時(shí)間來錄制、編輯音頻文件,然后在電腦中播放來得便利和效果好。
2.網(wǎng)絡(luò)在教學(xué)活動(dòng)中的應(yīng)用
20世紀(jì)90年代,計(jì)算機(jī)的發(fā)展進(jìn)入一個(gè)新的階段,其中一個(gè)最主要的特征就是網(wǎng)絡(luò)的發(fā)展,網(wǎng)絡(luò)以其簡便的信息查詢、便捷的通信手段,很快得到了普及。時(shí)至今日,網(wǎng)絡(luò)已經(jīng)深入到每個(gè)人的生活中。在教育領(lǐng)域,各種教育網(wǎng)站、學(xué)校校園網(wǎng)迅速發(fā)展、壯大起來。
網(wǎng)絡(luò)最主要的特點(diǎn)就是信息資源的豐富性和共享性。教師可以利用網(wǎng)絡(luò)查資料,也可布置學(xué)生自主搜尋、查找。教師要充分利用電腦網(wǎng)絡(luò)這個(gè)巨大的教育資源庫,引導(dǎo)學(xué)生更深更廣地學(xué)習(xí)。例如,學(xué)習(xí)《梨園百花》時(shí),可充分發(fā)揮學(xué)生自主學(xué)習(xí)的能力,課前布置學(xué)生通過網(wǎng)絡(luò)查詢戲曲資料,包括劇種分類、戲曲唱腔、伴奏樂器、名家名段等,在課堂教學(xué)時(shí),學(xué)生能根據(jù)自己的認(rèn)知,結(jié)合老師的講解,形成自己的觀點(diǎn)和知識體系。
音樂教師進(jìn)行創(chuàng)造性的信息技術(shù)嘗試工作也很多:建立音樂網(wǎng)站,提供音樂知識和音樂課件;建立FTP下載站點(diǎn),提供常用的音樂資源下載等等。學(xué)生還可以編輯資料與信息,與他人進(jìn)行溝通、交流。在這個(gè)過程中,不僅鍛煉了學(xué)生的思維能力、操作能力,還培養(yǎng)了與他人合作的能力。這些工作的開展和深入,真正實(shí)現(xiàn)了資源共享。
二、對課程教學(xué)內(nèi)容進(jìn)行信息化處理后成為學(xué)習(xí)者的學(xué)習(xí)資源
學(xué)校和教師要積極創(chuàng)設(shè)經(jīng)過數(shù)字化處理的教學(xué)資源軟件環(huán)境,包括滿足優(yōu)化課程學(xué)習(xí)需求的課本資源;滿足擴(kuò)展性學(xué)習(xí)需求的校本資源;滿足個(gè)性發(fā)展需要的社本資源。例如我校正進(jìn)行的校本課程開發(fā),經(jīng)過定期或不定期的運(yùn)行和操作,都將形成文本和圖片或視頻資料,所有的內(nèi)容和過程以及成果都將上傳至校園網(wǎng),成為學(xué)習(xí)者的學(xué)習(xí)資源。
三、信息技術(shù)和音樂課程的整合讓學(xué)生知識獲得重構(gòu)
信息技術(shù)和音樂課程的整合,可培養(yǎng)學(xué)生獲取、分析、加工和利用信息的知識和能力,使他們具有在信息化社會中學(xué)習(xí)、發(fā)展和生存的信息素養(yǎng);培養(yǎng)學(xué)生掌握利用信息技術(shù)的學(xué)習(xí)方式,學(xué)會在信息技術(shù)環(huán)境下對自己的學(xué)習(xí)活動(dòng)進(jìn)行設(shè)計(jì)、實(shí)施和評價(jià),自覺地以不斷的學(xué)習(xí)促進(jìn)自身的發(fā)展和提高,幫助學(xué)生知識重構(gòu)。
篇5
論文摘 要 隨著課改實(shí)驗(yàn)的進(jìn)一步深入,信息技術(shù)與課程整合下的新型課堂教學(xué)如雨后春筍,呈現(xiàn)出一派欣欣向榮的景象。傳統(tǒng)課堂教學(xué)評價(jià)已經(jīng)在新課程理念下站不穩(wěn)腳了,其弊端主要體現(xiàn)在評價(jià)內(nèi)容、方式、主體性等方面,如何在新課程理念下提高英語課堂教學(xué)評價(jià)是我們關(guān)注的問題。
目前,班級授課制仍然是課堂教學(xué)的基本組織形式,但隨著新課程改革的不斷深入它也越來越暴露出其缺點(diǎn)。如教學(xué)活動(dòng)多由教師做主,學(xué)生學(xué)習(xí)的主動(dòng)性和獨(dú)立性受到一定程度的限制;學(xué)生主要接受現(xiàn)成的知識成果,其探索性、創(chuàng)造性不易發(fā)揮;學(xué)生動(dòng)手機(jī)會較少,教學(xué)的實(shí)踐性不強(qiáng),不利于培養(yǎng)學(xué)生的實(shí)際操作能力。受傳統(tǒng)教學(xué)方式的影響,傳統(tǒng)的英語課堂教學(xué)評價(jià)也暴露出了其弊端,主要體現(xiàn)在以下方面:
(1)評價(jià)內(nèi)容過于片面。評價(jià)內(nèi)容往往偏離生活實(shí)際,重知識而輕能力,忽視了個(gè)體差異和個(gè)性化發(fā)展的價(jià)值評價(jià),對學(xué)生的情感態(tài)度和價(jià)值觀沒有起到熏陶、潛移默化的作用。
(2)評價(jià)方式欠靈活。目前我國評價(jià)學(xué)生最主要的方式還是紙筆測驗(yàn),特別是對面臨中考高考的學(xué)生,不是每月一大考,就是三天兩頭一小考,這種評價(jià)方法造成了一部分學(xué)生特別是學(xué)習(xí)困難的學(xué)生無法認(rèn)識自己的潛能,從而喪失了自我發(fā)展的信心和動(dòng)力。
(3)評價(jià)主體單一。傳統(tǒng)課堂教學(xué)以教師為中心展開,評價(jià)組織形式單一,主要以教師的評價(jià)為主,學(xué)生多處于消極被動(dòng)的地位,從不敢奢望自己評價(jià)自己,從而忽視了學(xué)生的力量,使評價(jià)沒有發(fā)揮真正的作用。
傳統(tǒng)教學(xué)評價(jià)中的弊端隨著新課程改革的不斷深入越來越明顯地暴露了出來。因此,在信息技術(shù)環(huán)境下建立一種新的適應(yīng)新課程發(fā)展需要的教學(xué)評價(jià)體系是亟待解決的問題。《國家英語課程標(biāo)準(zhǔn)》提出“評價(jià)是英語課程的重要組成部分。科學(xué)的評價(jià)體系是實(shí)現(xiàn)課程目標(biāo)的重要保障。”課堂評價(jià)是教學(xué)中的重要環(huán)節(jié),直接影響到學(xué)生的學(xué)習(xí)效果和教師的教學(xué)質(zhì)量。如何運(yùn)用創(chuàng)造性思維進(jìn)行英語課堂評價(jià)是關(guān)鍵,基于以上問題,下面談?wù)劰P者的看法:
1 評價(jià)的內(nèi)容廣泛,可以是課堂教學(xué)的各個(gè)環(huán)節(jié)的各個(gè)方面,注重三維目標(biāo)評價(jià)
在新教學(xué)模式下評價(jià)的標(biāo)準(zhǔn)也相應(yīng)轉(zhuǎn)變成了“教師是否為學(xué)習(xí)者創(chuàng)設(shè)了一個(gè)有利于意義建構(gòu)的情境;是否能激發(fā)學(xué)習(xí)者的動(dòng)機(jī)、主動(dòng)精神和保持學(xué)習(xí)興趣;以及是否能引導(dǎo)學(xué)生加深對基本理論和概念的理解等”①因此在評價(jià)過程中不能只看考試分?jǐn)?shù),更應(yīng)側(cè)重于三維目標(biāo)的評價(jià),評價(jià)學(xué)生對運(yùn)用現(xiàn)代信息技術(shù)手段自主學(xué)習(xí)能力、對英語課程學(xué)習(xí)的興趣及態(tài)度、信息素養(yǎng)能力、在不同階段、不同方面取得的進(jìn)步和發(fā)展能力及創(chuàng)造性學(xué)習(xí)能力等。只有這樣,才能真正發(fā)揮評價(jià)的教育功能,使評價(jià)成為學(xué)生自我認(rèn)識、自我教育、自我進(jìn)步的動(dòng)力。
信息技術(shù)與課程整合下的教學(xué)目的是為了每一個(gè)學(xué)生的發(fā)展,課堂教學(xué)也不例外。因此,關(guān)注學(xué)生在課堂教學(xué)中的表現(xiàn)應(yīng)成為課堂教學(xué)評價(jià)的主要內(nèi)容,包括學(xué)生在課堂師生互動(dòng)、自主學(xué)習(xí)、同伴合作中的行為表現(xiàn)、參與熱情、情感體驗(yàn)和探究、思考的過程等等各個(gè)環(huán)節(jié)。通過了解學(xué)生在課堂上如何討論、如何交流、如何合作、如何思考等等學(xué)生的行為表現(xiàn),評價(jià)課堂教學(xué)。
2 評價(jià)方式靈活多樣,從單一化走向多元化
美國哈佛大學(xué)的教育教授howard gardner(霍華德·加德納)教授認(rèn)為,每個(gè)人都具有多元智能,即智能(語言智能、邏輯—數(shù)學(xué)智能、肢體運(yùn)動(dòng)智能、音樂智能、視覺空間智能、人際智能、內(nèi)省智能、自然智能)。也就是說,每個(gè)人的智能是多元的,并有自己獨(dú)特的組合,每個(gè)人都有能力改進(jìn)且擴(kuò)展自己的智能。基于多元智能理論,信息技術(shù)與課程整合下的教學(xué)評價(jià)方式也應(yīng)趨向多元化。英語學(xué)科內(nèi)容豐富,很多東西是用紙筆無法測試出來的。如學(xué)生的聽說閱讀能力、口頭表達(dá)能力、角色扮演能力、協(xié)作學(xué)習(xí)能力等就無法通過試卷來評價(jià)。具體的評價(jià)方式有實(shí)際操作測驗(yàn)(例如在七年級英語教學(xué)中有這樣一課:can you send an e-mail to your friend ?在這種信息技術(shù)教學(xué)環(huán)境中,學(xué)生動(dòng)手實(shí)踐運(yùn)用英語給好友發(fā)送電子郵件,既掌握了語言的學(xué)習(xí),又提高了信息技術(shù)應(yīng)用能力。對于這種評價(jià),應(yīng)實(shí)行實(shí)際操作測驗(yàn)評價(jià)法,而不是紙筆測驗(yàn)評價(jià))、提問、小組辯論、角色扮演、問題討論、口頭演說、“文件夾”式評價(jià)模式(例如根據(jù)每個(gè)學(xué)生在英語課程學(xué)習(xí)期間所做的工作,建立學(xué)生的評價(jià)檔案。如學(xué)生的語音、書寫記錄,學(xué)生參與小組活動(dòng)的情況記載,學(xué)生課余時(shí)間的學(xué)習(xí)拓展情況等統(tǒng)統(tǒng)整理成個(gè)人的“文件夾”,以此作為評定學(xué)生的一個(gè)重要依據(jù))。同時(shí)教師在評價(jià)學(xué)生過程中需要注意以下幾點(diǎn):
(1)評價(jià)時(shí)要注意教師評價(jià)的語言與方式。德國教育家第斯多惠曾說:“真正的教學(xué)藝術(shù)不在于傳授而在于不斷喚醒、鼓舞和激勵(lì)。”鼓舞和激勵(lì)的語言是孩子的陽光,是課堂的生命。我們在給學(xué)生進(jìn)行口頭評價(jià)時(shí),要盡量多地給予正面評價(jià),多角度和多方面地看待學(xué)生所作出的努力。評價(jià)是為學(xué)習(xí)服務(wù)的,其目的在于提高學(xué)生學(xué)習(xí)效率,成為學(xué)生學(xué)習(xí)的動(dòng)力和源泉,為學(xué)生的終身發(fā)展服務(wù)。
(2)教師的評價(jià)要避免暈輪效應(yīng)。評價(jià)要避免暈輪效應(yīng)對價(jià)值判斷的影響。尤其要注意對“學(xué)困生”的評價(jià)不要因?yàn)榻處煂ζ湟酝J(rèn)識的偏見隨便在收集資料時(shí)否定學(xué)生的積極行為,而導(dǎo)致評價(jià)結(jié)果的主觀性。
(3)教師在評價(jià)學(xué)生時(shí)要傾注“愛”。教師在評價(jià)時(shí)首先要真誠地關(guān)愛每一位學(xué)生,真誠地傾聽每一位學(xué)生的發(fā)言,不管他是優(yōu)等生還是后進(jìn)生,要有的放矢地作出恰當(dāng)?shù)脑u價(jià),不可敷衍了事。例如:在聽力教學(xué)中,后進(jìn)生因?yàn)槁牪欢承﹩卧~或句子注意力分散,這時(shí)教師要注意判斷和反饋,如遇見困難單詞及句子時(shí)適當(dāng)停頓,然后教師再口頭闡述幾遍,學(xué)生則會因?yàn)榻處煹膬A聽而感受到教師對自己的尊重和真誠,如此他們會更加積極地投入到學(xué)習(xí)中,注意力自覺地指向教師所授內(nèi)容。
3 評價(jià)主體多元化,評價(jià)組織形式體現(xiàn)多樣性和可選擇性
傳統(tǒng)課堂教學(xué)中,老師是評價(jià)的權(quán)威,是學(xué)生課堂學(xué)習(xí)唯一的評定者,評價(jià)是老師的專利。這樣的課堂顯然和新的教育理念不和諧,在新的教育理念下,老師并不是課堂的主宰,課堂上不能只有老師的評價(jià)。評價(jià)組織形式具有多樣性和可選擇性,要以學(xué)生為中心,將教師評價(jià)、學(xué)生自評互評有效結(jié)合起來,學(xué)生是學(xué)習(xí)的主體,讓學(xué)生在課堂上參與評價(jià)。以形成性評價(jià)為主,以學(xué)生平時(shí)參與各種英語教學(xué)活動(dòng)所表現(xiàn)的興趣、態(tài)度和交流能力為主要依據(jù)。只有注重對學(xué)生平時(shí)學(xué)習(xí)情況及時(shí)地評價(jià),才能有效地提高學(xué)生學(xué)英語的積極性。
“多一把衡量的尺子就多出一批好學(xué)生。”多元化、多角度的評價(jià),合情合理的評價(jià),來自教師、學(xué)習(xí)同伴們的評價(jià),這樣豐富多彩的評價(jià)不僅幫助學(xué)生對自己的知識作一次有效的梳理,而且還培養(yǎng)了傾聽意識,促進(jìn)了學(xué)生語言的發(fā)展。
教學(xué)評價(jià)是教學(xué)活動(dòng)不可缺少的一個(gè)基本環(huán)節(jié),它在教學(xué)過程中有檢驗(yàn)教學(xué)效果、診斷教學(xué)問題、提供反饋信息、引導(dǎo)教學(xué)方向、調(diào)控教學(xué)進(jìn)程等重要作用,因此在新課程標(biāo)準(zhǔn)下有效地進(jìn)行課堂教學(xué)評價(jià)是十分重要的。
注釋
① 李秀蘭.新教學(xué)模式中的教學(xué)評價(jià).http//:online edu.org.
參考文獻(xiàn)
[1] 鐘啟泉等主編.《基礎(chǔ)教育課程改革綱要》解讀.華東師范大學(xué)出版社,2001.
[2] 吳維寧.新課程學(xué)生學(xué)業(yè)評價(jià)的理論與實(shí)踐[m].廣州:廣東教育出版社,2004:21-27.
篇6
【關(guān)鍵詞】欣普貝生;催產(chǎn)素;促宮頸成熟;引產(chǎn)
【中圖分類號】R719 【文獻(xiàn)標(biāo)識碼】A 【文章編號】1004-7484(2013)05-0403-01
引產(chǎn)是產(chǎn)科適時(shí)終止妊娠常用的一種方法,對于適合順產(chǎn)的孕婦,其成功率取決于宮頸是否成熟。近年,欣普貝生(即0.8 mm控釋地諾前列酮栓)被應(yīng)用于臨床促宮頸成熟,并取得良好效果。它與傳統(tǒng)的催產(chǎn)素引產(chǎn)原理有所不同,本研究擬通過聯(lián)合應(yīng)用來發(fā)揮二者長處,提高引產(chǎn)成功率,我們隨機(jī)選取260位2010年1月~2012年12月在我院住院接受分娩產(chǎn)婦,給予欣普貝生聯(lián)合催產(chǎn)素進(jìn)行足月妊娠促宮頸成熟及引產(chǎn),并與使用催產(chǎn)素的對照組進(jìn)行臨床效果比較研究,取得了良好的臨床效果,現(xiàn)將結(jié)果報(bào)道如下:
1 資料與方法
1.1一般資料。2010年1月~20l2 年12月選擇在我院住院接受分娩產(chǎn)婦260例,入選標(biāo)準(zhǔn):(1)年齡20~34歲,孕周37~41周,單胎頭位,初產(chǎn)婦;(2)宮頸Bishop評分≤6分;(3)無胎膜早破,無嚴(yán)重合并癥及引產(chǎn)禁忌證,胎兒中等大小。按照隨機(jī)抽簽法將260例產(chǎn)婦隨機(jī)分為研究組和對照組,每組各130例,兩組產(chǎn)婦的年齡、孕周及宮頸Bishop評分均無明顯差異,具有可比性。
1.2方法。兩組產(chǎn)婦在用藥前均由專人檢測胎心和宮縮情況。研究組產(chǎn)婦給予2.5U催產(chǎn)素注射液(國藥準(zhǔn)字H11021686,北京雙鶴藥業(yè)股份有限公司)靜脈滴注(加到5%葡萄糖注射液500ml),滴速從8滴/min開始,逐漸增加滴速(每隔15~20min)直到出現(xiàn)規(guī)律宮縮(10min內(nèi)有3次宮縮,持續(xù)30s以上),最大滴速不超過30滴/min,同時(shí)給予欣普貝生(地諾前列酮栓,國藥準(zhǔn)字J20060054,英國CTS公司生產(chǎn))1枚(10mg)橫置于陰道后穹窿。給藥后產(chǎn)婦臥床1h,即可自由活動(dòng)。若已臨產(chǎn)、破膜、出現(xiàn)子宮過度刺激[1](連續(xù)30 min內(nèi)宮縮頻率>5次/10 min為宮縮過頻;宮縮持續(xù)時(shí)間≥2 min為宮縮過強(qiáng);宮縮過頻或過強(qiáng),同時(shí)伴胎心率異常,如胎心監(jiān)護(hù)中出現(xiàn)中度或重度可變減速,定義為子宮過度刺激或強(qiáng)直性宮縮跡象)、胎兒窘迫、產(chǎn)婦對欣普貝生發(fā)生系統(tǒng)性不良反應(yīng)(如嚴(yán)重的惡心、嘔吐、低血壓和心動(dòng)過速等),則立即將藥物取出,否則在給藥24 h后取出,并再次進(jìn)行宮頸Bishop評分。對照組僅按上述方法給予催產(chǎn)素。
1.3療效判定標(biāo)準(zhǔn)。顯效:在給藥后24h內(nèi)臨產(chǎn)并結(jié)束分娩,Bishop評分提高3分以上;有效:用藥后24h未臨產(chǎn)但宮頸Bishop評分提高2~3分;無效:用藥后24h未臨產(chǎn)且官頸Bishop評分提高低于2分[2],總有效率=顯效率+有效率。
2 結(jié)果
2.1兩組臨床療效比較。研究組中顯效85例,有效37例,總有效率達(dá)93.84%;對照組中顯效例35,有效39例,總有效率為56.92%;經(jīng)統(tǒng)計(jì)分析發(fā)現(xiàn)研究組的總有效率明顯高于對照組,且差異具有統(tǒng)計(jì)學(xué)意義(P
表1兩組臨床療效比較[例(%)]
組別 n 顯效 有效 無效 總有效率
研究組 130 85(65.38) 37(28.46) 8(6.15) 93.84*
對照組 130 35(26.92) 39(30.00) 56(43.08) 56.92
注:與對照組比較,*P
2.2兩組臨產(chǎn)時(shí)間比較。對照組臨產(chǎn)時(shí)間為(28.54士12.41)h,研究組組臨產(chǎn)時(shí)間為(10.58士4.27)h;經(jīng)統(tǒng)計(jì)分析發(fā)現(xiàn)研究組的臨產(chǎn)時(shí)間較對照組明顯縮短,且差異具有統(tǒng)計(jì)學(xué)意義(P
2.3兩組妊娠結(jié)局比較。對照組中剖宮產(chǎn)62例,占47.69%,研究組中剖宮產(chǎn)16例,占12.31%;經(jīng)統(tǒng)計(jì)分析發(fā)現(xiàn)研究組的剖宮產(chǎn)率明顯低于對照組,且差異具有統(tǒng)計(jì)學(xué)意義(P
2.4兩組不良反應(yīng)比較。研究組中發(fā)生2例胎心異常,6例羊水污染,2例過強(qiáng)過頻宮縮,1例新生兒窒息;對照組5例胎心異常,5例羊水污染,1例過強(qiáng)過頻宮縮,1例新生兒窒息。兩組比較上述發(fā)生率差異均無統(tǒng)計(jì)學(xué)意義(P>0.05)。另外,研究組產(chǎn)婦中有2例發(fā)生腹瀉,1例心慌,而對照組中2例發(fā)生心慌,1例發(fā)生嘔吐,兩組產(chǎn)婦均在停藥后自行緩解。
3 討論
前列腺素E2應(yīng)用于臨床促宮頸成熟已有40多年歷史,是較為理想的促宮頸成熟藥物。其作用機(jī)制為通過刺激內(nèi)源性前列腺素E2的產(chǎn)生及增加宮頸細(xì)胞基質(zhì)水分與粘多糖的含量,使宮頸膠原纖維消失和分離,達(dá)到促宮頸成熟的作用。外源性的前列腺素E2也有松弛宮頸平滑肌的作用,有利于宮頸擴(kuò)張;同時(shí),前列腺素也能促進(jìn)子宮平滑肌細(xì)胞間縫隙連接的形成,誘發(fā)子宮收縮,以達(dá)到引產(chǎn)的目的[3]。欣普貝生其控釋技術(shù)可使藥物釋放更穩(wěn)定、更安全。
催產(chǎn)素又名縮宮素,臨床上廣泛用于引產(chǎn)和催產(chǎn)。催產(chǎn)素通過與縮宮素受體結(jié)合發(fā)揮作用。催產(chǎn)素受體在宮頸上分布很少,故催產(chǎn)素對宮頸的直接作用小,其主要作用是選擇性興奮子宮平滑肌,增強(qiáng)子宮收縮力及收縮頻率,從而促進(jìn)宮頸成熟,誘發(fā)產(chǎn)程啟動(dòng)。催產(chǎn)素是公認(rèn)安全有效并早已用于臨床的藥物,但長期臨床實(shí)踐發(fā)現(xiàn),縮宮素誘導(dǎo)宮頸成熟效果欠佳[4]。
為了探討欣普貝生聯(lián)合催產(chǎn)素用于足月妊娠促宮頸成熟及引產(chǎn)的臨床效果。本研究對住院接受分娩孕婦給予欣普貝生聯(lián)合催產(chǎn)素進(jìn)行足月妊娠促宮頸成熟及引產(chǎn),并與單純使用催產(chǎn)素的對照組進(jìn)行臨床效果比較,研究結(jié)果顯示研究組中總有效率達(dá)93.84%,對照組中總有效率為56.92%,差異具有統(tǒng)計(jì)學(xué)意義(P
綜上所述,欣普貝生聯(lián)合催產(chǎn)素用于足月妊娠促宮頸成熟和引產(chǎn)的臨床效果明顯優(yōu)于單純使用催產(chǎn)素,剖宮產(chǎn)率降低,臨產(chǎn)時(shí)間縮短,而且用藥安全方便,我們認(rèn)為在足月妊娠引產(chǎn)中聯(lián)合使用欣普貝生、催產(chǎn)素,副作用少并能提高引產(chǎn)成功率,能減少因引產(chǎn)失敗、社會因素的剖宮產(chǎn),這對降低產(chǎn)科剖宮產(chǎn)率、提高陰道順產(chǎn)率、增進(jìn)產(chǎn)婦身心健康具有重要社會意義,值得臨床推廣。
參考文獻(xiàn):
[1] Lyrenas S,Clason Ⅰ,Ulmsten U.In vivo controlled release of PGE2 from a vaginal insert(0.8mm,10mg)during induction of labour[J].BJOG,2001,108(15):169-178.
[2] 魏華莉,楊蓓,李春華.欣普貝生與催產(chǎn)素在足月妊娠促官頸成熟及引產(chǎn)的對比觀察[J].中華全科醫(yī)學(xué),2012,10(2):199-201.
篇7
在聽書App這樣的新興市場,就已經(jīng)出現(xiàn)了懶人聽書、酷我聽書、話匣子等多個(gè)產(chǎn)品。但這類產(chǎn)品的共同特點(diǎn)是對有聲讀物依賴性強(qiáng),而有聲讀物卻因人工費(fèi)用較高、資源較少,很快便讓一些聽書App出現(xiàn)了坐吃山空的問題。
天行聽書的妙招
在聽書App市場,并非沒有人找到解開這一“死穴”的方法。由天行匯通公司研發(fā)的手機(jī)App應(yīng)用——天行聽書就是個(gè)特例。和很多聽書軟件不同,這款產(chǎn)品一經(jīng)上市便迅速躥紅。上市僅一周,已在百度移動(dòng)應(yīng)用平臺突破了“10萬+”的下載量,還不包括安卓市場、應(yīng)用匯、XX手機(jī)助手等App下載市場的統(tǒng)計(jì)數(shù)據(jù)。
令天行聽書異軍突起的,正是其對智能人機(jī)交互技術(shù)(HCI)的應(yīng)用。在天行匯通公司,記者見識了天行聽書的核心技術(shù)——語音合成(TTS)和語音識別(ASR)技術(shù)。
“形象地說,語音合成技術(shù)的作用就是讓你隨便輸入一段文字,它幫你馬上轉(zhuǎn)換成聲音。大家用天行聽書下載一個(gè)TXT文本,然后選擇男聲、女聲或粵語來朗讀,不用任何真人去朗讀這些文字,它們就能立即變成可以‘聽’的書,這就是在應(yīng)用TTS。”天行匯通董事長張連毅告訴記者,目前國內(nèi)在這一領(lǐng)域做得比較好的科技公司屈指可數(shù),天行聽書的核心技術(shù)正是來自于在國內(nèi)語音合成領(lǐng)域的專家——捷通華聲。天行在軟件中應(yīng)用了捷通華聲靈云平臺中的語音合成和識別技術(shù),當(dāng)用戶用天行聽書的書庫搜索自己喜歡的書籍時(shí),還可以通過語音進(jìn)行搜索:不用在搜索欄里打字,只要簡單地說出所要尋找的圖書名字就可立即自動(dòng)搜取。這些技術(shù)就是HCI,當(dāng)前還屬于全球IT尖端科技研究項(xiàng)目。
聽書App不再受有聲讀物制約
讓聽書軟件不依賴有聲讀物發(fā)展,讓讀者可以隨時(shí)傾聽自己喜歡的書籍,天行聽書的成功證明,TTS和ASR等HCI技術(shù)的應(yīng)用,或許會成為聽書App市場突破發(fā)展瓶頸的關(guān)鍵。
通過TTS技術(shù),用戶可以隨時(shí)隨地將手機(jī)本地存儲中的書籍(TXT格式)導(dǎo)入到天行聽書中進(jìn)行閱讀。由于其本質(zhì)上并非傳統(tǒng)意義上的有聲讀物,所以用戶在語音聽書的過程中不用依賴網(wǎng)絡(luò),即使在無網(wǎng)環(huán)境下依舊可以使用天行聽書,隨時(shí)隨地享受“聽書”的樂趣,不用像傳統(tǒng)聽書App那樣常受到網(wǎng)絡(luò)的限制。
很多人都會產(chǎn)生這樣的疑問:“語音合成技術(shù)會像人朗讀那樣有感情有抑揚(yáng)頓挫嗎?”據(jù)記者了解,在國內(nèi),天行聽書語音合成技術(shù)目前已經(jīng)達(dá)到了該領(lǐng)域中的極高標(biāo)準(zhǔn)。雖然還不能像真人發(fā)聲那樣自然,但聽起來已經(jīng)接近真人發(fā)聲的自然感。
篇8
1.1 語音合成技術(shù)簡介
語音處理是目前比較活躍的研究領(lǐng)域之一,它的迅速發(fā)展與計(jì)算機(jī)的發(fā)展是分不開的,從中我們可以看出現(xiàn)代科學(xué)相互影響的程度。語音是人類最便利的信息交換手段,因此也是人與計(jì)算機(jī)之間最理想的接口之一。語音處理是多門學(xué)科的基礎(chǔ)上發(fā)展起來的一門綜合性技術(shù),涉及聲學(xué)﹑生理學(xué)﹑心理學(xué)﹑線形系統(tǒng)理論﹑數(shù)字信號處理﹑計(jì)算機(jī)科學(xué)和語言學(xué)等領(lǐng)域。
語音識別和語音合成技術(shù)是實(shí)現(xiàn)人機(jī)語音通信,建立一個(gè)有聽和講能力的口語系統(tǒng)所必需的兩項(xiàng)關(guān)鍵技術(shù)。使電腦具有類似于人一樣的說話和聽懂人說話的能力,是90年代信息產(chǎn)業(yè)的重要競爭市場。和語言識別相比,語言合成的技術(shù)相對說來要成熟一些,是該領(lǐng)域中近期最有希望產(chǎn)生突破并形成產(chǎn)業(yè)化的一項(xiàng)技術(shù)。語音識別和語音合成是語音處理所包含的兩大重要分支,在這兩個(gè)問題中,合成無疑是比較容易的.在識別方面,我們還沒有關(guān)于大腦是如何識別語音和識別說話人的一般理論,即使有這樣的理論也不能保證在計(jì)算機(jī)上簡單地模仿就能得到可用的處理方法;而在合成方面,我們已經(jīng)掌握了語音生成的聲學(xué)特征,利用現(xiàn)有技術(shù)很容易復(fù)制發(fā)音機(jī)理.盡管我們還不大清楚音位轉(zhuǎn)化為語音的心理過程,但在實(shí)際的語音模擬上已經(jīng)取得了成功.
:14000多字
有參考文獻(xiàn)及源程序
400元
備注:此文版權(quán)歸本站所有;。轉(zhuǎn)貼于
篇9
以前,一個(gè)在總部產(chǎn)品部門的同事Scott Meredith,也是TTS的專家,在向別人介紹我的時(shí)候,總忘不了說一句“She is the motherof Mulan TTS system”。我總是欣然接受“木蘭媽媽”這個(gè)稱呼。
“木蘭”是我加入微軟后帶領(lǐng)幾位年輕同事研發(fā)出來的中英文雙語文語轉(zhuǎn)換系統(tǒng)(text-to-speech,簡稱TTS)。她不僅能將中文、英文文稿流暢的朗讀出來,還能很好的處理混雜著很多英文單詞、短語和句子的文稿,在研究院成立五周年的慶祝活動(dòng)中,木蘭名列“十大”成果之一。我常常引以為豪。
木蘭凝聚了我多年的心血,就像我的另一個(gè)孩子,在我的孕育、撫養(yǎng)下,從無到有、從小到大、逐步完善,改進(jìn)。最終成功的“嫁”到微軟最新操作系統(tǒng)Vista中,并且由此孵化出微軟唯一的一個(gè)TTS產(chǎn)品部門。
“木蘭”是如何誕生的
我是2000年初加入研究院的,是研究院的第一位女性研究員,也是研究院第一個(gè)從事TTS研究的人。我?guī)ьI(lǐng)的這個(gè)TFS小組在很長時(shí)間都是微軟內(nèi)部唯一的一個(gè)從事語音合成技術(shù)研發(fā)工作的團(tuán)隊(duì)。憑借著在中文語言文化上的優(yōu)勢,我們差不多花了一年左右時(shí)間專門從事中文語音合成的研究,做出了一個(gè)合成效果非常好的原型系統(tǒng)。之后的1至2年內(nèi),我們把研究重點(diǎn)轉(zhuǎn)移到了英語語音合成上面,也取得了相當(dāng)好的效果。
接下來我們選擇的方向就是解決中英文混讀的問題。隨著互聯(lián)網(wǎng)的發(fā)展,中西方文化的交融,越來越多的中文文章中會雜糅有英文內(nèi)容,可能是某產(chǎn)品的品牌型號,也可能是一首著名歌曲。遇到這樣的文章,傳統(tǒng)文語轉(zhuǎn)換系統(tǒng)就撓頭了。
最典型的解決方案就是在后臺架起兩個(gè)系統(tǒng),一個(gè)專門處理中文,一個(gè)專門處理英文。遇到中英文混雜的句子,就將中文部分分割出來送給中文系統(tǒng),英文部分則送給英文系統(tǒng),然后將兩者的輸出合并起來返回給用戶。這樣做的最大缺陷在于分開處理的兩種語言缺乏統(tǒng)一的語調(diào)、語氣,甚至連聲音本身都差別很大。
這樣的結(jié)果聽上去時(shí)斷時(shí)續(xù),極為不連貫。可懂度(能聽懂)和自然度(聽起來舒服)都比較差。我們當(dāng)時(shí)花了很多精力去物色一個(gè)中英文都比較強(qiáng)的播音員,為我們的語音系統(tǒng)錄音,這樣就可以保證語音數(shù)據(jù)庫中的雙語聲音是一致的。另外我們還將中英文的處理能力融合在一個(gè)系統(tǒng)中,有統(tǒng)一的韻律控制,這樣生成的語句即便包含兩種語言,也能有統(tǒng)一的語調(diào)和節(jié)律,就像一個(gè)能講雙語的人講出來的話,這個(gè)雙語語音合成系統(tǒng)在可懂度與自然度上都取得了較好的效果。我們將這個(gè)系統(tǒng)命名為木蘭。木蘭就是這樣誕生的。
之后的一段時(shí)間里,我們致力于不斷提高木蘭的聲音質(zhì)量,并從應(yīng)用角度探索如何將語音合成技術(shù)方便人們的日常生活,例如語音聊天室(一方輸入文字,另一方聽到聲音)、動(dòng)畫配音(為孩子DIY動(dòng)畫故事)、個(gè)性化聲音加工等,在我們完成了一個(gè)又一個(gè)有趣的研究項(xiàng)目的過程中,木蘭長大了,成熟了。
木蘭“嫁”入Vists
在2003年之際,微軟公司在著力開發(fā)新一代操作系統(tǒng)Vista,當(dāng)時(shí)總部產(chǎn)品部門基本準(zhǔn)備購買其他公司的一套現(xiàn)成的語音合成軟件。在他們對木蘭有所了解后,最終決定用我們的技術(shù)成果,這對TTS研究團(tuán)隊(duì)無疑是一件歡欣鼓舞的事情,因?yàn)槟馨炎约旱难芯砍晒D(zhuǎn)化到服務(wù)于用戶的產(chǎn)品中是我們的夢想。可是,事情運(yùn)作起來遠(yuǎn)投有想象的那么簡單。所有的開發(fā)和單元測試工作都必須在北京做。而我們這個(gè)以研究為主的團(tuán)隊(duì),寫程序不是我們最擅長的能力,而且勢必占用我們很多做研究的時(shí)間。但是,為了一個(gè)共同的目標(biāo)――把自己的研究成果做進(jìn)微軟產(chǎn)品,我們團(tuán)隊(duì)的每一個(gè)人都非常投入地做這個(gè)項(xiàng)目。
剛開始,我們只有5個(gè)人,三個(gè)來自TTS組,兩個(gè)來自技術(shù)轉(zhuǎn)化組。大家分擔(dān)著產(chǎn)品開發(fā)環(huán)節(jié)中的各個(gè)角色,PM、SDE、SEET,每天都超負(fù)荷運(yùn)轉(zhuǎn)著。正巧,項(xiàng)目啟動(dòng)后不久,微軟亞洲工程院宣布成立,它成立的使命是把研究院的最新技術(shù)孵化進(jìn)產(chǎn)品中去,TTS項(xiàng)目也就成了工程院的第一批項(xiàng)目之一。
我們從總部爭取到了更多的人員指標(biāo),TTS開發(fā)組逐漸擴(kuò)大了,有了專職PM、Developer和Tester。當(dāng)然,任務(wù)也更多了,不光要把TTS做進(jìn)操作系統(tǒng),還要做到所有需要TTS技術(shù)的產(chǎn)品中去。不光要做中文、英文,還要做西班牙語、日語、法語等二十多種語言,大概在2004年8月份左右,在工程院中,我們已經(jīng)孵化出一支完整的TTS開發(fā)團(tuán)隊(duì),而我們幾個(gè)仍想致力于研究工作的人逐漸抽身,開始考慮下一步的研究方向。而那時(shí)候,為Vista做的工作已經(jīng)完成了80%以上。
當(dāng)我的木蘭最終“嫁”了出去后,有段時(shí)間我產(chǎn)生了一種空落感,茫然若失,TTS作為一個(gè)產(chǎn)品化了的技術(shù)算是大功告成了,那么接下來應(yīng)該怎么走,還能做些什么?在這些問題上我們的團(tuán)隊(duì)做了很多思考。在隨后的兩年中,我們主要在語音合成技術(shù)的應(yīng)用化、個(gè)性化層面進(jìn)行大膽的探索,通過把十余種較有代表的地方方言運(yùn)用到語音的表達(dá)中,試圖使對話效果更富趣味性、擬人性和娛樂性。在這個(gè)創(chuàng)意的基礎(chǔ)上,我們做出了一些原型系統(tǒng),效果還很不錯(cuò)。這些工作都是“木蘭”的延伸。
18年的緣份,妙不可言
回想起來,我與語音合成這個(gè)研究方向已經(jīng)結(jié)緣十多年了,這緣分源自于碩士入學(xué)之初的一次選擇。
當(dāng)時(shí)我從西北工業(yè)大學(xué)保送到哈爾濱船舶工程學(xué)院讀研究生,我選了語音處理專業(yè)。等兩年后報(bào)考中科院聲學(xué)所博士時(shí),我依然申請了語音合成方向。從碩士階段開始算起,到后來留在聲學(xué)所工作、直到在微軟亞洲研究院工作到2007年,我已經(jīng)在這個(gè)領(lǐng)域奮戰(zhàn)了近18個(gè)年頭了。
語音合成是一個(gè)交叉學(xué)科,既要懂得語音信號處理,還要掌握語言內(nèi)部的音韻、語法等系統(tǒng)的知識,并且需要能將這些知識很好的融合到語音合成系統(tǒng)之中。此外,還需要了解心理學(xué)實(shí)驗(yàn)方法,通過各種實(shí)驗(yàn)來幫助我們更好地理解人的聽覺特點(diǎn),從而更好的滿足用戶的需求。正是因?yàn)樗蟮南嚓P(guān)學(xué)科的知識面比較廣,才吸引我投入了這么多時(shí)間在上面。
而研究院,也是從事這樣專注研究的一個(gè)好地方,它為每個(gè)研究員提供了很好的平臺與環(huán)境,還有做事情的自由,每個(gè)人有很大的自由決定想做什么,不做什么。而且,只要要求合理,研究院總是會保障你有足夠的資源做自己的研究。我曾經(jīng)很奢侈地?fù)碛羞^一個(gè)專門的錄音室。在那里,我們進(jìn)行了各式各樣的錄音實(shí)驗(yàn),這也是“木蘭”會有很好的音質(zhì)的一個(gè)重要保障。
期盼再做一次“媽媽”
到2007年的時(shí)候,我已在TTS領(lǐng)域耕耘了十多年了。雖然,頗有收獲,但內(nèi)心深處逐漸萌生去打探一下TTS之外的領(lǐng)域的念頭。這時(shí),我對大規(guī)模數(shù)據(jù)加工處理產(chǎn)生了興趣,這其中麻省理工學(xué)院的Victor Zue教授給了我很大的啟示。
有一次,他來研究院訪問時(shí)時(shí),對我們提過這樣一個(gè)問題:如果將你在做研究中所使用的數(shù)據(jù)量,乘上一百或者一千倍,同樣的問題還能用同樣的方法來解決嗎?
篇10
從4月12日開通新浪微博到現(xiàn)在,史蒂芬?霍金一共只發(fā)了兩條信息,然而這兩條微博就為他“賺取”了300多萬中國粉絲。他的第一條向中國網(wǎng)友問好的微博就獲得近百萬點(diǎn)贊,此外還有評論和轉(zhuǎn)發(fā)各40多萬條。相隔一天之后,他在第二條微博中發(fā)出的消息再次引起轟動(dòng)――研發(fā)一臺“納米飛行器”,將讓人類飛達(dá)半人馬星座的α星。霍金在微博中稱,加入這一計(jì)劃的,還有俄羅斯“土豪”尤里?米爾納和臉書(Facebook)創(chuàng)始人“小扎”。
不僅物理大師組的這個(gè)“局”堪稱夢幻組合,而且他的“突破攝星”計(jì)劃也讓人充滿遐想:用激光推進(jìn)的微型星際飛船,以1/5光速的速度,花20年左右的時(shí)間就能到達(dá)半人馬座α星并發(fā)回照片。
實(shí)際上,以目前人類在工程材料、推進(jìn)器等方面的技術(shù)水平,無論是用激光還是太陽光,要想把一個(gè)即便只有1~10克重的物體加速到光速的1/5,大概也需要比一顆原子彈爆炸的總能量還要大的能量。這種極大的能量集中到“納米飛行器”上首先會摧毀它。所以,用目前科技發(fā)展的眼光來看,霍金探索半人馬座α星的計(jì)劃或許還只是科幻;而能夠體現(xiàn)當(dāng)今科學(xué)發(fā)展水平的,卻是將這位科學(xué)天才的身體禁錮了50多年的那臺輪椅。
輪椅,霍金形象的一部分
在霍金的第一條微博發(fā)出之后,就有中國網(wǎng)友發(fā)問:全身不能動(dòng)的霍金發(fā)一條微博需要多久?回答這個(gè)問題,要從這位當(dāng)今人類“最強(qiáng)大腦”的標(biāo)志性的形象說起。
霍金17歲就入讀牛津大學(xué)攻讀自然科學(xué),他用了很短時(shí)間就得到了一等榮譽(yù)學(xué)位,隨后轉(zhuǎn)讀劍橋大學(xué)研究宇宙學(xué)。1963年,21歲的他不幸被診斷患有肌肉萎縮性側(cè)索硬化癥(又稱盧伽雷氏癥)。這是一種無法治愈的致命疾病,病人會慢慢喪失運(yùn)動(dòng)能力,后期甚至因?yàn)楹粑『秃聿考∪饴楸远荒馨l(fā)音,并因而失語。
當(dāng)時(shí)醫(yī)生判斷霍金只能活兩三年,然而他后來卻堅(jiān)強(qiáng)地一直活下來,但疾病使霍金的身體嚴(yán)重變形,頭只能朝右邊傾斜,肩膀左低右高,雙手緊緊并在當(dāng)中,握著手掌大小的擬聲器鍵盤,兩腳則朝內(nèi)扭曲,嘴幾乎歪成S形。數(shù)十年來,這樣奇特的形象和那臺輪椅,在全世界面前定格成為一個(gè)天才科學(xué)家的符號。
患病之后,霍金全身只有三根手指和兩只眼睛可以活動(dòng),并且只能用極其微弱、難以識別的語言交談。在1985年因患肺炎而做氣管切開手術(shù)后,霍金更是被徹底剝奪了說話的能力。當(dāng)時(shí),美國加利福尼亞州一位名叫瓦特?沃爾托茲的電腦工程師為霍金設(shè)計(jì)了一個(gè)名為“平等器”的電腦程序,其中的文本文件是Word+。這個(gè)程序可以讓霍金從屏幕上選擇詞匯,只要他按動(dòng)手中的開關(guān)選擇詞匯后,就會轉(zhuǎn)入語音合成器,發(fā)出聲音來。
后來,劍橋調(diào)節(jié)通訊公司的大衛(wèi)?梅森改進(jìn)了這套設(shè)備,并安裝在霍金的輪椅上,使霍金“說話”的速度大大加快,每分鐘可“說”出15個(gè)詞,如果需要,還可以把文字直接打印出來。
這臺世界上幾乎獨(dú)一無二的輪椅不僅是霍金的代步工具,也構(gòu)成霍金個(gè)人形象的一部分。它是一臺集計(jì)算機(jī)軟件、通信技術(shù)、紅外光、語音轉(zhuǎn)換器于一體的人工智能設(shè)備,通過它,霍金的思想可以轉(zhuǎn)化為語音和文字,并表達(dá)給全世界――包括他的數(shù)百萬新浪微博粉絲。
霍金輪椅的語音合成器安置在椅背上,可以把他寫出的文字轉(zhuǎn)譯成獨(dú)特的“霍金式”電子語音。輪椅上安裝有一個(gè)12英寸的電子屏幕,即便在陽光下也能讓他看得清楚屏幕上的內(nèi)容和圖像。通過這個(gè)小小的“窗口”,霍金可以寫演講稿、收發(fā)電子郵件,甚至可以用即時(shí)通信軟件skype來接聽電話。
霍金輪椅上的平板電腦擁有Core17處理器,它可以控制輪椅上所有的電子系統(tǒng)。輪椅上的萬用遙控器是一個(gè)紅外線裝置,可以用來操作霍金辦公室和家里的電視、音響、燈光,甚至可以用來開門、關(guān)門。
輪椅上裝有一個(gè)叫做“盒”的設(shè)備,內(nèi)有USB集線器、音響放大器和整流器,供各種子系統(tǒng)使用。這部輪椅的電源安裝在椅座下方,供輪椅移動(dòng)和整個(gè)電腦系統(tǒng)使用。此外,這套系統(tǒng)還裝有一套備用電池。
其實(shí),霍金輪椅就是一部智能機(jī)器,而且它是隨著科技的發(fā)展而逐漸升級的,以上所描述的只是這臺智能輪椅的基本構(gòu)造。
發(fā)一條微博需要多久
2005年之后,霍金徹底喪失了運(yùn)動(dòng)能力――連手指都不能活動(dòng)了,這讓他以前操作輪椅上的電腦的方式完全失效。為此,英特爾的創(chuàng)始人戈登?摩爾(Gordon Moore)為他設(shè)計(jì)了2.0版的輪椅,使得霍金能繼續(xù)與外界交流,而且照樣通過“交談”來實(shí)現(xiàn)。
新版霍金輪椅主要通過眼動(dòng)追蹤、聯(lián)想輸入和語音合成器播放,來支持這位科學(xué)巨人與世界對話。研究人員為霍金設(shè)計(jì)了一個(gè)特殊的眼鏡,上面安裝了紅外線發(fā)射器和檢測肌肉活動(dòng)的探測器,可以通過霍金說話時(shí)面部肌肉的收縮和舒張來激活輔助系統(tǒng),并用眼球控制紅外線發(fā)射器,選定在屏幕中輪流出現(xiàn)的英文字母。
例如,當(dāng)霍金想說“點(diǎn)子”(idea)這個(gè)詞時(shí),他的面頰肌肉收縮首先激活輔助系統(tǒng),電腦屏幕上會出現(xiàn)字母i,這時(shí)霍金的眼球動(dòng)一下,計(jì)算機(jī)就會不斷顯示以i開頭的英文字母,直到idea出現(xiàn);霍金再動(dòng)一下眼球來表示選定這個(gè)字母,這就如同普通人用手操作鼠標(biāo)時(shí)的兩次點(diǎn)擊確定一樣。當(dāng)霍金完成造句后,就可以把這個(gè)句子發(fā)送到語音合成器上,由后者替他“說”出來了。
有趣的是,由英特爾公司設(shè)計(jì)的語音系統(tǒng)用的是美式英語,這讓一些人尤其是英國女王伊麗莎白,對這位英國國寶級科學(xué)家的“口音”頗有微詞。她在一次會見霍金時(shí)問,“還是美國口音嗎?”霍金回答說:“是的,而且這個(gè)聲音已經(jīng)拿到了版權(quán)。”伊麗莎白女王對英語語音十分看重,以至于英國以她的發(fā)音作為英式英語的標(biāo)準(zhǔn)音。盡管如此,霍金輪椅的智能發(fā)音系統(tǒng)沒能取悅于女王,但是這套2.0版的輪椅畢竟讓霍金與世界的交流延續(xù)至今。
在升級后的輪椅中,霍金為了使用紅外線監(jiān)測裝置,總是要把臉部肌肉繃緊,以便寫文章、收發(fā)郵件和瀏覽互聯(lián)網(wǎng)。到了2011年,他的病情進(jìn)一步惡化,用這種方式每分鐘僅能輸入一兩個(gè)單詞,因而不得不再次求助于老朋友摩爾。在摩爾的指派下,因特爾首席技術(shù)官賈斯汀?拉特納(Justin Rattner)組建了一個(gè)人機(jī)交流技術(shù)團(tuán)隊(duì),團(tuán)隊(duì)成員專門去拜訪霍金,試圖為他找到解決辦法。在見面的當(dāng)時(shí),霍金花了20分鐘,才發(fā)出一句包含30個(gè)單詞的歡迎拜訪者的話。
其后,技術(shù)團(tuán)隊(duì)對霍金的設(shè)備進(jìn)行了改造升級,研發(fā)了一個(gè)可供所有殘障人士使用的交互系統(tǒng)工具包(輔助情境感知工具包,簡稱ACAT)。安裝升級了這個(gè)開源項(xiàng)目后,霍金輪椅可謂升級到2.1版。雖然還是利用面部肌肉動(dòng)作來操作電腦,但ACAT允許使用者通過幾乎任何面部動(dòng)作來進(jìn)行交互操作。升級后的軟件由于集成了Swift Key人工智能預(yù)測技術(shù),霍金僅需要輸入15%~20%的字母,電腦軟件就能預(yù)測出剩下的內(nèi)容,還能夠在每輸入一個(gè)單詞后預(yù)測出下一個(gè)可能的單詞。利用升級后的軟件,霍金對文件進(jìn)行瀏覽、編輯、管理和在多任務(wù)間進(jìn)行切換、收發(fā)電子郵件等日常任務(wù)的速度提高了10倍。
在沒有使用ACAT之前,霍金的輸入速度是每分鐘1.5個(gè)單詞(每20分鐘30個(gè)單詞),在使用ACAT后,他的輸入速度至少提高了一倍,也就是每分鐘輸入3~4個(gè)單詞。有人計(jì)算,霍金在向中國公眾發(fā)一條有99個(gè)詞的微博時(shí),即便沒有錯(cuò)誤,大約也需要30多分鐘。再加上思考以及排版、審閱等,估計(jì)霍金用了大約40分鐘時(shí)間,才完成了他向中國粉絲的第一次問候。
“腦控”,輪椅不僅屬于霍金
2.1版的霍金輪椅或許在某一天就會因?yàn)橹魅瞬∏榈牟恍壹又囟鵁o法使用,因此,人機(jī)交流專家已經(jīng)開始設(shè)計(jì)3.0版智能輪椅――也許這并非只是為霍金一個(gè)人而設(shè)計(jì)的,所有重度殘障人都可能受益于此。而且,由于霍金已經(jīng)習(xí)慣了自己現(xiàn)有的輪椅,而要想習(xí)慣3.0版輪椅,這位物理大師可能還需要開始新的學(xué)習(xí)。
最新版智能輪椅是基于喉部肌肉發(fā)音時(shí)的收縮和舒張來設(shè)計(jì)的。當(dāng)人們說話時(shí),大腦語言中樞會發(fā)出信號到喉嚨,使喉嚨的肌肉群協(xié)同收縮和舒張而發(fā)出聲音。即使一個(gè)人說話不說出聲,或者說出來的話只是自己能夠聽到,其喉部的肌肉群也仍然有運(yùn)動(dòng)。換句話說,想要說出的話即使僅僅在大腦中,大腦也會產(chǎn)生指令,讓喉嚨肌肉群運(yùn)動(dòng)。如果設(shè)計(jì)一個(gè)軟件,能夠通過“讀懂”喉嚨肌肉群的運(yùn)動(dòng)來判斷要說出的詞句,然后傳輸?shù)秸Z音合成器上,就能形成人的話語。與靠電腦軟件檢測臉部肌肉相比,這樣的“發(fā)音”方式要直接很多。
根據(jù)這一原理,美國航天總署艾姆斯研究中心研發(fā)了一項(xiàng)技術(shù),不僅可以讓殘障人自主控制電動(dòng)輪椅,而且能夠?qū)⑺枷耄ㄏ胝f的話)傳送到語音合成器,讓后者“說話”。首先,通過一個(gè)貼在喉部皮膚上的電極,使用者頭腦中只要有“向右”或“停下”的想法(指令),輪椅便會自動(dòng)探測到喉部微弱的電子脈沖并“翻譯”出來,這樣的指令正確傳達(dá)給輪椅后,輪椅就會完成右轉(zhuǎn)或停下的動(dòng)作。同樣,使用者想說什么話,也可以通過軟件探測到,并向語音合成器傳輸指令,讓后者替使用者“發(fā)聲”。
霍金已經(jīng)嘗試過這種人(腦)-機(jī)界面,但他感到并不適應(yīng)。原因有兩個(gè):其一,從使用面頰肌肉到通過喉部肌肉收縮來操控,有一個(gè)需要重新學(xué)習(xí)的過程,霍金還沒有適應(yīng)這種新的技能。其二,按照目前的技術(shù),電極擺放的位置如果稍有偏移,辨識的準(zhǔn)確率就會從94%下降到50%以下。有時(shí)候,電極解讀并發(fā)送到語音合成器“說”出來的話,并非霍金的本意。所以霍金的輪椅目前并沒有正式使用這一系統(tǒng)。
更高級的智能技術(shù)是“腦機(jī)接口”,即用思想來控制不能運(yùn)動(dòng)的四肢。美國大學(xué)生伯克?哈特5年前因潛水意外導(dǎo)致頸椎脊髓受損,四肢永久癱瘓。從2014年起,俄亥俄州神經(jīng)中心的研究人員就開始設(shè)計(jì)一個(gè)植入伯克哈特大腦的芯片來讓其思想控制運(yùn)動(dòng)。這個(gè)植入腦部的芯片名為“神經(jīng)生命”,它通過連接器與電腦相連。電腦使用特殊軟件來解讀大腦傳來的信號后,發(fā)送指令給鑲有130個(gè)電極的電子手袖套,以刺激手部肌肉,讓伯克?哈特得以繞過脊髓,控制手部活動(dòng)。經(jīng)過一年多的練習(xí),現(xiàn)在伯克?哈特已經(jīng)可以用思維控制右手,完成拿起杯子、刷信用卡等動(dòng)作。
同樣,如果把芯片植入大腦語言中樞,就可以在大腦想說什么話的時(shí)候通過人機(jī)指令讓輪椅上的語音合成器說出來。只是,這需要向霍金的大腦語言中樞植入芯片。如果想用思想控制輪椅的運(yùn)動(dòng),也得向大腦運(yùn)動(dòng)中樞植入芯片。當(dāng)然,這種設(shè)想中的3.0版本輪椅目前還幫不到霍金,這首先是因?yàn)椋艚疬€不愿意在自己天才的大腦中植入芯片。
目前,霍金輪椅的價(jià)格可能是普通殘障者所可望而不可即的。由于霍金的輪椅都是科技公司友情贊助的,并不需要他自己“埋單”,因此,還沒有人能夠給霍金輪椅定一個(gè)“官方價(jià)格”。據(jù)粗略估算,買一臺目前版本的霍金輪椅大概得花95萬~100萬美元。如果將來真的升級到3.0版,恐怕價(jià)錢更會高出許多。
- 上一篇:語音識別系統(tǒng)
- 下一篇:語音視頻
熱門標(biāo)簽
語音實(shí)訓(xùn)總結(jié) 語音識別技術(shù) 語音教學(xué) 語音 語音室 心理培訓(xùn) 人文科學(xué)概論