解碼技術論文范文
時間:2023-03-15 14:07:36
導語:如何才能寫好一篇解碼技術論文,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
0 引言
中文MARC是中國機讀目錄(China Machine-Readable Catalogue)的簡稱,中文MARC的主要作用是將各類書目信息編目成統一的標準計算機可讀形式,便于讀者檢索以及各圖書情報部門之間交流書目。學位論文是高校大學生為獲取相應級別學位而撰寫的關于在校期間所學知識的應用或所完成的科研成果。
目前,我國各高校的學位論文大部分都是用中文撰寫的,也有一小部分是用外文撰寫的。高校圖書館將學位論文收藏至自建特色數據庫,就需要對學位論文進行編目,對學位論文編目時要保證編目產生的關于學位論文的數據的質量,以方便讀者檢索并利用學位論文。
1 中文MARC編目學位論文存在的問題
高校圖書館對文獻資源進行有效的分類標引和主題標引,并用相應的著錄、編目格式使文獻資源的主要檢索項及特點形成書目的形式就是高校圖書館的編目工作[1]。學位論文編目的工作流程一般為:回溯編目―審校―典藏―貼書標―入庫上架。學位論文作為一種特殊的文獻資源,其編目具有自己的特點:1)編目難度高。高校大學生研究的學術領域及學術方向繁多,其具體研究方向小而專,對非專業編目人員來說,分類編目比較困難;2)編目工作量巨大。教育事業飛速發展,各高校每年都在擴大招生,進而各高校每年產出的學位論文數量激增,而高校圖書館編目人員有限,而且圖書館每年還要有其他書目入館需要編目,因此編目人員總的工作量非常大。3)學位論文撰寫語種不統一。部分高校設有外國語學院,這些學院的部分學生所撰寫的學位論文所使用的語種一般為外文。
中文MARC是以UNIMARC為基本依據,根據我國出版物的具體情況制定的[2]。中文MARC機讀記錄字段區有如下10個功能塊:0―標識塊;1―編碼信息塊;2―著錄信息塊;3―附注塊;4―款目連接塊;5―相關題名塊;6―主題分析塊;7―責任者塊;8―國際使用塊;9―國內使用塊[3]。中文MARC通過對每個功能塊增設功能不同的多種字段及子字段、對每個字段又增設不同要求的標識符的方式更為詳細的記錄文獻信息。
高校圖書館編目學位論文最終要達到的目標是:1)精準、全面、直觀的反映出學位論文所表達的科研成果,包括科研成果的領域,關鍵詞等信息。2)準確標引學位論文,形成規范數據,方便讀者進行檢索。編目學位論文是讀者可以使用學位論文的前提和基礎,學位論文編目工作的質量直接關系到讀者對學位論文的使用情
況[1]。因此,學位論文編目工作是高校圖書館工作中的一個重要分支,各高校對學位論文編目工作都很重視。但是由于學位論文本身具有的特殊性和中文MARC編目具有的高技術性,導致中文MARC在對學位論文進行編目的時候會出現一些問題,而這些問題的出現直接影響了學位論文編目的質量,進而影響到學位論文在高校圖書館乃至整個學術界的正常流通。中文MARC在高校圖書館學位論文編目中存在如下問題。
1)標準不統一。當前我國使用比較普遍的中文MARC編目標準有兩種:一種是國家圖書館編寫制定的全國圖書館聯合編目中心系統標準;一種是北京大學圖書館編寫制定的中國高等教育文獻資源保障系統,即CALIS系統標準[3]。雖然采用這兩種中文MARC編目標準編目的數據覆蓋面都很廣,共享性也比較強,但還是應該將這兩種標準結合,制定一套唯一的編目標準。有了唯一的標準,各高校圖書館在選擇編目系統時也不需要進行比較,既方便了高校圖書館編目工作,也能使圖書信息流通更順暢。
2)標引不規范。《中國圖書分類法》是高校圖書館編目分類的主要依據。由于部分高校圖書館還有自己編寫的《圖書館編目分類細則》,并結合這兩個規范來進行編目,因此在很多編目細則上出現了不一致現象。
3)著錄字段不完整。中文MARC編目雖然具有詳細的編目規則,但是不同的編目員對規則的理解會有所不同。在中文MARC著錄中,字段和指示符都有詳細的規定,如果出現指示符的漏著、錯著都會直接影響到學位論文的檢索。
4)外文語種撰寫的學位論文編目格式不統一。當前我國圖書館使用USMARC對外文圖書進行著錄,而有些圖書館認為只有原版外文書籍才應該用USMARC進行編目,其余外文圖書應該按中文MARC格式來著錄。因此,使用外文撰寫的學位論文編目格式就出現了兩種,即USMARC格式和中文MARC格式。這種不一致的編目格式會嚴重影響到學位論文的網上共享,對數字圖書館的建設也有不利影響。
高校圖書館每年進書量都很大,新進圖書只有經過編目才能入庫上架,讀者才能在館藏書目檢索系統中檢索到圖書,而高校圖書館專業的編目人員非常有限,因此就會出現非專業人員對圖書進行編目,比如燕山大學圖書館學位論文的編目工作就是由勤工助學的學生來完成的。編目工作對人員專業要求比較高,編目細則又非常繁雜,雖然專業的編目人員已經設定號學位論文編目格式,但是非專業人員在對學位論文進行編目的時候很容易就會出現漏著、錯著的現象,而在對學位論文編目中出現的錯誤只有非常專業的編目人員才能及時發現,這樣就會導致很多編目過程中出現的錯誤到最后都沒有被發現,從而影響到讀者對學位論文的檢索。
2 改進與展望
篇2
(一)功能及主要技術指標要求
直讀式電子壓力計實現井下壓力和溫度參數的測量,并將測量結果通過單芯鎧裝電纜實時傳送至地面解碼控制儀,主要技術指標要求如下所示。
a)壓力測量范圍:(0~30、45、60、80)MPa;壓力測量誤差:0.04%F.S;
b)溫度測量范圍:(-20~+150)℃,測量誤差:±1℃;
c)傳輸距離不小于6000m;通訊誤碼率1.0×10-7。
(二)基本方案及工作原理
直讀式電子壓力計由井下電子壓力計和地面解碼控制儀兩部分組成,其中井下電子壓力計由壓力傳感器、溫度傳感器、信號放大電路、模數轉換電路、單片機系統、編碼電路、數字通訊接口電路和裝載于單片機系統中的相關工作軟件組成,解碼控制儀由解碼電路、通訊接口電路、通用計算機(油田配置)和相關工作軟件組成。
工作過程中,井下電子壓力計由地面解碼控制儀通過單芯鎧裝電纜提供能源,溫度和壓力傳感器分別將環境壓力和溫度轉換為電信號輸出,該電信號經放大和模數轉換后由單片機系統進行數據實時采集和處理,然后按一定周期經數字通訊口輸出。井下電子壓力計和井上解碼控制儀之間通過單芯鎧裝電纜連接,解碼控制儀中通訊接口電路接收井下電子壓力計輸出的壓力和溫度數據,并經解碼后輸入計算機中進行實時分析和處理。
2、數據傳輸方案選擇
設備之間數據通訊通常有并行通訊和串行通訊兩種方案,并行通訊的缺點是傳輸距離短,通訊信道所占點號多,而串行通訊與之相反。根據井下電子壓力計與井上解碼控制儀的數據傳輸特點,需選擇串行數據傳輸方式。
在曼徹斯特編碼中,用電壓跳變的相位不同來區分邏輯1和邏輯0,即用正的電壓跳變表示邏輯0,用負的電壓跳變表示邏輯1。
在油田測井中,井下電子壓力計在井下采集大量信息,并傳送給地面解碼控制儀;但井下電子壓力計到地面解碼控制儀這段信道的傳輸距離較長且環境惡劣,常用的NRZ碼不適合在這樣的信道里傳輸,而且NRZ碼含有豐富的直流分量,容易引起滾筒的磁化。曼徹斯特編碼方式使得信號以串行脈沖碼的調制方式在數據線上傳輸,和最常用的NRZ碼相比,消除了NRZ碼的直流成分,具有時鐘恢復和更好的抗干擾性能,這使它更適合于從井下到井上的信道傳輸,因而在井下電子壓力計和地面解碼控制儀之間選用曼徹斯特編碼使數據傳輸可靠性更高、傳輸距離更遠。
3、曼徹斯特碼編碼軟硬件設計
每一周期井下電子壓力計需將采集到的壓力和溫度兩個參數分別進行曼徹斯特編碼方式輸出,井下電子壓力計與地面解碼控制儀之間按如下通訊協議進行。
a)壓力與溫度均以字為單位進行傳送,先發送壓力字,后發送溫度字,一個壓力字和一個溫度字的組合稱為一個消息;
b)每一個字由20位組成,第1~3位為3個起始位,第4~19位為16個數據位,第20位為奇偶校驗位;
c)壓力字3個起始位電平為先高后低,溫度字起始位為先低后高,高低電平均各占一位半,壓力字與溫度字校驗位均采用奇校驗;
d)傳輸的波特率:5.7292kbps(175μs/位),傳輸一個消息共耗時3.5ms。為保證數據傳輸可靠性,井下電子壓力計同一消息在一個采樣周期內重復發送兩次,地面解碼控制儀根據校驗位判斷每個字的正確性。
由單片機編程輸出兩路I/O控制信號,經過濾波電路、運放電路、整型電路后,產生曼徹斯特編碼雙相電平信號,并經單芯鎧裝電纜送至地面解碼控制儀。為滿足曼徹斯特編碼格式及井下電子壓力計與地面解碼控制儀之間的通訊協議,井下電子壓力計軟件采用如下的編程方式輸出波形。
a)壓力字同步頭為262.5μs高電平后跟隨262.5μs低電平,溫度字同步頭為262.5μs低電平后跟隨262.5μs高電平;
b)若數據位為邏輯0,則在87.5μs低電平后跟隨87.5μs高電平;
c)若數據位為邏輯1,則在87.5μs高電平后跟隨87.5μs低電平;
d)校驗位的波形產生方式與數據位相同。
4、曼徹斯特碼解碼軟硬件設計
地面解碼控制儀需將井下電子壓力計輸出的曼徹斯特碼進行解碼,并按通訊協議用軟件將接收到的曼徹斯特碼數據轉換為井下電子壓力計測得的壓力和溫度數據,即地面解碼控制儀中的解碼過程為井下電子壓力計編碼過程的逆過程。曼徹斯特碼解碼過程可分為如下三部分:
a)同步字頭檢測,并辨別其為溫度數據還是壓力數據。
b)對曼碼形式的數據進行解碼,從曼徹斯特碼波形中分離出同步時鐘,并將時鐘和數據進行處理使曼碼數據轉化為非歸零二進制數據。
c)將串行數據轉化為并行數據,并進行奇偶校驗,以檢驗數據傳輸的正確性。
經過幾千米鎧裝電纜傳輸上來的數據,幅度衰減到毫伏級,因此井上需要精密的解碼電路,才能保證數據傳輸無誤碼率。井下傳輸上來的數據經過濾波電路、精密運算放大器、雙D觸發器輸出曼碼波形給單片機,經過單片機的程序轉化為井下的壓力與溫度數字量。
5、試驗結果
直讀式電子壓力計首臺產品完成廠內試驗后,到油田用8000m的鎧裝電纜連接井下電子壓力計和地面解碼控制儀,將電子壓力計下放到井下6500m的深度,在溫度高達150℃、壓力為30~60MPa的油井中測試壓力和溫度。在三次連續5個小時的測試過程中,數據傳輸準確可靠,沒有出現丟點現象,誤碼率為零。
6、結束語
試驗數據統計分析結果表明,本文研究結果解決了直讀式電子壓力計通訊方案、通訊協議、單芯遠距離傳輸、曼徹斯特碼編解碼軟硬件設計等關鍵技術,增強了電子壓力計在油田測井領域的市場競爭力。
參考文獻:
[1]1553B總線及其在測控網絡中的應用.計量與測試技術.侯青劍.2005.3
篇3
Abstract: JPEG2000 is a new image coding standard which can provide better rate-distortion performanc than the JPEG standard. But a lot of computation redundancy exists in the traditional implementation of JPEG2000 encoder, in particular at the lower bit rate. That makes the encoder need more encoding time and working memory size. In order to reduce the computational complexity, the paper proposed a new JPEG 2000 image size conversion algorithm, the algorithm can greatly reduce the image conversion required computation amount and time.
關鍵詞: JPEG2000;轉換;頻率域
Key words: JPEG 2000;transformation;frequency domain
中圖分類號:TN919.81 文獻標識碼:A 文章編號:1006-4311(2013)26-0184-02
0 引言
JPEG2000是新一代的靜態圖像編碼國際標準,與已有的JPEG標準相比,它可以提供更好的圖像質量和更高的壓縮率,但其計算的復雜度也遠高于JPEG算法。一般在處理JPEG 2000圖像時,若欲將其圖像尺寸縮小,首先需由JPEG 2000解碼器處理,將JPEG 2000圖像解碼到空間域圖像后,在空間域里將圖像縮小至所需尺寸后,再經JPEG 2000編碼器將圖像作編碼,最后得到尺寸縮小后的壓縮圖像。但是由于在空間域里使用圖像大小轉換方法來縮小JPEG 2000圖像,需要大量的計算量、繁雜的處理過程、以及占用大量的存儲空間。為了加快圖像尺寸轉換處理速度、降低計算復雜度、以及有效降低存儲空間占用,本論文提出一個快速的JPEG 2000圖像尺寸縮小轉換算法。流程如圖1。
在我們的快速JPEG 2000圖像尺寸縮小轉換方法中,首先將原始JPEG 2000圖像經EBCOT解碼以及反量化步驟解出圖像的頻率域編碼信息后,再透過頻率域圖像尺寸縮小轉換方法,直接在頻率域里縮小圖像尺寸,最后再通過量化與EBCOT編碼等步驟,將圖像尺寸縮小后的圖像頻率域編碼信息編成JPEG 2000圖像。
本文所提的JPEG 2000圖像尺寸縮小轉換方法與空間域圖像大小轉換方法相比,所提的方法省掉反向小波轉換、反向色彩轉換、后置處理、前置處理、正向色彩轉換、以及正向小波轉換等六個步驟。由于所提的方法不需將頻率域編碼信息轉成空間域圖像,因此本論文所提的方法除了可更快速的轉換圖像大小外,也可省下存放空間域圖像內容所需的存儲空間以及減少所需的計算量。
1 簡化JPEG 2000壓縮與解壓縮流程
在快速JPEG 2000圖像尺寸縮小轉換方法中,保留了EBCOT解碼、反量化、量化與EBCOT編碼等四個部分,主要原因說明如下:
1.1 EBCOT編/解碼 JPEG 2000編碼后的圖像會儲存成封包的格式,但封包并非以子頻帶為單位儲存,所以要取得各子頻帶的內容,必須先經過EBCOT解碼才行。再者本文的方法有可能需要對子頻帶再進行小波轉換,因此EBCOT編/解碼過程不可省略。
1.2 量化與反量化 保留量化與反量化步驟的主要原因在于圖像經由正向小波轉換后,會產生不同大小的子頻帶頻率信息,不同子頻帶頻率信息使用不同的量化步長值進行量化。
子頻帶與量化步長值這兩者有相對應關系,換句話說以具有7個子頻帶的JPEG 2000圖像而言,必須要有7個相對應的量化步長值。而子頻帶與量化步長值所產生的數目與小波轉換的層數有關,對于一個經過m層小波轉換的影像,所具有的子頻帶數目Nsubbands計算公式為:Nsubbands=3×m+1,圖2所示為圖像經由二次小波轉換后所產生的七個不同的子頻帶。
每個子頻帶的量化步長值都是由一組獨立的控制參數(ε,μ)決定,該組控制參數必須記錄于JPEG 2000碼流頭部,供譯碼端還原量化步長值使用。圖3所示為一張圖像經過三次小波轉換后所產生的頻率域情況。
本文所提的頻率域圖像尺寸縮小方法會改變原本圖像的小波轉換層數,進而影響到量化步長值與子頻帶的對應關系。當使用不同小波轉換層數時,每個子頻帶的量化步長值會不同。所以,當圖像在進行尺寸縮小前,先使用原本JPEG 2000圖像的量化步長值對圖像進行反量化,還原頻率域信息,當圖像尺寸已調整縮小后,再用新的量化步長值來量化頻率域信息,即可解決量化步長值與子頻帶不一致的問題。
在我們所提的方法中,分別會遇到小波層數足夠與小波層數不足的情況。假設一張JPEG 2000圖像小波層數為m層,欲要將圖像尺寸縮小為原來的(1/2n×1/2n)大小時,假如n
若n>=m發生,也就是小波層數不足。首先經EBCOT解碼后,產生不同的子頻帶信息。針對不同的子頻帶信息使用反量化,接著進行圖像縮小的工作,將不需要的外頻信息去除,保留的頻率信息因小波層數不足(小波層數需為1層以上),要對保留的頻率信息再進行小波轉換。產生出來的小波頻率域尺寸大小超過欲轉換尺寸,可將外頻的小波頻率信息去除,保留LL子頻帶。此時圖像大小雖已符合轉換所需大小,但JPEG 2000規定圖像至少要有一層小波轉換,所以必須再做一次小波轉換,得到一張小波轉換層數為1的JPEG 2000圖像,最后再經量化與EBCOT編碼,得到尺寸縮小后的JPEG 2000圖像。
2 頻率域圖像尺寸縮小轉換方法
圖1中間的頻率域圖像尺寸縮小轉換方法主要工作包括縮小頻率域圖像尺寸與修改JPEG 2000圖像碼流主標頭相關參數等步驟,詳細步驟如下:
2.1 括縮小頻率域圖像尺寸
①小波轉換層數足夠的作法。假設當圖像的小波層數為m層,欲將圖像尺寸縮小為(1/2n×1/2n)大小時,若n
首先使用EBCOT解出頻率域信息,再對需保留的頻率域信息作反量化動作,接著將整張圖像的尺寸縮小,并且丟棄不需要的外頻頻率信息,最后將所保留的頻率域信息再重新經過量化與EBCOT編碼,即可得到圖像尺寸縮小后的JPEG 2000圖像。
②小波轉換層數不足的作法。假設當圖像的小波層數為m層時,欲將圖像尺寸縮小為(1/2n×1/2n)大小時,若n>=m,就是小波層數不足,則除了丟棄m個外層的中高頻信息外,還需要將原來最內層的低頻信息,進行(n-m)+1次小波轉換,再將所產生的(n-m)層的中高頻信息丟棄。由于以上的(n-m)次小波轉換后的中高頻信息最終將被丟棄,因此在進行以上小波轉換時可直接省略許多計算工作,不必進行完整的小波轉換。此法為本文提出的快速小波轉換方法。
2.2 修改JPEG 2000圖像碼流主標頭相關參數 JPEG 2000圖像碼流主標頭記錄原始圖像大小、塊狀(tile)大小、小波層數、各子頻帶的量化步階值參數(ε和μ)等數據信息。在我們所提方法中,并沒有將圖像解回空間域,而是在頻率域信息縮小圖像尺寸后,直接進行量化和EBCOT編碼,產生新的JPEG 2000圖像。新的JPEG 2000圖像碼流主標頭數據無法像空間域轉換方法由JPEG 2000壓縮方式設定,而必須自行修改JPEG 2000圖像碼流主標頭內的相關參數。
3 小結
JPEG 2000具有的多種特性使其有著廣泛的應用前景。目前許多圖形圖像公司如Pegasus,Aware等在開發的圖像軟件中集成了JPEG 2000圖像壓縮技術;有的公司如ImagePower等已開發出JPEG 2000的DSP芯片。JPEG 2000將取代JPEG在圖像壓縮領域發揮重要作用。本論文提出一個新的快速圖像壓縮方法,可大幅降低使用空間域轉換時的處理時間,以及所需存儲空間,但是本文所提方法只針對靜態圖像實現固定大小的縮小轉換,無法對圖像作任意大小轉換,對圖像作任意大小轉換是一個很好的發展方向,需作進一步研究。
參考文獻:
[1]杜偉娜,孫軍,倪強.基于JPEG2000的高效率控制算法[J].上海交通大學學報,2006,40(1):16-19.
篇4
由於在現今資訊流通普遍的社會中,影像的需求量越來越大,影像的數位化是必然的趨勢。然而在數位化過的影像所占的資料量又相當龐大,在傳輸與處理上皆有所不便。將資料壓縮是最好的方法。如今有一新的模式,在壓縮率及還原度皆有不錯的表現,為其尚未有一標準的格式,故在應用上尚未普及。但在不久的未來,其潛力不可限量。而影像之於印刷有密不可分的關系。故以此篇文章介紹小波(WAVELET)轉換的歷史淵源。小波轉換的基礎原理。現今的發展對印刷業界的沖擊。影像壓縮的未來的發展。
壹、前言
由於科技日新月異,印刷已由傳統印刷走向數位印刷。在數位化的過程中,影像的資料一直有檔案過大的問題,占用記憶體過多,使資料在傳輸上、處理上都相當的費時,現今個人擁有True Color的視訊卡、24-bit的全彩印表機與掃描器已不再是天方夜譚了,而使用者對影像圖形的要求,不僅要色彩繁多、真實自然,更要搭配多媒體或動畫。但是相對的高畫質視覺享受,所要付出的代價是大量的儲存空間,使用者往往只能眼睜睜地看著體積龐大的圖檔占掉硬碟、磁帶和光碟片的空間;美麗的圖檔在親朋好友之間互通有無,是天經地義的事,但是用網路傳個640X480 True Color圖形得花3分多鐘,常使人哈欠連連,大家不禁心生疑慮,難道圖檔不能壓縮得更小些嗎?如此報業在傳版時也可更快速。所以一種好的壓縮格式是不可或缺的,可以使影像所占的記憶體更小、更容易處理。但是目前市場上所用的壓縮模式,在壓縮的比率上并不理想,失去壓縮的意義。不然就是壓縮比例過大而造成影像失真,即使數學家與資訊理論學者日以繼夜,卯盡全力地為lossless編碼法找出更快速、更精彩的演算法,都無可避免一個尷尬的事實:壓縮率還是不夠好。再說用來印刷的話就造成影像模糊不清,或是影像出現鋸齒狀的現象。皆會造成印刷輸出的問題。影像壓縮技術是否真的窮途末路?請相信人類解決難題的潛力是無限的。既然舊有編碼法不夠管用,山不轉路轉,科學家便將注意力移轉到WAVELET轉換法,結果不但發現了滿意的解答,還開拓出一條光明的坦途。小波分析是近幾年來才發展出來的數學理論。小波分析,無論是作為數學理論的連續小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發展,他保留了傅氏理論的優點,又能克服其不足之處。可達到完全不失真,壓縮的比率也令人可以接受。由於其數學理論早在1960年代中葉就有人提出了,而到現在才有人將其應用於實際上,其理論仍有相當大的發展空間,而其實際運用也屬剛起步,其後續發展可說是不可限量。故研究的動機便由此而生。
貳、 WAVELET的歷史起源
WAVELET源起於Joseph Fourier的熱力學公式。傅利葉方程式在十九世紀初期由Joseph Fourier (1768-1830)所提出,為現代信號分析奠定了基礎。在十九到二十世紀的基礎數學研究領域也占了極重要的地位。Fourier提出了任一方程式,甚至是畫出不連續圖形的方程式,都可以有一單純的分析式來表示。小波分析是近幾年來才發展出來的數學理論為傅利葉方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波規范正交基。其後1984年,法國地球物理學J. Morlet在分析地震波的局部性質時,發現傳統的傅利葉轉換,難以達到其要求,因此引進小波概念於信號分析中,對信號進行分解。隨後理論物理學家A.Grossman對Morlet的這種信號根據一個確定函數的伸縮,平移系 { a -1/2 Ψ[(x-b)/a] ;a,b?R ,a≠0}展開的可行性進行了研究,為小波分析的形成開了先河。
1986年,Y. Meyer建構出具有一定衰減性的光滑函數Ψj,k(x),其二進制伸縮與平移系 {Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}構成L2(R)的規范正交基。1987年,Mallat巧妙的將多分辨分析的思想引入到小波分析中,建構了小波函數的構造及信號按小波轉換的分解及重構。1988年Daubechies建構了具有正交性(Orthonormal)及緊支集(Compactly Supported);及只有在一有限區域中是非零的小波,如此,小波分析的系統理論得到了初步建立。
三、 WAVELET影像壓縮簡介及基礎理論介紹
一、 WAVELET的壓縮概念
WAVELET架在三個主要的基礎理論之上,分別是階層式邊碼(pyramid coding)、濾波器組理論(filter bank theory)、以及次旁帶編碼(subband coding),可以說wavelet transform統合了此三項技術。小波轉換能將各種交織在一起的不同頻率組成的信號,分解成不相同頻率的信號,因此能有效的應用於編碼、解碼、檢測邊緣、壓縮數據,及將非線性問題線性化。良好的分析局部的時間區域與頻率區域的信號,彌補傅利葉轉換中的缺失,也因此小波轉換被譽為數學顯微鏡。
WAVELET并不會保留所有的原始資料,而是選擇性的保留了必要的部份,以便經由數學公式推算出其原始資料,可能不是非常完整,但是可以非常接近原始資料。至於影像中什度要保留,什麼要舍棄,端看能量的大小儲存(跟波長與頻率有關)。以較少的資料代替原來的資料,達到壓縮資料的目的,這種經由取舍資料而達到壓縮目地的作法,是近代數位影像編碼技術的一項突破。即是WAVELET的概念引入編碼技術中。
WAVELET轉換在數位影像轉換技術上算是新秀,然而在太空科技早已行之有年,像探測衛星和哈柏望遠鏡傳輸影像回地球,和醫學上的光纖影像,早就開始用WAVELET的原理壓縮/還原影像資料,而且有壓縮率極佳與原影重現的效果。
以往lossless的編碼法只著重壓縮演算法的表現,將數位化的影像資料一絲不漏的送去壓縮,所以還原回來的資料和原始資料分毫無差,但是此種壓縮法的壓縮率不佳。 將數位化的影像資料轉換成利於編碼的資料型態,控制解碼後影像的品質,選擇適當的編碼法,而且還在擷取圖形資料時,先幫資料「減肥。如此才是WAVELET編碼法主要的觀念。
二、 影像壓縮過程
原始圖形資料 色彩模式轉換 DCT轉換 量化器 編碼器 編碼結束
三、 編碼的基本要素有三點
(一) 一種壓縮/還原的轉換可表現在影像上的。
(二) 其轉換的系數是可以量化的。
(三) 其量化的系數是可以用函數編碼的。
四、 現有WAVELET影像壓縮工具主要的部份
(一) Wavelet Transform(WAVELET轉換):將圖形均衡的分割成任何大小,最少壓縮二分之一。
(二) Filters(濾鏡):這部份包含Wavelet Transform,和一些著名的壓縮方法。
(三) Quantizers(量化器):包含兩種格式的量化,一種是平均量化,一種是內插量化,對編碼的架構有一定的影響。
(四) Entropy Coding(熵編碼器):有兩種格式,一種是使其減少,一種為內插。
(五) Arithmetic Coder(數學公式):這是建立在Alistair Moffat s linear time coding histogram的基礎上。
(六) Bit Allocation(資料分布):這個過程是用整除法有效率的分配任何一種量化。
肆、 WAVELET影像壓縮未來的發展趨勢
一、 在其結構上加強完備性。
二、 修改程式,使其可以處理不同模式比率的影像。
三、 支援更多的色彩。可以處理RGB的色彩,像是YIQ、HUV的色彩定義都可以分別的處理。
四、 加強運算的能力,使其可支援更多的影像格式。
五、 使用WAVELET轉換藉由消除高頻率資料增加速率。
六、 增加多種的WAVELET。如:離散、零元樹等。
七、 修改其數學編碼器,使資料能在數學公式和電腦的位元之間轉換。
八、 增加8X8格的DCT模式,使其能做JPEG的壓縮。
九、 增加8X8格的DCT模式,使其能重疊。
十、 增加trellis coding。
十一、 增加零元樹。
現今已有由中研院委托國內學術單位研究,也有不少的研究所的碩士。國外更是如火如荼的展開研究。相信實際應用於實務上的日子指日可待。
伍、 影像壓縮研究的方向
1. 輸入裝置如何捕捉真實的影像而將其數位化。
2. 如何將數位化的影像資料轉換成利於編碼的資料型態。
3. 如何控制解碼影像的品質。
4. 如何選擇適當的編碼法。
5. 人的視覺系統對影像的反應機制。
小波分析,無論是作為數學理論的連續小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發展,他保留了傅氏理論的優點,又能克服其不足之處。
陸、 在印刷輸出的應用
WAVELET影像壓縮格式尚未成熟的情況下,作為印刷輸出還嫌太早。但是後續發展潛力無窮,尤其在網路出版方面,其利用價值更高,WAVELET的出現就猶如當時的JPEG出現,在影像的領域中掀起一股旋風,但是WAVELET卻有JPEG沒有的優點,JPEG乃是失真壓縮,且解碼後復原程度有限,能在網路應用,乃是由於電腦的解析度并不需要太高,就可辨識其圖形。而印刷所需的解析度卻需一定的程度。WAVELET雖然也是失真壓縮,但是解碼後卻可以還原資料到幾乎完整還原,如此的壓縮才有存在的價值。
有一點必須要提出的就是,并不是只要資料還原就可以用在印刷上,還需要有解讀其檔案的RIP,才能用於數位印刷上。等到WAVELET的應用成熟,再發展其適用的RIP,又是一段時間以後的事了。
在網路出版上已經有瀏覽器可以外掛讀取WAVELET檔案的軟體了,不過還是測試版,可是以後會在網路上大量使用,應該是未來的趨勢。對於網路出版應該是一陣不小的沖擊。
圖像壓縮的好處是在於資料傳輸快速,減少網路的使用費用,增加企業的利潤,由於傳版的時間減少,也使印刷品在當地印刷的可能性增高,減少運費,減少開支,提高時效性,創造新的商機。
柒、 結論
WAVELET的理論并不是相當完備,但是據現有的研究報告顯現,到普及應用的階段,還有一段距離。但小波分析在信號處理、影像處理、量子物理及非線性科學領域上,均有其應用價值。國內已有正式論文研究此一壓縮模式。但有許多名詞尚未有正式的翻譯,各自有各自的翻譯,故研究起來倍感辛苦。但相信不久即會有正式的定名出現。這也顯示國內的研究速度,遠落在外國的後面,國外已成立不少相關的網站,國內僅有少數的相關論文。如此一來國內要使這種壓縮模式普及還有的等。正式使用於印刷業更是要相當時間。不過對於網路出版仍是有相當大的契機,國內仍是可以朝這一方面發展的。站在一個使用其成果的角度,印刷業界也許并不需要去了解其高深的數理理論。但是在運用上,為了要使用方便,和預估其發展趨勢,影像壓縮的基本概念卻不能沒有。本篇文章單純的介紹其中的一種影像壓縮模式,目的在為了使後進者有一參考的依據,也許在不久的將來此一模式會成為主流,到時才不會手足無措。
參考文獻
1.Geoff Davis,1997,Wavelet Image Compression Construction Kit,。
2.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(上), 峰資訊股份有限公司。
3.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(下), 峰資訊股份有限公司。
4.施威銘研究室,1994,PC影像處理技術(二)圖檔壓縮續篇,旗標出版有限公司。
5.盧永成,民八十七年,使用小波轉換及其在影像與視訊編碼之應用,私立中原大學電機工程學系碩士學位論文。
6.江俊明,民八十六年,小波分析簡介,私立淡江大學物理學系碩士論文。
7.曾泓瑜、陳曜州,民八十三年,最新數位訊號處理技術(語音、影像處理實務),全欣資訊圖書。
附錄:
嵌入式零元樹小波轉換、 階層式嵌入式零元樹小 波轉換、階層式影像傳送 及漸進式影像傳送
目前網路最常用的靜態影像壓縮模式為JPEG格式或是GIF格式等。但是利用這些格式編碼完成的影像,其資料量是不變的,其接受端必須完整地接受所有的資料量後才可以顯示出編碼端所傳送的完整影像。這個現象最常發生在利用網路連結WWW網站時,我們常常都是先接收到文字後,其網頁上的圖形才,慢慢的一小部份一小部份顯示出來,有時網路嚴重塞車,圖形只顯示一點點後就要再等非常久的時間才再有一點點顯示出來,甚至可能斷線了,使得使用者完全不知道在接收什麼圖案的圖形,無形中造成網路資源的浪費。此缺點之改善,可以使用嵌入式零元樹小波轉換(EZW)來完成。
階層式影像傳送系統的主要功能為允許不同規格之顯示裝置或解碼器可以從同一編碼器中獲得符合其要求之訊號,如此不需要對於不同的解碼器設計不同的編碼器配合利用之,進而增加了其應用的 范圍,及減低了所架設系統的復雜度,也可以節省更多的設備費用。利用Shapiro所提出的嵌入式零元樹小波轉換(EZW)技術來設計階層式影像傳送系統時,其編碼的效果不是很好。主要的原因是,利用(EZW)技術所設計的編碼器是根據影像的全解析度來加以編碼的,這使得擁有不同解析度與碼率要求的解碼器,無法同時分享由編碼器所送出來的位元流。雖然可以利用同時播放(Simulcast)技術來加以克服之,但是該技術對於同一影像以不同解析度獨立編碼時,將使得共同的低通次頻帶(Lowpass Subband)被重復的編碼與傳送,而產生了相當高的累贅(Redundancy)。
基於上述情況,有人將嵌入式零元樹小波轉換(EZW)技術加以修改之,完成了一個新式的階層式影像傳送系統。該技術為階層式嵌入的零元樹小波轉換(Layered Embedded Zerotree Wavelet,簡稱 LEZW技術。這個技術使我們所設計出來的階層式影像傳送系統,可以在編碼傳送前預先指定圖層數目、每層影像的解析度與碼率。
LEZW技術是將EZW技術中的連續近似量化(SAQ)加以延伸應用之,而EZW傳統的做法是將SAQ應用於全部的小波轉換系數上。然而在LEZW技術中,從基層(Base Layer)開始SAQ一次僅用於一個 圖層(Layer)的編碼,直到最高階析度的圖層為止。當編碼的那一圖層碼率利用完時,即表示該圖層編碼完畢可以再往下一圖層編碼之。為了改善LEZW的效率,在較低圖層的SAQ結果應用於較高圖層的SAQ過程中,基於這種編碼的程序,LEZW演算法則可以在每一圖層平均碼率的限制下,重建出不同解析度的影像。因此,LEZW非常適合用於設計階層式影像傳送系統。
LEZW技術也可以應用於漸進式傳送,對於一個漸進式影像傳送系統而言,控制其解析度將可以改善重建影像的視覺品質。而常用的漸進式傳送方法有使用向量量化器或零元樹資料結構編碼演算法則。但是向量量化器需要較大的記憶體及對與傳送中的錯誤敏威,而利用EZW技術所設計的漸進式影像傳送系統,可以改善這些缺點,所以享有較好的效能。但是它也有缺點就是,應用於漸進式傳送時是根據全解析度來做編碼及傳送,因此在低碼率的限制之下時,若用全解析度來顯示影像將使得影像模糊不清。所以在低碼率傳送時的影像以較低的解析度來顯示時,則可以使影像的清晰度有所改善。
篇5
由於在現今資訊流通普遍的社會中,影像的需求量越來越大,影像的數位化是必然的趨勢。然而在數位化過的影像所占的資料量又相當龐大,在傳輸與處理上皆有所不便。將資料壓縮是最好的方法。如今有一新的模式,在壓縮率及還原度皆有不錯的表現,為其尚未有一標準的格式,故在應用上尚未普及。但在不久的未來,其潛力不可限量。而影像之於印刷有密不可分的關系。故以此篇文章介紹小波(WAVELET)轉換的歷史淵源。小波轉換的基礎原理。現今的發展對印刷業界的沖擊。影像壓縮的未來的發展。
壹、前言
由於科技日新月異,印刷已由傳統印刷走向數位印刷。在數位化的過程中,影像的資料一直有檔案過大的問題,占用記憶體過多,使資料在傳輸上、處理上都相當的費時,現今個人擁有TrueColor的視訊卡、24-bit的全彩印表機與掃描器已不再是天方夜譚了,而使用者對影像圖形的要求,不僅要色彩繁多、真實自然,更要搭配多媒體或動畫。但是相對的高畫質視覺享受,所要付出的代價是大量的儲存空間,使用者往往只能眼睜睜地看著體積龐大的圖檔占掉硬碟、磁帶和光碟片的空間;美麗的圖檔在親朋好友之間互通有無,是天經地義的事,但是用網路傳個640X480TrueColor圖形得花3分多鐘,常使人哈欠連連,大家不禁心生疑慮,難道圖檔不能壓縮得更小些嗎?如此報業在傳版時也可更快速。所以一種好的壓縮格式是不可或缺的,可以使影像所占的記憶體更小、更容易處理。但是目前市場上所用的壓縮模式,在壓縮的比率上并不理想,失去壓縮的意義。不然就是壓縮比例過大而造成影像失真,即使數學家與資訊理論學者日以繼夜,卯盡全力地為lossless編碼法找出更快速、更精彩的演算法,都無可避免一個尷尬的事實:壓縮率還是不夠好。再說用來印刷的話就造成影像模糊不清,或是影像出現鋸齒狀的現象。皆會造成印刷輸出的問題。影像壓縮技術是否真的窮途末路?請相信人類解決難題的潛力是無限的。既然舊有編碼法不夠管用,山不轉路轉,科學家便將注意力移轉到WAVELET轉換法,結果不但發現了滿意的解答,還開拓出一條光明的坦途。小波分析是近幾年來才發展出來的數學理論。小波分析,無論是作為數學理論的連續小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發展,他保留了傅氏理論的優點,又能克服其不足之處。可達到完全不失真,壓縮的比率也令人可以接受。由於其數學理論早在1960年代中葉就有人提出了,而到現在才有人將其應用於實際上,其理論仍有相當大的發展空間,而其實際運用也屬剛起步,其後續發展可說是不可限量。故研究的動機便由此而生。
貳、WAVELET的歷史起源
WAVELET源起於JosephFourier的熱力學公式。傅利葉方程式在十九世紀初期由JosephFourier(1768-1830)所提出,為現代信號分析奠定了基礎。在十九到二十世紀的基礎數學研究領域也占了極重要的地位。Fourier提出了任一方程式,甚至是畫出不連續圖形的方程式,都可以有一單純的分析式來表示。小波分析是近幾年來才發展出來的數學理論為傅利葉方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波規范正交基。其後1984年,法國地球物理學J.Morlet在分析地震波的局部性質時,發現傳統的傅利葉轉換,難以達到其要求,因此引進小波概念於信號分析中,對信號進行分解。隨後理論物理學家A.Grossman對Morlet的這種信號根據一個確定函數的伸縮,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展開的可行性進行了研究,為小波分析的形成開了先河。
1986年,Y.Meyer建構出具有一定衰減性的光滑函數Ψj,k(x),其二進制伸縮與平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}構成L2(R)的規范正交基。1987年,Mallat巧妙的將多分辨分析的思想引入到小波分析中,建構了小波函數的構造及信號按小波轉換的分解及重構。1988年Daubechies建構了具有正交性(Orthonormal)及緊支集(CompactlySupported);及只有在一有限區域中是非零的小波,如此,小波分析的系統理論得到了初步建立。
三、WAVELET影像壓縮簡介及基礎理論介紹
一、WAVELET的壓縮概念
WAVELET架在三個主要的基礎理論之上,分別是階層式邊碼(pyramidcoding)、濾波器組理論(filterbanktheory)、以及次旁帶編碼(subbandcoding),可以說wavelettransform統合了此三項技術。小波轉換能將各種交織在一起的不同頻率組成的信號,分解成不相同頻率的信號,因此能有效的應用於編碼、解碼、檢測邊緣、壓縮數據,及將非線性問題線性化。良好的分析局部的時間區域與頻率區域的信號,彌補傅利葉轉換中的缺失,也因此小波轉換被譽為數學顯微鏡。
WAVELET并不會保留所有的原始資料,而是選擇性的保留了必要的部份,以便經由數學公式推算出其原始資料,可能不是非常完整,但是可以非常接近原始資料。至於影像中什度要保留,什麼要舍棄,端看能量的大小儲存(跟波長與頻率有關)。以較少的資料代替原來的資料,達到壓縮資料的目的,這種經由取舍資料而達到壓縮目地的作法,是近代數位影像編碼技術的一項突破。即是WAVELET的概念引入編碼技術中。
WAVELET轉換在數位影像轉換技術上算是新秀,然而在太空科技早已行之有年,像探測衛星和哈柏望遠鏡傳輸影像回地球,和醫學上的光纖影像,早就開始用WAVELET的原理壓縮/還原影像資料,而且有壓縮率極佳與原影重現的效果。
以往lossless的編碼法只著重壓縮演算法的表現,將數位化的影像資料一絲不漏的送去壓縮,所以還原回來的資料和原始資料分毫無差,但是此種壓縮法的壓縮率不佳。將數位化的影像資料轉換成利於編碼的資料型態,控制解碼後影像的品質,選擇適當的編碼法,而且還在擷取圖形資料時,先幫資料「減肥。如此才是WAVELET編碼法主要的觀念。
二、影像壓縮過程
原始圖形資料色彩模式轉換DCT轉換量化器編碼器編碼結束
三、編碼的基本要素有三點
(一)一種壓縮/還原的轉換可表現在影像上的。
(二)其轉換的系數是可以量化的。
(三)其量化的系數是可以用函數編碼的。
四、現有WAVELET影像壓縮工具主要的部份
(一)WaveletTransform(WAVELET轉換):將圖形均衡的分割成任何大小,最少壓縮二分之一。
(二)Filters(濾鏡):這部份包含WaveletTransform,和一些著名的壓縮方法。
(三)Quantizers(量化器):包含兩種格式的量化,一種是平均量化,一種是內插量化,對編碼的架構有一定的影響。
(四)EntropyCoding(熵編碼器):有兩種格式,一種是使其減少,一種為內插。
(五)ArithmeticCoder(數學公式):這是建立在AlistairMoffat''''slineartimecodinghistogram的基礎上。
(六)BitAllocation(資料分布):這個過程是用整除法有效率的分配任何一種量化。
肆、WAVELET影像壓縮未來的發展趨勢
一、在其結構上加強完備性。
二、修改程式,使其可以處理不同模式比率的影像。
三、支援更多的色彩。可以處理RGB的色彩,像是YIQ、HUV的色彩定義都可以分別的處理。
四、加強運算的能力,使其可支援更多的影像格式。
五、使用WAVELET轉換藉由消除高頻率資料增加速率。
六、增加多種的WAVELET。如:離散、零元樹等。
七、修改其數學編碼器,使資料能在數學公式和電腦的位元之間轉換。
八、增加8X8格的DCT模式,使其能做JPEG的壓縮。
九、增加8X8格的DCT模式,使其能重疊。
十、增加trelliscoding。
十一、增加零元樹。
現今已有由中研院委托國內學術單位研究,也有不少的研究所的碩士。國外更是如火如荼的展開研究。相信實際應用於實務上的日子指日可待。
伍、影像壓縮研究的方向
1.輸入裝置如何捕捉真實的影像而將其數位化。
2.如何將數位化的影像資料轉換成利於編碼的資料型態。
3.如何控制解碼影像的品質。
4.如何選擇適當的編碼法。
5.人的視覺系統對影像的反應機制。
小波分析,無論是作為數學理論的連續小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發展,他保留了傅氏理論的優點,又能克服其不足之處。
陸、在印刷輸出的應用
WAVELET影像壓縮格式尚未成熟的情況下,作為印刷輸出還嫌太早。但是後續發展潛力無窮,尤其在網路出版方面,其利用價值更高,WAVELET的出現就猶如當時的JPEG出現,在影像的領域中掀起一股旋風,但是WAVELET卻有JPEG沒有的優點,JPEG乃是失真壓縮,且解碼後復原程度有限,能在網路應用,乃是由於電腦的解析度并不需要太高,就可辨識其圖形。而印刷所需的解析度卻需一定的程度。WAVELET雖然也是失真壓縮,但是解碼後卻可以還原資料到幾乎完整還原,如此的壓縮才有存在的價值。
有一點必須要提出的就是,并不是只要資料還原就可以用在印刷上,還需要有解讀其檔案的RIP,才能用於數位印刷上。等到WAVELET的應用成熟,再發展其適用的RIP,又是一段時間以後的事了。
在網路出版上已經有瀏覽器可以外掛讀取WAVELET檔案的軟體了,不過還是測試版,可是以後會在網路上大量使用,應該是未來的趨勢。對於網路出版應該是一陣不小的沖擊。
圖像壓縮的好處是在於資料傳輸快速,減少網路的使用費用,增加企業的利潤,由於傳版的時間減少,也使印刷品在當地印刷的可能性增高,減少運費,減少開支,提高時效性,創造新的商機。
柒、結論
WAVELET的理論并不是相當完備,但是據現有的研究報告顯現,到普及應用的階段,還有一段距離。但小波分析在信號處理、影像處理、量子物理及非線性科學領域上,均有其應用價值。國內已有正式論文研究此一壓縮模式。但有許多名詞尚未有正式的翻譯,各自有各自的翻譯,故研究起來倍感辛苦。但相信不久即會有正式的定名出現。這也顯示國內的研究速度,遠落在外國的後面,國外已成立不少相關的網站,國內僅有少數的相關論文。如此一來國內要使這種壓縮模式普及還有的等。正式使用於印刷業更是要相當時間。不過對於網路出版仍是有相當大的契機,國內仍是可以朝這一方面發展的。站在一個使用其成果的角度,印刷業界也許并不需要去了解其高深的數理理論。但是在運用上,為了要使用方便,和預估其發展趨勢,影像壓縮的基本概念卻不能沒有。本篇文章單純的介紹其中的一種影像壓縮模式,目的在為了使後進者有一參考的依據,也許在不久的將來此一模式會成為主流,到時才不會手足無措。
參考文獻:
1.GeoffDavis,1997,WaveletImageCompressionConstructionKit,。
2.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(上),峰資訊股份有限公司。
3.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(下),峰資訊股份有限公司。
4.施威銘研究室,1994,PC影像處理技術(二)圖檔壓縮續篇,旗標出版有限公司。
5.盧永成,民八十七年,使用小波轉換及其在影像與視訊編碼之應用,私立中原大學電機工程學系碩士學位論文。
篇6
關鍵詞:轉碼;實時;MPEG-2;H.264
中圖分類號:TP37 文獻標識碼:A 文章編號:1009-3044(2017)06-0219-04
1 概述
多種視頻壓縮標準的同時存在,導致視頻設備間急需解決兼容問題,而視頻轉碼是有效解決這種兼容問題的一種技術。H.264作為新一代的視頻壓縮標準,具有比其它視頻壓縮標準擁有更高的壓縮率。然而,當前保留的大多數視頻節目都是由 MPEG-2壓縮得到的,為了適應實際的需要,由 MPEG-2到 H.264的標清分辨率實時轉碼是很 有必要的。本文的研究工作就是圍繞標清實時轉碼技術展開的。
2 轉碼方案選取
在轉碼器中,編碼部分的耗時遠遠大于解碼部分。本論文研究的目的,是在盡可能少增加碼流和盡量少降低圖像質量的前提下,實現MPEG-2到H.264在D1分辨率(720x576)的實時轉碼。為此,需要從輸入的MPEG-2碼流中提取可復用參數并用于H.264 編碼端,以減輕編碼端的編碼時間。
MPEG-2 轉 H.264 轉碼器屬于不同標準間的轉碼。在其轉碼過程中,如果直接使用解碼端產生的運動矢量,將導致轉碼的運動估計不準、視頻質量下降等許多問題, 所以需要對運動矢量進行調整。文獻[2]使用mobile-calendar序列對CPDT轉碼結構和兩種DCT域轉碼結構做了測試。測試的結果是, 象素域級聯轉碼器轉碼后的圖像質量(以PSNR為標準)明顯高于DCT域轉碼。象素域級聯轉碼結構有著低復雜度和高靈活性等特點,并且有最好的PSNR效果,對錯誤偏移也有很好的抗誤碼性,非常適合作為MPEG-2轉H.264轉碼器的結構。因此,本文研究的轉碼器采用了運動矢量重估計的象素域級聯轉碼結構。
3 轉碼器的實現
轉碼器的輸入端是正確的 MPEG-2 碼流,輸出端是可包含 I、P、B 三種幀類型的 H.264 碼流,其中 B 幀以及 IDR 幀的頻率可由轉碼器參數設定。這里詳細討論三種幀類型轉碼的算法。
3.1 I幀轉碼的實現
本文研究的轉碼器針對D1分辨率視頻流,每幀分辨率為720x576,即每幀有1620個宏塊需要編碼。如果I幀中宏塊的幀內預測包含所有預測模式,將會有非常大的計算量,而且由于標準間較大的差異,轉碼器在幀內預測方面可復用信息非常少。為了達到比較高的轉碼速度,并且不影響圖像質量,本轉碼器采用了簡化幀內預測模式的方法:轉碼器在幀內預測部分只采用16x16幀內預測的4種模式,同時降低量化參數。這樣,每個幀內預測宏塊最多只需進行16次預測即可,遠遠小于選用全部幀內預測模式的592次。這種方法雖然使轉碼器中I幀的壓縮率少量下降,但是大大提高了I幀轉碼速度。I幀宏塊的轉碼流程如圖1所示。
3.2 P幀的轉碼
本文研究的D碼器其運動估計算法主要有以下幾個重點:
宏塊的模式選擇:由于MPEG-2和H.264中運動矢量的相關性,MPEG-2中得到的基于宏塊16x16的MV對于H.264中的7種幀間預測模式來說是比較準確的。如果只采用H.264的16x16,16x8,8x16,8x8四種分割方式進行預測,雖然會使預測更加準確從而減少10%的碼流,但是使運動估計部分的計算復雜度增加了4倍以上。本轉碼器對運算速度的要求很嚴格,所以為了提高轉碼速度,本轉碼器盡可能采用16x16模式對宏塊進行預測編碼。當16x16模式預測的塊其SAD超過閾值時,再進行8x8塊分割編碼。
亞像素搜索精度:一般來說編碼器在編碼每幀之前都要對當前幀做插值。H.264對亮度最高可達1/4像素,其半像素點需要通過復雜的6頭濾波,而1/4像素點由一對對角半像素點線性內插得出。其計算量很龐大。本轉碼器最高搜索精度使用半像素,從而在略微增加碼流大小的情況下大大減少了運動估計的時間。
半像素插值范圍:普通視頻編碼器在編碼P幀前需要對整幅圖像進行插值。本論文研究的轉碼器為了提高轉碼效率,避免了對所有塊都進行半像素插值。方法是:當整像素匹配塊的SAD小于某個閾值時,直接以該匹配塊為最佳匹配塊進行殘差編碼,而不在半像素域內進行搜索。這樣可以在對碼流影響不大的情況下,減少半像素6頭濾波的計算次數以及半像素域的運動搜索。
搜索窗口:轉碼器中輸入流包含的運動矢量和在全局范圍內重新搜索得到的最佳運動矢量比較接近,為了減少6頭插值濾波的次數和搜索范圍,同時考慮到MPEG-2解碼產生的指向半像素的運動矢量與H.264編碼的最佳運動矢量有差距,本文轉碼方案中運動矢量在復用前首先進行取整操作。在對坐標為(x,y)的宏塊做運動估計時,如果需要進行半像素域搜索,則僅搜索其上下左右四個半像素點,從中找出SAD最小的塊作為最佳匹配塊。
宏塊模式復用:在MPEG-2碼流中我們還可以得到宏塊模式。對于非幀間預測塊可以直接利用此信息,將此塊作為H.264中的幀內模式來處理。這樣就避免了此塊的模式選擇部分,節約了時間。
轉碼器的編碼端在進行P幀宏塊轉碼時,必須首先判斷出16x16宏塊的最佳參考塊位置。
每個P幀宏塊的轉碼流程為:
(1)判斷該塊是否為幀間預測塊,如果不是,則進行16x16幀內預測編碼;
(2)如果該塊屬于幀間預測,則讀取該塊在解碼中對應的運動矢量;
(3)如果該塊有兩個運動矢量,則分別對其進行(4)(5)步,并選取SAD小的運動矢量作為參考;
(4)根據解碼中對應的取整運動矢量從參考幀中找到參考塊,并計算參考塊亮度與當前塊亮度之間的SAD;
(5)判斷SAD值是否超過閾值,如果兩個運動矢量所指向的參考塊其SAD均超過閾值,則到(6),否則選取使得SAD小的運動矢量作為運動重估計的參考,并到(10);
(6)根據該塊周圍塊的運動矢量,計算該塊的PMV,并計算該PMV所指向參考塊與當前塊之間的SAD;
(7)選取使SAD最小的運動矢量作為運動重估計的參考;
(8)如果SAD大于閾值,計算參考塊色差U和V相對于當前塊的SAD是否都小于閾值。如果是則選取參考塊為最佳匹配塊并運行(10),否則運行(9);
(9)對參考塊周圍進行6頭濾波插值,并在參考塊頂點像素上、下、左、右、頂點5個點的范圍內搜素最佳匹配塊;
(10)根據最佳匹配塊和運動矢量判斷該塊是否屬于SKIP宏塊。如果是則按SKIP宏塊編碼,否則對該塊進行殘差編碼。
從P幀宏塊轉碼流程可以看到,本轉碼器采用的運動重估計無需對整幅圖像進行插值,并且計算過程中可大大減少半像素6頭濾波插值,從而提高轉碼器P幀轉碼的速度。
3.3 B幀的轉碼
P幀與B幀最大的區別在于,B幀編碼可以有三種預測方向:前向,后向和雙向。B幀預測方式如圖2所示。
3.3.1 MPEG-2中B幀的編碼
在MPEG-2標準中B幀不可以作為參考幀參與運動估計和運動補償,所以編碼器不存儲B幀的編碼重構圖像。根據運動矢量的不同,MPEG-2的B幀宏塊編碼可分為三類:
如果只有一個前向預測運動矢量,那么該B幀宏塊僅參考前一個I幀或者P幀。這種僅采用前向預測的B幀宏塊的壓縮方法與P幀中幀間預測宏塊的壓縮方法類似;
如果只有一個后向預測的運動矢量,那么該B幀宏塊參考的是后向的一個I幀或P幀,其預測方法與P幀的幀間預測原理相同,只不過預測方向相反;
當前向和后向運動矢量都存在時,說明該B幀宏塊需要做雙向預測。它需要從前后兩個I幀或P幀中做預測,其殘差塊為當前原始宏塊像素與前向、后向兩個預測塊的像素平均值的差。
MPEG-2中B幀的模式選擇樹形結構如圖3所示。
3.3.2 H.264中的B幀編碼
H.264中B幀的編碼原理和MPEG-2類似,不過其編碼方案有3個重要改進:
允許對B幀宏塊進行劃分,允許對其子塊進行運動估計和運動補償;
允許B幀在過去和將來有限的多幅參考幀中使用多個參考幀進行運動估計,參考幀的數量隨不同檔次而變;
允許B幀作為其它幀的參考幀。
圖4顯示了H.264中3種B幀編碼方式:一個前向和一個后向預測;兩個前向預測;兩個后向預測。
和MPEG-2相比H.264在B幀的模式中增加了一種DIRECT模式。這種模式與SKIP模式有些類似,其運動矢量不編碼,而是根據周圍宏塊的運動矢量進行預測得到的。不過它與SKIP模式最大的不同在于,SKIP模式的宏塊沒有像素殘差,而DIRECT模式有像素差。這樣在編碼過程中可以節省運動矢量的編碼位數,從而增大壓縮比。
在B幀中可以對宏塊進行4種分割,分別是16x16、16x8、8x16、8x8。不同的分割方式可以采用的預測模式也不盡相同。表1所示為B幀的宏塊預測選擇。
3.3.3 B幀轉碼的實現
B幀的轉碼和P幀轉碼相似,也需要對運動矢量進行調整。B幀預測在H.264中是非常消耗時間的,如果使用多參考幀,其計算量遠遠高于P幀編碼。為了使轉碼器在高速轉碼B幀的同時,盡量少影響碼流大小,設計合理的模式選擇算法非常重要。
本文研究的轉碼器其B幀宏塊模式選擇方法有以下幾個關鍵:
一般來說,輸入MPEG-2碼流中B幀的預測模式選擇是比較準確的,所以轉碼器對MPEG-2碼流中B幀宏塊的預測方向進行復用。如果編碼宏塊對應MPEG-2碼流中采用的是單向預測,則直接復用該預測模式。如果該宏塊采用的是雙向預測,則在H.264編碼時根據計算決定預測方式。這樣可以在碼流壓縮率基本不變的情況下,使預測模式的選擇時間減少到原來的三分之一;
H.264標準中的DIRECT模式支持16x16宏塊分割方式,并且使碼流壓縮率有明顯提高,所以本轉碼器在處理雙向預測塊的運動估計時,采用雙向預測和DIRECT預測模式,并從中選出最合適的模式進行宏塊殘差編碼。雖然和僅采用雙向預測相比增加了一種預測模式,從而增加了運動估計的運算,但是使得壓縮后B幀碼流比特率大大減少。
如果B幀宏塊在解碼端采用前向或后向預測,則H.264編碼端該宏塊采用和解碼時相同的預測模式進行編碼。當B幀宏塊解碼端采用雙向預測時,其模式選擇過程為:
取前向預測運動矢量,按前向預測方式找到最佳匹配塊,并計算SAD。如果SAD小于閾值,則按前向預測進行編碼,否則繼續進行預測模式的選擇;
取后向預測運動矢量,按后向預測方式找到最佳匹配塊,并計算SAD。如果SAD小于閾值,則按后向預測進行編碼,否則繼續進行預測模式的選擇;
進行DIRECT預測,找到最佳匹配塊,并計算SAD。如果小于閾值,則按DIRECT模式進行編碼,否則繼續進行預測模式的選擇;
進行雙向預測,并與DIRECT預測模式進行比較,選擇COST小的模式進行編碼。
B幀雙向預測塊轉碼流程如圖5所示。
4 測試結果
4.1不使用去方塊濾波器的轉碼效果
測試環境為PCIntel(R)Core(TM)2CPU2.0GHz,內存1G。在試驗中D1(720x576)測試碼流選用廣電提供的大話西游片段序列和Tank序列,幀數均為25fps,GOP均為15,碼流格式為IBBP。轉碼輸出端輸出格式同輸入碼流格式,幀數均為25fps。測試轉碼時測試200幀,量化參數選用QP=32,不使用去方塊濾波。
大話西游測試碼流屬于運動不是很劇烈的碼流。使用本轉碼器測試后,PSNR平均值35.3712,最低值33.8383,最高值39.0904。前4幀PSNR為:
PSNR (YCbCr Y Cb Cr): 37.6093 36.2018 43.9715 43.8465
PSNR (YCbCr Y Cb Cr): 35.3219 33.7641 44.1130 43.7948
PSNR (YCbCr Y Cb Cr): 35.1656 33.6160 43.7726 43.4904
PSNR (YCbCr Y Cb Cr): 35.3718 33.8730 43.0355 42.8159
轉碼后200幀的碼流大小共1.296kb,轉碼速度為平均每幀24.184ms。在實時要求的每幀40ms情況下,可以實現實時轉碼器。
Tank序列和上一個序列相比運動比較劇烈。測試得到PSNR平均值為33.3818,最低值31.2469,最高值37.0915。前4幀PSNR為:
PSNR (YCbCr Y Cb Cr): 34.4716 32.8147 45.2238 46.8538
PSNR (YCbCr Y Cb Cr): 31.8217 30.1360 43.4940 46.3854
PSNR (YCbCr Y Cb Cr): 32.0798 30.3967 43.7334 46.2518
PSNR (YCbCr Y Cb Cr): 33.2598 31.6105 43.2837 46.0296
轉碼后200幀的碼流大小共2.540kb,轉碼速度為平均每幀27.3ms。可以實現實時轉碼。雖然在劇烈的運動視頻進行轉碼時PSNR會有所下降,但是從視覺上感覺差異不大。
由實驗結果可見,在對運動不是很劇烈的碼流進行轉碼時,碼流壓縮率比較高,圖像質量比較好,轉碼速度很快,在對運動比較劇烈的碼流轉碼時,碼流壓縮率和圖像質量都有所下降,但是都在可以接受的范圍內。雖然轉碼速度也略有下降,但是還是能保證實時轉碼。
4.2使用去方塊濾波器的轉碼效果
測試時使用大話西游片段序列和Tank序列,同樣測試200幀,選用量化參數QP=32,轉碼時使用去方塊濾波器。
大話西游碼流平均轉碼速度為每幀29.61ms,其中V波耗時平均每幀5.43ms。PSNR平均值35.6615,最低值34.1878,最高值39.4467,前4幀的PSNR為:
PSNR (YCbCr Y Cb Cr): 37.5639 36.1336 44.2403 44.0461
PSNR (YCbCr Y Cb Cr): 35.4928 33.9397 44.2055 43.8518
PSNR (YCbCr Y Cb Cr): 35.3602 33.8116 43.9539 43.6541
PSNR (YCbCr Y Cb Cr): 35.5582 34.0564 43.3320 42.9935
該測試條件下的PSNR和不使用濾波器時測得的PSNR平均值35.3712,最低值33.8383,最高值39.0904相比,有明顯的提升,且塊效應有明顯的消除。碼流大小1,292kb,與不使用濾波時壓縮的1,296kb相比有少量下降。
Tank碼流平均轉碼速度為每幀35.199ms,其中濾波耗時平均每幀7.90ms。PSNR平均值33.5520,最低值31.4689,最高值37.2467,前4幀的PSNR為:
PSNR (YCbCr Y Cb Cr): 34.2591 32.5901 45.6571 47.0037
PSNR (YCbCr Y Cb Cr): 31.8855 30.1968 43.7478 46.5964
PSNR (YCbCr Y Cb Cr): 32.1336 30.4466 44.0063 46.5356
PSNR (YCbCr Y Cb Cr): 33.2226 31.5645 43.6591 46.2399
該測試條件下的PSNR和不使用去方塊濾波時PSNR平均值為33.3818,最低值31.2469,最高值37.0915相比,圖像質量有明顯提高。轉碼后碼流大小為2,512kb,比不使用濾波時的2,540kb有所下降。
由實驗結果可見,兩個碼流在轉碼器添加去方塊濾波功能的情況下,圖像質量有所提升,碼流大小略有下降,轉碼速度仍然達到了D1分辨率實時轉碼的目的。
5 結束語
本論文的研究目標是基于 PC 環境,在保證圖像質量少量損失的前提下實現 MPEG-2 到 H.264 的 D1 分辨率實時轉碼。當前,分辨率為 D1 電視格式的視頻編碼大多是通過 MPEG-2 壓縮的,而 H.264 由于其性能的卓越,注定會在當今與將來有更廣泛的應用,所以研究 MPEG-2 到 H.264 的轉碼是很必要的,有很強的現實意義與價值。
參考文獻:
[1] 畢厚杰.新一代視頻壓縮編碼標準H.264/AVC[M].北京:人民郵電出版社,2005:22-24.
[2] Werner N.Requantization for transcoding of MPEG-2 intraframes[J]. IEEE Trans image Process,1999,8(2):.
[3] Assuncao P, Ghanbari M. Buffer analysis and control in CBR video transcoding[J].IEEE Trans. Circuits Syst. Video Technol,2002(12): 1009-1020.
篇7
關鍵詞:嵌入式系統,802.11協議,無線視頻傳輸,樓宇智能化
1.引言
目前樓宇門禁裝置大多為一個簡單的可控電子開關,一般采取語音對話的有線控制方式,不具備可視化能力和無線控制能力,其存在交互效果差、有線網絡布線繁瑣、智能化程度不夠高的缺點。。隨著視頻編、解碼技術和無線傳輸技術的快速發展,智能化樓宇系統也得到了快速的發展。嵌入式無線網絡產品以其體積小、成本低、使用靈活方便等優點,得到了越來越廣泛的應用。隨著市場上智能化樓宇的不斷升溫, 門鈴系統已作為智能化辦公室和智能化小區的一個重要組成部分。
本研究介紹的智能小區無線可視化門鈴系統正是在這樣的應用前景下,基于802.11無線網絡協議進行設計的。
2.系統整體結構設計與工作原理
如圖1所示,該系統采用低功耗、高性能的嵌入式IDTRC32434 作為主控芯片,使用VW2010芯片進行硬實時編解碼以提高編解碼效率,采用PHILIPS公司的BGW200無線芯片進行音視頻碼流的轉發控制。整個系統由服務器端和客戶端兩部分組成,主要實現音頻視頻數據采集和高質量編解碼以及無線網絡傳輸功能。
服務器端工作原理
由CCD Sensor和音頻端口進來的輸入信號,經過視頻A/D和音頻A/D轉換后,進行MPEG4視頻編碼和MPEG MP3音頻編碼。編碼后的視音頻碼流送到網絡復用模塊打包后,將壓縮編碼后的數據流經過802.11x無線網絡送到客戶端。如下圖1所示:
系統客戶端工作原理
由無線網絡接收的音視頻碼流數據,經過網絡解復用模塊解復用后,獲得的視頻碼流和音頻碼流分別送至視頻解碼模塊和音頻解碼模塊進行MPEG4
視頻解碼和MP3音頻解碼。解碼后的數據經過視頻模擬編碼、D/A和音頻D/A轉換后送到可視終端顯示。如下圖2所示:
3.硬件設計
系統的硬件設計主要分四個部分:主控制系統、音視頻采集系統、多媒體編解碼系統、無線網絡系統。。
3.1 主控芯片采用IDT RC32434
它是一款64位MIPS,內部集成了NAND Flash控制器(FlashC)、32位PCI總線控制器(PCIC)、4通道DMA控制器、4通道SDRAM控制器(SDRAMC)、外部總線控制器 (EBUSC)、外部總線接口(E―BUSI)以及2個通用串口等,并通過內部總線對它們分別進行控制。該芯片提供高達400MHz的頻率,集成了標準外圍元件互連(PCI)接口,可與802.11a/b/g和串行Ⅵ、等先進外圍設備連接。處理速度快,功能強,性價比高,能很好滿足嵌入式ucLinux系統的需求。
3.2 CCD 攝像頭和A/D 轉換芯片
SAA 7110 是Philip s 公司生產的可編程前端視頻解碼器,它可將輸入的視頻模擬信號轉換為YUV 數字信號。其內部包含三路模擬處理通道, 能實現視頻源的選擇, 數據輸出格式有YUV4: 1: 1 (8bit) 和YUV 4: 2: 2 (8bit) 兩種。它還包括抗混疊濾波,A/D 轉換, 自動嵌位, 自動增益控制, 時鐘產生, 多制式解碼及亮度、對比度和飽和度的控制等功能。
3.3多媒體編解碼芯片
該系統采用VW2010作為多媒體編解碼芯片,它是一種實時MPEG-4音視頻壓縮/解壓芯片。其片內集成有3個信號處理/控制單元,包括一個視頻編碼(壓縮)器、一個視頻解碼(解壓)器和一個片內CPU(內部擴展一個音頻編碼DSP、一個音頻解碼DSP、一個多路復合單元和一個多路解復合單元)。具有可編程、高性能和低功耗特點,因為每個信號處理/控制單元都由一個RISC處理器和專用的硬件加速器構成。
3.4802. 11b 芯片
無線模塊采用的芯片是PHILIPS公司的BGW200,該芯片通過高速串口SPI2與處理器的SPI1口連接。SPI(SerialPeripheral Interface,串行外設接口)是一種同步外設接口,允許MCU與各種外圍設備以串行方式進行通信、數據交換。當IDT RC32434與BGW200之間互相通信時只能通過BGW200的SPI2口進行,此時IDT RC32434是主(HOST),BGW200是從機(SLAVE),傳輸的時鐘由HOST控制。
4.軟件設計
本系統軟件設計按層次劃分主要分為三層:系統初始化引導和嵌入式系統內核移植、外設驅動程序編寫(包括USB攝像頭驅動、無線網絡模塊驅動等)、數據采集與無線傳輸。
4.1 系統引導、內核移植和文件系統的建立
雖然Linux 內核小、效率高,但嵌入式系統的硬件資源畢竟有限,因此不能直接把Linux作為操作系統,要針對具體的應用通過配置內核、裁減shell和嵌入式C庫對系統進行定制,使整個系統能夠存放到容量較小的Flash中。嵌入式Linux系統主要由4 個部分組成:引導內核啟動的文件(bootloader)、Linux內核文件(kernel)、虛擬磁盤文件(ramdisk)、用戶空間文件(user)。把它們分別放在DataFlash內的4個分區模塊中。對于不需要動態改變,使用較節省空間的ROMFS只讀文件系統;user模塊內需要進行較多的讀寫操作,所以使用支持動態擦寫保存的JFFS2文件系統。在構建完軟件平臺后,下面就主要涉及到USB攝像頭驅動和無線驅動模塊設計、視頻采集模塊和基于802.11無線網絡傳輸模塊的程序設計。
4.2 USB攝像頭驅動
搭建好嵌入式Linux的開發環境后,下一步就首要完成USB攝像頭驅動工作。。Video4Linux(V4L)是Linux中關于視頻設備的內核驅動,它為針對視頻設備的應用程序編程提供一系列接口函數。對于USB口攝像頭,其驅動程序中提供了基本的I/O操作接口函數open,read,write,close的實現。當應用程序對設備文件進行系統調用操作時,Linux內核將通過file-operations結構訪問驅動程序提供的函數。在編譯時選取動態加載模式,確定USB攝像頭被正常驅動后,下一步就是使用Video4Linux提供的API函數集來編寫視頻采集程序。
4.3 音視頻數據采集
在完成USB攝像頭驅動后,就可以針對設備文件/dev/video進行視頻捕捉方面的程序設計。其中用到的主要函數有:Camera open():用來開啟視頻設備文件;Camera get capability():取得設備文件的相關信息;Cameraget picture():獲取圖像的相關信息
Cameraclose():用來關閉設備文件;Camera grab image():用來抓取圖像,采用mmap方式,直接將設備文件/dev/ video0映射到內存,加速文件I/O操作,還可以使多個線程共享數據。如圖3.
圖3
4.4音視頻壓縮編解碼
獲取圖像數據后,可以直接輸出到FrameBuffer進行顯示,由于本系統要將采集到的音視頻通過無線網絡傳輸出去,所以在傳輸之前要對原始的圖像數據進行壓縮編碼,在此選用VW2010芯片來實現MPEG- 4視頻編解碼方案。和其他標準相比,MPEG-4壓縮比更高,節省存儲空間,圖像質量更好,特別適合在低帶寬條件下傳輸視頻,并能保持圖像的質量。對視頻流進行壓縮編碼以后,接下來就要實現網絡傳輸部分的功能。
4.5無線網絡模塊驅動
無線驅動模塊的軟件架構分為三部分:客戶驅動(client driver)、主機硬件抽象層(HHAL)、主機操作系統抽象層(HOSAL)。設備驅動程序本質上來說就是一組相關函數的集合。它利用結構體file_operations與文件系統聯系起來,內核使用該結構體訪問驅動程序的函數,該數據結構定義再<linux/fs.h>頭文件中。在這個數據類型中,每一個成員變量指向驅動程序定操作的函數,對于沒有的操作函數,相應的成員函數可以設置位NULL。
設備驅動程序通常包含下面3個最主要的部分:(1)驅動程序的注冊和注銷;(2)設備的打開和釋放;(3)設備的讀寫操作。
對于需要動態加載的模塊,通過執行Makefile文件,在當前目錄會生成目標文件wireless.o。將目標文件wireless.o下載到已經燒寫好的文件系統中。當目標板重新啟動后,運行命令:insmod wireless.o 即可將無線驅動模塊鏈接到內核中。一旦驅動程序被注冊到內核表中,對驅動程序的操作就和它的主設備號對應起來了。當應用程序對設備文件進行某種操作時,內核會從file_operations結構中找到并去調用正確的函數。卸載模塊可輸入下面的命令:rmmodwireless.o。
4.6無線網絡傳輸控制過程
(1) 初始化
系統初始化包括對SAA 7110、VW2010、RC32434、BGW20 等芯片的初始化。初始化過程主要包括對一些數據寄存器、地址寄存器、中斷服務寄存器等進行相應的操作以形成系統運行環境的初始狀態。
(2) 傳輸控制策略
上電開始初始化程序后,服務器端USB攝像頭的模擬視頻信號在程序控制下通過SAA7110 視頻解碼芯片完成模數轉換,接著mpeg4 編碼芯片VW2010將接收的數字圖像信號進行DCT變換、量化編碼、熵編碼后,把數據流輸出到相應的SDRAM內部的FIFO中。RC32434MCU在FIFO中查找幀同步標志,如果找到,判斷緩沖區內是否有一幀的數據,如果有則微處理器讀出壓縮數據流并發送到BGW20進行擴頻、調制發射出去。客戶端初始化過程與服務器端類似,在系統初始化完畢后通過與服務器端交互,建立網絡連接,并將SDRAM 用作硬解碼時的數據緩沖區,采用LCD 接口連液晶屏用來顯示圖像。整個系統中,由RC32434完成對各器件的初始化、協調整個系統的工作。
5.結論
系統采用64位MIPS芯片IDT RC32434作為主控制器,以VW2010作為MPEG-4編、解碼芯片實現網絡端口輸入和輸出的MPEG-4碼流、采用BGW200無線模塊進行音視頻數據傳輸,在uclinux平臺上結合先進的多媒體無線傳輸技術實現的,結果表明其具有較高的傳輸效率、和普遍的門禁設備相比,本系統具有更好的靈活性與擴展性、交互能力、控制能力更強。而且該無線音視頻傳輸技術也可廣泛用于IP電視、衛星電視、安防系統、智能樓宇系統和基于MPEG-4標準的數字電視廣播系統中,應用前景十分廣闊。
參考文獻
[1] 杜春雷編著,《ARM 體系結構與編程》, 清華大學出版社,2003.
[2]Philips Semi conductor,《SAA 7110 Enhanced Video Input Processor (EVIP) Data Sheet》, May 1998.
[3] 魏永明、駱剛等譯,《Linux 設備驅動程序》第二版, 中國電力出版社, 2002.
[4] 廣州周立功單片機發展有限公司. P89LPC932A1 FLASH單片機使用指南.
[5]Thomson, J. An integrated 802.11a baseband and MAC processor. Solid-State Circuits Conference,ISSCC,2002(1):12~21
篇8
【關鍵詞】數模結合;收費公路;監控聯網;方案
0 概述
甘肅省省公路管理局作為甘肅省公路系統的主管部門,管轄13個公路總段和1個公路分局。各公路總段和公路分局分管各自轄區內的二級公路收費所,每個收費所又分管有1至3個收費站。目前,各個收費站監控系統只停留在其上級單位――收費所中。監控視頻和音頻未能進一步傳輸至公路總段,更未能上傳至省省公路管理局。因此,省公路管理局和各公路總段對所轄收費所的管理及各收費站車流量情況的監控都無法達到可視化的效果,不能及時給公路總段和省公路管理局的相關領導提供交通一線的決策信息。隨著信息技術的發展,省公路管理局根據自身現象,提出將監控信號、IP視頻傳輸、中心(分控中心)顯示、點播、存儲、大屏幕顯示系統有效的結合為一個整體,構建一個優質的基于網絡平臺的數字視頻管理系統,從而實現全省二級公路聯網監控。
1 方案目標
省公路管理局此次建設智能視頻監控系統,實現對整個二級公路收費站的實時視頻監控、圖像存儲、歷史圖像查詢、云臺操作控制;實現監控網絡和監控內容的廣度覆蓋,監控網絡應全面覆蓋重點地區,監控內容應適應二級公路收費系統視頻監控業務的需求;實現監控信息反饋的快速反應,確保信息的快速、高效和安全流動。具體建設目標:建成省級二級路收費站監控網絡,建成省級主控室和中心機房,建設智能視頻監控管理平臺。
2 系統功能
根據各收費所監控系統的實際情況,經過綜合分析,要實行聯網監控,最好的方案是監控數據逐級匯總,最終傳輸至省公路管理局,省公路管理局可隨時根據需要點播對應收費站的相關視頻,并進行監聽。我們可以將系統歸納為監控資源、傳輸網絡、監控中心、視頻管理平臺四個部分。
(1)監控資源是監控信息的起始點,包括圖像信息、音頻信息、報警信息甚至還包括區域監控系統。在本案中監控資源指收費站視頻監控攝像機。
(2)傳輸網絡是監控信息的傳輸通道。傳輸網絡可分為模擬和數字兩種。本方案的傳輸網絡為IP傳輸網,采用光纖線路(租用或敷設)和租用運營商MSTP(10M)線路兩種方式來實現聯網。
(3)監控中心是各種監控資源的處理和響應中心。同時包含查看監控資源、大屏幕電視墻圖像顯示、音視頻錄相及各種終端設備的控制及管理。本方案中包括三級監控中心,第一級為省公路管理局監控中心、第二級為公路總段監控中心、第三級為收費所監控中心。收費所監控中心為監控資源的匯聚中心,也是目前全省各收費的已建成的比較完整的監控中心,都具備相對獨立、完整的CATV監控系統。
(4)視頻管理平臺是整個系統的調度、管理核心,負責系統內各種監控資源信息的調配和記錄、用戶的管理、設備的管理工作。同時負責與第三方系統接口工作等。
3 數模結合技術下的整體設計框架
視頻編碼器和解碼器應用到模擬監控系統中,將傳統的模擬視頻信號轉換為數字信號,通過計算機網絡來傳輸,這就實現了視頻/音頻的數字化、系統的網絡化、應用的多媒體化和管理的智能化。ivsIP智能監控解決方案,通過視頻管理平臺實現圖像信息的調配、存儲、回放以及用戶、設備的管理,實現了整個系統的智能化。總體設計如圖1所示:
圖1 系統總體設計圖
IVSIP智能解決方案:最底層的監控資源在經過監控接入層的編碼器編碼后,通過媒體交換層的IP承載網,將監控音、視頻信息傳送至控制管理層和視頻應用層。不同于傳統的監控模式,監控視頻流和音頻流以IP數據包的形式在網絡中傳輸。因此,可以很方便地通過媒體交換服務器MS、視頻管理服務器VM和DC解碼器對監控音、視頻資源進行統一管理。還可以很方便地應用IP SAN技術,對音、視頻數據進行集中存儲和備份。另外,通過開發相應視頻應用程序,可以更深層次的應用音、視頻監控信息。如圖2所示。
圖2 iVS IP智能監控解決方案示意圖
3.1 視頻編、解碼器
編解碼器支持H.264、MPEG2、MPEG4、MJPEG等多種標準編碼格式,提供從單路到16路各種密度的規格,支持實時流和存儲流雙流設計,支持高至8Mbps的高清碼流或低至128Kbps的標清碼流并且可以根據用戶需求任意調整,采用電信級制造工藝,可以基于各種網絡環境高質量、可靠的滿足各類網絡監控前端編碼、存儲和解碼的需求。
3.2 網絡視頻存儲系統
專業的IP存儲技術和強大的數據管理服務器構建完善的網絡存儲系統,存儲資源可以根據需求分布式部屬并加以統一資源管理和調度,支持動態存儲資源管理、在線部屬,可以基于統一平臺滿足不同存儲質量、容量和服務質量的客戶需求,可以提供完善的備份和存儲生命周期管理功能,同時支持NAS備份功能。
3.3 系統管理平臺
包括專用的視頻管理服務器、數據管理服務器、客戶端和流媒體服務器,視頻管理服務器是用于集中認證、注冊、配置、控制、報警轉發控制的專用信令服務器,可以實現完善的視頻編解碼設備網絡管理功能,支持多臺信令管理服務器相互協同工作組建多級多域的管理平臺。數據管理服務器主要功能為管理存儲設備、存儲資源和視頻數據,支持對系統所有存儲資源進行全方位的監控和管理,支持不間斷的視頻檢索、回放等業務。客戶端可以提供友好方便的人機界面功能,包括監控對象的實時監視監聽、查詢、云臺控制、接警處理,并集成了基本的GIS功能方便用戶操作。
3.4 承載網絡系統
采用充分組播優化的系列交換機對前端視頻編碼器傳輸的數據進行接入、匯聚、交換。通過設備自身安全特性和防火墻等實現對邊界安全接入的控制。同時可通過網絡本身的設備、協議冗余實現整個監控網絡的穩定性。
篇9
關鍵詞:SC2262;SC2272;智能手機;無線尋呼
靜脈輸液是目前疾病治療的主要手段。然而因我國人口眾多,醫療資源不充足,經常出現醫院病床緊張的情況,因此,醫院設立了輸液大廳,類似于門診治輸液方式,其存在患者眾多,人員流動性大,醫護人員分配少的特點。輸液人數眾多護士工作強度大,無法定期查看患者輸液進行狀況。患者一但輸液結束,沒有及時換藥或撥針將出現血液回流等不良狀況,必然會增加醫療事故發生的概率。針對上述現狀,為了緩解護士的工作壓力,為患者提供可靠優質的治療服務,國內外部分廠家相繼研制了有線尋呼系統,因其存在布線施工復雜、成本高、維護難的不足,已不能很好的用于輸液大廳這種場合[1]。基于上述背景,本文順應物聯網理念的發展潮流,本著低成本,高可靠性、穩定性的原則,將WIFI技術、無線射頻技術、智能手機技術相結合,設計了一款低成本、移動性好、多種模式無線主機接收,可靈活組網進行無線擴展的輸液無線尋呼系統。
1 系統總體結構設計
系統總體框圖如圖1所示,由呼叫終端、接收主機、護士站PC機及智能手機終端構成。在實際使用中,呼叫終端由病人手持或安放在輸液椅子邊上,(注意:椅子的編號與呼收終端地址相對應)。當輸液結束時,病人按下呼叫終端上的按鍵,通過無線射頻發射呼叫信息幀到接收主機,接收主機收到有效信息后通過WIFI模塊以WIFI網絡通信技術,轉發到護士站的PC機進行語音報號,同時還可轉發到護士的智能手機上。接收主機也可以通過無線路由擴大網絡覆蓋范圍。
2 硬件設計
2.1 呼叫終端模塊
呼叫終端分別由射頻發射模塊、電源電路、編碼電路組成。射頻發射模塊選用XY-FST射頻發射模塊。編碼電路選取SC2262,通過查閱其用戶手冊中的引腳定義[2],設計的終端模塊電路如圖2所示,R6用于調節編碼振蕩器的頻率;SC2262的第17為串行輸出發送引腳,與射頻模塊的數據引腳相接。10、11、12、13為數據編碼,可設為0或1;1---8為三態地址引腳,設置時必須與主機的解碼接收模塊SC2272相同。其中J11、J12在設計PCB時做編碼狀態設置跳線,以便于對不同模塊對應的輸液座位進行對應編號設置。其工作流程是:當按鍵S4沒有按下時,模塊不通電,所以不耗電,為電池供電提供了較好的可能性。當按鍵按下時模塊得電立即傳送已設好的編碼數據。
2.2 接收主機模塊
2.2.1 超外差接收射頻模塊
超外差接收射頻模塊由解碼模塊與XY-FST射頻接收模塊構成。接收終端的呼叫號碼,通過SC2272解碼后,將結果輸出單片機的P10~P13口線。通過查閱SC2272的用戶手冊可知[3],接在15、16腳間的電阻值選取很關鍵,要與SC2262的對應。同時其地址也要與2262設置相同。正確解碼后17腳會輸出由0到1的脈沖信號,將其連接到單片機的P14口線用于通知單片機讀取數據。
2.2.2 處理器模塊及WIFI模塊
處理器模塊的主要任務是通過I/O口讀取SC2272接收到的終端呼叫號,然后通過串口控制WIFI模塊,將數據上傳到WIFI網絡,WIFI終端接收。因處理器不需要做復雜運算處理,因此選用成本較低,通用性好的AT89S51單片機來實現。
為了降低開發的難度,縮短開發的周期,近而降低開發成本,綜合考慮成本高低、技術支持是否良好等多方面的因素,最終選用了濟南有人物聯網技術有限公司的串口轉WIFI模塊USR-WIFI232。USR-WIFI232系列產品具有超小體積、支持無線工作在STA/AP/AP+STA/WDS(WDS即無線漫由功能)模式等特點,能夠使本文設計的尋呼系統便于實現靈活的組網模式,組成一個覆蓋范圍較廣的WIFI網絡,進而提高了系統的通用性。模塊的接口定義及管腳說明詳見參考文獻[4]。
3 軟件設計
3.1 接收主機軟件設計
單片機上電后,首先完成串口初始化,接著進入主循環,通過P14口線不斷檢測解碼模塊SC2272的第17腳是否有0到1的信號跳變,以確定是否有終端呼叫。如果有就讀取呼叫值,然后按特定的數據幀格式通過串口發送到WIFI模塊,WIFI模塊不對數據做任何處理直接傳輸到整個WIFI網絡,供護士站PC主機接收和安卓智能手機接收。
3.2 護士站PC軟件設計
基于VB6.0平臺開發的顯示界面如圖3所示,包括當前呼叫號碼顯示區域,網絡連接設置與狀態顯示區及語音調節區域。對于網絡的連接編程選用WinSock控件能通過TCP協議(數據傳輸協議)連接到接收主機的WIFI網絡。同步號碼語音播報是通過在VB環境中添加Win32 speech API中的對象庫來完成。可根據PC操作系統中已安裝的語音庫設為中英文男女音四種模式。
4 結論與討論
本系統整體調試通過,調試顯示如圖3所示。經過多次測試,本系統能夠很好的實現對終端呼叫信號的接收、顯示、播報及轉發。接收范圍也能滿足應用要求。本方法設計的系統克服了有線系統的缺陷,具有成本低、移動性好、多種模式無線主機接收,可靈活組網進行無線擴展的優勢。
[參考文獻]
[1]于沛.基于無線傳感器網絡輸液監測系統設計[D].碩士論文,黑龍江大學,2012,1-5.
[2]拓迪電子有限公司.SC2262數據手冊.佛山市拓迪電子有限公司,2010,1-30.
[3]拓迪電子有限公司.SC2272數據手冊.佛山市拓迪電子有限公司,2010,1-28.
[4]有人科技有限公司.USR-WIFI232芯片技術手冊.濟南有人科技有限公司,2012,1-26.
篇10
【關鍵詞】智能家居 GSM模塊 單片機
隨著網絡技術的發展,網絡化智能家居系統可提供遙控、家電控制、照明控制、窗簾自控、防盜報警、可編程定時控制及計算機控制等多種功能和手段,使生活更加舒適、安全和便利。本文設計的基于GSM網絡的智能家居監控系統由智能監控模塊、數據采集系統和用戶手機構成,通過GSM短信息的收發實現對家庭設備的遠程監控。
1 總體設計方案
系統由中心控制模塊和各分散控制模塊組成。中心控制模塊實現控制用戶手機和各分散控制功能模塊。選用AT89S52單片機作為該監控系統的核心控制元件。主控單片機模塊接收用戶手機發送的短信息,根據短消息的內容控制各子功能模塊;同時主控單片機模塊將家居系統的控制信息以短信形式發送到用戶手機,由單片機構成各控制模塊子系統。
1.1 系統硬件部分
根據任務需要,合理選擇單片機、傳感器、GSM模塊和設備來構成系統。為使硬件設計盡可能合理,系統的電路設計遵循了以下幾個方面:
(1)選擇標準化、模塊化的典型電路,提高設計的成功率和結構的靈活性。
(2)選用功能強、集成度高的電路或芯片。
(3)選擇通用性強、市場貨源充足的元器件。
(4)在對硬件系統總體結構考慮時,考慮通用性的問題,采用模塊化的設計方式。
(5)系統的擴展及各功能模塊的設計應適當留有余地,以備將來修改、擴展之需。
(6)在電路設計時,充分考慮應用系統各部分的驅動能力
最終確定采用AT89S52單片機作為處理芯片。西門子的TC35系列的TC35iGSM模塊,TC35i與GSM2/2+兼容、雙頻(GSM900/GSMl800)、RS232數據口、符合ETSI標準GSM0707和GSM0705,且易于升級為GPRS模塊。該模塊集射頻電路和基帶于一體,向用戶提供標準的AT命令接口,為數據、語音、短消息和傳真提供快速、可靠安全的傳輸,方便用戶的應用開發與設計。
1.2 系統軟件部分
軟件部分由以下幾部分構成:數據采集單元、手機短信信令識別與分析單元、GSM模塊TC35 modem接口程序部分、分析控制部分。其中數據采集部分和手機短信信令識別需要作實時處理;GSM模塊TC35 modem接口程序部分和分析控制部分則是根據采集和手機短信信令進行分時操作有利于提高系統效率。
2 系統軟件設計
軟件設計部分主要有數據采集部分、手機短信信令識別、TC35Modem接口程序部分、分析控制部分。其中數據采集部分和手機短信信令識別需要作實時處理;GSM模塊TC35Modem接口程序部分和分析控制部分則是根據采集和手機短信信令進行分時操作有利于提高系統效率。本智能家居監控系統軟件設計的內容主要有主控模塊程序、TC35Modem模塊通信程序、串口通信初始化程序和短消息的編碼解碼程序。軟件設計模塊如圖1所示。
2.1 單片機系統軟件設計
為了實現單片機與TC35I模塊的通信順暢,必須使二者的串口波特率一致,如果單片機F=11.0590MHZ,設置串行口波特率為9600,工作方式為方式3,Tl定時器采用工作方式2。其中串行口和定時器的工作方式和初值可以根據具體情況加以更改。
本系統的軟件設計是將整個短信處理模塊放入單片機的中斷服務子程序中。發送和接收串行口數據采用中斷方式進行,這樣可以大大節省CPU資源。當接收一幀數據進入一位寄存器,送入接收SBUF中,同時將Rl置1;當發送數據載入發送SBUF中開始向外發送,發送完畢后即將TI置1。無論Rl置1還是TI置1,均會激發串口中斷,執行中斷服務程序。響應中斷時,首先判斷中斷是接收程序還是發送程序,若為接收中斷則將SBUF中的數據存入接收隊列緩沖區;若為發送中斷便將待發送的數據幀發送到SBUF中。
2.2 短消息PDU模式編碼解碼程序
在GSM標準中,中文編碼采用UTF-8的編碼,不是目前國內常用的GB-2312編碼,因此需要對中文編碼進行轉換才能與采用GB-2312漢字庫相配合,方可正確顯示出短消息中漢字字型。由于UTF-8和GB-2312編碼之間不存在一一對應的線性關系,因此需要采用查表的方式進行轉換。
2.3 短消息收發程序設計
發送短信息的主要工作是將發送的內容進行相應的編碼,其次就是將發送所用的SMS服務中心號碼、目標號、有效時間和短信內容按照PDU編碼的格式發送出去。如果是接收短信息,其工作就是將接受到的短信息內容進行解碼,發送和接收的PDU串的結構是不同的。接收程序流程圖如圖2所示。
3 運行結果
運行結果如圖3所示。
4 結論
本文設計了一個基于GSM網絡的無線傳感智能家居監控系統。系統在運行中還有改進之處,還需進一步對程序結構進行優化。本設計只是智能家居控制中的一部分,目前國內很多公司都在致力于智能家居產品的開發,隨著相關技術的進一步發展,我國將全面普及智能家庭網絡系統和產品。
參考文獻
[1]黃欣榮.基于GSM短信模塊的家庭防盜報警系統的設計[J].中國新通信,2010(06),19-22.
[2]曾志永,凌振寶,王君.基于GSM技術的智能家居系統的設計[J].電子技術應用,2005(10),33-35.
[3]齊趙毅,陳杰浩,羅穎等.基于GSM的智能家居遠程監控系統[J].科技信息,2013(04),19.
[4]申利民,劉冬香.基于GSM智能家居控制系統的設計[J].傳感器世界,2011,17(1):32-36.
[5]王騏,何嘉斌.單片機控制GSM模塊實現短信收發的軟件設計[J].單片機與嵌入式系統的應用,2005.
[6]馬忠梅.單片機的C語言應用程序設計[M].北京:北京航天航空大學出版社,2007.
[7]邱文靜.基于GSM短信息的家居設施遙控監測系統設計[D].南京:南京理工大學碩士學位論文,2009.
[8]蘇江福.基于GSM網絡的智能家居監控系統設計與實現[D].哈爾濱工程大學碩士學位論文,2008.