圖像分析論文范文
時間:2023-03-21 14:54:12
導語:如何才能寫好一篇圖像分析論文,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
1引言
工程圖紙掃描圖象的識別與理解是目前學術界和工程界研究的熱點,在機械、電子、建筑及地理信息系統(tǒng)等應用領域中具有重要的實際意義。圖樣中有兩部分信息,一是圖形,由幾何圖素組成,用來表達產(chǎn)品形體;二是文字,用來定義產(chǎn)品尺寸及描述其它信息,有的附于圖形,如尺寸數(shù)字等,也有獨立存在的,如技術要求等。文字是圖樣中非常重要的信息。因此,工程圖紙掃描圖象的字符提取與識別是一個重要問題,對進一步的尺寸理解、圖像理解等高層次理解都有較大作用。工程圖樣中的文字包括多種字符,如漢字、數(shù)字、字母及符號等。字符情況較為復雜,有自己的一些特點:字符多為手寫,具有一定的隨意性,不同于印刷體;具有多種方向,不僅有水平書寫,而且有的垂直放置,還有其它各種角度的斜向;有直體與斜體;有時字符與字符及圖形粘連,增加了圖文分割及字符提取的難度;位置分散,大小不一。上述情況在字符的分割及識別時都必須考慮。所以,工程圖樣字符提取及識別是一個十分困難的問題。
鑒于工程圖樣字符的特點,其處理方法與光柵文檔具有很大差別,一般的處理過程是:先標識連通體,從中選出字符域,再根據(jù)字符域鄰近和共線來生成字符串域,并判斷方向,然后分割字符域,最后進行字符識別及校正。經(jīng)過多年研究,工程圖樣字符的分割及識別算法已有多種:一是基于連通體[1];二是基于輪廓跟蹤[2],利用同步邊緣特性檢測進行輪廓跟蹤,分離字符輪廓,采用鄰域搜索來生成字符串,最后通過分類樹進行字符識別,并根據(jù)專業(yè)知識作校正;三是行程編碼匹配法[3],采用圖分割集方法來分割與字符及圖形粘連的字符。
本文提出一種基于單義域鄰接圖的圖文分割方法,在二值圖象水平黑游程編碼基礎上,以相關游程線寬和拓撲的一致為約束生成條形域,對其中多義域作分裂獲得單義域:線段域和圓弧域,并建立其鄰接圖。字符筆劃可以表示為一個或多個單義域。字符筆劃的長度較小,線寬一致。根據(jù)這些特點,從單義域中篩選字符筆劃域,進行初步圖文分離。字符筆劃多是鄰接的,以字符筆劃域為起點,通過遍歷鄰接圖搜索鄰接的字符筆劃域,來提取字符域。字符結構與圖元差別較大,根據(jù)字符域特性實現(xiàn)字符進一步篩選。采用字符域外接矩形來標識字符的大小和位置。根據(jù)字符域外接矩形相交來判定字符鄰近,再加上字符共線為判據(jù)來生成字符串域。圖樣中字符串多是附于圖形的,單義域可以很容易獲取方向,即可得圖形方向。利用共串字符外接矩形中心及所附圖形對字符進行定向。然后將非水平字符域旋轉至水平,并重新進行水平黑游程編碼,以單義域鄰接圖來表達字符的結構特征,為后續(xù)識別作準備。下面進行詳細介紹。
2圖象的單義域鄰接圖描述
在工程圖形中,既有圖元又有字符。圖元有多種,如線段、圓弧、圓、箭頭等,而且圖元多為相交。不同圖元需要用一種結構來統(tǒng)一描述,然后通過分析其幾何與拓撲特征確定類型來進行矢量化。交點信息對提取同一圖元及不同圖元之間拓撲關系具有重要指導意義。字符是由筆劃組成的,在提取筆劃的基礎上進行識別是一種很好的方法。但筆劃的提取難度較大。現(xiàn)有對圖樣字符的識別多是處理數(shù)字和字母,較少涉及漢字,而我國圖紙均有大量漢字信息,還有數(shù)字及字母等。因此,需要建立一種模型,既能表達幾何數(shù)據(jù),還可以描述拓撲關系,便于各種特征提取。
現(xiàn)有圖文分離算法多是以象素為單元,進行連通體生成。而連通體對后續(xù)識別貢獻較小,尤其是對圖元的識別。這就要求采用一種模型能夠統(tǒng)一描述圖形和文字的幾何與拓撲信息。基于單義域鄰接圖的描述模型,可以統(tǒng)一描述圖元和文字,不但能提取圖元,還為字符識別的筆劃特征提取提供啟發(fā)。下面給出單義域鄰接圖的建立方法。
對圖象作水平黑游程編碼,這時對圖象的分析單元由象素變?yōu)橛纬蹋纬踢B通性反映了圖形拓撲關系。如圖1.b所示。通過分析游程的拓撲關系,可以獲取具有轉折意義的游程[4]。這些關鍵游程為圖元分割提供線索。相關游程基于寬度和拓撲一致性可以聚合為一個集合,來表達某一幾何與拓撲意義,稱之為條形域。條形域具有較強的整體性和宏觀性[5]。但是,有的條形域具有多義性,即由線段域和圓弧域組成,對多義域需作分裂得單義域。這時,圖象的表達單元變?yōu)閱瘟x域,如圖1.c所示。而單義域首末游程的拓撲則表達了單義域的拓撲關系。單義域鄰接圖可以完整地表達圖象中圖元與字符的幾何與拓撲信息。如圖2所示。
3字符提取
圖文分離算法已有多種,主要是基于連通域。多數(shù)字符是一個連通域,數(shù)字、字母及漢字多是連通的,或是由幾個連通域構成的,而且字符域具有許多與幾何圖元域不同的特征。在實際中多以象素八鄰域來進行字符提取,且輔以多種字符屬性判斷,確認是字符域而不是圖形域,并生成其最小外接矩形,用以標識字符域的大小與位置。上述算法主要是分析連通域的特征來確定字符,在生成連通體時,對于圖文粘連情況,勢必形成一體,需要后續(xù)分割或造成圖文誤分。這主要是因為在形成連通體時只是基于象素。如果能夠在確定筆劃域的基礎上進行圖文分割及字符提取,則毫無疑問會提高分割及提取效果。
根據(jù)制圖規(guī)則,圖樣中的漢字、數(shù)字、字母的字體均有規(guī)定,在一定掃描率下,可以確定字符的范圍閾值,從而確定字符筆劃的長度,而字符筆劃線寬又是基本一致的,根據(jù)這兩個條件從單義域中選取字符筆劃域。鄰接的字符筆劃域為一個字符,或是一個字符的部分筆劃。字符提取是以字符筆劃域為基礎的,遍歷鄰接圖搜索鄰接的字符筆劃域來完成。下面給出具體算法:
(1)取出未訪問字符筆劃域,設為當前域,新建字符域及其外接矩形,將當前域插入字符域。
(2)如果當前域無鄰接的可訪問域,則轉到(4),否則,取當前域鄰接的未訪問字符筆劃域,設為當前域,插入字符域,字符域外接矩形生長。
(3)返回(2)。
(4)得一字符。
字符結構與圖元差別較大,根據(jù)字符域特性[1]實現(xiàn)字符進一步篩選。圖3.a給出圖1.a的字符提取結果,采用外接矩形標識。
4字符串生成
工程圖紙中字符多以串的形式存在,組成字符串來表達語義。分析字符的字符串歸屬能夠為字符識別提供方向及上下文等信息。由于圖樣字符的多向性,字符的方向確定也需從字符串中獲取。對于小象素群究竟是小數(shù)點還是噪聲,只有置身于字符串的上下文中才能作出正確判斷。因此,字符串的組合是繼字符提取之后的必然要求。
字符串成組通常采用的方法有兩種,一種是利用Hough變換進行共線檢測[6];另一種是相鄰檢測,即字符串的生成就是將鄰近字符組合在一起。第二種方法有多種作法:一種是以字符外接矩形的中心距為判據(jù)的,與某一閾值作比較,若小于閾值則將其歸為同一字符串。一般先進行水平、垂直兩個方向字符串搜索,再進行斜方向,以字符外接矩形的中心距為判定值,對不同方向采用不同閾值[2]。另一種是以字符外接矩形的角點距為判據(jù)的,與某一閾值作比較,若小于閾值則將其歸為同一字符串[7]。閾值與方向的關系較大,有時需要同時處理多種情況。
上述方法即使對同一字體由于方向不同(水平、垂直、斜向)需采取不同閾值,對方向較為敏感。本文采用一種矩形求交方法來進行字符鄰近判斷,可以較好地解決字符鄰近判斷問題,無需預先設定方向。
4.1字符組合
在圖樣中,不同大小文字之間的行列間距是不同的,文字列間距與其大小具有一定對應關系。本文根據(jù)字符域外接矩形自適應求得字間距,通過膨脹字符外接矩形,即字符外接矩形按字列間距擴大生成膨脹矩形,對膨脹矩形進行求交運算來判定兩個字符是否鄰近。同一字符串的字符不但是鄰近的,而且還應共線(第三個字符起)。下面給出字符組合步驟:
(1)取出未訪問字符域i,設為當前域,新建字符串域,將當前域插入字符串域。
(2)如果當前域無鄰近且共線的可訪問域,則轉到(4),否則,取當前域鄰近且共線的未訪問字符域,設為當前域,并插入字符串域。
(3)返回(2)。
(4)得一字符串。
圖3.b可以看出,矩形求交方法可以較好解決字符組合問題,在字符串的生長中無需預設方向。
4.2字符串定向及旋轉
工程圖樣中字符是多向的,其定向問題直接影響識別精度。字符串的方向為其書寫的基線方向。多數(shù)方法以字符中心連線來確定方向,但,如果字符較少,則誤差較大。在工程圖紙中,多數(shù)字符串附于圖形,尤其是線段,而其基線方向與其所附線段的方向一致,如機械圖樣中的尺寸數(shù)字。由于采用單義域鄰接圖來描述圖象中圖形和文字,從單義域中可以很容易獲得圖形的方向信息。對于附于圖形的字符串定向,可以采用比較字符串中心線與所附線段來確定字符串的基線方向。如果字符串鄰近的某一單義域(線段域)的方向與字符串中字符域中心連線方向一致,則采用線段域方向作為字符串方向。而獨立字符串的定向問題可采用文獻[1]方法。
對于水平字符串,可以直接取出每個字符進行識別。而對其它方向的字符串,需先對每個字符根據(jù)其方向旋轉至水平然后進行識別。圖3.b給出字符串標識。圖3.c給出旋轉后結果。
5字符單義域表示
我國圖紙多是中西文混合,字符識別的特征提取必須考慮漢字特點,筆劃特征明顯。字符識別的特征提取方法很多,如果能夠提取筆劃,則必定會大大提高識別效果[8]。采用單義域鄰接圖可以較好地提取、表達字符的幾何與拓撲信息。圖4給出字符單義域表示實例。
6結束語
本文采用單義域鄰接圖來表達圖象信息,在確定筆劃域的基礎上進行圖文分割及字符提取,整體性很強。本研究算法已被應用于我們開發(fā)的工程圖紙掃描圖象識別與理解系統(tǒng)之中,字符提取效果較好。但仍需進一步完善,研究各種復雜情況,以提高字符及其筆劃特征提取精度,尤其是研究各種結構漢字,進行以筆劃為基礎的中西文識別。
參考文獻
[1]鄒榮金,蔡士杰,張福炎等.字符粘連及字線相交的分割與識別方法.軟件學報,1999,10(3):241-247
[2]胡友蘭,黃樹槐,常明.工程圖中字符分離和標注字符串生成技術.華中理工大學學報,1997,25(3):30-33
[3]陳勇,朱林,常明.工程圖中粘連字符的提取與分割.華中理工大學學報,1996,24(4):23-26
[4]S.DiZenzo,L.Cinque,andS.Levialdi.Run-BasedAlgorithmsforBinaryImageAnalysisandProcessing.IEEETransactionsonPatternAnalysisandMachineIntelligence,1996,18(1):83-89
[5]王金鶴.基于條形域結構的掃描圖樣識別理論與方法研究(博士學位論文).大連,大連理工大學,1999.6
[6]江早,劉積仁,劉晉軍.工程圖紙圖象圖文自動分割工具SegChar.軟件學報,1999,10(6):589-594
[7]李偉青,彭群生.一種新的字符提取和組合算法.工程圖學學報,1997,No.2-3:38-45
[8]L.Y.TsengandC.T.Chuang.AnefficientKnowledge-BasedStrokeExtractionMethodforMulti-FontChineseCharacters.PatternRecognition,1992,25(12):1445-1458
AnAlgorithmofExtractingCharactersfromScannedImageofEngineeringDrawingsUsingPrimitiveRegionAdjacencyGraph
篇2
論文摘要:本文從知識管理理論的角度出發(fā),研究了圖書館知識共享的相關問題.并以此作為基點來實證分析圖書館實行知識共享的現(xiàn)狀與存在的障礙因素.進而探求克服共享障礙的激勵措施。論文分成3個部分:第一部分探討圖書館知識共享的內(nèi)涵.并從三個方面闡述圖書館實施知識共享的必要性。第二部分提出并分析了圖書館知識共享實踐的障礙。第三部分提出了解決圖書館知識共享障礙的主要途徑。
20世紀90年代以來.圖書館面臨著新技術特別是信息技術的飛速發(fā)展的挑戰(zhàn),信息技術不斷改變著社會的文化,圖書館也隨之改變管理與服務方式。無論是為促進社會的發(fā)展還是為自身的生存。圖書館都應該認真審視周邊變化的環(huán)境,明確自身的定位和任務。引入知識管理.建立一個實時、開放的知識共享系統(tǒng)。總之。實行知識共享是圖書館在知識經(jīng)濟時代的必然選擇。
1、圖書館知識共享的內(nèi)涵
圖書館知識共享也是圖書館開展的知識共享。這不僅包括圖書館內(nèi)部人員之間的知識共享,還包括與圖書館緊密相連的外部機構之間、圖書館和圖書館用戶之間的知識共享。圖書館內(nèi)部人員知識共享是指圖書館內(nèi)部人員個人的知識通過各種交流方式與其他成員所分享從而轉化成組織知識的過程;圖書館外部的知識共享主要是圖書館與圖書館用戶與其價值鏈上的組織的知識互補性和協(xié)同發(fā)展的需要而進行的知識轉移的過程。其中圖書館內(nèi)部人員的知識共享和圖書館與用戶之間的知識共享是圖書館知識共享的主要方面,而圖書館與外部機構之間的知識共享是圖書館知識共享的次要方面。
2、目前國內(nèi)圖書館知識共享實踐的障礙
2.1部分讀者和館員提供隱性知識的被動性
圖書館館員作為知識擁有者,在獲得知識的過程中.要付出一定的物力、精力和財力。對于個人來說,館員對圖書館的價值取決于自身所知道的而其他人并不知曉的知識。個人擁有的獨特技能使自己改進工作效率,提高個人在團體中的地位,而共享之后的知識不再為個人獨有,自己存在的價值就會減少。
2.2缺乏有效的激勵機制
由于對隱性知識的重要性和復雜性認識不足.缺乏對隱性知識的研究和有效管理,圖書館知識共享管理大多不健全。館員所擁有的隱性知識貯存在頭腦中,是否貢獻出來供其他人共享,完全取決于館員的意愿。所以合理的激勵機制對促進隱性知識交流和共享極為重要。但目前大多數(shù)圖書館采取的分配制度明顯不利于隱性知識的交流與共享,缺少由物質(zhì)、精神等多方面激勵形成有效的激勵機制,是圖書館隱性知識得不到有效管理的一大障礙。
2.3圖書館利用的復雜性和難度
圖書館對知識的組織和整序是其基本功能,而知識的組織和整序需要的是特殊的專業(yè)性技能。因其組織和整序的日益復雜化不可避免地影響用戶的檢索和利用。這是造成用戶利用圖書館難度的根本原因。因為從用戶查詢利用來說.盡管需要的知識和技能的專業(yè)化色彩已經(jīng)淡化,但仍然會帶來不少麻煩。在現(xiàn)代化信息技術條件下,隨著復合圖書館、數(shù)字圖書館建設的推進。圖書館利用的復雜性和難度沒有降低。資源的豐富和復雜性,檢索查詢的復雜性,圖書館服務設施的復雜性,這些都給用戶的利用造成了一定的困難。而圖書館對用戶的培訓、咨詢實際上是把自身的個人知識和技能拿來與用戶分享,這種個人知識和技能不是顯性知識,而是主觀化的隱性知識。
3、解決圖書館知識共享障礙的主要途徑。
3.1通過宣傳教育廣泛達到共識
由于知識共享的研究大多集中在企業(yè)中,知識共享對提高組織競爭力具有十分重要的作用,但對圖書館的知識共享卻并未引起足夠的重視。圖書館是社會文化結構,長期以來一直受財政撥款的扶持,因此競爭意識不強。隨著中國加入WTO,圖書館信息服務的職能受到商業(yè)機構或信息咨詢公司的挑戰(zhàn)越來越大,圖書館要想在今后的競爭中立住腳跟,就要重視知識共享和知識創(chuàng)新,增加知識資本,提高工作和業(yè)務能力,增強圖書館的整體服務能力和服務效果。圖書館利用教育、培訓活動以及通過領導示范、業(yè)績考評等手段把知識共享與圖書館的核心價值觀相聯(lián)系,打破部門思維.幫助成員之間建立合作關系,建立一種學習、合用、開放的文化環(huán)境,激勵人們以內(nèi)在的力量和他人進行知識共享。
3.2建立圖書館知識共享協(xié)議
圖書館和其他社會組織一樣,有工作關系維系的供需鏈,圖書館與書商、行政管轄部門、社區(qū)、用戶、本行業(yè)及其他文獻信息服務部門、技術支持行業(yè)及部門,同樣也包括其他圖書館。圖書館最重要的使命就是為其用戶擴大知識的獲取、各圖書館之間的關系是共存共榮的互助協(xié)作關系。網(wǎng)絡技術和通訊技術的迅猛發(fā)展為身處異地的圖書館員知識交流和共享提供了必要的工具,因此在某種程度上說,在全球范圍內(nèi)實現(xiàn)圖書館知識共享是有可能的,主要建立圖書館知識共享協(xié)議,這是深度合作和長久合作的必要措施。由于各館知識資源分布不平衡,所以共享具有差異性。為平衡各館之間的利益,有必要建立合適的補償機制。可以對貢獻知識的數(shù)量、知識的受認可度及運用到工作中所取得的成效進行大致測定,根據(jù)測定結果決定補償力度。利益平衡是知識交流和共享得以持續(xù)進行的基石。
3.3建立圖書館知識共享激勵機制
3.3.1激勵用戶知識共享的主要措施
建立知識共享的激勵機制,包括物質(zhì)激勵和精神激勵。使用戶既能獲得實際的利益又能得到心理上的滿足.從而激發(fā)用戶的知識學習、創(chuàng)新及知識共享的主動性和積極性,增強其知識交換的意愿。
(1)共同創(chuàng)新機制
創(chuàng)新并不總是來自圖書館內(nèi)部.很大部分是來自用戶。圖書館可以積極地加強與用戶的聯(lián)系,使用戶成為圖書館良好的合作者.共同進行信息服務的開發(fā)和革新。
(2)共同學習機制
這是一種突出圖書館無形的社會文化價值創(chuàng)造和利用的方式.重點在于促進圖書館和用戶之間以及不同用戶之間的團隊學習。通過這種方式圖書館可以在與用戶的互動中創(chuàng)造價值,甚至可以利用用戶的知識創(chuàng)造一種全新的價值鏈或者進行組織結構及流程的再造。同時促進圖書館與用戶進行顯性和隱性知識的共享。
(3)智力資產(chǎn)共享機制
共享智力資產(chǎn)是圖書館與用戶關系最為密切的知識共享方式。把用戶視為圖書館的“所有者”,圖書館與用戶共同分享雙方的智力資產(chǎn),并且創(chuàng)造出新的智力資產(chǎn),以獲取智力資產(chǎn)的最大收益。用戶不僅參與參考咨詢服務,還同圖書館一起共同開創(chuàng)圖書館的未來。
3.3.2激勵館員知識共享的主要措施
(1)知識(成果)署名并定期公布制度
對圖書館員工個人或團隊的知識成果都加以署名。其它的知識(成果)都定期在圖書館內(nèi)部公開,并在指定的地方加以公布。這樣做一方面是圖書館對員工運用和創(chuàng)造知識的辛勤勞動的肯定和尊重,他們由此也會產(chǎn)生一種自我價值實現(xiàn)感,在以后的工作中就會更加努力地自覺創(chuàng)造出更多的成果與大家分享;另一方面,要求圖書館員申報一定時期內(nèi)(比如說一個月)以來的知識成果,匯報與其他館員交流了多少有用的知識,將多少知識應用到實際工作中了。
(2)知識薪酬支付制度
對貢獻了知識成果的館員。通過增發(fā)薪水與酬金來激勵。對那些貢獻了較多經(jīng)驗、技能等隱知識而對經(jīng)濟利益較敏感的館員,圖書館可將其貢獻與獎金等掛鉤,或稿酬的方式支付。館員發(fā)表的作品在館內(nèi)公布時亦以一定的稿酬鼓勵。凡第一次在館內(nèi)公布的重要理論觀點及技術知識為其付予一定的稿酬。這方面可制定一個詳細的標準。
篇3
1形神論的形成及在佛教思想文化中的含義
中國油畫藝術中, 形神論這一藝術理論與佛教思想文化存在著一定的聯(lián)系。中國藝術形神之說自古以來一直是藝術美學的一個重要議題。 形與象二者相互關連,合二為一即為形象。 將其分開來看,可最早追溯到中國的先秦典籍《易經(jīng)》。 該書這樣闡述道易者象也,象也者像也。 這是最早的對形象的理解,將象等同于像。 《系辭傳》則肯定了易象的來源是天上萬象的寫照,并提出觀物取象的思想。老子也曾對象加以說明。 他所著的《道德經(jīng)》中提到道之為我,惟恍惟惚; 惚兮恍兮,其中有象;恍兮惚兮,其中有物。 該句中對象的描述或指對象的具體形態(tài)、物象,亦或可能是對宇宙中自然萬物變化莫測,氣象萬千的一種模糊意義上的形容。 但不管怎樣,都從不同角度作出了對象的理解。由此看出《易經(jīng)》和老莊哲學都蘊藏著一定的美學思想,比后來傳入中國的佛教思想文化要早很多,它們是中國藝術美學理論形神論形成的必要因素。 隨著歷史與藝術的發(fā)展,佛教思想文化在與儒道等典型文化的既相互排斥又相互滲透、融合的進程中完成了中國化的歷程,并與儒道思想文化一起加速了中國藝術美學形神論的成熟與完善。 形象一詞在佛家典籍中早已被提極過,但并非對藝術而言。 前者的《易經(jīng)》與老莊哲學只提到了象,而并未將形與之聯(lián)系在一起。 而佛教則很好地將二者合二為一。 《高僧傳卷八》這樣記載道:圣入之資靈妙以應物,體名寂以通神,借微言以津道,托形象以傳真。 其中雖然充滿了唯心主義思想,但形象一詞卻卻誕生了, 這其中的美學思想不言而喻,而更加推動了形神論之說走向成熟的是佛教的神不滅論,其著力揭示了神是不隨形滅的。 形是易朽的東西,神是精極而為靈者也,它是恒常不變的實體(無生) 可以托身異形、隨物冥移這些佛教的思想文化點明了神的重要及靈性,也表明了形的暫時性,不恒久性。于此形粗神精的價值觀也就隨之凸現(xiàn)出來了,這也恰恰體現(xiàn)了藝術美學思想中的形神論。
2形神論之于油畫創(chuàng)作的重要意義
形神論在美學上的反映,最突出的就是貴神賤形,即重視畫面的神,形則處于從屬的地位。 由此,中國藝術美學思想中的形神論理論更為豐富、成熟,集多家思想文化融合互補于一體,但佛教思想文化中的神不滅論的痕跡則尤為明顯,由此,繪畫藝術理論也就更為豐富多彩了。如以形寫神。元代劉見孫的《蕭達可文序》中這樣闡述道:即神似,雖形不酷似,尤似也。 其意思是說有了神采了,盡管形象上不太吻合,也沒有關系,神似則可。 《畫論》中說:今人看畫,多取形似,不知古人最以形似為末節(jié)。 意思是說,時下人們欣賞畫作,大多通過形來評判該幅畫作的好壞,豈不知古人早已將形的好壞放到了評價標準的最后。 于此同時,形神論的形成與發(fā)展也離不開大量的藝術實踐。 佛教傳入中國后,佛畫的大量繪制也很大程度地加速了藝術的發(fā)展與藝術理論的成熟與完善。 通過大量的藝術實踐,形神論得到了進一步的豐富與發(fā)展。形神論的美學思想不僅對中國傳統(tǒng)繪畫影響深遠,同時也直接或間接地影響了中國油畫藝術的發(fā)展。 具有一定國學基礎及文人精神思想的中國藝術家在面對油畫創(chuàng)作的時候,只是在材料技法方面稍顯陌生,占主導地位的卻仍然是人的思想精神,而這恰恰是油畫創(chuàng)作標準的最高層面,即神的層面。 中國油畫家受傳統(tǒng)文化形神論的影響,在油畫創(chuàng)作中不斷探索,十分注重畫面中的形與神。油畫藝術對于東西方而言,確實存在著差異。 西方古典的寫實性與東方傳統(tǒng)的表現(xiàn)性、寫意性確實存在著明顯的差異性,但這只是二者在形與神上的側重點不同而已,前者在形上要求嚴謹性、科學性,理性的成分較多;后者則把形放到次要地位,只求似則可,把神即精神、性靈、神韻列在首位。 二者之間看似沖突,但仔細分析判斷后,事實并非如此。 二者只是由于文化差異導致了在油畫創(chuàng)作上的側重點不同,但最終的目的卻是一樣的,即都是為了滿足審美的需求以及表達一定程度的精神世界、思想內(nèi)涵。 中國眾多的油畫家們正立足于本民族傳統(tǒng)文化的高點上,通過不斷探索研究,吸收外來文化的精華,使油畫在中國這片土地上快速發(fā)展,形神論則一直被高度重視并貫穿于油畫創(chuàng)作之中。
當今油畫藝術形式繁雜,成多元化趨勢。 一部分藝術家吸收西方古典寫實性藝術的精華,注重形的處理,并與中國審美文化相結合,創(chuàng)作出了具有東方特色的寫實性油畫藝術,使畫面達到了形神兼?zhèn)渌囆g效果,即重視形體,又重視對其神韻的追求。寫實畫家較多,如冷軍、王沂東等。 同時西方藝術家們通過反思古典寫實油畫的得失,自覺的追求油畫語言的變換與變異,向表現(xiàn)性、象征性和抽象性油畫藝術方向發(fā)展。 比如西方現(xiàn)代主義畫家拋棄了古典的寫實性,開始追求表現(xiàn)性、象征和抽象性,這些方面都與中國傳統(tǒng)文人畫接近,即逸筆草草,聊以解胸中逸氣。從一定意義上來說,中國傳統(tǒng)繪畫的寫意性與西方現(xiàn)代繪畫的主張有異曲同工之妙,都是對神采的追求,對精神性的探索。 盡管東西方思想文化存在著巨大差異,但藝術卻是全人類的藝術,中國繪畫藝術與西方繪畫藝術達到了某種程度的共鳴。 在東方文化氛圍之內(nèi),藝術家們除古典寫實以外,在油畫創(chuàng)作中又采用了變形、夸張、抽象等藝術手法,進行更加大膽的藝術嘗試,創(chuàng)作出大批優(yōu)秀的油畫作品來。其一個共同點就是藝術家們都沒有拋棄東方燦爛輝煌的思想文化,尤其注重對形與神的處理并將其繼承、發(fā)揚、再創(chuàng)造。這些優(yōu)秀的藝術家有吳冠中、趙無極等。 吳冠中的繪畫藝術極富思想精神性,畫面靈動而優(yōu)雅,色彩豐富而純凈,具有禪的境界。
篇4
關鍵詞:舌診;舌象客觀化;舌體圖像分割;圖像分析;RGB;動態(tài)閾值
中圖分類號:TP391文獻標識碼:A文章編號:1009-3044(2008)14-20910-02
1 引言
自古以來中醫(yī)有四種診斷疾病的方法,那就是望、聞、問、切四診。望診就是醫(yī)生通過視覺來觀察病人的神、色、形和態(tài)的變化。總體來說,望診包括一般望診和舌診兩部分,一般望診又包括望神、察色、望形態(tài)、望五官等,舌診包括望舌質(zhì)、望舌苔。舌質(zhì)是舌的肌肉部分,舌苔是舌面附著的苔狀物,舌質(zhì)可以反映五臟的虛實,舌苔可以察外協(xié)浸入人體的深淺[1-2]。臨床上通常把舌質(zhì)和舌苔變化聯(lián)系起來綜合判斷,一般是急性病重舌,慢性病重脈,因為舌象能準確及時的反映機體生理病理狀況[3]。望舌診病是中醫(yī)長期實踐積累的獨特診病手段。
2 舌象客觀化的研究
傳統(tǒng)的中醫(yī)舌診是由中醫(yī)師根據(jù)自己的知識和經(jīng)驗用人眼觀察,并在短時間內(nèi)作出判斷,其診斷結果受醫(yī)生的知識水平、思維方式及診斷技巧的限制,也受光線溫度等外界客觀因素的影響,因此難免會出現(xiàn)某些誤差,把淡黃色誤作深黃色,紅色誤作淡紅色等。為了消除人為因素的影響,使用現(xiàn)代數(shù)字圖像處理及分析技術和現(xiàn)代的智能信息處理技術,使中醫(yī)舌診從主觀診斷轉向客觀決策[4],進行舌診客觀化的研究是非常有意義的,具有較好的前沿性和可操作性。
采用數(shù)字圖像處理技術對舌象進行圖像分析的研究始于80年代中期。孫立有等人,先對利用圖像處理和模式識別進行舌診客觀化的研究提出了一種想法[5],建議著重分析舌象的色度變化,并且貫徹中醫(yī)的辯證觀及整體觀思想,為國內(nèi)后來的舌診客觀化研究提出了一個方向。蘇開娜等首次利用圖像處理技術進行了舌苔潤燥的分析,采用二分光反射模型討論了舌苔圖像上亮斑象素點在RGB 彩色空間的分布特征及亮度特征。本文主要探討舌體區(qū)域自動分割的一種方法[6]。
3 用動態(tài)閾值法分割舌體區(qū)域
在舌體圖像分割中,一般的分法是利用舌體的顏色與背景顏色的不同,把舌體區(qū)域從背景中分割出來。臺灣國立中山大學蔣依吾等根據(jù)大量的觀察實驗指出舌體中舌尖舌邊的RGB三色分量與周圍皮膚由較大差異,提出了的邊緣增強公式,進行舌體區(qū)域分割取得一定效果[7]。但是由于這種顏色差別僅存在于舌尖和舌邊,不適用舌根部位,所以僅用顏色的差值來分割舌體是無法取得好的效果。本文參考上述公式,再利用舌體區(qū)域與背景區(qū)域存在的豐富邊緣,用動態(tài)閾值的分法獲取邊緣并連接,在舌體圖像分割中取得較好效果。
3.1 用RGB三色分量差值法分割舌體區(qū)域
設RGB色彩空間像素Vc=(r,g,b),r,g,b∈[0…1]則有:
Gate=(r-g)+(b-g)*6+(r+g+b)/3
IF(gate(i,j)
Crf(i,j)=1;
ELSE Crf(i,j)=0;
其中(i,j)指像素在圖像矩陣中的位置。gate(i,j)是RGB三色分量差值,Crf(i,j)為參考的二值化圖像,Crf(i,j)=1指要分割出的目標區(qū)域,Crf(i,j)=0指背景區(qū)域。這樣可以得到舌體中的舌邊和舌尖的邊緣,再通過舌體根部與上嘴唇出現(xiàn)的陰影區(qū)得到舌根邊緣,這樣就可以把整個舌體區(qū)域分割開來[8]。
3.2 用動態(tài)閾值法分割舌體區(qū)域
上述分法僅利用了顏色信息,很難把與舌體顏色相近的唇部區(qū)域去除,但是大部分舌體與唇部之間都存在一定的邊緣,用動態(tài)閾值取出圖像的灰度邊緣,再加上上述方法取出的RGB三色分量差值得到邊緣,分割舌體,這種方法會取得更好的效果。具體操作是:首先定位舌中的一點,然后取出沿圖像四周的點與舌中此點連線的灰度值,計算連線中的最大梯度,取為待選邊緣點。梯度的計算公式是grad(i)=gray(i)-gray(i+I),其中grad(i)指在連線位置i處的梯度值;gray(i)是指在連線位置i處的灰度值。用RGB三色分量差值得到的舌體邊緣點,將其記為coloredge (i)。最后比較灰度梯度得到的邊緣點與用RGB三色分量差值得到的邊緣點,選擇最終邊緣點,連接這些點,形成閉合區(qū)域,分割出舌體區(qū)域[9]。根據(jù)經(jīng)驗,選擇最終邊緣點的公式:
IF(rgad(i)
edge(i)=grad(i);
ELSEedge(i)=colordege(i);
4 結論
根據(jù)中醫(yī)對分割出的圖像的評價,把圖像質(zhì)量分為5個等級:優(yōu)等,較好,中等,分割失敗,未分割[10]。實驗樣本中基本涵蓋了各種情況的舌圖像,有舌面完全伸出覆蓋下嘴唇的圖像,也有未完全伸出的圖像,也有露出上腭的圖像。我們用上述的3.1和3.2方法分別對舌體區(qū)域進行分割實驗。實驗證明,3.1方法對于舌面伸出覆蓋下嘴唇的圖像有較好的效果,但對于舌面未完全伸出未覆蓋下唇的圖像分割效果很差。3.2方法對于上述兩種圖像都有較好的效果,但對于舌邊緣模糊的圖像分割效果較差。兩種分割方法得到的效果圖如下:
5 結束語
近年來計算機技術的迅猛發(fā)展,使舌診客觀化研究在方法上有了很大的進展,但仍存在許多問題亟待解決。在中醫(yī)理論指導下和臨床實踐的參與下,利用計算機和圖像處理技術對舌象作進一步的定性、定量分析,建立舌診的客觀統(tǒng)一識別標準,提高了舌象特征自動分析的準確性和實用性,推動了舌診客觀化系統(tǒng)的發(fā)展,這將是我們進一步研究的重點。
參考文獻:
[1] 劉慶,岳小強.舌診現(xiàn)代化研究的回顧與展望[J].中西醫(yī)結合學報,2003,5(1):66-70.
[2] 沈蘭蓀,王愛民,王衛(wèi)國,等.圖像分析技術在舌診客觀化中的應用[J].電子學報,2001,12(A):1762-1765.
[3] 朱潔華,阮邦志,勵俊雄,等.舌診客觀化研究的一種圖象處理方法[J].中國生物醫(yī)學工程學報,2001,20(2):132-137.
[4] 王愛民,趙忠旭,沈蘭蓀.中醫(yī)舌象自動分析中舌色、苔色分類方法的研究[J].北京生物醫(yī)學工程,2000,19(3):136-142.
[5] 孫立有.利用計算機圖像識別技術進行舌診客觀化研究的探討[J].安徽中醫(yī)學院學報,1989,5(4):5-7.
[6] 蘇開娜,盧翔飛.基于圖象處理的舌苔潤燥分析方法的研究[J].中國圖象圖形學報,1999,4(增刊):345-348.
[7] 蔣依吾,陳建仲.電腦化中醫(yī)舌診系統(tǒng)[J].中國中西醫(yī)結合雜志,2002,20(2).
[8] 沈蘭蓀,趙忠旭.基于圖像處理的中醫(yī)舌像分析儀的研究[J].國外電子測量技術,1999(6):33-35.
[9] 王愛民.用于舌診客觀化的圖像分析技術的研究[D].博士學位論文,北京:北京工業(yè)大學,2001.
篇5
1.1.1醫(yī)學圖像處理的特點及重要性
醫(yī)學圖像處理技術包括很多方面,如:圖像恢復、圖像重建、圖像分割、圖像提取、圖象融合、圖象配準、圖像分析、圖像識別等等。進行醫(yī)學圖像處理的最終目的是實際應用于醫(yī)學輔助、工業(yè)區(qū)生產(chǎn)、科學研究等方面,所以其具有較廣泛的應用價值和研究意義。醫(yī)學圖像處理的對象是各種不同模態(tài)的醫(yī)學影像。在醫(yī)學臨床的使用中,醫(yī)學影像主要有超聲波(UI)、X-射線(X-CT)、核磁共振成像(MRI)、核醫(yī)學成像(NMI)等。隨著計算機技術的發(fā)展,醫(yī)學影像技術已成為一門新興交叉學科,目前是計算技術與醫(yī)學結合技術中發(fā)展最快的領域之一。借助有力的醫(yī)學圖像處理技術手段,極大的改善了醫(yī)學影像的質(zhì)量和顯示方法,其成果使臨床醫(yī)生能更直接、更清晰地觀察人體內(nèi)部組織及病變部位,確診率也得到了提高。這不僅使醫(yī)學臨床診斷水平在現(xiàn)有的醫(yī)療設備的基礎上得到極大地提高,并且能使醫(yī)學研究與教學、醫(yī)學培訓、計算機輔助臨床外科手術等實現(xiàn)數(shù)字化應用,從而為醫(yī)學研究與發(fā)展提供堅實的基礎,在醫(yī)學應用中具有不可估量的實用價值。
醫(yī)學圖像與普通圖像相比,具有以下幾方面的特點(1)醫(yī)學圖像具有灰度上的含糊性。表現(xiàn)為兩方面:一方面是由于成像技術上的原因帶來的噪聲擾,往往使物體邊緣的高頻信號被模糊化;另一方面,由于人體組織的螺動等現(xiàn)象會造成圖像在一定程度上產(chǎn)生模糊效應。(2)局部體效應。處于邊界上的像素中,通常同時包含了邊界和物質(zhì),使得難以精確地描述圖像中物體的邊緣、拐角及區(qū)域間的關系,加之假如出現(xiàn)病變組織,則其會侵襲周圍正常組織,導致其邊緣無法明確界定。
1.2論文的研究目標及工作
1.2.1論文主要涉及的三方面基礎理論
論文主要涉及馬爾科夫隨機場(MRF)理論、模糊集理論及Dempster-shafe證據(jù)理論三個方面的基礎理論,下面分別作介紹:1)馬爾科夫隨機場(MRF)理論基于隨機場的圖像分割方法是一類考慮像素點間的空間關聯(lián)性的統(tǒng)計學方法。其實質(zhì)是從統(tǒng)計學的角度出發(fā),將圖像中各像素點的灰度值看作是具有一定概率分布的隨機變量,從而對數(shù)字圖像進行建模。Cristian Lorenz等人,在醫(yī)學圖像分割中提出了一種可應用于任意拓撲結構的新型統(tǒng)計模型。根據(jù)馬爾科夫隨機場圖像模型,利用最大后驗概率準則(MAP),提出一種迭代松弛算法。MRF模型能夠區(qū)分不同紋理的分布,其特別適用于紋理圖像的分割。但使用MRF模型進行分割的關鍵問題在于參數(shù)估計,所以分割的效果往往取決于對參數(shù)估計的準確度。為此通常在分割與參數(shù)估計間進行輪流迭代計算,例如:先初始化參數(shù),在此基礎上分割,再利用分割的結果對參數(shù)進行進一步的估計,然后再分割,如此直到滿足收斂條件。然而此類方法只能利用單一的圖像信息,不能綜合利用多種圖像信息。
第二章馬爾科夫隨機場(MRF、理論及其應用
馬爾科夫隨機場簡稱,是英文Morkov Random Fields的縮寫。它包含了兩層意思:一個是馬爾科夫(Morkov)性質(zhì);一個是隨機場性質(zhì)。它是基于統(tǒng)計學的分割方法在醫(yī)學圖像分割的應用中,最為常用的一種方法。圖像具有高度的空間信息相關性,而馬爾科夫隨機場(腫)恰好具有有效描述空間信息相關性的特點,加之其具有完善的數(shù)學理論和性質(zhì),所以廣泛的被應用于圖像的處理中,如:圖像的恢復、紋理的提取、模板的匹配和圖像的分割等。娜于圖像的分割,對噪聲有很好的抑制作用;同時是基于模型的方法,所以容易與其它方法結合是它的優(yōu)點。在本文中主要用于腦部—圖像的預處理及前期的分割。下面介紹馬爾科夫隨機場(MRF )的基本理論及其在本文中的應用。
2.1馬爾科夫隨機場CMRF )基本理論
2.1.1一維馬爾科夫(MARKOV)隨機過程
過程(或系統(tǒng))在Zg時刻(即? = /q)的狀態(tài)己知,若過程在/Q后面的時刻,即的狀態(tài)與過程在時刻之前(即
2.2圖像中馬爾科夫隨機場、MRF )模型的建立
2.2.1鄰域系統(tǒng)與勢團(Cliques)
由本文2.1.2小節(jié)中馬爾科夫隨機場(娜)的定義中,任何滿足條件1)非負性的概率都由條件2)中的描述馬爾科夫(MARKOV)性的條件概率所唯一確定。條件2)中的條件概率所描述的也稱為隨機場F (本文中也即數(shù)字圖像)的局部特性。而條件2)中的條件概率的直接求得是很困難的,由概率論中條件概率的公式可知要求的尸C/i 需要知道即需要知道隨機場的聯(lián)合分布,而馬爾科夫隨機場)是用條件概率來定義的,不能很好反映的聯(lián)合分布。也就意味著由馬爾科夫隨機場(MRF )的局部特性來定義整個場的全局特性是存在困難的。以上問題的解決要歸功于Hammersley-Clifford定理,該定理給出了馬爾科夫隨機場隨機場(MRF )與吉布斯隨機場(GRF )的等價關系,從而可以用吉布斯(Gibbs)分布來求解中的概率分布問題。
1.1論文研究的目的和意義………………1
1.1.1醫(yī)學圖像處理的特點及重要性……………… 1
1.1.2醫(yī)學圖像分割中存在的問題、現(xiàn)狀及發(fā)展………2
1.1.3醫(yī)學圖像分割的方法………………
1.2論文的研究目標及工作………………6
1.3本文組織結構………………9
第二章馬爾科夫隨機場(MRF、理論及其應用………………11
2.1馬爾科夫隨機場、MRF )基本理論……………… 11
2.2圖像中馬爾科夫隨機場QMRF )模型的建立………12
2.3估計準則與優(yōu)化算法………………16
2.4本章小結………………19
篇6
關鍵詞:遙感 計算機解譯 影像分類 濕地調(diào)查
中圖分類號:P23 文獻標識碼:A 文章編號:1672-3791(2013)03(a)-0039-02
天津市地處渤海灣頂,九河下梢,有數(shù)萬公頃淺海域和沼澤、灘涂,水庫和縱橫交錯的河流,星羅棋布的坑塘洼淀。天津市濕地含有海岸濕地、河流濕地、湖泊濕地等,為物種多樣性提供了良好的生態(tài)環(huán)境。北大港、團泊洼、大黃堡、爾王莊、七里海等濕地按國際評判標準的分類,都屬于相當重要的等級。如何保護和合理開發(fā)利用濕地,成為保護天津城市生態(tài)環(huán)境與促進天津經(jīng)濟持續(xù)發(fā)展重要課題,本人提出了利用遙感技術監(jiān)測天津濕地的狀況,希望為相關部門提供參考作用。
1 濕地的分類
濕地分為人工濕地和天然濕地兩大類詳細分類如表1所示。本論文研究的濕地范圍僅為天津海岸線以上的濕地,并不包括海岸線以下至低潮時水深不超過6 m的水域。
2 濕地地物光譜特征與識別研究
濕地的光譜特征主要是由水本身物質(zhì)的組成決定的,但是又受到了各種水狀態(tài)的影響。水體的反射主要在藍綠光波段,其他波段吸收都很強,特別到了近紅外波段吸收就更強。地表較純潔的自然水體對0.4~2.5μm 波段的電磁波吸收明顯高于絕大多數(shù)其它地物。
3 監(jiān)測的數(shù)據(jù)源
SPOT衛(wèi)星是法國空間研究中心(CNES)研制的一種地球觀測衛(wèi)星系統(tǒng)。“SPOT”系法文Systeme Probatoire d’Observation dela Tarre的縮寫,意即地球觀測系統(tǒng)。
每一影像覆蓋面積60×60km2。當進行側向(可達27°)掃描時,每一影像覆蓋面積為80×80 km。
SPOT衛(wèi)星的普段參數(shù):(1)綠譜段(500~590 nm):該譜段位于植被葉綠素光譜反射曲線最大值的波長附近,同時位于水體最小衰減值的長波一邊,這樣就能探測水的混濁度和10~20 m的水深。(2)紅譜段(610~680 nm):它可用來提供作物識別、土壤和巖石表面的情況。(3)近紅外譜段(790~890 nm):能夠很好的穿透大氣層。在該譜段,植被表現(xiàn)的特別明亮,水體表現(xiàn)的非常黑。紅和近紅外譜段的綜合應用對植被和生物的研究是相當有利的。
此次監(jiān)測實驗用的是2011年的SPOT衛(wèi)星數(shù)據(jù),包含紅、綠、和近紅外3個波段。
4 濕地信息提取
4.1 監(jiān)督分類法
采用監(jiān)督分類的方法,利用航天遙感數(shù)據(jù)通過內(nèi)業(yè)判讀,依照濕地分類在影像上提取2011年的濕地信息。監(jiān)督分類 (supervised classification)又稱訓練場地法,是以建立統(tǒng)計識別函數(shù)為理論基礎,依據(jù)典型樣本訓練方法進行分類的技術。即根據(jù)已知訓練區(qū)提供的樣本,通過選擇特征參數(shù),求出特征參數(shù)作為決策規(guī)則,建立判別函數(shù)以對各待分類影像進行的圖像分類,是模式識別的一種方法。要求訓練區(qū)域具有典型性和代表性。判別準則若滿足分類精度要求,則此準則成立;反之,需重新建立分類的決策規(guī)則,直至滿足分類精度要求為止。常用算法有:判別分析、最大似然分析、特征分析、序貫分析和圖形識別等。
這里采用最大似然法:假定每個波段中的每類的統(tǒng)計都呈現(xiàn)正態(tài)分布,并將計算出給定象元都被歸到概率最大的哪一類里。
4.2 濕地信息提取實驗
為了便于有效地分析和研究,通常選擇能夠反映地物信息的最佳的波段,它們反映了圖像中基本的重要的信息,稱之為圖像的特征。圖像特征是圖像分析的重要依據(jù)。特征提取是對分類精度和可靠性影響最大的因素之一。本論文實驗根據(jù)濕地的光譜特征用的是4、3、2假彩色波段,將根據(jù)影像反映的光譜特性基于監(jiān)督分類來提取信息。
圖1是根據(jù)遙感影像分類的獲得的濕地分類圖像在這里分水體、植被、樹木、居民地4類,輸出結果圖像。藍色為濕地、紅色為居民地、綠色為植被樹木。
參考文獻
[1] 李建平,張柏,張泠,等.濕地遙感監(jiān)測研究現(xiàn)狀與展望[J].地球科學進展,2007,26.
[2] 張曉龍,李培英,李萍,等.中國濱海濕地研究現(xiàn)狀與展望[J].海洋科學進展,2005(1).
[3] 牛明香,趙庚星.南四湖區(qū)濕地信息遙感提取技術研究[J].國土與自然資源研究,2004(1).
[4] 趙萍,傅云飛,鄭劉根,等.B.Satyanarayana;基于分類回歸樹分析的遙感影像土地利用/覆被分類研究[J].遙感學報,2005(6).
[5] 周昕薇,宮輝力,趙文吉,等.北京地區(qū)濕地資源動態(tài)監(jiān)測與分析[J].地理學報,2006(6).
[6] 張東水,蘭樟仁,邱榮祖.“3S”技術在福建省濕地研究中應用進展[J].福建林業(yè)科技,2006(2).
[7] 楊柳.基于ETM+影像的扎龍濕地遙感分類研究[D].東北師范大學,2003.
篇7
【關鍵詞】自動錄播;圖像跟蹤;主動紅外;空間網(wǎng)格
【中圖分類號】G40-057 【文獻標識碼】A 【論文編號】1009―8097(2009)07―0114―02
由于教育部對精品課程建設及一般高校基于網(wǎng)絡的教學資源庫建設的共同需求,各高校都在加緊進行精品課程建設的課堂錄像工作,《課堂教學自動錄播系統(tǒng)》正在大部分高校中興建。該系統(tǒng)包括諸多高端技術,圖像跟蹤技術是其主要技術之一。
圖像跟蹤,是一個較復雜的過程,包含多種技術在內(nèi)。本文提到的圖像跟蹤技術,不是指跟蹤的全過程,僅指能夠觸發(fā)并指揮攝像機移動的技術,即只是告訴攝像機去哪里,至于去不去、該誰去、怎么去在這里暫不做分析。首先對自動錄播系統(tǒng)中圖像跟蹤方式的現(xiàn)狀作一簡單分析。
一 錄播系統(tǒng)中圖像跟蹤方式的現(xiàn)狀及存在的問題
在自動錄播系統(tǒng)中,圖像跟蹤技術主要包括兩個方面,即教師圖像跟蹤技術與學生圖像跟蹤技術。
1 教師圖像跟蹤技術
當前教師圖像跟蹤技術主要有基于信號的探測方式和基于圖像分析和運動檢測的人像識別方式兩大類。
(1) 基于信號的探測方式
基于信號的探測方式主要有兩個:
被動式紅外探測技術――將紅外發(fā)射裝置放置在被跟蹤對象身上,接收裝置安放在攝像機旁,攝像機根據(jù)紅外接收裝置接收的紅外信號的方向決定攝像機拍攝方位[1]。該方式的主要優(yōu)點是技術較成熟、成本較低、施工較簡單。主要缺點是抗干擾能力較差;教師側身或轉背紅外信號丟失,無法判斷拍攝方向;拍攝高度無法自動調(diào)整;無法判斷被拍攝對象的距離從而設置出中景、遠景、近景等效果。
主動式超聲波探測技術――將多個具有特殊頻率的超聲波發(fā)射和接收裝置安裝在黑板的下方,根據(jù)超聲波接收裝置接收的反射波變化來決定攝像機拍攝的方向。該方式的主要優(yōu)點是技術較成熟,可判斷被拍攝對象與黑板的距離。由于超聲波發(fā)射角度偏大,所以拍攝方位的精度不太高,易出現(xiàn)視頻信號來回切或攝像機不斷左右擺的誤操作,同時它無法判斷被拍攝對象的高度從而自動調(diào)整攝像機的拍攝高度。
(2) 基于圖像分析和運動檢測的人像識別方式
該方式是依靠計算機的專門軟件,對攝像機捕獲的人像進行分析處理,將其設定為跟蹤對象,使其始終處于攝像機的拍攝范圍內(nèi),實現(xiàn)人像的自動跟蹤,并可實現(xiàn)鏡頭的推、拉變化等。由于其設備的大幅減少和施工難度、復雜度的降低,很受用戶歡迎。這是當前技術含量較高的跟蹤技術,也是課堂教學錄播系統(tǒng)跟蹤技術的最終解決方案。
由于基于圖像分析和運動檢測方式的跟蹤系統(tǒng)技術含量高,造成設備成本較高,很多該方面的新技術還沒有真正應用于一般產(chǎn)品中,使得現(xiàn)階段該技術在使用中頻繁出現(xiàn)跟丟和亂跟的現(xiàn)象,對多個目標的識別分析難度就更大,所以還沒有廣泛的應用于課堂教學的錄播系統(tǒng)中。
2學生圖像跟蹤技術
目前,對學生圖像的跟蹤絕大多數(shù)廠商都選取了較為簡單的無線按鈕、有線或無線話筒等開關方式。每個按鈕與攝像機的一個預置位對應,按下某個按鈕,攝像機自動對準一個已預設好的方向,以此“定位”進行拍攝[2],關掉按鈕,攝像機返回教師攝像機拍攝方式;話筒跟蹤方式是打開某個話筒開關,話筒發(fā)射紅外光,學生攝像機被觸發(fā),攝像機采用被動式紅外探測技術跟蹤進行拍攝。關閉話筒,攝像機返回教師攝像機拍攝方式。
上述技術除無線話筒本身存在的缺陷:學生手持話筒影響課堂錄像真實感,電池更換不便等外,最大的缺陷是上課時學生好奇不斷亂按按鈕或話筒打開忘了關,噪聲和圖像會不斷干擾正常的課堂錄像。在以往的課堂錄像中多數(shù)都需進行課后補錄,并重新編輯,給課堂教學錄播帶來極大不便。
二 一個較好的解決方案
以上提到的圖像跟蹤技術或多或少存在缺陷,基于圖像分析和運動檢測方式的人像跟蹤技術,雖然是最終解決圖像跟蹤的技術方案,但目前應用還存在一定的難度。經(jīng)共同研究和實踐我們認為采用“主動紅外+空間網(wǎng)格”技術是當前較好的解決方案之一。
圖1中矩形方塊為紅外發(fā)射頭,橫向的水平與交叉的虛線(較粗),為安裝在教室后方吊頂上“教師紅外發(fā)射頭”發(fā)射的紅外光覆蓋范圍,主要負責教師的圖像跟蹤,由教師任一動作觸發(fā),攝像機的拍攝方向及景別由教師所處的具置確定;縱向的垂直與交叉的虛線(較細),為水平安裝在教室左右高度為1.4米處的“學生紅外發(fā)射頭”發(fā)射的紅外光覆蓋范圍,主要負責起立回答問題的學生圖像跟蹤,當學生起立回答問題時,由于學生高度的變化觸發(fā)紅外探測信號,使錄播計算機的錄像內(nèi)容自動切換到學生攝像機,攝像機的拍攝方向及景別由起立的學生所處的具置確定,學生回答完問題坐下后,觸發(fā)錄播計算機恢復到教師攝像機拍攝方式。兩個覆蓋區(qū)也可聯(lián)合使用。
1 “主動紅外”
所謂“主動紅外”是指安裝在錄播教室的左、右及后方的多個紅外發(fā)射裝置,按一定角度主動發(fā)射紅外波長的光波,由固定在墻上的長條型紅外光接收裝置接收該光波信號。如圖2,由于紅外發(fā)射裝置安裝的高度和位置不同,在教室內(nèi)可形成一個紅外光的三維空間。教師或學生在該空間出現(xiàn)和移動,都會使紅外接收裝置接收的信號發(fā)生變化,由此啟動錄播系統(tǒng)和改變攝像機拍攝方向。
2 “空間網(wǎng)格”
所謂“空間網(wǎng)格”,簡單的講就是在系統(tǒng)中將教室變成一個由若干個矩形網(wǎng)格組成的三維空間(如圖1)。安裝在墻上的紅外接收條裝置(粗實線)是由多個紅外接收器組成,每隔10厘米左右一個,根據(jù)教學現(xiàn)場的實際,利用系統(tǒng)軟件可對教室講臺和學生座位區(qū)進行網(wǎng)格劃分,一般是邊長為一米左右的矩形。根據(jù)人像投影等技術,系統(tǒng)可對其中的目標(教師和學生)進行準確的空間網(wǎng)格定位,包括上下、左右及前后。上下、左右決定攝像機云臺的轉動方向,前后則可以支持攝像機鏡頭的推、拉。這樣空間網(wǎng)格劃分,在錄播時就可設計多個遠景、近景等平滑變焦的策略,增加了畫面的景別變化,提升了錄制效果。
空間網(wǎng)格技術是將整個教室空間三維網(wǎng)格化,無論是老師還是學生,系統(tǒng)都可以準確的感知目標的空間位置,實現(xiàn)跟蹤“無盲區(qū)”。教師不再限制在講臺上,學生不再需要按話筒開關或按鈕,無論老師走到教室的哪個位置,無論學生在哪個位置起立回答問題,只要空間網(wǎng)格中某個紅外接收信號有所改變,系統(tǒng)都可以準確的感知,配合合理的策略,可以輕松解決“互動”。
空間網(wǎng)格技術通過提前對不同網(wǎng)格的屬性定義,系統(tǒng)不僅可以準確的感知到目標的空間位置,還可以通過網(wǎng)格的屬性對目標的動作做出分析和判斷。系統(tǒng)在這樣的分析判斷的基礎上導入拍攝思想,指導攝像機拍攝,就可形成自動錄播的智能策略。
“主動紅外+空間網(wǎng)格”技術是一項較新的專利技術,較好的解決了當前課堂教學自動錄播系統(tǒng)中教師和學生的圖像跟蹤問題。當然,它也存在設備成本較高,安裝、調(diào)試較復雜等不足,整體美觀和穩(wěn)定性也有待進一步改進。一個好的技術還必須與好的策略相配合,教師講課的類型很多,各有其特點,跟蹤技術怎樣滿足各類教師教學的拍攝需求,設計出合理的跟蹤策略還有大量的工作值得分析研究。
參考文獻
篇8
【關鍵詞】小波變換;邊緣檢測;模極大值
1.基于視頻的車輛檢測方法
車輛檢測是交通圖像監(jiān)控系統(tǒng)的關鍵,而圖像最基本的特征是邊緣。所謂邊緣是指其周圍像素灰度有階躍變化或屋頂狀變化的那些像素的集合。邊緣也可以定義為圖像局部特性的不連續(xù)性。例如,灰度級的突變,紋理結構的突變等。邊緣常常意味著一個區(qū)域的終結和另一個區(qū)域的開始。邊緣信息對圖像分析和人的視覺都是十分重要的。它是圖像分割所依據(jù)的最重要的特征,也是紋理特征的重要信息源和形狀特征的基礎,而圖像的紋理形狀特征的提取又常常要依賴于圖像分割。圖像的邊緣提取也是圖像匹配的基礎;因為它是位置的標志,對灰度的變化不敏感,它可作為圖像匹配的特征點。
運動邊緣的檢測可通過計算圖像在空間和時間上的差分獲取。空間上的差分可用各種已有的邊緣檢測算法得到,這方面的算法研究已經(jīng)很成熟, 可以應用現(xiàn)有的算法, 比如Sobel 、Roberts、Prewitt、Canny、拉普拉斯算子等,這些算子在算法復雜度以及效果上有很大的差別,一般的邊緣檢測方法是對原始車輛圖像的每個像素考察它的某個鄰域內(nèi)灰度的變化,利用邊緣鄰近一階或二階方向導數(shù)變化規(guī)律檢測邊緣,例如基于微分的邊緣檢測算子,一階微分算子有Roberts算子、Sobel算子、Prewitt算子、Canny算子等,二階微分算子有拉普拉斯算子、Logo算子等。微分算子的一個明顯缺點是對噪聲較為敏感。由于原始圖像往往含有各種噪聲,所以用這類算子進行運動車輛邊緣檢測時常常會有困難,于是只能人為地根據(jù)實際情況選用合適的算子。
2.基于小波變換的邊緣檢測理論
從小波理論入手,構造適當?shù)男〔?從多尺度的角度,通過模極大值的方法提取其邊緣這種方法可以取得較好的效果,但對選擇小波有較為嚴格的要求。圖像的二維小波變換可以分別在圖像的行和列的方向上做一維小波變換來得到,在圖像的二維小波變換中,為了便于計算,常用的是正交(或雙正交),且具緊支撐和至少一階消失矩的二進小波變換。
首先考慮連續(xù)小波變換,假設光滑函數(shù) 滿足:
3.基于小波變換的邊緣檢測算法
下面在二進小波變換的基礎上定義小波變換在每個尺度上的梯度方向和模:
由于小波變換的結果,通常使圖像的能量集中在邊緣附近,且在圖像灰度值的突變點取得局部極大值,其小波模的極大值反映了邊緣點的奇異性,所以通過小波變換可以檢測出圖像的邊緣點。在不同尺度下作小波變換其實質(zhì)就是用不同頻率的帶通濾波器對信號作濾波,因此把主要反映噪聲頻率的那些尺度的小波變換去掉,再把剩余各尺度的小波變換結合起來作反變換,就能得到較好地抑制了噪聲的信號。對于圖像的邊緣檢測,求模的局部極大值實質(zhì)上就是求梯度向量模極大。求出該小波變換的模的局部極大值點,就可以找出圖像的邊緣點。
4.改進的小波變換模局部極大值點算法
篇9
論文摘要 目的:探討糖尿病足中醫(yī)辨證分型與血管細胞核增殖相關抗原的表達差異。方法:對32例截肢的糖尿病足患者按中醫(yī)辨證分為氣血兩虛瘀阻證、脈絡瘀熱證、脈絡熱毒證和氣陰兩虛瘀阻證,分別對其截肢肢體的脛后動脈應用免疫組化法對細胞核增殖相關抗原(Ki67)的表達進行觀察、分析。結果:Ki67的陽性表達與糖尿病足動脈硬化閉塞程度呈負相關,與血管炎癥病變程度呈正相關。結論:炎癥在糖尿癥的大血管病變的過程中起到了重要的作用。
糠尿病足是糖尿病的嚴重并發(fā)癥,據(jù)統(tǒng)計1996年全球糖尿病患者1.2億,預計到2025年,將達到2.5億以上,而大約15%的糖尿病患者將在其生活的某一時間發(fā)生足潰瘍或壞疽[1]。目前對于糖尿病足病因及發(fā)病機制雖然還不是完全清楚,但大家公認糖尿病合并大血管病變導致動脈粥樣硬化是糖尿病足發(fā)病的最主要因素。現(xiàn)將2004年10月~2005年5月間我們收治的32例糖尿病足患者的截肢動脈標本的血管細胞核增殖相關抗原(Ki67)與其中醫(yī)辨證分型的相關性研究情況報告如下。
1 臨床資料
1.1 一般資料:32例均為天津醫(yī)科大學代謝病醫(yī)院和天津中醫(yī)學院第一附屬醫(yī)院2004年10月~2005年5月間的住院患者,其中男性24例,女性8例;年齡50~86歲,平均年齡69.2歲;糖尿病病程最長30年,最短6年,平均18±2.4年。
1.2 診斷標準:糖尿病足的診斷標準采用2000年中華醫(yī)學會糖尿病學會第二屆糖尿病足會議所制訂的“糖尿病足(肢端壞疽)檢查方法及診斷標準”。
1.3 截肢標準:參照國際糖尿病足工作組編寫的《糖尿病足國際共識》中關于“大截肢的定義、標準和指標”[2]執(zhí)行。
1.4 中醫(yī)辨證分型標準:參照《中醫(yī)外科學(第七版)》及《中藥新藥臨床研究指導原則·脫疽》之中醫(yī)辨證分型方案分為氣陰兩虛瘀阻證、脈絡瘀熱證、氣血兩虛瘀阻證、脈絡熱毒證四型。
2 觀察方法
2.1 標本取材:壞疽截肢標本32例,其中按中醫(yī)辨證分型氣血兩虛瘀阻組10例,脈絡瘀熱組10例,氣陰兩虛瘀阻組4例,脈絡熱毒組8例,取各例標本下肢脛后動脈。標本經(jīng)過10%福爾馬林固定,常規(guī)石蠟包埋,備用。
2.2 設備、試劑:美國PENGUIN-600CL自動圖像分析系統(tǒng),細胞核增殖相關抗原(Ki67)抗體PV9000試劑盒DAB購于北京中山生物技術有限公司。
2.3 免疫組織化學法:標本常規(guī)石蠟包埋,4μm連續(xù)切片,采用PV法進行免疫組化染色,染色過程嚴格按試劑盒染色程序進行,選取已知的陽性切片作陽性對照,PBS代替一抗作為陰性對照。觀察細胞核增殖相關抗原(Ki67),陽性物質(zhì)呈棕黃色細顆粒狀于細胞核表達,采用美國PENGUIN-600CL圖像分析系統(tǒng)進行圖像分析,選取病變處每500個細胞Ki67的陽性表達率作為其陽性表達指數(shù)。統(tǒng)計學處理應用SPSS10.0軟件包進行方差分析。
3 結果
3.1 中醫(yī)各證型所占比例以及年齡、性別分布:各證型比例,氣血兩虛瘀阻組10例(31.25%),脈絡瘀熱組10
例(31.25%),氣陰兩虛瘀阻組4例(12.5%),脈絡熱毒組8例(25.0%)。年齡、性別分布情況,見表1。
表1 32例患者年齡、性別分布 n(%)
性別n50~60歲61~70歲71~80歲80歲以上男24( 75.0)4(12.5) 8(25.0)11(34.4)1(3.1)女 8( 25.0)1( 3.1) 3( 9.3) 4(12.5)0 總計32(100.0)5(15.6)11(34.4)15(46.9)1(3.1)3.2 免疫組織化學法觀察各證型Ki67表達差異:具體情況見表2。
表2 各證型Ki67陽性表達指數(shù)比較 (%)
證型Ki67陽性表達指數(shù)脈絡熱毒 4.87±1.01*氣陰兩虛瘀阻1.86±0.47脈絡瘀熱1.49±0.13氣血兩虛瘀阻0.30±0.18注:與氣血兩虛瘀阻型比較,*P
氣血兩虛瘀阻證、脈絡熱毒證、脈絡瘀熱證、氣陰兩虛瘀阻證中均可見部分細胞Ki67呈陽性表達,在脈絡熱毒證中表達指數(shù)最高,氣血兩虛瘀阻證中表達指數(shù)最低,二者比較具有顯著性差異(P
4 討論
Ki67抗原為細胞核內(nèi)與細胞分裂增殖相關的蛋白抗原,分子量為345kd和395kd,其編碼基因位于第10號染色體上。Ki67的表達出現(xiàn)于G1中期到晚期,S期和G2期逐漸增加,有絲分裂期達高峰,分裂后迅速降解或丟失抗原決定簇,到G0期則不表達,半衰期為lh或更短[3]。有人認為它可能是具有蛋白結合特性的重要結構,在有絲分裂中起著維持DNA規(guī)則結構的重要作用[4],是一個反映細胞增殖的敏感指標。
在糖尿病足的不同辨證分型中氣血兩虛瘀阻證、脈絡熱毒證、脈絡瘀熱證、氣陰兩虛瘀阻證中Ki67表達均呈陽性,在脈絡熱毒證中表達最強、氣血兩虛瘀阻證中表達最弱,二者相比具有顯著性差異(P<0.05)。根據(jù)Ki67陽性指數(shù)可以判斷細胞增殖的活性,指明細胞增殖與糖尿病足動脈病變的關系。在糖尿病足的不同辨證分型中動脈的硬化閉塞程度由輕到重依次是脈絡熱毒證、氣陰兩虛瘀阻證、脈絡瘀熱證、氣血兩虛瘀阻證。Ki67的陽性表達與糖尿病足動脈硬化閉塞程度呈負相關。而在通過對32例糖尿病足截肢的動脈進行病理學觀察的過程中發(fā)現(xiàn)糖尿病足血管病變主要體現(xiàn)在中動脈的病理學變化,其中脈絡熱毒、氣陰兩虛瘀阻兩證型以動脈周圍及全層的炎癥性改變?yōu)橹鳎幻}絡瘀熱、氣血兩虛瘀阻證以中膜鈣化、平滑肌細胞萎縮、變性、壞死及膠原纖維增多及內(nèi)膜粥樣斑塊形成為主,炎癥表現(xiàn)不明顯;而Ki67的陽性指數(shù)與血管炎癥病變程度呈正相關。這說明炎癥在糖尿病的大血管病變的過程中起了重要的作用,特別是在脈絡熱毒證、氣陰兩虛瘀阻證兩型,這對臨床具有重要的指導意義。
5 參考文獻
1 Boulton A J. The diabetic foot:a global view. Diabetel Metab Res Rev,2000,16(1):2.
2 許樟榮,敬華.糖尿病足國際共識.中華糖尿病學會第二屆足病第一次足病研討會.2002,435.
篇10
關鍵詞:圖像拼接 圖像配準 圖像融合 虛擬現(xiàn)實
中圖分類號:TP3 文獻標識碼:A 文章編號:1672-3791(2015)01(a)-0000-00
1 引言
圖像拼接是將一組已經(jīng)在空間上配準的、相互之間存在重疊部分的圖像序列,經(jīng)過圖像變換、重采樣和圖像融合后形成一幅包含每個圖像序列的寬視角或360度視角的全景圖像的技術[1]。目前,圖像拼接技術的應用方向主要包括以下四個方面:
1.1 虛擬現(xiàn)實
將圖像拼接技術應用于虛擬現(xiàn)實系統(tǒng)中,實現(xiàn)動態(tài)或者交互式虛擬的3D環(huán)境,可以利用多個圖像源實時合成視頻,能呈現(xiàn)遠程會診和手術參與的三維場景,音樂會或體育賽事,或參加遠程教育和虛擬教室等。
1.2 提高圖像的分辨率
利用具有重疊區(qū)域的多幅圖像或者視頻圖像序列可以生成超分辨率圖像,因為圖像的重疊區(qū)域包含實際場景的很多冗余信息。
1.3 增大光學系統(tǒng)的視場角
為了有效地提高視場光學系統(tǒng),多傳感器可用于捕捉不同角度的圖像,然后使用領域的圖像拼接技術的實時拼接這些圖像,形成了較大的實地查看圖像。
通過獲取場景和目標更多的信息生成大場景圖像或三維立體圖像,以利于圖像的檢索、編輯、分析和理解。朱云芳[2]提出通過構造視頻的全景圖,利用手工與計算機相結合的方法對全景圖進行編輯,實現(xiàn)對視頻內(nèi)容的檢索和編輯。
2 圖像拼接的關鍵技術
圖像拼接的一般流程包括圖像預處理、圖像配準和圖像融合三步:
2.1圖像預處理
由于硬件設備自身缺陷,有很多不同的噪聲使得捕獲的圖像達不到圖像質(zhì)量的要求,因此需要對原始圖像進行去噪、修正等圖像預處理工作。圖像預處理階段的精度對最后拼接圖像的質(zhì)量有著很大的影響。圖像拼接預處理的主要目的就是保證圖像配準的精度,簡化圖像配準的難度。常見的預處理方法包括以下幾種[3]:
2.1.1 圖像平滑與邊緣銳化處理
由于圖像的拍攝視角不同、折疊變換不同以及存在隨機噪聲,使得具有重疊區(qū)域的圖像序列在重疊部分的細節(jié)上并不完全相同。因此,只能選取輪廓或其它主要邊緣來做特征匹配的垂直邊緣。
2.1.2 相位相關算法
如果圖像存在平移,那么可以將平移轉化到頻域,并且計算相位差。在平移運動坐標上的脈沖就是這個相位差的傅立葉反變換,在對齊兩幅圖像的位移位置后,兩幅圖像的對齊點可以通過搜索最大值的位置得到。
2.1.3 灰度圖投影算法
如果垂直方向上的平移可以忽略,而且水平方向上平移較小的時候,可以使用灰度圖投影算法對相鄰的兩幅圖像進行粗略定位。以便在進行精確配準時,減小誤,差縮小搜索范圍。首先,一個彩色圖像轉換為灰度,然后將其轉換為二進制圖像的灰度圖像,所有像素的灰度值,然后到垂直方向,預計到積累,通過比較相鄰的曲線大致可以匹配的位置圖像的投影。
2.1.4視頻序列子集的篩選
進行基于視頻的圖像拼接時,需要首先對視頻序列圖像進行篩選。由于視頻序列圖像有很充裕的重疊信息可以利用,因為它們相互之間的位移量很小。因此,為了既可以降低配準誤差和拼接圖像的不連續(xù)性,又能減小計算量,可以只選取它的一個子集,而不使用全部的視頻序列圖像。
2.1.5 基于模板匹配的算法
基于模板匹配的過程是將一幅圖像中位于重疊區(qū)域的一塊作為模板,在另一幅圖像中搜索和模板具有相同或相似值的對應塊,這樣就可以確定兩幅圖像的重疊范圍。通常情況下,如果模板面積越大,這種算法的精度就越高,但是其計算復雜度也會很高。此外,也可以使用以圖像的重疊在另一個為模板與圖像的最佳匹配的搜索兩個相鄰像素的比例為模板,然后一部分,有效地降低計算量。然而,在很多的分割計算所需的比例,將減少準確性。
2.1.6 遺傳算法估計碎片圖像的拓撲排列
如果原始圖像是一些碎片圖像,并且相機的運動方式未知或不規(guī)則(如醫(yī)學圖像,海底或者太空探測圖像),或者不知道它們的拓撲排列順序時可以使用對原始圖像序列的拓撲排列進行估計的方法。
圖像拼接的預處理是為下一步的精確配準做準備,許多預處理算法和配準算法是緊密相關的。可以根據(jù)選定的圖像配準算法來選擇相應地的預處理算法,從而提高圖像拼接精度和速度。此外,拼接圖像變換模型的選定還可以根據(jù)原始圖像的特性來,這樣就可以選擇合適的圖像拼接預處理算法和圖像配準算法。
2.2 圖像配準
圖像配準的定義是關于同一目標的兩幅或者多幅圖像在空間位置上的對準。如果對同一目標的兩個圖像是相同的,即可完成圖像配準并不難。圖像配準是一個非常復雜的技術過程。由于捕捉到不同時刻,不同視場和不同的成像傳感器隨著亮度的噪音和各種不同的成像過程的耦合,而是具有某種程度的相似性兩個圖像[4]。圖像配準的過程主要包括以下幾個步驟:
2.2.1 選擇特征空間
可以根據(jù)待配準圖像的各種不同特征來實現(xiàn)匹配,主要包括圖像本身的亮度,圖像的邊緣、曲線、角點、直線交點、高曲率點,圖像的不變矩、重心等。
2.2.2選擇相似性測度
圖像配準中最重要的步驟是相似性測度的選擇,因為相似性測度的結果決定了兩幅圖像是否匹配,而且決定了如何確定匹配位置。
2.2.3 選擇搜索空間與策略
搜索空間的目的是找到圖像配準的最佳位置的集合。在很多情況下,減少測量的數(shù)量是很重要的,因為誤匹配位置越多,計算量就越大,問題就越嚴重。在有些情況下,可以利用一些已知信息去掉不可能匹配的搜索子空間,從而達到減少計算量的目的。為了減少計算量,匹配時還需要選擇合適的搜索策略。
圖像配準算法與圖像拼接算法的準確率、拼接精度和拼接速度直接相關,是圖像拼接技術的關鍵部分。目前,學者主要從以上幾個方面進行研究,以改進圖像配準算法的性能,即減少配準的時間、提高配準的精度。
2.3 圖像融合
得到圖像序列之間精確的空間變換關系在經(jīng)過圖像配準之后,為了把多幅原始圖像拼合成一幅全景圖還需要進行圖像融合。圖像融合的主要過程包括:鄰近地區(qū)的拼接圖像對齊縫合,以消除由全球累積誤差和圖像失真造成的多個圖像重疊區(qū)域,繪制了全景拼接圖像的過程[5]。
圖像拼接預處理是為圖像配準做準備的,以提高圖像配準的精度和速度,在一些情況下可以省略預處理過程;圖像配準是圖像拼接的核心和關鍵技術;圖像融合是為了保證拼接圖像的質(zhì)量,消除圖像的亮度差異、拼接縫隙和鬼影問題等。
3 圖像拼接的研究進展
目前,圖像拼接技術已經(jīng)被廣泛應用于軍事和民用領域,如虛擬現(xiàn)實、衛(wèi)星遙感、海底勘探、機器人視覺、無人機監(jiān)視和搜索、視頻監(jiān)控、醫(yī)學探查等 [6]。
3.1 實時圖像拼接
實時圖像拼接系統(tǒng)能夠實時進行圖像采集、實時完成圖像拼接和拼接圖像的輸出、顯示。為了提高系統(tǒng)處理圖像數(shù)據(jù)的速度,實時拼接在低層次的語言在圖像拼接算法的核心處理單元的嵌入式圖像拼接的形式在運算速度用于滿足實時應用的要求算法,甚至是硬件圖像系統(tǒng)要求。
實時圖像拼接技術的巨大推動力來源于眾多的實際應用需求,圖像拼接算法,人們深入研究和微電子技術的飛速發(fā)展,使得具體應用的發(fā)展,圖像處理的圖像拼接算法的效率和穩(wěn)健進入高速處理單元,在可能的核嵌入式實時圖像馬賽克鑲嵌圖像系統(tǒng)及其應用的熱點技術。
3.2 自動圖像拼接
雖然人類獲取和存儲圖像數(shù)據(jù)的能力在不斷增強,并且巨大的數(shù)據(jù)倉庫已經(jīng)形成,但是還很欠缺高效地處理這些數(shù)據(jù)的能力。例如:由無人機采集的視頻仍然需要人類實時監(jiān)視,并以回放的方式進行分析。因為圖像分析人員數(shù)量很少,而且這種工作非常的艱難,于是要求計算機能夠自動進行圖像拼接,并且能夠跟蹤圖像中用戶感興趣的目標,并進行標記和注釋。
關于自動圖像拼接的研究主要包括兩個方面:①自動判斷參考圖像與待拼接圖像是否能夠進行拼接。②根據(jù)待拼接圖像的類型自動選擇合適的拼接算法,然后自動進行圖像配準和融合,最后采用客觀的圖像質(zhì)量評價方法,自動判斷拼接后的圖像質(zhì)量是否滿足用戶的要求。
3.3 彩色圖像拼接
彩色圖像比灰度圖像更能夠滿足人類視覺感知要求,因為它能夠提供更多的圖像信息。而且,更有利于圖像的彩色圖像分析和目標識別與跟蹤,彩色圖像拼接技術已成為一個重要方面。
3.4 3D立體圖像拼接
如果不同觀看影像或三維立體的圖像拼接大量冗余信息的視頻序列的使用,可以使圖像瀏覽,分析和理解更加容易。由于圖像拼接技術與很多學科的理論和技術相關聯(lián),使得圖像拼接技術的研究和發(fā)展不是那么迅速。近些年來,國內(nèi)外學者進行了大量的研究和開發(fā)工作,并取得了豐碩的成果,有效地提高圖像拼接的質(zhì)量和魯棒性。
4 結語
圖像拼接技術是虛擬現(xiàn)實和圖像繪制技術研究重點,隨著圖像拼接技術的不斷發(fā)展,其在工作和生活中的應用將會越來越廣泛,將會對經(jīng)濟社會發(fā)展產(chǎn)生較大影響。
參考文獻
[1] 強贊霞,彭嘉雄,王洪群.基于傅里葉變換的遙感圖像配準算法[J].紅外與激光工程,2004,33(4):385-387.
[2] 朱云芳.基于圖像拼接的視頻編輯[D].浙江:浙江大學博士論文,2006.
[3] 張朝偉,周焰,吳思勵,等.基于SIFT特征匹配的監(jiān)控圖像自動拼接[J].計算機應用,2008,28(1):191-194.
- 上一篇:現(xiàn)代標志設計論文
- 下一篇:圖像處理技術論文