航空和衛(wèi)星的建模和問題探究
時(shí)間:2022-09-20 04:58:38
導(dǎo)語:航空和衛(wèi)星的建模和問題探究一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
本文作者:SowmyaArArcot工作單位:
1引言
利用攝影測量和遙感為制圖和GIS獲取數(shù)據(jù),傳統(tǒng)方法的特點(diǎn)是人工有效地從影像__匕提取高精度的三維數(shù)據(jù),在距離_匕這些影像從空間平臺(tái)獲取的圖像到近景固定目標(biāo)圖像。一般來說,這些生產(chǎn)程序是費(fèi)時(shí)并且很昂貴。在目前的制圖和GIS預(yù)算基礎(chǔ)上,傳統(tǒng)的方法限制了能提取的地形信息的數(shù)量和分辨率。另外,山于數(shù)據(jù)獲取當(dāng)局采用了不合理的數(shù)據(jù)更新周期,在很多情況下,數(shù)據(jù)趨向于過時(shí)。數(shù)據(jù)獲取系統(tǒng)總是技術(shù)驅(qū)動(dòng)的,并且適應(yīng)最新的方法和設(shè)備。將來,當(dāng)數(shù)字系統(tǒng)成為現(xiàn)實(shí)時(shí),這將毫無疑問會(huì)繼續(xù).在提高自動(dòng)化水平的基礎(chǔ)上,數(shù)字系統(tǒng)為提取制圖和GIS所需信息提供新方法。新方法中也包括計(jì)算機(jī)視覺中的邊緣裁剪技術(shù),該技術(shù)利用了人工智能和機(jī)器學(xué)習(xí)等領(lǐng)域知識(shí)。兇此,攝影測量與遙感和計(jì)算機(jī)視覺與人工智能等領(lǐng)域的研究人員觸合他們各自的技能來解決這個(gè)應(yīng)用領(lǐng)域的一些具體的問題。在攝影測量與遙感領(lǐng)域自動(dòng)提取地面地形信息需要過程的簡潔表達(dá)和壓縮影像范圍的知識(shí)。這是一個(gè)很重要的工作,因?yàn)橛跋裰袃?chǔ)存著極其復(fù)雜的信息。攝影測量中獲得的地表地形的影像的比例尺可從l:3000到l:90000,而遙感獲得的影像的像素分辨率可從!米到30米不等。地形的影像特征的結(jié)構(gòu)很復(fù)雜.它是由很多不同的亮度組合而成的,這些亮度可以表達(dá)例如,核物、地表、水文等這樣的自然特征:也可以表達(dá)例如,房屋、道路等人工建筑,還能表達(dá)像陰影或亮度所造成影明的人造物體。另外,遙感影像中,一些特征之間的關(guān)系比一般照片上的特征之間的關(guān)系復(fù)雜。這些特征意味著航天和衛(wèi)星影像的信息提取是很大的挑戰(zhàn)。信息提取的研究首先得考慮數(shù)據(jù)的語義方面的問題。可是,提取的信息的幾何性質(zhì)也必須被考慮,以至于可以確保空間數(shù)據(jù)的相關(guān)規(guī)范性。計(jì)算機(jī)視覺是一門自動(dòng)和集成廣泛可用于可視處理和表達(dá)方法的科學(xué),通過建立清晰、有意義的影像上的對(duì)象描述,應(yīng)用方法和技術(shù)很廣泛,其中包括數(shù)字影像處理,模式識(shí)別,幾何建模,理解和認(rèn)知處理.計(jì)算機(jī)視覺本身主要涉及影像解譯和圖像識(shí)別問題,并且試圖通過目標(biāo)和場景識(shí)別來解決這些問題。在這個(gè)過程中,使用從影像中提取屬性和關(guān)系的技術(shù)、形狀表達(dá)和描述技術(shù),最后,利用提取和描述的特征進(jìn)行基于模型的識(shí)別。由于影像獲取的方法,在從數(shù)字遙感影像提取信息的過程中計(jì)算機(jī)視覺方法的應(yīng)用是很復(fù)雜的,因而,當(dāng)使用針對(duì)普通照片影像的提取方法時(shí),要仔細(xì)考慮遙感影像的數(shù)據(jù)特征。在計(jì)算機(jī)視覺應(yīng)用中很難處理的特征,在航空和衛(wèi)星影像同樣也是很難處理。普通的影響因素包括獲取影像過程中的噪音,陰影的影響,由于照相機(jī)的角度和定位引起的幾何變形的影響和光照的影響,由于封閉和部分目標(biāo)等問題所引起的影響.解譯航空(衛(wèi)星)影像和其他的圖像時(shí)采用的方法是不同的.三維物體幾何形狀是航空影像判讀過程中的最基本的元素,這并不是因?yàn)橐崛「叱痰脑?而且是因?yàn)樵谂凶x中三維對(duì)象可提供更多的信息。是三維還是二維信息更有利于特征的描述,這樣的問題便被提出來了。在計(jì)算機(jī)科學(xué)領(lǐng)域里,對(duì)大多數(shù)研究而言,二維圖像數(shù)據(jù)一般認(rèn)為是足夠的,盡管有研究小組正從事立體視覺和深度信息提取方面的研究。盡管有些例外,但大多數(shù)形狀和位置描述決定了計(jì)算機(jī)視覺中的對(duì)象模型,對(duì)于中、低分辨率的航空影像,使用纂于形狀的識(shí)別是令人質(zhì)疑的。然而,上下文信息對(duì)遙感影像的解譯有很大的作用。比如,橋作為穿過河流的道路的一部分可能很容易被識(shí)別。航空影像中的目標(biāo)很密集,并有很多的組成部分,這一現(xiàn)象己被認(rèn)識(shí)到了。這與計(jì)算機(jī)視覺最近的發(fā)展趨勢(shì)是一致,計(jì)算機(jī)視覺識(shí)別圖像上的目標(biāo),首先是分離不同目標(biāo)的組成部分和它們之間的關(guān)系。這篇文章將回顧一些在計(jì)算機(jī)視覺中己使用的知識(shí)描述和建模的方法,并給出他們?cè)谘芯窟b感影像理解方面的例子。方法很多,要討論這個(gè)領(lǐng)域中所有正在被研究者所使用的方法是不可能的。其他方法的討論可能會(huì)涉及其他的領(lǐng)域,如Crevicr和LePage基于知識(shí)的影像理解的方法.Hancock和Kittler方法是兩種松弛技術(shù),sriniva犯n是人工智能技術(shù)在遙感方面的探索等。第二部分將介紹機(jī)器視覺領(lǐng)域中的知識(shí)的定義、知識(shí)表達(dá)的方法、控制問題、特征建模方法。第三部分介紹特征表達(dá)和特征識(shí)別的過程。第四部分介紹知識(shí)表達(dá)方法在航空測量和遙感中的應(yīng)用實(shí)例.
2知識(shí)、表達(dá)和模型
2.1知識(shí)的定義•MerriamWebsterDictionary把知識(shí)定義為己知的事實(shí)和條件,知識(shí)是通過經(jīng)驗(yàn)和聯(lián)想獲得,它的范圍包括人所獲得的信息和理解,是己知的總和。表達(dá)是描述的行為,狀態(tài)和行為的描述.表達(dá)成與本質(zhì)相應(yīng)的具有特殊特征或品質(zhì)的符號(hào)、副本或圖像。模型是事物的仿真表達(dá),是仿真的實(shí)例。在計(jì)算機(jī)視覺和人工智能中,這些術(shù)語的應(yīng)用不是很嚴(yán)格.與它們的字典中的意思和技術(shù)定義相適應(yīng),很難確切定義。計(jì)算機(jī)視覺必須獲取影像中場景的有用的描述,最初的描述就是圖像強(qiáng)度值的陣列。在低層視覺階段,進(jìn)行圖像的初步處理。中級(jí)階段應(yīng)用獨(dú)立的鄰域處理方法提取圖像的特征和標(biāo)識(shí)不同的部分。高級(jí)階段歸納更多圖像特征表達(dá),在這個(gè)階段進(jìn)行初步識(shí)別.為了處理光線和視角的變化、形狀和陰影的影響、圖像處理如,相機(jī)角度和位置的變化和低層處理中的嗓聲問題,我們需要現(xiàn)實(shí)世界有關(guān)圖像獲取和應(yīng)用等方面的知識(shí),這些知識(shí)是較高層的豐富的表達(dá),這在計(jì)算機(jī)視覺中稱為模型。這些模型解釋、描述或抽象了圖像信息。圖像和模型之間的橋梁就是一定范圍的表達(dá),它聯(lián)結(jié)著輸入圖像和輸出解釋。(l)生成圖像,圖像是輸入數(shù)據(jù)的圖像和模擬表達(dá)例如:二值圖像和側(cè)面影像。(2)分割圖像,分割后的圖像由與實(shí)際目標(biāo)相應(yīng)的一些像素組成,例如:分割算法的輸出。(3)關(guān)系模型,它是經(jīng)過編碼后的知識(shí),用于高層推理和解譯.每種表達(dá)方法有它的應(yīng)用范圍的局限性。所以,在圖像解譯中,所有四種類型的表達(dá)方法都是重要的。我們應(yīng)該重點(diǎn)放在第四種上,即關(guān)系模型,它包含了用于圖像理解目的的知識(shí)表達(dá)和模型。2.2知識(shí)表達(dá)知識(shí)表達(dá)的目的是用計(jì)算機(jī)易于處理的形式表達(dá)知識(shí)。一個(gè)好的計(jì)算機(jī)表達(dá)語言應(yīng)該易于表達(dá)、簡潔、意義明了的、獨(dú)立的。FOL(FirstOrderLoglc)語言是人工智能中表達(dá)方案的基礎(chǔ).FOL有規(guī)范的語法和語義,在這種語言里,一個(gè)句子的解譯也就是上面談及的。FOL的推斷過程允許從舊語句中推斷出新語句。這種規(guī)范的推斷過程可以用于自動(dòng)的從已知的事實(shí)中獲取正確的結(jié)論.邏輯編程語言和產(chǎn)品系統(tǒng)二者都以FOL為基礎(chǔ).像Prolog這樣的邏輯編程語言允許用FOL的嚴(yán)格模式描述知識(shí),也能完成推斷過程,可以從通用的知識(shí)里提取新的信息。邏輯編程語言通常使用“后向鏈”控制,用后向的邏輯推理法:為證明一些事物,他們發(fā)現(xiàn)數(shù)據(jù)庫中的邏輯關(guān)系有助于結(jié)論的形成。因此,當(dāng)一個(gè)目標(biāo)確定后,“后向鏈”是推理中的最佳方式。產(chǎn)品系統(tǒng)由現(xiàn)存的事物的知識(shí)庫、一組規(guī)則或“產(chǎn)品”組成,這些都是用邏輯關(guān)系表達(dá)的。下面是一個(gè)產(chǎn)品系統(tǒng)的例子。如果一個(gè)區(qū)域是一個(gè)長型的、性質(zhì)相同的目標(biāo),那么他屬于道路。產(chǎn)品系統(tǒng)以匹配,選擇,產(chǎn)生結(jié)果這種方式永不停息地循環(huán),應(yīng)用數(shù)據(jù)庫的知識(shí),產(chǎn)生新的信息。在匹配階段,系統(tǒng)尋找所有已有的、滿足當(dāng)前數(shù)據(jù)的法則。在選擇階段,系統(tǒng)運(yùn)用第一階段的匹配原則,選擇一個(gè)規(guī)則來執(zhí)行。選擇的規(guī)則在結(jié)果產(chǎn)生階段被執(zhí)行,在這個(gè)階段可能會(huì)牽涉知識(shí)庫里知識(shí)的增加或側(cè)除,和數(shù)據(jù)的輸入、輸出。在人工智能和航空側(cè)里與遙感領(lǐng)域,框架和語義網(wǎng)絡(luò)是最近最流行的值時(shí)表達(dá)結(jié)構(gòu)。它應(yīng)用隱喻,把對(duì)象表達(dá)為曲線圖中的節(jié)點(diǎn),這些節(jié)點(diǎn)用分類的結(jié)構(gòu)組織,節(jié)點(diǎn)之間的關(guān)系表述為二進(jìn)制的關(guān)系.在框架系統(tǒng)中,二進(jìn)制的關(guān)系被認(rèn)為是其他框架填充過來的空槽;在語義網(wǎng)絡(luò)中,它們之間的關(guān)系被認(rèn)作是節(jié)點(diǎn)中的有向線。這兩個(gè)系統(tǒng)的意義和所要完成的任務(wù)是相同的.描述邏輯系統(tǒng)是從語義網(wǎng)絡(luò)發(fā)展而來的,最基本的思想是利用目標(biāo)和類別的復(fù)雜定義和它們之間來進(jìn)行表達(dá)和推理。描述邏輯語言提供三種推理支持:(l)概念描述的分類,在特殊的層次中概念的自動(dòng)整理。(2)對(duì)獨(dú)立目標(biāo)根據(jù)它們的屬性分類。(3)知識(shí)庫所有知識(shí)一致性維護(hù)。對(duì)于這些邏輯所支持的語言幾乎無法表達(dá),并且很難詳細(xì)闡述復(fù)雜的制約條件.這些語言的優(yōu)點(diǎn)是他們有依據(jù)推理服務(wù)的正式的語義和簡單的邏輯操作.簡言之,像Prolog這樣的邏輯編程語言有一個(gè)執(zhí)行模型,這種執(zhí)行模型很簡單,以至于一個(gè)程序設(shè)計(jì)員就可處理。近來,Pr。109編譯器被推薦作為小型人工智能項(xiàng)目一c產(chǎn)品系統(tǒng)的首選開發(fā)工具,該產(chǎn)品系統(tǒng)是一個(gè)流行的人工建模推理系統(tǒng);與Prolog不同的是,產(chǎn)品系統(tǒng)不是基于查詢的,而是開放的、不間斷的系統(tǒng),它處于連續(xù)的操作中。語義系統(tǒng)提供一個(gè)比基于文本式的形式主義更容易理解的圖形界面。它可以像FOL一樣富有表現(xiàn)力,盡管大多數(shù)并不是這樣,因?yàn)檫@種系統(tǒng)強(qiáng)加嚴(yán)厲的拘束于可以表達(dá)的對(duì)象之上.他的優(yōu)點(diǎn)其中包括能表模塊方法中的層次關(guān)系,并且相對(duì)比較簡單。描述邏輯把清楚的語義與簡單的邏輯操結(jié)合起來.所以,當(dāng)所有的方案都依據(jù)FOL語言,就有這種或那種方法的折衷.2.3控制問題不管選擇什么樣的影像表達(dá),影像數(shù)據(jù)的處理和影像數(shù)據(jù)的表達(dá)處理可以稱為影像數(shù)據(jù)驅(qū)動(dòng),稱為從下而上的控制,或可稱為內(nèi)部模型控制,叫做從上而下的控制。自下而上的數(shù)據(jù)驅(qū)動(dòng)包括從影像處理、分割到描述,每一階段為下階段準(zhǔn)備數(shù)據(jù)。如果鄰域影像處理方法成本底,而且輸入的數(shù)據(jù)是準(zhǔn)確、可信的話,從下而上的控制是有用的.馬爾(Marr)和Ullman致力于自下而上的方法研究.這種自下而上的方法是基于人類視覺數(shù)據(jù)不變的自下而上的處理基礎(chǔ)上的。Marr認(rèn)為這個(gè)系統(tǒng)導(dǎo)致一個(gè)中間描述叫做21/2維的結(jié)構(gòu),包括地表定位、參考視場中的距離和方位。另外,Ullman假設(shè)高水平的處理叫做可視化程序,它檢測中間表達(dá)中的感興趣特征。自上而下的模型驅(qū)動(dòng)控制是被知識(shí)庫里產(chǎn)生的可能性和先決條件驅(qū)動(dòng)的。因而,模型驅(qū)動(dòng)控制嘗試用一種目標(biāo)指向的行為去執(zhí)行內(nèi)部的模型證明.一個(gè)普通的自上而下的控制方法是假設(shè)和證明。這個(gè)一般可以控制低層次的操作.好像支持的人類可視化某些方面的關(guān)系并不是自上而下,這個(gè)發(fā)現(xiàn)促進(jìn)了模型驅(qū)動(dòng)方法的發(fā)展。降低低水平處理過程的設(shè)想亦如此。在實(shí)際操作中,計(jì)算機(jī)視覺系統(tǒng)趨向于混合使用自上而下和自下而上兩中控制方法,系統(tǒng)的重點(diǎn)在方法效率和實(shí)用上.并行和串行計(jì)算可能在所有的設(shè)計(jì)中都用上了。自上而下和自下而上這兩種控制隱含了一種層次處理關(guān)系.在層次控制中,控制程序看作是合作收集和競爭專家,在任何時(shí)候,“專家”幫助大多數(shù)選擇。黑板結(jié)構(gòu)是這種方法的一個(gè)例子,在黑板結(jié)構(gòu)中模塊化的知識(shí)源之間通過一個(gè)公共的黑板(存儲(chǔ)器)進(jìn)行通訊,它們可以通過這個(gè)公共的黑板進(jìn)行輸入和輸出。2.4建模問題在計(jì)算機(jī)視覺中的基于模型的方法中,在一類圖象中可按優(yōu)先次序定義了一些模型,并利用這些模型來進(jìn)行目標(biāo)識(shí)別。這些模型對(duì)現(xiàn)實(shí)世界和應(yīng)用中的一些外部知識(shí)進(jìn)行編碼二目標(biāo)模型可能是外觀模型,形狀模型,物理模型等。在目標(biāo)表達(dá)上,每一個(gè)模型應(yīng)該適應(yīng)一定的變化范圍,這些變化可能是由于視角的變化、光照的變化、柔韌目標(biāo)的形狀變化等因素引起的.另外,影像獲取本身的多變性、每組對(duì)象中單個(gè)對(duì)象的多變性,也要考慮進(jìn)去.感興趣的目標(biāo)可能是二維的或三維的:這些目標(biāo)可能是剛性的、有鏈接的或有韌性的。圖像可能是距離圖像或是強(qiáng)度圖像.識(shí)別就是確定圖像上不同的特征和在匹配階段對(duì)比模型特征。模型(圖像)的關(guān)聯(lián)特征可以用前面己經(jīng)討論過的方法中的一種來表達(dá)。在一幅沒有限制場景的強(qiáng)度圖像識(shí)別一個(gè)三維目標(biāo)是很困難的,航片和衛(wèi)星影像就屬于這類情況。深度信息的丟失、遮擋和混亂的細(xì)節(jié)信息產(chǎn)生了很多問題:另外,圖像的強(qiáng)度間接與目標(biāo)的形狀相關(guān).
3特征的自動(dòng)提取
絕大多數(shù)影像解譯系統(tǒng)的目的是在影像中提取/識(shí)別目標(biāo).在基于模型的方法中,它通過首先提取目標(biāo)屬性,然后再將他們與模型匹配。3.1特征屬性的描述在計(jì)算機(jī)可視中,目標(biāo)的屬性、性質(zhì)和可以從影像中提取的場景都叫做特征.這些屬性有時(shí)被分類為全局屬性和局部屬性。然而,在攝影測量與遙感領(lǐng)域,“特征”這個(gè)術(shù)語是指圖像上可識(shí)別的目標(biāo)或者結(jié)構(gòu),如道路、建筑物,特征的分類依賴于具體應(yīng)用:舉個(gè)例子,對(duì)航空影像來說,全局性的描述可以包括航影像覆蓋的地區(qū)例如:城區(qū)或郊區(qū)。避免過多的名字和定義,文章中的混淆就會(huì)減少。在這篇文章里,攝影測量中的術(shù)語“特征”即是影像中可識(shí)別的對(duì)象。若涉及對(duì)象的性質(zhì),我們就要用術(shù)語:“屬性”了。目標(biāo)的全局屬性可以概括為目標(biāo)完全可視化部分的信息,如面積、周長、長度等。理論上講,為了處理多分辨率和多變的圖像,這些全局性屬性應(yīng)是縮放和平移不變的。特征不應(yīng)該重疊,這樣可以避免混亂和遮擋:另外,目標(biāo)每個(gè)不同視角需要獨(dú)立的模型,這樣可以處理多視角圖像。例如,在攝影測量中,局部屬性可能是聯(lián)結(jié)和分割的邊緣,這些可以看作特征的獨(dú)立屬性。然而,在計(jì)算機(jī)可視化中,局部屬性大多數(shù)時(shí)候被看作屬性之間的聯(lián)系,或者是上下文。相關(guān)的屬性在圖表中構(gòu)成。評(píng)價(jià)特征屬性表達(dá)方案的標(biāo)準(zhǔn)是敏感度、范圍、穩(wěn)定性、有效性和獨(dú)特性.根據(jù)這些標(biāo)準(zhǔn),研究者總結(jié)出一個(gè)基于模型方法的好的表達(dá),.其中包括局部屬性和圖像特定區(qū)域和目標(biāo)的組合。這是因?yàn)榫植繉傩钥梢愿鶕?jù)輸入數(shù)據(jù)的有限部分有效計(jì)算出來;這些屬性很穩(wěn)定,因?yàn)楸硐蟮囊稽c(diǎn)變化僅僅影響某些屬性,目標(biāo)的局部遮擋僅僅影響局部特征。邊緣連接就是邊緣分析基礎(chǔ)上的局部特征的一個(gè)例子.多尺度表達(dá)是可取的,因?yàn)樵诖蟪叨壬?兩個(gè)大體上相似的目標(biāo)具有相似的描述,即使在小尺度上有一些不同。不管是從影像數(shù)據(jù)庫還是從經(jīng)過高分辨率重采樣的影像上,對(duì)于航空影像和衛(wèi)星影像而言,這種多尺度描述是比較容易獲得的。這個(gè)選擇項(xiàng)并不是對(duì)大多數(shù)計(jì)算機(jī)視覺應(yīng)用都有用。唯一的模型判斷標(biāo)準(zhǔn)在特征識(shí)別過程中并不重要,因?yàn)樽R(shí)別的方法能夠允許由于噪音和遮擋等原因造成的錯(cuò)誤匹配。比較航空影像、衛(wèi)星影像和計(jì)算機(jī)視覺中的圖像而言,前者局部特征的定位比較容易,因?yàn)榍罢叩耐夥轿辉睾拖鄼C(jī)參數(shù)是己知的或者可以推倒出來。對(duì)于大多數(shù)航空影像計(jì)算機(jī)視覺研究而言二描述己經(jīng)是足夠的,但是三維模型和匹配經(jīng)常應(yīng)用于攝影測量中,例如建筑物形狀提取。最后,什么屬性對(duì)于特征提取或識(shí)別有用呢?屬性要能表達(dá)不同的特征和圖像不同的部分之間的區(qū)別。第二,屬性要能反映外部世界的規(guī)律和結(jié)構(gòu)。這樣,屬性的選擇就是與應(yīng)用無關(guān)的了.在遙感中,通過輻射校正、地物的光譜特征和地面的真實(shí)情況,所得到的多光譜影像的特征是眾所周知的。一些屬性的規(guī)律將可以從這些特征知識(shí)中提取:例如,不同類型的地面覆蓋的光譜特性,如不同類型的植被、土壤、礦物質(zhì)、水和一些人工建筑物經(jīng)過多年廣泛的實(shí)驗(yàn)和地面事實(shí)已經(jīng)被確定了。在計(jì)算機(jī)視覺中,另外一些屬性是基于形狀和外形的;例如.道路是窄的條帶,建筑物是封閉的多邊型等。另外一些屬性是基于上下文的,例如,建筑物通常位于道路旁,橋一般是跨越在河上的。特征可以一定的結(jié)構(gòu)進(jìn)行組織。一種方法是用層次的方法組織它們的部分或全部關(guān)系,例如基于系統(tǒng)的語義網(wǎng)絡(luò)。第二種方法根據(jù)鄰接關(guān)系來組織它們。后者對(duì)應(yīng)于空間臨近或上下文關(guān)系。二者都可以用圖形表達(dá)。32特征識(shí)別計(jì)算機(jī)視覺中的目標(biāo)識(shí)別與攝影測量中的特征提取相對(duì)應(yīng)。為了從一幅圖像上識(shí)別單個(gè)目標(biāo),自下至上的數(shù)據(jù)驅(qū)動(dòng)控制通常是足夠的,其中屬性第一次被檢測和表達(dá)成符號(hào).通過聚集比較原始的屬性來確定新的特征.利用這些屬性從模型庫中選擇合適的模型,也稱為索引。然后找到與影像屬性最匹配的模型屬性。最后,利用一些決策程序來校正模型屬性.查找過程本質(zhì)上包括歸類、建立索引和匹配等步驟。然而,在包含多個(gè)目標(biāo),并且有遮擋和重疊的比較復(fù)雜的遙感影像中自下至上控制是不適用的,另外,在質(zhì)量比較差的圖像中噪聲會(huì)產(chǎn)生假屬性。對(duì)于遙感圖像,這是一個(gè)非常合適的方案.在這種情況下,自上而下或者混和控制策略是比較有用的.在自上而下的方法中,假設(shè)階段需要利用屬性檢索模型的組織,使得基于觀測的屬性和一小部分合適的目標(biāo)可以被選擇.在校正階段應(yīng)用選用的模型來識(shí)別目標(biāo).在混合方法上,兩個(gè)階段的聯(lián)合提高了處理效率。當(dāng)結(jié)果屬性比單個(gè)屬性更豐富時(shí),就可以對(duì)屬性進(jìn)行組合.這個(gè)過程稱為知覺組織.Lowe提出了目標(biāo)識(shí)別中組合問題和屬性組合標(biāo)準(zhǔn)。他尋找邊緣分割的結(jié)構(gòu),它應(yīng)該是在一定的投影方式下具有普遍性。例如同線性和平行邊緣。Zerroug和Nevatia應(yīng)用均勻投影方法把圓柱投影到二維空間。許多研究者己經(jīng)研制了專業(yè)組合方法,例如:steger等的用于路道提取的方案,Hewricsson和Baltsavias等的用于建筑物的提取方案。顯然局部上下文信息在屬性組合中發(fā)揮著重要的作用,因?yàn)?為了定義局部上下文信息,人們希望把描述局部屬性與其他屬性之間的關(guān)系作一些特定安排。有關(guān)遮擋、透視、幾何、物理方面的一般知識(shí)對(duì)識(shí)別來說是必要的.Brooks(1981)建立了一個(gè)名為^eRoNYM的目標(biāo)識(shí)別幾何推理系統(tǒng).Matsuyama和H、ang(一985)研制的s一oMA系統(tǒng),其中包括了幾何推理專家模塊。Mc引one和Shufelt(1994)在他們的系統(tǒng)中考慮了投影幾何,以用于建筑物提取,而Lang和Forstner(1996)在建筑物提取中應(yīng)用了多態(tài)特性.上下文信息在圖像理解起著重要的作用。特別在松弛標(biāo)記方法中,該方法用局部和全局上下文信息來進(jìn)行圖像區(qū)域或目標(biāo)標(biāo)記。經(jīng)過分割階段,場景標(biāo)記應(yīng)該與場景知識(shí)相對(duì)應(yīng),并且標(biāo)記應(yīng)該是一致的.這個(gè)問題用約束傳播的方法來解決.局部約束導(dǎo)致局部一致,并且通過迭代的方法,局部一致性與整幅圖像的一致性相協(xié)調(diào)。關(guān)于松弛標(biāo)記方法的詳細(xì)論述可以參考Hancock和Kittle:的文章。離散的松弛方法很簡單,只能處理完整和精確的分割.概率松弛方法是建立在局部不一致性很可能全局解譯比一致很有價(jià)值但不易于解釋的基礎(chǔ)上的,可參見早期Rosenfeld等人(1976)關(guān)于這種方法的一個(gè)例子.為了處理匹配階段的不確定性,人們應(yīng)用了多種基于證據(jù)的技術(shù),例如:Dompstershafer理論,可靠性估計(jì),模糊邏輯,最小錯(cuò)誤原理,可信度估計(jì),隨機(jī)封閉集,貝葉斯網(wǎng)絡(luò)等.
4建模和表達(dá)方法應(yīng)用的一些例子
在計(jì)算機(jī)視覺和攝影測量與遙感領(lǐng)域中的知識(shí)表達(dá)和建模方法的應(yīng)用就是前述一些方法的具體化。這些應(yīng)用的領(lǐng)導(dǎo)者在理論上是機(jī)器械視覺的研究者。在攝影測量與遙感領(lǐng)域,所采用的方法緊隨計(jì)算機(jī)視覺領(lǐng)域之后,這些方法己經(jīng)改進(jìn)成信息提取的方法了.這些應(yīng)用表明攝影測量與遙感領(lǐng)域的研究者在人工智能技術(shù)上達(dá)到了專業(yè)水平。這些方法己經(jīng)從基于規(guī)則的系統(tǒng)發(fā)展到語義網(wǎng)絡(luò),從框架發(fā)展到邏輯描述。在這一部分,計(jì)算機(jī)視覺和攝影測量與遙感領(lǐng)域中的一些應(yīng)用的回顧就表明了這個(gè)趨勢(shì).4.1邏輯Reiter和Mackworth是第一批在計(jì)算機(jī)視覺系統(tǒng)中,應(yīng)用邏輯作為一種表達(dá)方式的研究者.在他們的著作中,他們提議用一個(gè)邏輯框架結(jié)構(gòu)來描述和解譯圖像和場景知識(shí),并且提出二者之間的形式映射關(guān)系。他們陳述了影像原理,場景原理和描述原則,這些原理的邏輯模型形成了影像的解譯。他們應(yīng)用一個(gè)稱為Mapse的簡單地圖理解系統(tǒng)來說明他們的方法。雖然這種應(yīng)用具有相對(duì)的局限性,但是還沒有新的系統(tǒng)被報(bào)道。一個(gè)原因是計(jì)算方法的復(fù)雜性。當(dāng)邏輯提供一個(gè)一致的形式來說明約束,特定的研究使用邏輯的效率并不高。另外,FOL本身善長描述數(shù)據(jù)的不確定性和不完整性,這些存在于圖像屬性之中。影像元素與影像對(duì)象之間的對(duì)應(yīng)并不是一對(duì)一的關(guān)系,另外的邏輯關(guān)系對(duì)這些模型是必要的。Matsuyama和Hwang采用了一個(gè)邏輯框架結(jié)構(gòu),在這種結(jié)構(gòu)中,動(dòng)態(tài)產(chǎn)生新的邏輯一致性和規(guī)則。4.2基于規(guī)則的產(chǎn)品系統(tǒng)Brooks研制了基于模型的影像理解系統(tǒng)一一ACRONYM系統(tǒng)用來檢測三維目標(biāo),并用它進(jìn)行了從航空影像上提取人工地物的實(shí)驗(yàn)。三維模型使用一個(gè)基于框架的表述來儲(chǔ)存。對(duì)提供的影像進(jìn)行了分析,ACRONYM系統(tǒng)提取了線段并獲得二維圓柱。幾何知識(shí)和圖像條件經(jīng)過編碼,形成規(guī)則被用來產(chǎn)生場景的三維模型,然后這些與框架相匹配以便識(shí)別人工地物。sIGMA是一種用框架來描述知識(shí),并且使用從上而下和從下而上兩種控制方案來提取特征的航空影像理解系統(tǒng)。它包括三個(gè)子系統(tǒng):幾何推理專家系統(tǒng)(GRE)、模型選擇專家系統(tǒng)(MSE)、低水平視覺專家系統(tǒng)(LIVE)。信息從GRE傳至MSE,然后同LIVE進(jìn)行通訊。SIGMA中的框架使用槽儲(chǔ)存一個(gè)對(duì)象的屬性和它與其他對(duì)象之間的關(guān)系。以框架中空間知識(shí)為基礎(chǔ),產(chǎn)生目標(biāo)的假設(shè)并用于影像特征相匹配。與目標(biāo)外形有關(guān)的推理,由MSE子系統(tǒng)來處理,并轉(zhuǎn)換成圖像術(shù)語傳遞給LIVE子系統(tǒng)。這種自上而下的影像屬性的選擇有利于檢測到一些小屬性,通過從航空影像中提取房屋和路段信息的實(shí)驗(yàn)對(duì)這個(gè)系統(tǒng)進(jìn)行了測試。Mckeown等提出一個(gè)基于規(guī)則的系統(tǒng),用來從航空?qǐng)D像上解譯飛機(jī)場.這個(gè)系統(tǒng)以大約450條規(guī)則為基礎(chǔ),分為6組:初始化、用于原始圖像片段解譯的區(qū)域解譯、一致性檢查、組合圖像片段對(duì)功能區(qū)域的規(guī)則和用于建立機(jī)場模型的目標(biāo)生成規(guī)則.Mckeown和Harvey研制了稱為•schemata一個(gè)航空影像解譯系統(tǒng),該系統(tǒng)中包括一個(gè)從標(biāo)準(zhǔn)知識(shí)集編匯的一些規(guī)則。它們從較高的層次模式中自動(dòng)生成規(guī)則,這有利于更好地進(jìn)行錯(cuò)誤處理和更有效的操作。他們的系統(tǒng)包括大約100schemeta,其中每一個(gè)都會(huì)產(chǎn)生大約5個(gè)規(guī)則。start和Fischler提出了一個(gè)基于知識(shí)的系統(tǒng),用上下文信息進(jìn)行地形識(shí)別。在不同的層次上用規(guī)則對(duì)上下文進(jìn)行定義。上下文信息并不一定可靠,結(jié)果導(dǎo)致很多冗余.這個(gè)解譯系統(tǒng)是以三種規(guī)則為基礎(chǔ)的:候選結(jié)果,候選結(jié)果評(píng)價(jià),一致性確定。在評(píng)價(jià)過程中,候選結(jié)果的比較是基于可靠的候選結(jié)果評(píng)價(jià)的基礎(chǔ)上的,在這個(gè)過程中評(píng)價(jià)相關(guān)相似性,候選結(jié)果是這類結(jié)果中的一個(gè).作者認(rèn)為這樣劃分知識(shí)是為了使其成為便于操作的大小單元。Stilla等描述了一個(gè)基于模型的系統(tǒng),用來從航空影像中自動(dòng)提取建筑物信息,目標(biāo)既具有特殊性又具有一般性。該系統(tǒng)中用產(chǎn)品規(guī)則和產(chǎn)品描述集來對(duì)要識(shí)別的目標(biāo)進(jìn)行建模.特殊的模型用不變的拓?fù)溥壿嫿Y(jié)構(gòu)來描述目標(biāo),而一般的模型更具有普通性.這些系統(tǒng)說明基于規(guī)則的系統(tǒng)不能保證知識(shí)的添加性和推理的一致性。如果打破單一規(guī)則基礎(chǔ)而采用多尺度的多規(guī)則那么就會(huì)使程序模塊化程度降低,而且不易于更改。Draper等人建議用黑板系統(tǒng)和基于schema的結(jié)構(gòu)來處理之。4.3黑板系統(tǒng)Nagao和Matsuyama首先陳述了用黑板模型的影像理解的問題,并把它應(yīng)用到郊區(qū)的航空影像中,用于識(shí)別汽車、房屋、道路等。他們的系統(tǒng)包括全局的數(shù)據(jù)庫和一組知識(shí)源.黑板用層次方法記錄由:基本區(qū)域、典型區(qū)域和目標(biāo)等組成的數(shù)據(jù).黑板還存儲(chǔ)一個(gè)標(biāo)記圖,它連接原始影像的象素和數(shù)據(jù)庫中的相應(yīng)區(qū)域。基本區(qū)域是影像段分割的結(jié)果,并用灰度、尺寸、影像中的位置來標(biāo)記。然后區(qū)域中的獨(dú)特的特征被提取,識(shí)別的結(jié)果是具有下面的基本屬性的區(qū)域。1.依據(jù)區(qū)域尺寸,大的、同類的區(qū)域;2.依據(jù)區(qū)域形狀,長的區(qū)域:3.依據(jù)區(qū)域光照,有陰影的區(qū)域;4.依據(jù)臨近區(qū)域的定位和太陽的定位,有陰影的區(qū)域;5.有植物和水的區(qū)域;6.根據(jù)紋理信息,高反差紋理區(qū)域。這些屬性以單獨(dú)的模式儲(chǔ)存在黑板上,然后根據(jù)不同區(qū)域的特殊特征存在或不存在,知識(shí)源會(huì)識(shí)別出一個(gè)特殊的目標(biāo).每種知識(shí)源都是一個(gè)規(guī)則,這些規(guī)則是在目標(biāo)識(shí)別的圖像處理操作過程中的一個(gè)條件或是復(fù)雜操作的一部分。例如,利用知識(shí)源檢洲莊稼地就是這樣:“如果”是大的同類的區(qū)域、植被區(qū)域、沒有水的區(qū)域、沒有光照源的區(qū)域,“那么”可以證明這片區(qū)域是莊稼地。每種知識(shí)源單獨(dú)識(shí)別一個(gè)目標(biāo),且這個(gè)可以導(dǎo)致同一個(gè)區(qū)域識(shí)別相互沖突(如莊稼地和草地)。為了解決這個(gè)問題,系統(tǒng)自動(dòng)地計(jì)算一個(gè)可靠值.然后,取可靠值最高的識(shí)別結(jié)果奮舍棄其他的識(shí)別結(jié)果。Fuger等描述了一個(gè)基于黑板的數(shù)據(jù)驅(qū)動(dòng)系統(tǒng)來分析航空影像中人工的目標(biāo).一般的目標(biāo)模型在黑板中用符號(hào)表達(dá),單個(gè)對(duì)象用幾個(gè)屬性描述.模型被許多參數(shù)所限制,這種參數(shù)被一個(gè)用“發(fā)展階段”的封閉的循環(huán)系統(tǒng)所決定。stilla提出一個(gè)基于黑板影像理解的系統(tǒng),這種系統(tǒng)適合于航空影像中復(fù)雜場景的結(jié)構(gòu)分析。從一個(gè)原始對(duì)象開始,反復(fù)使用中間結(jié)果,目標(biāo)對(duì)象就可以一步一步地組成。對(duì)象的組成用一個(gè)派生的圖表來表達(dá)和記錄.通過二維圖像的分割和直線的近似計(jì)算來進(jìn)行圖像的分析識(shí)別。黑板系統(tǒng)一般趨向于具有一個(gè)集中控制的結(jié)構(gòu),所以效率就成了問題。另外,黑板系統(tǒng)假設(shè)所需要的知識(shí)源是有效的,所以在計(jì)算機(jī)視覺應(yīng)用中應(yīng)用該方法前提是圖像已經(jīng)被分析過了。4.4框架Hanson和Rieman把框架作為假設(shè)的產(chǎn)生的機(jī)器。關(guān)于目標(biāo)分類的知識(shí)表達(dá)為框架。槽描述了目標(biāo)類別之間二進(jìn)制幾何關(guān)系。槽還包括例示其他的對(duì)象描述的產(chǎn)品規(guī)則,這樣,框架可用于控制又可用于表達(dá).Ikeuchi和kanade用來表達(dá)三維對(duì)象.當(dāng)明確了目標(biāo)模型是有用的,處理過程是自上而下的。然后,如果模型比較弱并且有較準(zhǔn)確的數(shù)據(jù),那么處理過程是自下而上的。其他使用框架的系統(tǒng)包括^eRONYM、sxGMA、Nagao和Matsuyama等人的系統(tǒng),這些己經(jīng)在上面介紹過了。4.5語義網(wǎng)絡(luò)Nicolin和Gabler描述了一個(gè)分析航空影像的系統(tǒng),該系統(tǒng)用語義網(wǎng)絡(luò)來表達(dá)和解譯圖像。系統(tǒng)由一個(gè)短期存儲(chǔ)器(STM)、一個(gè)方法庫(MB)、一個(gè)長期存儲(chǔ)器(LTM)組成.5丁M的概念地等同于黑板,儲(chǔ)存影像解譯的部分結(jié)果.LTM存儲(chǔ)場景的先驗(yàn)知識(shí)和特殊領(lǐng)域知識(shí)。系統(tǒng)匹配STM的內(nèi)容和LTM的內(nèi)容來產(chǎn)生解譯結(jié)果.這個(gè)過程由MB中的推理機(jī)模塊來完成.STM最墓本的內(nèi)容是用一種自上而下的方式建立起來的,并且在一種模型驅(qū)動(dòng)階段狀態(tài)產(chǎn)生,校驗(yàn)LTM中存儲(chǔ)的目標(biāo)屬性的已有部分和缺少的部分。為了基于知識(shí)從數(shù)字地圖中提取目標(biāo),Ma}’er已經(jīng)發(fā)展了一個(gè)基于語義網(wǎng)絡(luò)的系統(tǒng)。該系統(tǒng)是建立在語義網(wǎng)絡(luò)和框架描述相結(jié)合的基礎(chǔ)上的,在控制上采用模型驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)相結(jié)合。模型是由三個(gè)層次組成的,一般與自上而下的影像處理過程的各自的層相一致:(l)影像層,如數(shù)字地圖;(2)影像圖表和文本層:(3)語義對(duì)象語義網(wǎng)絡(luò)以圖形層的部分元素為基礎(chǔ)構(gòu)建語義對(duì)象,這些對(duì)象構(gòu)成了圖形對(duì)象和地形對(duì)象之間的一般或特殊的關(guān)系.例如,一個(gè)圖表對(duì)象層中延長的區(qū)域特征化為“路的兩邊”、“人行道”、“道路網(wǎng)”等.雖然其他對(duì)象的描述沒有給出,但是測試己證明了道路網(wǎng)的提取.用框架被設(shè)計(jì)來分析不同的概念和他們的屬性.對(duì)象的提取以模型驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)實(shí)例為基礎(chǔ),初始的研究以用戶確定的特定目標(biāo)為基礎(chǔ)的。雖然方法是以地圖上明確定義的信息提取為基礎(chǔ),但是M叮er認(rèn)為這個(gè)過程對(duì)影像信息的提取也是很有用的。Tonjes己使用語義網(wǎng)絡(luò)從重疊的航空影像來建立影像模型。輸出是具有適當(dāng)植被表示的三維景觀。Tonjes認(rèn)為語義網(wǎng)絡(luò)適用于表達(dá)結(jié)構(gòu)化目標(biāo)的知識(shí).它的語義網(wǎng)絡(luò)是用框架描述的,其中包括關(guān)系、屬性和方法。語義網(wǎng)絡(luò)有三個(gè)層:(l)傳感器圖層,該層從紋理,條帶和圖像細(xì)節(jié)為基礎(chǔ)描述分割層。(2)幾何和材料層,該層利用傳感和地形解譯結(jié)果來描述三維表面層。(3)影像層,它是要提取的對(duì)象。語義網(wǎng)絡(luò)建立在三層之間。目標(biāo)描述通過每層來重建,重建是基于數(shù)據(jù)驅(qū)動(dòng)和模型驅(qū)動(dòng)的。Lang和Forstner把他們的建筑物的提取方法建立在多態(tài)的中間層特征的基礎(chǔ)上。該方法中應(yīng)用了部分分層描述的語義模型。各部分之間的關(guān)系沒有包括在其中。結(jié)合應(yīng)用于頂點(diǎn)原始層的數(shù)據(jù)驅(qū)動(dòng)模型和用于目標(biāo)解譯、驗(yàn)證假設(shè)層的模型驅(qū)動(dòng)方法的基礎(chǔ)上,建立了建筑物假設(shè)層,應(yīng)用了四種建筑物類型:平屋頂、非直角平屋頂、人字形屋頂、曲線屋頂.sch川ing和vogtle開發(fā)了一個(gè)利用已知地圖庫輔助解譯的數(shù)字地圖史新系統(tǒng)。影像與地圖相比較,檢測出地圖自編輯以來的變化。接著,語義網(wǎng)絡(luò)分析新的特征。產(chǎn)生了兩個(gè)網(wǎng)絡(luò),一個(gè)用場景,另一個(gè)用于圖像,在其中網(wǎng)絡(luò)中的典型關(guān)系建立在不同的層次上.DoGunst提出了一個(gè)數(shù)據(jù)驅(qū)動(dòng)和模型驅(qū)動(dòng)相結(jié)合的方法,用來識(shí)別數(shù)字地圖更新所需的目標(biāo),這個(gè)方法是建立在用于道路描述的目標(biāo)導(dǎo)向模型和用于特征識(shí)別的基于框架的語義網(wǎng)絡(luò)基礎(chǔ)上的。框架詳細(xì)定義了目標(biāo)之間的關(guān)系,目標(biāo)的定義,可選的目標(biāo)定義和預(yù)處理關(guān)系。道路的細(xì)節(jié)包括復(fù)雜道路的結(jié)合點(diǎn),這些在知識(shí)庫中己被描述。這是一個(gè)包括幾個(gè)不同類型的道路特征的非常細(xì)節(jié)的研究。研究效果很明顯,但同時(shí)也表明解譯如此多細(xì)節(jié)存在著困難。Quint和sties在一996年,quint在1997年提出了一個(gè)叫MOSES的航空影像分析系統(tǒng),該系統(tǒng)用語義網(wǎng)絡(luò)作為建模工具,利用從地形圖和GIS數(shù)據(jù)中獲取的知識(shí)來自動(dòng)精練。地圖和圖像中的一般模型的概念是相應(yīng)的生成的模型概念的特例。對(duì)應(yīng)于特定的場景的特定模型由系統(tǒng)自動(dòng)產(chǎn)生:它是通過結(jié)合用圖像的一般模型進(jìn)行地圖分析而產(chǎn)生場景的描述而產(chǎn)生的。一開始,數(shù)字化的有用的線段用來作為地圖的結(jié)構(gòu)分析,從而獲取地圖的結(jié)構(gòu)分析結(jié)果。這樣,結(jié)果圖像一般模型來產(chǎn)生特殊模型,以用于圖像分析,對(duì)于結(jié)構(gòu)分析,原始影像用作輸入部分。分析是模型驅(qū)動(dòng)的,進(jìn)行目標(biāo)識(shí)別。在圖像分析處理中用價(jià)值函數(shù)指導(dǎo)研究。總結(jié)之,己發(fā)現(xiàn)語義網(wǎng)絡(luò)有很廣泛的應(yīng)用,并且己經(jīng)應(yīng)用于航空影像和數(shù)字地圖的解譯中.4.6描述邏輯邏輯描述的方法在攝影測量方面的應(yīng)用微乎其微.其中一個(gè)是Lang和schroder(1994)研制的基于描述邏輯的方法,利用該方法結(jié)合從地圖上提取的參考信息來解譯航空影像的變化。用KL一one相似描述邏輯來描述不同類型的目標(biāo)知識(shí)和可能的變化類型,它在必要和充足的條件下對(duì)概念進(jìn)行描述。用描述邏輯的描述模塊對(duì)有關(guān)場景和解譯的實(shí)際信息進(jìn)行描述。用目標(biāo)概念和變化概念在邏輯上描述空間地物的幾何關(guān)系和拓?fù)潢P(guān)系。目標(biāo)被認(rèn)為是經(jīng)過圖像處理和屬性提取后的目標(biāo)概念的一個(gè)實(shí)例。變化概念的概念被定義為識(shí)別變化.利用目標(biāo)導(dǎo)向和許多啟發(fā)式方法實(shí)現(xiàn)快速搜索。然而,這篇文章的例子似乎都以人工影像為基礎(chǔ)的。
5結(jié)論
這篇文章回顧了計(jì)算機(jī)視覺、攝影測量與遙感領(lǐng)域里的研究者們研究的知識(shí)表達(dá)和建模方法一些發(fā)展。知識(shí)表達(dá)方法己經(jīng)從產(chǎn)品系統(tǒng)經(jīng)語義網(wǎng)絡(luò)、框架,發(fā)展到描述邏輯階段。就它們的復(fù)雜程度、模塊化和操作定義的清晰等方面而言,它們都有各自的優(yōu)點(diǎn),這些系統(tǒng)在特定的領(lǐng)域都有應(yīng)用的實(shí)例,且都取得了不同程度的成功。就它們?cè)谔崛『妥R(shí)別圖像特征中與人眼匹配的能力而言,這些實(shí)例表明這些知識(shí)表達(dá)和建模方法仍有待于進(jìn)一步發(fā)展。除了對(duì)本文談及的一些方法的比較外,我們不可能得出哪能種方法最適合于從航空影像和衛(wèi)星影像上自動(dòng)提取信息的結(jié)論.研究者們正在研究從數(shù)字圖像上提取數(shù)字制圖和Gls所需信息的方法,攝影測量與遙感領(lǐng)域的研究者正聯(lián)合計(jì)算機(jī)視覺專家來獲取知識(shí)表達(dá)和建模方面的技術(shù),結(jié)合圖像數(shù)據(jù)的特點(diǎn)采用特殊的方法。雖然,這個(gè)工作正處于發(fā)展之中,但已經(jīng)取得了重大進(jìn)展。攝影測量與遙感領(lǐng)域和計(jì)算機(jī)視覺領(lǐng)域的研究者在這項(xiàng)工作上繼續(xù)合作是十分重要的,這樣可以通過聯(lián)合發(fā)揮各自的優(yōu)勢(shì).