透析無線傳感器網(wǎng)絡(luò)故障檢測

時間:2022-03-22 05:00:00

導(dǎo)語:透析無線傳感器網(wǎng)絡(luò)故障檢測一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

透析無線傳感器網(wǎng)絡(luò)故障檢測

摘要:針對無線傳感器網(wǎng)絡(luò)資源受限的特點,研究了故障管理的相關(guān)內(nèi)容,主要對故障檢測的幾種常見方法進(jìn)行比較說明,對于無線傳感器網(wǎng)絡(luò)的應(yīng)用具有一定的指導(dǎo)意義。

關(guān)鍵詞:無線傳感器資源受限故障管理故障檢測

無線傳感器網(wǎng)絡(luò)是由大量低成本且具有傳感、數(shù)據(jù)處理和無線通信能力的傳感器節(jié)點通過自組織方式形成的網(wǎng)絡(luò)[1]。它獨立于基站或移動路由器等基礎(chǔ)通信設(shè)施,通過特定的分布式協(xié)議自組織起來形成網(wǎng)絡(luò)。它能夠協(xié)作地實時監(jiān)測、感知和采集網(wǎng)絡(luò)分布區(qū)域內(nèi)的各種環(huán)境或監(jiān)測對象的信息,并對這些信息進(jìn)行處理,使需要這些信息的用戶在任何時間、任何地點和任何環(huán)境條件下(尤其是僅適合無線通信條件下)獲取大量詳實而可靠的信息。因此,這種網(wǎng)絡(luò)系統(tǒng)可以被廣泛地應(yīng)用于國防軍事、國家安全、環(huán)境監(jiān)測、交通管理、醫(yī)療衛(wèi)生、制造業(yè)、反恐抗災(zāi)等領(lǐng)域。

隨著無線傳感器網(wǎng)絡(luò)應(yīng)用范圍的進(jìn)一步擴(kuò)展,常常被部署在極端環(huán)境來收集外部環(huán)境的數(shù)據(jù)。由于傳感器節(jié)點的電源、存儲和計算能力有限,并且應(yīng)用環(huán)境惡劣,使得傳感器節(jié)點比傳統(tǒng)網(wǎng)絡(luò)的節(jié)點更易于失效。在這些情況下維持高質(zhì)量的服務(wù),并盡可能地降低能源消耗是很有挑戰(zhàn)性的,有效的故障管理對于達(dá)成這些目標(biāo)是有極大幫助的。因此,對無線傳感器網(wǎng)絡(luò)故障進(jìn)行管理是非常重要的。

一、無線傳感器網(wǎng)絡(luò)故障管理

當(dāng)網(wǎng)絡(luò)或系統(tǒng)出現(xiàn)故障時,網(wǎng)絡(luò)故障管理便成為管理員首要用到的工具。因此,故障管理事實上是整個網(wǎng)絡(luò)管理的重中之重。

但遺憾的是,由于網(wǎng)絡(luò)故障涉及到不同廠商,不同類型設(shè)備,涉及復(fù)雜的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),涉及不同組織對故障類型的不同定位規(guī)則。

從用戶的角度來說,希望在日常工作和生活中網(wǎng)絡(luò)運營暢通,信息傳輸不受任何網(wǎng)絡(luò)故障干擾。而從網(wǎng)絡(luò)運行和管理者角度來說,他們希望在網(wǎng)絡(luò)運營過程中,即使發(fā)生故障,也能很快地得到故障發(fā)生的原因。這些方方面面的因素使得對無線傳感器網(wǎng)絡(luò)故障管理的研究在近年來發(fā)展比較緩慢。下面參照傳統(tǒng)網(wǎng)絡(luò)的故障管理,將無線傳感器網(wǎng)絡(luò)的故障管理分為三個階段:故障檢測、故障診斷和故障恢復(fù)[2]來分別說明。

1)故障檢測。

為了確定故障的存在,需要收集與網(wǎng)絡(luò)狀態(tài)相關(guān)的數(shù)據(jù)。一般來說,網(wǎng)絡(luò)發(fā)生故障后,網(wǎng)絡(luò)設(shè)備將處于不正常的狀態(tài)。通過獲取設(shè)備的狀態(tài)信息,就可以及時發(fā)現(xiàn)網(wǎng)絡(luò)中出現(xiàn)的故障。收集網(wǎng)絡(luò)狀態(tài)信息有兩種方法:設(shè)備向管理系統(tǒng)報告關(guān)鍵的網(wǎng)絡(luò)事件;由網(wǎng)絡(luò)管理系統(tǒng)定期地查詢網(wǎng)絡(luò)設(shè)備的狀態(tài),即主動輪詢。

一般情況下,網(wǎng)絡(luò)管理系統(tǒng)將這兩種方法結(jié)合起來使用。當(dāng)對網(wǎng)絡(luò)組成部件狀態(tài)進(jìn)行檢測后,不嚴(yán)重的簡單故障通常被記錄在錯誤日志中,并不作特別處理。而嚴(yán)重一些的故障則需要通過網(wǎng)絡(luò)管理器,即所謂的“告警”。

網(wǎng)絡(luò)設(shè)備一般都具有感知異常情況的能力,當(dāng)設(shè)備發(fā)現(xiàn)自身或網(wǎng)絡(luò)中的嚴(yán)重不正常現(xiàn)象時,它采用告警的方式報告給網(wǎng)管中心,因此,故障檢測一般由網(wǎng)絡(luò)中的設(shè)備完成。

2)故障診斷。

故障會在網(wǎng)絡(luò)中傳播,論文格式所有感知到故障的網(wǎng)絡(luò)對象(包括物理對象和邏輯對象)都會發(fā)生告警,在一個大型網(wǎng)絡(luò)中,一個故障可能會引起大量的告警。故障診斷就是對網(wǎng)絡(luò)設(shè)備發(fā)出的告警進(jìn)行相關(guān)處理,從一大堆的告警中找到故障發(fā)生的真正原因,并找出故障節(jié)點。在網(wǎng)絡(luò)故障診斷中,一個理想的告警應(yīng)該包含有關(guān)故障的五W信息(Who、What、Where、When和why)。由于網(wǎng)絡(luò)設(shè)備對于自身以外的網(wǎng)絡(luò)情況只了解非常有限的知識,所以網(wǎng)絡(luò)設(shè)備產(chǎn)生的大部分網(wǎng)絡(luò)告警只回答了who、what和when三個問題,而故障診斷要進(jìn)行where和why的推理。另外,告警噪聲的存在進(jìn)一步增加了故障診斷的難度,這些告警噪聲包含:告警丟失、延遲、重復(fù)和虛假告警等。

3)故障恢復(fù)。

故障恢復(fù)的主要目的是根據(jù)識別的故障原因,自動或手動地對網(wǎng)絡(luò)進(jìn)行控制操作,恢復(fù)網(wǎng)絡(luò)的正常運行。

二、無線傳感器網(wǎng)絡(luò)故障檢測常見方法按照故障檢測的執(zhí)行主體所處位置的不同,可以將無線傳感器網(wǎng)絡(luò)故障檢測方法分為集中式方法和分布式方法

2.1集中式方法。

集中式方法[3]是無線傳感器網(wǎng)絡(luò)中較為常見的一種方法,一般來說是物理上或邏輯上處于中心位置的節(jié)點,負(fù)責(zé)對網(wǎng)絡(luò)進(jìn)行監(jiān)控,追蹤失敗節(jié)點或可疑節(jié)點。由于中心節(jié)點要負(fù)責(zé)的事務(wù)較多,通常都讓該節(jié)點不受能量的限制,能夠執(zhí)行大范圍的故障管理事務(wù)。集中式方法的結(jié)構(gòu)如圖1所示,主要采用周期輪詢的方式來對節(jié)點進(jìn)行管理:中心節(jié)點通常采用周期性主動探測的方式一些探測包,來獲取節(jié)點的狀態(tài)信息,對獲得的信息進(jìn)行分析,從而確定節(jié)點是否失效。

采用集中式網(wǎng)絡(luò)管理,所有的網(wǎng)絡(luò)設(shè)備都由一個管理者進(jìn)行管理。當(dāng)信息流量不大的時候,集中式網(wǎng)絡(luò)管理簡單且有效,在失效節(jié)點定位方面具有高效和準(zhǔn)確的優(yōu)點,所以它非常適用十小型的局域網(wǎng)絡(luò)。在集中式網(wǎng)絡(luò)管理結(jié)構(gòu)下,管理者作為“客戶”要完成復(fù)雜的網(wǎng)絡(luò)管理任務(wù),同時還必須與多個作為“服務(wù)器”的交換信息。這種結(jié)構(gòu)存在著較大的缺陷,主要表現(xiàn)為:

1)所有的分析和計算任務(wù)都集中在中心節(jié)點站,造成網(wǎng)絡(luò)管理的瓶頸,中心節(jié)點負(fù)載過重。由于其余節(jié)點的信息收集后都是發(fā)往中心節(jié)點,因此中心節(jié)點很可能變成一個專門用于數(shù)據(jù)傳輸?shù)墓?jié)點以滿足故障檢測和管理的需要。隨之而來的問題就是中心節(jié)點所在的區(qū)域會有大量的流量往來,導(dǎo)致該區(qū)域的節(jié)點能量消耗急劇增加,越是靠近中心節(jié)點的越是這樣,如圖1中的A,B節(jié)點。

2)中心節(jié)點站一旦失效,整個網(wǎng)管系統(tǒng)就崩潰了,這樣導(dǎo)致整個系統(tǒng)的可靠性偏低。

3)集中式結(jié)構(gòu)導(dǎo)致大量的原始數(shù)據(jù)在網(wǎng)絡(luò)上傳輸,帶來了大量額外的通信量,占用大量的通信帶寬,并導(dǎo)致網(wǎng)管系統(tǒng)工作效率降低。

4)用于監(jiān)測網(wǎng)絡(luò)并收集數(shù)據(jù)的是預(yù)先定義好且功能固定的,一旦要擴(kuò)展新的功能時十分不便,這樣會造成系統(tǒng)的可擴(kuò)展性較差。

5)遠(yuǎn)端節(jié)點與管理中心之間的距離較遠(yuǎn),且傳感器網(wǎng)絡(luò)中采用多跳通信,因此這兩者之間的信息交互時延過長。

2.2分布式方法分布式方法支持局部決策的概念,能夠平滑地將故障管理分散到網(wǎng)絡(luò)中去。目標(biāo)是讓節(jié)點在與中心節(jié)點通信前,能夠給出一定層次的決策。在這種思想下,傳感器節(jié)點能做的決策越多,越少的信息將被傳輸給中心節(jié)點,從而減少通信量。其算法流程如右表1。分布式的方法通常分為以下幾種:

1)節(jié)點自檢測方法。節(jié)點自檢測的方法依賴于節(jié)點自身所包含的功能進(jìn)行故障檢測,并將檢測結(jié)果發(fā)送給管理節(jié)點。文獻(xiàn)[4]中介紹了一種節(jié)點自檢測的方法,通過軟件和硬件的接口檢測物理節(jié)點的失效。硬件接口包含了幾個靈活的電路用于檢測節(jié)點的方位和碰撞。軟件接口包含了幾個軟件部件,用于采樣傳感器節(jié)點的讀取行為。由于故障的檢測由節(jié)點本身完成,這種方法的優(yōu)點是不需要部署額外的軟件或硬件節(jié)點用于故障檢測。

2)鄰居協(xié)作的方法[5]。顧名思義,鄰居協(xié)作的基本思想就是:在節(jié)點發(fā)出故障告警之前,將節(jié)點獲得的故障信息與鄰居(一跳通信范圍內(nèi))獲得的故障信息進(jìn)行比較,得到確認(rèn)的情況下才將故障信息發(fā)往管理節(jié)點。在大多數(shù)的情況下,中心節(jié)點并不知道網(wǎng)絡(luò)中的任何失效信息,除非那些已經(jīng)用節(jié)點協(xié)作方式確認(rèn)的故障。這樣的設(shè)計減少了網(wǎng)絡(luò)的通信信息,從而保留了節(jié)點的能量。

3)基于分簇的方法[6]。基于分簇的方法將整個網(wǎng)絡(luò)分成不同的簇,從而將故障管理也分散到各自的區(qū)域內(nèi)完成。簇內(nèi)采用散播的方式來定位失敗節(jié)點,簇頭節(jié)點與一跳范圍內(nèi)的鄰居以某種規(guī)則交換信息。通過分析收集到的信息,根據(jù)預(yù)先定義的失敗檢測規(guī)則可以最終確定失敗節(jié)點。接著,如果發(fā)現(xiàn)了一個故障節(jié)點,該區(qū)域所在的節(jié)點將會把信息傳播給所有的簇。

三、常見方法的比較

從上可知,集中式方法與分布式方法都各有優(yōu)缺點,針對于不同應(yīng)用類型的網(wǎng)絡(luò),應(yīng)該選取不同的方法。為了方便方法的選取,我們對上述方法個定性分析。考慮無線傳感器網(wǎng)絡(luò)本身能量有限的特點,以及故障檢測的一般目的,我們選取能量消耗、通信開銷、故障檢測率和虛警率這四個方面進(jìn)行比較,結(jié)果如表1。

無線傳感器網(wǎng)絡(luò)的應(yīng)用已經(jīng)十分廣泛,而且,一般認(rèn)為物聯(lián)網(wǎng)的最底部一層即為無線傳感器網(wǎng)絡(luò),因此對無線傳感器網(wǎng)絡(luò)的研究能很好地指導(dǎo)實踐工作。本文對無線傳感器網(wǎng)絡(luò)故障檢測的方法進(jìn)行了分類描述分析,對于指導(dǎo)無線傳感器網(wǎng)絡(luò)故障研究工作具有一定的指導(dǎo)意義。