容錯技術分析論文

時間:2022-01-14 05:11:00

導語:容錯技術分析論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

容錯技術分析論文

隨著現代工業技術的發展和計算機的普及,工業設備運行的安全性和可靠性越來越引起人們的重視,為了保證其安全、高效和可靠地運行,必須采用與之相適應的管理模式,容錯技術為計算機系統提供了這樣的能力:當計算機內部出現故障的情況下,計算機系統仍能正確工作。計算機容錯技術是計算機系統可靠性提高的重要手段。

當系統內部有故障存在時,通過容錯技術消除故障的影響,使系統最終仍能給出正確的結果。按照時間劃分,故障可分為以下三種:永久性故障、間歇性故障和偶然性故障。永久故障是永遠持續下去直至修復為止的故障。對硬件來說,永久性故障意味著不可逆的物理變異。對軟件來說,這類故障也就是一個不可以自動恢復的錯誤狀態。間歇性故障是短暫的,但卻是斷續的,它既有偶然性,又有不定期的重復性。如一個處于臨界狀態的電路輸出時好時壞,而一個虛焊點就會引起這樣的故障。偶然性故障出現是短暫的,且可能是非重復性的。常常由于環境的變換、電源方面的干擾、元器件性能的波動、軟件的隨機變換、電磁干擾等因素而引起。這樣的故障有可能僅出現一次,或很長時間出現一次,但卻可能造成數據錯誤,甚至系統癱瘓。

針對不同故障應采取不同的容錯方法。容錯技術能自動適時地檢測并診斷出系統的故障,然后采取對故障的控制或處理的對策略。按照系統的失效響應階段,可以把各種容錯技術分成三種:故障檢查、靜態冗余、動態冗余。故障檢測并不提供對故障的容忍,而是發生故障時給出一個警告。故障檢測廣泛應用于微型機和小型機之類的小系統中,其中一些已體現了簡單的聯機檢測機理。嚴格地說,故障檢測不是容錯,它盡管檢測了故障,但是不能容忍這些故障,不給出故障警告。動態冗余用于糾錯碼存儲器或具有固定配置(即線路器件之間的邏輯連接保持不變)的多數表決冗余計算機之類的系統中。

根據不同情況,一個容錯系統可經歷以下階段:(1)故障檢測:大多數失效最終導致產生邏輯故障。有許多方法可用來檢測邏輯故障,如奇偶校驗、一致性校驗和協議違章都可以用來檢測故障。故障檢測技術有兩個主要的類別,即脫機檢測和聯機檢測,在脫機檢測情況下,進行檢測時設備不能進行有用的工作;聯機檢測提供了實時檢測能力,因為聯機檢測與有用的工作同時執行。聯機檢測技術包括奇偶校驗和冗余校驗;(2)故障限制:當故障出現時,希望限制其影響范圍。故障限制是把故障效應的傳播限制到一個區域內,從而防止污染其他區域;(3)故障屏蔽:故障屏蔽技術把失效效應掩蓋了起來,從某種意義上說,是冗余信息戰勝了錯誤信息,多數表決冗余設計就屬于故障屏蔽;(4)重試:在許多場合,對一個操作系統的第二次試驗可能是成功的,對不引起物理破壞的瞬間故障尤其如此;(5)診斷:對故障檢測技術沒有提供有關故障位置、性質的信息進行診斷;(6)重組:當檢測出一個故障并判明是永久性故障時,重組系統的器件替換失效的器件或把失效的器件與系統的其他部分隔離開來,也可使用冗余系統,確保系統能力不降低;(7)恢復:經檢測和重組后,必須消除錯誤效應。通常,系統會回到故障檢測前處理過程的某一點,并從這一點重新開始操作。這種恢復形式通常要后備文件、校驗點和應用記錄方法;(8)重啟動:如果一個錯誤破壞的信息太多,或者系統沒有設計恢復功能,那么恢復就不可能實現。僅當系統未受任何破壞時,才能進行“熱”重啟,并從故障檢測點恢復所有的操作。“熱”重啟相當于系統需要完全重新加載;(9)修復:即把診斷為故障的器件還原下來,修復也可以是聯機進行的或者脫機進行的;(10)重構:對元件進行物理替換之后,把修復的模塊重新加入到該系統中去。對聯機修復來說,實現重構不中斷系統的工作。

隨著計算機硬件和網路的快速發展,容錯計算機的系統開銷逐漸降低,且糾錯速度快。而軟件方法實現的容錯,對硬件不會提過高的要求。同時系統靈活,資源利用比較合理。更正檢測、診斷將會采取人工智能的處理途徑,以專家系統的各種智能工具來支持故障檢測和診斷。利用專家的知識,借助推理機構,迅速而準確地提供診斷結果。系統的動態重構、故障恢復功能及神經元芯片等將被用到容錯技術中來,都將在智能化的支持下得以實現。同時對電路內部的自檢、自重構研究,可以解決電路本身及子系統的可靠性問題,將會出現容錯的VLS1芯片及可直接支持系統容錯設計的可容錯設計芯片,為系統設計者提供一個具有透明性的容錯設計元器件。進入到芯片內部的容錯技術的研究將成為容錯研究的一大分支。

隨著網路時代的到來,對于一個成功的電子商務系統來說,必須響應在線客戶的需求并遵守服務的那個協議(SLA),同時保護客戶的隱私及電子商務系統安全正常運營。對于客戶要求的響應程度及安全保護措施是一個基于Internet的電子商務系統成功的必要條件,容錯服務器就成為網絡時代電子商務運營商首要選擇。未來的智能化家庭都將擁有一個家庭數據中心,可提供全天候的服務,包括家庭安全、防盜和防煤氣泄漏以及各種家用電器的控制,這個家庭數據中心也只有采用容錯計算機才能擔當。今后容錯技術將同時在軟件和硬件上得到發展,將會出現初級的容錯軟件的設計方法,應用軟件方面的容錯設計將會產生一些實用的工具,同時產生一個通用操作系統和硬件相結合的容錯方法,走軟硬結合的道路。系統容錯設計將在分布式系統、CSCW等方面出現新的容錯設計方法。

[摘要]隨著計算機技術的發展,容錯技術和容錯計算機將成為新的研究發展方向。本文介紹了容錯技術的基本原理及內容,介紹了容錯系統的經歷階段和實現容錯功能的關鍵技術,總結了計算機容錯技術的現階段的應用情況。

[關鍵詞]容錯技術可靠性容錯功能

參考文獻:

[1]胡謀.計算機容錯技術[M].北京:中國鐵道出版社.

[2]楊孝宗.容錯計算技術的提出和發展[J].電子和信息化.

[3]劉云龍,陳俊亮.基于數據流分析的軟件容錯策略[J].軟件學報.

[4]FlaviuChristian,UnderstandingFault-TolerantDistributedSystems[J].CommunicantionsofACM.