網(wǎng)絡(luò)故障診斷論文
時間:2022-03-13 04:45:00
導(dǎo)語:網(wǎng)絡(luò)故障診斷論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:簡單介紹網(wǎng)絡(luò)及路由器的基本概念,簡述網(wǎng)絡(luò)分層診斷技術(shù),結(jié)合討論路由器各種接口的診斷,綜述互聯(lián)網(wǎng)絡(luò)連通性故障的排除。
關(guān)鍵詞:網(wǎng)絡(luò)互聯(lián)網(wǎng)路由器故障診斷
一.引言
世紀之交,全球因特網(wǎng)高速發(fā)展。抓住機遇,迎接挑戰(zhàn),我國的網(wǎng)絡(luò)建設(shè)方興未艾。政府上網(wǎng)工程拉開序幕,網(wǎng)絡(luò)建設(shè)的新高潮已經(jīng)到來。網(wǎng)絡(luò)診斷是管好、用好網(wǎng)絡(luò),使網(wǎng)絡(luò)發(fā)揮最大作用的重要技術(shù)工作之一。本文首先簡單介紹網(wǎng)絡(luò)及路由器的基本概念,簡述分層診斷技術(shù),結(jié)合討論路由器各種接口的診斷,綜述互聯(lián)網(wǎng)絡(luò)連通性故障的排除。
二.網(wǎng)絡(luò)與路由器概述
網(wǎng)絡(luò)診斷是一門綜合性技術(shù),涉及網(wǎng)絡(luò)技術(shù)的方方面面。為方便下面的討論,首先簡單回顧一下網(wǎng)絡(luò)和路由器的基本概念。
1.計算機網(wǎng)絡(luò)是由計算機集合加通信設(shè)施組成的系統(tǒng),即利用各種通信手段,把地理上分散的計算機連在一起,達到相互通信而且共享軟件、硬件和數(shù)據(jù)等資源的系統(tǒng)。計算機網(wǎng)絡(luò)按其計算機分布范圍通常被分為局域網(wǎng)和廣域網(wǎng)。局域網(wǎng)覆蓋地理范圍較小,一般在數(shù)米到數(shù)十公里之間。廣域網(wǎng)覆蓋地理范圍較大,如校園、城市之間、乃至全球。計算機網(wǎng)絡(luò)的發(fā)展,導(dǎo)致網(wǎng)絡(luò)之間各種形式的連接。采用統(tǒng)一協(xié)議實現(xiàn)不同網(wǎng)絡(luò)的互連,使互聯(lián)網(wǎng)絡(luò)很容易得到擴展。因特網(wǎng)就是用這種方式完成網(wǎng)絡(luò)之間聯(lián)結(jié)的網(wǎng)絡(luò)。因特網(wǎng)采用TCP/IP協(xié)議作為通信協(xié)議,將世界范圍內(nèi)計算機網(wǎng)絡(luò)連接在一起,成為當(dāng)今世界最大的和最流行的國際性網(wǎng)絡(luò)。
2.為了完成計算機間的通信,把每部計算機互連的功能劃分成定義明確的層次,規(guī)定了同層進程通信的協(xié)議及相鄰層之間的接口和服務(wù),將這些層、同層進程通信的協(xié)議及相鄰層之間的接口統(tǒng)稱為網(wǎng)絡(luò)體系結(jié)構(gòu)。國際標準化組織(ISO)提出的開放系統(tǒng)互連參考模型(OSI)是當(dāng)代計算機網(wǎng)絡(luò)技術(shù)體系的核心。該模型將網(wǎng)絡(luò)功能劃分為7個層次:物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層、傳輸層、會話層、表示層和應(yīng)用層。
3.TCP/IP即傳輸控制協(xié)議和網(wǎng)間互聯(lián)協(xié)議是一組網(wǎng)絡(luò)協(xié)議。TCP/IP起源于美國ARPANET網(wǎng),發(fā)展至今已成為因特網(wǎng)使用的標準通信協(xié)議。使用TCP/IP能夠使采用不同操作系統(tǒng)的計算機以有序的方式交換數(shù)據(jù)。
4.路由器是一種網(wǎng)絡(luò)設(shè)備,是用于網(wǎng)絡(luò)連接、執(zhí)行路由選擇任務(wù)的專用計算機。路由器工作于網(wǎng)絡(luò)層,對信包轉(zhuǎn)發(fā),并具有過濾功能。路由器能夠?qū)⑹褂貌煌夹g(shù)的兩個網(wǎng)絡(luò)互連起來,能夠在多種類型的網(wǎng)絡(luò)之間(局域網(wǎng)或廣域網(wǎng))建立網(wǎng)絡(luò)連接。它將處在七層模型中的網(wǎng)絡(luò)層的信息,根據(jù)最快、最直接的路由原理從一個網(wǎng)絡(luò)的網(wǎng)絡(luò)層傳輸?shù)搅硪粋€網(wǎng)絡(luò)的網(wǎng)絡(luò)層,以達到最佳路由選擇。同時在內(nèi)部使用高檔微處理器,用高速的內(nèi)部總線連接適合各種網(wǎng)絡(luò)協(xié)議的接口卡。并具有多種網(wǎng)管功能,能監(jiān)視與路由器相連接的一些網(wǎng)絡(luò)設(shè)備和它們的配置運行情況。
5.CISCO路由器是目前網(wǎng)絡(luò)建設(shè)中使用最多的一種路由器,有多種檔次、多種系列,目前常用的當(dāng)屬2500系列,本文以2500系列為例討論。2500系列路由器是固定接口的多協(xié)議路由器,支持CISCOIOS全部功能。根據(jù)特定的協(xié)議環(huán)境分為以下四種類型:固定配置的路由器(2501)、帶HUB口的路由器(2507)、摸塊化的路由器(2514)和訪問服務(wù)器(2511)。它們結(jié)構(gòu)簡單、操作方便、易于配置和管理,是一種用于小規(guī)模局域網(wǎng)和廣域網(wǎng)網(wǎng)絡(luò)層中繼的路由設(shè)備。
6.CISCOIOS是CISCO所特有的互連網(wǎng)操作系統(tǒng),所有的CISCO產(chǎn)品都運行IOS,IOS將它們無縫連接在一起協(xié)同工作。給用戶提供一個可支持任意硬件界面、任意鏈路層、網(wǎng)絡(luò)層協(xié)議的可擴展的開放型網(wǎng)絡(luò)。IOS支持眾多的協(xié)議,包括各種網(wǎng)絡(luò)通信協(xié)議和路由協(xié)議等。CISCOIOS已成為工業(yè)界網(wǎng)際網(wǎng)互聯(lián)的事實標準。CISCOIOS提供幾種不同的操作模式,每一種模式提供一組相關(guān)的命令集、不同的操作權(quán)限和操作功能。基于安全目的,CISCO用戶界面中有兩級訪問權(quán)限:用戶級和特權(quán)級。第一級訪問允許查看路由狀態(tài),叫做用戶EXEC模式,又稱為查看模式;第二級訪問允許查看路由器配置、修改配置和運行調(diào)試命令,叫做特權(quán)EXEC模式,又稱為配置模式。在特權(quán)級中,按不同的配置內(nèi)容,可進入不同的配置模式,如全球配置模式、接口配置模式、線配置模式等。
三.網(wǎng)絡(luò)故障診斷概述
網(wǎng)絡(luò)故障診斷應(yīng)該實現(xiàn)三方面的目的:確定網(wǎng)絡(luò)的故障點,恢復(fù)網(wǎng)絡(luò)的正常運行;發(fā)現(xiàn)網(wǎng)絡(luò)規(guī)劃和配置中欠佳之處,改善和優(yōu)化網(wǎng)絡(luò)的性能;觀察網(wǎng)絡(luò)的運行狀況,及時預(yù)測網(wǎng)絡(luò)通信質(zhì)量。
網(wǎng)絡(luò)故障診斷以網(wǎng)絡(luò)原理、網(wǎng)絡(luò)配置和網(wǎng)絡(luò)運行的知識為基礎(chǔ)。從故障現(xiàn)象出發(fā),以網(wǎng)絡(luò)診斷工具為手段獲取診斷信息,確定網(wǎng)絡(luò)故障點,查找問題的根源,排除故障,恢復(fù)網(wǎng)絡(luò)正常運行。
網(wǎng)絡(luò)故障通常有以下幾種可能:物理層中物理設(shè)備相互連接失敗或者硬件及線路本身的問題;數(shù)據(jù)鏈路層的網(wǎng)絡(luò)設(shè)備的接口配置問題;網(wǎng)絡(luò)層網(wǎng)絡(luò)協(xié)議配置或操作錯誤;傳輸層的設(shè)備性能或通信擁塞問題;上三層CISCOIOS或網(wǎng)絡(luò)應(yīng)用程序錯誤。診斷網(wǎng)絡(luò)故障的過程應(yīng)該沿著OSI七層模型從物理層開始向上進行。首先檢查物理層,然后檢查數(shù)據(jù)鏈路層,以此類推,設(shè)法確定通信失敗的故障點,直到系統(tǒng)通信正常為止。
網(wǎng)絡(luò)診斷可以使用包括局域網(wǎng)或廣域網(wǎng)分析儀在內(nèi)的多種工具:路由器診斷命令;網(wǎng)絡(luò)管理工具和其它故障診斷工具。CISCO提供的工具足以勝任排除絕大多數(shù)網(wǎng)絡(luò)故障。查看路由表,是解決網(wǎng)絡(luò)故障開始的好地方。ICMP的ping、trace命令和Cisco的show命令、debug命令是獲取故障診斷有用信息的網(wǎng)絡(luò)工具。我們通常使用一個或多個命令收集相應(yīng)的信息,在給定情況下,確定使用什么命令獲取所需要的信息。譬如,通過IP協(xié)議來測定設(shè)備是否可達到的常用方法是使用ping命令。ping從源點向目標發(fā)出ICMP信息包,如果成功的話,返回的ping信息包就證實從源點到目標之間所有物理層、數(shù)據(jù)鏈路層和網(wǎng)羅層的功能都運行正常。如何在互聯(lián)網(wǎng)絡(luò)運行后了解它的信息,了解網(wǎng)絡(luò)是否正常運行,監(jiān)視和了解網(wǎng)絡(luò)在正常條件下運行細節(jié),了解出現(xiàn)故障的情況。監(jiān)視那些內(nèi)容呢?利用showinterface命令可以非常容易地獲得待檢查的每個接口的信息。另外showbuffer命令提供定期顯示緩沖區(qū)大小、用途及使用狀況等。Showproc命令和showprocmem命令可用于跟蹤處理器和內(nèi)存的使用情況,可以定期收集這些數(shù)據(jù),在故障出現(xiàn)時,用于診斷參考。
網(wǎng)絡(luò)故障以某種癥狀表現(xiàn)出來,故障癥狀包括一般性的(象用戶不能接入某個服務(wù)器)和較特殊的(如路由器不在路由表中)。對每一個癥狀使用特定的故障診斷工具和方法都能查找出一個或多個故障原因。一般故障排除模式如下:第一步,當(dāng)分析網(wǎng)絡(luò)故障時,首先要清楚故障現(xiàn)象。應(yīng)該詳細說明故障的癥侯和潛在的原因。為此,要確定故障的具體現(xiàn)象,然后確定造成這種故障現(xiàn)象的原因的類型。例如,主機不響應(yīng)客戶請求服務(wù)。可能的故障原因是主機配置問題、接口卡故障或路由器配置命令丟失等。第二步,收集需要的用于幫助隔離可能故障原因的信息。向用戶、網(wǎng)絡(luò)管理員、管理者和其他關(guān)鍵人物提一些和故障有關(guān)的問題。廣泛的從網(wǎng)絡(luò)管理系統(tǒng)、協(xié)議分析跟蹤、路由器診斷命令的輸出報告或軟件說明書中收集有用的信息。第三步,根據(jù)收集到的情況考慮可能的故障原因。可以根據(jù)有關(guān)情況排除某些故障原因。例如,根據(jù)某些資料可以排除硬件故障,把注意力放軟件原因上。對于任何機會都應(yīng)該設(shè)法減少可能的故障原因,以至于盡快的策劃出有效的故障診斷計劃。第四步,根據(jù)最后的可能的故障原因,建立一個診斷計劃。開始僅用一個最可能的故障原因進行診斷活動,這樣可以容易恢復(fù)到故障的原始狀態(tài)。如果一次同時考慮一個以上的故障原因,試圖返回故障原始狀態(tài)就困難的多了。第五步,執(zhí)行診斷計劃,認真做好每一步測試和觀察,直到故障癥狀消失。第六步,每改變一個參數(shù)都要確認其結(jié)果。分析結(jié)果確定問題是否解決,如果沒有解決,繼續(xù)下去,直到解決。
四.網(wǎng)絡(luò)故障分層診斷技術(shù)
1.物理層及其診斷
物理層是OSI分層結(jié)構(gòu)體系中最基礎(chǔ)的一層,它建立在通信媒體的基礎(chǔ)上,實現(xiàn)系統(tǒng)和通信媒體的物理接口,為數(shù)據(jù)鏈路實體之間進行透明傳輸,為建立、保持和拆除計算機和網(wǎng)絡(luò)之間的物理連接提供服務(wù)。
物理層的故障主要表現(xiàn)在設(shè)備的物理連接方式是否恰當(dāng);連接電纜是否正確;MODEM、CSU/DSU等設(shè)備的配置及操作是否正確。
確定路由器端口物理連接是否完好的最佳方法是使用showinterface命令,檢查每個端口的狀態(tài),解釋屏幕輸出信息,查看端口狀態(tài)、協(xié)議建立狀態(tài)和EIA狀態(tài)。
2.?dāng)?shù)據(jù)鏈路層及其診斷
數(shù)據(jù)鏈路層的主要任務(wù)是使網(wǎng)絡(luò)層無須了解物理層的特征而獲得可靠的傳輸。數(shù)據(jù)鏈路層為通過鏈路層的數(shù)據(jù)進行打包和解包、差錯檢測和一定的校正能力,并協(xié)調(diào)共享介質(zhì)。在數(shù)據(jù)鏈路層交換數(shù)據(jù)之前,協(xié)議關(guān)注的是形成幀和同步設(shè)備。
查找和排除數(shù)據(jù)鏈路層的故障,需要查看路由器的配置,檢查連接端口的共享同一數(shù)據(jù)鏈路層的封裝情況。每對接口要和與其通信的其他設(shè)備有相同的封裝。通過查看路由器的配置檢查其封裝,或者使用show命令查看相應(yīng)接口的封裝情況。
3.網(wǎng)絡(luò)層及其診斷
網(wǎng)絡(luò)層提供建立、保持和釋放網(wǎng)絡(luò)層連接的手段,包括路由選擇、流量控制、傳輸確認、中斷、差錯及故障恢復(fù)等。
排除網(wǎng)絡(luò)層故障的基本方法是:沿著從源到目標的路徑,查看路由器路由表,同時檢查路由器接口的IP地址。如果路由沒有在路由表中出現(xiàn),應(yīng)該通過檢查來確定是否已經(jīng)輸入適當(dāng)?shù)撵o態(tài)路由、默認路由或者動態(tài)路由。然后手工配置一些丟失的路由,或者排除一些動態(tài)路由選擇過程的故障,包括RIP或者IGRP路由協(xié)議出現(xiàn)的故障。例如,對于IGRP路由選擇信息只在同一自治系統(tǒng)號(AS)的系統(tǒng)之間交換數(shù)據(jù),查看路由器配置的自治系統(tǒng)號的匹配情況。
五.路由器接口故障排除
1.串口故障排除
串口出現(xiàn)連通性問題時,為了排除串口故障,一般是從showinterfaceserial命令開始,分析它的屏幕輸出報告內(nèi)容,找出問題之所在。串口報告的開始提供了該接口狀態(tài)和線路協(xié)議狀態(tài)。接口和線路協(xié)議的可能組合有以下幾種:1)串口運行、線路協(xié)議運行,這是完全的工作條件。該串口和線路協(xié)議已經(jīng)初始化,并正在交換協(xié)議的存活信息。2)串口運行、線路協(xié)議關(guān)閉,這個顯示說明路由器與提供載波檢測信號的設(shè)備連接,表明載波信號出現(xiàn)在本地和遠程的調(diào)制解調(diào)器之間,但沒有正確交換連接兩端的協(xié)議存活信息。可能的故障發(fā)生在路由器配置問題、調(diào)制解調(diào)器操作問題、租用線路干擾或遠程路由器故障,數(shù)字式調(diào)制解調(diào)器的時鐘問題,通過鏈路連接的兩個串口不在同一子網(wǎng)上,都會出現(xiàn)這個報告。3)串口和線路協(xié)議都關(guān)閉,可能是電信部門的線路故障、電纜故障或者是調(diào)制解調(diào)器故障。4)串口管理性關(guān)閉和線路協(xié)議關(guān)閉,這種情況是在接口配置中輸入了shutdown命令。通過輸入noshutdown命令,打開管理性關(guān)閉。
接口和線路協(xié)議都運行的狀況下,雖然串口鏈路的基本通信建立起來了,但仍然可能由于信息包丟失和信息包錯誤時會出現(xiàn)許多潛在的故障問題。正常通信時接口輸入或輸出信息包不應(yīng)該丟失,或者丟失的量非常小,而且不會增加。如果信息包丟失有規(guī)律性增加,表明通過該接口傳輸?shù)耐ㄐ帕砍^接口所能處理的通信量。解決的辦法是增加線路容量。查找其他原因發(fā)生的信息包丟失,查看showinterfaceserial命令的輸出報告中的輸入輸出保持隊列的狀態(tài)。當(dāng)發(fā)現(xiàn)保持隊列中信息包數(shù)量達到了信息的最大允許值,可以增加保持隊列設(shè)置的大小。
2.以太接口故障排除
以太接口的典型故障問題是:帶寬的過分利用;碰撞沖突次數(shù)頻繁;使用不兼容的幀類型。使用showinterfaceethernet命令可以查看該接口的吞吐量、碰橦沖突、信息包丟失、和幀類型的有關(guān)內(nèi)容等。
1)通過查看接口的吞吐量可以檢測網(wǎng)絡(luò)的利用。如果網(wǎng)絡(luò)廣播信息包的百分比很高,網(wǎng)絡(luò)性能開始下降。光纖網(wǎng)轉(zhuǎn)換到以太網(wǎng)段的信息包可能會淹沒以太口。互聯(lián)網(wǎng)發(fā)生這種情況可以采用優(yōu)化接口的措施,即在以太接口使用noiproute-cache命令,禁用快速轉(zhuǎn)換,并且調(diào)整緩沖區(qū)和保持隊列。
2)兩個接口試圖同時傳輸信息包到以太電纜上時,將發(fā)生碰橦。以太網(wǎng)要求沖突次數(shù)很少,不同的網(wǎng)絡(luò)要求是不同的,一般情況發(fā)現(xiàn)沖突每秒有3、5次就應(yīng)該查找沖突的原因了。碰橦沖突產(chǎn)生擁塞,碰橦沖突的原因通常是由于敷設(shè)的電纜過長、過分利用、或者“聾”節(jié)點。以太網(wǎng)絡(luò)在物理設(shè)計和敷設(shè)電纜系統(tǒng)管理方面應(yīng)有所考慮,超規(guī)范敷設(shè)電纜可能引起更多的沖突發(fā)生。
3)如果接口和線路協(xié)議報告運行狀態(tài),并且節(jié)點的物理連接都完好,可是不能通信。引起問題的原因也可能是兩個節(jié)點使用了不兼容的幀類型。解決問題的辦法是重新配置使用相同幀類型。如果要求使用不同幀類型的同一網(wǎng)絡(luò)的兩個設(shè)備互相通信,可以在路由器接口使用子接口,并為每個子接口指定不同的封裝類型。
3.異步通信口故障排除
互連網(wǎng)絡(luò)的運行中,異步通信口的任務(wù)是為用戶提供可靠服務(wù),但又是故障多發(fā)部位。主要的問題是,在通過異步鏈路傳輸基于LAN通信量時,將丟失的信息包的量降止最少。
異步通信口故障一般的外部因素是:撥號鏈路性能低劣;電話網(wǎng)交換機的連接質(zhì)量問題;調(diào)制解調(diào)器的設(shè)置。檢查鏈路兩端使用的調(diào)制解調(diào)器:連接到遠程PC機端口調(diào)制解調(diào)器的問題不太多,因為每次生成新的撥號時通常都初始化調(diào)制解調(diào)器,利用大多數(shù)通信程序都能在發(fā)出撥號命令之前發(fā)送適當(dāng)?shù)脑O(shè)置字符串;連接路由器端口的問題較多,這個調(diào)制解調(diào)器通常等待來自遠程調(diào)制解調(diào)器的連接,連接之前,并不接收設(shè)置字符串。如果調(diào)制解調(diào)器丟失了它的設(shè)置,應(yīng)采用一種方法來初始化遠程調(diào)制解調(diào)器。簡單的辦法是使用可通過前面板配置的調(diào)制解調(diào)器,另一種方法是將調(diào)制解調(diào)器接到路由器的異步接口,建立反向telnet,發(fā)送設(shè)置命令配置調(diào)制解調(diào)器。
showinterfaceasync命令、showline命令是診斷異步通信口故障使用最多的工具。showinterfaceasync命令輸出報告中,接口狀態(tài)報告關(guān)閉的唯一的情況是接口沒有設(shè)置封裝類型。線路協(xié)議狀態(tài)顯示與串口線路協(xié)議顯示相同。showline命令顯示接口接收和傳輸速度設(shè)置以及EIA狀態(tài)顯示。showline命令可以認為是接口命令(showinterfaceasync)的擴展。showline命令輸出的EIA信號及網(wǎng)絡(luò)狀態(tài):
noCTSnoDSRDTRRTS:調(diào)制解調(diào)器未與異步接口連接。
CTSnoDSRDTRRTS:調(diào)制解調(diào)器與異步接口連接正常,但未連接遠程調(diào)制解調(diào)器。
CTSDSRDTRRTS:遠程調(diào)制解調(diào)器撥號進入并建立連接。
確定異步通信口故障一般可用下列步驟:檢查電纜線路質(zhì)量;檢查調(diào)制解調(diào)器的參數(shù)設(shè)置;檢查調(diào)制解調(diào)器的連接速度;檢查rxspeed和txspeed是否與調(diào)制解調(diào)器的配置匹配;通過showinterfaceasync命令和showline命令查看端口的通信狀況;從showline命令的報告檢查EIA狀態(tài)顯示;檢查接口封裝;檢查信息包丟失及緩沖區(qū)丟失情況。
六.結(jié)語
網(wǎng)絡(luò)發(fā)生故障是不可避免的。網(wǎng)絡(luò)建成運行后,網(wǎng)絡(luò)故障診斷是網(wǎng)絡(luò)管理的重要技術(shù)工作。搞好網(wǎng)絡(luò)的運行管理和故障診斷工作,提高故障診斷水平需要注意以下幾方面的問題:認真學(xué)習(xí)有關(guān)網(wǎng)絡(luò)技術(shù)理論;清楚網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計,包括網(wǎng)絡(luò)拓樸、設(shè)備連接、系統(tǒng)參數(shù)設(shè)置及軟件使用;了解網(wǎng)絡(luò)正常運行狀況、注意收集網(wǎng)絡(luò)正常運行時的各種狀態(tài)和報告輸出參數(shù);熟悉常用的診斷工具,準確的描述故障現(xiàn)象。