網絡疑難診斷

一個成熟的網絡管理機構一般都制定有一整套完整的故障管理日志記錄機制,同時人們也率先把專家系統和人工智能技術引進到網絡故障管理中心。但對于大多數初學網絡的人來說,這未免有點過于復雜,不過沒關系,我來幫大家總結一下網絡故障診斷和排除的方法和經驗,供各位網管和菜鳥參考。
我們可以根據網絡故障的性質把網絡故障分為物理故障與邏輯故障,也可以根據網絡故障的對象把網絡故障分為線路故障、路由故障和主機故障。 下面首先介紹按照網絡故障不同性質而劃分的物理故障與邏輯故障。

物理故障

  1. 1

    物理故障指的是設備或線路損壞、插頭松動、線路受到嚴重電磁干擾等情況。比如說,網絡管理人員發現網絡某條線路突然中斷,首先用ping或fping檢查線路在網管中心這邊是否連通。


    網絡故障診斷和排除
  2. 2

    ping的格式為:ping 192.168.0.1 (192.168.0.1是IP地址,可以是主機的IP也可以是網絡中另一臺計算機的IP)。ping一般一次只能檢測到一端到另一端的連通性,而不能一次檢測一端到多端的連通性,但fping一次就可以ping多個IP地址,比如C類的整個網段地址等。順便多說一句,網絡管理員經常發現有人依次掃描本網的大量IP地址,不一定就是有黑客攻擊,fping也可以做到。如果連續幾次ping都出現\"Requst time out\"信息,表明網絡不通。這時去檢查端口插頭是否松動,或者網絡插頭誤接,這種情況經常是沒有搞清楚網絡插頭規范或者沒有弄清網絡拓撲規劃的情況下導致的。

    網絡故障診斷和排除
  3. 3

    另一種情況,比如兩個路由器Router直接連接,這時應該讓一臺路由器的出口連接另一臺路由器的入口,而這臺路由器的入口連接另一路由器的出口才行。當然,集線器Hub、交換機、多路復用器也必須連接正確,否則也會導致網絡中斷。還有一些網絡連接故障顯得很隱蔽,要診斷這種故障沒有什么特別好的工具,只有依靠經驗豐富的網絡管理人員了。

    網絡故障診斷和排除

邏輯故障

  1. 1

    邏輯故障中最常見的情況就是配置錯誤,就是指因為網絡設備的配置原因而導致的網絡異常或故障。配置錯誤可能是路由器端口參數設定有誤,或路由器路由配置錯誤以至于路由循環或找不到遠端地址,或者是路由掩碼設置錯誤等。比如,同樣是網絡中的線路故障,該線路沒有流量,但又可以ping通線路的兩端端口,這時就很有可能是路由配置錯誤了。

  2. 2

    遇到這種情況,我們通常用“路由跟蹤程序”就是traceroute,它和ping類似,最大的區別在于traceroute是把端到端的線路按線路所經過的路由器分成多段,然后以每段返回響應與延遲。如果發現在traceroute的結果中某一段之后,兩個IP地址循環出現,這時,一般就是線路遠端把端口路由又指向了線路的近端,導致IP包在該線路上來回反復傳遞。幸好traceroute可以檢測到哪個路由器之前都能正常響應,到哪個路由器就不能正常響應了。這時只需更改遠端路由器端口配置,就能恢復線路正常了。

  3. 3

    邏輯故障的另一類就是一些重要進程或端口關閉,以及系統的負載過高。比如也是線路中斷,沒有流量,用ping發現線路端口不通,檢查發現該端口處于down的狀態,這就說明該端口已經關閉,因此導致故障。這時只需重新啟動該端口,就可以恢復線路的連通了。還有一種常見情況是路由器的負載過高,表現為路由器CPU溫度太高、CPU利用率太高,以及內存剩余太少等,如果因此影響網絡服務質量,最直接也是最好的辦法就是——更換路由器,當然換個好點的。(如果你有銀子的話)




網絡故障根據故障的不同對象也可以劃分為:線路故障、路由故障和主機故障。
  
  1. 線路故障
  線路故障最常見的情況就是線路不通,診斷這種情況首先檢查該線路上流量是否還存在,然后用ping檢查線路遠端的路由器端口能否響應,用traceroute檢查路由器配置是否正確,找出問題逐個解決。方法在前面已經提過,這里就不多說了。
  
  2. 路由器故障
  事實上,線路故障中很多情況都涉及到路由器,因此也可以把一些線路故障歸結為路由器故障。檢測這種故障,需要利用MIB變量瀏覽器,用它收集路由器的路由表、端口流量數據、計費數據、路由器CPU的溫度、負載以及路由器的內存余量等數據,通常情況下網絡管理系統有專門的管理進程不斷地檢測路由器的關鍵數據,并及時給出報警。而路由器CPU利用率過高和路由器內存余量太小都將直接影響到網絡服務的質量。解決這種故障,只有對路由器進行升級、擴大內存等,或者重新規劃網絡拓撲結構。
  
  3. 主機故障
  主機故障常見的現象就是主機的配置不當。像主機配置的IP地址與其它主機沖突,或IP地址根本就不在子網范圍內,由此導致主機無法連通。主機的另一故障就是安全故障。比如,主機沒有控制其上的finger,RPC,rlogin等多余服務。而攻擊者可以通過這些多余進程的正常服務或bug攻擊該主機,甚至得到Administrator的權限等。還有值得注意的一點就是,不要輕易的共享本機硬盤,因為這將導致惡意攻擊者非法利用該主機的資源。發現主機故障一般比較困難,特別是別人惡意的攻擊。一般可以通過監視主機的流量、或掃描主機端口和服務來防止可能的漏洞。最后提醒大家不要忘了安裝防火墻,因為這是最省事也是最安全的辦法。

中超联赛排名