服務器故障如何處理?面對服務器故障的發生,第一步永遠是先進行必要的信息收集,對于整個系統的基本信息,故障信息、存儲設備信息以及組網、主機服務器信息要有了解。
對故障可能的發生原因有一個了解,然后再細化到每個組成部分上排查可能存在的問題。
主機層
在主機層面大多需要檢查的是操作系統版本,相應的HBA卡是否達到合適的標準,如速率、IOPS及帶寬等。其次是在主機上安裝的多路徑軟件,查看一下與存儲設備連接的物理路徑的狀態以及存儲LUN等信息。
網絡層
網絡層次可能發生的問題大多是連通性問題,由于鏈路故障導致的丟包或者誤碼率上升等現象,此現象可以在交換機上觀察端口的信息,觀察誤碼率是否在持續增長,如有,則可能存在鏈路部件異常或接觸不良的現象。其次,可能是端口速率或帶寬未達到標準,查看端口配置及協商狀況,這些都有可能導致服務器安全故障或性能問題。
存儲層
在底層存儲方面主要考慮存儲模塊的配置,指示燈狀態等信息,從指示燈狀態我們可以分析出是否存在硬件故障等,其次在配置方面:RAID級別、分條深度、LUN讀寫策略、cache策略,LUN歸屬、硬盤類型等是否符合業務的特點以及不符合時可能導致的問題。都是需要我們在故障排查處理時需要考慮的。
以上是域名頻道關于服務器故障如何處理的整理,域名頻道提供高穩定高可用的云服務器產品,詳情鏈接 http://verycreative.cn/vps/