客戶在使用光模塊時或多或少會遇到各種各樣的故障問題,像光模塊型號選用是否正確、使用的跳線是否正確等一些常見問題,客戶是有判斷能力且有明確的解決方法,但對于某些使用時出現(xiàn)的故障問題,如傳輸異常等,很多客戶不知道該如何排查并解決。本文將重點教您如何排查并解決傳輸、信息讀取以及硬件三個方面的故障。
傳輸類故障排查及解決方法
該類故障問題主要包含端口不UP、端口狀態(tài)為UP但不接收或發(fā)送報文、端口頻繁up或down以及CRC錯誤。具體排查方式及解決方案如下:
端口不UP
以10G SFP+/XFP光模塊為例,當光模塊光口與其他設(shè)備互連不能UP時,可從以下五個方面進行排查:
第一步,檢查兩端端口的速率和雙工模式是否匹配——執(zhí)行“show interface brief”命令進行查看,若是不匹配,通過speed命令和duplex命令配置端口的速率和雙工模式。
第二步,檢查設(shè)備端口與光模塊的速率、雙工模式是否匹配——執(zhí)行“show interface brief”命令進行查看,若是不匹配,通過speed命令和duplex命令配置端口的速率和雙工模式。
第三步,檢查兩端端口是否正常——通過環(huán)回測試兩端端口是否能UP。在單板上的10G SFP+端口上使用10G SFP+直連線纜(適用于短距離連接,或用SFP+光模塊和光纖跳線)進行互連,10G XFP端口上使用XFP光模塊和光纖來進行測試,查看該端口是否能UP。如果能UP,則說明對端端口異常;如果不能UP,則說明本端端口異常。可通過更換本端、對端端口來檢查故障是否解決。
第四步,檢查光模塊是否正常——主要是檢查DDM、光功率、波長、距離等參數(shù)是否正常,若是不正常,則通過更換與光接口匹配的光模塊。
DDM信息——通過“show interfaces transceiver detail”命令檢查參數(shù)是否正常,若出現(xiàn)告警,則表示該光模塊有故障或該光模塊與光接口類型不匹配。
光功率——使用光功率計測試端口收發(fā)光功率是否在正常范圍內(nèi)及穩(wěn)定。
波長/距離——通過“show transceiver interface”命令檢查兩端光模塊波長、距離等是否一致。
第五步,檢查光纖是否正常——如,單模SFP+光模塊搭配單模光纖,多模SFP+光模塊搭配多模光纖,若是不匹配立即更換與之相匹配的光纖即可。
若是通過上述檢查仍未找到故障原因,建議您直接聯(lián)系供應商的技術(shù)人員尋求技術(shù)幫助。
端口狀態(tài)為UP,但不接收或發(fā)送報文
當端口狀態(tài)為up,卻不能接收或發(fā)送報文時,從以下三個方面進行故障排查:
第一步,查看端口報文統(tǒng)計結(jié)果。檢查兩端端口狀態(tài)是否一直UP,并且檢測兩端的報文統(tǒng)計是否增長。
第二步,檢查端口配置是否影響報文的接收。首先檢查是否做過網(wǎng)絡(luò)配置,核查配置是否正確,必要時全部刪掉再測試看問題是否解決;其次檢查端口MTU值是否為1500,若是大于1500,則需修改配置。
第三步,檢查端口及鏈路截止是否正常。更換連接端口,將其連接到其他端口查看是否存在相同現(xiàn)象,若是仍然故障,則替換光模塊。
若是經(jīng)過上述檢查故障仍未排查清楚,則建議您直接聯(lián)系供應商的技術(shù)人員。
端口頻繁up或down
當光模塊的光端口頻繁up或down時,先確認光模塊是否異常,可通過查看光模塊alarm信息來排查兩端光模塊及連接光纖問題;對于支持數(shù)字診斷功能的光模塊可通過查看DDM信息確認光模塊的光功率是否處于臨界值,若是發(fā)射光功率處于臨界值,則更換光纖、光模塊作為交叉驗證,若是接收光功率處于臨界值,則排查對端光模塊及連接光纖。當電口光模塊出現(xiàn)該情況,嘗試設(shè)置速率雙工。
若是排查完鏈路、對端設(shè)備以及中間設(shè)備后,故障仍然存在,則建議您直接聯(lián)系供應商的技術(shù)人員。
CRC錯誤
第一步,先查看報文統(tǒng)計信息判斷故障問題。通過“show interface”命令,查看端口出入方向的錯包統(tǒng)計確定體積是哪項增長,從而判斷故障問題。
端口入方向出現(xiàn)CEC、frame、throttles錯包且計數(shù)持續(xù)增加——使用儀器測試鏈路是否故障,若是故障則更換網(wǎng)線或光纖;或者更換網(wǎng)線或光纖光模塊與其他端口連接,若是端口更換后錯包又再次出現(xiàn),則視為單板端口故障,若是更換到正常端口仍出現(xiàn)錯包,則對端設(shè)備、中間傳輸鏈路故障的可能性較大,排查即可。
檢查端口入方向是否出現(xiàn)overrun錯包且計數(shù)持續(xù)增加——通過多次執(zhí)行“show interface”命令查詢input errors是否有增加,若有則代表著overruns增加,單板內(nèi)部可能擁塞或堵死。
檢查端口入方向是否出現(xiàn)giants錯包且計數(shù)持續(xù)增加——檢查兩端Jumbo配置是否一直,如端口默認的最大報文長度是否一致,允許最大報文長度是否一致等。
第二步,檢查光模塊的光功率是否正常。通過“show transceiver interfaces detail”命令查看光口所插光模塊的數(shù)字診斷參數(shù)的當前測量值。若是光模塊的光功率不正常,則需更換光模塊。
第三步,檢查端口配置是否正常。通過“show interface brief”命令查看端口配置是否有異常,其中兩端的協(xié)商狀態(tài)雙工模式和端口速率是否一致,若是存在半雙工模式或速率不一致,則通過duplex命令和speed命令分別配置雙工模式和端口速率。
第四步,檢查端口及鏈路介質(zhì)是否正常。更換連接端口查看是否存在相同現(xiàn)象,若是存在相同現(xiàn)象,則檢查連接鏈路中中間設(shè)備以及傳輸介質(zhì)是否正常,若是正常,則替換光模塊。
第五步,檢查端口是否收到大量流控幀。通過“show interface”命令,查看端口pauses幀計數(shù),若是不斷增長,則說明該端口發(fā)出或接收到了大量的流控幀。另外,檢查端口出入流量是否過大以及對端設(shè)備的流量處理能力。
通過上述檢查完成后若是配置、對端以及鏈路都沒有問題,那么請直接聯(lián)系供應商的技術(shù)支持人員。
信息讀取異常類故障排查及解決方法
顯示不支持
當查看系統(tǒng)日志時發(fā)現(xiàn)存在上報非合法光模塊信息,如unqualified、unapproved、unknown等,則先檢查編碼信息,若是編碼出現(xiàn)差錯,則重新編碼,若是編碼正確,可聯(lián)系供應商的技術(shù)支持人員尋求幫助。
不支持DDM
當系統(tǒng)提示光模塊不支持數(shù)字診斷時,通過“show transceiver interfaces detail”命令查詢對數(shù)字診斷功能的支持與否,或直接聯(lián)系供應商咨詢該光模塊是否支持數(shù)字診斷功能。若該模塊支持數(shù)字診斷功能,卻沒辦法解決故障,直接聯(lián)系供應商的技術(shù)支持人員尋求幫助。
DDM異常
當安裝光模塊的接口無法正常工作時,可根據(jù)以下三步驟進行故障排查:
第一步,檢查光模塊Alarm告警信息。若是告警信息中存在接收有問題,一般是對端端口、光纖或中轉(zhuǎn)設(shè)備所導致的;若是存在發(fā)送問題或者電流、電壓異常,則需排查本端端口。
第二步,檢查光模塊的接收、發(fā)送光功率是否正常。可通過“show interfaces transceiver detail”命令,查詢光模塊的接收/發(fā)送光功率是否正常,以及其他參數(shù)是否在閾值范圍內(nèi);或者通過實時查詢,檢查光功率、溫度、電壓、偏直電流等參數(shù)是否正常。
第三步,檢查是光模塊本身故障還是相鄰設(shè)備或中間連接鏈路故障。可更換端口、光模塊等來進行交叉驗證。
經(jīng)過上述步驟,仍然無法確認,可聯(lián)系供應商的技術(shù)支持人員需求技術(shù)幫助。
硬件類故障排查及解決方法
硬件類故障排查主要是從光模塊自身出發(fā)。首先,需確保購買的光模塊品質(zhì)經(jīng)過認證,若是沒有認證,質(zhì)量無法得到保障,建議不再使用該光模塊;其次,檢查光模塊的金手指是否有損傷,若是有損傷則需替換光模塊;最后,檢查接口是否受到污染或損傷,若是接口有污染清潔即可,若是有損傷建議替換。
總結(jié)
為了大大減少光模塊在使用中故障發(fā)生的概率,最好選用性能可靠穩(wěn)定且品質(zhì)有保障的光模塊,與此同時,也要懂得正確專業(yè)的操作方式,如網(wǎng)線或光纖跳線和其他相關(guān)設(shè)備等。