1告警系統分析
C&C08程控交換機在運行過程中,當某些部件出現故障時,交換機的告警系統就會檢測收集到各種軟、硬件故障,然后經維護軟件處理后在告警臺輸出告警信息報告,并通過告警箱顯示告警級別及告警原因,發出可視、可聞信號,提示維護人員進行必要的處理,以保證設備的正常運行。
C&C08交換機的告警系統采用分散采集、集中處理的方式,將各種告警信息集中到告警通信板分類處理后,再分別送到告警燈、告警箱和遠端網管中心。根據故障對設備的影響程度、重要性及緊迫性分為緊急故障、重要故障、一般故障和提示性故障等4個告警級別。
1.1緊急告警(一級告警)
緊急告警需要緊急處理,這種告警往往具有全局性,會導致主機癱瘓,對應紅色告警級別指示燈和急促鈴聲。如主機板故障、網板故障、時鐘板故障等,故障內容涉及CPU、EMA、BNET、CNT、CTN、SNT、FBI等重要部件。
1.2重要告警(二級告警)
重要告警指局部范圍內的單板或線路故障告警和事故告警,需要及時處理,否則會影響重要功能的實現,如用戶板故障、數字中繼板故障等;對應信號為紅色指示燈及次急促鈴聲。故障內容涉及SIG、MFC、DRV、ST、ASL、MC2、OPT及NOD等板件,以及信令鏈路故障等。
1.3一般告警(三級告警)
一般告警,指一般性的,描述各單板或線路工作是否工作的狀態故障告警和事故告警;提醒維護人員及時查找告警原因,消除故障隱患,對應信號為黃色指示燈及斷續鈴聲。故障內容涉及單板復位、PCM告警等。
1.4警告告警(四級告警)
警告告警是提示性告警,指不會影響系統性能的提示性的故障告警和事故告警,如測試板告警,這種告警不會影響系統性能,不必及時處理,但對交換機運行狀態要做到心中有數,對應信號為綠色指示燈及單次鈴聲。
在日常維護中,機房維護人員應從以下5個方面察看告警信息:一是機架行列告警燈,二是告警箱,三是維護終端的告警臺,四是單板指示燈,五是維護臺的“設備控制”單板狀態。另外有些故障可能在上述5處都無法查覺,而是來自用戶的申告。通過以上方面察看可以獲得告警信息和用戶申告信息。
2故障分析和處理的原則
C&C08的操作系統不僅具有各種軟件管理協調功能,同時還具有差錯分析和處理能力。對于機房維護人員來說,后者更具有重要現實意義。因為在實際操作中,我們可以利用交換機的差錯分析處理軟件對故障進行分析和判斷。
當C&C08的操作系統發出告警信息后,機房維護人員首先應根據告警的級別判斷障礙性質、重要性及地點,并遵循以下原則對故障進行分析和處理:
(1) 處理重要事件時,首先要提取話單,以免話單丟失;
(2) 在能夠處理的范圍內,盡量不影響全局通話;
(3) 避免在話務量高峰時處理,最好在話務空閑時進行故障處理;
(4) 觀察單板指示燈和維護終端的狀態,分析相關單板;
(5) 不要盲目更換單板,防止故障擴散;
(6) 插拔單板時,一定要帶防靜電腕套,并將接地端靠地連接。
3交換機的故障定位與處理方法
3.1C&C08交換機的測試診斷功能
C&C08具有較強的測試診斷功能。一方面,各智能單板都具有自檢功能,設備運行過程中,各智能單板可實時進行自檢,一旦發生故障將自動報警或倒換;另一方面可通過測試子系統向主機發送命令,對指定設備進行測試。
3.1.1測試系統的組成和基本原理
(1) 測試系統的組成。C&C08機的測試系統由硬件測試設備、主機軟件和終端軟件組成。硬件測試設備主要包括用戶電路測試板(TSS)、用戶模塊母板測試總線以及帶有自測功能的各種智能單板。測試系統的主機軟件是指運行于交換模塊MPU板的主機軟件中的TEST程序模塊。測試系統的終端軟件由BAM上的測試服務器和工作站上的測試臺組成。
(2) 測試系統的基本原理。測試子系統通過終端系統向主機發送人機命令,由主機下達相應的測試命令給相應的設備,啟動相應的測試任務。測試完成后將測試結果通過主機送回終端,由終端系統進行分析、統計、顯示與打印。
3.1.2測試系統的主要內容
C&C08測試系統的主要內容包括3個部分,即用戶電路測試、系統單板測試、測試系統自檢。
(1) 用戶電路測試。電路測試主要指對交換機用戶電路的各項性能或指標的測試。主要包括用戶內線測試、用戶外線測試及用戶儀表測試。測試的性能指標包括:線路絕緣電阻、絕緣電壓、絕緣電容及用戶板性能測試。
(2) 系統單板測試。系統單板測試是指系統對23種單板提供的單板自檢功能,如MPU、EMA、BNET板等。各智能單板在平時即可進行實時自檢,一旦有故障將自動向終端發送告警信息。當測試系統向上列單板發出測試命令后,根據各單板返回的測試結果可判斷出各單板的運行狀態,從面進行故障定位。
(3) 測試系統自檢。測試系統自檢主要是對測試板、測試總線的檢測,以防止因測試板或測試總線的原因導致測試結果出現錯誤。
在日常的維護工作中,維護人員經常需要利用交換系統提供的各種測試手段對設備出現的各類故障進行定位及定性分析,所以掌握交換機的各種測試內容尤為重要。
3.2C&C08交換機故障分析和處理的方法
故障不同,故障的表現形式也不盡相同。機房維護人員要根據不同故障的表現形式,結合實際工作經驗,判斷故障的級別,分析故障現象,找出故障產生的原因,并準確鎖定故障位置,迅速排除故障。C&C08交換機故障處理方法一般有以下5種:
(1) 排除法。某些故障由于涉及的故障點較多,應先羅列出故障現象及故障發生的可能性,根據話音和信令的流程進行分析,逐步排除。分析故障可能性時,要盡可能做到全面、客觀,不要有遺漏,實際排除可能性時,應從可能性低的開始排除,層層遞進。
(2) 對比法。參照本系統正常運行的設備或其他工作場地正常運行的設備數據作基準,仔細對比故障設備和正常設備之間的參數區別,分析故障發生的可能性,找出故障的準確位置。
(3) 替換法。對硬件設備故障的處理往往采用替換法。即當懷疑某個電路板出現問題時,維護人員可通過替換電路板的方法進行判斷和驗證。替換時應做到替換的正常設備要與被替換的設備完全相符,替換后進行相關的后續處理及恢復性的操作,如果一切恢復正常,則表示此故障為硬件設備發生問題。
(4) 數據修改、數據再設定法。此方法適用于軟件方面的故障鑒定。如果系統軟件在設計和編制時存在某種缺陷,或是系統參數、數據及用戶數據等出現某種錯誤,會導致系統不能在特定情況下正常執行某些任務。當此類現象發生時,維護人員可采用數據修改或數據再設定的方法進行處理。
(5) 人工啟動和邏輯復位法。即重新啟動或復位法,一般采取按復位鍵,重新插拔單板,或者直接關閉電源重新復位,對單板的硬件、軟件進行邏輯初始化,使其恢復正常的工作狀態。此種方法一般是在單板硬件或軟件發生混亂而無法正中國論文聯盟www.Lwlm.com常工作的時候采用。