一、事件基本情况
1、某局大楼通信机房,由于空调故障导致通信机房温度超出服务器承受范围,服务器感应器传感系统启用,服务器自动关闭系统进程。本次两套马可尼网管主用服务器及备用服务器都是因机房温度过高,自动关闭服务器。服务器不能正常运行。
当温度降到服务器能承受
2、事件状态下的通信运行方式
220kv板桥站(sma-16)至某局大楼(sma-16)传输a网业务运行在保护通道
3、事件经过及影响范围
(1)事件经过
事件:220kv板桥站(sma-16)至某局大楼(sma-16)传输a网通道误码率过多,影响传输,主用通道业务中段。业务自动倒换到保护通道。
故障原因:220kv板桥站(sma-16)至某局大楼(sma-16)传输a网光路在板桥站侧的交换卡switch unit interface 1 parity fail 。systemclock failure from switch a .交换卡裂化造成stm-16通道误码。
08:30 220kv板桥站(sma-16)至某局大楼(sma-16)传输a网sdh hovc#1 #2 ho path excessive ber告警。
09:30 通信网管人员报障(220kv板桥站(sma-16)至某局大楼(sma-16)传输a网通道误码率过多),造成主用通道业务中段,自动倒换到保护通道。重要中心站点需立即组织相关人员进行诊断抢修。
10:50抢修人员负责人到达220kv板桥站,办理好相关工作手续后,马上组织人员对板桥站至某局光路光路纤芯连接进行检查,对业务中断光纤进行测试,光路收发正常。
在设备上查看光卡收发光功率显示正常,而在光卡line west a/east a上显示sdh hovc #1#2 ho path excessive ber,再switch 卡上查看时发现line west a/east a switch unit interface 1 parity fail出现时间相隔两天。其它链路上未出现异常告警,判断为交换卡裂化,需更换交换卡恢复业务。
16:00 抢修人员负责人在某局网管主管处取来交换卡,将交换卡安装在保护槽位,设备告警消失,所有主用业务恢复正常运行。
二、事件原因分析
事件原因:
220kv板桥站(sma-16)至某局大楼(sma-16)传输a网通道板桥站侧的交换卡裂化,交换能力下降,由于没有保护交换卡,造成交换通道误码率上升,至使通道中断,倒换至保护通道。设备运行年限时间长是交换卡故障主要原因。
三、暴露的问题
在网运行的设备未配置相应保护板卡,出现问题时容易造成运行业务中断。未配备相应备品备件,出现问题时无法最快速处理。
四、整改措施与建议
对于在网运行设备必需安装相应的保护板卡,及配备相应的备品备件,一旦运行时间长出现裂化或异常,发现故障急时处理。加强网管监测力度,一旦发现异常马上通报处理。