湖南空管分局成功处置一起管制综合信息系统业务故障

2024-11-16 16:40:24 admin

通讯员张志芳报道:近日,湖南合信湖南空管分局管制综合信息系统中的空管TOMS(塔台运行管理系统)子系统所有终端退出服务,FIPS (航班信息处理系统)部分报文处理服务异常,分局湖南空管分局技术保障部值班人员随即检查故障服务器数据库性能时,成功处置发现FIPS 数据库出现死锁,起管TOMS主用数据库节点宕机,制综障存储硬件出现橙色告警。息系

管制综合信息系统为管制员提供航班动态显示、统业自动化系统前置处理、湖南合信塔台电子进程单、空管离港放行和现场运行管理等多项重要管制运行功能。分局故障发生时正值暑运高峰时段,成功处置TOMS 系统对塔台管制指挥尤为重要,起管情况紧急。制综障

技术人员根据应急处置预案,息系第一时间协助塔台管制员启用了纸质进程单,恢复了塔台管制的航班显示;随即,技术人员将TOMS 系统的数据库从故障存储告警的刀框下线,启用备用刀框中的TOMS应急数据库,以最短的时间恢复了塔台TOMS 系统的正常运行。

TOMS系统业务恢复后,值班人员发现故障的存储一直在报错,而此时FIPS 及管制现场运行系统的主数据库数据仍运行在故障的存储上,如果不及时将业务迁移,后果将不堪设想。为了确保黄花国际机场第二日管制服务的正常保障,当日技保部值班领导和终端设备管理室主任现场拍板:停止故障存储上的所有在运行的管制综合信息系统主用数据库,启用备份刀框的应急数据库为主用状态。

一场与时间赛跑的特情处置在8.4凌晨分别在管制业务楼和塔台井然有序地进行。当日技保部值班领导赵坚全程在现场监督、指挥,终端设备管理室主任黄肖超多方协调广州技术专家和管制部门相关科室,精心组织技术骨干做好设备检查和业务监控。04:45,所有管制综合信息系统的数据库业务全部迁移至备份刀框的正常存储上,保障开航前所有管制业务正常使用。

8.4白天备份刀框接受了暑运大流量的考验,但是这么重要的系统没有冗余备份对于空管业务保障来说是万万不行的。当应急数据库成功保障了湖南空管分局管制服务不中断后,技术保障部主任赵坚和终端设备管理室主任黄肖超又组织中南空管局专家和湖南空管分局技术骨干投入到新一轮故障刀框的存储排故工作中去了。

48小时,整整48小时,湖南空管分局技保部领导和终端设备室领导、员工一直坚持在现场,通过搜集日志,更换备件,优化配置,重启故障设备等系列操作,最终定位了本次设备故障的原因:主用刀框存储设备控制器硬件故障,导致 FIOM (Flexed IO Module)FPGA模块反复重启,最终导致TOMS主用数据库无法访问。通过一天的观察及日志分析,DELL 厂家确认故障刀框硬件恢复正常。

在此次故障发生至定位恢复的30多个小时中技术保障部赵坚主任全程在现场跟踪故障处置情况,并不断与管制部门进行沟通协调为故障处置和检修争取更大的空间,持续工作48小时后看到设备恢复才安心离开现场。终端设备室黄肖超主任全程带领值班人员进行故障分析,探讨处置方案,为值班人员树立了废寝忘食、不辞劳苦的好榜样。多名值班人员一直坚守现场,做好运行保障的同时积极协助厂家进行日志搜集、进行故障及可能存在隐患的分析。此次故障处置展现了湖南空管分局技术人员严谨的工作作风、缜密的处置思路、精湛的业务技能和强大的团结协作能力,始终坚持“专心做事,用心服务”,为蓝色天空下的每次安全飞行保驾护航。

  • 文章

    191

  • 浏览

    616

  • 获赞

    7

赞一个、收藏了!

分享给朋友看看这篇文章

热门推荐