江汉油田升级运维管理平台提高处理效率

“升级后的Ganglia运维管理平台,报错信息一目了然,修改作业参数可以对症下药,地震资料处理运行效率大大提升。”江汉油田物探院信息资料服务中心副主任专家肖晓燕兴奋地说道。

Ganglia运维管理平台,由该院基于开源软件Ganglia研发的物探院专属运维管理平台,主要用于监控全院集群设备运行情况,保障生产科研顺利运行。

随着近几年的应用,Ganglia运维管理平台监控信息不够精细的问题十分突出,遇到作业报错后,技术人员很难找到问题根源,无法达到预期效果。

为更好地做好技术保障,该院召集技术团队商量升级对策,从多年应用经验和解决用户需求角度出发,分析平台存在的漏洞和不足,结合院多个集群版本各自特点,开始升级Ganglia。

研发团队从网上收集有用数据、信息,凭借着多年工作积累的丰富经验,带着问题研发,修复完善前期应用中发现的漏洞,一个个试验收集的代码库,逐步测试优化,经过4个多月的努力,终于完成Ganglia运维管理平台升级。

升级后的平台,监控界面直观便捷,监控功能达到40多个,窗口里可以按照用户需求快速调出每个节点的运行情况,查看节点的CPU、内存以及数据读写状态等等关键核心参数,图片直观,信息一目了然,采样值更是精确到每个点。如今,用户可以根据错误信息列表更精准地追溯作业运行起止时间内用户参数设置与系统之间的碰撞,并采取对应的修补措施。

今年江汉油田下达的多个重点处理项目中,该运维管理平台发挥了大作用,石柱南三维地震资料处理、李埠南、八面河等项目如期提交,得到甲方高度好评。

信息来源: 
2021-10-12