联通智网创新中心构建系统可观测稳定性保障体系,数智赋能运营新生态
发布时间:2024-08-08 16:48:49 | 来源:中国网 | 作者: | 责任编辑:孙玥中国联通智网创新中心全面贯彻党的二十届三中全会精神,发展高效新质生产力,纵深推进科技创新、数智赋能。客户交付运营室在支部红色引擎行动指引下成立运营尖兵队,围绕“系统高效运行保障创新攻坚”课题,构建了集约网络运营监控管理平台,推进网络IT支撑系统可观测稳定性保障体系落地,利用多源海量数据进行智能分析、敏捷处理,致力做优智慧运营、增强运营新动能、提升服务精准度,担当“系统守护神”。
【洞见势之所趋,深入践行科创之责】
当前应用上云和微服务架构正在成为技术主流趋势,系统变得更敏捷、更健壮、更高性能,但也带来了架构复杂度的提升,传统运维方法已经无法满足数字经济时代的新需求,构建智能化、集约化运营体系成为企业转型的关键。
迎接挑战,运营尖兵队知重负重,围绕“拉通ICT,构建大生态”的总体目标,打造一体化智慧运营体系,实现生产运营全流程贯通、故障全生命周期管控、多层级全息系统运行情况观测视图,已完成规模化赋能应用,为100+大型集约系统提供全链路端到端工具支撑,助力全国集约化运营体系落地。
如何实现故障“发现-定位-预防”,保障系统可视、可管、可控、可持续运营?
【AIops助力立体化监控“无死角”】
运营尖兵队制定了全层级监控告警覆盖规范,利用多样化、非侵入方式进行数据采集,构建了统一告警中心,实现告警信息一点看全、一点派发,大幅提升了故障预警效率。
告警不仅要提量更要提质,从海量告警中识别关键信息重点是优化告警配置,降低误告次数,平台利用AIOps算法智能化分析运营数据,预测服务阈值、检测异常业务指标等,告警压缩率达80%、大幅提升了告警准确率,系统可用率达业界先进水平。
【性能监控实时“跟踪”用户感知】
面对多源前端触点,除对系统运行指标监控之外,网络运营监控管理平台打造了统一浏览器监控工具,实时抓取JS错误、AJAX请求、点击、页面加载等数据,主动感知用户体验,辅助系统排查异常、堵塞漏洞、优化功能设计,提升用户满意度,切实助力数字化感知运营。
【APM调用链担当故障定位“指挥棒”】
故障根因分析不仅关乎故障识别,更重要的是追溯引发问题的深层次原因,从根本上解决问题,这一过程仅依赖专家经验知识库是不够的,平台通过APM应用性能监控,清洗服务、中间件、外部接口,实时追踪全层级服务调用链路数据,自动生成服务链路拓扑,打穿业务和服务壁垒,实现秒级预警、分钟级根因定位。
【未雨绸缪,遇事方从容】
征程万里风正劲,重任千钧再奋蹄。未来,联通智网创新中心将充分展现“数字信息运营服务国家队、数字技术融合创新兵”的责任与担当,践行“强基固本、守正创新、融合开放”集团战略,持续聚焦数智应用发展、网信安全行动计划,加强科技创新,加快实现高水平科技自立自强,发展新质生产力,助力公司高质量发展,推进数字化转型迈向新台阶,朝着建成科技强国的宏伟目标奋勇前进。(中国联通智网创新中心)