摘要
本项目围绕政企民生工程通讯业务保障中的IT系统运维痛点,构建了一套基于数据驱动的IT系统运维智能体系统。该系统深度融合数据要素与人工智能技术,通过“混合模型协同推理”架构,实现对IT系统故障的预测、定位、处置与恢复的全流程智能化运维。项目已在四川、西藏、江苏等多地的政务、运营商、公安、司法等领域成功落地,显著提升运维效率与系统可靠性,具备较强的技术领先性、产业竞争力和推广价值。
一、项目背景
随着《数字中国建设整体布局规划》的深入推进,政企民生工程(如通讯服务、算力中心、政务云平台)的IT系统规模持续扩大,系统复杂度高、业务连续性要求严苛。然而,传统运维模式面临三大核心痛点:
数据孤岛:跨系统数据融合率不足30%,难以形成全局运维视图;
经验依赖:故障检测与根因定位依赖人工,平均故障检测时间(MTTD)超5分钟,定位准确率不足60%;
响应滞后:日均运维数据超50TB,AI辅助运维陷入“数据过载、价值难发挥”困境。
在此背景下,本项目以“数据要素×人工智能”融合创新为核心,构建智能运维体系,助力政企民生工程实现从“被动响应”到“主动预防”的运维模式转型。
二、项目目标
本项目旨在构建一个具备L4级全智治能力的IT系统运维智能体,具体目标包括:
故障预警:实现故障提前5分钟预警,准确率≥90%;
根因定位:将故障定位时间从数小时缩短至分钟级,准确率≥85%;
自动化处置:实现故障自愈与预案执行,人工干预率≤5%;
资源优化:通过3比特量化技术降低GPU消耗4倍,支持国产化芯片部署;
业务保障:年减少业务中断损失超200万元,提升系统可用性至99.999%。
三、建设内容
1.数据要素基础
构建“政企自有+公共数据+第三方补充”的多元数据采集体系,覆盖网络设备、服务器、业务日志、环境传感器等全链路数据。截至2025年6月,累计汇聚数据超8PB,日均处理50TB数据,通过“分类授权+脱敏处理+合规审查”确保数据全流程合规可控。
2.技术架构
采用“筑基-融智-赋能”三阶段技术路径:
筑基阶段:构建高质量、合规、安全的数据基座,支持多源异构数据接入、清洗、融合与存储;
融智阶段:构建“大模型(LLM)+小模型(LSTM、MLFD)”混合协同推理架构,实现跨模态故障诊断与动态决策;
赋能阶段:通过反馈闭环与产业赋能机制,实现系统持续进化与生态共建。
3.智能体核心能力
感知认知层:小模型实时监测指标异常,大模型解析日志语义,协同实现秒级根因定位;
决策执行层:基于知识图谱匹配预案,结合强化学习动态优化策略,实现自动化故障处置;
轻量化部署:支持3比特量化、动态分层压缩,适配国产芯片与边缘计算场景。
4.数据治理与安全
建立“全流程合规、全生命周期可控”的数据治理体系,涵盖数据标准化、伦理审查、分级分类、加密存储、区块链存证等机制,确保数据在采集、处理、流通、销毁各环节的安全与合规。
四、实施效果
1.运维效能提升
故障预警:提前5分钟预警,准确率超90%;
根因定位:时间从小时级缩短至≤3分钟,准确率提升至90%以上;
日志分析:覆盖率从70%提升至95%;
自动化处置:人工干预率降低至5%以下,故障自愈时间≤30秒。
2.经济效益显著
成本降低:GPU资源消耗降低4倍,硬件投入减少75%;
损失减少:年减少业务中断损失超200万元;
人力优化:工单处理效率提升30%,人工运维成本下降35%。
3.社会与行业价值
国产化适配:全面兼容飞腾、鲲鹏、龙芯等国产芯片,支持国家安全可控战略;
绿色低碳:算力中心能耗降低15%,年碳排放减少10%;
标准建设:参与制定国家标准1项、行业标准1项、团体标准3项、企业标准20项;
产业赋能:通过隐私计算学习推动行业数据协作,构建AIOps生态。
4.典型应用案例
四川省交通运输厅:保障“一网通办”数据服务稳定,提升政务效率;
中国移动西藏公司:在高原环境下实现云平台99.95%高可用;
成都公安天府新区分局:构建“平战结合”指挥体系,协同响应提速60%;
四川高院:实现数据库自动化运维,RTO<15分钟,满足司法数据安全要求。
《基于数据驱动的IT系统运维智能体》项目以数据要素为核心,通过技术创新与模式创新,实现了政企民生工程通讯业务运维的智能化、自动化与国产化转型。项目不仅在技术层面突破“数据孤岛”“经验依赖”等行业难题,更在经济效益、社会服务与产业生态方面展现出广泛的应用前景与推广价值,为“数字中国”建设提供了可复制、可推广的智能运维范例。




完成单位:成都派沃特科技股份有限公司
完成人:黄希、刘翼、欧瑞、宋晓梅