基于大模型智能体的无线网区域故障管理创新应用案例

中国联通某省公司(以下简称该公司)依托亚信科技智能体平台(AI Agent Platform,以下简称AAP),构建了一套基于大模型智能体的无线网区域故障智慧管理系统。该系统以大模型为核心,融合知识库、拓扑生成、多智能体协同等能力,实现对无线网区域性故障的自动识别、智能定界定位、处置建议推送与闭环管理。

摘要

随着5G网络规模化部署与业务复杂度的提升,无线网络运维面临区域性故障频发、跨专业定界定位困难、处理流程繁琐等挑战。中国联通某省公司(以下简称该公司)依托亚信科技智能体平台(AI Agent Platform,以下简称AAP),构建了一套基于大模型智能体的无线网区域故障智慧管理系统。该系统以大模型为核心,融合知识库、拓扑生成、多智能体协同等能力,实现对无线网区域性故障的自动识别、智能定界定位、处置建议推送与闭环管理。

项目于2024年9月上线试运行,显著提升了故障处理效率与网络质量。系统月均识别区域性退服故障346次,较上线前下降34.8%;基站4小时恢复达标率达95.9%,提升1.1个百分点;故障定位推送平均耗时仅8分钟,定位准确率达80%。本案例展示了大模型智能体在通信运维领域的落地价值,为行业数字化转型提供了可复用的技术路径与运营范式。

一、实施背景

1.1无线网络运维痛点突出

近年来,无线网络规模持续扩大,网络结构日趋复杂,传统运维模式在应对区域性、跨专业故障时暴露出一系列问题:

故障频发,影响面广:月均退服类故障超过5.9万次,相关工单达9600余张。区域性故障导致用户业务接入感知显著下降,严重影响客户体验。

定界定位能力弱:90%以上的区域性故障涉及传输、动环、数据设备等多专业,需跨专业协同研判。现有系统缺乏自动化、可视化的拓扑关联能力,定位过程依赖人工电话沟通,效率低下。

处置流程繁琐:故障派发后,一线人员需在多系统间手动查询动环停电、传输中断、设备告警等信息,流程环节多、耗时长,且故障复盘与策略优化缺乏数据支撑。

1.2智能化转型成为必然选择

为应对上述挑战,该公司提出引入大模型与智能体技术,构建具备自主感知、分析、决策能力的智慧运维系统。亚信科技的AAP产品以其强大的语义理解、任务规划与工具调用能力,成为该项目实现故障自动化、智能化管理的核心技术支撑。

二、实施目标

项目旨在通过构建以大模型智能体为核心的无线网故障管理系统,实现以下目标:

1.故障自动识别与智能定界定位基于实时告警数据,通过智能体自动识别区域性故障,并依托知识库与拓扑数据,实现跨专业故障的根因定位。

2.故障处理流程闭环与效率提升通过钉钉实现“T+0”信息推送,一线人员可快速反馈处理结果,系统支持故障复盘与处置策略持续优化。

3.运维知识体系化与能力沉淀构建无线故障运维专有知识库,将历史案例、专家经验转化为可检索、可推理的结构化知识,赋能一线人员。

4.运维过程可视化与可追溯基于拓扑自动生成与还原技术,实现故障影响范围、传输路径、关联设备的全景可视,支持故障处理全过程追溯。

三、建设内容

3.1整体技术架构

项目采用分层架构设计,包括业务层、能力层与网络数据底座,整体架构图如图1所示。

图1:项目整体技术架构

业务层:基于内嵌智能体及WEB可视化技术,实现无线网故障监控与管理的全景可视。

能力层:以亚信科技大模型智能体技术为核心,构建故障识别、定界定位智能体,根据同步的资源及拓扑数据,故障知识库,实现无线网的故障识别、定界定位工作流闭环。

网络数据底座:利用集团天宫平台与本地云池资源,搭建了数据采集治理平台与大模型服务组件。

3.2智能体技术能力构建

AAP作为系统的“智能大脑”,具备以下核心能力:

意图识别:根据告警信息识别故障场景(如基站退服),适配对应智能体启动分析流程。

任务规划:基于大模型的语义理解与推理能力,结合知识库生成故障分析步骤,并依赖关系编排执行顺序。

知识库构建:整合产品文档、历史故障报告、专家经验等语料,通过向量化存储与检索技术,构建无线运维专有知识库,支持智能体快速获取领域知识。

工具集封装:集成告警关联、拓扑生成、舆情查询、钉钉推送等API工具,智能体可根据任务需求自动调用相应工具执行操作。

3.3关键实施步骤

1、数据治理与知识库构建

整合移动网、传输网、动环系统告警数据,统一接入该公司网络平台。

基于历史故障案例与专家经验,构建向量化知识库,支持智能体快速检索与推理。

2、拓扑关系梳理与可视化

根据基站承载环路信息,还原从接入、汇聚到骨干的完整传输路径。

基于GIS与逻辑拓扑生成技术,实现故障影响范围与关联设备的多维可视化。

3、智能体工作流设计

故障识别智能体:实时监测批量退服告警,通过时间窗口、地理位置、基站数量等规则识别区域性故障。

图2:无线网故障识别智能体工作流程

故障定界定位智能体:根据知识库与工具集,按步骤分析动环告警、传输中断、设备异常等可能原因,输出根因报告并推送至一线人员。

4、系统部署与模型选型

选用Qwen2-72B-int4作为核心大模型,其在中文理解、多语言支持、开源合规等方面表现优异,符合通信运维场景需求。

系统部署于该公司云池,支持高并发告警处理与实时拓扑渲染。

四、实施效果

4.1运维效率显著提升

智能体自动识别并定位9–11月区域性退服故障346次,月均故障量较8月下降34.8%。

基站4小时恢复达标率达95.9%,较8月提升1.1个百分点。

故障定位报告平均推送时间仅8分钟,极大缩短了故障响应时长。

4.2定位准确性达到实用水平

智能体输出故障原因与实际根因对标准确率达80%,具备较高的可信度与实用性。

通过拓扑可视化与历史回溯功能,故障定界定位过程全程可追溯,支撑复盘与优化。

4.3知识沉淀与隐患挖掘能力增强

构建的无线运维知识库持续吸收新案例,支持智能体自学习与策略优化。

通过重复故障计算模型,系统自动标识高频故障点,辅助网络隐患定位与预防性维护。

4.4业务价值与社会效益

提升用户网络感知,降低因区域性故障导致的业务中断风险。

减少一线运维人员跨系统查询与人工研判工作量,释放人力资源。

为通信行业运维数字化转型提供了可复制、可推广的智能体落地范式。

完成单位:亚信科技(中国)有限公司

完成人:马广杰、吴珺、李传胜、张培蔚

THEEND

最新评论

更多
暂无评论