智能运维 Agent 可抽象为感知层、推理层和行动层的三层架构。感知层负责从运维环境中采集和融合多维度数据,通过云监控和 ARMS 采集 Metrics,通过 SLS 和 LoongCollector 采集 Logs,通过可观测链路追踪采集 Traces,同时实现拓扑感知和变更感知,形成统一的运维数据视图。推理层是 Agent 的核心大脑,采用 LLM 与知识库协同架构:LLM 推理引擎负责自然语言理解、逻辑推理和决策生成,通过 Chain-of-Thought 技术输出可解释的推理链路;运维知识库采用向量数据库与结构化数据库混合架构,通过 RAG 技术动态检索相关知识,增强 LLM 专业性;多 Agent 协同机制将复杂任务分配给不同专长的 Agent 协作完成。行动层负责将决策转化为具体运维操作,通过工具编排框架封装各类运维工具,包括查询类工具(SPL 查询、PromQL 查询)、分析类工具(日志聚类、时序异常检测)、操作类工具(服务重启、配置变更、流量切换)和通知类工具,同时通过严格的权限控制和审批机制保障操作安全。
加载中...