AIOps 的发展经历了四个阶段。
第一阶段(2010-2015):规则驱动——核心驱动力是静态阈值和正则匹配,典型能力包括阈值告警和日志关键词过滤。其根本局限在于无法应对未知故障模式,误报率极高。
第二阶段(2015-2022):机器学习驱动——核心驱动力是时序预测与异常检测算法,能够做动态基线、聚类分析和根因定位。但特征工程繁重、模型可解释性差,仍需人工闭环。
第三阶段(2022-2025):大模型 Copilot 驱动——核心驱动力是 LLM + RAG,实现了自然语言查询日志、告警摘要和修复建议生成。但 Copilot"只动口不动手",决策与执行割裂,且存在幻觉风险。
第四阶段(2025-至今):Agent 驱动——核心驱动力是 LLM 推理 + Tool Use + 自主循环,实现了端到端故障自愈、多工具编排和自主验证。但对可观测性密度、行动安全性和治理框架提出了全新要求。
前三个阶段的共同逻辑是:系统产生数据,算法理解数据,结论呈现给人类,由人完成最终判断与执行。Agent 驱动阶段首次打破了"人在回路"的瓶颈。