阿里云 Prometheus 主机监控通过自动服务发现机制实现弹性计算节点的秒级纳管。针对阿里云 ECS 服务器,系统支持多种服务发现方式,可灵活选择需接入监控的目标服务器。当大规模主机弹性伸缩发生时(例如约 500 台规模),监控服务能够在一分钟内发现新的计算节点。发现节点后,系统会自动安装对应的 Exporter(如 Node-exporter、Process-exporter、GPU-exporter),同样在一分钟内完成部署。从计算节点创建运行到用户可以观察到监控数据,整个过程延迟控制在两分钟内。对于下线的计算节点,监控数据的停止采集时间也保持在两分钟内,系统会自动卸载 Exporter 并删除配置,优化资源回收。
加载中...