在传统部署中,K8s APIServer 的监控采集组件通常与集群部署在同侧,当集群出现问题时监控系统也会一并宕掉,无法观测到异常现场。阿里云通过建设带外数据链路(out-bound)来解决这一问题。带外链路独立于集群内部环境运行,即使集群本身出现故障,也只会影响与集群内部环境相关的带内链路(in-bound),而不会影响带外数据采集。此外,集群关键组件的事件以及能感知节点底层异常的主动运维事件,也通过带外链路采集至日志组件中。这种设计确保了在最需要监控数据的故障场景下,关键的可观测数据依然可用,大幅提升了监控系统的可靠性。
加载中...