LoongCollector针对每个目的端引入了受AIMD(加性增、乘性减)启发的自适应并发限制机制,解决传统采集器在网络异常时失败重试占满线程导致全局堵塞的问题。
该机制根据失败率将并发控制分为三个区域:
- 无回退区(失败率0%-10%):维持当前并发量不变
- 慢回退区(失败率10%-40%):将并发量乘以0.8缓慢降低
- 快回退区(失败率40%-100%):将并发量乘以0.5快速降低
恢复机制采用加性增长策略:当成功率达到100%时,并发量逐步+1线性恢复至最大值。统计以窗口/批次聚合,避免短暂网络抖动引起并发剧烈震荡。当某个目的端出现异常时,其发送额度快速衰减,最大化降低对其他目的端的影响,确保故障隔离。网络恢复后系统可秒级自愈。