GeminiStateBackend 是阿里云实时计算 Flink 版提供的企业级状态后端,在存算分离架构下针对大状态场景进行了深度优化,相比开源 RocksDB 有三个核心优势:
- KV 分离:支持自动/手动开启,将大 Value 分离存储,大幅降低 Compaction 带来的写放大,显著提升复杂聚合与 Join 的性能。实测吞吐提升 50%+
- 自适应调参(Adaptive Tuning):根据流量和访问模式自动调整内存与 IO 参数,避免因配置不当导致的 OOM 或性能抖动,无需人工调优
- 按需迁移(Lazy Migration):Failover 或扩缩容时无需等待全量数据下载即可启动计算,实现秒级启动,大幅缩短业务断流时间
配置方式:SET 'table.exec.state.backend' = 'gemini' 并开启 KV 分离 SET 'state.backend.gemini.kv.separate.mode' = 'GLOBAL_ENABLE'。实测开启后作业在流量高峰期 CPU 使用率下降 20%,Checkpoint 耗时更加稳定。对于 State Size 较大且吞吐要求极高的场景强烈推荐使用。