新SQL引擎在超大规模数据聚合场景下表现优异。在千亿规模单列聚合场景中,对1000亿数据进行单列聚合统计,执行耗时仅1.46秒。在万亿规模数据场景下,开启增强SQL模式后单列聚合只需15秒。通过设置合适的计算并行度,万亿规模数据的单列聚合甚至可以在10秒内完成。需要注意的是并行度并非越大越好,过大的并行度会导致调度开销升高,性能反而逐渐收敛甚至出现负优化。这些性能表现得益于新引擎的C++计算引擎、Pipeline细粒度并行、计算存储融合架构以及阿里自研缓存组件的综合优化效果。对于上万亿数据规模的报表级分析场景,用户可以根据实际需求权衡并行度设置,在性能和资源消耗之间找到最佳平衡点。
加载中...