新 SQL 引擎在大规模数据聚合场景下表现出色。对于千亿规模(1000 亿行)数据的单列聚合统计,执行耗时仅 1.46 秒即可完成。万亿规模数据开启增强 SQL 模式后,单列聚合仅需 15 秒,通过设置合适的计算并行度可进一步缩短到 10 秒以内。在高基数聚合场景方面,针对 200 亿规模数据中 768 万个 distinct 值的数值型高基数聚合,新引擎耗时 1.8 秒,较老引擎的 17.7 秒提升约 10 倍。字符型高基数聚合(20 亿个 distinct 值)从接近 40 秒降低到 12 秒,通过调整并行度可进一步降到 6.2 秒。多列聚合场景中,1000 亿规模数据的双列 group by 从 27.5 秒降到 6.5 秒,性能提升约 4 倍且结果完全精确。
加载中...