0.1.2 版本对三类核心 AGENT 指标的计算方式进行了全面升级,从「猜测」变为「可量化」。第一,agent.message_count(消息计数):改为基于 event.messages.length 精确计算,准确反映 Agent 在一次任务中处理的消息数量。第二,agent.tool_call_count(工具调用计数):改为基于 assistant 工具调用块逐次计数,精确记录每一次工具调用,而非简单统计工具类型数量。第三,usage(token 用量):改为从 llm_output 缓存中汇总后,在 agent_end 时统一写入,确保 token 消耗数据的完整性和准确性。这三类指标的准确化使得用户可以精确评估一次任务的「复杂度成本」,识别高消耗的任务类型,进而优化提示词和工具编排策略,实现更精细的成本治理。
加载中...