0.1.2版本对AGENT层指标进行了全面改造,从"猜测"变为"可量化"。核心包含三类指标。第一是agent.message_count,基于event.messages.length进行精确计算,准确反映对话中的消息数量。第二是agent.tool_call_count,基于assistant工具调用块逐次计数,精确统计工具调用次数。第三是usage即token用量,改为从llm_output缓存汇总后在agent_end统一写入,确保token消耗数据的准确性。当AGENT层拿到稳定的message、tool、token三类核心指标后,用户可以更准确地评估一次任务的复杂度成本,识别高消耗任务类型,从而优化提示词与工具编排策略。这对于成本治理至关重要,特别是在大规模使用Agent的场景下,能够精细量化每个Agent调用的资源消耗,为成本分摊和优化提供可靠的数据基础。
加载中...