UModel 代码知识图谱的构建流水线包含五个核心阶段。DETECT 阶段负责增量变更检测,为每个文件计算 SHA256 内容指纹与上次构建缓存比对,实现增量构建。EXTRACT 阶段采用 AST+LLM 双轨提取:AST 轨道基于 tree-sitter 解析器提取定义、引用、调用和继承等确定性关系(置信度=1.0),LLM 轨道负责生成模块摘要、文档-代码关联和组件归属等语义信息。RESOLVE 阶段处理跨文件符号解析,包括 Go import 路径解析、方法 receiver type 归属、函数调用解析和接口实现的 extends 关系,全部为确定性解析不依赖 LLM。BUILD 阶段完成图谱组装和架构发现,通过 Leiden 算法进行社区检测并结合依赖方向分析生成有层次的架构视图。SYNC 阶段将 Entity 和 Topo 数据同步到 UModel 后端(基于 SLS 存储引擎),支持 graph-match 图遍历、SQL 聚合和全文检索。
加载中...