当前代码理解分为五种范式,代表从无状态搜索到有状态推理的演进。范式一是 Agentic Search(Claude Code 流派),用 grep/rg/glob 实时搜索文件系统,优点是零预处理、永远新鲜、隐私友好,但无结构感知且每次从零开始。范式二是 CodeIndex(Cursor、Windsurf、Copilot 流派),用 tree-sitter 做语义切片后生成向量 embedding,支持自然语言语义搜索,但向量相似度无法做结构化关系推理。范式三是 Code Graph+RAG(Qodo、Augment Code 流派),在向量索引之上叠加代码依赖图和 commit 历史,但图的范围仍限于代码域且查询能力有限。范式四是 CodeWiki(DeepWiki 流派),由 LLM 自动生成精美 Wiki 文档,适合人类快速了解项目,但存在幻觉风险、难遍历、难维护的问题。范式五是代码知识图谱(UModel),通过 Entity+Log+Link 构建跨域的图谱,支持确定性结构关系查询和时间维度分析。
加载中...