针对探索性测试场景生成过度依赖缺陷报告导致正常功能覆盖不足、用户手册多模态信息碎片化提取困难、大语言模型易产生幻觉及隐式知识缺失、复杂Web交互难以可靠自动化执行等难题,研发大模型赋能的测试场景自动生成与执行系统通过对半结构化文档的智能化分析、功能导向知识图谱的构建以及多智能体协作的混合动作生成,可准确提取应用系统隐含的前置条件与预期行为,有效辅助测试人员自动生成多样化且高质量的探索性测试场景,实现自然语言测试场景的自主可靠执行,全面验证应用系统的功能正确性,支持测试断裂与真实软件缺陷的精准区分及动态修复。基于用户手册的测试场景自动生成与执行系统包括文档处理、知识图谱构建与精化、测试场景生成、高层调度规划、步骤分解与动作生成、浏览器自动化执行、反思与检测、知识管理等功能。
使用说明:
访问方式
部署大模型赋能的测试场景自动生成与执行系统,先创建场景自动生成服务的虚拟环境,再打开自动执行工具。
场景自动生成服务
探索性测试系统的场景自动生成服务,作为自动化测试的智能知识中枢,基于用户手册自动化构建应用功能知识图谱并生成测试场景。通过大语言模型的多模态理解和推理能力,帮助团队突破传统测试场景覆盖不全、过度依赖人工经验的瓶颈,为全面发现系统潜在缺陷提供高质量的用例支持。系统通过提取的页面、概念、功能和场景等关键实体,直观反映了被测系统复杂业务逻辑和交互行为的覆盖程度。
场景自动生成服务采用多阶段的智能化处理方式,实现了从半结构化文档到可执行测试场景的精准转换。包括文档树构建梳理手册的层次结构,静态与动态实体提取捕获系统的页面状态和操作行为,ReAct智能体精化机制推断隐式前置条件并解决知识幻觉,结构化场景生成体现测试用例的完整性与准确性等。这些多维度的智能化分析与处理,帮助团队全面还原用户真实的交互路径和预期结果,及时发现和补充传统测试用例中的遗漏场景。
系统还实现了文档智能解析、知识图谱可视化、不一致性检测、测试预言推断等重要功能,并通过与多智能体执行框架的无缝对接确保测试场景的可执行性。场景自动生成服务作为智能探索性测试的大脑,不仅展示了团队在提升自动化测试覆盖率道路上的进展,也为后续的自主执行和缺陷定位指明了方向。通过AI驱动的方式,帮助团队更高效、全面地开展端到端业务测试实践,最终达到提升软件整体质量、保障极致用户体验的目标。
使用 uv命令可启动场景自动生成服务器,接受由场景自动执行工具发送的用户手册,并向其发送所生成的知识图谱和测试场景。

场景自动执行工具
场景自动执行工具的核心模块,作为端到端业务测试的自动化引擎,以自然语言描述的测试场景为输入,实现测试场景的自主可靠执行与验证。通过多智能体模块化协作与混合动作生成机制,帮助团队解决复杂Web交互瓶颈,实时识别并修复测试断裂,为提高测试效率和软件质量提供强大的自动化支持。系统通过规划智能体、决策智能体等核心组件的协同工作,直观反映了团队在智能化探索性测试中的先进能力。
执行工具采用多层次的架构设计,展现了测试场景自动化执行的各项核心能力。包括规划层的高层调度反映对测试步骤逻辑的把控与缺失步骤的自主推断,决策层的ReAct式分解展示对复杂Web交互的处理能力,反思与检测层的双重机制反映区分测试断裂与真实功能断裂的准确性,知识管理模块的层次化图谱体现跨任务执行经验的持续积累等。这些多维度的技术创新,帮助团队全面应对不完整或模糊的测试描述,及时发现和解决潜在的软件缺陷。
系统还提供了浏览器自动化、VM2沙箱安全执行、提前终止机制、多步批处理等重要功能与优化策略的快速入口,并通过并行应急规划确保测试执行的高效性与可控性。场景自动执行工具作为智能化测试的驾驶舱,不仅展示了团队在提升自动化测试水平道路上的进展,也为后续的测试用例设计和系统质量保障指明了方向。通过大模型赋能与多智能体协作的方式,帮助团队更科学、系统地开展探索性测试实践,最终达到构建高可靠、高质量软件系统的目标。
自动执行工具的启动界面如下所示:

可输入账号密码登录,也可离线使用,或尝试测试功能:

离线登录后界面如下所示:

点击左下角的头像按钮可对账号进行管理,可以切换或退出账号:

点击左下角的齿轮(设置按钮)可对应用进行详细的配置,包括执行参数以及浏览器的详细设置等等:

左上方第一个按钮打开的左栏包括任务组、模块复用和文件夹模块。其中,任务组可以读入测试场景并进行进行自动执行:

左上方第二个按钮打开的左栏包括所有执行后生成的执行报告和记录的执行历史。

左上方第三个按钮打开的左栏包括大模型对话窗口,对话历史通过气泡呈现,并可以上传图片。

左上方第四个按钮打开的左栏可查看覆盖率等信息。

此外,中栏展示了具体的执行步骤,右栏记录了任务和文件等信息。
发送用户手册
点击任务栏的 newTask 按钮。

在出现的弹窗中选择任务代理按钮。

点击选择按钮开始导入用户手册

选择示例应用 TrainTicket 的用户手册并点击打开按钮。

用户手册发送成功:

服务器生成测试场景
服务器接受用户手册后开始生成测试场景:

知识图谱与场景生成成功。

测试场景导入成功:

可视化知识图谱
查看所生成的知识图谱,点击预览按钮:

知识图谱如下所示:

自动执行测试场景
选择要执行测试场景,点击 RUN 按钮:

或批量并行执行:

生成单独任务和并行任务如下图左上角所示:

点击探索按钮后,即可自动开始开始执行:

执行后的结果如下图中所示:
