专题：automated-testing

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 5 篇文章。

AI Agent 模式在软件工程规范化中的实践与方法

媒体InfoQ 中文2026/04/04 22:005700

• AI Agent 实现需求‑代码‑测试全链路自动化

• 提供 Prompt、Tool‑Calling 与 CI 配置示例

本文系统阐述了 AI Agent 在软件工程规范化中的应用路径，涵盖需求解析、代码生成、自动化测试与审计闭环。通过实际案例展示了基于 LLM 的 Agent 编排如何提升开发效率、降低缺陷率，并提供了实现细节、工具选型与治理建议。

媒体Lobsters AI2026/04/01 02:335810

• 通用LLM评估框架

• 模块化测试流程

Pipevals是面向所有LLM应用的通用评估框架，提供标准化的性能分析流程。通过模块化设计支持多维度指标测试，可自动化完成数据预处理、评估计算与结果可视化。其核心亮点在于跨模型兼容性与系统化评估能力，为模型优化提供可靠数据支撑。

媒体InfoQ2026/03/16 22:024850

• 从DOM测试转向视觉UI代理

• 图像配准提升测试精度

文章讨论了图像处理技术在自动化测试中的应用，重点分析了视觉UI代理、图像配准和'Chain-of-Thought'方法，指出LLMs在高精度任务中的不足，并提出结合生成式AI与经典算法的解决方案，具有较高的技术参考价值。

媒体InfoQ 中文2026/03/16 21:236830

• AI用于处理大规模代码实验

• 分析代码生成与修复效果

本文分析了AI在软件工程中处理大量代码的实验与应用，探讨了其在代码生成、测试和修复中的潜力与挑战。核心亮点包括对AI局限性的剖析、实际效果评估以及对工程化落地的建议。

官方美团技术团队2026/01/13 08:006840

KuiTest是一款基于大模型的UI测试工具，通过模拟人类预期实现异常检测。其准确率高达86%，误报率低至1.2%，已执行21万+测试用例，发现百余缺陷，显著提升测试效率与覆盖率。