专题:automated-testing

按该标签聚合的大模型资讯列表(自动分类与标签提取)。5 篇文章。

媒体InfoQ 中文2026/04/04 22:005700
AI Agent 实现需求‑代码‑测试全链路自动化
提供 Prompt、Tool‑Calling 与 CI 配置示例

本文系统阐述了 AI Agent 在软件工程规范化中的应用路径,涵盖需求解析、代码生成、自动化测试与审计闭环。通过实际案例展示了基于 LLM 的 Agent 编排如何提升开发效率、降低缺陷率,并提供了实现细节、工具选型与治理建议。

媒体Lobsters AI2026/04/01 02:335810
通用LLM评估框架
模块化测试流程

Pipevals是面向所有LLM应用的通用评估框架,提供标准化的性能分析流程。通过模块化设计支持多维度指标测试,可自动化完成数据预处理、评估计算与结果可视化。其核心亮点在于跨模型兼容性与系统化评估能力,为模型优化提供可靠数据支撑。

媒体InfoQ2026/03/16 22:024850
从DOM测试转向视觉UI代理
图像配准提升测试精度

文章讨论了图像处理技术在自动化测试中的应用,重点分析了视觉UI代理、图像配准和'Chain-of-Thought'方法,指出LLMs在高精度任务中的不足,并提出结合生成式AI与经典算法的解决方案,具有较高的技术参考价值。