专题:ai-coding-benchmark

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

媒体量子位2026/03/14 14:257820
Cursor发布CursorBench评测基准
评测强调真实任务与执行效率

Cursor推出CursorBench评测基准,强调真实任务与高效执行,与SWE-Bench等传统基准形成对比。评测方法结合线下标准化测试与线上用户反馈,旨在更准确地反映AI编程智能体的实际表现。