专题:efficiency

按该标签聚合的大模型资讯列表(自动分类与标签提取)。6 篇文章。

媒体量子位2026/03/14 14:257820
Cursor发布CursorBench评测基准
评测强调真实任务与执行效率

Cursor推出CursorBench评测基准,强调真实任务与高效执行,与SWE-Bench等传统基准形成对比。评测方法结合线下标准化测试与线上用户反馈,旨在更准确地反映AI编程智能体的实际表现。

官方Microsoft Research Blog2026/03/05 02:056820
多模态推理模型Phi-4-Reasoning-Vision发布
强调效率与性能的平衡设计

Phi-4-Reasoning-Vision是一款高效多模态推理模型,兼顾推理能力、处理效率与数据需求。其核心亮点在于创新的训练方法和架构设计,适用于数学、科学推理、计算机使用和图像描述等任务,提供了与其他模型的详细对比。