专题:open-standard

按该标签聚合的大模型资讯列表(自动分类与标签提取)。2 篇文章。

社区Reddit r/LocalLLaMA2026/02/11 18:0840

一项针对四大主流LLM的“认知责任”行为探针研究,旨在评估模型在处理不确定性、有限召回和无效前提时的表现。研究通过13个压力提示识别出五种可重复的失效模式,包括“不确定性下的虚假精确”和“封闭世界幻觉”。基于这些发现,研究者提出了“Anchor Core v0.1”开放标准,这是一个供应商中立的规范,旨在为具有认知责任的AI输出定义最低行为要求。该开源项目…