Anthropic漏引华人团队AI情绪机制研究，已道歉并补引

量子位2026/04/07 17:09机翻/自动摘要/自动分类

内容评分

技术含量

9/10

营销水分

7/10

摘要

Anthropic在研究AI情绪机制时漏引华人团队成果，后道歉补引。华人团队首次系统研究LLMs情绪生成机制，构建情绪回路实现精准控制，准确率达99.65%。

正文

Anthropic近期发布了一篇关于Claude内部情绪机制的新论文，研究发现模型中存在171种情绪向量，并验证了情绪表征对模型行为的因果影响。然而，MBZUAI研究生Chenxi Wang指出，该研究未引用其团队去年发表的首篇系统性AI情绪回路研究论文。经过沟通，Anthropic已道歉并补引该成果。该华人团队论文系统研究了LLMs的情绪生成机制，构建了SEV数据集，提取了与语境无关的情绪方向向量，并通过消融和增强实验验证了情绪控制的可行性。研究还发现，情绪信息在多层网络中传播，形成跨层的‘情绪回路’，在Qwen和LLaMA-3.2等模型上均表现出良好的泛化能力，情绪表达准确率高达99.65%。

Anthropic漏引华人团队AI情绪机制研究，已道歉并补引

内容评分

摘要

正文

标签