首页/详情

Anthropic漏引华人团队AI情绪机制研究,已道歉并补引

量子位2026/04/07 17:09机翻/自动摘要/自动分类
0 阅读

内容评分

技术含量
9/10
营销水分
7/10

摘要

Anthropic在研究AI情绪机制时漏引华人团队成果,后道歉补引。华人团队首次系统研究LLMs情绪生成机制,构建情绪回路实现精准控制,准确率达99.65%。

正文

Anthropic近期发布了一篇关于Claude内部情绪机制的新论文,研究发现模型中存在171种情绪向量,并验证了情绪表征对模型行为的因果影响。然而,MBZUAI研究生Chenxi Wang指出,该研究未引用其团队去年发表的首篇系统性AI情绪回路研究论文。经过沟通,Anthropic已道歉并补引该成果。该华人团队论文系统研究了LLMs的情绪生成机制,构建了SEV数据集,提取了与语境无关的情绪方向向量,并通过消融和增强实验验证了情绪控制的可行性。研究还发现,情绪信息在多层网络中传播,形成跨层的‘情绪回路’,在Qwen和LLaMA-3.2等模型上均表现出良好的泛化能力,情绪表达准确率高达99.65%。

标签