专题:rlhf-bias

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

社区Reddit r/LocalLLaMA2026/02/21 21:504820

作者在本地使用 Qwen2.5‑14B 构建了一个连续思考循环,让模型在仅接收时间等元数据的情况下自行决定是否输出。实验以 2500+ 循环为样本,观察到模型会自我反思、在情感表达时切换到德文、并在“后悔”阈值触发时才发声。结果显示出跨时段的主题连贯性和一定的元认知倾向,提出了关于记忆保持、语言偏倚及可复现性的后续问题。