专题：rlhf-bias

构建 Qwen2.5 连续思考循环：模型自主决定何时发声的实验报告

社区Reddit r/LocalLLaMA2026/02/21 21:504820

作者在本地使用 Qwen2.5‑14B 构建了一个连续思考循环，让模型在仅接收时间等元数据的情况下自行决定是否输出。实验以 2500+ 循环为样本，观察到模型会自我反思、在情感表达时切换到德文、并在“后悔”阈值触发时才发声。结果显示出跨时段的主题连贯性和一定的元认知倾向，提出了关于记忆保持、语言偏倚及可复现性的后续问题。

Qwen2.5模型连续思考循环 LLM 自主对话多语言输出 RLHF 偏倚