重复提示提升LLM回答质量：最新论文与资源汇总指南

近日，一篇题为《Repeated Prompting Improves Large Language Model Responses》（arXiv:2512.14982）的论文指出，将同一提示多次重复输入（或在不同上下文中循环使用）能够显著提升模型的答案完整性和一致性。作者通过在 GPT‑4、Claude‑2、Llama‑2 等主流模型上进行对比实验，发现重复提示在开放式问答、代码生成以及事实检索任务中平均提升 7%–12% 的准确率。

现有的 Prompt Engineering 资源库

| 资源 | 主要内容 | 适用模型 | |------|----------|----------| | OpenAI Cookbook | 官方示例、最佳实践、Prompt 模板（包括重复提示的实验脚本） | GPT‑3/4 系列 | | LangChain Prompt Templates | 可组合的 Prompt 类库，支持链式调用和多轮重复 | 多模型通用 | | PromptSource (GitHub: github.com/bigscience-workshop/promptsource) | 大规模公开 Prompt 集合，包含多语言、任务多样性 | 多模型 | | EleutherAI Prompt‑Engineering Guide | 系统化的提示技巧文档，章节专门讨论 Prompt Repetition 与 Self‑Consistency | Llama、Mistral 等开源模型 | | Awesome Prompt Engineering (GitHub: github.com/prompt-engineering/awesome-prompt-engineering) | 社区维护的 Prompt 资源清单，收录论文、代码、工具 | 通用 |

如何快速获取并实验重复提示

克隆示例仓库：

git clone https://github.com/bigscience-workshop/promptsource.git
cd promptsource
pip install -r requirements.txt

使用 OpenAI API 进行重复提示（Python 示例）：

import openai, time
def repeat_prompt(prompt, n=3, model="gpt-4"):
    responses = []
    for _ in range(n):
        resp = openai.ChatCompletion.create(model=model, messages=[{"role": "user", "content": prompt}])
        responses.append(resp.choices[0].message[content])
        time.sleep(0.5)  # 防止速率限制
    # 采用多数投票或拼接策略
    return "\n---\n".join(responses)

实验对比：将单次提示与 3‑5 次重复提示的输出进行 BLEU、ROUGE 或人工评估，复现论文中的提升幅度。

建议的资源聚合方式

在 GitHub 创建组织 PromptTricks，子仓库分别收录 重复提示、自洽采样、Chain‑of‑Thought 等技巧。
使用 GitHub Actions 自动跑基准测试（OpenAI、Claude、Llama），生成 Markdown 报告，保持技术前沿同步。
将实验脚本统一封装为 repeat_prompt.py，并在 README 中提供一键运行的 Docker 镜像（docker pull prompttricks/repeat-prompt:latest），方便社区复现。

通过上述资源与实践步骤，开发者可以在不等待专门仓库出现的情况下，快速跟进论文的最新提示技巧，并在自己的项目中验证其有效性。

重复提示提升LLM回答质量：最新论文与资源汇总指南

内容评分

摘要

正文

现有的 Prompt Engineering 资源库

如何快速获取并实验重复提示

建议的资源聚合方式

标签