专题：semantic-firewall

WFGY 3.0：16 种 RAG 失效模式复盘 + 131 题高约束张力基准，助力本地 LLM 调试与评估

社区Reddit r/LocalLLaMA2026/02/12 21:5540

WFGY 3.0 是面向本地大语言模型的调试与基准工具。它首先回顾了 WFGY 2.0 中的 16 种 RAG/基础设施失效模式，并通过“语义防火墙”在 Prompt 层实现自检，无需改动底层系统。随后发布的 131 题张力基准包（Q001‑Q131）提供高约束、含数学结构的长链推理任务，并配套 v0.1 测试协议，帮助用户给模型打 0‑3 张力分数并标记…

LLM 调试检索增强生成语义防火墙基准测试本地大模型

专题：semantic-firewall

WFGY 3.0：16 种 RAG 失效模式复盘 + 131 题高约束张力基准，助力本地 LLM 调试与评估

WFGY 3.0：16 种 RAG 失效模式复盘 + 131 题高约束张力基准，助力本地 LLM 调试与评估