DeepBench:开源AI工作台,实现模型评估与消融实验一体化原文社区Reddit r/LocalLLaMA2026/03/04 21:235840DeepBench是一个开源AI工作台,旨在简化大型语言模型的评估流程。它支持模型搜索、消融实验、对战测试和VRAM预测,结合PyTorch、HuggingFace Hub、Streamlit等技术栈,为开发者提供统一的控制面板。项目鼓励社区贡献,具有较高的实用价值。DeepBench消融实验模型评估PyTorchStreamlit