专题：deepbench

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 1 篇文章。

DeepBench：开源AI工作台，实现模型评估与消融实验一体化

社区Reddit r/LocalLLaMA2026/03/04 21:235840

DeepBench是一个开源AI工作台，旨在简化大型语言模型的评估流程。它支持模型搜索、消融实验、对战测试和VRAM预测，结合PyTorch、HuggingFace Hub、Streamlit等技术栈，为开发者提供统一的控制面板。项目鼓励社区贡献，具有较高的实用价值。