专题：vram

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 2 篇文章。

VRAMora：本地LLM硬件对比平台发布，深度解析性能、功耗与成本

社区Reddit r/LocalLLaMA2026/02/15 12:481560

VRAMora是一款新发布的本地大语言模型（Local LLM）硬件对比工具，旨在解决本地LLM部署的硬件选型难题。它能帮助用户评估不同硬件配置下LLM的运行速度、功耗和成本，并直观展示模型运行速度与参数数量的关系。该工具为开发者提供了实用参考，目前正寻求社区反馈以持续优化其功能与数据准确性。

本地大模型硬件对比性能评测显存应用部署

寻找适合工具调用的本地 LLM

原文

社区Reddit r/LocalLLaMA2026/02/09 23:2720

用户拥有 24GB VRAM，寻求一个能高效执行基础工具调用任务的本地 LLM。当前遇到的主要问题是模型冗余调用或不必要地调用工具。虽然 Qwen 3 VL 20B 表现尚可，但速度较慢；GLM 4.6v 则表现不佳。用户希望找到一个更小的模型，能够精确且高效地处理低工具调用计数和基础工具调用场景，并询问是否遗漏了其他可行选项。

本地大模型工具调用通义千问 GLM 模型显存