专题：open-source-llm

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 3 篇文章。

Google发布Gemma 4系列模型，MoE架构提升效率并获生态广泛支持

媒体AINews2026/04/03 13:443600

• Google发布Gemma 4四款模型

• Hermes Agent因内存管理受欢迎

Google发布Gemma 4系列模型（2B‑31B），采用混合专家（MoE）架构提升计算与显存效率，并已通过Unsloth、HF Inference等工具实现生态兼容。开源代理Hermes因内存管理优化受到开发者青睐，迁移自OpenClaw。实际使用中，Gemma 4在部分硬件上表现出色，但在Claude Code等场景仍面临速率和内存瓶颈，兼容性仍需完…

Gemma-4模型混合专家架构 Hermes Agent 大模型兼容性开源大模型

在 4× NVIDIA H200 上部署最佳开源大模型：聊天与代码智能体实战指南

原文

社区Reddit r/LocalLLaMA2026/02/20 22:142640

本文针对拥有 4 块 NVIDIA H200（共约 320 GB 显存）的用户，系统评估并推荐了在该硬件上运行的最佳开源大模型，重点包括 Llama 3 70B‑Instruct、Mixtral‑8x7B‑Instruct、Phi‑3‑mini‑128K、Gemma 2‑27B‑Instruct 与 StarCoder2‑15B。提供了基于 vLLM 的多…

开源大模型 NVIDIA H200 开源前端框架 Cline VLLM

Claude Code 最佳本地/开源模型搭配：代理任务与非编码工作场景深度探讨

原文

社区Reddit r/LocalLLaMA2026/02/15 18:294570

本文聚焦于 Claude Code 在代理任务和非编码工作场景下的最佳本地/开源模型选择。旨在汇集社区实践经验，探讨模型的通用性、易用性及在自动化流程中的表现。重点关注模型对自然语言指令的理解能力、逻辑推理和任务分解能力。文章鼓励分享模型性能对比、部署集成技巧、Prompt 工程策略以及成本效率考量，以期构建更智能的 AI 协作环境。

Claude Code 本地大模型开源大模型代理任务非编码工作

专题：open-source-llm

Google发布Gemma 4系列模型，MoE架构提升效率并获生态广泛支持

在 4× NVIDIA H200 上部署最佳开源大模型：聊天与代码智能体实战指南

Claude Code 最佳本地/开源模型搭配：代理任务与非编码工作场景深度探讨

Google发布Gemma 4系列模型，MoE架构提升效率并获生态广泛支持