专题:open-source-llm

按该标签聚合的大模型资讯列表(自动分类与标签提取)。3 篇文章。

媒体AINews2026/04/03 13:443600
Google发布Gemma 4四款模型
Hermes Agent因内存管理受欢迎

Google发布Gemma 4系列模型(2B‑31B),采用混合专家(MoE)架构提升计算与显存效率,并已通过Unsloth、HF Inference等工具实现生态兼容。开源代理Hermes因内存管理优化受到开发者青睐,迁移自OpenClaw。实际使用中,Gemma 4在部分硬件上表现出色,但在Claude Code等场景仍面临速率和内存瓶颈,兼容性仍需完…

社区Reddit r/LocalLLaMA2026/02/20 22:142640

本文针对拥有 4 块 NVIDIA H200(共约 320 GB 显存)的用户,系统评估并推荐了在该硬件上运行的最佳开源大模型,重点包括 Llama 3 70B‑Instruct、Mixtral‑8x7B‑Instruct、Phi‑3‑mini‑128K、Gemma 2‑27B‑Instruct 与 StarCoder2‑15B。提供了基于 vLLM 的多…

社区Reddit r/LocalLLaMA2026/02/15 18:294570

本文聚焦于 Claude Code 在代理任务和非编码工作场景下的最佳本地/开源模型选择。旨在汇集社区实践经验,探讨模型的通用性、易用性及在自动化流程中的表现。重点关注模型对自然语言指令的理解能力、逻辑推理和任务分解能力。文章鼓励分享模型性能对比、部署集成技巧、Prompt 工程策略以及成本效率考量,以期构建更智能的 AI 协作环境。