专题:local-llms

按该标签聚合的大模型资讯列表(自动分类与标签提取)。4 篇文章。

官方Simon Willison2026/03/31 05:314830
本地模型与编码代理集成困难
聊天模板和提示构建复杂

本文探讨了本地大语言模型与编码代理集成时遇到的挑战,包括使用方式、模板设计和提示构建等问题。Gerganov强调,系统各组件的整合难度和潜在缺陷是导致性能问题的关键因素,对开发者和研究人员具有重要参考价值。

官方Simon Willison2026/03/24 13:097840
流式专家技术实现大模型在低内存设备运行
Qwen3.5-397B-A17B在MacBook Pro成功运行

流式专家技术通过按需加载专家权重,使超大规模语言模型能在内存有限的设备上运行。已实现Qwen3.5-397B-A17B和Kimi K2.5模型在MacBook Pro和iPhone上的运行,处理速度逐步提升。该技术为本地化部署和边缘计算提供了新思路,具有较高的实用价值。

社区Reddit r/LocalLLaMA2026/02/15 16:472840

该开源工具利用“LLM作为评判者”机制,旨在系统化评估本地大语言模型(如LLaMA-3、Qwen-Coder)在RAG和代码任务中的性能。它提供多模型对比、LLM智能评分、推理过程记录及结果导出等功能,可用于代码模型评估、回归测试和生成微调偏好数据。作者强调提示词敏感性和中间步骤记录的重要性,并呼吁社区分享可复用评估工具的经验。