专题:local-deployment

按该标签聚合的大模型资讯列表(自动分类与标签提取)。13 篇文章。

官方Simon Willison2026/03/30 10:206720
维多利亚时代风格AI模型发布
支持本地运行,无需云端依赖

LLM-MrChatterbox 0.1 是一个基于维多利亚时代背景、经过伦理训练的AI模型,可在本地运行。其核心亮点在于历史风格的对话体验和伦理约束机制,适用于AI模型研究和本地部署场景。

媒体AINews2026/03/20 13:445620
Composer 2 使用 Kimi K2.5,引发归属与许可争议
二次微调、强化学习提升模型领域适配性

Cursor Composer 2 基于开源模型 Kimi K2.5,因模型归属与许可证问题引发讨论。文章指出,二次微调和强化学习是提升模型适配性的主流手段,强调标注来源、合规许可的重要性。同时,Claude Code 与第三方工具及通讯平台的集成、LangChain 向多智能体系统的演进,展示了 AI 产品差异化的最新趋势。

媒体SuperTechFans2026/03/09 07:575730
Qwen 3.5本地部署指南
ZIP码优化表单填写体验

本文汇总了2026年3月9日Hacker News精选内容,涵盖AI模型本地部署、表单优化、政策法规、硬件改装及系统移植等技术话题。重点介绍了Qwen 3.5系列模型的部署方法,分析了AI写作中的套路,并讨论了ZIP码在表单中的使用优化。内容具有较高的技术相关性和参考价值。

媒体AINews2026/03/02 13:446830
Qwen 3.5支持多模态与轻量化部署
采用Gated DeltaNet混合注意力机制

阿里巴巴发布Qwen 3.5系列模型,涵盖0.8B至9B参数规模,支持多模态处理和扩展强化学习。模型采用Gated DeltaNet混合注意力机制,适用于边缘设备和轻量级应用。已在Ollama和LM Studio中集成,并在iPhone 17 Pro上实现6位精度运行。Codex 5.3在编码代理测试中表现良好,但系统稳定性仍是挑战。

社区Reddit r/LocalLLaMA2026/02/22 19:454750

本文提供了在配备 MLX 8‑bit、128 GB 内存的 Mac Ultra 上,通过局域网将 Qwen3‑coder‑next 本地部署于 LM Studio 的完整操作指南。包括仅使用官方 qwen-code 仓库启动模型服务、关键的 `settings.json` 配置(必须使用 anthropic 类型)以及性能调优建议。文章强调避免使用非官方 …

社区Reddit r/LocalLLaMA2026/02/21 21:314830

Qwen Code是阿里巴巴Qwen团队开发的开源CLI编程助手,能自主理解、编写代码。其核心亮点在于可与LM Studio及Qwen3-Coder模型本地集成,实现完全离线、免费的AI编程体验,擅长代码重构、调试与解释。然而,原版默认启用遥测功能,引发隐私担忧。为此,社区成员undici77发布了无遥测的修改版本,确保用户数据严格本地化,提供了安装脚本和…

社区Reddit r/LocalLLaMA2026/02/21 20:043750

本文详细介绍了开发者利用Apple MLX框架在M系列Mac上构建本地文本转语音(TTS)应用Murmur的经验。面对云端TTS的订阅限制和隐私担忧,该项目旨在提供一个完全离线、高性能的解决方案。开发过程中发现,MLX在Apple Silicon上实现了超实时推理速度,并通过神经引擎优化资源利用,确保了数据隐私。尽管是本地应用,其音质已能媲美云服务。Mur…

社区Reddit r/LocalLLaMA2026/02/15 12:511540

本文记录了一位RTX 4090(24GB显存,64GB RAM)用户在本地部署AI编码器和LLM时面临的选型困境。用户在卸载Coder 2.5后,正考虑Llama.cpp和Qwen3 Coder,并寻求社区推荐。他偏好GUI,对Docker的繁琐操作感到不满。核心需求是寻找一个兼顾上下文理解、准确性和智能性的高性能编码器,并对OpenAI免费版模型表现出失…