专题:qwen3

按该标签聚合的大模型资讯列表(自动分类与标签提取)。6 篇文章。

社区Reddit r/LocalLLaMA2026/02/15 13:193840

Qwen3-ASR模型现已通过MLX平台在Apple Silicon上实现原生运行,为M系列GPU带来了高性能的自动语音识别能力。该重实现提供了0.6B和1.7B两种模型规模,支持52种语言,并具备词级时间戳、4位/8位量化、流式解码等高级特性。性能测试显示,其在M4 Pro上识别速度快,错误率低,且内存占用高效。这一进展为Apple生态系统中的AI应用开…

社区Reddit r/LocalLLaMA2026/02/15 12:511540

本文记录了一位RTX 4090(24GB显存,64GB RAM)用户在本地部署AI编码器和LLM时面临的选型困境。用户在卸载Coder 2.5后,正考虑Llama.cpp和Qwen3 Coder,并寻求社区推荐。他偏好GUI,对Docker的繁琐操作感到不满。核心需求是寻找一个兼顾上下文理解、准确性和智能性的高性能编码器,并对OpenAI免费版模型表现出失…

社区Reddit r/LocalLLaMA2026/02/08 21:1250

一位用户分享了在英特尔NPU(13 TOPS)上成功运行Qwen3系列小型语言模型的经验。通过更新NPU驱动,性能从1-2 TPS提升至8-31 TPS。作者已将转换后的模型及运行指南上传至Hugging Face,方便其他用户尝试。他还提到OpenVino运行GGUF模型未成功,并期待LLAMA.cpp对NPU支持的PR合并,以简化NPU上的模型运行。

媒体AINews2026/01/26 13:447820

Anthropic联合多家公司发布MCP Apps规范,旨在构建互操作应用生态。NVIDIA推出ToolOrchestra,基于80亿参数模型和强化学习协调代理行为。RLMs在代理系统中被重视,Clawdbot强调结果导向设计,但存在安全风险。阿里巴巴的Qwen3-Max-Thinking在多个评估平台表现突出,具备自适应工具使用能力。