专题：gpt-oss

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 3 篇文章。

探索将 GPT‑5.3 核心能力蒸馏至 MoE 架构的 GPT‑OSS 实践

原文

社区Reddit r/LocalLLaMA2026/02/22 20:004460

作者探讨将 GPT‑5.3 的核心编码能力通过知识蒸馏迁移到基于 MoE 的开源模型 GPT‑OSS，以期在 Strix Halo 上实现更快、更轻量的推理。文章提出技术路线并提醒可能的政策风险，呼吁社区分享已有的 MoE 蒸馏实现。

知识蒸馏 Mixture‑of‑Experts 架构 GPT-OSS模型模型压缩

你是否为大语言模型建立了专属基准测试？

原文

社区Reddit r/LocalLLaMA2026/02/08 20:5340

一位用户分享了其为大语言模型（LLM）构建的个人基准测试，旨在评估模型在逐步推理、数学、指令遵循、歧义处理、解释能力及在线搜索等多个维度的表现。测试结果令人意外：在约15个问题中，GPT-OSS:20b在用户标准下常优于OpenAI和Mistral模型。同时，GLM-4.7-REAP-23b-a3b表现远逊于QWEN-3-VL-8b。该非正式测试揭示了大型…

LLM 基准测试模型评估本地大模型 GPT-OSS模型通义千问

GPT-OSS自主强化学习训练方法的实用探索

原文

媒体Hugging Face Blog2026/01/27 09:534730

本文探讨GPT-OSS的自主强化学习训练方法，分析其决策与适应能力，提出改进策略，为AI系统开发提供理论与实践指导。

智能代理强化学习 GPT-OSS模型强化学习模型优化 AI训练