专题：training-framework

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 2 篇文章。

阶跃星辰开源Step 3.5 Flash：性能与效率并重的预训练框架发布

媒体InfoQ 中文2026/03/04 23:205720

阶跃星辰开源了其预训练和训练框架Step 3.5 Flash，旨在提升大模型训练的效率和性能，降低计算成本。该框架通过优化训练过程，显著缩短训练时间并减少资源消耗。同时，其模型OpenClaw调用量已达行业前列，显示出强大的实际应用影响力。此次开源将为大模型技术的发展和普及提供有力支持，促进AI领域的创新。

大语言模型预训练训练框架开源项目

仅更换训练框架，一日内显著提升15款大模型编码能力

原文

社区Hacker News2026/02/12 21:3040

一项引人注目的研究展示了仅通过更换名为'Harness'的训练框架，便能在短短一个下午内大幅提升15款大型语言模型（LLM）的编码能力。这一成果凸显了训练工具和框架在LLM性能优化中的关键作用。研究表明，即使不修改模型本身或训练数据，优化训练过程也能带来显著的性能提升。这为LLM开发者提供了新的思路，即通过改进训练基础设施来快速增强模型在代码生成等复杂任务…

大语言模型编码能力训练框架性能优化