专题:training-framework

按该标签聚合的大模型资讯列表(自动分类与标签提取)。2 篇文章。

媒体InfoQ 中文2026/03/04 23:205720

阶跃星辰开源了其预训练和训练框架Step 3.5 Flash,旨在提升大模型训练的效率和性能,降低计算成本。该框架通过优化训练过程,显著缩短训练时间并减少资源消耗。同时,其模型OpenClaw调用量已达行业前列,显示出强大的实际应用影响力。此次开源将为大模型技术的发展和普及提供有力支持,促进AI领域的创新。

社区Hacker News2026/02/12 21:3040

一项引人注目的研究展示了仅通过更换名为'Harness'的训练框架,便能在短短一个下午内大幅提升15款大型语言模型(LLM)的编码能力。这一成果凸显了训练工具和框架在LLM性能优化中的关键作用。研究表明,即使不修改模型本身或训练数据,优化训练过程也能带来显著的性能提升。这为LLM开发者提供了新的思路,即通过改进训练基础设施来快速增强模型在代码生成等复杂任务…