专题:grpo-algorithm

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

媒体AWS Machine Learning Blog2026/03/26 01:307950
Amazon Bedrock支持RFT训练,无需端点配置
使用OpenAI API进行模型强化微调

Amazon Bedrock推出强化微调功能,支持OpenAI兼容API,简化LLM训练流程。通过奖励函数和自动化训练,开发者可高效定制模型,适用于数学推理等任务。文章提供完整代码示例和监控方法,适合开发者和研究人员参考。