首页/详情

领域特定 SLM 微调的训练数据如何获取?

Reddit r/LocalLLaMA2026/02/10 16:13机翻/自动摘要/自动分类
3 阅读

摘要

本文探讨了领域特定语言模型(SLM)微调过程中训练数据的获取与处理方法。作者希望了解业界在数据创建、耗时、踩坑经验以及所用工具和服务等方面的实践,为相关研究和开发提供参考。如果您有相关经验,欢迎分享您的见解。

正文

正在研究团队如何处理领域特定语言模型(SLM)的训练数据创建。

如果您有相关经验,非常希望能了解:

  1. 您是如何创建/获取数据的?
  2. 整个过程花了多长时间?
  3. 有哪些经验是您以后绝不会再尝试的?
  4. 您尝试过哪些工具/服务?

标签