Clawdbot 事件引发思考:有没有一种无需大规模抓取即可训练模型的方法?原文社区Reddit r/LocalLLaMA2026/02/10 12:2260针对AI模型训练中普遍存在的“先抓取后道歉”的数据爬取乱象,作者提出疑问:是否存在一种更优的训练方式,能在不损害数据所有者控制权的前提下进行模型训练或微调?文中提及联邦学习和安全环境训练等潜在方案,但对其应用现状表示不确定,并对当前大规模数据抓取模式表示不满。数据抓取联邦学习数据隐私AI伦理模型训练