Goodfire AI探索机械可解释性前沿:Myra Deng与Mark Bissell的技术实践原文媒体Latent Space2026/02/07 06:456820Goodfire AI的Myra Deng和Mark Bissell展示了机械可解释性技术在模型行为检测、修正及跨领域应用中的实践。通过SAEs、probes等方法,他们实现了对模型内部特征的识别与编辑,提升了AI的透明度和可控性。在医疗健康领域,该技术被用于优化模型以加速药物发现,具有实际应用价值。机械可解释性模型优化技术AI可解释性医疗AI应用LLM技术