构建 140 项生物信息学技能库,助 AI 编码代理精准生成科研代码
Reddit r/LocalLLaMA2026/02/20 21:14机翻/自动摘要/自动分类
3 阅读
内容评分
技术含量
7/10
营销水分
5/10
摘要
作者推出开源项目 scicraft,收录 140 条覆盖基因组学、蛋白质组学、结构生物学等领域的生物信息学“技能”,每条提供可运行代码、关键参数和故障排查,旨在为 Claude Code 等 AI 编码代理注入可靠的领域知识,提升科研代码生成的准确性和可用性。
正文
我正在开发 scicraft——一个系统化的、面向生命科学的技能库,当前已收录 140 条可直接注入 AI 编码代理(如 Claude Code)的“技能”。每条技能对应一个结构化的 Markdown 文件,内容包括:
- 所属工具或库(如 Scanpy、PyDESeq2、AutoDock Vina、RDKit、BioPython 等)
- 可直接运行的代码示例
- 关键参数说明与常见错误排查
- 决策框架,帮助模型在不同分析场景下选择合适的工作流
这些技能覆盖基因组学、转录组学、蛋白质组学、结构生物学、药物发现、系统生物学、细胞生物学以及通用科学计算等多个子领域。项目已在 GitHub 开源,欢迎社区提交需求,补充未覆盖的工具或工作流。
使用示例(伪代码)
# 在 Claude Code 中加载 scicraft 技能库 load_skill('scanpy_preprocess') result = run_skill('scanpy_preprocess', data_path='raw_counts.h5ad')
项目地址:https://github.com/jaechang-hits/scicraft