受EleutherAI的启发,OpenBioML旨在成为
我们可以访问大规模计算资源,并希望利用它们来加速研究。如果这是您感兴趣的事情,您可以考虑
该项目的目标是研究最近的扩散模型对基因组学数据的应用和适应。扩散模型是功能强大的模型,已用于图像
我们的任务
大多数研究小组缺乏承担前沿研究项目以及快速迭代新想法所需的计算能力。AlphaFold2最近的成功证明了这一事实:为了训练最终模型,DeepMind的团队使用了128个TPUv3数周时间,但这并没有考虑之前为最终架构所使用的所有资源。很少有学术实验室能够获得如此大规模的资源,但很明显,人才和创新思想可以在世界各地找到。
激励我们的是可用资源和人才之间的不相称:通过创建一个分散的研究实验室,可以访问以前只有资金最充足的工业研究实验室才能使用的计算和存储资源,我们寻求支持更广泛的社区并激励发布当前技术可以提供的最先进的预测模型。
人们一再明确表示,机器学习模型通常会显示出令人惊讶的涌现能力,而这些能力往往难以预见。例如,AlphaFold2被发现能够预测四元结构。研究人员在其检查点发布后不久就对该模型进行了实验,发现了这种能力。我们都将从改进的生物技术中获益,如果机器学习越来越成为计算生物学的核心,我们需要确保这些能力得到充分发现和利用。