6. AI For Science 模型集合介绍

6.1. Boltz-2

Boltz-2是由麻省理工学院计算机科学与人工智能实验室与上市AI制药公司Recursion一起开发的下一代结构生物学基础模型。 它在 AlphaFold 3 和 Boltz-1 的基础上进一步突破,能够同时预测分子复合体的三维结构与结合亲和力,这对于精准的分子设计至关重要。 Boltz-2 首次将深度学习模型的亲和力预测精度提升至接近物理计算自由能微扰(FEP)方法的水平,同时运算速度提高了约 1000 倍。

镜像使用方法:

参考 7 容器化安装部署 章节获取Boltz-2镜像及启动镜像。

  1. 环境搭建:

    export ISU_FASTMODEL=1
    export USE_TDUMP=OFF
    export TMEM_LOG=OFF
    export DEBUG_ITRACE=0
    
  2. 测试方法:

    Boltz-2镜像中包含四个测试体系: AHCYNR1H2FKBP1ATYK2,其中 $CASENAME 为测试体系名称, $REPNUM 为重复取平均次数,一般设置成 1 或者 2 即可。

    cd /workspace/bench && bash dataset.sh && python3 predict.py -p $CASENAME -n $REPNUM
    

6.2. DiffDock

DiffDock 是一种用于药物发现中分子对接的扩散生成模型。DiffDock 由两个模型组成:评分模型和置信度模型。

  • 评分模型是一个三位等变图神经网络,包含三个部分:嵌入层、由6个图卷积层组成的交互层以及输出层。该模型总共有 20M 参数。评分模型的作用是通过运行反向扩散过程,为蛋白质-配体结合生成一系列潜在的构象。

  • 置信度模型的架构和评分模型相似,但在交互层中包含了5个图卷积层。该模型总共有 5M 参数。置信度模型用于对评分模型生成的配体姿态进行排序。

镜像使用方法:

参考 7 容器化安装部署 章节获取DiffDock镜像及启动镜像。

  1. 环境搭建

镜像环境中已经包含有环境变量的对应设置。

  1. 测试方法

    cd /workspace/tests && bash performance_fwd.sh
    

6.3. ai-models

ai-models是欧洲中期天气预报中心(ECMWF)推出的一个用于人工智能天气预报的开源项目,专门用于提供标准化的AI天气预报工作流程,支持Pangu-Weather、Fourcastnet、Fourcastnetv2、Graphcast、Gencast、FengWu、FuXi、Aurora等模型,沐曦自研增加了ECMWF的AIFS模型。 目前提供多种数据源作为气象模型的输入,包括MARS数据源、CDS数据源和自定义的数据,并且也支持将预报结果直接输出为通用的grib格式文件。

通过 7 容器化安装部署 章节介绍的方法,在曦云系列GPU硬件部署ai-models模型。

6.4. NeuralGCM

NeuralGCM是由谷歌研究院与欧洲中期天气预报中心(ECMWF)等机构合作研发的一款开创性机器学习模型。它本质上是一个神经大气环流模型,创造性地将基于物理定律的可微分流体动力学核心与学习小尺度物理过程的神经网络模块相结合, 从而能够在统一框架内同时处理从几天到几十年时间跨度的天气预测与气候模拟任务。作为首个基于机器学习的大气环流模型,NeuralGCM展示了“物理+AI”混合范式在提升地球系统模拟效率和能力方面的巨大潜力。

通过 7 容器化安装部署 章节介绍的方法,在曦云系列GPU硬件部署NeuralGCM模型。