DP还能这么跑?基于非冯·诺依曼架构的DP高速计算
发布网友
发布时间:2024-10-24 13:12
我来回答
共1个回答
热心网友
时间:2024-11-07 06:16
长期以来,分子动力学(MD)领域面临“鱼与熊掌不可兼得”的问题。经典MD速度快,但精度低,难以满足高精度计算需求;而第一性原理MD精度高,却速度慢,计算大系统成为瓶颈。DP团队提出的基于深度学习势的分子动力学(DeePMD)在保持AIMD级别精度的同时,大幅提升了计算速度,但速度上仍比CMD慢2个数量级左右。湖南大学刘杰教授课题组近期推出基于新型非冯·诺依曼架构的分子动力学(NVNMD),实现了AIMD级别的高精度与CMD级别的高速度,成功实现了MD计算的“鱼与熊掌兼得”。
冯·诺依曼架构在MD计算中造成了“存储墙”瓶颈,计算总耗时与功耗的绝大部分消耗在存储单元与计算单元之间的数据搬运上。为解决这一问题,湖南大学研究团队自主研发了基于新型非冯·诺依曼架构的MD计算系统NVNMD,该系统中存储单元与计算单元融为一体,避免了频繁的数据搬运,显著提高了MD计算性能。
为实现从传统CPU/GPU向新型非冯·诺依曼架构的“范式转移”,研究团队对DeePMD进行了多项修改与创新,如使用整数等离散数据类型替代浮点数、移位运算替代乘法、离散神经网络替代连续神经网络、采用逼近近似替代三角函数求解,旨在充分利用新型架构的有限硬件资源,实现高速MD计算。
NVNMD系统由冯·诺依曼架构的主处理器MPU与非冯·诺依曼架构的从处理器SPU组成,高速传输接口HTI连接两者。计算中,SPU负责高维势能面计算,而MPU执行其他操作,如构建相邻列表和牛顿力学积分。NVNMD通过采用多项高速硬件技术,进一步提升了计算性能。
为评估NVNMD性能,研究团队使用CPU(Intel i7-10700K)和FPGA(Xilinx xcvu9p)硬件实现计算机系统,验证了NVNMD的高精度、高速度和能效。结果显示,NVNMD不仅具有DeePMD等机器学习MD(MLMD)级别的高精度,且具有CMD级别的高速度。NVNMD在GeTe的分子动力学模拟中复现了其相变过程,并与DeePMD和AIMD结果一致。在Li₁₀Ge₂SP₁₂的分子动力学模拟中,NVNMD得到的500K下的Li原子均方位移与文献值基本一致,能效提升了2-3个数量级。
湖南大学研究团队开发了NVNMD的训练代码和计算服务,免费提供给研究者使用。感兴趣的读者可通过原文链接报名获取测试账号,并通过GitHub下载训练代码进行模型训练。NVNMD的更多细节与论文链接也已提供。