6000万亿次算力之上:中国“谢耳朵们”的科技狂奔

工业社会靠电力,智能社会靠算力,尖端科研靠高性能计算。

远到无穷无尽的宇宙、暗物质,深到3500以下的黑暗深海,近到每一个人身上的细胞结构,这些研究无一不需要复杂、精密的精算能力。

目前,上海交通大学李政道研究所内就在从事相关研究,其中包括南海中微子望远镜 “海铃计划”、寻找系外类地行星“地球2.0”、 寻觅新物理的“暗之光”等。

该研究所于2016年创立,汇聚了一大批青年科学家,目标是打造前沿科学技术研究的国家战略科技力量,成为上海科创中心的“璀璨明珠”,技术实力可与哥本哈根大学尼尔斯·玻尔天文学、物理学暨地球物理学研究所相匹敌。

和以往的传统计算机相比,如今科研人员只需要通过笔记本把相关任务提交给高性能计算,通过几十万原子级别的全原子模拟来做测试。

就在今年4月,上海交通大学125周年校庆时,杨元庆先生决定个人出资1亿元人民币,帮助上海交大建设建设绿色水冷高性能计算中心,目前已正常投入使用,它的加入,使上海交通大学的算力成为中国高校最强。

“18年前用曙光,然后用联想深腾,80年前为浪潮交大的PI系统上线而欢呼,昨日又为联想交大思源一号系统上线而激动”,陈民在朋友圈里留下这么一段话,“青葱变油腻的过程中也见证了国内高性能计算系统的快速蓬勃发展。”

本期显微故事聚焦这些如美剧《生活大爆炸》中“谢耳朵“一样的科研学者们,他们的研究看起来高深莫测,但又让人充满好奇。

大部分研究都很难在一两年内看到成果,不仅需要超越常人的毅力,更需要可与世界接轨、甚至超越全球技术的高性能计算能力。

但正像奔涌的海浪一样,这些中国最值得被尊敬的科研工作者,依然稳打稳扎、蓄势,等待突破当下的那一刻。

以下是关于他们的真实故事:

去往海里捉光,去观察遥远的星际

7月,南海。

台风“烟花”即将到来,在波浪翻涌着的海面上有一艘科考船,整艘科考船只点了一盏红灯,在昏暗的红色光晕里,船体左摇右晃。

甲板上的科研人员们严肃地聚集在一起,摆弄组装手里的设备。

这是一个总长度达60米的探测器,由一个发光球和两个探测球组成,每一个探测球上都配备了光电倍增管(PMT)和图像传感器(CCD)。

组装好后,这个探测器将会放入深海中,用以观察这片区域海水的介质——他们要捕捉切伦科夫光。

切伦科夫光是高能天体中微子,在进入地球大气表面衰变后,与水或冰发生碰撞所产生的电磁辐射,呈蓝色,当辐射足够强时,甚至能用肉眼看见它。

海下3500米接收着这些高能天体运动里逃逸出来的中微子,它与水碰撞,形成蓝色的切伦科夫光。

船上的这群科研人员来自上海交通大学李政道研究所,他们所要做的,就是探索建设中国首个深海中微子望远镜,通过捕捉高能天体中微子来探索极端宇宙,被称为“海铃计划”。

“捕捉到切伦科夫光,找到它携带的超兴星爆发等高能天体事件物理过程的信息,我们能看到遥远的极端宇宙,到底发生了什么。”薛峤说道,他是参与海铃探路者计划的一员,也是上海交通大学一名大三的学生。

深海中微子望远镜是什么?简单来说,它能帮助人类构建完备的多信使天文网,推动粒子物理、天体物理、地球物理、海洋地理、海洋生物等前沿交叉研究。

因此,该计划也被纳入中国科协第十次全国代表大会上提出的“部署一批前瞻性、战略性、基础前沿性技术研发项目”、“在深海、深空、深地、深蓝等领域积极抢占科技制高点”。

薛峤等人此行首先要海域水质是否适合作为中微子望远镜候选台址,然后再在深水区域采集相关数据,对全水深海水相关性质进行扫描。

因为PMT对光子高度敏感,所有的探测作业必须在夜间进行。凌晨4点,科考船上的起重机启动,探测球逐渐没入水中。令人惊喜的是,这次下放竟然非常顺利,水平倾幅度很小。

图 |深海中微子望远镜

薛峤的导师、首席科学家徐东莲教授一下子惊喜地叫出了声,这意味着他们可以省去很多调整的时间。他们本还想再采集一些数据,但“烟花”正在逼近,为了躲避台风,薛峤等人不得不从另一个方向驶回。

尽管船上的每个人都通宵达旦地进行数据监测,但在返程的这一刻,所有人都感到由衷的快乐——他们朝着中国建立自己首个深海中微子望远镜的目标,向前迈进了一步。

在这个世界上,总有一些仰望星空的人,他们探索未知的奥秘,想办法解决发现的各种问题,既拓展人类知识的边界,也探索思考世界的方式。

这是一条漫长的征途,不知道路程有多长、会遇到哪些阻碍,甚至不确定是否真的存在一个终点。

但这个世界上,总是需要这些在征途上探索的寻路者,他们仰望星空、探索未知的奥秘,从而让人类世界的认知边界无线拓宽。

在这其中,还有些人终身的奋斗目标是让宇宙里最神秘、最深不可测的“隐形物质”——暗物质可视化。

暗物质无法被人类肉眼看见,因为它不会吸收和反射光,所以不能被人眼接收,但不可否认的是它确实存在,甚至一定程度影响宇宙。

为了寻找暗物质的踪迹,上海交通大学物理与天文学院的张骏教授开始寻找星系附近被引力场弯曲的信息图像,“我们可以通过扭曲的星系图像反推暗物质的存在、空间分布。”

除了高深莫测的物理前沿科技,还有一些科研人员致力于探索人类身体和疾病的奥秘,生命与物理学院大二的学生钟博子韬就在研究蛋白质结构与其功能的关系。

在生命科学领域,蛋白质的结构(即氨基酸序列的折叠方式)决定了蛋白质的作用,但此前蛋白质的结构一直未能破解。

今年7月,钟博子韬所在的Deepmind实验室基于进化过程中蛋白质位点之间的进化关系,深度学习蛋白质结构的演化过程,推出能预测蛋白质结构的平台AlphaFold,可预测出35万种蛋白质结构。

钟博子韬希望在解密蛋白质结构与其功能的关系后,基于所需功能反向推到蛋白质结构,从而在未来通过创造新蛋白、治疗疾病。

深海、宇宙、人体,无论是哪个领域都存在着这些追逐微光的科研者,他们上下而求索,寻觅一切未知,但梦想很宏伟,现实却往往布满荆棘。

这些复杂而精确的研究,往往需要庞大的计算能力,人脑、普通计算机都无法胜任,谁来帮助这些科学家呢?

高性能计算,当代可科研的“最强大脑”

这些看起来“非常酷”的研究,往往也遭遇着不少现实的困难。

以薛峤所做的项目为例,在探测水质结束后、下放中微子望远镜之前,他们需要先通过计算机模拟光子在水下的轨迹情况,设置探测器距离,进而由计算机模拟每个光子经过这段水的路径。

但这些参数整体的运算量非常庞大。

以光子总数为例,通常是500万个,而此次探测海水,则经过了3000余个不同的点位,这意味着每个点位都需要跑500万的光子,这样大体量的数据模拟,必须使用高性能计算才能实现。

还有此次探测时首次使用到的CCD技术。

在理论上,图像传感系统同样能探测中微子,但目前世界上还没有一个国家实现这一猜想。在此次海铃探路者行动中,他们在使用PMT方法的同时,也加入了CCD探测。

后者探测了数百个数据点,每个点都要多轮复测拍照,照片数量同样十分庞大。这意味着他们很难用人力完成此事,也必须借助高性能计算。

图 | 投入使用的杨元庆科学计算中心

研究暗物质的张骏也遇到了高性能计算的需求。

在他所研究的领域,引力透镜效应有强弱之分,在强透镜区域,星系一般会形成多个背景源的像,甚至圆弧,而弱透镜区域则只产生比较小的扭曲。

张骏研究的是弱引力透镜效应,这意味着他需要通过对大量背景源像的统计分析,才能估算大尺度范围内天体质量的分布。

以2万次曝光的星空区域为例(每次曝光覆盖2个平方度),里面大概有2万星系,他就需要处理4亿的星系数据。

即使是在800个CPU核的高性能计算设备上跑,在已经优化过的情况下,也要跑上一两天(非优化状态下,800个CPU核要跑20天),更不要说人力去处理了。

图 | 张骏在接受采访

陈民的研究则需要更强大的算力。

他所研究的激光携带巨大的能量,而等离子体态是完全离化后的状态,温度极高,很难控制,因而他需要依赖计算机去模拟激光尾波加速的过程。

陈民用大量的模拟粒子来代替真实粒子,尽管有所简化,但数据量依然达到10的十几次方,数据量也通常在几T、几P,仅一个计算就需要两三千个CPU核跑一下午、甚至一天的时间去处理。

“激光因为本身的特殊性,需要大量的计算机模拟,以及相关程序的研制和物理模型的构建。在激光等离子体领域,高性能计算机的作用可以和实验并重,甚至在我看来,它比纯理论还要重要一点。”

钟博子韬则是利用超级计算机,修改了AplhaFold的运行流程。

原流程全在CPU上运行,对大型集群计算设备的要求高,但这种研究条件并非人人具备。

钟博子韬利用高性能计算,将AlphaFold原本要消耗CPU和GPU(显卡)的部分拆分开来,分别放置在不同的硬件设施上运算,大大提高了AlphaFold的效率,资源利用率是原流程的425倍,GPU运算效率是原流程的14倍,在减少了对设备的需求和运行时间后,后续基于蛋白质结构研究其功能,就能更快地称为可能。

在当代的科研里,高性能计算机越来越成为不可或缺的绿叶和基石,大量的数据计算和模拟实验都需要依托超级计算机实现,这时哪里拥有更大的算力,哪里就能帮助实验更顺利的展开。

宝马配良驹,助力探索自然最深的奥秘

为了更好帮助科研人员进行前沿研究,今年4月10日,在上海交通大学125周年校庆时,联想集团董事长兼首席执行官CEO杨元庆先生决定,捐赠1亿元人民币,帮助上海交大建设建设绿色水冷高性能计算中心。

这一高性能计算中心位于张江科学城的李政道研究所实验室内,是其中的算力基座和“最强大脑”。

杨元庆本身也是上海交大81级计算机科学及工程系校友。在他读书的年代,即便是计算机系,整个系里也只有一台电脑,当时他们一星期只能用2个小时的计算机。

但现在,随着高性能计算机的发展,所有的科学研究都能基于高性能计算向前更快速地迈进。

12月14日早,高性能计算中心揭牌,杨元庆特意提前了半小时到达现场,只为了来二楼的计算中心提前见见几位教授学者,看看高性能计算中心还存在哪些需要优化的地方。

图 | 杨元庆在活动现场和学者们交谈

杨元庆还对在场的学者们表示,在使用高性能计算中心之后,一定要把好的方面和不好的方面都告诉他,以便联想未来改进和调整。

这是一次愉快的交谈,他们讨论蛋白质的酶如何催化DNA的合成与存储,讨论计算机模拟激光聚变的多体计算,讨论深海中如何探测中微子,以及在这些研究的过程中高性能计算所能起到的作用。

相较于传统技术,该高性能计算中心采用联想最先进的高性能计算产品与技术、以及联想独创的“海神”温水水冷技术,节约能耗成本40%以上,在增强算力的同时助力实现国家碳中和目标。

这一绿色水冷高性能大型科学设备被命名为“思源一号”,拥有共计60566个CPU核。。

图 | 投入使用的杨元庆科学计算中心

陈民所研究的方向里,涉及凝聚态中的多体计算,因为是多体,需要的计算空间非常大。

在提交任务之前,他们需要用高性能计算做好一步一步的优化,确保万无一失之后,再提交大规模的任务。思源一号在CPU核数和算力上的增加,能很好地帮他进行实验模拟。

对陈民来说,计算机技术的进步,对激光研究非常利好。由于计算机的算力直接与激光的计算和模拟息息相关,激光领域也因此和计算机领域高度联系起来。

他曾经画过一个图,发现激光的发展和计算机的发展在早期基本同步,后来因计算机运用更广泛,计算机的发展便更快,远超激光。

他研究这个方向研究了20多年,整个世界的学者研究这个方向研究了40多年,到这个阶段,配合高性能计算,他觉得激光的研究应该出来一些新的东西了,他希望自己可以推动激光技术的进一步发展。

在张骏所拿到的星系图像的数据还比较小的时候,他跑去小型工作站去分析数据,那时的服务器很小,只有四十几个核,少量的数据也要跑30天左右。

他很感激高性能计算的快速发展,他们现在的数据动辄几十个T,如果不是高性能计算的帮助,研究会很难进行。

更何况,高性能计算对他们的帮助是多维的,不止在于对星系图像的测量,还包括后续对大量背景源像的统计分析,在海量的数据里,高性能计算能像砂里淘金一样,快速找到那些“闪闪发光”的信号。

“现在科研工作必须高性能计算来帮忙”, 上海交通大学生命与物理学院大二的学生钟博子韬对杨元庆学长说道。

图 | 杨元庆(左二)与薛峤(左一)、钟博子韬(右二)和陈民(右一)交谈

杨元庆还与科研人员们表示,“我现在的梦想,就是用联想的高性能计算助力我们国家的科学研究和重大项目的开发,让大家在科学研究领域更加往上去奔。”

钟博子韬则很期待12月底去申请“思源一号”,他所做的项目对GPU的要求很高,而他知道思源一号的GPU要比目前所用的高性能计算设备更强。

这意味着他或许可以进一步提高AlphFold的运行速度,帮助生命科学领域里的科研人员在研究蛋白质上更进一步。

图 | 思源一号

“高性能计算还提供了一个新的机会,有可能创造一种新的研究领域。比如说原来只能一个月做一个实验的方式。现在用计算机代替它,一次就做几万个实验。“

尾声

陈民还记得,学生时代国内高性能计算设备很少,当时设备算力跟不上,做一个模拟花了16天,模拟还特别容易断。

后来联想出了深腾的高性能计算设备,有上千个CPU核,在当时,已经能很好地帮助陈民做更大粒子量的激光模拟了。

一转眼,20年过去了。

国家在发展,科技在进步,现在,高性能计算设备已经扩展到了数万个CPU核,他在技术的日新月异里同样获得了在激光领域研究的一些结果。

2021年,高性能计算全球 Top500 公布,其中有180台来自联想,延续了2018年以来的霸主地位,也继续让中国遥遥领先。

“思源一号”的建成,让上海交大得以超越剑桥和哈佛等名校,跻身全球高校算力前列。

而在同一天,联想集团还与上海交大签订了战略合作协议。高级副总裁、首席战略官和首席市场官乔健表示,联想集团计划在未来三年拿出两个亿人民币,在科研领域、人才培养和新技术孵化三个领域,与上海交通大学携手共进。

李政道研究所的现任所长、交通大学老校长、中科院院士张杰回忆, 作为1956年的诺贝尔物理学家获得者,李政道总是站在中国发展的每一个最关键的时刻、提出了最关键的建议,帮助中国在科学技术及高等教育少走不少弯路。

早在多年前,李政道就曾想建立一个属于中国的科技中心,但苦于当时的经济社会发展限制,一直未能成行。

如今,张杰接过李政道的“接力棒”,李政道研究所实验楼和杨元庆计算中心在一个月内相继落成,让这个梦想越来越近。

“我们希望能代表中国对世界上自然界中最难理解的奥秘发起冲击,在解决奥秘的过程中做出中国人独特的贡献。”

本文来自微信公众号 “显微故事”(ID:xianweigushi),作者:显微故事编辑部,36氪经授权发布。