■本报见习记者 赵宇彤 记者 赵广立
AI for Science(AI4S,人工智能用于科学研究),是一个“AI与科学家孰强”的命题吗?
“我们不要问AI能做什么,而是要问AI能做什么现行方法不能做的事情。”近日,在中国科学院计算技术研究所(以下简称计算所)主办的“2025年计算所AI4S研讨会”上,中国科学院院士陈润生指出,科学家需要怎样的AI、AI如何解决新问题,应当是关注的重点。
在圆桌讨论环节,陈润生和计算所研究员陈熙霖、中国科学技术大学教授罗毅、中国科学院上海药物研究所研究员朱维良、中国科学院分子细胞科学卓越创新中心研究员陈洛南、微软研究院科学智能中心全球合伙人秦涛,围绕“AI赋能科学”展开了讨论。
科研迎来“再开荒”?
“AI擅长消化数据,计算能力强、反应速度快,只要有足够的算力就能处理大量数据。”秦涛表示,从计算层面看,AI4S确实引发了科研范式的变革。
多年来,在“维数灾难”的困境中,对于如何处理多尺度问题(多变量函数),科学家总是有心无力。这极大阻碍了科研发现的步伐。20世纪50年代终于迎来一道曙光——AI的诞生把一些科学问题转化为算法问题,不仅能高精度解决大量传统科学计算无法解决的难题,还能高效处理海量数据。
从蒸汽机的轰鸣到AI的曙光初现,生产工具的变革直接提高了生产力水平。“AI能够加速计算,当计算能力足够强、速度足够快时,也许能将科学领域中‘不可能的事情’变为可能。”秦涛说。
然而,AI能否实现科研的“再开荒”,科学家并不乐观。
“AI制药不是一个新概念。自计算机诞生以来,科学家就开始了药物分子设计的尝试。”在朱维良看来,AI确实在某些方面极大提高了新药研发效率,但目前尚未出现药物设计的范式突破。“要使用AI,还需进行数据的积累和清洗。”他说,对生物制药而言,AI4S还处于“全面爆发前的积累时期”。
陈洛南则认为,在高维、因果关系较弱的复杂系统中,AI能通过“黑箱”发现可预测的结果。在生命科学领域,传统基础科学理论无法处理、解读复杂高维的数据,AI则提供了全新视角。
陈洛南道出许多科学家的心中所想——AI似乎可以用来深入挖掘复杂数据之间的联系。“现在数据多、规律少,我们就利用‘黑箱’发现新规律,基于新规律产生新数据,进行一轮再发现。这就像一种循环。”
这与美国科学哲学家托马斯·库恩在《科学革命的结构》一书中的观点如出一辙:科学史本质上是循环的,每个新的科学发现都带来了一种感知世界的新范式,每个范式都经历着与“发明、解决问题、危机和崩溃”相同的生命周期。
让人头痛的“幻觉”和令人兴奋的“涌现”,正是AI的一体两面。那么,AI如何解决科学问题,又该解决哪些科学问题?
AI和科学家如何“双向奔赴”
科学界流传着这样一个说法:随着相对论、量子科学被揭示,科学进步的脚步正在放缓。但人们深信,在科学的广袤土壤中,仍有深埋的宝藏等待挖掘。
不断发展的AI会是“天选之子”吗?拿着这把“热得发烫”的新“锄头”,科学家依旧有不少疑惑和期待。
在陈洛南看来,具有万能近似定理的AI能处理各种复杂的函数关系,辅助进行科学研究和应用。“AI擅长预测,却不擅长找科学规律,目前的深度学习仍然是静态表征,而解读规律需要动态表征。”基于多年生物信息学研究,陈洛南提出,如果未来AI能用动态表征解读高维数据,在科研中也许有更好的表现。
罗毅也提出了对AI的期待。“跨尺度是科学研究中最难的问题,我们现在有多尺度计算,但在跨尺度科研方面没有突破,因为从原理上就不可行。未来如果能实现跨尺度科学研究,才是AI对科学研究的最大赋能。”
朱维良表示:“希望深度学习能发现那些已经积累了大量数据但尚未从中获得发现的新知识。在挖掘数据的同时,AI能不能利用深度学习对诸如求解生物大分子薛定谔方程这样的第一性原理问题进行模拟?这个课题对政治经济、人类社会的影响将不可估量。”
从探索未知到求取新知、从解决具体问题到探讨第一性原理,AI与科学研究碰撞的火花,正在点燃更多期待,同时还伴随着一些冷思考。
“计算是等价的,任何可以被图灵机模拟或执行的问题都是可计算的,只是快与慢的问题。”陈熙霖说,“AI只是提供了让科学家思考更快、层级更多的工具。”
陈熙霖打了个比方:“我们这些做计算机研究的人就像足球比赛的中场(队员),既不是前锋也不是守门员,偶尔跑到前场踢进一球,就自以为能进球了。其实我们还是中场,必须承认分工、找准定位,为其他学科提供更快、更强的工具和方法。”
秦涛认为,AI确实能帮科学家破解让传统方法“束手无策的难题”,但这类问题可能100年后才会产生经济或社会价值。“我们希望科学家能及时反馈当前亟须处理的问题,并借助AI及时解决。”
用好才能“好用”
近年来AI4S备受关注,几位科学家认为,要让AI更好为科研赋能,还得解决一些关键问题。
AI4S被视作科学研究的“第五范式”,“数据密集”是不可或缺的标签。秦涛观察到,当前海量数据的来源已不再局限于互联网或科学实验,AI合成数据也是重要来源之一。“AI生成的数据存在同质化、低质化风险。”他认为,在合成数据问题上,科学家和AI需要密切配合,否则可能适得其反。
“科学实验的优势恰恰在于,一些客观存在的物理规律能帮助AI生成高质量的新数据。”秦涛说,这就需要“黑箱”与“白箱”相互配合,“‘黑箱’立足于AI视角,‘白箱’则包含许多科学知识,依托AI强大的数据处理能力,二者的无间结合有望加速科学新发现”。
朱维良认为,AI是效能工具,科研工作者现在只有用好AI,将来AI才能在各个方面“好用”。
“关于AI有什么用,每个人都有自己的看法,但当下更应当讨论顶层设计的问题。”陈润生直言,AI实际上是对人类智慧的集成,要真正在科学研究中用好AI,统筹管理和顶层设计非常重要。
“大家都承认AI是很好的工具,也是进行创新研究的动力,但我们的底层基础科学能否支撑AI4S体系?当传统理论被AI打破后,我们该做哪些准备?”陈润生指出,这些问题都需要在顶层设计层面进行宏观、仔细的考量。他同时表示,现在AI4S充满喧嚣,能否用AI解决真正的科学问题很关键。
对此,陈熙霖认为,AI4S的发展确实需要适当规划,但因为其不确定性较大,所以不能只有唯一方案。
“此外,在什么尺度上进行AI4S研究值得关注。在平台化、有序化推进AI4S的同时,也要做好分工。”陈熙霖认为,人机协同、人智协同,才是AI赋能科学研究的最佳模式。
0 条