首页 > 科技快讯 > 从爱因斯坦到ChatGPT，颠覆性的科研工作越来越少了？

从爱因斯坦到ChatGPT，颠覆性的科研工作越来越少了？

晰数塔互联网快讯
2023-12-25 16:23

我对这个话题好奇的缘起是上周 Nature 上发表的一篇编辑部评论（Editorial）：《从爱因斯坦到AI：100年光阴如何改变科学》。

编辑部评论通常都很短，这篇也不例外。这篇评论本身说的：“过去100年产生的一些重大科研进展，深刻地塑造了今天的科学格局，而今天的重大科研进展也将深刻地塑造明日的科研格局，但是，塑造的方式是不确定的。”

这些重大科学突破中的一些从一开始就大大改善了人类的工业化条件，从而大大提升了人类的生活质量。如比利时化学家利奥·贝克兰在1907年将他发明的塑料商业化。但是，因为很长时间内，缺乏监管，这些科技突破对地球和人类也造成了巨大伤害。

也就是说，这篇 Nature 编辑部评论想说的是：监管。

最近两三年AI发展之势迅猛，AlphaGo之于围棋，AlphaFold之于计算生物物理，ChatGPT之于自然语言模型等等，多个领域都有了“颠覆性”的科技突破。

这些AI领域的突破，放诸百年后，会被怎样看待？未来之视今，犹如今之视昔乎？

这些AI领域的成就会因为今天的缺乏监管，而在未来逐渐伤害人类吗？因此，Nature 编辑部呼吁建立全球性的监管协议（to be governed by global agreements）—— 放任自流绝对不行。

以上，这篇短篇的编辑部评论就基本说完了。这不是引发小王兴趣的内容。

我感兴趣的是Nature编辑部的“话引子”，即七拐八歪从100年前的塑料、合成氨、相对论勾连到mRNA、ChatGPT的引子 —— “颠覆性创新”，英文是disruptive innovation。

20世纪初的颠覆性创新有：1900年马克思·普朗克的量子物理，1905年爱因斯坦的光电效应、布朗运动、狭义相对论和质能方程，1910年摩根发现基因，1925年雷蒙德·达特证明非洲是人类发源地等等。

21世纪初的颠覆性创新有：2001年人类基因组计划，2012年的CRISPR基因编辑、希格斯玻色子，2015年的引力波等等。

但是，科学界有一个主流共识：颠覆性的创新越来越少，科技创新的颠覆性也越来越低。

这是2023年初在Nature上发表的一篇科学情报学论文的名场面图片：颠覆性科学在萎缩 —— 各个领域：社会科学、技术、物理科学、生物科学和医药，都如此。

这篇论文的标题是《论文和专利都正在随时间变得不颠覆》。通讯作者罗素·方克来自明尼苏达大学卡尔森管理学院。

所以，“颠覆性”怎么定义？怎么度量？

作者使用CD指数来衡量科技颠覆性。CD指数的范围是-1到1，1代表最大知识颠覆（disruptive），-1 代表最大知识固化（consolidating）。

作者考察每一篇论文或专利的文献引用情况：它引用了哪些文献，被哪些文献引用。

在理想情形下，一篇论文或专利，所有引用它的文献都不去引用它所引用的文献，那么这篇论文或专利就达到了最大颠覆性，CD值 = 1。

这个定义的假设是：一篇论文或专利能够对先前的已经发表的文献构成最大的颠覆，意味着，它的后续工作都不必引用比它更早的工作，只引用它就足够。

打个比方，一个人站在巨人的肩膀上，如果这个人也足够巨大，那么之后的人统统都只踩在这个人肩膀上就行了，而不必再去落脚在前一个巨人肩膀。

我举一个直观的例子：AlphaFold2的Nature论文。

这篇在2021年6月上线的论文目前已经被引用超过10000次，而其本身则引用了84篇论文。我没有去按定义计算它的CD值，但是我认为它的CD值会很高。

我只在这里提出直观的观察。我在谷歌学术订阅了这篇论文的引用邮件，会收到谷歌学术定时发来的引用情况，即这篇论文又被哪些新的论文或专利引用。我注意到，许多远离蛋白质结构预测的领域也在引用AlphaFold2。比如，关于美国南部某种蝴蝶的基因突变；又比如，种猪养殖中的AI应用。这些论文引用AlphaFold2的前导论文的可能性是非常低的。

下面是我随手找的一篇Agriculture杂志在2023年发表的一篇论文，标题是关于罗马尼亚绵羊育种相关基因和蛋白。工作来自罗马尼亚首都的布加勒斯特大学，应该是这个国家顶级的学府吧。这篇论文引用了AlphaFold2，还引用错了 —— 用了AlphaFoldsimulation的说法（可见作者不懂蛋白计算），还没引用原文 —— 引了ColabFold。无论如何，罗马尼亚绵羊绝不会去踩AlphaFold2所踩的肩膀。