目前的博士级人工智能就是扯淡!
实属没想到,诺奖得主、谷歌DeepMind CEO哈萨比斯(Demis Hassabis)竟公然怒怼奥特曼。
在最近的访谈中,哈萨比斯公开表示,把如今的LLM称作「博士级智能」,纯属无稽之谈!
它们并非真正的博士级智能——虽然具备某些博士水平的能力,但整体上并不具备全面性。
而真正的通用智能,应该是在所有领域都能达到博士级别的全面能力。
真正的通用人工智能不会犯低级错误,现在的AI并不具备持续推理、适应和学习的能力。
哈萨比斯认为:目前,还大概率还缺失1-2项关键突破,距离真正的「博士级智能」仍有5到10年之遥。
哈萨比斯对「博士级AI」的批评、对AGI本质能力的真知灼见,颇有市场:
左右滑动查看
不过,他对 AGI 到来时间的判断,未必准确。
除了对AGI路线的探讨,在All-In峰会上,哈萨比斯先回忆了诺奖时刻,之后系统阐述了他对世界模型、机器人、科研加速、能耗与效率的最新判断:
Genie 3把一段文字变成可实时交互的「世界」,Gemini正在成为Alphabet的「AI引擎」,而真正具备创造力与一致性的AGI,仍需关键突破与时间磨砺。
AI天才执掌DeepMind
AlphaFold助力摘诺奖
哈萨比斯,4岁成为国际象棋天才,2023年因对AI的贡献被英国皇室册封为爵,2024年获得诺贝尔化学奖。
因蛋白质结构预测,谷歌DeepMind的哈萨比斯、John M.Jumper共享了1/2的诺奖
但是在正式公布前的十分钟,他本人才得到获奖通知,根本来不及消化这个消息,整个人都有点懵。
随后,在瑞典参加为期一周的颁奖典礼,更是精彩绝伦,包括与王室成员的交流,每项安排都让他惊叹。
这项延续120年的荣誉传统中,最让人震撼的环节是组委会有个特殊安排——他们会从保险库中取出诺贝尔奖历史签名簿。
哈萨比斯体验了终生难忘的人生高光时刻:
将自己的名字与居里夫人、爱因斯坦等历史上所有诺奖得主签在同一本名册上。
哈萨比斯作为DeepMind的CEO,是谷歌AI的掌舵人。
为了加入发展AI,谷歌和Alphabet旗下的AI团队(包括原来的DeepMind)进行了整合,成立了现在的谷歌DeepMind。
哈萨比斯把新DeepMind描述为整个谷歌和Alphabet的「发动机」。
DeepMind负责Gemini、Gemma、Veo等生成式AI模型的开发,同时负责以AlphaFold为代表的科学项目研究。
Gemini是谷歌的核心AI模型,应用到谷歌搜索、Gmail等多个产品。
他领导的全部人员大约5000人,超过80%都是工程师或博士研究员。
谷歌开始做Gemini时,就坚持多模态——能看图、听音频、看视频,也能输出多种形式。
要走向通用人工智能,系统不能只懂语言和抽象,还得懂身边的物理世界;这是机器人之所以难、智能眼镜类助手之所以关键的原因。
他这次介绍了最新推出的世界模型Genie 3、谷歌「新安卓」Gemini Robotics以及爆火的「Nano Banana」
前两项落到一个共同方向:让AI真正理解并操控物理世界。
DeepMind在推进把Gemini Robotics做成跨机器人平台的「准操作系统层」,可以把它理解成机器人的「Android」。
哈萨比斯认为机器人还处在偏早期的阶段,但接下来一两年里,大概率出现「Aha时刻」。
而未来几年,通用模型更强、更稳健、更懂物理世界的细节,足以完全支撑机器人在物理世界的操控能力。
关于未来创意工作将如何发展,哈萨比斯表示:顶尖的创意者,依然会主导引人入胜的体验和动态故事线;他们可能变为「世界观的编辑」,负责引导和整合众人的集体创造力。
AGI路在何方?
AI的科学应用是哈萨比斯最关心的方向。
他之所以把整段职业生涯押在AI上,就是为了用它加速科学发现、改善人类健康。
如果以正确方式构建AGI,它会成为终极的科学工具。
过去几年,DeepMind已经展示了不少路径:最出名的是AlphaFold,但谷歌也把AI用在材料设计、受控核聚变装置的等离子体控制、天气预报、甚至奥数级别的数学问题上。
相同范式的AI系统,加上一点任务定向的微调,就能在很多复杂领域里起作用。
哈萨比斯认为AI加速科学发现才刚刚开始。
当然,目前还缺一块:真正的「创造力」。
在给定命题的前提下,今天的AI能去证明、去求解,但还谈不上自己提出全新的猜想、假说或理论。什么时候它能自主提出好的问题,那也许才是一项关键的里程碑测试。
什么是「创造力」?
哈萨比斯认为:那是我们常为之喝彩的「直觉式跃迁」——历史上的顶尖科学家和艺术家都会做的那种跨越。
也许,创造力靠的是类比,靠把看似无关的事物勾连起来。
心理学和神经科学对人类如何做到这一点各有理论,但一个可操作的测试是:
把一套现代AI的知识截断在1901年,看看它能不能在1905年「自己想出」狭义相对论那样的理论。
如果能,那就说明人类触及到了真东西,也许AGI近在眼前。
再举个例子:十年前,AlphaGo不仅击败了围棋世界冠军,它还下出「神之一手」——第二局那手著名的「第37手」。
但问题是:AI能不能不仅发明新策略,而是「发明一款像围棋那样优雅、耐玩、审美上同样动人的游戏」?
答案目前是否定的。这正是距「通用」的短板:真正的AGI,也该能做到这种层面的创造。
那具体还缺什么?
Anthropic的Dario、OpenAI的奥特曼认为,AGI不久就能到来。
哈萨比斯更谨慎。他认为核心在于:我们能不能复现人类最优秀科学家那种「直觉式跃迁」,而不只是循序渐进的改良?
伟大科学家和优秀科学家的差别,不在于基本功,而在于创造力:他们能从别的学科里捕捉到某种模式,把它类比、迁移到当前难题上。
哈萨比斯相信AI终会做到这一点,但如今在推理思维方式上,AI仍欠火候,难以支撑这种突破。
另一个短板是「一致性」。
奥特曼等人称目前AI已达到「博士级智能」,哈萨比斯认为并非如此。
在若干子任务上,他们已达到「博士水平」,但并不意味着「全面博士级」。
而「通用智能」恰恰意味着在各个维度都能稳定地达到那个水准。事实是,我们都见过:
只要换个提问方式,当下的聊天机器人会在高中数学、甚至简单计数上犯低级错。
对真正的AGI来说,这种情况不该发生。距离能完成上述能力的AGI, 哈萨比斯认为还有大概5到10年。
除此之外,AI还缺「持续学习」的能力:能在线吸收新知识、及时调整行为。
也许,Scaling Law会继续带来部分改进。
但如果要下注,哈萨比斯认为还需要一两次关键性的原创突破,而这些突破很可能会在未来五年内出现。
破解科研难题,AI4S持续发力
除了已经取得大量重磅成果摘得诺奖的AlphaFold外,AI也将助力提高能源效率,解决自身需要的海量能源带来的衍生问题。
AlphaFold这类混合模型,是AI未来发展方向
AlphaFold是一种混合模型。
所谓混合模型,是指同时使用概率性模型和确定性模型。
概率性模型是目前大模型普遍都在使用的基于概率预测下一个Token的模式,而引入确定性模型是大模型取得关键进步的下一步方向。
确定性模型遵循固定的逻辑算法,相同的输入必然得到相同的输出。
例如在大模型中引入真实世界的物理规则与化学规则,就是确定性模型。
哈萨比斯也在采访中,详细介绍了AlphaFold这个混合模型。
AlphaFold有一个学习组件,也就是概率组件,基于神经网络和Transformer等技术,能从提供的任何可用数据中学习。
但在生物学和化学领域,很多时候数据并不充足。因此,必须将一些已知的化学和物理规则内置到模型中。
在AlphaFold中,需要设定原子间的键角,并确保模型理解原子不能重叠等基本物理约束。
键角有约束规则
理论上,模型可以自己学会这些,但这会极大浪费模型的学习能力。
所以,将这些规则作为约束条件直接加入,是更高效的做法。
哈萨比斯也表示,无论是AlphaGo还是其他混合系统,其关键和难点都在于如何将学习系统与一个更偏向于人工设计的、定制化的系统完美结合,让它们协同工作。这其实相当有挑战性。
他认为,最终的目标是,当通过混合系统取得进展后,应将这些经验反哺并整合到学习组件中。
为了更具体地说明这点,哈萨比斯举了从AlphaGo到AlphaZero的例子:
这有点像我们对 AlphaZero 所做的改进。
AlphaZero是AlphaGo的一个更通用的版本,AlphaGo内部包含了一些针对围棋的特定知识。
但在 AlphaZero中,我们移除了这些定制规则,包括我们用来训练的人类棋谱数据,而是让它从零开始,通过自我对弈进行学习。
最终的结果是,它不仅能下围棋,还能学会任何其他的棋类游戏。
AI加速药物发现
哈萨比斯仍在管理Isomorphic。
这家公司是DeepMind的衍生公司,建立在AlphaFold蛋白质折叠预测的突破之上,致力于革新药物发现。
了解蛋白质结构只是药物发现过程的第一步,以便后续解决问题,如设计出能与蛋白质靶点精准结合且无副作用的化合物。
哈萨比斯表示,在未来十年内,有望将药物发现的周期从数年甚至十年,缩短到几周乃至几天。
Isomorphic正在构建平台,礼来(美国大型跨国医药公司)、诺华(英国大型跨国制药公司)也将深度参与其中。
Isomorphic自己内部也同步开展了药物研发项目,预计明年即可进入临床前阶段。
Isomorphic目前正在把重心放在癌症和免疫学等领域,并与美国MD安德森癌症中心这类全球顶尖机构进行科研合作。
与此同时,DeepMind也在着力研究AlphaFold模型的更先进版本,让模型不仅能够理解蛋白质相互作用,还能理解更多内容,从而助力药物研发。
AI能源需求庞大,但为优化能源效率贡献更大
随着大模型参数不断膨胀,训练和推理带来的巨大能源消耗也越来越成为一个万众瞩目的问题。
面对指数级增长的能源需求曲线,哈萨比斯解释了DeepMind是如何应对的。
由于背靠谷歌这个全球最庞大的AI应用场景,极高的效率、极低的延迟和极低的服务成本是对模型的迫切要求。
DeepMind使用蒸馏等技术来提高模型效率,在同等性能下,效率提升了几十倍。
然而,由于大家仍在探索AGI的路上,节约下来的能源又被投入到前沿模型研发上了。
当然,哈萨比斯也指出,AI系统为解决能源和气候变化问题带来的贡献,将远远超过其自身的消耗。
可能的贡献包括优化电网系统、设计具有新特性的材料,以及提升新能源的效率等。
未来十年,人工智能将在很大程度上帮助我们解决这些重大挑战,其贡献将远超今天的能源消耗。
哈萨比斯认为,十年后若AGI降临,将开启一场科学的黄金时代,也将是全新的文艺复兴。
参考资料:
https://www.youtube.com/watch?v=Kr3Sh2PKA8Y
https://x.com/vitrupo/status/1966752552025792739
https://x.com/rohanpaul_ai/status/1966950863685157368