姚班校友与7位顶尖科学家创立具身智能公司,30人团队估值316亿,尚无产品

2026年05月24日 19:25
本文共计4060个字,预计阅读时长14分钟。
来源/机器人大讲堂 责编/爱力方

2026年5月,一家成立不到半年的初创公司Recursive Superintelligence(RSI)完成6.5亿美元融资,估值46.5亿美元(约人民币316亿元)。8位联合创始人、不到30人的团队、谷歌GV和英伟达领投,这些数字背后,是行业对下一个增长曲线的集体焦虑,也是顶级科学家对技术路线的激进押注。

这不是一次普通的融资。RSI的目标是让系统自己改进系统,直到超级智能出现。这个愿景足够宏大,也足够危险。问题在于:当预训练Scaling Law的边际收益递减,递归式自我改进是否真的是那条新的增长曲线?还是又一次“超前于时代”的豪赌?

PART 01

为什么是现在:Scaling Law的天花板

RSI的成立时机并非偶然。CEO Richard Socher给出的判断很直接:这个领域正在触及对数级收益递减。你需要增加一两个数量级的数据和算力,却只能得到微小的改进。

Image

这个判断并非孤例。过去两年,整个行业都在经历同一个困境:GPT-4之后,下一次能力跃迁从哪里来?更大的模型、更多的数据、更长的训练时间,这些传统手段的效果正在变得越来越不明显。OpenAI的o1系列转向推理时计算,DeepMind押注AlphaFold式的科学应用,而RSI选择的是最激进的一条路,让系统自己成为研究员。

Socher的逻辑很简洁:“这些系统本质是代码,而现在它们可以写代码。“当这两个事实连接起来,自我改进的闭环就有了技术基础。传统的研发循环是人类主导的:研究员提出想法,工程师写实验,团队跑训练,评估模型,再根据结果调整下一轮方向。RSI要做的是把这个循环的一部分交给系统,让它发现自身能力短板,设计新实验,写新benchmark,然后主动重写自己的代码库。

这不是在固定考卷上刷分,而是让系统永远不停下来,像生物进化一样持续发明新的优化方向。一个版本改进下一个版本,改进后的版本继续改进后面的版本。如果这条路走通,理论上可以绕过数据和算力的瓶颈,直接进入指数级的能力增长。

但理论和现实之间,往往隔着无数工程细节和不可预测的失败。

PART 02

姚班+Meta+DeepMind,这支团队背后在赌什么?

RSI能在早期拿到46.5亿美元估值,最直接的原因是创始团队的人才密度。8位联创是这个领域最稀缺的能力组合。

Image
Image
  • Richard Socher:吴恩达在斯坦福的博士生,ImageNet和GloVe作者,谷歌学术引用量超过24万次。他创办的MetaMind被Salesforce收购,后来又做出估值15亿美元的搜索引擎You.com。他的角色是把学术视野和商业落地能力结合起来。
  • 田渊栋:Meta FAIR前研究科学家总监,长期研究强化学习、基础模型效率和神经网络理解。他做过ELF OpenGo,把AlphaZero式训练开源实现到围棋场景;最近几年又转向Llama推理、长序列加速、低成本训练等更贴近大模型系统瓶颈的问题。他的价值在于把理论路线转化为可工程化的系统。
  • 施天麟(Tim Shi):清华姚班校友,Cresta联合创始人之一。Cresta从斯坦福实验室起步,2019年就把Transformer模型用到实时客服Agent Assist里,代表了智能体在企业场景的早期落地能力。姚班背景意味着他具备扎实的计算机科学基础和系统工程能力,这对RSI构建复杂的自我改进系统至关重要。
  • Tim Rocktäschel:UCL人工智能教授,曾在Google DeepMind担任开放式研究方向负责人,研究重点是AGI、开放式进化和自我改进。他提出的Rainbow Teaming把安全红队问题改写成开放式搜索,让系统持续生成更多样、更有效的对抗提示,这套方法现在几乎所有安全团队都在用。
  • Alexey Dosovitskiy:Vision Transformer作者之一,2020年率先把Transformer直接用到图像patch序列上,证明视觉任务不需要卷积网络做底座。
  • Jeff Clune:长期研究开放式进化、AI-generating algorithms和安全问题,他的Darwin Gödel Machine论文讨论的正是让系统修改自身代码、再用benchmark验证改进是否有效。
  • Josh Tobin:OpenAI早期成员,曾担任OpenAI Agents Research Team负责人。
  • Caiming Xiong:曾在Salesforce负责AI Research和Applied AI,和Socher长期共事。

这8个人分别对应强化学习和大模型效率、开放式算法、安全红队、视觉Transformer、智能体产品化、企业落地、创业组织和自我改进研究。他们不是随机组合,而是一个完整的技术拼图:有人负责底层系统优化,有人负责开放式搜索算法,有人负责安全对齐,有人负责商业化路径。

更重要的是,Socher在采访中特别强调:“我们将尽可能保持团队小而精,最终把很多事情委托给我们的Agent。”这不是口号,而是RSI商业模式的核心,如果连自己的研发流程都无法自动化,如何说服外界相信递归式自我改进可行?

PART 03

"5万名博士”的尤里卡机器,RSI的第一步能走通吗?

RSI给出的第一个目标很具体:训练一个具备“5万名博士”能力的系统,首先聚焦于这个领域自身的科学研究。

这个路线图的逻辑是清晰的。如果系统能够自动化研究本身,那么它就能加速自己的进化速度。一旦这个闭环建立起来,再把同样的能力迁移到其他科学领域,理论上可以解决人类最难的基础科学问题。

但从“能写代码的系统”到“能改进自己的系统”,中间隔着巨大的技术鸿沟。现有的大模型可以生成代码,但它们不知道自己哪里弱,不知道该设计什么实验,不知道如何评估改进是否有效。更关键的是,它们没有长期目标感,每次生成都是独立的,无法形成持续的自我优化循环。

RSI需要解决的核心问题包括:如何让系统识别自身局限?如何设计有效的实验而不是随机试错?如何编写可靠的benchmark而不是自欺欺人?如何确保自我改进的方向是对齐的而不是失控的?

这些问题没有一个是容易的。AlphaGo可以通过自我对弈变强,是因为围棋有明确的胜负规则。但研究本身没有这样的规则,什么叫“更好的系统”?是推理速度更快,还是泛化能力更强?是在benchmark上得分更高,还是在真实任务中更有用?

Socher自己也清楚这个赌注的分量。他说:“如果你是学术研究者且超前于时代,你最终会被称作远见者。但如果你是创业者且超前于时代,你的公司就死了。”

这句话既是自我警醒,也是对投资人的坦诚,RSI押的是一条可能需要5到10年才能验证的技术路线。

PART 04

裁员潮与融资潮:AI行业正在经历什么?

RSI不是孤例。2025年以来,顶级科学家集体出走、资本集体押注,已经成为这个领域最明确的结构性浪潮。

Image

David Silver的Ineffable Intelligence种子轮拿了11亿美元,估值51亿美元。

Ilya Sutskever的SSI估值未披露,但外界普遍认为在50亿美元以上。

Yann LeCun的AMI Labs募资10亿美元。

这些科学家都曾是各自机构的核心人物,现在他们选择离开,用自己的声誉和时间押注新的技术方向。

Image

这背后是两个层面的判断。第一,大型科技公司的研究正在从探索转向工程化。2025年10月,Meta裁减600名员工,田渊栋也在裁员名单中,这不是因为他们不够优秀,而是因为公司需要的不再是“发论文的研究员”,而是“能快速落地产品的工程师”。

第二,预训练Scaling Law的红利正在消退,但新的增长曲线还没有被验证。这个时间窗口是科学家创业的最佳时机,如果等到新路线被证明可行,大公司会迅速跟进;如果太早,技术和市场都不成熟。

Image

资本愿意在早期给出如此高的估值,本质上是在为“人”买单。RSI的6.5亿美元融资,与其说是对技术路线的认可,不如说是对这8位联创能力的信任。投资人赌的是:即使递归式自我改进这条路走不通,这个团队也有能力pivot到其他方向,或者至少能产出有价值的技术副产品。

但这种“人才溢价”也有代价。RSI的估值已经是典型种子轮公司的几十倍,这意味着它必须在未来几年内证明自己的技术路线确实比传统方法更有效,否则下一轮融资会非常困难。

PART 05

烧完6.5亿美元之前,RSI能证明什么?

递归式自我改进是这个领域最诱人的愿景之一,但也是最难实现的目标之一。RSI的出现,既是技术进步的必然,也是行业焦虑的产物。

从乐观的角度看,RSI押对了方向。预训练Scaling Law的边际收益确实在递减,行业需要新的增长曲线。如果递归式自我改进能够实现,它将彻底改变研发的范式,从人类主导的缓慢迭代,变成系统主导的指数级加速。这不仅会影响技术本身,还会加速药物研发、材料科学、核聚变等基础科学领域的突破。

从务实的角度看,RSI面临的挑战是巨大的。技术上,从“能写代码”到“能改进自己”之间有无数未解决的问题。商业上,RSI需要在烧完6.5亿美元之前证明自己的价值,而递归式自我改进可能需要5到10年才能真正成熟。组织上,一个不到30人的团队如何与OpenAI、DeepMind这样的巨头竞争?

Image

更深层的问题是:递归式自我改进是否真的是通往超级智能的唯一路径?还是只是众多可能路径中的一条?如果能力增长最终还是受限于物理世界的反馈速度,比如药物实验需要几个月,材料测试需要几周,那么纯粹的代码层面自我改进能走多远?

RSI的故事还在开始阶段。它的成功或失败,将为整个行业提供关键的数据点:在预训练Scaling Law之后,下一条增长曲线到底在哪里?是递归式自我改进,是推理时计算,是多模态融合,还是完全不同的方向?

无论结果如何,RSI的出现本身就是一个信号,这个行业正在从“更大更强”的线性思维,转向“如何让系统自己变得更聪明”的元层面思考。这个转变可能比任何单一技术突破都更重要。

来源:30人团队、零产品!姚班校友与7位顶尖科学家创立具身智能公司,估值316亿! | 机器人大讲堂

声明:本文来自机器人大讲堂,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/