AI春晚智源大会主角更替继续,AI狂潮寻找下一站
在6月12日至13日,第八届北京智源大会得以在中关村国际创新中心成功举行。
这场被业界称为“AI春晚”的盛会,作为人工智能(AI)产业的重要活动,成为了衡量产业情绪与技术路线的晴雨表。到了2026年,人们在讨论中所关注的关键词已经转变为AI自进化、世界模型以及下一物理状态预测。
回望近年来行业发展历程,从以ChatGPT为代表的聊天机器人程序迅速点燃了全球大模型技术的浪潮,到一批国产大模型创业公司成功占据了行业的核心舞台,再到机器人、世界模型与智能体相继进入公众视野并成为新的焦点,这场被称为“AI春晚”的盛会也见证了过去数年间,人工智能产业其核心关注重心所发生的一系列系统性迁移。
只是与前几年相比,会场中所呈现出的情绪氛围似乎平缓了许多。虽然一些新的热点话题已经浮现,但尚未孕育出能够引领风潮的超级明星公司。在经历了数年(约三年)的技术高速发展之后,人工智能产业正步入一个新的转型与过渡时期。
将时间维度拉长来看,历届智源大会上嘉宾阵容的更迭轨迹,实际上就是一部浓缩的AI产业演进史。
在2023年,ChatGPT问世不久,国内所谓“百模大战”的局面也正处于酝酿与蓄势的阶段。当年的大会高光,属于OpenAI的代表人物萨姆·奥尔特曼以及深度学习领域的先驱杰弗里·辛顿。在那个时期,国内的大模型技术总体上仍处于追赶的进程中,主论坛的嘉宾构成因此也以海外学者和国内顶尖的科研人员为主,而会议的议题则更多地聚焦于人工智能的基础技术探索。
2024年,行业格局经历了显著的演变。月之暗面、百度、智谱AI、零一万物、面壁智能等一众国产大模型企业的创始人、首席技术官(CTO)成为了大会的核心参与者,“百模大战”演进到了白热化的竞争阶段。其中,月之暗面创始人杨植麟在会场内人气居高不下,圆桌对话环节结束之后,他多次被现场的观众围绕请求交流,最终在工作人员的协助下才得以离开现场,这一幕也成为了当年大会上标志性的画面。
2025年,主角再度发生了"易位"。在第七届智源大会之上,宇树科技的创始人王兴兴成为了全场新的焦点人物,他在结束了开幕式的圆桌对话环节之后,在现场安保人员的引导下得以离场。具身智能技术取代了大语言模型,成为了当年大会的核心关键词,机器人格斗以及舞蹈表演都成功登上了主论坛的舞台。
针对当前的行业发展趋势,面壁智能首席执行官(CEO)李大海向《每日经济新闻》的记者(以下简称“每经记者”)阐述了他的看法。他认为,技术进步的过程并非是匀速线性的。随着大语言模型作为底层基础设施逐步走向成熟,产业界关注的焦点自然会经历一个从底层模型技术向具体应用场景迁移的过程。他指出,这种迁移是产业发展的合理趋势,也是必然方向。
在6月12日至13日,第八届北京智源大会得以在中关村国际创新中心成功举行。这场被业界称为“AI春晚”的盛会,作为人工智能(AI)产业的重要活动,成为了衡量产业情绪与技术路线的晴雨表。到了2026年,人们在讨论中所关注的关键词已经转变为AI自进化、世界模型以及下一物理状态预测。回望近年来行业发展历程,从以ChatGPT为代表的聊天机器人程序迅速点燃了全球大模型技术的浪潮,到一批国产大模型创业公司成功占据了行业的核心舞台,再到机器人、世界模型与智能体相继进入公众视野并成为新的焦点,这场被称为“AI春晚”的盛会也见证了过去数年间,人工智能产业其核心关注重心所发生的一系列系统性迁移。只是与前几年相比,会场中所呈现出的情绪氛围似乎平缓了许多。虽然一些新的热点话题已经浮现,但尚未孕育出能够引领风潮的超级明星公司。在经历了数年(约三年)的技术高速发展之后,人工智能产业正步入一个新的转型与过渡时期。将时间维度拉长来看,历届智源大会上嘉宾阵容的更迭轨迹,实际上就是一部浓缩的AI产业演进史。在2023年,ChatGPT问世不久,国内所谓“百模大战”的局面也正处于酝酿与蓄势的阶段。当年的大会高光,属于OpenAI的代表人物萨姆·奥尔特曼以及深度学习领域的先驱杰弗里·辛顿。在那个时期,国内的大模型技术总体上仍处于追赶的进程中,主论坛的嘉宾构成因此也以海外学者和国内顶尖的科研人员为主,而会议的议题则更多地聚焦于人工智能的基础技术探索。2024年,行业格局经历了显著的演变。月之暗面、百度、智谱AI、零一万物、面壁智能等一众国产大模型企业的创始人、首席技术官(CTO)成为了大会的核心参与者,“百模大战”演进到了白热化的竞争阶段。其中,月之暗面创始人杨植麟在会场内人气居高不下,圆桌对话环节结束之后,他多次被现场的观众围绕请求交流,最终在工作人员的协助下才得以离开现场,这一幕也成为了当年大会上标志性的画面。2025年,主角再度发生了"易位"。在第七届智源大会之上,宇树科技的创始人王兴兴成为了全场新的焦点人物,他在结束了开幕式的圆桌对话环节之后,在现场安保人员的引导下得以离场。具身智能技术取代了大语言模型,成为了当年大会的核心关键词,机器人格斗以及舞蹈表演都成功登上了主论坛的舞台。针对当前的行业发展趋势,面壁智能首席执行官(CEO)李大海向《每日经济新闻》的记者(以下简称“每经记者”)阐述了他的看法。他认为,技术进步的过程并非是匀速线性的。随着大语言模型作为底层基础设施逐步走向成熟,产业界关注的焦点自然会经历一个从底层模型技术向具体应用场景迁移的过程。他指出,这种迁移是产业发展的合理趋势,也是必然方向。2026年,每经记者在第八届北京智源大会现场注意到,会场所呈现出的整体氛围,又呈现出与往届不同的特征。本届大会共汇聚了2位图灵奖得主、8位两院院士以及30余位30岁以下的青年科学家。此外,超过40位人工智能企业的CEO与创始人亦出席了活动。大会安排了多达200场演讲与分享活动,线下报名人数业已突破1万人。据智源研究院院长王仲远透露,本届报名总人数已超越去年。不过,本届大会上并没有出现此前因明星嘉宾出席而导致的拥堵场面。
在论及大会核心议题的演变过程时,王仲远在接受每经记者采访的过程中指出,在过去数年的时间里,智源大会开幕式的主角始终处于持续变化的状态,从大语言模型到具身智能,再到本年度所聚焦的世界模型,每一次主角的更迭,其本质所反映的是产业界关注重心的系统性迁移。在他看来,智源大会更像一个平台与载体,清晰地映射出时代演进的轨迹。
AI自进化成热词
第八届北京智源大会中一个值得关注的变化是,其中更多的年轻面孔获得了显著的关注并登上了主讲台。
在开幕式所安排的圆桌对话环节之中,小米集团MiMo大模型团队负责人罗福莉,与清华大学人工智能研究院副院长、生数科技创始人朱军,清华大学计算机系教授、面壁智能联合创始人兼首席科学家刘知远,以及南洋理工大学校长讲席教授、人工智能交叉研究院院长安波,进行了同台对话交流。
AI自进化同样成为了本届大会之中被讨论得最为频繁的核心议题之一。
罗福莉判断认为,上一代模型的能力上限更多体现在执行层面,指令清晰时执行效果接近完美;而顶尖模型如今已经开始向设计验证指标、规划实验流程等更抽象的能力外延。
她认为,当前模型与顶尖研究员之间所存在的差距,主要源于“提出有价值的问题”这一关键环节。然而,这一差距正借助“更强的模型叠加更好的智能体系统”而持续缩小。
刘知远则从更为宏观的视角出发,提出了如下类比:工业革命的核心在于用机器替代人的重复体力劳动,当其发展至极致时,便实现了用机器制造机器;而正在发生的智能革命,本质上则是用AI替代人的重复脑力劳动,用AI制造AI,这已成为技术发展到高级阶段的必然标志。他同时强调,‘AI创造AI’(即AI create AI)这一过程的最外层驱动力,仍然应当是人类自身的主体性。
安波则保持着一种相对审慎的态度。他指出,虽然认同AI自演化的长远方向,但他同时强调,这一演进机制在人工智能能力尚未成熟的阶段,在完全封闭的系统环境内难以独立实现有效运转。其运作目前高度依赖于来源于外部用户交互所生成的真实反馈数据。他进一步指出,完全依赖封闭环境来构建数据飞轮的路径是行不通的。
现在仍处于世界模型早期
如果说2025年的核心议题是具身智能,那么本届智源大会的核心战略意图,则聚焦于将“世界模型”这一概念,从技术探讨的幕后,正式推向产业应用的台前。
在大会正式举行前的采访环节中,王仲远对智源研究院在世界模型这一方向上的核心判断进行了系统性的阐述。他指出,当前的人工智能领域正经历一场深刻的范式变革,即从过去专注于“预测下一个词元”的语言模型范式,演变为“预测下一个物理状态”的新范式。他强调,这一演进正是世界模型的本质所在。
智源对现有的世界模型相关技术路线进行了梳理与归纳,将其划分为四大类别:
第一类为以语言为中心的世界模型,其中涵盖了视觉—语言模型(VLM)以及视觉—语言—动作模型(VLA);
第二类是以像素为中心构建的世界模型,其典型代表包括Sora和Seedance等视频生成模型。
第三类是以三维结构为核心构建,其中包括了三维重建技术以及李飞飞团队所开发的World Labs Marble模型;
第四类是以视觉表征为中心的世界模型,例如杨立昆提出的JEPA(联合嵌入预测架构)系列模型。该类模型的核心预测目标在于对视觉表征进行压缩,不过,这类模型所预测的视觉嵌入演化,与实际的物理规律演化过程并不能简单地等同起来。
王仲远认为,这四类模型与真正面向物理世界的基座模型相比都还有显著差距,“当前仍处于世界模型的早期,依然需要进行大量的科研探索工作”。
在这一技术判断的基础上,智源研究院在本届大会上正式发布了其通用世界基座模型的初期版本——悟界Physis-v0.1。该模型旨在通过统一的物理状态学习框架,来实现物理世界的正确性建模、动作因果关系的可追溯性、长程推理的一致性以及跨场景的通用泛化能力。不过,王仲远也明确指出,这只是一个0.1版本,他强调“很明显,这只是一个非常初步的、仍在训练阶段的模型”。智源此次的核心目的在于分享其研发进展与初步观察,而非进行一次重磅的模型产品发布。
值得特别提及的是,智源研究院行为世界模型创新中心负责人一职,由年仅22岁的青年学者陈博远担任。王仲远表示,智源历来秉持着"青年挑大梁"的理念,当年悟界系列的多位负责人也是在30岁左右便走上了重要岗位。
AI Coding的冲击可能更直接更快
在大模型产业论坛的圆桌讨论环节之中,针对大模型企业是否具备长期竞争"护城河"这一议题,与会各方所持观点的交锋依然十分激烈。有与会者指出,当前顶尖大模型的能力正在呈现出快速趋同的发展态势,开源与闭源模型之间的技术差距已经缩减至三到六个月的周期范围之内,大模型企业在未来阶段或许也将面临"有量无价"的处境。
对于当前的行业竞争态势,王仲远认为,大模型整体性能的迭代过程目前还远未触及天花板,其提升空间依然广阔。基于这一判断,未来的行业格局可能会趋向于一个“一超多强”的局面,也有可能形成多个巨头并立的结构。他进一步指出,现阶段所广泛使用的各类性能评测榜单,其结果本身也并非完全可信,需要审慎看待。
他特别指出,开幕式上所介绍的最新Claude模型的发布,充分证明了一个事实:即便互联网文本数据已接近耗尽,AI的能力依然能够实现持续提升。此外,不仅模型本身在不断演进,整个系统的生产能力,以及产品形态从聊天工具向执行工具的转变,也正在同步推进。
银河通用CTO王鹤阐述了世界动作模型(WAM)的概念,并将其与泛泛而谈的世界模型进行了区分。
王鹤在介绍中指出,银河通用此前借助10亿帧仿真数据,已在抓取任务上验证了零样本端到端能力,然而,对于更多任务的扩展,仍然依赖于真实世界的遥操作数据,即远距离工作数据。
在王鹤看来,世界动作模型(WAM)的核心设计逻辑在于将“动作”置于首要位置,它能够依赖于大量人类第一视角视频来学习动作模式,而无需进行人工动作标注。这条技术路径有望推动具身智能在未来两年内达到类似于“GPT3.5级别”的预训练发展里程碑。
在开幕式圆桌对话环节,刘知远阐述了以下观点:美国人工智能公司Anthropic的估值之所以能够超越OpenAI,其关键因素在于该公司识别并锁定了“代码”这一垂直领域,从而得以形成一个高效的数据闭环。具体而言,在2024年至2025年间,其强化学习方法论上所取得的成功,与Claude Code等产品从全球用户处持续收集代码反馈数据的能力相结合,共同作用并构成了一个可持续运转的数据飞轮。
刘知远提出观点认为,这一模式具备借鉴意义,任何领域若能快速构建同类数据闭环,都将有望加速AI落地与技术突破。
而在王仲远的判断之中,未来两到三年的周期之内,人工智能辅助编程(AI Coding)对各行业所产生的冲击力度,相比世界模型等前沿议题而言可能更为直接且更为迅速。他在采访中阐述,腾讯近期所披露的信息表明,今年以来该公司新增代码的大部分已由AI生成,这意味着人类数字世界正被现代人工智能技术所系统性地重构。
技术热潮的换挡期
与前两年相比,一个明显的变化是:技术热点的更新迭代速度并未减缓,但"造星效应"却呈现减弱趋势。
无论是在世界模型领域还是在人工智能辅助编程领域,当下都尚未涌现出一家能够像去年的宇树科技以及前年的月之暗面那样,一经亮相便引爆全场的明星企业。
某科技公司一位报名参会的人士在接受每经记者采访时,分享了自己参加智源大会的观感。该人士表示,不论是否存在技术明星人物,智源大会所探讨的核心议题始终位于技术发展的前沿地带;对于从业者而言,参与聆听会议内容以及与现场的参展商开展交流活动,都具备了相当的价值。
王仲远在回应每经记者采访时指出,每年的智源大会都能够向全行业展示并引领对人工智能最新演进方向的认知,这也是今年大会报名人数创下新高的重要原因之一。此外,他坦言世界模型这一概念在过去半年中在受到广泛关注的同时,也出现了一定程度的概念滥用现象,他强调希望能够逐步凝聚起行业共识,以防止对世界模型这一术语的滥用。
在开幕式的对话环节中,阿里云创始人王坚与智源研究院理事长黄铁军,针对“总有人比时代早十年”这一议题,展开了一场更具哲学意味的讨论。
在相关讨论中,王坚提出了一个基于历史观察的类比。他指出,从飞机实现首次成功飞行,到高等教育体系中正式确立“航空系”这一专业学科,其间历经了超过三十年的技术积淀与体系构建。他进而推断,如果我们认可当前所讨论的人工智能是一场规模宏大的根本性变革,那么从技术爆发到形成独立、完整且成熟的学科体系,可能仍然需要一个相当漫长的演进过程。他以此强调,我们或许还远未到达能够为人工智能设立一个真正意义上自成一系的阶段,其学科化与体系化的进程才刚刚起步。
当具身智能的机器人格斗赛所引发的初始狂热逐渐消退,当大模型能力的持续迭代已演变为一种行业常态,而诸如自进化、世界模型这类更为抽象的概念,尚未能寻找到一个具体的、可被广泛感知的明星应用载体时,整个行业便似乎正处于一个由新旧技术叙事彼此交织、亟待更迭的换挡阶段。
正如刘知远在圆桌对话上对年轻人提出的观点,真正的创新往往具有反共识的特性。这意味着,如果一项工作或方向已获得全世界范围的普遍认同并付诸实践,那么它从本质上讲便不再符合创新的定义。同理,被所有人一致认为应当去完成的事情,同样难以被界定为创新。由此推断,下一个能够引发广泛关注、成为焦点的突破性技术或应用场景,极有可能正孕育于当前那些尚未进入主流视野、鲜有研究与讨论的边缘领域之中。
来源:“AI春晚”智源大会主角更替继续,AI狂潮寻找下一站 | 证券时报网