Kimi公开预测2026世界杯:部署300个Agent进行104场比赛赛前预测和赛后复盘

2026年06月10日 14:40
本文共计6856个字,预计阅读时长23分钟。
来源/36氪 责编/huazi56 爱力方

AI技术应当更透明。”

文|张虎

2026年夏天,美加墨世界杯的哨声尚未吹响,但足球的狂热已经提前登陆。

在中国,苏超联赛正以一种荒诞又热血的方式席卷社交媒体——10块钱门票被炒到900块,常州因连败被网友戏谑地从“常州”褪成“吊州”再缩成“巾州”,官方甚至亲自下场玩梗:“比赛第一,友谊第十四。”当苏州、无锡、常州这三座江苏GDP最强的城市在积分榜上默契地垫底,网友的吐槽精准得令人心碎:“连输球的顺序都跟GDP排名一样。”

贝克汉姆来苏州助威的那天,“江苏十三太保”在抖音的播放量已经冲破109亿次。

这就是足球。它能让算法失效,让常识翻车,让最理性的长三角集体破防。

而在另一个平行战场上,一场更冷静的豪赌正在上演。48支球队、104场比赛——这是世界杯扩军后的首届赛事,也是全球AI公司集体“下注”的新战场。只是这一次,科技圈有人选择了一件最危险的事:唱反调

6月8日刚传出投前估值飙至300亿美元、半年猛增6倍的Kimi,转身又放了一个大招:用自己的Agent能力“押注”世界杯。所有主流模型都把西班牙和法国捧上冠军宝座,Kimi却站了出来,偏偏“支持”德国队。

月之暗面旗下的AI助手Kimi近日宣布,将通过Agent Swarm功能调动300个Agent,对全部104场比赛进行赛前公开预测与赛后复盘。如果这只是“AI猜球”的追热点营销,本该无人问津。但Kimi在公告正文里写下了一句耐人寻味的话——

“AI技术应当更透明。”

不仅如此,Kimi还主动邀请其他模型公司一起参与公开预测,并声明:“我们认为,AI不应该被包装成永远正确的系统。一个值得信赖的AI系统,应当有能力清楚表达自己的边界。”在这个习惯了用“刷新SOTA”“超越人类基准”开场、用“免责声明”收尾的年份里,这句话听起来不像宏大叙事,倒更像一封公开战书。

从一只章鱼说起

如果你经历过2010年南非世界杯,大概率还记得那只突然红遍全球的章鱼。

它叫保罗,住在德国奥博豪森的一家水族馆里。预测方式简单到近乎荒诞:工作人员把两个透明盒子放进水中,盒子上分别贴着两支球队的标识,里面各放一只贻贝。保罗游向哪个盒子,打开哪个盒子,人们就认为它“预测”哪支球队会赢。

一开始,这只是水族馆为蹭世界杯热度设计的小节目。没人真指望一只软体动物理解足球,更没人相信它能读懂阵型、状态、盘口和民族情绪。但事情偏偏开始失控:保罗一路猜中德国队的比赛,又在半决赛前选择了西班牙。一天后,西班牙1比0击败德国。等到它又选中西班牙夺冠,全世界终于坐不住了。8次预测全部命中。若按独立二选一粗略计算,概率为1/256,即0.39%。

章鱼保罗就这样成了上一代世界杯预测帝。

严格说,它什么也没解释。它没有训练数据,没有模型参数,没有置信区间,也没有一份200页的技术报告。它只是伸出触腕,打开一个盒子,然后让媒体、球迷、赌徒和全世界的围观者替它完成解释。

世界杯预言帝“章鱼保罗”(图片借助AI生成)

这才是保罗真正迷人的地方。它不在于“懂不懂足球”,而在于它把预测变成了一场全球同步观看的仪式。人们一边嘲笑自己不该相信一只章鱼,一边又忍不住刷新新闻,等它把下一只贻贝从盒子里取出来。世界杯从来不只是一项体育赛事,它更像一台全球同步启动的情绪机器:每隔四年,人们会突然愿意相信很多平时绝不会相信的东西,玄学、手感、梦境、球衣颜色,还有彩票站门口那句“今年该轮到他们了”。

某种意义上,保罗更像是前算法时代最后一个被全球共同观看的“黑箱模型”。

它的黑箱是可爱的,因为它不承担责任。猜对了,是神迹;猜错了,也不过是一只章鱼选错了午饭。可AI不一样。AI的黑箱之所以让人不安,是因为它开始进入真实决策:投资分析、医疗建议、法律咨询、企业经营,甚至现在的世界杯预测。一个错了最多被做成段子,一个错了可能影响业务、判断、钱,甚至信任。

从保罗到AI,变化的不是人类突然变得更理性,而是“预测帝”的外壳换了。水族箱变成了Agent Swarm,贻贝变成了数据集,触腕变成了300个并行Agent。真正没变的是那件事:每当世界充满不确定性,人们总想找一个东西替自己先开口。

区别在于,保罗可以沉默,AI不能。保罗不解释,反而成就神话;AI如果不解释,就会制造恐惧。

这也是Kimi这次世界杯预测最值得看的地方。它不是又造了一个“赛博章鱼保罗”,而是在尝试回答一个更现实的问题:当预测从娱乐变成产品能力,当黑箱从水族馆搬进工作流,一家公司究竟该把自己的不确定性藏起来,还是摊开来?

德国队,凭什么?

当主流模型清一色将西班牙、法国、巴西推上夺冠热门前三,Kimi给出的判断是:德国队被严重低估了。

模型测算,德国队基准夺冠概率约11.0%,校准后约11.3%,而部分市场的隐含概率仅为7.4%——这中间约3.6个百分点的缺口,在博彩世界里已是一笔不容小觑的价差。

为什么是德国?

Kimi给出的分析链条很长:连续两届世界杯小组出局的阴影,在公众和市场心理上留下了顽固的“近因偏差”,持续压低了德国的定价;Elo排名、阵容估值和人才储备厚度的硬指标上,日耳曼战车依旧稳居世界第一梯队;穆西亚拉与维尔茨这对年轻创造力轴线,正在治愈德国队面对铁桶阵时“控球多、威胁少”的痼疾。

而站在场边的那位少帅,或许是最大的X因素。

38岁的纳格尔斯曼是本届世界杯最年轻的主教练。生于1987年的他被誉为足坛“战术神童”,不仅是德甲历史上最年轻的教练,也是德国足球职业化后最年轻的国家队主帅,更是“Laptop Coach”(笔记本教练)的代名词。他对数据的苛刻近乎偏执——不是那种高高在上的“数据分析”,而是扎根草皮的实时追问:“到底什么才算是赢得球权的时刻?什么是丢掉球权的时刻?压迫的定义是什么?反击的定义是什么?”他要求系统学习这些定义,甚至要求“在我中断训练的同时立刻拿到数据”。

德国队主教练纳格尔斯曼(图片借助AI生成)

Kimi在报告中特别提及这一点时,几乎带着某种“惺惺相惜”的意味——当一位比梅西和C罗还年轻的主教练用AI优化球队的压迫防线,一家中国AI公司也正在用算法重新评估这支球队的夺冠概率。一条技术暗线,从训练场延伸到预测模型,在世界杯的舞台上悄然交汇。

当然,Kimi也坦承了风险:高压体系对体能和阵容完整度的要求极高,北美盛夏的高温可能放大一切隐患;一旦关键位置出现伤病,或者撞上防守组织严密、身体对抗凶悍的对手,德国队的优势窗口会迅速收窄。

更何况,这里还横亘着一个冷硬的“美洲魔咒”——历史上,欧洲球队在美洲举办的世界杯上从未夺冠,唯一的例外是2014年的德国队在巴西登顶。2026年,世界杯再次回到美洲大陆,西班牙、法国都要面对这道诅咒,而德国,恰恰是唯一打破过它的人。

反共识,有时候需要的不只是勇气,还有历史注脚的青睐。

104场“公开处刑”,是坦诚还是另一种聪明?

预测德国队,最多算“态度表达”。Kimi接下来的一步,则堪称挑衅——它公开邀请其他AI模型加入这场预测。

翻译一下:Kimi不只自己下场,还要拉所有同行一起接受104场现实检验。

这不是没有风险的豪赌。回顾往届世界杯,AI预测的“翻车史”血迹斑斑。2018年俄罗斯世界杯,微软、百度、谷歌、阿里云等平台的AI集体看好西班牙、德国、巴西,最终法国队夺冠。2022年卡塔尔,艺电、尼尔森、538等机构倒是押中了阿根廷,但具体到每场比赛的命中率,半岛电视台AI只有58.7%,538更跌至57.1%——基本接近抛硬币。

金融界的AI甚至输得更难看。高盛曾砸下20万个模型、100万次模拟,隆重预测巴西与德国的决赛对决,结果被法国队一剑封喉。讽刺的是,真正连续四届100%命中世界杯冠军的,不是华尔街的量化模型,而是EA Sports的《FIFA》游戏。

“猜对了就是科学,猜错了就是玄学。”一位数据博主曾如此总结。

kimi关于2026年世界杯赛事分析的200页公开报告

世界杯在这里变成了一个天然的、公开的、无法遮挡的测试场。每一场比赛都是一次验证,每一次预测错误都会留下数字化的“案底”。Kimi甚至提前列好了“错误分类框架”:数据滞后、关键假设失效、模型结构盲区、临场意外事件、足球本身的随机性——仿佛已经做好了被当众打脸的准备。

这背后,是AI行业一场正在静默发生的信任危机。

ChatGPT爆火之初,“AI无所不能”的叙事铺天盖地。但很快,幻觉问题、逻辑漏洞、在专业场景中的不靠谱表现开始频繁暴露:AI搜索编造假新闻,AI法律助手引用不存在的判例,AI投资建议给出方向性错误……每一桩都在蚕食“AI可信”的地基。普通用户的信任曲线急剧掉头,从早期“看到AI生成的内容就相信”,迅速转向“看到AI生成的内容先怀疑”。信任,正在从AI行业的核心资产,变成一笔需要不断偿还的负债。

福布斯调查显示,过去五年全球公众对AI的信任度已从61%下降至53%。凯捷研究院2026年初对全球15个行业1678名高管的调研,则揭示了一个更尖锐的矛盾:67%的人认为AI将重塑行业规则,但72%担忧技术与可靠性尚未验证,62%认为公众接受度不足将直接制约推广。

信心在顶层,疑虑在基层;故事在发布会,真相在现实场。

漂亮的榜单,失效的信任

过去两年,AI行业形成了一种默契的话术体系:发布会上的数字和榜单排名永远漂亮,演示视频永远成功,案例库里的失败案例永远“正在优化中”。没有哪一件事单独摧毁了谁,但它们像持续滴落的水珠,一点点侵蚀着公众对“AI可信”的集体认知。

在这个背景下回头看Kimi的“诚实宣言”,就很难简单地将其归类为一次营销事件了。它触碰到了一个行业级的结构性问题:当AI产品越来越多地进入需要承担后果的真实决策场景——医疗建议、法律咨询、投资分析甚至赛事预测——公众凭什么相信你?

2023年,纽约一位律师在Mata v Avianca案中向法庭提交了6个判例,法官翻遍卷宗后发现——全是AI编造的。同年,德勤澳洲一份237页的报告因引用不存在的判决,被客户退回44万澳元。国内的戏码同样荒诞:“80后死亡率5.2%”的假数据在微信群里疯传,西藏地震后AI生成的废墟图片骗过了无数双眼睛。

中欧国际工商学院方跃教授说得刻薄却精准:“当能力不再是瓶颈,信任才是天花板。”

过去行业的通行做法,是把风险藏进用户协议最后一页、用8号灰色字体印刷的免责条款里。那是一种“法律避险术”——就像酒店前台那张“贵重物品遗失概不负责”的告示,你明知道它存在,却从不会认真读。

Kimi这次走了另一条路。

高置信度准确率约85%-90%,中等置信度骤降至55%-65%,低置信度接近随机区间——这些数字没有被塞进某个犄角旮旯,而是直接写在正文C位。

Kimi公开的首轮比赛预测结果

问题是:这种策略能重建信任吗?还是会因为自曝其短而被公众更快地抛弃?

答案取决于一件事——公众想从AI那里得到的,究竟是永远正确的幻觉,还是清楚知道自己有多不确定的诚实?如果是前者,Kimi在冒险;如果是后者,它可能正试图定义一种新的技术沟通范式:不完美,但可追溯;不确定,但愿担责。

一石三鸟,还是三重野心?

把镜头拉远一点,这次发布的叙事结构相当精密,甚至饱含“心机”。

技术层面,Agent Swarm的300个并行Agent首次在具体应用场景中公开亮相。你可以把它们想象成一个庞大教练组的分工现场:有的Agent像资深球探,死盯Elo排名和FIFA积分的变化;有的像数据分析师,翻阅xG和xT指标的每一页报表;有的像战术教练,评估阵容匹配和克制关系;还有的像站在投注站里的观察员,监测赔率异动背后的市场情绪。它们各自给出结论、证据、置信度和反方解释,再通过融合校验形成概率性判断。Elo/FIFA强度模型、Poisson和Dixon-Coles进球分布模型、Monte Carlo模拟、贝叶斯动态更新——这一系列方法的复合运用,让这次预测不再是”大模型拍脑袋”,而是一场多Agent协作推理的产品级路演。

行业层面,“AI技术应当更透明”和“邀请同行加入”,在不点名的情况下完成了一次精准的行业对话。当“AI信任危机”逐渐从圈内讨论变成公众议题,第一个站出来说“我不完美”的人,天然占据了道德高地和辨识度的双重C位。

用户层面,世界杯福利被设计成了一场精心计算的增长引擎。用户登录选择主队,主队赢球就能参与瓜分10亿Token池;如果德国队赢球,所有用户额外再瓜分10亿Token。而领取的Token直接导流至6月3日刚刚推出的Kimi Work——一款定位为“知识工作者本地办公助手”的桌面Agent产品,集成了建站、PPT制作等Skills,以及金融、科研、法律等专业数据库。从绿茵场的注意力,到办公桌的生产力,这条转化链路比任何品牌广告都来得直接。

天下没有免费的午餐。这是Kimi用万亿Token赌的一场“公开考试”,让自家产品Kimi Work借势闪亮登场。

Kimi Work产品广告

这场精心设计的品牌叙事的背后是一个真实的问题:当AI从聊天框走向真实世界,从娱乐消遣走向决策辅助,公众需要的是一个永远不会错的“神谕”,还是一个能够清楚说出“这件事我有多大把握、哪些地方我可能出错”的可靠工具。

诚实,不应该是AI公司给用户的人情,而是技术进入现实世界必须支付的门票。

踢足球的和写代码的,到底谁更需要技术?

官方文末,Kimi埋了一条让人无法忽视的暗线:本届世界杯每进一球,即向中国足球事业捐赠10亿Token,用于支持基层足球、校园足球和青训教练使用AI工具,预计覆盖超过1万名从业者。

“中国男子足球队已连续24年未进入世界杯。我们能做的,仍有很多。”——这句话措辞克制,却难掩背景里的巨大落差。一边是38岁的德国主帅纳格尔斯曼,用数据和AI武装一支传统强队;另一边是一家年轻的中国AI公司,在自己国家连续24年无缘世界杯的背景下,选择把技术资源往最基层输送。两幅画面并不对称,却指向同一个命题:技术到底能在多大程度上改变一项运动?

Kimi支持中国足球事业的捐赠活动页

这里的对比甚至有些刺痛。范志毅那句“脸都不要了”的怒吼犹在耳边——那是国足1比5惨败给泰国后留下的时代注脚。更冰冷的数字横亘在眼前:中国注册球员仅约8000人,而日本超过100万。在这个基数上谈论“世界杯梦想”,多少显得有些奢侈。

但希望往往出现在官方叙事之外。

今年4月U17亚洲杯,中国U17男足3比1逆转沙特阿拉伯,时隔22年历史性闯入四强,距离世少赛仅一步之遥。贵州“村超”在过去三年从地方联赛演变为现象级文化事件,全平台浏览量突破900亿次,带动190亿旅游收入,2025年决赛吸引超8万现场观众、线上观看突破3亿人次。新近崛起的“苏超”省级城市联赛,10元门票被炒到900元,“常州”因战绩不佳被网友改写为“巾州”,官方甚至亲自下场玩梗——“比赛第一,友谊第14”。

从U17的亚细亚赛场,到村超的苗乡鼓楼,再到苏超的城市德比——中国足球的未来,或许并不在某支国家队的身上,而是分散在这些看似微小却正在顽强生长的节点里。

中国足球的困境当然不可能靠送Token来解决,它涉及青训体系、联赛健康度、足球文化等远为复杂的系统性问题。但Kimi这个动作提出了一个假设:如果数据和技术曾经是职业足球顶层俱乐部的“奢侈品”,AI能不能把它变成基层也能用的“基础公共品”?

诚实是资产,还是债务?

足球可能是世界上最难预测的运动。

一场比赛的走向,可能因为一个VAR判罚、一张红牌、一次门将的超常发挥、或一场突如其来的暴雨而彻底改写。任何预测系统都无法征服这种程度的随机性,Kimi当然也不能。

但也许恰恰是这种“无法征服”,让世界杯成为了绝佳的技术诚实度测试。在这里,你可以选择假装自己很确定,然后被现实反复打脸;你也可以从一开始就说清楚自己有多不确定,然后把每一步推理都摊开给人看。

Kimi Agent Swarm的功能展示页

Kimi选择后者——它的300个Agent此刻可能正在模拟104场比赛的无数种可能性,但更值得关注的是它抛出的那个问题本身:在AI行业面临信任赤字的当下,诚实是一种道德选择,还是一种竞争策略?是一个品牌人设,还是一种迟早必须支付的长期技术债务?

Kimi最后提到,“我们认为,AI不应该被包装成永远正确的系统。一个值得信赖的AI系统,应当有能力清楚表达自己的边界。”

这种表达的风险却是真实的。如果Kimi的预测准确率惨淡,它将成为“AI不懂足球”的最新注脚;如果它恰好猜对几个冷门,又可能被质疑为“幸存者偏差”。

归根到底,德国队能不能爆冷夺冠,7月就会揭晓;但“AI该不该更诚实”这道题,答案没那么容易得出——真正的问题是,公众还有多少耐心等AI学会诚实。

更没有人知道,先跨出这一步的公司们,是会得到奖赏,还是付出代价。

(注:预测报告由AI生成,请谨慎参考)

本文由「晓曦」原创出品

来源:300亿美金,300个Agent,Kimi公开预测世界杯:不怕打脸-36氪 | 36氪

声明:本文来自36氪,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/