AI大模型集体押注世界杯,DeepSeek押宝法国队,Kimi看好阿根廷队,千问、豆包、元宝等支持西班牙队,谁最懂球?
每经记者|温梦华 每经编辑|何小桃 张益铭
编辑 何小桃 张益铭 易启江
校对 金冥羽
距离2026年美加墨世界杯开幕仅剩数小时,这场全球瞩目的足球盛宴即将正式打响(北京时间6月12日凌晨)。然而在绿茵场外,另一场没有硝烟的竞赛早已悄然展开——人工智能技术正在这场体育盛事中扮演着越来越重要的角色,从赛事研判到实力比拼,科技与足球的融合正创造出新的可能。
6月8日,国产大模型Kimi对外宣布,将借助名为“智能体(Agent)”的集群,同时调度多达300个子Agent,对多达104场世界杯赛事结果进行公开预测,并且提出了德国队或许会爆冷夺冠的可能性。与此同时,Kimi还推出了一项“押注”活动:设立了总量达1万亿的Token(词元)奖池,用户选择支持的球队,所选球队若获胜,用户便可瓜分这些Token,从而将体育赛事与AI产品的用户运营深度地结合在一起。
《每日经济新闻》记者(以下简称每经记者)观察到,千问平台也推出了类似的预测活动。通过实际测试发现,豆包、元宝、DeepSeek、文心一言等国产大模型在被询问“2026年世界杯谁会夺冠”时,得出了西班牙队将最终夺冠的结论,且各模型所依据的推理逻辑也表现出高度的一致性。
然而,在这场热闹的表象之下,Kelly Bench所发布的最新数据却清楚地表明,包括GPT在内的多个顶级大模型在足球博彩预测任务中的实际表现并不理想。
既然AI在预测上无法取胜,Kimi、千问等AI大模型为何还要押注世界杯呢?这背后所反映的,实际上是AI大模型行业的集体焦虑:当写诗、做题、对话等同质化竞争逐渐走到尽头,各家厂商都急于证明自身具备理解复杂、动态且充满不确定性的真实世界的能力。
“万亿Token狂欢”:世界杯成AI“用户拉新战场”
面对世界杯所带来的海量关注度,众多品牌正积极布局,而此次参与竞争的,不仅包括传统赞助商,还涵盖了那些坐拥万亿级Token的人工智能大模型。
6月8日,Kimi发布了声明并指出,将借助Agent集群来同时调度300个子Agent,对104场世界杯赛事开展公开预测工作,并且会在每轮比赛前公布预测结果、赛后执行复盘分析。
Kimi所采用的预测策略并未完全追随普遍的市场观点。该模型并未完全否认当前大多数主流模型将西班牙队和法国队列为夺冠最大热门的判断,同样判断这两支队伍的夺冠概率位居前列,然而,它提出了一个额外的关注点:德国队的夺冠概率或许被市场所低估。
Kimi月之暗面公众号
当网友热烈讨论“AI预测究竟准不准”“AI是否真正懂球”时,Kimi在文章开篇便坦然承认“我们的预测很可能是错的”,并表示希望借助本次尝试,将分析过程、预测结果以及赛后复盘共同置于一个统一的透明化分析框架之内。

此外,Kimi设立并开放了总量达1万亿的Token奖池。用户预测冠军球队并挑选支持的队伍,所选球队每次获胜即可参与瓜分该奖池。截至6月11日18时,Kimi App数据表明,参与用户的支持率实时排行前五的球队依次为阿根廷、法国、西班牙、巴西与葡萄牙,其中阿根廷获得了43.33%用户的挑选。
Kimi“预测冠军队抢万亿Token”活动截图
因此,Kimi在世界杯期间押重注并提供万亿Token的举措,其本质并非单一的技术展示,而是一次技术能力与品牌营销策略的深度结合。从技术执行层面看,该行动确实体现了调度复杂智能体集群以处理大规模并行任务的能力,这属于其核心竞争力的一次实战化应用。然而,从市场影响与用户增长的角度审视,将技术验证与高关注度的体育事件、用户激励体系相结合,无疑构成了一个经典且高效的市场沟通与用户获取方案。在行业面临同质化竞争与寻求新场景的当下,此类行动已成为厂商证明其模型理解真实世界复杂性、并以此建立品牌差异化认知的关键手段。

长期关注世界杯等知名赛事的体育咨询专家、关键之道创始人张庆在接受《每日经济新闻》采访时指出,Kimi此次举办的活动,其运作逻辑与春节联欢晚会期间的红包抢夺、集卡瓜分奖金等互联网平台惯用策略高度相似,本质上更偏向于一种市场营销活动。
“每一届世界杯均构成规模庞大的流量聚集场景,各企业均希望借此获得参与机会,以扩大自身的曝光度与用户引流渠道。”张庆在向《每日经济新闻》记者阐释时指出,当前大模型领域内的竞争尤为激烈,核心焦点在于争夺用户注意力及使用频次;借助世界杯这一契机,一方面能够提升相关品牌在市场中的声量,另一方面也有助于促进大模型产品的数据用户积累及活跃度增长。
深耕人工智能产业多年的技术专家王岩(出于隐私考虑使用化名)在接受每经记者采访时指出,大模型预测世界杯冠军的行为,是体育热点、平台Token补贴策略与Agent技术展示需求等多重因素共同叠加所形成的传播事件。
王岩所持的核心观点是,利用热点进行借势仅仅是引发关注的入口,真正意义上的竞争焦点将集中于如何将模型抽象的能力,转化为用户可以切实感知到的结果。这意味着,在品牌传播的维度上,AI大模型企业已经不再仅仅对外公布模型参数、基准榜单或撰写技术报告,而是借助关注度极高的赛事,来为用户创造体验产品的入口;而在更为深层的商业竞争层面,各家模型实际争夺的是用户心智的占领、使用频次的提升、社交网络的广泛传播以及开发者群体的关注。
截至目前,已有多少用户参与了Kimi"押注"世界杯的这项活动?通过借助Agent集群来预测世界杯冠军,Kimi将会在哪些方面获得能力的提升呢?Kimi方面(月之暗面)向《每日经济新闻》记者表示:"暂无回应"。
多款国产大模型预测西班牙队
精准共识还是算法趋同?

不仅限于Kimi,其他人工智能大模型领域的参与者也在共同参与这场世界杯带来的商业盛宴。例如,千问平台同样推出了名为“决战美加墨,与千问一起预测,赢万元现金”的运营活动,加入了这场旨在展示技术实力的行业竞争之中。
千问App截图

"我近日也运用了DeepSeek与豆包来预测2026年世界杯的冠军归属,目的是对比它们所进行的分析论证是否具备合理性,不过我观察到它们所给出的预测结果及相关论证都存在较为明显的局限性。"张庆向《每日经济新闻》记者指出。
在国产大模型的评估下,究竟哪支队伍被视作“2026年世界杯的冠军候选”?经《每日经济新闻》记者对DeepSeek、Kimi、豆包、元宝、千问、文心一言与智谱清言等模型进行实际测试后发现:DeepSeek的预测结果指向法国队,Kimi的预测结果倾向于阿根廷队;而千问、豆包、元宝、文心一言以及智谱清言等五款国产大模型,则一致将预测支持投向了西班牙队。
针对2026年世界杯的冠军归属,各款AI大模型给出了各自不同的理由分析。不过,更值得关注的一个现象是,那些选择支持西班牙队的模型,其推理逻辑呈现出高度趋同性,它们的核心论据之一,均建立在“权威数据模型及相关机构的观点高度一致看好”这一基础上。
大模型的预测到底准不准?


能否获得球迷的青睐?
上海财经大学特聘教授胡延平向每经记者表示,AI大模型已初步展现出依托全局动态信息以及深度复杂推理所具备的特定预测能力,这为各家大模型进行预测提供了相应的基础与信心,但足球本身具有不确定性,预测的成功率与精准度方面仍有待观察。
世界杯预测活动为评估与验证模型及智能体(Agent)的综合能力提供了一个技术验证与展示的理想平台,然而其预测效果往往呈现出复杂性。根据胡延平的评估,在这届世界杯中,表现最为优异的预测模型,其预测准确率预期可介于60%至80%之间。
然而,Kelly Bench在针对2023至2024赛季英格兰超级联赛所开展的模拟评估中却呈现出截然不同的结论。该研究发现,其所评估的每一个前沿模型在整个赛季周期内均出现了亏损,且有相当数量的模型经历了破产的结局。在这些模型当中,Claude Opus 4.7目前以-3.7%的平均投资回报率处于相对领先的位置;另外还有4个模型成功避免了破产的发生。
Kelly Bench截图

“人工智能本质上是一种辅助性工具。鉴于足球赛事的复杂性,该工具通过以战队历史战绩、世界杯排名、赔率、国际足联官方数据等大量多维度信息为基础,成功呈现了基于客观数据的统计分析结果。因此,将其作为参考工具具备相应的价值,然而在实际应用中,相关决策者并不会完全依赖于其输出结果。”一位长期关注世界杯赛事的资深球迷向《每日经济新闻》记者阐述道。
从上述球迷的视角出发,相较于大模型的预测结果,每位球迷都更加倾向于支持自己所喜爱的球队,个人喜好在判断过程中占据了相当大的比重。并且随着赛事推进至决赛阶段,球员的临场发挥与心理层面的博弈变得尤为关键,这导致了不确定性的显著增加。
不再比谁更会“聊”

押注世界杯背后AI们集体想拼什么?
当Kimi调用300个子Agent对世界杯赛事开展并行预测,当千问、豆包、元宝争先恐后地给出各自的夺冠热门队伍时,这场看似娱乐化的"AI押注战"背后,AI大模型厂商究竟想"秀"什么?又在集体"卷"什么?
“在本轮由大模型预测世界杯冠军的事件中,其本质是生成式AI从基础问答工具向公共事件运营平台演进的一个典型样本。”王岩向每经记者解释道,公众所直观感受到的是关于冠军归属的预测活动,而企业所实际展示的则是Agent协同调度、长上下文理解、实时信息检索、概率结果解释以及高并发服务处理等综合能力;从商业竞争维度来看,各家企业真正竞逐的是用户时长的占用、潜在付费场景的转化以及面向资本市场的故事叙事。
Kimi月之暗面公众号

在当前阶段,人工智能大模型之间的竞争重点已经不仅仅局限于参数规模的对比。行业的关注点正逐步从基础对话能力的展示,转向对实际问题解决能力的评估;从对单一模型性能的比较,演变为对多元化应用场景的挖掘。然而,这种行业趋势与实际的落地状况之间,依然存在着显著的差距。根据《Build for the Future 2025》全球研究报告对1250多家企业的调研结果,仅有5%的公司成功将人工智能的价值进行了规模化应用。与此同时,Gartner机构提供的数据也表明,截至2025年底,在各类企业应用中,真正嵌入了人工智能代理(AI Agent)功能的产品占比依然不足5%。
胡延平观察到,大模型与智能体正经历从对话交互向任务执行、从预训练模式向持续学习范式、以及从依赖静态语料向持续进行多维度现实感知的重要转变。他指出,诸如世界杯预测这类探索性项目,将有效推动上述技术演进过程。未来行动智能体所需构建的能力体系,也将沿着“感知-交互-决策-协同”的路径持续发展。
不过,王岩向《每日经济新闻》记者坦言指出,虽然世界杯预测可以作为检验Agent能力的公开压力测试,但这一活动本身并不能直接等同于Agent能力的自动提升。实际上,大模型在这场公开的预测活动中,主要训练和检验的是其在长任务组织、概率校准以及用户交互这几个特定维度上的能力。
“Kimi所部署的300个Agent,主要代表其分析覆盖面的扩展,这并不能直接等同于预测准确率的提升。相关针对Agent任务Token消耗的研究表明,对于同一任务,不同Agent所消耗的Token量可能相差数十倍,而更多的Token消耗并不必然带来更高的预测准确率。同样,相关的Prediction Arena研究亦指出,多个前沿模型在Kalshi真实预测市场长达57天的交易测试中,最终收益率介于-16.0%至-30.8%之间,研究的规模与最终结果之间并未显示出相关性。”王岩在面向《每日经济新闻》记者进行进一步分析时如此阐述道。
正如王岩所指出的那样,当前智能体(Agent)的最大能力缺口,正逐步从“是否能够制定出合理的计划”转变为“是否能够稳定地执行并完成长周期的真实任务”。这一转变意味着,哪家机构或企业能够率先将这种“实战能力”成功落地并应用于实际场景中,哪家就有可能在日趋激烈的市场竞争中脱颖而出。
免责声明:本篇文章所包含的内容及相关数据,仅供参考之用,并不作为任何决策的最终依据,亦不构成直接的投资建议。投资者依据文章所载内容进行决策所导致的任何后果,应由投资者本人自行承担。
|每日经济新闻 nbdnews 原创文章|

本声明旨在明确禁止以下行为:未经版权持有者明确许可,任何单位或个人不得对本文内容进行转载、摘编、复制、镜像或其他形式的使用。
来源:DeepSeek押宝法国队,Kimi看好阿根廷队,千问、豆包、元宝等支持西班牙队,AI大模型集体押注世界杯,谁最懂球? | 每日经济新闻