大模型公司上影节竞争活跃,智象未来联合创始人王科对话:过去三年我们“隐形”,现在我们将适当走到台前但节奏仍然克制

2026年06月17日 20:37
本文共计12141个字,预计阅读时长41分钟。
来源/每日经济新闻 责编/Zhuangdian 妆点人生

智象未来作为一家专注于大模型的公司,自成立以来历经三年多时间,营业收入实现了迅速增长。在文本生成图像(通常简称为文生图)领域,该公司已成功超越谷歌,目前在全球范围内排名仅次于OpenAI。公司的业务重心主要面向企业端(To B),聚焦于多模态生成式人工智能方向,并且首创了UiT架构。公司联合创始人兼首席运营官王科在接受每经记者专访时指出,这种爆发式的增长主要得益于当前人工智能应用浪潮的推动,以及中国在影视文化生态方面所具备的优势。王科进一步认为,大型模型的最终格局并不会呈现“赢家通吃”的局面,真正的核心壁垒在于其所构建的服务生态。

每经记者|丁舟洋  舒冬妮    
每经编辑|黄博文

7亿元的营业收入与超过46亿元的亏损,以及超过6200亿元的市值,在这些看似悬殊的数据背后,可以理解为市场对于“大模型第一股”智谱华章所预留的成长空间,这同时也反映了当前资本对于人工智能(AI)这一技术领域的集中看好。

“当风口来了的时候,我们也不要吝惜自己的子弹。”在6月中旬举办的第28届上海国际电影节上,另一家势头强劲的大模型公司“智象未来”的联合创始人兼首席运营官王科,在接受《每日经济新闻》记者(简称“NBD”)的专访时,表达了这样一句观点。这家成立三年有余的大模型公司,在2025年实现了全年营收过亿元,并在2026年继续保持迅猛的增长态势。

王科出席“2026影视产业海上论坛” 图片来源:主办方供图

在6月公开发布的全球第三方文生图评测榜单中,智象未来的商用图像模型(HiDream-O1-Image-1.5)获得了位居全球第三的综合评分,该成绩成功超越了谷歌的同类模型,并且仅次于OpenAI的两款模型。与此同时,依托这套全模态架构所延伸出的AI视频生成能力,正是该公司能够得以切入商业营销、影视制作及社媒内容创作等多个赛道,并持续拉动业务增长的核心支点。

在当前国内的各大影视节展上,视觉类AI大模型厂商表现活跃:Minimax与上影节合作推出了AI影视工作坊,快手的“可灵”以及字节跳动的“Seedance”则主动与上、下游的影视企业展开对接。这一现象背后存在清晰的逻辑链条:在大模型研发所需的高昂投入与激烈竞争中,影视赛道被各家视为实现商业变现、跑通商业闭环的核心抓手。

“图像作为连接现实世界与数字模型的桥梁,是通往世界模型、并使大模型能够理解真实物理世界规律的关键通道,这方面它势必会成为各大技术团队进行竞争的核心战场。”王科指出。

6月10日,智象未来的模型在Artificial Analysis——这是一个全球知名的独立AI模型评测与分析平台——发布的文生图榜单中,成功取得了总榜第三、国内第一的优异成绩。这一成就标志着中国公司能够借助极少的训练算力,通过采用全新的UiT架构(即统一原生全模态架构)以及算法突破,从而达到世界领先的技术水平。正如王科所指出的,这体现了中国大模型企业跳出了“大力出奇迹”的行业惯性,依托底层架构的迭代创新,走出了独有的技术路径。

NBD: 智象未来在"硬科技圈"中已成为风头正劲的关注对象,仅4月和5月完成的两轮融资合计便突破了6亿元。作为一家C端用户尚不熟悉的公司,贵方这家大模型企业缘何能够获得投资人如此高度的青睐?

梅涛院士作为公司的首席执行官,拥有加拿大工程院外籍院士的身份,并在人工智能视觉与多模态领域已经进行了近二十年的深入研发,是该领域内最为权威的科学家之一。公司首创并自主研发的UiT架构,是区别于OpenAI、Google以及国内多数视频厂商所采用的DiT(扩散模型)路线的核心技术底座。该架构的设计核心在于适配世界模型,旨在让人工智能能够统一地理解文字、图片、视频以及空间物理信息。正是这一架构,使得技术路径得以脱离对“大力出奇迹”模式的依赖,并能够通过算法的持续迭代,借助极少的算力资源实现大模型的性能突破。团队认为,这正是用以突破当前技术天花板的关键架构。

其次,公司于2023年成立之初,便将业务重心确立在多模态生成式人工智能领域。恰逢那一年,大语言模型ChatGPT横空出世,普遍被视为生成式大模型时代的开端。三位创始人因此产生了一种强烈的使命感,他们认为多模态技术的“ChatGPT时刻”理应由他们来推动实现。基于这一共识,团队得以迅速组建并开启创业进程。在当时的市场环境中,主流关注焦点仍集中于大语言模型,押注多模态方向的企业寥寥无几。因此,当时间来到2024年多模态成为全行业焦点时,该公司实际上已经率先发展了一年。

智象未来所提出的原生全模态模型架构(UiT) 图片来源:企业供图

NBD: 为什么你们在大众领域有些“隐身”?

智象未来之所以能够成为一家以To B端业务为核心的大模型公司,其背后有着十分重要的战略考量。事实上,在创业初期,几位创始人曾就究竟是选择To B还是To C的路径进行过反复探讨。在尝试了多种可能性之后,团队最终回归到了“第一性原理”进行思考:生成式人工智能本质上是一场生产力革命,应当首先从供给侧着手,通过实现降本增效与质量提升来创造价值。在这一逻辑下,To B模式能够最直接地完成价值变现,并为客户提供切实的商业回报。相比之下,To C业务的底层逻辑依然属于流量生意,其产生的大部分利润被流量平台所获取,而当前阶段的人工智能技术尚难以颠覆这种由流量寡头主导的商业模式。因此,基于以上清晰的分析,公司最终决定将战略重心稳固地聚焦于To B领域。

在C端业务方面,公司虽然有所布局,但主要依赖自然流量来获取用户,而非投入大量资金进行流量采买。这一策略的核心目的在于,通过自然积累的用户群体来收集宝贵的反馈数据,从而有效反哺模型的持续迭代与优化。目前,这一C端产品已经积累了约5000万的用户规模。相较于直接的商业收入,这些用户所产生的数据反馈被公司视为更为关键的资产。公司方面认为,只有当未来的流量平台分发模式发生根本性改变时,C端市场才可能真正转变为核心战场。回顾过去三年,公司选择保持“隐形”状态,其原因是将战略重心置于深度服务B端客户、不制造市场焦虑、不盲目追逐行业热点。随着近期在权威榜单上取得优异成绩以及业务层面的显著增长,公司预计将会适度提升其公开的能见度,但整个过程仍将保持审慎和克制的节奏。

由于图像在多模态理解中扮演着关键角色,图像驱动的全模态模型必然会成为各方竞争的核心焦点。

用“日新月异”乃至更迭的表述,或许仍不足以精确描绘当下大模型领域的竞争格局。各大厂商一方面在技术研发上持续加码投入,另一方面则在积极探寻商业化落地的具体窗口。在此背景下,AI短剧与AI影视工具已然成为大模型企业竞相争夺的战略要地。智象未来联合创始人王科透露,近期已有一家专业短剧工作室整体并入公司。其考量并非直接着眼于短期收益,而是旨在系统性地拆解与吸收短剧创作与制作过程中,那些难以标准化但至关重要的所谓“know-how”的技术诀窍。

NBD:今年字节跳动的Seedance2.0发布后,AI短剧的大规模生产已经迅速成为现实,而第一个打出视频类大模型旗号的Sora却已悄然退场。对于这一现象,你怎么看?

王科: 字节具备充足的财力、丰富的数据资源以及较高的人才密度,基于红果和抖音的实际应用场景,针对中国社交媒体与短剧生态的特点,训练出了名为Seedance的大模型。该模型最为显著的特征,在于将影视导演所具备的若干核心能力融入了模型架构之中。从当前阶段来看,其在技术表现上已领先于多数国外视频类大模型。

然而,国外视频类大模型发展历程中的一个标志性事件,即为Sora的退场。尽管OpenAI为Sora投入了巨额研发成本,但行业内部的竞争已趋于白热化。同时,其现有用户多为从事娱乐内容创作的普通个体,这一用户群体的特性决定了其直接的盈利空间相当有限。此外,鉴于OpenAI本身已拥有极高的市场估值,资本市场随之对其业务增长提出了极为严苛的要求。因此,当Sora所在业务线未能展现出预期的增长势头时,OpenAI便会选择坚决地终止该项目。

这带来了一个关键警示:避免一味追求表面的新颖性或短暂的声量,也不必将所有优势与光环集于一身,而是应当扎实地对某个行业、特定场景乃至具体痛点形成透彻的理解。

NBD:展望未来,视频类模型赛道的核心竞争将聚焦于哪些维度?

在当前的市场格局中,王科指出,生成式人工智能的本质是一场深刻的生产力变革,其价值创造应首先从供给端入手,致力于实现降本增效与质量提升。基于这一第一性原理的思考,智象未来自成立之初便确立了以企业端(To B)为核心的业务重心。这一战略选择源于一个清晰的逻辑:相较于依赖流量分发的消费者端(To C)业务,To B模式能够更直接地完成价值变现,为客户提供切实的商业回报,从而更有效地驱动商业闭环的形成。在模型技术层面,王科认为,图像作为连接现实世界与数字模型的桥梁,是通往世界模型的关键通道,因此必然会成为各家技术团队竞争的核心战场。近期,智象未来的商用图像模型在全球第三方文生图评测中取得了优异成绩,其背后正是团队坚持底层架构创新,通过自研的UiT架构以较少的算力实现了性能突破的结果。

王科: 图像构成了所有视觉信息的入口,因此,我们将其命名为多模态大模型。在该领域中,中美科技公司将不可避免地展开竞争。图像最为典型的特征在于“一图胜千言”。与文字相比,图像所承载的信息量要大得多,且呈现方式更为直观。此外,图像是超越国界的,不存在语言沟通的障碍。基于上述两个特性,图像因此可以被视为通向未来世界模型的入口。

当前,公司正积极投身于这一竞争之中。智象未来已在文生图模型领域超越了Google,接下来将挑战OpenAI。可以预见,图像模型将必然作为视频模型的新起点。未来的视频应用,必须依托图像模型的能力,以搭建更强大的视频生成模型。最终目标是实现全模态,即任意模态输入与任意模态输出。

未来,如果希望抢占制高点,图像驱动的全模态模型必将成为竞争的焦点。相关公司希望在这次竞争中担当主力,并有信心打赢这场仗。

在6月发布的Artificial Analysis文生图榜单中,智象未来模型的综合评分已超越Google同类模型,位列第三
图片来源:企业供图

当风口来临之际,也不应当吝惜自身的资源投入。

创业进入第四年,承担市场开拓职责的王科日程安排得十分紧凑,用他的话来形容,便是“不是在见客户,就是在前往会面的途中”。这也解释了他为何在今年频繁亮相于网络视听大会、上海国际电影节等影视行业的关键活动之中,其目的在于拓展行业联系与业务机会。他回顾道,在前几年公司面临融资压力时,自己尚有许多感到沮丧或气馁的时刻;但到了今年,这种情绪已明显被冲淡。相反,他根本“没有时间沮丧”,心中更多的是一种因业务增长带来的积极前景所激发的兴奋感。

如今,他时常思考的是如何能够迅速地构建起一个完整的生态系统。随着业务的爆发式增长,团队看到了发展的希望;其心态可概括为:当机遇来临时,不应当吝惜资源,而应加大力度去获取用户并为其创造价值。

NBD:公开数据显示,智象未来的年营业收入已从2025年的约1亿元,跃升至2026年单季度即超越此数额的水平。这一显著的爆发式增长,其背后的核心驱动因素是什么?

王科:增长的爆发主要源于两个浪潮的叠加效应。第一个浪潮具体指的是今年春节前后AI应用“龙虾”的爆发。

第二个多模态浪潮的涌现则得益于中国在影视文化领域所形成的全产业链综合生态优势。中国庞大的人口基数为其提供了深厚的市场基础,并且中国的短视频普及率在全球范围内处于最高水平,为其奠定了庞大的用户基础;与此同时,短剧这一新兴形态的崛起,则从根本上重塑了中国观众的文化消费模式与习惯。

当视频模型的输出质量逼近实拍效果,观众已无法分辨内容来自AI生成还是传统拍摄时,影视与技术之间的行业界限就被打破了。这一技术突破始于2025年6月,"漫剧"成为首个爆发的内容形态。传统漫剧的制作需要设计师手绘原画、逐帧编排与渲染,工序繁琐且成本极高;而AI工具仅凭若干指令即可搭建完整的工作流,通过先生图后生视频或首尾帧控制等技术路线便可完成全链路制作。在盲测评估中,AI生成的画面与传统方式产出的成品已难以区分,但前者的制作成本仅为后者的五分之一甚至十分之一。

尽管该公司行事低调,但它成功抓住了市场发展机遇。

每经记者|丁舟洋 舒冬妮
每经编辑|黄博文

7亿元的营业收入与超过46亿元的亏损,以及超过6200亿元的市值,在这些看似悬殊的数据背后,可以理解为市场对于"大模型第一股"智谱华章所预留的成长空间,这同时也反映了当前资本对于人工智能(AI)这一技术领域的集中看好。

"当风口来了的时候,我们也不要吝惜自己的子弹。"在6月中旬举办的第28届上海国际电影节上,另一家势头强劲的大模型公司"智象未来"的联合创始人兼首席运营官王科,在接受《每日经济新闻》记者(简称"NBD")的专访时,表达了这样一句观点。这家成立三年有余的大模型公司,在2025年实现了全年营收过亿元,并在2026年继续保持迅猛的增长态势。

王科出席"2026影视产业海上论坛" 图片来源:主办方供图

在6月公开发布的全球第三方文生图评测榜单中,智象未来的商用图像模型(HiDream-O1-Image-1.5)获得了位居全球第三的综合评分,该成绩成功超越了谷歌的同类模型,并且仅次于OpenAI的两款模型。与此同时,依托这套全模态架构所延伸出的AI视频生成能力,正是该公司能够得以切入商业营销、影视制作及社媒内容创作等多个赛道,并持续拉动业务增长的核心支点。

在当前国内的各大影视节展上,视觉类AI大模型厂商表现活跃:Minimax与上影节合作推出了AI影视工作坊,快手的"可灵"以及字节跳动的"Seedance"则主动与上、下游的影视企业展开对接。这一现象背后存在清晰的逻辑链条:在大模型研发所需的高昂投入与激烈竞争中,影视赛道被各家视为实现商业变现、跑通商业闭环的核心抓手。

"图像作为连接现实世界与数字模型的桥梁,是通往世界模型、并使大模型能够理解真实物理世界规律的关键通道,这方面它势必会成为各大技术团队进行竞争的核心战场。"王科指出。

6月10日,智象未来的模型在Artificial Analysis——这是一个全球知名的独立AI模型评测与分析平台——发布的文生图榜单中,成功取得了总榜第三、国内第一的优异成绩。这一成就标志着中国公司能够借助极少的训练算力,通过采用全新的UiT架构(即统一原生全模态架构)以及算法突破,从而达到世界领先的技术水平。正如王科所指出的,这体现了中国大模型企业跳出了"大力出奇迹"的行业惯性,依托底层架构的迭代创新,走出了独有的技术路径。

NBD:智象未来在"硬科技圈"中已成为风头正劲的关注对象,仅4月和5月完成的两轮融资合计便突破了6亿元。作为一家C端用户尚不熟悉的公司,贵方这家大模型企业缘何能够获得投资人如此高度的青睐?

梅涛院士作为公司的首席执行官,拥有加拿大工程院外籍院士的身份,并在人工智能视觉与多模态领域已经进行了近二十年的深入研发,是该领域内最为权威的科学家之一。公司首创并自主研发的UiT架构,是区别于OpenAI、Google以及国内多数视频厂商所采用的DiT(扩散模型)路线的核心技术底座。该架构的设计核心在于适配世界模型,旨在让人工智能能够统一地理解文字、图片、视频以及空间物理信息。正是这一架构,使得技术路径得以脱离对"大力出奇迹"模式的依赖,并能够通过算法的持续迭代,借助极少的算力资源实现大模型的性能突破。团队认为,这正是用以突破当前技术天花板的关键架构。

其次,公司于2023年成立之初,便将业务重心确立在多模态生成式人工智能领域。恰逢那一年,大语言模型ChatGPT横空出世,普遍被视为生成式大模型时代的开端。三位创始人因此产生了一种强烈的使命感,他们认为多模态技术的"ChatGPT时刻"理应由他们来推动实现。基于这一共识,团队得以迅速组建并开启创业进程。在当时的市场环境中,主流关注焦点仍集中于大语言模型,押注多模态方向的企业寥寥无几。因此,当时间来到2024年多模态成为全行业焦点时,该公司实际上已经率先发展了一年。

智象未来所提出的原生全模态模型架构(UiT)图片来源:企业供图

智象未来之所以能够成为一家以To B端业务为核心的大模型公司,其背后有着十分重要的战略考量。事实上,在创业初期,几位创始人曾就究竟是选择To B还是To C的路径进行过反复探讨。在尝试了多种可能性之后,团队最终回归到了"第一性原理"进行思考:生成式人工智能本质上是一场生产力革命,应当首先从供给侧着手,通过实现降本增效与质量提升来创造价值。在这一逻辑下,To B模式能够最直接地完成价值变现,并为客户提供切实的商业回报。相比之下,To C业务的底层逻辑依然属于流量生意,其产生的大部分利润被流量平台所获取,而当前阶段的人工智能技术尚难以颠覆这种由流量寡头主导的商业模式。因此,基于以上清晰的分析,公司最终决定将战略重心稳固地聚焦于To B领域。

在C端业务方面,公司虽然有所布局,但主要依赖自然流量来获取用户,而非投入大量资金进行流量采买。这一策略的核心目的在于,通过自然积累的用户群体来收集宝贵的反馈数据,从而有效反哺模型的持续迭代与优化。目前,这一C端产品已经积累了约5000万的用户规模。相较于直接的商业收入,这些用户所产生的数据反馈被公司视为更为关键的资产。公司方面认为,只有当未来的流量平台分发模式发生根本性改变时,C端市场才可能真正转变为核心战场。回顾过去三年,公司选择保持"隐形"状态,其原因是将战略重心置于深度服务B端客户、不制造市场焦虑、不盲目追逐行业热点。随着近期在权威榜单上取得优异成绩以及业务层面的显著增长,公司预计将会适度提升其公开的能见度,但整个过程仍将保持审慎和克制的节奏。

由于图像在多模态理解中扮演着关键角色,图像驱动的全模态模型必然会成为各方竞争的核心焦点。

用"日新月异"乃至更迭的表述,或许仍不足以精确描绘当下大模型领域的竞争格局。各大厂商一方面在技术研发上持续加码投入,另一方面则在积极探寻商业化落地的具体窗口。在此背景下,AI短剧与AI影视工具已然成为大模型企业竞相争夺的战略要地。智象未来联合创始人王科透露,近期已有一家专业短剧工作室整体并入公司。其考量并非直接着眼于短期收益,而是旨在系统性地拆解与吸收短剧创作与制作过程中,那些难以标准化但至关重要的所谓"know-how"的技术诀窍。

NBD:今年字节跳动的Seedance2.0发布后,AI短剧的大规模生产已经迅速成为现实,而第一个打出视频类大模型旗号的Sora却已悄然退场。对于这一现象,你怎么看?

王科:字节具备充足的财力、丰富的数据资源以及较高的人才密度,基于红果和抖音的实际应用场景,针对中国社交媒体与短剧生态的特点,训练出了名为Seedance的大模型。该模型最为显著的特征,在于将影视导演所具备的若干核心能力融入了模型架构之中。从当前阶段来看,其在技术表现上已领先于多数国外视频类大模型。

然而,国外视频类大模型发展历程中的一个标志性事件,即为Sora的退场。尽管OpenAI为Sora投入了巨额研发成本,但行业内部的竞争已趋于白热化。同时,其现有用户多为从事娱乐内容创作的普通个体,这一用户群体的特性决定了其直接的盈利空间相当有限。此外,鉴于OpenAI本身已拥有极高的市场估值,资本市场随之对其业务增长提出了极为严苛的要求。因此,当Sora所在业务线未能展现出预期的增长势头时,OpenAI便会选择坚决地终止该项目。

这带来了一个关键警示:避免一味追求表面的新颖性或短暂的声量,也不必将所有优势与光环集于一身,而是应当扎实地对某个行业、特定场景乃至具体痛点形成透彻的理解。

NBD:展望未来,视频类模型赛道的核心竞争将聚焦于哪些维度?

在当前的市场格局中,王科指出,生成式人工智能的本质是一场深刻的生产力变革,其价值创造应首先从供给端入手,致力于实现降本增效与质量提升。基于这一第一性原理的思考,智象未来自成立之初便确立了以企业端(To B)为核心的业务重心。这一战略选择源于一个清晰的逻辑:相较于依赖流量分发的消费者端(To C)业务,To B模式能够更直接地完成价值变现,为客户提供切实的商业回报,从而更有效地驱动商业闭环的形成。在模型技术层面,王科认为,图像作为连接现实世界与数字模型的桥梁,是通往世界模型的关键通道,因此必然会成为各家技术团队竞争的核心战场。近期,智象未来的商用图像模型在全球第三方文生图评测中取得了优异成绩,其背后正是团队坚持底层架构创新,通过自研的UiT架构以较少的算力实现了性能突破的结果。

王科:图像构成了所有视觉信息的入口,因此,我们将其命名为多模态大模型。在该领域中,中美科技公司将不可避免地展开竞争。图像最为典型的特征在于"一图胜千言"。与文字相比,图像所承载的信息量要大得多,且呈现方式更为直观。此外,图像是超越国界的,不存在语言沟通的障碍。基于上述两个特性,图像因此可以被视为通向未来世界模型的入口。

当前,公司正积极投身于这一竞争之中。智象未来已在文生图模型领域超越了Google,接下来将挑战OpenAI。可以预见,图像模型将必然作为视频模型的新起点。未来的视频应用,必须依托图像模型的能力,以搭建更强大的视频生成模型。最终目标是实现全模态,即任意模态输入与任意模态输出。

未来,如果希望抢占制高点,图像驱动的全模态模型必将成为竞争的焦点。相关公司希望在这次竞争中担当主力,并有信心打赢这场仗。

在6月发布的Artificial Analysis文生图榜单中,智象未来模型的综合评分已超越Google同类模型,位列第三
图片来源:企业供图

当风口来临之际,也不应当吝惜自身的资源投入。

创业进入第四年,承担市场开拓职责的王科日程安排得十分紧凑,用他的话来形容,便是"不是在见客户,就是在前往会面的途中"。这也解释了他为何在今年频繁亮相于网络视听大会、上海国际电影节等影视行业的关键活动之中,其目的在于拓展行业联系与业务机会。他回顾道,在前几年公司面临融资压力时,自己尚有许多感到沮丧或气馁的时刻;但到了今年,这种情绪已明显被冲淡。相反,他根本"没有时间沮丧",心中更多的是一种因业务增长带来的积极前景所激发的兴奋感。

如今,他时常思考的是如何能够迅速地构建起一个完整的生态系统。随着业务的爆发式增长,团队看到了发展的希望;其心态可概括为:当机遇来临时,不应当吝惜资源,而应加大力度去获取用户并为其创造价值。

NBD:公开数据显示,智象未来的年营业收入已从2025年的约1亿元,跃升至2026年单季度即超越此数额的水平。这一显著的爆发式增长,其背后的核心驱动因素是什么?

王科:增长的爆发主要源于两个浪潮的叠加效应。第一个浪潮具体指的是今年春节前后AI应用"龙虾"的爆发。

第二个多模态浪潮的涌现则得益于中国在影视文化领域所形成的全产业链综合生态优势。中国庞大的人口基数为其提供了深厚的市场基础,并且中国的短视频普及率在全球范围内处于最高水平,为其奠定了庞大的用户基础;与此同时,短剧这一新兴形态的崛起,则从根本上重塑了中国观众的文化消费模式与习惯。

当视频模型的输出质量逼近实拍效果,观众已无法分辨内容来自AI生成还是传统拍摄时,影视与技术之间的行业界限就被打破了。这一技术突破始于2025年6月,"漫剧"成为首个爆发的内容形态。传统漫剧的制作需要设计师手绘原画、逐帧编排与渲染,工序繁琐且成本极高;而AI工具仅凭若干指令即可搭建完整的工作流,通过先生图后生视频或首尾帧控制等技术路线便可完成全链路制作。在盲测评估中,AI生成的画面与传统方式产出的成品已难以区分,但前者的制作成本仅为后者的五分之一甚至十分之一。

尽管该公司行事低调,但它成功抓住了市场发展机遇。

关于具体的市场占有率数据,目前很难给出一个确切的数字,因为当前的市场态势尚处于一个高速爆发的初期阶段。以红果平台为例,每天都有大量的AI短剧内容上线,尽管我们目前从这个庞大市场中获得的份额还相对有限,但这恰恰表明了其巨大的增长空间,因为我们的品牌与产品会随着市场的成熟而逐渐被更多用户熟知。更重要的是,AI短视频营销的整体市场体量,实际上是AI短剧的百倍之多。在这个规模更为庞大的AI短视频营销领域,我们的业务既为头部的电商平台提供服务,也全面覆盖了中小型的跨境商家以及线下的实体门店,同时还配备了软硬件一体化的综合性营销产品。

今年第一季度,签约收入已超越去年全年的总额。将尽力确保收入质量具备长期可持续性。同时,在市场风口来临时,也不会吝啬投入,会加大投入力度以获取用户,为用户创造更多价值。最终目标是在模型迭代、产品迭代以及用户信任这三个方面实现长期发展。

大模型的终局不会“赢家通吃”

智象未来的机构股东结构展现出了多元化的布局特征,这体现了公司在资本市场上的广泛吸引力与战略协同能力。其中,安徽省以及合肥市的系列国有产业基金进行了长期的投资加注,提供了稳定且持续的资金支持;同时,东方富海、深创投等一线创投机构也汇集于此,进一步增强了投资组合的多样性。科大讯飞与京东科技作为技术型企业,为公司提供了技术与产业方面的协同效应;而长江电影集团、华策影视等影视企业的相继入股,则为公司AI影视及短剧业务的落地带来了必要的内容资源与渠道支持。在战略性融资持续推进的过程中,公司的盈利问题也受到了业界的广泛关注。

人工智能驱动的视频生成模型技术实现了关键性突破,显著模糊了影视内容创作与底层技术之间的界限。这一变革在2025年6月前后以“漫剧”形式的集中涌现为标志性事件,其核心在于AI工具能够依据简单的文字指令,驱动生成包含分镜、画面与剪辑的完整制作流程。该流程将综合制作成本压缩至传统模式的五分之一乃至十分之一,并且在行业盲测中,其生成质量已难以与人工制作内容进行有效区分。在此背景下,智象未来公司凭借其自主研发的UiT统一多模态架构,已将其商用图像生成模型的全球综合排名提升至第三位,在特定基准上超越了包括Google在内的竞争产品。公司的战略重心明确地聚焦于面向企业的To B业务模式,旨在通过为影视、广告及营销等垂直行业提供显著的降本增效解决方案来实现商业价值变现。同时,其面向消费者的C端产品已积累了约5000万用户产生的反馈数据,为模型的持续迭代提供了宝贵的优化基础。当前行业竞争日趋激烈,能否在影视这一高价值赛道成功落地并实现规模化的商业变现,已成为考验各家企业核心能力的关键。此前OpenAI旗下Sora产品的退场也构成了一个警示,表明脱离行业实际需求的技术路线难以持续。推动行业增长的核心驱动力来自于AI应用场景的全面爆发以及中国独特的影视制作与分发生态优势,例如在2025年春节前后涌现的“龙虾”等AI原生应用,以及短剧这一内容形态所蕴含的巨大市场潜力。未来竞争的焦点预计将从单一的视频生成,转向由高精度图像生成能力所驱动的“全模态”模型,即能够处理并实现任意模态间的输入与输出转换。智象未来公司的明确目标正是构建并主导这一下一代技术范式,其实现路径将始终以扎实的技术创新与产业生态构建为双基石。

关于盈利问题,公司当然需要进行深入思考,这同时也是投资人在交流时经常提出的问题。如果将研发的投入成本计入总支出,那么公司在当前阶段肯定仍然处于亏损状态。然而,公司仍然愿意持续投入资源,这是因为公司具备相应的能力与使命感,以在这场竞争中取得胜利。

NBD:我们想进一步了解,高性能AI芯片的供应问题,在当前阶段是否依然构成对中国大模型公司发展的一个关键性制约因素?

王科: 客观而言确实如此。若存在芯片供应不足的情况,训练速度会相对迟缓。

NBD: 此前你们提及在模型构建中引入了超过2000亿参数的规模,这一技术规格具体意味着什么?是否存在技术增强导致亏损速度加快的情况?

从技术层面来说,训练一个拥有2000亿参数的模型并非单纯增加计算资源就能实现;随着参数规模的扩大,模型的训练过程可能变得不稳定,甚至导致性能崩溃。现有行业信息显示,目前全球范围内能够成功运用2000亿参数规模进行训练且保证模型稳定运行的机构屈指可数,而我们正是其中仅有的两家公司之一。这一成就高度依赖于卓越的算法架构设计与高质量的数据处理能力。

算力资源的消耗与模型参数规模的增长之间,并非呈现简单的线性关系。在此方面,团队保持了克制的态度,并未为了争夺“月度榜单”的领先地位而无节制地投入计算资源,转而采取了两到三个月完成一次重大版本迭代的稳健策略。

由此可以认为,“技术越强亏得越快”这一论断并不成立。技术的强大并不直接等同于资金消耗的增加,而是通过算法架构的优化、数据回流的效率以及算力使用的提升来具体体现。高达2000亿的参数规模并非面向客户的直接卖点,而是作为底层能力的坚实支撑。

关于一种市场观点,即认为大型语言模型的发展终局将呈现出“赢者通吃”的局面,其他企业最终会被迫走向合并或被收购的道路,对此可以展开分析如下。

我并不完全认同这种观点。AI技术的发展本质上体现了技术平权的趋势,理应呈现出多元共生的繁荣格局。包括Google、OpenAI、字节、阿里以及智谱在内的众多企业都在积极参与其中,基于各自的技术基因与发展战略进行探索,但并未掌握任何可以完全垄断市场的独家技术。因此,我认为“一家通吃”的局面出现的可能性不大,从当前的竞争态势来看,也尚未见到任何一家企业具备这样的绝对能力。唯一值得警惕的是,有的海外公司正试图通过垄断数据来建立竞争壁垒,例如在扫描文献典籍后销毁原始数据。我认为,这种做法是对人类知识遗产的不负责任,长期来看必将反噬其自身。真正的竞争壁垒在于服务于整个产业生态,只有当生态系统真正繁荣起来,才会形成难以逾越的整体性优势。

封面图片来源:主办方

来源:大模型公司都来上影节“抢生意”|对话智象未来联合创始人王科:过去三年我们“隐形”,现在我们会适当走到台前,但节奏仍然克制 | 每日经济新闻

声明:本文来自每日经济新闻,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。
0
TAGS: []

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/