大模型重塑视觉 AI,商汤获Gartner®认定为全球前沿技术创新者

2026年06月22日 14:57
本文共计3117个字,预计阅读时长11分钟。
来源/资讯中国 责编/LaosijiAming 老司机阿明

近日,Gartner发布了一份聚焦于“视觉AI”领域的专题报告(以下简称《报告》),题为《Emerging Tech: AI Vendor Race: Tech Innovators Shaping AI Vision Intelligence Solutions》。该报告深入探讨了生成式AI如何重构计算机视觉市场。该报告明确指出,下一代视觉智能的发展关键,在于将传统的计算机视觉能力与多模态基础模型、空间模型以及边缘原生架构相结合,从而实现更强的语义理解能力、实时推理能力与高可靠性的部署应用。

基于这一全球发展趋势,该报告甄选出了12家将在2026年引领生成式人工智能(GenAI)计算机视觉领域的技术创新机构。其中,商汤成功入围了“前沿技术创新者”类别,并与阿里巴巴共同构成了该类别中仅有的两家中国厂商。

此份来自国际权威机构的认可,是商汤科技继成功斩获IDC中国视觉AI市场十连冠之后,又获得的一项全球性肯定。对商汤科技而言,这份认可不仅代表着其作为视觉AI市场领跑者的地位,更标志着商汤是那个率先推动视觉AI从基础感知,向着具备“感知-理解-规划-执行”完整能力的视觉智能体进行演进的底层技术创新者。

借助多模态基础模型,实现对视觉AI技术范式的重构

作为中国视觉AI领域的早期开拓者之一,商汤一直致力于探索视觉智能技术的前沿。从专用视觉模型,到视觉语言模型,再到视觉语言动作模型,直至世界动作模型,商汤深度参与了视觉AI技术关键演进方向的发展历程,并持续推动着这一方向的演进。

图片1.jpg

在过去十年的发展历程当中,计算机视觉的核心价值主要体现在"看见"与"看懂"这两个层面。随着生成式AI以及空间智能技术的快速发展,全球视觉AI市场正在经历深刻的重塑过程,其价值边界早已突破了传统单一的图像与视频智能化分析范畴,逐步进化为连接物理世界与数字世界的重要智能入口,并加速在城市治理、企业运营、具身智能以及医疗健康等高价值场景当中实现落地应用。

对商汤而言,此次被甄选进入Gartner研究报告,代表着它并非仅仅是一家传统意义上的计算机视觉厂商。相反,它已成为一家基于全栈人工智能技术能力,率先推动将多模态基础模型应用于视觉AI底层技术创新的代表性企业之一。借助于算力、模型、平台以及实际场景应用四者的协同作用,商汤正在有力推动视觉AI技术范式,从基础的“识别”能力,向更高阶的“理解、规划与行动”综合智能体阶段演进。

商汤方舟 SenseFoundry 产品平台的核心价值,在于将十年来所积累的计算机视觉能力与多模态基础模型能力实现深度融合。这也是大模型时代视觉AI领域发生的关键转变之一。该平台将视觉专用模型演进至“通专融合”的智能体范式,旨在有效应对传统视觉业务所面临的场景泛化能力较弱、模型训练成本高昂等问题。目前,这一平台得以在多个业务领域的典型场景中广泛应用,从客户的实际部署与使用中验证了其技术价值。依托端到端的智能训练闭环机制,商汤方舟平台能够实现视觉模型的自动化研发、快速迭代以及轻量化部署,从而大幅降低了人工智能技术的落地应用门槛。

在全球智能体产业加速爆发的背景下,商汤方舟率先响应市场需求,完成了产品核心能力的系统性升级。此次升级以Agent技术与多模态能力为基石,推出了名为方舟数智(SenseFoundry Agents)的全新产品形态。该产品打通了从工具调用到业务执行的全流程链路,并凭借其多模态交互与自主任务规划能力,成功实现了平台定位的根本性跃迁,即从专注于“视觉感知的中台”,全面演进为支撑“数智化运营的中台”。

借助海内外市场的规模化落地应用,视觉AI技术正在不断加速其在例如安防监控、智慧城市、工业质检,以及自动驾驶等关键场景中的部署进程。这一发展趋势,正在有力驱动着视觉AI技术向着全域智能的方向持续演进。与传统的单一场景识别不同,全域智能追求的是在一个更大的范围,乃至整个环境当中,实现对视觉信息的综合感知、深层次理解与自主决策。在这一过程中,视觉AI在提升运行效率、降低部署成本,以及拓展应用边界等重要方面,展现出了巨大的潜力与价值。

技术创新的最终价值,在于其能否在真实世界的应用场景中得到有效验证。为此,Gartner报告将昆明人工智能赋能中心项目作为创新案例纳入了研究范畴。该项目成功构建了以“多模态大模型、智能视觉与大数据技术”为核心的人工智能赋能底座,对城市视频流信息与物联网资源实施了全面的整合,从而打通了“感知-决策-行动”的全业务闭环,有力支撑了各类政务场景实现深度的智能化落地。这一标杆性成果的取得,正是商汤将技术创新与实际场景落地能力紧密结合的集中体现。

商汤在计算机视觉领域已持续深耕长达十年之久,始终牢牢占据行业领先地位。如果说Gartner报告得以体现了商汤在下一代视觉AI底层技术方向上的创新能力,那么商汤在中国以及亚太市场所拥有的长期客户基础,则进一步充分证明了其不仅是一位底层技术创新者,更是一线应用创新者与产业落地先锋。

作为在长期产业实践中得以持续演进的智能平台,商汤方舟目前已在全国200余座城市中完成了规模化落地部署,为超过3万个园区、楼宇、网点及交通枢纽提供服务支撑,其算法每年的调用量达到400亿次以上。该平台的业务版图已全面贯穿城市治理、公共安全、应急管理、交通管控、企业安防以及商业运营等主流场景,逐步形成了成熟且稳定的商业化落地体系。从行业客户的实际需求出发,人工智能所具备的价值不仅源于技术能力本身,更依赖于系统能够长期稳定运行、持续开展优化迭代,并具备规模化复制与推广的能力。商汤在过去十余年间服务政企行业所积累的应对复杂场景的实践经验,以及所构建的覆盖项目建设、运营服务和持续升级环节的完整交付体系,共同构成了赢得客户长期信赖的重要基础。

基于国内成熟的技术体系与丰富的落地经验,商汤同步推进了其全球化布局的步伐,其业务已完成了对东南亚、东北亚以及中东等12个海外市场的覆盖,并实现了高达70%的海外客户复购率。由此,商汤构建了一套可复制、可规模化的中国AI出海范式,并搭建起了一整套完整的海外生态与服务体系。步入2026年,商汤的海外视觉AI业务以及客户需求,正在加速推进与多模态大模型的深度融合。这一变化意味着,视觉AI出海已从单纯的“中国技术复制到海外”模式,进一步迈向了“基于本地场景构建智能运营平台”的新阶段。

视觉AI领域正迎来新一轮的技术变革。此次报告的发布,进一步印证了视觉AI在生成式AI时代所具备的发展潜力与产业价值空间。商汤在过去十年间所沉淀的视觉AI核心技术能力与产业实践经验,正与多模态基础模型和智能体技术进行深度融合,持续推动视觉AI迈向新的发展周期。

Gartner,《Emerging Tech: AI Vendor Race: Tech Innovators Shaping AI Vision Intelligence Solutions》,2026年4月30日

Gartner并未在其研究报告中提供对任何供应商、产品或服务的支持,也未建议科技用户应当优先选择那些获得了最高评分或其他称号的供应商。Gartner的研究报告所陈述的观点,属于其研究与顾问组织的见解,相关意见不应被视为客观的事实陈述。就该研究报告而言,Gartner明确放弃了所有明示或默示的保证,其中涵盖了关于产品适销性或适用于特定用途的任何保证。

GARTNER 是 Gartner, Inc. 和/或其关联公司在美国以及国际范围内所持有的商标与服务标识,并经由正式许可在本文中予以引用。本文作者及发布方特此声明保留所有相关权利。

来源:大模型重塑视觉 AI,商汤获Gartner®认定为全球前沿技术创新者-资讯中国 | 资讯中国

声明:本文来自资讯中国,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/