腾讯云发布音视频AI品牌WAND,内置六大自研模型与60+项AI能力

2026年06月05日 16:48
本文共计740个字,预计阅读时长3分钟。
来源/aibase 责编/爱力方

6月5日,在2026AI产业应用大会上,腾讯云音视频正式发布AI原生能力底座WAND。 依托超过20年的技术积累,腾讯云音视频此次从底层模型、媒体能力到接入方式进行全面升级,音视频媒体AI能力将以Agent-Native模式向行业开放,实现了从提供单点媒体处理能力向面向AI应用与Agent的原生媒体底座的战略升级。

image.png

WAND架构由模型引擎、能力层和场景方案三层构成,包含编解码、增强、擦除、生成、理解、音频六大自研媒体专用模型,补充了主流生成式大模型在媒体生产流程中的不足。能力层则将60+项媒体AI能力按生成、理解、处理、编码重新组织,通过API、Agent预编排工作流(Agentic Workflow)和Skills三种模式开放,支持Agent端到端自动跑通整条链路,无需切换工具。

image.png

WAND能力架构图

在真实业务中,WAND展现出高适配与高效率优势。在电商应用中,WAND生成模型可针对不同品类定制处理策略,有效降低报错率并提升图片可用率。在短漫剧创作中,WAND将剧本生成、角色一致性保持等环节串联为自动链路,使平均生产效率提升90%,已服务国内80%以上的头部漫剧平台,其AI增强与无痕擦除技术更是双双荣获NAB Show2026年度产品奖。

此外,面对高并发、极低延迟要求的赛事直播场景,WAND通过自研模型协同调度,将识别、生成、合成、编码整合为全自动化流程,相较传统方案可节省超50%的码率,已累计支撑数千场全球顶级赛事。

作为连续11次保持中国及出海市场份额第一的领跑者,腾讯云音视频此举正加速音视频能力成为可被Agent统一调度的生产级工具,全面赋能AI Agent时代的视听应用创新。

来源:腾讯云发布音视频 AI 品牌 WAND:内置六大自研模型与60+项AI能力 | AIbase

声明:本文来自aibase,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/