谷歌联合英伟达发布开源模型DiffusionGemma,引入扩散机制单卡推理提速4倍

2026年06月11日 10:55
本文共计594个字,预计阅读时长2分钟。
来源/aibase 责编/TouziXiaohu 投资小狐

谷歌于2026年6月10日正式发布了实验性开源语言模型DiffusionGemma,打破了传统大模型逐字生成的自回归范式,首次将图像AI中的扩散机制引入文本生成领域。该模型通过从随机噪声中进行多次迭代优化,可实现一次性并行输出256个标记的词块。

QQ20260611-102527.jpg

在硬件效能上,通过英伟达的深度优化,模型在单GPU单用户模式下的运行速度比同类传统模型提升了近四倍。在H100显卡上处理单条请求时,其输出速度可达每秒1000个标记,即使在RTX5090等高端消费级显卡上也能突破每秒700个标记。

DiffusionGemma拥有260亿参数,依托混合专家(MoE)架构,单步激活参数仅为38亿。尽管在标准基准测试中,其文本生成质量与准确率略逊于传统的Gemma4系列模型,但其独特的“全块感知”能力打破了自回归模型只能向后推演的局限。由于所有标记在生成过程中可以相互引用,该模型在文本后补、代码填空、数独求解以及氨基酸序列等非线性、结构化数据处理任务中展现出显著优势。

QQ20260611-102535.jpg

目前,该模型权重已基于Apache2.0协议在Hugging Face开源,并全面兼容vLLM、MLX等主流推理框架。这一探索不仅打破了内存带宽对GPU算力的制约,也为未来AI在复杂逻辑及非线性文本生成任务上的应用开辟了全新的技术路径。

来源:谷歌联合英伟达发布开源模型DiffusionGemma:引入扩散机制,单卡推理提速4倍 | AIbase

声明:本文来自aibase,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/