资讯

谷歌联合英伟达发布开源模型DiffusionGemma，引入扩散机制单卡推理提速4倍

2026年06月11日 10:55

本文共计594个字，预计阅读时长2分钟。

来源/aibase 责编/TouziXiaohu 投资小狐

谷歌于2026年6月10日正式发布了实验性开源语言模型DiffusionGemma，打破了传统大模型逐字生成的自回归范式，首次将图像AI中的扩散机制引入文本生成领域。该模型通过从随机噪声中进行多次迭代优化，可实现一次性并行输出256个标记的词块。

在硬件效能上，通过英伟达的深度优化，模型在单GPU单用户模式下的运行速度比同类传统模型提升了近四倍。在H100显卡上处理单条请求时，其输出速度可达每秒1000个标记，即使在RTX5090等高端消费级显卡上也能突破每秒700个标记。

DiffusionGemma拥有260亿参数，依托混合专家（MoE）架构，单步激活参数仅为38亿。尽管在标准基准测试中，其文本生成质量与准确率略逊于传统的Gemma4系列模型，但其独特的“全块感知”能力打破了自回归模型只能向后推演的局限。由于所有标记在生成过程中可以相互引用，该模型在文本后补、代码填空、数独求解以及氨基酸序列等非线性、结构化数据处理任务中展现出显著优势。

目前，该模型权重已基于Apache2.0协议在Hugging Face开源，并全面兼容vLLM、MLX等主流推理框架。这一探索不仅打破了内存带宽对GPU算力的制约，也为未来AI在复杂逻辑及非线性文本生成任务上的应用开辟了全新的技术路径。

来源：谷歌联合英伟达发布开源模型DiffusionGemma:引入扩散机制，单卡推理提速4倍 | AIbase

声明：本文来自aibase，版权归作者所有。文章内容仅代表作者独立观点，不代表爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

TAGS: DiffusionGemma 谷歌开源模型英伟达扩散机制 MoE模型

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

匿名

2026-06-09

·

846 浏览
LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

匿名

2026-06-26

·

790 浏览
通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

匿名

2026-06-18

·

788 浏览
富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

匿名

2026-06-26

·

612 浏览
世界模型到底在建模什么

匿名

2026-06-29

·

560 浏览
余承东发声，鸿蒙智能将迈向Agent时代

匿名

2026-06-12

·

543 浏览

通知

尊敬的用户

user

资讯

谷歌联合英伟达发布开源模型DiffusionGemma，引入扩散机制单卡推理提速4倍

谷歌联合英伟达发布开源模型DiffusionGemma，引入扩散机制单卡推理提速4倍

相关图文

黄仁勋穿过的黑色皮夹克将拍卖：有亲笔签名，预计成交价4万-6万美元（约27万-40万元人民币）

利好来袭！突然集体飙涨！英伟达、特斯拉传出大动作

英伟达发布Nemotron-Labs-TwoTower扩散语言模型性能提升超两倍

AI芯片独角兽Etched融资成功，估值升至50亿美元。

Anthropic发布Claude Sonnet 5，性能逼近Opus 4.8、价格降低60%；英伟达老款GPU RTX 3060重新在美上市

“大空头”伯里再次向AI宣战：不仅做空英伟达，还做空卡特彼勒

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

世界模型到底在建模什么

余承东发声，鸿蒙智能将迈向Agent时代

快讯

2026年豪华轿车市场盘点：智驾正成为新的分水岭

三星、SK海力士与英伟达、博通等签订9500亿美元芯片大单

GSMA大中华区总裁斯寒：亚太已成为全球AI创新试验场，6G+AI将重构数字经济新范式

郑州普瑞眼科引进新一代机器人全飞秒VISUMAX 800及新微创全飞秒手术SMILE pro，实现1°散光精准矫正

Agent开辟算力新战场，CPU赛道呈现红绿蓝三足鼎立格局

阿里研究院人工智能治理中心主任傅宏宇：不能只看“价格战”表象，开源生态与敏捷治理将重塑AI产业格局

聚焦基础研究、人工智能、人民城市，上海这场重磅会议锚定关键方向

韩美科技巨头聚首旧金山，英伟达与Anthropic宣布达成大型协议

报道称英伟达与SK集团将共同推出价值超5000亿美元的AI计划

穆迪警告AI投资潮将冲击信用质量，科技巨头迈入重资产时代

推荐专栏

爱力方

机器人大讲堂

下一篇

user

资讯

谷歌联合英伟达发布开源模型DiffusionGemma，引入扩散机制单卡推理提速4倍

谷歌联合英伟达发布开源模型DiffusionGemma，引入扩散机制单卡推理提速4倍

相关图文

黄仁勋穿过的黑色皮夹克将拍卖：有亲笔签名，预计成交价4万-6万美元（约27万-40万元人民币）

利好来袭！突然集体飙涨！英伟达、特斯拉传出大动作

英伟达发布Nemotron-Labs-TwoTower扩散语言模型 性能提升超两倍

AI芯片独角兽Etched融资成功，估值升至50亿美元。

Anthropic发布Claude Sonnet 5，性能逼近Opus 4.8、价格降低60%；英伟达老款GPU RTX 3060重新在美上市

“大空头”伯里再次向AI宣战：不仅做空英伟达，还做空卡特彼勒

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

世界模型到底在建模什么

余承东发声，鸿蒙智能将迈向Agent时代

快讯

2026年豪华轿车市场盘点：智驾正成为新的分水岭

三星、SK海力士与英伟达、博通等签订9500亿美元芯片大单

GSMA大中华区总裁斯寒：亚太已成为全球AI创新试验场，6G+AI将重构数字经济新范式

郑州普瑞眼科引进新一代机器人全飞秒VISUMAX 800及新微创全飞秒手术SMILE pro，实现1°散光精准矫正

Agent开辟算力新战场，CPU赛道呈现红绿蓝三足鼎立格局

阿里研究院人工智能治理中心主任傅宏宇：不能只看“价格战”表象，开源生态与敏捷治理将重塑AI产业格局

聚焦基础研究、人工智能、人民城市，上海这场重磅会议锚定关键方向

韩美科技巨头聚首旧金山，英伟达与Anthropic宣布达成大型协议

报道称英伟达与SK集团将共同推出价值超5000亿美元的AI计划

穆迪警告AI投资潮将冲击信用质量，科技巨头迈入重资产时代

推荐专栏

爱力方

机器人大讲堂

下一篇

英伟达发布Nemotron-Labs-TwoTower扩散语言模型性能提升超两倍