资讯

英伟达开源双塔AI模型，文本生成速度提升2.42倍，画质保留98.7%

2026年07月03日 16:06

本文共计554个字，预计阅读时长2分钟。

来源/aibase 责编/MoRanShiguang 墨染时光

英伟达 7 月 2 日推出 Nemotron-Labs-TwoTower 离散扩散语言模型，旨在解决大模型逐一生成 Token 速度慢的痛点，相关权重已在 Huggingface 开源。模型基于现有 Nemotron 骨干网络改造，复用预训练权重，无需从零完整训练，大幅降低开发成本。

60B 双塔架构，分工并行提升生成效率

模型总参数量 60B，拆分为两座 30B 独立神经网络协同工作，每塔激活 3B 参数，搭载 128 个可路由专家模块。上下文塔固定冻结，负责留存全文语义信息；去噪塔专门训练，依靠扩散机制并行生成文本，两塔通过交叉注意力互通数据。

传统模型逐 Token 串行输出，双塔架构可并行写入文本，大幅拉高推理吞吐量，兼顾速度与输出效果。多类基准测试数据显示，模型综合能力保留原版 98.7% 水准，文本生成吞吐速度直接提升 2.42 倍，仅代码、数学类任务小幅下滑。

开源落地，适配多场景推理部署

该模型采用英伟达专属开源协议开放权重，开发者可自由下载测试、商用部署。运行需搭配双张 H100 或 A100 80GB 显卡，单卡仅支持纯自回归模式，双塔完整推理需双卡协同。测试覆盖常识、数学、代码、阅读理解等多项任务，多数指标与原版基本持平，平衡了生成速度与内容质量。

来源：英伟达双塔 AI 模型开源发布，文本生成速度提升 2.42 倍、画质保留 98.7% | AIbase

声明：本文来自aibase，版权归作者所有。文章内容仅代表作者独立观点，不代表爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

TAGS: 英伟达开源 Nemotron 双塔模型离散扩散文本生成加速

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

匿名

2026-06-09

·

846 浏览
LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

匿名

2026-06-26

·

790 浏览
通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

匿名

2026-06-18

·

788 浏览
富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

匿名

2026-06-26

·

612 浏览
世界模型到底在建模什么

匿名

2026-06-29

·

560 浏览
余承东发声，鸿蒙智能将迈向Agent时代

匿名

2026-06-12

·

543 浏览

通知

尊敬的用户

user

资讯

英伟达开源双塔AI模型，文本生成速度提升2.42倍，画质保留98.7%

英伟达开源双塔AI模型，文本生成速度提升2.42倍，画质保留98.7%

60B 双塔架构，分工并行提升生成效率

开源落地，适配多场景推理部署

相关图文

英伟达发布Nemotron-Labs-TwoTower扩散语言模型性能提升超两倍

英伟达推出新一代多模态模型，智能体效率提升九倍

英伟达发布多模态全能模型，称智能体效率提升至竞品9倍

英伟达推出Nemotron 3系列开源模型推理效率提升5倍

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

世界模型到底在建模什么

余承东发声，鸿蒙智能将迈向Agent时代

快讯

字节豆包 AI 手机项目生变：硬件负责人离职，项目进入调整期

三大指数冲高回落小幅收红，机器人产业链全线爆发，半导体材料概念股集体调整

电商数据泄露、“水军”恶评、AI小作文，警方披露幕后黑手

AI智能体Elements Claw成功实现超导材料研发闭环

AI研究驶入“自动驾驶”时代：杨植麟详解大模型训练第三阶段

日本企业押注AI工业机器人以与中国和欧洲竞争

74元3小时叫机器人来家里干活：一年烧几百亿的具身智能刚落地

中大伟业（北京）科技有限公司以“文旅AI操作系统”破局万亿文旅产业大生态

小微即将上线，AI时代微信生态稳了吗？

英伟达开源双塔AI模型，文本生成速度提升2.42倍，画质保留98.7%

推荐专栏

爱力方

机器人大讲堂

下一篇

user

资讯

英伟达开源双塔AI模型，文本生成速度提升2.42倍，画质保留98.7%

英伟达开源双塔AI模型，文本生成速度提升2.42倍，画质保留98.7%

60B 双塔架构，分工并行提升生成效率

开源落地，适配多场景推理部署

相关图文

英伟达发布Nemotron-Labs-TwoTower扩散语言模型 性能提升超两倍

英伟达推出新一代多模态模型，智能体效率提升九倍

英伟达发布多模态全能模型，称智能体效率提升至竞品9倍

英伟达推出Nemotron 3系列开源模型 推理效率提升5倍

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

世界模型到底在建模什么

余承东发声，鸿蒙智能将迈向Agent时代

快讯

字节豆包 AI 手机项目生变：硬件负责人离职，项目进入调整期

三大指数冲高回落小幅收红，机器人产业链全线爆发，半导体材料概念股集体调整

电商数据泄露、“水军”恶评、AI小作文，警方披露幕后黑手

AI智能体Elements Claw成功实现超导材料研发闭环

AI研究驶入“自动驾驶”时代：杨植麟详解大模型训练第三阶段

日本企业押注AI工业机器人以与中国和欧洲竞争

74元3小时叫机器人来家里干活：一年烧几百亿的具身智能刚落地

中大伟业（北京）科技有限公司以“文旅AI操作系统”破局万亿文旅产业大生态

小微即将上线，AI时代微信生态稳了吗？

英伟达开源双塔AI模型，文本生成速度提升2.42倍，画质保留98.7%

推荐专栏

爱力方

机器人大讲堂

下一篇

英伟达发布Nemotron-Labs-TwoTower扩散语言模型性能提升超两倍

英伟达推出Nemotron 3系列开源模型推理效率提升5倍