Google发布Gemma412B开源模型,支持无编码器全模态,16GB内存笔记本可本地运行

2026年06月04日 11:24
本文共计725个字,预计阅读时长3分钟。
来源/aibase 责编/爱力方

Google日前正式发布全新开源大模型Gemma412B,标志着端侧全模态AI迎来突破性进展。该模型颠覆了传统多模态模型依赖视觉和音频外部编码器的复杂链路,创新性地采用“Unified”无编码器架构。

通过这一设计,文字、图像、音频及视频四种模态的原始数据得以直接输入同一个Transformer主干网络进行一体化处理,从根本上消除了因传统外挂“翻译”模块带来的显存占用与高延迟问题,实现了更接近原生的跨模态理解。

QQ20260604-091609.jpg

作为一款专为消费级硬件优化的端侧模型,Gemma412B在参数效率上表现惊人。在基准测试中,其跑分成绩直逼Google自家26B体量的大模型,而内存占用却不足其一半。模型具备256K Token的超长上下文窗口,支持超过140种语言,并内置强化逐步推理的Thinking模式与原生Function Calling能力。

在落地部署方面,该模型最低仅需16GB显存或统一内存即可流畅运行,经4-bit量化后更是可下探至8GB,其核心目标直指在普通笔记本上实现高效本地化运行。目前,Google AI Edge Gallery已正式从手机端扩展至桌面端,macOS用户下载安装即可本地激活Gemma412B。得益于内置的沙盒Python环境以及支持语音交互的Eloquent系统,用户已能在聊天界面中直接执行代码、绘制图表并进行流畅的语音对齐交互。

业内分析认为,Gemma412B的推出进一步加速了AI去中心化的进程。其极高的性能密度与端侧亲和力,不仅打破了云端算力的桎梏,也为未来兼顾低延迟与隐私安全的端侧全模态个人助理应用铺平了技术道路。

来源:Google发布Gemma412B开源模型:主打无编码器全模态,16GB内存笔记本可本地运行 | AIbase

声明:本文来自aibase,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/