Liquid AI 开源混合专家模型 LFM2.5,端侧大模型迎来突破。

2026年05月29日 15:44
本文共计715个字,预计阅读时长3分钟。
来源/aibase 责编/爱力方

人工智能初创公司 Liquid AI 今日正式发布并开源了全新的端侧大模型LFM2.5-8B-A1B。该模型专为消费级硬件的工具调用和复杂指令遵循而设计,在保持极低计算成本的同时,显著提升了端侧设备的推理与推理性能。

在架构上,该模型采用了稀疏混合专家(MoE)设计,总参数量为 8.3B。得益于这种稀疏性,模型在每个 Token 生成时仅激活 1.5B 参数,这使得它能够流畅地在手机及笔记本电脑等本地设备上运行。

image.png

长文本扩展与推理能力升级

相比前代产品,LFM2.5 将上下文窗口从 32K 大幅扩展至 128K 词元,预训练数据量也从 12T 提升至 38T。作为一款纯推理模型,它会在输出最终答案前生成显式的思维链,且其高压缩率的词表能更高效地处理中文、阿拉伯文等九种语言。

为了解决长推理中的逻辑死循环与幻觉问题,开发团队在训练中引入了两阶段强化学习(RL)。其中,偏好优化有效减少了长链路推理中的“死循环”,而专门的防幻觉奖励机制则让模型在面对超出知识库的问题时能够主动拒绝回答。

端侧性能强劲与生态全面兼容

在性能表现上,LFM2.5 实现了爆发式增长,其在逻辑推理与反幻觉基准测试中的得分大幅超越前代,甚至在指令遵循上媲美更大参数量的模型。在工具调用方面,模型默认输出高效的 Python 函数调用,并支持在系统提示词中无缝切换为 JSON 格式。

该模型在发布首日便获得了主流推理生态的全面支持,包括 llama.cpp、MLX、vLLM 和 SGLang。在硬件实测中,它在 M5 Max 芯片上的解码速度高达每秒 253 字节,而在手机端也能达到每秒约 30 字节,完美兼顾了端侧运行的私密性与高效率。

来源:端侧大模型迎突破!Liquid AI 开源混合专家模型 LFM2.5 | AIbase

声明:本文来自aibase,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/