中国团队重新定义计算机:让矩阵归模拟,让逻辑归数字

2026年06月10日 16:16
本文共计4136个字,预计阅读时长14分钟。
来源/互联网 责编/Zhuangdian 妆点人生

让矩阵回归模拟,让逻辑回归数字!这支中国团队重新定义了计算机

黄仁勋那边需要推演一万步,这家公司的芯片却只需走完一步

 

henry 发自 凹非寺

量子位 | 公众号 QbitAI

黄仁勋的GPU在求解一道矩阵方程时,往往需要进行上亿次乘法运算。

一家中国公司借助模拟计算,一步就把问题解开了。

这家公司叫 安纳智芯 (Anatrix)。

过去几年里,整个AI行业几乎都在朝着同一个方向持续狂奔。无论是GPU、TPU、LPU还是CPU,大家反复角逐的本质,其实始终仍然是数字计算:

更多的晶体管、更先进的制程工艺、更大的带宽以及更高的吞吐能力。

 

但就在最近,人们逐渐发现,有一批公司已经开始不再沿着这套既有逻辑继续前行。

安纳就是其中之一。

他们所选定的,是一个已经沉寂许久、却在这两年间重新升温的方向:

模拟计算 。

这个概念听着新,其实一点都不新。

早在数字计算机尚未实现大规模普及之前,人类就已经开始对模拟计算进行研究。最近较受关注的存算一体、光计算、量子计算以及类脑芯片,如果从更宏观的角度来看,其本质上也都归属于这一技术路线。

之所以在这两年间再次进入人们的视野,其中一个极为关键的原因在于:

模拟计算天然具备更高的并行度以及更低的功耗,同时也不像数字芯片那样会高度依赖先进制程。

但它所面临的问题同样十分明显,数字计算在本质上处理的其实是0和1,只要能够对高低电平加以区分,误差就可以被持续校正。

而传统模拟计算由于直接借助物理信号来表征信息,电压、电流以及电导等物理量在传播过程中,往往更容易出现噪声积累与信号漂移。

矩阵规模越大,误差放大得越夸张。

在过去几十年间,数字计算依赖于摩尔定律持续推进,计算精度也被不断地“硬堆”上去;而模拟计算虽然在理论上具备更高的效率,却始终受困于精度方面的问题。

行业内甚至长期存在一种相当流行的看法:模拟计算虽然速度很快、功耗很低,但始终缺乏足够的可信性。也正因如此,精度问题便逐渐演变成模拟计算在过去几十年间始终难以解开的最大症结。

而安纳做的,就是把它解开。

模拟计算的精度,不再是问题了

过去近十年间,安纳的核心科学家始终都在围绕同一件事情持续推进——

把模拟计算的结果,做得足够可信。

去年,团队完成了精度可与数字芯片相当的原理性验证,使模拟计算在这一领域形成了明显领先,而今年,相关芯片目前已经进入流片阶段。

在技术路线方面,安纳所走的是一条非常典型、但同时也非常“硬核”的模拟计算路线:

以存储器阵列为基础,搭建非冯诺依曼架构芯片。

简单来说,就是把矩阵方程直接映射到物理电路之中,让电路本身得以成为方程求解器。

输入给进去,测输出,输出就是解。

也正因如此,那些GPU无法直接完成求解、只能依赖海量迭代来持续逼近的矩阵方程,在安纳这里,得以一步完成,并保持精确。

 

GPU在拿到一个512×512的矩阵方程之后,首先并不会对其进行“直接求解”。相反,它通常会先把这一问题拆解、转置并分解,再将其转化为海量的矩阵乘加运算,随后借助一轮又一轮的迭代过程,逐步逼近最终答案。整个求解流程,往往需要上亿次乘法运算。

但有意思的是。

即便精度方面的问题已经开始得到解决,但在今天,绝大多数从事模拟计算的公司,依然没有选用这条技术路径。

像Unconventional AI、Normal Computing以及EnCharge AI这类近两年最受关注的模拟计算创业公司,当前主打的方向依然集中在低功耗、存算一体或者特定场景加速。

值得注意的是,模拟计算正在重新进入资本市场的关注范围。到2025年底,主打低功耗模拟芯片的Unconventional AI在种子轮阶段,便获得了由Lightspeed Venture Partners以及a16z联合领投的4.75亿美元融资,估值接近45亿美元;专注热力学计算的Normal Computing于今年3月完成了由三星领投的5000万美元融资;而存算一体公司EnCharge AI在去年也完成了超过1亿美元的B轮融资。

这背后所对应的,其实是两种截然不同的研究哲学。

 

一种思路,是接受模拟计算本身存在误差,并在低精度条件之下,去寻找那些“足够可用”的应用场景。

另一种思路,则是先把精度推进到极限,再进一步讨论效率与成本。

安纳属于后者。

在与量子位交流的过程中,团队反复提到了一个观点:

几乎所有计算平台的发展历程,实际上都遵循着同一条路径:先把精度推进到极限,再依据具体场景的需求,进一步向下进行取舍。

数字计算同样遵循这一规律,在AI模型训练过程中,往往会先选用FP32,随后再逐步向下兼容FP16、INT8以及INT4。

如果在一开始就直接在低精度条件之下寻找“够用”,那么很多能力或许将始终没有机会得到验证。

从上世纪80年代末兴起的类脑计算,到此后出现的模拟神经网络,再到今天所讨论的存算一体,这类相似的技术叙事其实已经反复上演过很多次。

因此,有争议的并不是对精度的追求本身,而是在过去相当长的一段时间里,由于模拟计算精度偏低被视为一种固有特性,行业长期停留在这一认知层面,并由此产生了判断上的偏差,最终只能退而求其次。

而安纳率先完成了认知层面的突破,其真正想要推进的方向,就是把高精度模拟计算真正推向可用阶段。

当所有人都在做乘法时,安纳想把“除法”重新补回来

除去在精度问题上的取向差异,安纳与其他模拟计算公司的不同之处,还在于其选定了一条完全不同的技术方向:

矩阵求逆 。

今天从事模拟计算的公司,无论是存算一体、模拟CIM,还是各类类脑以及光计算路线,几乎都在围绕矩阵乘法展开。

这一点其实并不难理解,因为整个AI产业在本质上,都是建立在矩阵乘法这一基础之上的。

一方面,GPU本身就天然极其擅长对矩阵乘法进行处理;另一方面,大模型推理过程本身也几乎完全建立在矩阵乘法之上,因此

整个行业的思路都很自然——

既然模拟计算天然具备更低功耗以及更高并行度,那么完全可以把它用于替代一部分GPU所承担的矩阵乘法;但安纳并没有沿着这一路径推进,而是选定了更加第一性的矩阵求逆方向。

那么,矩阵乘法与矩阵求逆之间,究竟存在什么不同呢?

简单来说,矩阵乘法在本质上属于“知因求果”的过程。权重是已知的,参数也是已知的,在完成乘法与加法运算之后,最终便会得到结果。

而矩阵求逆则恰好相反。结果往往已经是已知的,但其中真正对应的参数、权重以及状态仍然处于未知状态,因此需要再反过来把它求解出来,也就是借助结果去反推出原因。

对应到大模型当中,这一点同样并不难理解:矩阵乘法更多对应的是推理过程,而矩阵求逆则更接近于训练过程。

因为训练在本质上,就是在输入与输出都已知的前提之下,再反过来去寻找其中最合适的参数。

需要指出的是,今天主流数字计算所采用的方式,依然是把原本应当直接求解的问题,转化为海量矩阵乘法运算,再借助持续迭代的过程逐步逼近答案。

 

事实上,矩阵求逆并不局限于大模型训练。在现实世界当中,那些真正困难的问题,很多在本质上其实都属于“逆问题”。

比如,机器人为什么会摔倒?自动驾驶如何从传感器数据当中还原真实状态?通信系统又如何从混杂信号之中恢复原始信息?

这些问题在底层所处理的,其实始终都是同一件事:借助结果去反推出原因。

而这,恰恰是GPU并不擅长处理的部分。因为在数字芯片体系之中,并不存在“原生矩阵求逆”这一算子,它在本质上的做法,其实是绕路完成求解。

先把一个求逆问题拆解开来,再将其转化为海量的矩阵乘法运算,随后借助持续不断的迭代过程,一轮一轮地逼近最终答案。

因此,GPU并不是在对问题进行“直接求解”,而是在借助持续迭代的方式“逐步逼近答案”,这也正是为什么,前文才会出现那个“一亿步”与“一步”之间的差别。

为了更清晰地理解这两者之间究竟存在怎样的差异,安纳还专门打了一个十分形象的比方。

比如,如果要建造长城,那么矩阵求逆就像“砖”一样;而数字芯片手里其实并没有砖,它所拥有的只有沙子、泥土以及原料。

因此,它需要先把泥料进行混合,再完成烧制与成型,最终才能得到一块砖,并依赖这块砖去建造长城。

而模拟计算芯片,则会直接把砖提供出来,不再需要从沙子开始着手。因此,这并不是“快一点”或者“省一点”的差别,而是计算范式本身存在不同。

一个是在不断迭代逼近。

一个则是原生求解。

安纳真正想做的,就是把这块已经缺失了很多年的“砖”,重新补回到体系之中。

让矩阵归模拟,让逻辑归数字

说到最后,一个极其现实的问题,仍然清楚地摆在面前:

模拟计算这块“砖”,究竟应当如何被嵌入到今天已经高度成熟的AI基础设施体系之中?

安纳给出的答案其实很简单:把矩阵交给模拟计算,把逻辑交给数字计算。

据了解,他们的模拟芯片在接口、数据格式以及互联方式等方面,均兼容现有GPU体系,因此可以直接接入当下已经实现scale的AI Infra以及算力中心。

更重要的是,它不依赖最先进制程。

当数字芯片仍然在3nm、2nm等节点上持续向物理极限逼近之时,模拟计算在某种意义上已经跳出了那一套“拼晶体管、拼工艺、拼堆叠”的竞争逻辑。

而一旦矩阵求逆这块“砖”被真正补回到体系之中,它所带来的变化,或许会比人们想象得更大。

机器学习中的优化问题、具身智能所涉及的实时运动控制、自动驾驶中的状态估计、6G通信里的信号恢复以及端侧AI的在线学习,这些系统背后在本质上都需要对矩阵方程进行高频求解。

过去,许多问题并非无法完成,而是在实际求解过程中往往过于缓慢、成本过高,并且能耗也过大。

而一旦矩阵求逆能够以原生、高精度以及低功耗的方式被完成,很多过去只能放在云端、只能离线训练、只能借助近似方式求解的事情,可能都会开始发生变化。

因此再回过头来看,安纳真正想做的,其实并不只是打造一颗“速度更快、功耗更低的芯片”。

他们真正希望切入的,是下一代智能系统在最底层所依赖的计算方式。

2012年,人们第一次意识到,GPU不仅具备图形渲染的能力,还可以被用于训练神经网络。

AI时代由此开启。

而在今天,安纳真正试图作出回应的,则是另一个问题:

如果说矩阵乘法定义了过去十年的AI发展路径,那么模拟计算以及矩阵求逆,是否会进一步定义下一代智能系统的底层计算方式?

至少在当下,他们已经站到了这个问题最前沿的位置。

来源:让矩阵归模拟,让逻辑归数字!这家中国团队重新定义了计算机 | 互联网

声明:本文来自互联网,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/