北京大学人工智能研讨院孙仲研讨员团队联合集成电路学院研讨团队,成功研制出根据阻变存储器的高精度、可扩展模仿矩阵核算芯片,初次完成了在精度上可与数字核算比美的模仿核算系统。
该芯片在求解大规划MIMO信号检测等要害科学问题时,核算吞吐量与能效较当时尖端数字处理器(GPU)进步百倍至千倍。相关论文于10月13日刊发于《天然·电子学》期刊。
关于大多数习惯了数字核算机(0和1)的大众而言,“模仿核算”是一个既陈旧又别致的概念,什么是模仿核算呢?
孙仲首先用生动的比方对其进行解说:“现在的一切芯片都是数字核算,数据都需求先转换成0和1的符号串。比方数字‘十’,需求转译成‘1’和‘0’,计为‘1010’。”假如用二进制来表明“1+1=2”,则应该记作“1+1=10”。
孙仲说,“而模仿核算则无需这层‘转译’,它是一种‘类比核算’(analogue computing),能够直接用接连的物理量(如电压、电流)来类比数学上的数字。比方,数学上的‘十’,能够直接用十伏或十毫伏的电压来表明。”
模仿核算机在核算机开展前期(上世纪30-60时代)曾被大范围的使用,但随着核算使命日益杂乱,其精度瓶颈凸显,逐步被数字核算替代。孙仲指出,此次研讨的中心正是要处理模仿核算“算禁绝”这一痛点。
当时的市面上的干流CPU和GPU都是数字芯片,并都选用冯诺依曼结构,将核算和存储功用分隔,通过01数字流的编译+核算+解码完成信息核算和传输。
根据阻变存储器的模仿核算的优势之一在于取消了“将数据转化为二进制数字流”这一进程,一起不用进行“进程性数据存储”,进而将数据核算进程与数据存储合而为一,完成算力解放。
孙仲指出,与其他“存算一体”计划比照,国内外许多团队集中于研讨矩阵乘法(AI推理的中心),而他的团队特征在于专心于更具挑战性的矩阵方程求解(AI二阶练习的中心)。矩阵求逆操作要求的核算精度极高,时刻杂乱度到达了立方级。而模仿核算凭仗物理规则直接运算的方法,具有低功耗、低推迟、高能效、高并行的天然优势,只需能不断下降核算误差,不断的进步核算精度,将为传统GPU的算力解放带来爆炸性打破。
在核算精度方面,团队在试验上成功完成16×16矩阵的24比特定点数精度求逆,矩阵方程求解通过10次迭代后,相对误差可低至10⁻⁷量级。在核算功能方面,在求解32×32矩阵求逆问题时,其算力已逾越高端GPU的单核功能;当问题规划扩展至128×128时,核算吞吐量更到达尖端数字处理器的1000倍以上,传统GPU干一天的活,这款芯片一分钟就能搞定。
关于使用远景,孙仲以为,模仿核算在未来AI范畴的定位是强壮的弥补,最大有或许快速落地的场景是核算智能范畴,如机器人和人工智能模型的练习。
谈及与现有核算架构的联系,孙仲着重未来将是互补共存:“CPU作为通用‘总指挥’因其老练与经济性而难以被筛选。GPU则专心于加快矩阵乘法核算。咱们的模仿核算芯片,旨在更高效地处理AI等范畴最耗能的矩阵逆运算,是对现有算力系统的有力弥补。”