10月14日,据《科技日报》报道,我国科研团队成功研发出一款新型芯片,其算力可超越当前顶级gpu千倍以上,攻克了长期困扰模拟计算领域的世纪难题。
此次成果由北京大学人工智能研究院孙仲研究员团队联合集成电路学院研究团队共同完成,成功研制出基于阻变存储器的高精度、可扩展模拟矩阵计算芯片,首次构建出在计算精度上媲美数字系统的全模拟计算体系。
该芯片在处理大规模MIMO信号检测等关键任务时,展现出惊人的性能优势——计算吞吐量与能效相较现有高端数字处理器(如GPU)提升了百倍甚至上千倍。
相关研究成果已于10月13日发表于国际权威期刊《自然·电子学》。
诸如通信基站中的信号处理、AI大模型训练中的参数优化等问题,本质上都涉及求解复杂的矩阵方程。传统数字计算方式虽然精度高,但面对大规模矩阵求逆时,往往面临巨大的计算开销、高能耗和长时间延迟。
因此,一度被认为过时的模拟计算技术近年来重新受到关注。它利用物理器件本身的特性实现并行运算,具备天然的低延迟与低功耗优势,在算力需求持续攀升的当下显得尤为珍贵。
然而,如何让模拟计算同时实现高精度与可扩展性,使其真正适用于现代复杂计算任务,一直是全球科学家难以突破的核心瓶颈。
为此,孙仲团队另辟蹊径,采用融合创新策略,通过新型信息器件、原创电路设计与经典算法的协同优化,成功打造了一个基于阻变存储器阵列的全模拟矩阵方程求解系统,并首次将模拟计算的精度提升至24位定点数水平。
孙仲介绍,团队基于迭代机制,结合低精度模拟矩阵求逆与高精度模拟矩阵-向量乘法,提出了一种全新的全模拟高精度矩阵求解方案:先快速获得方程的“近似解”,再通过“位切片”技术进行多轮精细化修正。
实验结果显示,该芯片在求解16×16矩阵逆时,实现了24比特的定点精度;经过10次迭代后,矩阵方程求解的相对误差可降至10⁻⁷级别,达到实用化标准。

在性能方面表现更为突出:求解32×32矩阵求逆问题时,其算力已超过高端GPU单核性能;当规模扩大到128×128时,计算吞吐量更是达到顶级数字处理器的1000倍以上。 同时,在同等精度条件下,其能效比传统数字方案高出超100倍,为未来绿色高效数据中心提供了关键技术路径。
研究人员还将该芯片应用于“大规模MIMO信号检测”场景中,仅需三次迭代,恢复图像即与原始图像高度一致,误码率与32位数字计算结果相当,充分展现了其在实时通信信号处理中的巨大潜力。
“我们证明了模拟计算有能力以极高的效率和精度解决现代科学工程中的核心计算挑战。”孙仲表示。
他指出,这项突破具有广泛的应用前景,可赋能多种计算场景,有望彻底改变现有算力格局。该研究为突破数字计算的局限开辟了一条极具潜力的新路线,或将终结数字计算长期主导的局面,开启一个算力无处不在、绿色高效的全新时代。
以上就是首次!突破世纪难题 我国成功研制出新型芯片:算力达顶级GPU的1000倍以上的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号