中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术

来自国内的光电混合芯片技术,登上最新顶刊Nature

中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术

这次的成果主要聚焦在了自主研发的光子计算处理器——PACE(Photonic Arithmetic Computing Engine)。

简单来说,PACE是一种基于光电混合的架构,它通过光执行矩阵向量乘法,可以实现超低延迟和高能效的计算。

根据论文中公开的数据显示,PACE在解决组合优化问题(如伊辛问题和最大割/最小割问题)时,计算延迟低至3纳秒,比传统GPU快了两个数量级。

这一突破的核心在于PACE的高度集成设计

这个系统集成了超过16000个光子组件,并通过创新的2.5D混合先进封装技术,将光子集成电路(PIC)与电子集成电路(EIC)无缝集成。

这种设计不仅解决了大规模光电系统集成中的技术难题,更为商业化落地奠定了基础。

而这个芯片技术,正是来自国内初创企业曦智科技

据了解,这是继八年前曦智科技创始人沈亦晨博士在Nature发表封面论文后,再一次登上这一顶刊。

那么PACE如此的速度,到底是如何做到的呢?

首次公开:16000个光子组件的高度集成

随着人工智能的快速发展,计算需求呈爆发式增长,传统电子计算面临着功耗、速度等方面的瓶颈。

光子计算凭借光的独特性质,如同时进行乘法和累加过程、数据传输能耗低、避免电阻损耗和发热问题等,成为极具潜力的替代方案,受到全球广泛关注。

然而,光子计算在发展过程中面临诸多挑战。一方面,集成光子学制造相对不成熟,缺乏先进的封装解决方案,导致大规模集成光子系统在性能提升、标准设计与验证以及封装等方面困难重重。

另一方面,光子计算在光学存储、计算精度(尤其在大规模复杂电路中)以及适配模型和算法等方面存在不足,限制了其商业化进程。

为此,曦智科技提出的PACE采用混合架构(首次对外公开),将光子集成电路(PIC)和电子集成电路(EIC)集成在一个系统级封装(SiP)中。

中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术
△PACE系统部署

PIC 负责执行光矩阵向量乘法(oMAC)操作,EIC则处理控制、迭代逻辑、数据输入输出、存储以及时钟控制等功能。

这种架构设计充分发挥了光子计算在速度和低延迟方面的优势,以及电子计算在逻辑处理和存储方面的长处。

在PIC中,团队设计了1×64光学数据模块和64×64权重模块执行oMAC操作。

光信号通过高性能光栅耦合器从外部激光阵列耦合进入电路,经过向量调制器阵列和权重调制器模块进行调制,最后在光电探测器阵列进行信号转换和合并。

EIC基于28-nm商业CMOS技术设计,PIC则是基于65-nm硅光子技术构建,单个芯片集成了超过16000个光子组件,实现了高度集成。

这种混合架构充分发挥了光计算的并行优势:光信号在波导中传输时天然完成乘加运算(oMAC),而电子电路则处理逻辑控制与数据存储。

实验数据显示,64×64矩阵运算延迟仅3纳秒,比传统GPU快500倍

中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术

除此之外,研究团队创造性地将光学矩阵运算应用于组合优化问题。

通过设计”噪声驱动递归算法”,PACE系统能够高效求解伊辛模型:

中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术

在求解63节点Max-cut问题时,系统经过平均537次迭代(耗时2.7μs)即可达到92.7%的收敛率,相比NVIDIA A10 GPU提速295倍。

更引人注目的是”图像搜索”演示,系统能从随机初始状态收敛到预设的”猫”图像目标。

中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术

中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术

Nature审稿人对曦智科技团队在光子计算工程化方面作出的努力给予了高度肯定:

还全球首发了新一代光电计算卡

就在前不久的3月25日,曦智科技还正式推出全新一代光电混合计算卡 ——曦智天枢

中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术

曦智天枢深度融合了光芯片与电芯片的优势,采用先进的3D封装技术,是一款高度可编程的光电混合计算卡。

与前代产品相比,其在光电集成度、光子矩阵规模、计算精度及可编程性等方面均实现了显着提升。

它不仅支持科学计算(如伊辛算法),还增强了对ResNet50等商业算法的适配性,进一步拓宽了应用场景。

中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术

曦智天枢采用非相干架构设计,具备出色的抗干扰能力和高计算精度。

其核心处理器由光学处理单元(OPU)和电学专用集成电路(ASIC)组成,通过3D先进封装技术实现协同工作,主频速率达1GHz,输出精度为8bit。

光芯片面积提升至600平方毫米,器件数量超过四万个,集成度大幅提高。

此外,其最大支持128×128矩阵规模,运算能力和灵活性均得到显着增强。用户可通过API自由配置计算矩阵系数,实现更高效的优化与适配。

在软件方面,产品搭载了曦智光电混合计算软件栈,支持主流框架如PyTorch和ONNX,用户可通过曦智编译器灵活构建高效的应用模型。

不仅如此,平台还支持用户自定义算子,进一步扩展了算法开发的灵活性。

对此,沈亦晨博士表示:

参考链接:
https://www.nature.com/articles/s41586-025-08786-6

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/5401.html

(0)
人脑网的头像人脑网
上一篇 2025年4月14日 下午3:16
下一篇 2025年4月14日 下午3:16

相关推荐

  • 8招教你快速打造作品的『全栈设计感』

    你,也可以成为“UI+交互+用户体验+跨界设计”综合能力的设计师。

    2017年4月17日
    4024
  • 清华张亚勤:10年后,机器人将可能比人都多

    “10年后,机器人将可能比人都多,会陆续进入工厂、社会,最终形态是进入家庭。未来每个人、每个家庭都有机器人。” 这样的预言,来自清华大学智能产业研究院(AIR)院长张亚勤。 在其新书《智能涌现》中,基于数十年对AI的思考与实践,从他领导下AIR研究院正在推进的三大方向——多模态大模型、自动驾驶和生物智能出发,张亚勤还给出了更多对AI技术演进方向的长期预判,包…

    2025年4月21日
    2700
  • 速戳报名!最新AIGC峰会嘉宾在此,4月16日,来和大佬们一起AI

    4月16日,北京金茂万丽酒店,第三届中国AIGC产业峰会就要来啦!观众报名通道已开启 https://hdxu.cn/Arf5 今年峰会主题是「万物皆可AI」,我们看到随着基础模型的深入发展,更多的AI新产品、新物种正在涌现。 我们希望让更多的AI落地被看见,让更多人用上AI、用好AI,与AI一同加速成长。 为此,我们邀请到了百度、华为、AWS、无问芯穹、数…

    2025年4月6日
    4100
  • 5700问答对全面评估拷问AI空间感!新基准来了丨浙大&成电&港中文

    这个对人类来说非常简单的问题,连GPT-4o这样级别的视觉语言大模型(VLMs)也可能答错。 究其根本,还是当前的视觉语言大模型在大规模图文数据中学习到的空间信息往往是片段化的,仅限于静态视角的理解,缺乏多维度、多视角的空间推理能力 因此,当面对需要多视角空间推理的任务时,这些模型们就频频卡壳。 但是,具备稳健的空间推理能力与视角理解能力的AI系统,才能真正…

    2025年6月2日
    1100
  • 全面评测图像编辑模型推理能力:所有模型在程序性推理方面表现差

    人类在学习新知识时,总是遵循从“记忆事实”到“理解概念”再到“掌握技能”的认知路径。 AI是否也建立了“先记住单词,再理解原理,最后练习应用”的这种知识结构呢? 测评一下就知道了! 东南大学联合马克斯·普朗克信息研究所、上海交通大学、阶跃星辰、加州大学伯克利分校与加州大学默塞德分校的研究团队,共同提出了KRIS-Bench(Knowledge-based R…

    2025年6月13日
    600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信