中山大学教授蔡鑫伦团队与不列颠哥伦比亚大学教授Lukas Chrostowski团队等合作,基于铌酸锂薄膜光电集成技术,创新性地把光的波动性和电子的粒子性结合起来,在光学神经网络芯片领域方面取得新进展。相关成果近日发表于《自然-通讯》(Nature Communications)。
超大型光学神经网络架构概念图。研究团队供图
人工智能(AI)正以惊人的速度发展,其所消耗的计算资源每3~4个月翻一番,计算芯片的性能提升速度已难以跟上算力需求的增长速度。在此背景下,多种框架结构的张量核心应运而生,其中光学神经网络芯片可以填补传统微电子计算芯片在速度、延迟和能效等关键指标上的短板,被认为是提升AI算力的重要发展方向。
论文第一作者、中山大学副教授林忠劲表示,近年来,虽然光学神经网络芯片领域不断有新的技术被突破,但是由于光损耗、单元器件密度、波长通道数等因素的限制,人们对光学神经网络芯片能否高效地处理大型数据、以及能否在模型训练方面具有优势一直持怀疑态度。
研究人员提出了一种新的简洁的光学神经网络芯片框架结构——实现了一整层的神经网络,计算速度达到120 GOPS,同时输入和输出的数量能够被灵活地调整以应对多种AI任务。该光学神经网络芯片还支持快速原位训练,权重的刷新速度达到60 GHz。他们首次在光上实现了负数与负数的乘法,为聚类AI任务的训练提供了新的方案。
该工作突破了铌酸锂薄膜光芯片的光子引线键合封装工艺,实现了铌酸锂薄膜光芯片和激光器的混合集成。激光器和铌酸锂薄膜光芯片之间通过聚合物三维光波导连接。由于光探测器不能直接在铌酸锂薄膜材料平台上制备,因此通过倒装焊的方式实现铌酸锂薄膜光芯片和光探测器之间的连接。
基于上述光学神经网络芯片,该工作还提出了首个端到端、纳秒级延迟、无需数字处理器辅助的超大型光学神经网络架构。在理论上,该光学神经网络可以实现500 TOPS的计算速度,并且能够在纳秒级别完成高维度数据的处理。
利用该光学神经网络芯片,研究人员实现了AI系统性能的提升,以原位模型训练的方式,实现了112×112像素的数字图像识别(监督学习)和聚类(无监督学习)AI任务。该研究工作不仅推动了光学神经网络芯片的发展,还为未来构建超大型光学神经网络奠定了基础。(来源:中国科学报 朱汉斌)