摘要:研究人员开发了一个完全集成的光子处理器,可以使用光线在光子芯片上执行深神网络的所有关键计算。这项进步可以提高跑步深度学习模型的速度和能源效率,以苛刻的应用程序,例如LIDAR,天文学研究和导航。...
为当今最苛刻的机器学习应用程序提供动力的深度神经网络模型已经变得如此大而复杂,以至于他们正在推动传统电子计算硬件的限制。
可以用光执行机器学习计算的光子硬件,提供了更快,更节能的替代方案。但是,光子设备无法执行某些类型的神经网络计算,需要使用片外电子设备或其他阻碍速度和效率的技术。
基于十年的研究,麻省理工学院和其他地方的科学家开发了一种克服这些障碍的新光子芯片。他们展示了一个完全集成的光子处理器,该处理器可以在芯片上执行深神经网络的所有关键计算。
该光学设备能够以不到一半的纳秒秒为单位完成机器学习分类任务的关键计算,同时达到超过92%的精度 - 与传统硬件相当的性能。
由形成光学神经网络的互连模块组成的芯片是使用商业铸造工艺制造的,可以使技术及其集成到电子产品中。
从长远来看,光子处理器可能会导致更快,更节能的深度学习,以实现计算苛刻的应用,例如LIDAR,天文学和粒子物理学或高速电信。
“在很多情况下,模型的性能并不重要,而是您能得到答案的速度。电子研究实验室(RLE)和NTT Research,Inc。的Postoc中的Photonics和AI组,后者是新芯片论文的主要作者。
Alexander Sludds '18,Meng '19,PhD '23,Nicholas Harris PhD '17和Darius Bunandar PhD '19,Bandyopadhyay加入了纸上。 Stefan Krastanov是前RLE研究科学家,现在是马萨诸塞州阿默斯特大学的助理教授; RLE的客座科学家,NTT Research的高级科学家Ryan Hamerly;诺基亚的前硅光子学领导Matthew Streshinsky现在是Enosemi的联合创始人兼首席执行官。 Periplous,LLC总裁Michael Hochberg;电气工程和计算机科学系教授,量子光子学和人工智能小组和RLE的首席研究员。该研究今天出现在自然光子学。
用光的机器学习
深神经网络由许多互连的节点或神经元的层组成,这些节点或神经元在输入数据上运行以产生输出。深神经网络中的一个关键操作涉及使用线性代数执行矩阵乘法,这会在数据通过从图层传递时转换数据。
但是除了这些线性操作外,深度神经网络还执行非线性操作,以帮助模型学习更多复杂的模式。非线性操作,例如激活功能,为深度神经网络提供了解决复杂问题的力量。
2017年,Englund的小组以及MarinSoljačić实验室的研究人员,Cecil和Ida Green Physics教授在单个光子芯片上展示了一个光学神经网络,可以用光执行矩阵乘法。
但是当时,该设备无法在芯片上执行非线性操作。光学数据必须转换为电信号,并发送到数字处理器以执行非线性操作。
Bandyopadhyay解释说:“光学中的非线性非常具有挑战性,因为光子不会很容易相互交互。这使得触发光学非线性的功能非常消耗,因此构建可以以可扩展方式进行系统的系统变得具有挑战性。”
他们通过设计称为非线性光学功能单元(NOFUS)的设备来克服挑战,该设备结合了电子和光学,以在芯片上实现非线性操作。
研究人员使用执行线性和非线性操作的三层设备在光子芯片上建立了光学深神经网络。
一个完全集成的网络
首先,他们的系统将深神网络的参数编码为光。然后,在2017年论文中证明了一系列可编程梁插图器对这些输入进行矩阵乘法。
然后,数据传递给可编程的NOFU,该NOFU通过将少量的光线转换为将光学信号转换为电流的光二极管来实现非线性函数。这一过程消除了对外部放大器的需求,消耗的能量很少。
Bandyopadhyay说:“我们一直都在光学域中,直到最后我们想读出答案。这使我们能够达到超低潜伏期。”
达到如此低潜伏期,使他们能够有效地训练芯片上的深层神经网络,这一过程称为原位通常在数字硬件中消耗大量能量的培训。
他说:“这对于您正在进行光学信号(例如导航或电信)的系统处理的系统特别有用,而且在您想实时学习的系统中。”
在训练测试期间,光子系统的精度超过96%,推理过程中的精度超过92%,这与传统硬件相当。此外,芯片在不到一半的纳秒中执行关键计算。
Englund说:“这项工作表明,从本质上讲,计算将输入到输出的映射可以汇总到线性和非线性物理学的新体系结构上,这些结构可以实现从根本上不同的计算规律与所需的努力缩放定律。”
整个电路是使用相同的基础架构和铸造工艺制造的,这些基础架构和铸造过程产生了CMOS计算机芯片。这可以使芯片能够使用久经考验的技术进行大规模制造,从而在制造过程中引入很少的错误。
Bandyopadhyay说,扩大其设备并将其与现实世界中的电子产品(如相机或电信系统)集成在一起,将是未来工作的主要重点。此外,研究人员希望探索可以利用光学功能的优势来更快训练系统的算法,并提高能源效率。
这项研究部分由国家科学基金会,空军科学研究办公室和NTT研究资助。