博士生，一作发Science，研发智能光芯片“太极”，赋能大模型算力

2024-04-29

9475

智能光计算作为近年来新兴的计算模态，具备高速、低功耗等特性，在后摩尔时代展现出有望超越硅基电子计算的潜力，解决人工智能领域的算力与功耗难题。然而，其计算任务往往局限于简单的字符分类、图像处理等。其痛点是光的计算优势被困在了不适合的电架构中，计算规模受限，无法支撑复杂大模型智能计算。

针对大规模光电智能计算难题，清华大学电子工程系方璐副教授课题组、自动化系戴琼海院士课题组，构建了智能光计算的通用传播模型，摒弃了传统电子深度计算范式，另辟蹊径，首创了分布式广度光计算架构，研制了全球首款大规模干涉-衍射异构集成芯片“太极”（Taichi），实现了160 TOPS/W的通用智能计算。

化深为广，分布式广度光计算架构。建立自顶向下的编码拆分-解码重构机制，将复杂智能任务化繁为简，拆分为多通道高并行的子任务，构建分布式浅层光网络对子任务分而治之，突破物理器件多层深度级联的固有计算误差。相异于电学神经网络依赖网络深度以实现复杂的计算与功能，“太极”架构源自光计算独特的“全连接”与“高并行”属性，化深度计算为广度计算，为实现规模易扩展、计算高并行、系统强鲁棒的通用智能光计算探索了新路径。

化深为广：Taichi分布式广度光计算架构

两仪一元，干涉-衍射融合计算芯片。以周易典籍“易有太极，是生两仪”为启发，建立干涉-衍射联合传播模型，刻画衍射光计算大规模并行优势与干涉光计算灵活重构特性，提出衍射编码-干涉特征计算-衍射解码的融合计算方法，研制了干涉-衍射异构集成智能光芯片，实现片上大规模通用光计算。更进一步，受益于光的高速传播特性，将衍射编解码与干涉特征计算进行部分/整体重构复用，以时序复用突破通量瓶颈，自底向上支撑分布式广度光计算架构。

0 (1).jpg

两仪一元：干涉-衍射融合计算芯片

据论文报道，“太极”芯片具备879 T MACS/mm^2的面积效率与160 TOPS/W的能量效率，首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务，将为百亿像素大场景光速智能分析、百亿参数大模型训练推理、低功耗自主智能无人系统提供算力支撑。

通用大规模光计算从无极至太极，以致万物化生。课题组希望“太极”可以在如今大模型通用人工智能蓬勃发展的时代，以光子之道，为高性能计算探索新灵感、新架构、新路径。

相关研究成果以“大规模光芯片太极赋能160 TOPS/W通用人工智能”（Large-scale photonic chiplets Taichi empowers 160 TOPS/W artificial general intelligence）为题，于北京时间4月12日凌晨发表于《科学》（Science）杂志。

清华大学电子工程系为论文的第一单位，清华大学电子系副教授方璐、自动化系教授戴琼海为论文通讯作者，电子系2020级博士生徐智昊、博士后周天贶（清华大学水木学者）为论文第一作者。该课题得到科技部2030“新一代人工智能”重大项目、基础科学中心项目，清华大学-之江实验室联合研究中心等的支持。

原文链接：

https://www.science.org/doi/10.1126/science.adl1203