近年来,日新月异的人工智能技术不断推动着社会进步和产业变革,其中卷积神经网络(CNN)以其卓越的图像识别能力,在人工智能技术领域,特别在ChatGPT中表现极为出色。近期,一项突破性的科研成果将卷积神经网络的概念引入光学领域,为人工智能成像技术带来了革命性的进展。
由yl7703永利官网智能科技学院张启明教授,智能科技学院、张江实验室光计算所顾敏院士领衔的研究团队,开发了一种超快速的卷积光学神经网络(ONN),这一技术在无需依赖光学记忆效应的情况下,实现了对散射介质后的物体进行高效、清晰的成像。这不仅是对传统光学成像技术的一次颠覆,更是卷积网络在人工智能中应用潜力的一次深刻展示。该成果于6月14日以 “基于超快卷积光学神经网络的非记忆效应散射成像(Memory-less scattering imaging with ultrafast convolutional optical neural networks)”为题发表于《科学》(Science)子刊《科学进展》(Science Advances)上,智能科技学院张雨超特聘研究员为第一作者,顾敏院士和张启明教授为共同通讯作者。
卷积神经网络作为目前为止应用最为广泛的指一种人工智能神经网络架构,它由生物的视觉皮层系统发展而来,视觉皮层结构由Hubel和Wiesel于1981年所提出,并获得了诺贝尔奖。卷积操作作为卷积神经网络中的核心,通过提取图像的局部特征并逐层构建更为复杂和抽象的特征表示,极大地推动了图像处理和模式识别领域的发展。然而,将这一概念应用于光学领域,面临着将电子信号转换为光学信号的挑战。研究团队巧妙地设计了一种全光学的解决方案,通过在光域中直接进行卷积网络操作,省去了繁琐的信号转换过程,实现了真正的光速计算。
这项技术的关键在于构建了一个多阶段的卷积网络,它由多个并行核心组成,能够以光速进行操作,直接从散射光中提取特征,实现图像的快速重建。这一过程不仅极大地提高了成像速度,还显著增强了成像质量,使得在复杂散射环境中的成像成为可能。同时,卷积光学神经网络的计算速度达到了每秒1570万亿次操作(1.57 Peta operations per second, POPS),为实时动态成像提供了强大的支持。
此技术另一大亮点是其多任务处理能力。通过简单地调整网络结构,同一卷积光学神经网络能够同时执行多种不同的图像处理任务,如分类、重建等,在光学人工智能领域尚属首次。张启明教授提到:“这种灵活性和效率的结合,不仅展示了卷积网络在人工智能中的重要性,也为光学成像技术开辟了新的道路。”
这项技术的问世,不仅是对卷积神经网络在光学领域的一次成功移植,更是对人工智能成像技术的一次重大推动。顾敏院士指出:“随着技术的不断发展和完善,我们有理由相信,卷积光学神经网络将在自动驾驶、机器人视觉、医学成像等多个领域将发挥更加重要的作用,为人类的生活带来更多便利,为科学研究提供更强大的工具。这是卷积网络的力量,也是人工智能的魅力。”
研究原理图
论文链接:https://www.science.org/doi/10.1126/sciadv.adn2205
供稿:智能科技学院