中国科协 | 全国学会 | 地方科协

人工智能利用时间数据3D成像

2020-08-06 10:48     来源:中国科学报 文乐乐 + AA -

  据《科学》报道,一个科学家小组获得了一种新的摄影技巧:通过测定光线反射回一个简单探测器的时间,他们巧妙获得了一个场景的三维图像。这项被称为“时间成像”的新技术展示了人工智能解决难题的能力。

  在传统摄影中,环境光反射物体,镜头将其聚焦在由微小感光元件或像素组成的屏幕上,图像就是反射光所形成的明暗斑点的图案。所谓的“飞行时间相机”甚至可以通过精确计算物体反射的闪光到达不同像素点的时间来制作3D图像。

  近几十年,研究人员发明了一种更精妙的方法,只需一个像素探测器就能捕捉到图像。他们不是将物体暴露在均匀的光照而是在不同模式的闪光下,这些闪光有点像正方形条形码。每个图案会反射物体的不同部分,因此由像素测量的光强度会随着图案变化而变化。通过追踪这些变化,研究人员可以重建物体的图像。

  现在,英国格拉斯哥大学的数据科学家Alex Turpin、物理学家Daniele Faccio及其同事发明了一种只用单一像素就能生成3D图像的方法——不需要不同模式的闪光。利用单光子探测器,他们用均匀的闪光照亮一个场景,并简单地测量反射时间。探测器以1 / 4纳秒的精确度计算到达的光子数量,并将其作为时间函数。仅凭这些信息,研究人员重建了现场的图像。

  “这令人惊讶,因为场景中物体的排列和时间信息之间原则上并没有一对一的关系。”未参与该研究的加州大学伯克利分校计算机科学家Laura Waller说。例如,无论什么方向,从距离探测器3米处的任何表面反射的光子都会在10纳秒内到达。

  为解决这个问题,Turpin和同事们使用了一种叫做神经网络的机器学习程序,训练其检测输入和输出之间的微妙关联。研究人员利用闪光和探测器记录一两个人在一个固定的、不对称的背景场景中移动的数据,同时,使用一个飞行时间摄像机记录场景真实的三维图像。

  研究人员上周在Optica上报告说,在使用这两组数据训练神经网络后,该程序能够对人在场景中的移动成像。与飞行时间摄像机相比,时间图像是模糊、缺乏细节的,但清晰地揭示了形状。

  神经网络能够解读模糊的信号,得益于它的训练——尝试联想到已经看过的类似的场景和物体。但这意味着该系统也有局限性:必须在它即将观察的精确场景中进行训练。

  Turpin说,与普通成像相比,时空成像系统具有一些优势。例如,新系统的速度可以非常快,有可能以每秒1000帧的速度工作,这种粗糙但快速的3D成像可以有各种应用,该系统也很便宜和简单。

  相关论文信息:https://doi.org/10.1364/OPTICA.392465


通讯地址:北京市朝阳区白家庄东里13号楼

电子邮箱:scei@cast.org.cn