RIKEN开发出新卷积神经网络 助力自动驾驶
讯 据外媒报道,日本综合性研究机构RIKEN脑科学中心的Andrea Benucci及其同事开发出一种创建人工神经网络的方法,可以学习更快、更准确地识别物体。该研究重点关注未被注意到的眼球运动,并表示眼球运动在稳定识别物体方面发挥着重要作用。这些发现可以应用于机器视觉,例如,使自动驾驶汽车更容易学习识别道路上的重要特征。
图片来源:RIKEN
头部和眼睛一整天都在不停移动,但人类不会因此看不清物体,即使视网膜上的物理信息不断变化。使这种感知稳定性成为可能的是运动命令的神经副本(neural copies)。 每次移动时,这些副本都会发送到整个大脑,并被认为可以让大脑解释自身的运动并保持感知稳定。
除了稳定的感知之外,有证据表明,眼球运动及其运动副本也可能有助于稳定地识别世界上的物体,但具体是如何发生的还不得而知。Benucci开发出一个卷积神经网络(CNN),在眼睛移动时优化视觉场景中的对象分类,或可解决上述问题。
首先,该神经网络经过训练,可将60,000张黑白图像分为10个类别。尽管该网络在这些图像上表现良好,但当使用模拟眼睛移动时自然改变的视觉输入的移位图像进行测试时,其性能急剧下降到偶然水平。然而,在使用移位图像训练网络后,只要还包括导致移位的眼球运动的方向和大小,分类显著提高。
特别的是,将眼球运动及其运动副本添加到网络模型中,系统能够更好地应对图像中的视觉噪声。Benucci表示:“这一进步将有助于避免机器视觉中的危险错误。凭借更高效、更强大的机器视觉,像素更改(也称为‘对抗性攻击’)会减少错误率,例如,自动驾驶汽车将停车标志标记为灯杆,或军用无人机错误将医院大楼分类为敌方目标。”
Benucci解释说:“模仿眼球运动及其传出副本意味着‘强制’机器视觉传感器具有受控类型的运动,同时通知负责处理关于自生运动相关图像的视觉网络,将使机器视觉更加强大,并且类似于人类的视觉体验。”
标签:运动 视觉 网络 图像 眼球