研究人员着眼于人眼提高计算机视觉效率

传统的硅结构已经让计算机视觉走了很长的路，但普渡大学的研究人员正在开发一种替代途径——从大自然中汲取灵感——他们说这是人造视网膜的基础。与我们自己的视觉系统一样，该设备能够感知变化，原则上比自动驾驶汽车和自动驾驶机器人等应用中使用的计算要求高的数字相机系统更高效

普渡大学理学院Richard和Judith Wien化学教授梅建国表示：“计算机视觉系统消耗大量能量，这是广泛使用它们的瓶颈。我们的长期目标是利用仿生技术，以较少的数据处理来应对动态成像的挑战。”。“通过在光感方面模仿我们的视网膜，我们的系统可能会大大降低数据密集度，尽管要实现硬件和软件的集成还有很长的路要走。”梅和他的团队从视网膜细胞的光感中获得了灵感。与自然界一样，光在他们建造的原型设备中引发电化学反应。这种反应随着反复暴露在光下而稳步增强，当光被撤回时会缓慢消散，从而有效地形成了设备接收到的光信息的记忆

该内存可能用于减少理解移动场景所需处理的数据量，这种方法比传统的计算机视觉更节能、更容错

该团队将他们的设备称为有机电化学光子突触，并表示它更接近于模拟人类视觉系统的工作方式，作为人机界面设备的基础具有更大的潜力。梅实验室的研究生、Nature Photonics一篇论文的主要作者Ke Chen说，这种设计也可能有助于神经形态计算应用程序，这些应用程序的工作原理与人脑结构相似

“在一个普通的计算机视觉系统中，你创建了一个信号，然后你必须将数据从内存转移到处理和返回内存；这需要大量的时间和精力，”陈说。“我们的设备具有光感知、光到电信号转换、现场记忆和数据处理的集成功能。”

目前，机器人或自主设备依赖于熟悉的数码相机作为计算机视觉的基础。在相机内部，硅晶体的光敏区域，称为光敏区，吸收光子并释放电子，将光转换为电信号，可以用越来越复杂的计算机图像识别程序进行处理。一台典型的智能手机相机使用超过1000万张照片，每张照片只有几微米（百万分之一米）见方，以远高于我们肉眼的分辨率拍摄图像。

但所有这些数据——无论场景是否变化，都必须分析所有可用的光信息——对于许多使用计算机视觉的任务来说是不必要的

相比之下，梅的解决方案与人类视觉一样，分辨率相对较低，但非常适合感知运动。人眼的分辨率在15微米左右。这个原型设备在一个10平方厘米的芯片上容纳了18000个晶体管，分辨率为几百微米。梅说，可以通过将分辨率降低到10微米左右来改进这项技术

反复暴露在光下会增加凝胶中的电荷不平衡，这一特征可用于区分静态场景的一致光和变化场景的动态光。当光被去除时，离子在短时间内保持其带电配置，这可以被视为光的临时记忆，逐渐恢复到中性配置

带正电的点充当晶体管的栅极，在有光的情况下，允许小电流在源极和漏极之间流动。与传统的光电探测器非常相似，电流指示光的强度和波长，并被传递到计算机进行图像识别。但是，尽管电流的输出是相同的，但正是将光转换为电化学信号的中间步骤创造了运动传感和记忆能力。

梅的电化学晶体管是一类新兴的光电器件，旨在集成光感知和记忆，但其器件的性能优越，因为电荷不平衡随着反复暴露在光下而以平稳稳定的增量增加，并且衰减速度比竞争对手的设计慢。随着未来迭代计划由柔性材料制成，他们也可能生产出可穿戴甚至生物兼容的版本。