UVA研究人员通过模仿自然并将先进计算推向边缘来增强机器视觉

导读 自动驾驶汽车偶尔会发生撞车事故,因为它们的视觉系统无法始终处理 3D 空间中的静态或慢速移动物体。在这方面,它们就像许多昆虫的单眼视

自动驾驶汽车偶尔会发生撞车事故,因为它们的视觉系统无法始终处理 3D 空间中的静态或慢速移动物体。在这方面,它们就像许多昆虫的单眼视觉,它们的复眼提供出色的运动跟踪和广阔的视野,但深度感知较差。

螳螂除外。

螳螂的视野也在其左眼和右眼之间重叠,从而形成具有 3D 空间深度感知的双目视觉。

弗吉尼亚大学工程与应用科学学院的研究人员将这一见解与一些精妙的光电工程和创新的“边缘”计算(在捕获数据的传感器内或附近处理数据)相结合,开发出了人工复眼,克服了机器目前收集和处理现实世界视觉数据的方式中令人烦恼的限制。这些限制包括准确性问题、数据处理滞后时间以及对大量计算能力的需求。

查尔斯布朗大学电气与计算机工程系博士生 Byungjoon Bae 表示:“在研究了螳螂眼睛的工作原理后,我们意识到复制其生物能力的仿生系统需要开发新技术。”

关于那些仿生窥视者

该团队精心设计的“眼睛”模仿自然,集成了微透镜和多个光电二极管,当暴露在光线下时会产生电流。该团队使用柔性半导体材料来模拟螳螂眼的凸形和刻面位置。

Bae 表示:“将传感器制成半球形并保持其功能是一项最先进的成就,它提供了广阔的视野和卓越的深度感知。”

“该系统可实时提供精确的空间感知,这对于与动态环境交互的应用程序至关重要。”

这些用途包括低功率汽车和无人机、自动驾驶汽车、机器人组装、监控和安全系统以及智能家居设备。

Bae 的导师是该系的副教授 Kyusang Lee,兼任材料科学与工程系的兼职教授,他是该团队最近在《科学机器人》杂志上发表的论文的第一作者。

该团队在实验室原型系统方面取得的重要发现之一是,与传统视觉系统相比,其功耗可能降低 400 多倍。

边缘计算的好处

Lee 的系统不使用云计算,而是可以实时处理视觉信息,几乎消除了数据传输和外部计算的时间和资源成本,同时最大限度地减少了能源使用。

Bae 表示:“这项工作的技术突破在于柔性半导体材料、可在设备内保持精确角度的保形设备、传感器内存储组件以及独特的后处理算法的集成。”

关键是传感器阵列持续监测场景的变化,识别哪些像素发生了变化,并将这些信息编码为更小的数据集进行处理。

这种方法模仿了昆虫通过视觉线索感知世界的方式,通过区分场景之间的像素来理解运动和空间数据。例如,螳螂和其他昆虫以及人类一样,可以利用运动视差现象快速处理视觉数据,其中较近的物体似乎比远处的物体移动得更快。只需要一只眼睛就能达到这种效果,但仅靠运动视差不足以实现准确的深度感知。

螳螂的眼睛很特殊,因为和我们一样,它们除了利用半球形复眼几何形状和运动视差来了解周围环境之外,还使用立体视觉(用双眼观察以感知深度)。

“这些先进材料和算法的无缝融合实现了实时、高效和准确的三维时空感知,”李说道,他是薄膜半导体和智能传感器领域一位多产的早期研究员。

他说:“我们团队的工作代表了重要的科学见解,通过展示巧妙的仿生解决方案来解决复杂的视觉处理难题,可以启发其他工程师和科学家。”

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章

<