新的技术进步可能对残疾人产生重要影响,在他们的日常生活中提供宝贵的援助。 这方面的一个关键例子是,技术工具可以为视障者(VI)提供指导,即部分或完全失明的个人。
考虑到这一点,中国Cloud MindsTechnologiesInc.的研究人员最近为VI个人创建了一种新的基于深度学习的可穿戴辅助系统。 该系统在ar Xiv上预先发表的一篇论文中提出,由可穿戴终端,强大的处理器和智能手机组成.. 可穿戴终端有两个关键部件,一个RGBD摄像头和一个耳机..
研究人员在论文中写道:“我们提出了一种基于深度学习的可穿戴系统,以提高VI的生活质量。” 该系统是为安全导航和实时综合场景感知而设计的。
由Cloud Minds团队开发的系统基本上是通过RGBD相机从用户周围收集数据。 这些数据被输入到卷积神经网络(CNN),该网络分析并预测最有效的避障和导航策略。 这些策略,以及其他关于周围环境的信息,然后通过耳机传达给用户。
在构建该系统时,第一批研究人员开发了一种数据驱动的端到端卷积网络(CNN),它可以在用户基于RGBD数据和相关的语义映射向前、左或右移动时生成无碰撞指令。 此外,他们设计了一系列易于VI个人采用的交互,以向他们提供可靠的反馈,例如避免障碍的行走指令和关于其周围环境的信息..
我们的避障引擎,从RGBD、语义地图和飞行员的行动选择输入中学习,能够提供关于VI周围障碍和自由空间的安全反馈。 通过使用语义图,我们还引入了一个有效的交互方案,以帮助VI通过智能手机感知三维环境。
研究人员在一系列真实世界的避障实验中测试了他们系统的性能。 值得注意的是,它们的系统在几种室内和室外场景中优于现有的方法。 他们在这些测试中收集的结果表明,该系统还提高了用户在现实世界任务中的移动性性能和环境感知能力,例如,帮助他们了解特定房间的布局,帮助他们找到丢失的物体,或传达附近的交通条件。
作为他们研究的一部分,研究人员收集了避障事件的数据集,其中包含了避免行走时附近障碍物的指令和其他信息,以感知周围的三维环境。 这些数据集可以帮助研究团队为VI个人培训其他基于深度学习的工具。
在未来,本研究开发的新型可穿戴系统可以为VI个人提供更有效和深入的帮助。 该团队现在计划集成一个声纳或凸点传感器,这将提高用户在导航更具挑战性或不安全的环境时的安全性。