本篇文章688字,读完约2分钟
9月13日,gpu开发者大会在北京召开。上海朗维科技首席科学家马会民教授就智能驾驶和视觉感知的核心问题做了详细的讲解。
马会民说,2003年,三维图像实验室被列入清华大学电子工程系,他们一直在关注识别技术尚未克服的问题。
小目标、强遮挡、高动态是他们应该关注的三个问题。马会民主要介绍了自动驾驶中的三种机器学习模型来解决上述三个问题。
1.显著对象检测:语义注意的认知模型
2.组件和认知模型:抵抗遮挡的能力
3.三维场景物体识别:适应复杂环境
首先,在显著目标检测中,我们要找到显著目标,为图像分割铺平道路。
其次,组件、结构和环境是图像识别中非常重要的因素,添加组件的特征也可以抵抗遮挡;
最后,下一步是与环境交互,并使用三维信息(立体视觉)来创建对象的语义模型。使用3D进行道路估计和语义特征,然后将其放入2D单目相机中,我们可以发现测试结果与双目相机的结果相当。原因在于它自身的先验和语义上、下维度之间的联系。
在三维先验测试中,我们可以确定汽车与建筑物的高度、宽度和比例,它们都在一定的范围内。然后,从多模态、多任务、多视角三个方面进行道路检测,从平视到鸟瞰进行多维检测,车辆检测和定位精度可提高6%以上。
他们还将立体视觉与激光雷达效应和混合传感器效应进行了比较,但在视觉传感中加入激光传感后,道路上的测试效果并没有明显改善,甚至比基于2D和3D融合的纯视觉识别效果还要差。
在自动驾驶中,车道检测、交通信号灯检测、道路标志和整体路径规划都需要在基于嵌入式开发的无人驾驶车辆运行算法中实现。为了实现智能驾驶和视觉感知,3d图像实验室采用上述三种模型来解决问题。