日前,在美国长滩举办的计算机视觉顶级会议CVPR 2019上,我所荣获双冠。其中,模式识别国家重点实验室机器人视觉课题组申抒含副研究员带领的团队获得了本年度“大时间跨度视觉定位竞赛”(Long-Term Visual Localization Challenge)的冠军模式识别国家重点实验室生物识别与安全技术研究中心雷震研究员带领的团队获得了UG2+计算机视觉算法-人脸检测竞赛的冠军 

      视觉定位是指利用单张图片和三维场景信息,精确地估计拍摄图像的相机三维位置和三维朝向。在许多计算机视觉和机器人的应用场景中,如自动驾驶、增强/混合现实、三维重建和SLAM等,视觉定位都是其中一项十分重要的基础技术。近年来,针对大规模室内外场景进行视觉定位的主流方法首先需要离线构建场景三维地图,之后再根据定位图像和三维地图的匹配对应关系在线计算相机位姿。这一流程的核心难点在于,由于光照、天气、季节、场景结构变化等因素影响,构图图像和定位图像可能存在显著差异,给图像匹配和位姿计算带来了巨大挑战。    

      基于此,本次大时间跨度视觉定位竞赛竞赛供了来自实际场景5个数据集包含近6万张用于三维地图构建图像和近8万张用于视觉定位的图像。数据集涵盖了室外定位和室内定位可能遇到的多种情况,与此同时,在定量评估的基础上,竞赛还要求参赛队伍提交相关论文以评估算法的理论创新性和可复现性。机器人视觉课题组参赛团队成员包括研究生时天欣、高翔、朱灵杰、田雨润他们凭借其在三维计算机视觉领域多年的研究积累,在本次竞赛中以图像检索和PnP算法为核心,利用图像高层的语义特征不随环境变化而改变的特点,将图像的高层语义信息纳入视觉定位流程中,显著克服了环境变化所带来的影响[1],有效提高了定位精确度。最终,团队提交的定位结果在5个评测数据集上获得4个第一,1个第二,其总分排名第一并夺得冠军。本次竞赛吸引了来自苏黎世理工学院、东京工业大学、韩国浦项科技大学、INRIAGoogle、微软等高校和企业的多个知名三维视觉团队参与。  

      UG2+竞赛由CVPR和多家计算机视觉领域知名的政府机构、学术机构、企业联合举办,其主要目的在于评估和探索当前最先进的图像处理算法在极端条件下对检测和识别等任务的精确性与鲁棒性。本次竞赛包含无约束视频中的物体分类与检测和低可见环境下的物体检测两个任务,提供了6000张夜间拍摄的真实场景中的低光照图像作为训练集,以及4000张相同设置下采集的图像作为最终的测试集。数据集涵盖了实际检测场景中可能遇到的各种光照,角度和姿态变化下的人脸图像,采集地点包含了教学楼、街道、桥梁、立交桥、公园等实际场景。     

      基于此,雷震研究员带领的团队参加了任务二中的“低光照环境下的人脸检测”子项目,其参赛成员包括研究生张士峰、庄楚斌他们使用SRNSelective Refinement Network[2]作为基础检测网络,并辅以MSRCR[3]图像增强技术对低光照下的人脸图像进行特殊处理,能够克服低光照环境下的人脸信息不清晰而带来的影响,有效提高了算法的准确度,在CVPR会议现场他们还做了题为Selective Refinement Network for Dark Face Detection”的口头报告。雷震团队经过三个多月的努力,最终从两百多支参赛队伍中脱颖而出,取得了本次竞赛的冠军。  

      参考文献: 

      [1] Tianxin Shi, Shuhan Shen, Xiang Gao, Lingjie Zhu.

      [2] Chi C, Zhang S, et al. Selective refinement network for high performance face detection. arXiv preprint arXiv:1809.02693, 2018.  

      [3] Jobson, Daniel J., Zia-ur Rahman, and Glenn A. Woodell. "A multiscale retinex for bridging the gap between color images and the human observation of scenes." IEEE Transactions on Image processing 6.7 (1997): 965-976.  

        

        

    附件: