草榴社区

草榴社区 研究生在计算机视觉顶会ECCV 2026上发表论文

2026-06-26 16:43 作者:曾胡越(供稿、供图) 审核:王​晖 刘作勋 易鹏 浏览:

近日,2024级硕士研究生曾胡越在导师韩先锋副教授指导下完成的研究成果《BEVOpen3D: Towards Open-World 3D Object Detection in Bird's-Eye-View》被European Conference on Computer Vision(ECCV 2026)录用。

开放世界三维目标检测是自动驾驶感知系统的核心挑战,旨在使模型能够识别训练阶段未见的未知类别物体。然而,传统“封闭集”训练范式依赖预定义类别列表,当遇到训练集外的新兴类别时模型完全失效,这严重制约了复杂场景下的泛化能力与安全性。为解决上述问题,该研究提出了一种“教师-学生”协同进化的在线蒸馏框架BEVOpen3D,使基于图像的开放词汇教师模型与三维点云学生模型从头同步训练。相较于传统硬标签,教师模型生成的软标签分布更加平滑,有效缓解了标签锐化带来的过拟合风险,显著增强了模型的泛化鲁棒性。针对自训练过程中固有的误差累积问题,研究提出了“三源标签精炼”模块,利用教师模型每轮迭代产生的可靠预测在线更新并校正学生伪标签,精准阻断了误差信号的传播链。在跨模态信息利用方面,研究创新性地提出了“热力图提议蒸馏”策略,将二维教师模型生成的类别响应热力图作为软监督信号,引导三维学生模型在鸟瞰图(BEV)空间学习语义分布。该设计巧妙规避了特征空间直接跨模态对齐的域差距难题,同时充分融合了图像纹理提供的细粒度语义信息,实现了几何定位精度与开放词汇分类能力的协同提升。

草榴社区 为该论文第一署名和通讯单位。论文作者分别是曾胡越(2024级硕士研究生)、杨佳琪(西北工业大学)、韩先锋(通讯作者)。ECCV 与 CVPR、ICCV 并称为计算机视觉领域三大顶级会议。ECCV 2026 将于2026年9月8日至13日在瑞典马尔默举行,共有10,473篇论文进入评审流程,最终2,883篇被接收,录取率为27.5%。



供稿:曾胡越

供图:曾胡越

初审:王

复审:刘作勋

终审:易