
利用深度神经网络对单个全景图进行的三维房间布局估计已经取得了很大的进展。然而,以前的方法不能通过边界的纬度或地平线深度来获得有效的房间布局的几何感知。我们提出,使用地平线深度和房间高度可以在水平和垂直方向上获得对房间布局的全方位的几何认知。此外,我们提出了一个具有法线和法线梯度的平面几何意识的损失函数,以监督墙壁的平面性和转角的情况。我们提出了一个高效的网络,LGT-Net,用于房间布局估计,它包含一个新颖的Transformer结构,称为SWG Transformer,用于模拟几何关系。SWG变换器由(移位)窗口块和全局块组成,以结合本地和全局的几何关系。此外,我们还设计了一个新颖的相对位置嵌入Transformer,以增强全景图的空间识别能力。实验表明,所提出的LGT-Net在基准数据集上取得了比当前先进技术(SOTA)更好的性能。
《LGT-Net: Indoor Panoramic Room Layout Estimation with Geometry-Aware Transformer Network》
20220303
论文地址:http://arxiv.org/abs/2203.01824v1