新闻动态

当前位置: 首页 - 新闻动态 - 科研进展 - 正文

(通讯员 刘家铭)西安电子科技大学协同智能系统教育部重点实验室武越副教授、刘家铭硕士在多媒体领域权威期刊IEEE Transactions on Multimedia (TMM)上发表题为“MPCT: Multiscale Point Cloud Transformer with a Residual Network”的学术论文。该论文针对点云变换器问题,提出了一种兼容几何和语义特征的多尺度变换器。

自注意力可以被概念化为对数据的顺序和数量不敏感的集合运算符,使其适用于嵌入三维空间中的点集。然而,将其运用在三维点云仍然面临挑战。为了解决原始自注意力网络在没有位置编码的情况下引起的复杂性和奇异性呈指数级增长的问题,我们通过合并位置编码来修改注意力机制,使其基于线性机制,从而降低计算成本和内存使用,对于点云理解更加可行。

为此,本文提出了一种多尺度点云变换器(MPCT)的新框架,旨在改进跨域应用中的现有方法。正如我们提出的注意力机制所明确的,对多重特征嵌入的利用可以充分捕获点云内的远程和局部上下文相关信息。此外,我们使用一个简单高效的残差网络来促进多尺度特征的融合,使MPCT能够更好地理解每个关注各阶段的点云表示。在多个数据集上进行的实验表明所提的MPCT优于现有方法,例如在ModelNet40和ScanObjectNN分类数据集上实现的准确率分别达到94.2%和84.9%。

IEEE Transactions on Multimedia是计算机科学和工程技术领域顶级期刊(IF 7.3,中科院一区,Top期刊)。该期刊致力于多媒体技术和多媒体应用研究的各个方面,包括但不限于电路、网络、信号处理、系统、软件和系统集成。

论文链接:https://ieeexplore.ieee.org/document/10249213

上一篇: 实验室吕旷达硕士、李豪副教授在IEEE TEVC发表论文

下一篇: 实验室刘家铭硕士、武越副教授在IEEE TIM发表论文