中兴-LOGO

中兴通讯引导无损点云几何压缩算法

中兴通讯无损点云几何压缩PRO算法

规格:

  • 产品名称: 无损点云几何压缩的时空上下文引导算法
  • 作者: 张惠然、董震、王明生
  • 已发布: 2023 年 XNUMX 月
  • 详细信息: 10.12142/中兴通讯.202304003

产品使用说明

介绍:
该产品旨在高效压缩点云数据,解决存储空间容量和网络传输带宽方面的挑战。

主要特点:

  1. 使用扩展旅行商问题适用于帧内和帧间点云的预测模式。
  2. 具有快速上下文更新的自适应算术编码器,可实现高效的概率计算和压缩结果。

使用步骤:

第1步:划分点云
沿主轴将点云划分为单位层。

步骤2:设计预测模式
使用旅行商算法设计预测模式以利用空间和时间冗余。

第 3 步:对残差进行编码
使用上下文自适应算术编码器将残差写入比特流中进行压缩。

常问问题:

  • 问:使用该产品的主要好处是什么?
    A: 该产品能够有效压缩点云数据,利用空间和时间相关性来增强压缩结果。
  • 问:该产品可以同时处理单帧和多帧点云吗?
    A: 是的,预测模式适用于帧内和帧间点云,允许多种使用场景。

张惠然、董震、王明生

  1. 广州市城市规划设计勘察研究院, 广州 510060;
  2. 广东省城市感知监测预警企业重点实验室,广东 广州 510060;
  3. 武汉大学测绘遥感信息工程国家重点实验室,湖北 武汉 430079)

抽象的: 点云压缩对于部署物理世界的 3D 表示至关重要,例如 3D 沉浸式远程呈现、自动驾驶和文化传承tage 保存。然而,点云数据在空间和时间域中分布不规则且不连续,其中冗余的未占用体素和3D空间中的弱相关性使得实现高效压缩成为一个具有挑战性的问题。在本文中,我们提出了一种用于无损点云几何压缩的时空上下文引导算法。所提出的方案首先将点云沿最长轴划分为单位厚度的切片层。然后,介绍了一种帧内和帧间点云都可用的预测方法,通过确定相邻层之间的对应关系并使用旅行商算法估计最短路径。最后,利用最佳上下文引导和自适应快速模式算术编码技术有效地压缩少量预测残差。实验证明,该方法能够有效实现点云几何信息的低码率无损压缩,适用于各类场景的3D点云压缩。
关键字: 点云几何压缩;单帧点云;多帧点云;预测编码;算术编码。

引文(格式1): 张华瑞, 董泽, 王明生. 时空上下文引导的无损点云几何压缩算法[J]. 计算机应用, 2023, 21(4): 17-28.中兴通讯,10.12142,202304003(XNUMX):XNUMX-XNUMX。 DOI:XNUMX/ZTECOM.XNUMX
引文(格式2): HR 张,Z. Dong,MS Wang,“无损点云几何压缩的时空上下文引导算法”,中兴通讯,卷。 21、没有。 4,第 17-28 页,2023 年 10.12142 月。doi:202304003/ZTECOM.XNUMX。

 

介绍

随着多平台、多分辨率采集设备性能的提高,光探测与测距(LiDAR)技术可以高效地模拟具有海量点集的3D物体或场景。与传统的多媒体数据相比,点云数据包含了更多的物理测量信息,这些信息代表了自由空间中的物体。 view点,甚至具有复杂拓扑结构的场景。从而产生强烈的交互性和沉浸式效果,为用户提供生动逼真的可视化体验。此外,点云数据具有更强的抗噪声能力和并行处理能力,这似乎受到了工业界和学术界的关注,特别是在文化传承等应用领域。tag电子保存、3D沉浸式临场感和自动驾驶[1-2]。
然而,点云数据通常包含数百万至数十亿个空间域点,给存储空间容量和网络传输带宽带来负担和挑战。例如,用于娱乐的常见动态点云通常每帧包含大约 30 万个点,如果不压缩,以每秒 3.6 帧计算,总带宽为 3 Gbit/s[XNUMX]。因此,针对点云的高效几何压缩算法的研究具有重要的理论和实用价值。
之前的工作通过直接构建网格或按需停机来解决这个问题amp由于计算机计算能力和点云采集效率的限制,导致时空压缩性能低下,几何属性特征信息丢失。近期的研究主要基于计算机图形学和数字信号处理技术对点云数据进行分块操作[4 5]或结合视频编码技术[6 7]进行优化。 2017年,运动图像专家组(MPEG)征求了点云压缩的提案,并就如何压缩此类数据进行了后续讨论。随着点云压缩方法的不断出现和出现,13年发布了两种点云数据压缩框架TMC2和TMC2018。上述研究表明点云压缩技术已经取得了显着的进展。然而,先前的工作主要分别处理点云的空间和时间相关性,但尚未充分发挥其在点云压缩方面的潜力。
为了解决上述挑战,我们引入了一种时空上下文引导的无损点云几何压缩方法。我们首先沿着主轴将点云划分为单元层。然后,我们采用时空相关性,通过旅行商算法设计预测模式。最后,使用上下文自适应算术编码器将残差写入比特流。我们的主要贡献如下。
1)我们通过扩展旅行商问题(TSP)设计了一种适用于帧内和帧间点云的预测模式。通过利用点云的空间和时间冗余,几何预测可以更好地利用空间相关性,从而实现各种类型的场景。
2)我们提出了一种具有快速上下文更新的自适应算术编码器,它从上下文字典中选择最佳的3D上下文,并抑制熵估计的增加。因此,它提高了熵编码器的概率计算效率并产生显着的压缩结果。
本文的其余部分结构如下。第 2 节概述了点云几何压缩的相关工作。第 3 节首先提出了一个结束语view 拟议的框架。然后,详细描述了所提出的方法。实验结果和结论分别在第 4 节和第 5 节中介绍。

相关工作

文献中已经提出了许多点云几何压缩算法。曹等人。 [8] 和 GRAZIOSI 等人。 [9]对当前点云压缩方法进行了调查和总结,分别关注空间维度压缩技术和MPEG标准化框架。我们提供一个简短的重新view 最近的进展分为两类:单帧点云压缩和多帧点云压缩。

  1. 单帧点云压缩
    单帧点云广泛应用于工程测量、文化遗产tage 保存、地理信息系统和其他场景。八叉树是一种广泛使用的数据结构,可以有效地表示点云,可以通过占用的节点记录信息来压缩点云。黄等[10]提出一种基于八叉树的方法,将点云递归地细分为节点,其位置由每个单元的几何中心表示。范等人[11]通过引入聚类分析来生成细节级别 (LOD) 层次结构并以广度优先顺序对其进行编码,进一步改进了该方法。然而,这些方法可能会由于迭代过程中对原始模型的近似而导致失真。
    为了解决这些局限性,学者们引入了几何结构特征,例如三角表面模型[12]、平面模型[13 14]和聚类算法[15],用于层间预测和残差计算。 RENTE等人[16]提出了渐进分层压缩的概念,首先使用八叉树结构进行粗粒度编码,然后使用图傅立叶变换进行云细节的压缩和重建。 2019年,MPEG发布了针对静态和动态点云的基于几何的点云压缩(G-PCC)技术,该技术通过坐标变换、体素化、几何结构分析和算术编码逐步实现[17]。
    由于八叉树内的某些八分圆可能稀疏甚至是空的,因此已经提出了一些方法通过修剪子节点来优化树结构,从而节省内存分配。对于前ample,DRICOT 等人。 [18]提出了一种推断直接编码模式(IDCM),用于基于稀疏性分析的预定义条件终止八叉树分区,其中涉及修剪八叉树结构以保存分配给子节点的位。张等人。 [19]建议沿主成分细分点云空间,并采用二叉树、四叉树和八叉树的划分方法。与传统的八叉树划分相比,上述混合模型可以有效减少用于表示稀疏点的位数,从而节省需要编码的节点。但过程中需要复杂的超参数条件和模式确定,难以满足自适应和低复杂度的要求。
    随着深度神经网络在图像和视频压缩方面取得重大进展,研究人员探索了通过利用超先验指导和压缩过程中潜在空间表达的冗余来进一步降低比特率的方法。 QUACH等人[20]黄等人[21]提出结合这些概念的方法。瓜达等人。结合卷积神经网络和自动编码器来利用相邻点之间的冗余并增强参考文献中的编码适应性。 [22]。最近,王等人。 [23]提出了一种基于变分自动编码器的点云压缩方法,通过学习超先验并减少算术编码的内存消耗来提高压缩率。上述方法利用神经网络编码器捕获点云的高阶隐向量、熵模型概率以及拟合较好的边缘概率,从而减少算术编码的内存消耗。总体而言,单帧点云几何压缩的研究相对成熟,但仍存在两个挑战。空间相关性尚未得到有效利用,大多数方法没有对点云数据的相关性进行彻底、高效的编码。此外,由于上下文数量巨大,熵编码的概率模型的计算显得漫长而艰巨。
  2. 多帧点云压缩
    多帧点云常用于实时3D沉浸式网真、交互式VR、3D自由等场景 view点播和自动驾驶。与单帧点云压缩不同,多帧点云压缩优先使用时间相关性以及运动估计和补偿。现有的多帧点云压缩方法可以分为两类:2D投影和3D去相关。
    图像和视频压缩领域非常广泛,并且在过去几十年中得到了深入的探索。各种算法将点云转换为图像,然后通过FFmpeg和H. 265编码器等直接压缩。AINALA等人[24]提出了一种平面投影近似编码模式,通过在平面上进行光栅扫描对几何和颜色属性进行编码。然而,这种方法会在映射过程中导致目标形状发生变化,从而导致准确的帧间预测变得困难。因此,SCHWARZ 等人[25]和 SEVOM 等人[26]建议分别使用旋转平面投影、立方体投影和基于面片的投影方法将点云转换为 2D 视频。通过将相似的投影放置在相邻图像中相同位置的相邻帧中,视频压缩器可以完全消除时间相关性。在参考文献中。 [27],几何间预测是通过TSP进行的,它通过搜索具有最接近平均值的块来计算相邻块内块的一一对应关系。 MPEG于2019年发布了针对动态点云的基于视频的点云压缩(V-PCC)技术[28]。该框架将输入点云划分为具有相似法向量和连续空间的小块,然后通过立方体将它们转换为平面,以记录占用图像和辅助信息。所有生成的图像均由成熟的视频编解码器压缩,所有比特流均组装成单个输出 file。已经进行了其他尝试来提高这些方法的有效性。 COSTA等人[29]从打包算法、数据打包环节、相关排序、定位指标的优化角度,探索了几种新的补丁打包策略。此外,帕克等人。 [30]设计了一种数据自适应打包方法,根据结构相似性将相邻帧自适应地分组到同一组中,而不影响V-PCC流的性能。由于点云投影不可避免地会造成信息丢失,学者们开发了有效的技术,利用基于3D空间的运动补偿技术来压缩连续帧的点云序列。 KAMMERL 等人[31]提出了一种基于八叉树的几何编码方法,通过执行相邻帧之间的异或(XOR)差异来实现高压缩效率。该方法不仅被流行的点云库(PCL)[32]采用,而且广泛用于进一步的算法研究。其他帧间方法将 3D 运动估计问题转换为特征匹配问题[33]或使用重建的几何信息[34]来预测运动矢量并准确识别相邻帧之间的对应关系。最近的爆炸性研究[35 36]表明,学习视频压缩比传统视频压缩提供了更好的率失真性能,为点云压缩带来了重要的参考意义。赵浩等[37]引入双向帧间预测网络来进行帧间预测,并带来空间和时间维度上相关信息的有效利用。卡亚等人。 [38]设计了一种新的密集点云序列几何特征编码范式,优化CNN估计编码分布,实现密集点云的无损压缩。
    尽管多帧点云模型的压缩编码技术取得了进展,但仍然存在两个问题。现有的多帧点云压缩方法主要依靠视频编码和运动补偿,这不可避免地会涉及映射和块边缘不连续性引起的信息丢失或失真。此外,由于帧间点云几何形状的不一致,预测编码的适用性较低。帧之间点的明显偏移和不可避免的噪声增加了在帧间压缩中有效使用预测编码的难度。

提出的时空上下文引导无损几何点云压缩方法

超过view
我们的时空上下文引导算法的整体流程如图 1 所示。首先,我们通过应用体素化和尺度变换来预处理输入点云。然后,将点云沿主轴分为单位厚度的切片层。接下来,我们设计了一种充分利用帧内和帧间的时间和空间相关性信息的预测模式。我们通过旅行商算法计算参考层(R层)点的最短路径,然后使用R层的结果进行时空预测并对其余点云进行编码,即预测层(P层) )。最后采用改进的熵编码算法得到压缩后的二进制文件 file.中兴通讯引导无损点云几何压缩算法- (2)

基于图像切片的层次划分

  1. 预处理
    预处理模块包括体素化和尺度变换,以便更好地索引每个特定点。在体素化中,我们将空间划分为大小为 N 的立方体,这对应于点云的实际分辨率。每个点都根据其位置分配一个唯一的体素。一个体素记为1;如果被正占用,则为0,否则为XNUMX。尺度变换可以通过缩小点云(点之间的距离变小)来降低稀疏性,从而获得更好的压缩效果。我们使用缩放因子 s 聚合点云坐标(x,y,z),即中兴通讯引导无损点云几何压缩算法- (3)
    为了保证无损压缩,我们需要确保缩放因子s不会导致几何损失,并且需要记录在标头中 file.
  2. 切片层划分
    该模块的工作原理是沿其一个轴划分 3D 点云,创建多个仅包含占用和非占用信息的单位切片层,这些信息可以使用预测编码器和算术编码器进一步压缩。该函数定义为:中兴通讯引导无损点云几何压缩算法- (4)
    其中G指的是输入点云坐标矩阵,axis指的是选择的维度,S(a,b)是每层提取的2D切片。一般来说,我们对大量测试序列进行实验,结果表明沿点云空间变化最长轴的划分产生最低的比特率,即中兴通讯引导无损点云几何压缩算法- (5)
  3. 最小边界框提取
    在大多数情况下,占用的体素通常是不可避免的,并且数量大大超过占用的体素。因此,同时处理和编码两种类型的体素会增加压缩算法的计算复杂性和编码速度。因此,我们采用定向边界框(OBB)[39]来计算每个切片层的最小边界框,确保各层边界框的方向一致。在后续处理中,仅压缩位于受限矩形内的体素。

空间上下文引导预测编码

空间上下文引导预测编码的目标是逐层编码所有点。受 TSP 的启发,我们设计了一种预测模式来探索每个切片层内的潜在顺序和相关性。该模块由分区和最短路径计算组成。
首先,我们对切片层进行分区并确定每个组的 R 层和 R 层。我们沿着选定的轴逐层遍历点云。当相邻层之间的最小包围盒主方向的长度相差指定单位长度时,记录为同一组。否则,作为下一组的参考层,并且下一组中的每个点云都使用相同的最短路径。在本文中,我们将每组的第一层设置为R层,其他层设置为P层。我们还对大量测试序列进行了实验,建议将此指定参数设置为3个单位以获得最佳压缩效果。
然后,我们对R层进行最短路径计算并记录Player的残差。根据各切片层点云的分布规律,基于TSP算法对各切片层的不规则点云进行优化排列。这使我们能够有效地计算到 R 层点云的最短路径,然后记录相应预测层的残差。算法 1 显示了预测过程的伪代码。

中兴通讯引导无损点云几何压缩算法- (6)

首先,我们定义局部区域内点之间的距离计算规则,并用随机选择的点pc1初始化路径状态。在每次迭代中,每当添加一个新点 pci 时,就会通过状态转移方程 path(P – i, i) 动态更新排列,直到所有添加的点按照最短路径的顺序记录在 P 中。该过程基于最小距离准则逐渐修改。在总最短路径中完成所有迭代后,我们计算最小值 中兴通讯引导无损点云几何压缩算法- (8) 计算每个R层中的dist(pci, pcj ),返回每个R层中点云的最短路径记录表。为了进一步压缩,我们计算同一组内 P 层与 R 层最短路径的偏差,并将其记录为预测残差。最后,输出Rlayer的最短路径和每组残差,并传递给熵编码器以进一步压缩预测残差。

时空上下文引导预测编码
空间上下文引导预测模式编码
单独的单帧点云。然而,单独对每个单帧点云应用空间编码可能会错过多帧点云的时间相关性所暴露的机会。考虑到多帧点云共享大量重叠,我们专注于使用时间冗余来进一步提高压缩效率。因此,基于所提出的空间上下文引导预测模式,我们可以通过识别跨帧的相邻层之间的对应关系来压缩多帧点云。

  1. 帧间划分
    为了增强帧间预测模式的有效性,保证相邻层帧之间足够的相似性至关重要。因此,我们需要对相邻帧之间的组进行划分,并确定跨帧的 R 层和 P 层。通过基于 R 层的最短路径估计 P 层的最短路径,我们记录预测残差并通过熵编码器进一步压缩它们。算法2显示了帧间划分的伪代码。中兴通讯引导无损点云几何压缩算法- (7)
    基于切片层方向对齐,我们依次实现了粗划分和细划分。对于粗划分,我们根据划分轴对应的坐标从小到大对每帧的切片层进行排序。因此,每帧的每个切片层都有唯一的层编号,允许我们粗略地划分相邻帧之间具有相同编号的切片层。然后,我们计算具有相同数量的相邻层的最小边界框的主轴长度之间的差异。如果该值小于或等于指定的长度单位,则层将被划分到同一组中。否则,我们将相邻帧对应层中最小边界框的主方向轴长度与相邻帧中指定层的编号前后的差值进行比较。然后将差异最小的层划分到同一组中。这样就保证了相邻层之间的精细划分,从而实现了相邻关系的精细划分。
  2. 时空上下文引导预测模式
    基于分区,我们应用并扩展了3.3节中提到的预测模式。我们在此过程中结合了帧间上下文,这意味着每组的第一层(充当 R 层)可能不一定会产生最佳预测结果。为了充分探索相邻层之间的潜在相关性,我们需要公开最佳预测模式。
    首先,我们计算当前组中每个切片层用作 R 层时的预测残差。通过比较所有情况下的预测残差,我们选择具有最小绝对残差值的R层作为最佳预测模式。对于R层最短路径计算,我们使用旅行商算法来计算最佳预测模式下R层的最短路径。此外,我们计算每组在各自最佳预测模式下的预测残差。我们还记录每组的占用长度和R层信息,以便在后续处理中进一步压缩。在后续操作中,我们对上述信息采用基于最佳上下文选择的算术编码来完成多帧点云几何压缩算法的整个过程。

基于上下文字典的算术编码
点云中的大量上下文在算术编码计算复杂性方面显着加重了整个压缩方案的负担。我们从以下两个模块改进了算术编码。 1)我们建立上下文字典,并根据熵估计选择和更新全局最优值,然后2)我们采用自适应编码器来有效计算概率的上下界。

  1. 上下文字典构建中兴通讯引导无损点云几何压缩算法- (10)
  2. 我们构造一个表示三元组队列的上下文字典,由每个切片层的点云坐标及其相应的非空上下文的整数表示组成。因此,我们将点云中包含的体素与每层的最小边界框及其非空上下文相关联。为了清楚地说明上下文字典的三重队列数组的构造,我们在图2中给出直观的解释。对于图2中的阴影两个方块,仅考虑上下文映射位置pc1和pc2。沿 x 轴和 y 轴的上下文贡献分别记录到两个队列 QX 和 QY 中。因此上下文字典由 QX - 和 QY - 组成。具有相同坐标的队列元素被集成为一个三元组,其上下文整数表示被计算为合并的三元组的上下文贡献之和。
    因此,每个体素的上下文可以计算为其上下文字典中占用体素的独立贡献的总和。这种结构有助于确定是否应将体素添加到上下文字典中,而无需进行繁琐的矩阵查找,从而显着降低计算复杂性和运行时间。
  3. 概率计算
    为了计算熵概率,必须考虑序列的长度及其组成体素的上下文。在这个模块中,我们设计了一个自适应编码器,它首先根据上下文字典估计每个组的累积概率上限和下限,然后对其进行编码。首先,我们基于马尔可夫链模型构造一棵二叉树。通过遍历体素的占用情况,我们分别为占用体素和空体素分配值1和0,并根据树结构计算概率。从根节点开始,当一个体素被占用时,我们将左子节点记为1,否则将右子节点记为0,并进行下一步判断和划分。占据体素的运行概率的计算公式可以在式(4)中找到。 (XNUMX)。

对于小于或等于n的游程长度,可能有2n个表示体素的占用状态的树节点。因此,任何占用体素的概率由遍历从根开始到树的任何无子节点结束的所有状态的独立联合概率来表示。基于等式。 (4)、为了对体素序列的占用进行算术编码,需要序列的累积上、下概率,如式(5)所示。 (XNUMX)。中兴通讯引导无损点云几何压缩算法- (11)

采用这种方法,我们可以利用算术编码的自适应特性,根据优化的概率估计模型和当前符号序列中每个符号的频率来调整每个符号的概率估计值。这使我们能够计算占用体素的累积概率的上限和下限并完成编码过程。

实验

实现细节

  1. 数据集。为了验证我们提出的方法的性能,我们对 16 个点云数据集进行了广泛的实验,这些数据可以从参考文献中下载。 [40],如图3所示,其中,图3(a)-3(l)是具有密集点的肖像,图3(a)-3(l)是具有密集点的肖像。 3(m) – 3(p) 是具有稀疏点的架构。无花果。图 3(a) – 3(h) 是从 Microsoft 获得的两种空间分辨率的体素化上半身点云数据序列。无花果。 8(i)– 3(l) 选自 3i 体素化全身点云数据序列。图 XNUMX 和 XNUMX 中剩余的大规模稀疏点云。 XNUMX(k)– XNUMX(p) 是静态立面和建筑数据集。
  2. 评估指标。所提出方法的性能以每点位数(BPP)来评估。 BPP是指该点所附带的坐标信息所占用的位数之和。值越低,性能越好。 中兴通讯引导无损点云几何压缩算法- (12)其中Sizedig表示点云数据的坐标信息所占用的位数,k指原始点云中的点数。
  3. 基准。我们主要将我们的方法与其他基线算法进行比较,包括: PCL-PCC:PCL 中基于八叉树的压缩; G-PCC(MPEG帧内编码器测试模型)和interEM(MPEG帧间编码器测试模型)分别针对单帧和多帧点云压缩; Silhouette 3D (S3D)[41] 和 Silhouette 4D (S4D)[42] 分别针对单帧和多帧点云压缩。
    对于 PCL,我们使用 PCL-v1.8.1 中的八叉树点云压缩方法仅用于几何压缩。我们根据点精度和体素分辨率设置八叉树分辨率参数。对于 G-PCC (TM13-v11.0),我们选择无损几何 中兴通讯引导无损点云几何压缩算法- (13) 中兴通讯引导无损点云几何压缩算法- (14)—无损属性条件处于八叉树预测模式,将参数保留为默认值。对于interEM(tmc3v3.0),我们使用无损几何和无损属性条件下的实验结果作为比较[43]。对于S3D
    和S4D,我们遵循默认的条件和参数。
  4. 硬件。所提出的算法使用 PCL-v1.8.1 的一些函数在 Matlab 和 C++ 中实现。所有实验均在配备 Intel Core i7-8750 CPU @2.20 GHz、8 GB 内存的笔记本电脑上进行测试。

单帧点云压缩结果

  1. 密集点云数据序列肖像的压缩结果
    表 1 显示了我们的空间上下文引导无损点云几何压缩算法与 PCL-PCC、G-PCC 和 S3D 方法在密集点云数据序列肖像上的性能比较。从表1可以看出,对于相同序列的所有点云,与其他方法相比,该方法实现了最低的压缩BPP。我们的算法相对于 S1.56D 的平均增益为 -0.02% 到 -3%,相对于 G-PCC 的平均增益为 -10.62% 到 -1.45%。表现出更明显的优势tage,即所提出算法的压缩性能增益范围为-10.62%到-1.45%;对于 PCL-PCC,所提出的算法在所有序列上显示出几乎翻倍的增益,范围从 -154.43% 到 -85.39%。
  2. 大规模稀疏点云数据的压缩结果
    由于S3D在这种情况下无法工作,因此我们仅在大规模稀疏点云数据上将我们的空间上下文引导无损几何点云压缩算法与PCL-PCC和G-PCC方法进行比较。同样,我们的算法在 G-PCC 和 PCL-PCC 上取得了相当大的性能,如表 1 所示。结果表明,与 G-PCC 相比,平均 BPP 增益范围为 - 8.84% 到 -4.35%。对于PCL-PCC,我们提出的算法显示出更明显的优势tages,增益范围为-34.69%至-23.94%。
  3. 概括
    为了更全面地比较单帧点云压缩结果,表 2 列出了我们的空间上下文引导压缩方法和其他最先进的基准方法之间的平均结果。与 S3D 相比,我们提出的方法显示平均增益范围为 - 0.58% 到 - 3.43%。至于G-PCC和PCL-PCC,平均增益分别至少达到-3.43%和-95.03%。实验分析表明,我们的空间上下文引导压缩方法明显优于当前的 S3D、G-PCC 和 PCL-PCC。因此,它可以满足各种场景类型(例如密集或稀疏分布)的点云几何的无损压缩要求,并且我们的方法的有效性始终保持不变。
  4. 多帧点云压缩结果
    我们针对现有的压缩算法(例如 S4D、PCL-PCC、G-PCC 和 interEM)评估了我们提出的时空上下文引导点云几何压缩算法。本实验仅使用密集点云数据序列的肖像。结果如图所示。

表 1. 我们的空间上下文引导压缩算法和基线方法的 BPP 比较。

中兴通讯引导无损点云几何压缩算法- (15)

表 2. BPP 与单帧点云数据上最先进的算法进行比较。中兴通讯引导无损点云几何压缩算法- (16)

表 3. 我们可以看到,经过预测模式和算术编码器的优化,所提出的算法在所有测试序列上都显示出优越性。具体来说,与 interEM 和 G-PCC 相比,所提出的算法显示出显着的增益,范围分别为 -51.94% 至 -17.13% 和 -46.62% 至 -5.7%。与S4D相比,所提出的算法显示出从-12.18%到-0.33%的稳健改进。至于 PCL-PCC,我们提出的算法几乎使所有测试序列减半。
此外,我们总结了该方法在人像密集点云数据序列上的压缩结果和增益,如表 4 所示。平均而言,与空间上下文引导点云相比,它的增益在 -11.5% 到 -2.59% 之间先前提出的几何压缩算法。此外,与 G-PCC 相比,它的平均增益高达 -19%,与 interEM 相比,平均编码增益为 -24.55%。此外,与S3D和S4D相比,其平均增益分别超过-6.11%和-3.64%。总体实验分析表明,时空上下文引导点云压缩方法可以充分利用帧内和帧间相邻层的空间和时间相关性。我们还改进算术编码器的全局上下文选择和概率模型以获得更低的比特率。所提出的方法超越了最先进算法的性能,从而满足动态肖像等多媒体应用场景中点云几何无损压缩的要求。

表 3. 我们的时空上下文引导压缩算法和基线方法的逐点比较。中兴通讯引导无损点云几何压缩算法- (17)

表 4. 与多帧点云数据上最先进的算法进行逐点比较。中兴通讯引导无损点云几何压缩算法- (18)

消融研究
我们对 8i 体素化全身点云数据序列的预测编码进行消融研究,以证明分区的有效性。从表5中可以看出,与非分区预测编码相比,改进显示多帧点云压缩稳定增益为-70%,单帧点云压缩稳定增益为-60%。
接下来,我们对算术编码进行消融实验,以证明上下文字典的有效性。如表6所示,在我们的方法中观察到,与没有上下文字典的算术编码相比,多帧点云压缩有-33%的稳健改进,单帧点云压缩有-41%的稳健改进。

中兴通讯引导无损点云几何压缩算法- (19) 中兴通讯引导无损点云几何压缩算法- (20)

时间消耗
我们测试时间消耗来评估算法复杂性并将所提出的方法与其他方法进行比较。算法复杂度由编码器和解码器独立分析,如表7所示。可以看出,G-PCC、interEM和PCL-PCC可以实现小于10 s的编码时间和小于5 s的解码时间。纵向密集点云数据。与其他方法相比,它们在大规模稀疏点云数据中也表现良好。我们提出的算法需要大约 60 秒和 15 秒来编码和解码肖像序列,对于立面和建筑点云数据甚至需要更多时间。比特率和压缩速度之间需要权衡。与需要数百秒编码的S3D和S4D相比,我们的耗时方法可以显示出优越性。
综上所述,我们提出的方法的时间消耗在所有比较算法中处于中等水平,但仍需要进一步改进。

结论

本文提出了一种时空上下文引导的无损点云几何压缩方法。我们以单位厚度的切片点云为输入单元,采用基于旅行商算法的几何预测编码模式,该模式适用于帧内和帧间。此外,我们充分利用全局上下文信息和基于上下文快速更新的自适应算术编码器来实现点云的无损压缩和解压缩结果。实验结果证明了我们方法的有效性及其相对于之前研究的优越性。对于未来的工作,我们计划进一步研究算法的整体复杂度,通过降低算法复杂度来实现高速压缩率和低码率压缩的结果。在各种类型的场景中都非常需要低比特率和实时/低延迟支持的方法。

参考

  1. 米XX,杨本生,董Z,等。使用 MLS 点云自动 3D 道路边界提取和矢量化 [J]. IEEE 智能交通系统交易,2022 年,23(6):5287 – 5297。DOI:10.1109/ TITS.2021.3052882
  2. 董Z,梁FX,杨本生,等。大型地面激光扫描仪点云的配准:重新view 和基准[J]. ISPRS 摄影测量与遥感杂志,2020,163:327–342。DOI:10.1016/j.isprsjprs.2020.03.013
  3. GRAZIOSI D、NAKAGAMI O、KUMA S 等。一个结束view 正在进行的点云压缩标准化活动:基于视频(V-PCC)和基于几何(G-PCC)[J]。 APSIPA 信号和信息处理交易,2020 年,9:e13
  4. DE QUEIROZ RL, CHOU P A. 使用区域自适应分层变换压缩 3D 点云 [J]. IEEE 图像处理交易,2016,25(8):3947–3956。 DOI:10.1109/TIP.2016.2575005
  5. 布莱特勒 A、帕扬 F、安东尼尼 M 等。利用深度图进行点云压缩[J].电子成像,2016,2016(21):1–6
  6. MEKURIA R,BLOM K,CESAR P。远程沉浸式视频点云编解码器的设计、实现和评估[J]。 IEEE 视频技术电路和系统交易,2017 年,27(4):828 – 842。DOI:10.1109/ TCSVT.2016.2543039
  7. DE QUEIROZ RL, CHOU P A. 动态体素化点云的运动补偿压缩[J]. IEEE 图像处理交易,2017 年,26 (8):3886–3895。 DOI:10.1109/TIP.2017.2707807
  8. CAO C, PREDA M, ZAHARIA T. 3D 点云压缩:一项调查 [C]// 第 24 届 3D 国际会议 Web 技术。 ACM,2019:1-9。 DOI:10.1145/3329714.3338130
  9. GRAZIOSI D、NAKAGAMI O、KUMA S 等。一个结束view 正在进行的点云压缩标准化活动:基于视频(V-PCC)和基于几何(G-PCC)[J]。 APSIPA 信号和信息处理交易,2020 年,9(1):e13。 DOI:10.1017/atsip.2020.12
  10. 黄Y,彭建良,郭成杰,等。基于八叉树的点云渐进几何编码 [C]//第三届 Eurographics/IEEE VGTC 基于点的图形会议。 IEEE,3:2016–103
  11. 范YX,黄Y,彭J L。基于层次点聚类的点云压缩[C]//亚太信号与信息处理协会年度峰会暨会议。 IEEE,2014:1 – 7。DOI:10.1109/APSIPA.2013.6694334
  12. DRICOT A,ASCENSO J.基于几何的点云编码的自适应多级三角汤[C]//第21届多媒体信号处理国际研讨会(MMSP)。 IEEE,2019:1 – 6。DOI:10.1109/MMSP.2019.8901791
  13. 何超,冉丽清,王丽,等。基于形状模式分析的点集曲面压缩[J].多媒体工具与应用,2017,76(20):20545–20565。 DOI:10.1007/s11042-016-3991-0
  14. IMDAD U、ASIF M、AHMAD M 等。利用一阶多项式进行三维点云压缩与解压[J].对称性, 2019, 11(2): 209. DOI: 10.3390/sym11020209
  15. 孙晓波,马辉,孙玉新,等。一种基于聚类的点云压缩算法[J]. IEEE 机器人和自动化快报,2019 年,4(2):2132–2139。 DOI:10.1109/LRA.2019.2900747
  16. DE OLIVEIRA RENTE P、BRITES C、ASCENSO J 等人。基于图的静态3D点云几何编码[J]. IEEE 多媒体交易,2019,21(2):284–299。 DOI:10.1109/TMM.2018.2859591
  17. 国际标准化组织。基于几何的点云压缩(G-PCC):ISO/IEC 23090-9 [S]。 2021年
  18. DRICOT A, ASCENSO J. 混合八叉树平面点云几何编码 [C]//第 27 届欧洲信号处理会议(EUSIPCO)。 IEEE,2019:1–5
  19. 张旭,高伟,刘书.点云压缩的隐式几何划分[C]//2020年数据压缩会议(DCC)论文集。 IEEE,2020:73-82。 DOI:10.1109/DCC47342.2020.00015
  20. QUACH M, VALENZISE G, DUFAUX F. 学习有损点云几何压缩的卷积变换 [C]//2019 年 IEEE 国际图像处理会议 (ICIP)。 IEEE,2019:4320–4324。DOI:10.1109/ICIP.2019.8803413
  21. HUANG TX, LIU Y. 深度学习中的3D点云几何压缩[C]//第27届ACM国际多媒体会议。 ACM,2019:890–898。 DOI:10.1145/3343031.3351061
  22. GUARDA AFR,RODRIGUES NMM,PEREIRA F。点云编码:采用基于深度学习的方法[C]//图片编码研讨会(PCS)。 IEEE,2020:1-5。 DOI:10.1109/PCS48520.2019.8954537
  23. 王家庆,朱华,马Z,等。学习点云几何压缩[EB/OL]。 [2023-09-01]。 https://arxiv.org/abs/1909.12037.pdf
  24. AINALA K、MEKURIA RN、KHATHARIYA B 等人。一种基于平面投影近似的八叉树点云压缩的改进增强层[C]//SPIE Optical Engineering+Applications。 SPIE,2016:223–231。DOI:10.1117/12.2237753
  25. SCHWARZ S、HANNUKSELA MM、FAKOUR-SEVOM V 等。体积视频数据的 2D 视频编码 [C]//图片编码研讨会 (PCS)。 IEEE,2018:61-65。 DOI:10.1109/PCS.2018.8456265
  26. FAKOUR SEVOM V, SCHWARZ S, GABBOUJ M. 用于基于投影的动态点云编码的几何引导 3D 数据插值 [C]//第七届欧洲视觉信息处理研讨会 (EUVIP)。 IEEE,7:2019-1。 DOI:6/EUVIP.0.1109
  27. KATHARIYA B、LI L、LI Z 等。具有相互补偿和旅行商预测的无损动态点云几何压缩[C]//数据压缩会议。 IEEE,2018:414。DOI:10.1109/DCC.2018.00067
  28. 国际标准化组织。基于视觉体积视频的编码 (V3C) 和基于视频的点云压缩:ISO/IEC 23090-5 [S]。 2021年
  29. PARK J、LEE J、PARK S 等。基于投影的占用图编码的 3D 点云压缩 [J]. IEIE 智能处理与计算交易,2020,9(4):293–297。 DOI:10.5573/ieiespc.2020.9.4.293
  30. COSTA A、DRICOT A、BRITES C 等。改进了 MPEG V-PCC 标准的补丁封装 [C]//IEEE 第 21 届多媒体信号处理国际研讨会 (MMSP)。 IEEE,2019:1 – 6。DOI:10.1109/MMSP.2019.8901690
  31. KAMMERL J、BLODOW N、RUSU RB 等人。点云流的实时压缩[C]//2012年IEEE机器人与自动化国际会议论文集。 IEEE,2012:778 – 785。DOI:10.1109/ICRA.2012.6224647
  32. PCL。点云库。 [EB/OL]。 [2023-09-01]。 http://pointclouds.org/
  33. THANOU D, CHOU PA, FROSSARD P. 基于图的动态 3D 点云序列压缩 [J]. IEEE 图像处理交易,2016,25(4):1765–1778。 DOI:10.1109/TIP.2016.2529506
  34. LI L、LI Z、ZAKHARCHENKO V 等。基于视频的点云属性压缩的高级 3D 运动预测 [C]//数据压缩会议 (DCC)。 IEEE,2019:498–507。 DOI:10.1109/DCC.2019.00058
    赵丽丽,马康,林XH,等。使用双向预测和范围自适应浮点编码的实时LiDAR点云压缩[J]. IEEE 广播交易,2022 年,68(3):620 – 635。DOI:10.1109/TBC.2022.3162406
  35. 林建平,刘德,李红旗,等。 M-LVC:用于学习视频压缩的多帧预测 [C]//IEEE/CVF 计算机视觉和模式识别会议。 IEEE,2020:3543 – 3551。DOI:10.1109/CVPR42600.2020.00360
  36. 杨 R、门泽尔 F、范古尔 L 等。学习具有分层质量和循环增强的视频压缩 [C]//IEEE/CVF 计算机视觉和模式识别会议。 IEEE,2020:6627–6636.DOI:10.1109/CVPR42600.2020.00666
  37. KAYA EC, TABUS I. 使用序列优化 CNN 模型对点云序列进行无损压缩 [J]. IEEE 访问,2022 年,10:83678 –83691。 DOI:10.1109/ACCESS.2022.3197295
  38. 丁S, 马曼南, POO A N. 自由曲面五轴加工中的定向包围盒和基于八叉树的全局干涉检测[J].计算机辅助设计, 5, 2004(36): 13-1281
  39. ALEXIOU E、VIOLA I、BORGES TM 等。 MPEG点云压缩率失真性能综合研究[J]. APSIPA 信号和信息处理交易,2019 年,8:e27。 doi:10.1017/ATSIP.2019.20
  40. PEIXOTO E. 使用二元分解进行点云几何的帧内压缩 [J]. IEEE 信号处理快报,2020 年,27:246–250。 DOI:10.1109/LSP.2020.2965322
  41. RAMALHO E, PEIXOTO E, MEDEIROS E. 具有上下文选择的 Silhouette 4D:动态点云的无损几何压缩 [J]. IEEE 信号处理快报,2021 年,28:1660 – 1664。DOI:10.1109/lsp.2021.3102525
  42. 国际标准化组织。 G-PCC 文档 N00106 的通用测试条件:ISO/IEC JTC 1/ SC 29/WG 7 MPEG [S]。 2021年

人物生平

  • 张惠然 分别于2020年和2023年在中国武汉大学测绘与测绘学院和测绘遥感信息工程国家重点实验室获得学士和硕士学位。现任中国广州市城市规划设计勘察研究院测量师。她的研究兴趣包括点云数据处理和压缩。参与遥感领域多个项目,在《武汉大学测绘与信息科学》杂志上发表论文XNUMX篇。
  • 董震 (dongzhenwhu@whu.edu.cn)分别于2011年和2018年在中国武汉大学获得遥感与摄影测量学学士和博士学位。武汉大学测绘遥感信息工程国家重点实验室(LIESMARS)教授。他的研究兴趣包括3D重建、场景理解、点云处理及其在智能交通系统、数字孪生城市、城市可持续发展和机器人中的应用。获得国内外各类比赛奖项10余项,在各类期刊和会议上发表论文60余篇。
    王明生 2001年毕业于吉林大学计算机科学与技术学院,获学士学位;2004年毕业于华南理工大学计算机科学与工程学院,获硕士学位。现任广州市城市规划局高级工程师。中国设计测量研究院。他的研究兴趣包括计算机应用和软件、地理学和测量。获得国家级各类竞赛20余项荣誉,在各类期刊和会议上发表论文50余篇。

DOI:10.12142/ZTECOM.202304003
https://kns.cnki.net/kcms/detail/34.1294.TN.20231108.1004.002.html,于 8 年 2023 月 XNUMX 日在线发布
稿件收到时间:2023-09-11

文件/资源

中兴通讯引导无损点云几何压缩算法 [pdf] 用户指南
无损点云几何压缩引导算法, 引导, 无损点云几何压缩算法, 无损点云几何压缩, 点云几何压缩, 几何压缩

参考

发表评论

您的电子邮件地址不会被公开。 必填字段已标记 *