中興-LOGO

中興通訊引導無損點雲幾何壓縮演算法

中興通訊無損點雲幾何壓縮PRO演算法

規格:

  • 產品名稱: 無損點雲幾何壓縮的時空上下文引導演算法
  • 作者: 張惠然、董震、王明生
  • 發表: 2023 年 XNUMX 月
  • 數字編號: 10.12142/中興通訊.202304003

產品使用說明

介紹:
該產品旨在高效壓縮點雲數據,解決儲存空間容量和網路傳輸頻寬方面的挑戰。

主要特點:

  1. 使用擴展旅行商問題適用於幀內和幀間點雲的預測模式。
  2. 具有快速上下文更新的自適應算術編碼器,可實現高效的機率計算和壓縮結果。

使用步驟:

第1步:劃分點雲
沿主軸將點雲劃分為單位層。

步驟2:設計預測模式
使用旅行商演算法設計預測模式以利用空間和時間冗餘。

第 3 步:對殘差進行編碼
使用上下文自適應算術編碼器將殘差寫入位元流中進行壓縮。

常問問題:

  • Q:使用該產品的主要好處是什麼?
    A: 該產品能夠有效壓縮點雲數據,利用空間和時間相關性來增強壓縮結果。
  • Q:該產品可以同時處理單幀和多幀點雲嗎?
    A: 是的,預測模式適用於幀內和幀間點雲,允許多種使用場景。

張惠然、董震、王明生

  1. 廣州市城市規劃設計勘察研究院, 廣州 510060;
  2. 廣東省城市感知監測預警企業重點實驗室,廣東 廣州 510060;
  3. 武漢大學測繪遙感資訊工程國家重點實驗室,湖北 武漢 430079)

抽象的: 點雲壓縮對於部署實體世界的 3D 表示至關重要,例如 3D 沉浸式遠端呈現、自動駕駛和文化傳承tage 保存。然而,點雲資料在空間和時間域中分佈不規則且不連續,其中冗餘的未佔用體素和3D空間中的弱相關性使得實現高效壓縮成為一個具有挑戰性的問題。在本文中,我們提出了一種用於無損點雲幾何壓縮的時空上下文引導演算法。所提出的方案首先將點雲沿最長軸劃分為單位厚度的切片層。然後,介紹了一種幀內和幀間點雲都可用的預測方法,透過確定相鄰層之間的對應關係並使用旅行商演算法估計最短路徑。最後,利用最佳情境引導和自適應快速模式算術編碼技術有效地壓縮少量預測殘差。實驗證明,此方法能夠有效實現點雲幾何資訊的低碼率無損壓縮,適用於各類場景的3D點雲壓縮。
關鍵字: 點雲幾何壓縮;單幀點雲;多幀點雲;預測編碼;算術編碼。

引文(格式1): 張華瑞, 董澤, 王明生. 時空上下文引導的無損點雲幾何壓縮演算法[J]. 電腦應用, 2023, 21(4): 17-28.中興通訊,10.12142,202304003(XNUMX):XNUMX-XNUMX。 DOI:XNUMX/ZTECOM.XNUMX
引文(格式2): HR 張,Z. Dong,MS Wang,“無損點雲幾何壓縮的時空上下文引導演算法”,中興通訊,卷。 21、沒有。 4,第 17-28 頁,2023 年 10.12142 月。

 

介紹

隨著多平台、多解析度擷取設備效能的提高,光探測與測距(LiDAR)技術可以有效率地模擬具有海量點集的3D物體或場景。與傳統的多媒體數據相比,點雲數據包含了更多的物理測量信息,這些信息代表了自由空間中的物體。 view點,甚至具有複雜拓撲結構的場景。從而產生強烈的互動性和沈浸式效果,為使用者提供生動逼真的視覺化體驗。此外,點雲資料具有更強的抗雜訊能力和平行處理能力,這似乎受到了工業界和學術界的關注,特別是在文化傳承等應用領域。tag電子保存、3D沉浸式臨場感與自動駕駛[1-2]。
然而,點雲資料通常包含數百萬至數十億個空間域點,對儲存空間容量和網路傳輸頻寬帶來負擔和挑戰。例如,用於娛樂的常見動態點雲通常每幀包含約 30 萬個點,如果不壓縮,以每秒 3.6 幀計算,總頻寬為 3 Gbit/s[XNUMX]。因此,針對點雲的高效幾何壓縮演算法的研究具有重要的理論和實用價值。
先前的工作透過直接建立網格或按需停機來解決這個問題amp由於電腦運算能力和點雲採集效率的限制,導致時空壓縮性能低下,幾何屬性特徵資訊遺失。近期的研究主要基於電腦圖形學和數位訊號處理技術對點雲資料進行分塊操作[4 5]或結合視訊編碼技術[6 7]進行最佳化。 2017年,運動影像專家小組(MPEG)徵求了點雲壓縮的提案,並就如何壓縮此類數據進行了後續討論。隨著點雲壓縮方法的不斷出現和出現,13年發布了兩種點雲資料壓縮框架TMC2和TMC2018。然而,先前的工作主要分別處理點雲的空間和時間相關性,但尚未充分發揮其在點雲壓縮方面的潛力。
為了解決上述挑戰,我們引入了一種時空上下文引導的無損點雲幾何壓縮方法。我們先沿著主軸將點雲分割為單元層。然後,我們採用時空相關性,透過旅行商演算法設計預測模式。最後,使用上下文自適應算術編碼器將殘差寫入位元流。我們的主要貢獻如下。
1)我們透過擴展旅行商問題(TSP)設計了一種適用於幀內和幀間點雲的預測模式。透過利用點雲的空間和時間冗餘,幾何預測可以更好地利用空間相關性,從而實現各種類型的場景。
2)我們提出了一種具有快速上下文更新的自適應算術編碼器,它從上下文字典中選擇最佳的3D上下文,並抑制熵估計的增加。因此,它提高了熵編碼器的機率計算效率並產生顯著的壓縮結果。
本文的其餘部分架構如下。第 2 節概述了點雲幾何壓縮的相關工作。第 3 節首先介紹了一個結束語view 擬議的框架。然後,詳細描述了所提出的方法。實驗結果和結論分別在第 4 節和第 5 節中介紹。

相關工作

文獻中已經提出了許多點雲幾何壓縮演算法。曹等人。 [8] 和 GRAZIOSI 等人。 [9]對目前點雲壓縮方法進行了調查和總結,分別關注空間維度壓縮技術和MPEG標準化框架。我們提供一個簡短的重新view 最近的進展分為兩類:單幀點雲壓縮和多幀點雲壓縮。

  1. 單幀點雲壓縮
    單幀點雲廣泛應用於工程測量、文化遺產tage 儲存、地理資訊系統和其他場景。八叉樹是一種廣泛使用的資料結構,可以有效地表示點雲,可以透過佔用的節點記錄資訊來壓縮點雲。黃等[10]提出一種基於八叉樹的方法,該方法將點雲遞歸地細分為節點,其位置由每個單元的幾何中心表示。範等[11]透過引入聚類分析來產生細節層級 (LOD) 層次結構並以廣度優先順序對其進行編碼,進一步改進了此方法。然而,這些方法可能會由於迭代過程中對原始模型的近似而導致失真。
    為了解決這些局限性,學者們引入了幾何結構特徵,例如三角表面模型[12]、平面模型[13 14]和聚類演算法[15],用於層間預測和殘差計算。 RENTE等[16]提出了漸進分層壓縮的概念,首先使用八叉樹結構進行粗粒度編碼,然後使用圖傅立葉變換進行雲細節的壓縮和重建。 2019年,MPEG發布了針對靜態和動態點雲的基於幾何的點雲壓縮(G-PCC)技術,該技術透過座標變換、體素化、幾何結構分析和算術編碼逐步實現[17]。
    由於八叉樹內的某些八分圓可能稀疏甚至是空的,因此已經提出了一些方法透過修剪子節點來優化樹結構,從而節省記憶體分配。對於前ample,DRICOT 等人。 [18]提出了一種推斷直接編碼模式(IDCM),用於基於稀疏性分析的預定義條件終止八叉樹分區,其中涉及修剪八叉樹結構以保存分配給子節點的位元。張等人。 [19]建議沿著主成分細分點雲空間,並採用二元樹、四叉樹和八叉樹的劃分方法。與傳統的八叉樹分割相比,上述混合模型可以有效減少用於表示稀疏點的位數,從而節省需要編碼的節點。但過程中需要複雜的超參數條件和模式確定,難以滿足自適應和低複雜度的要求。
    隨著深度神經網路在影像和視訊壓縮方面取得重大進展,研究人員探索了透過利用超先驗指導和壓縮過程中潛在空間表達的冗餘來進一步降低位元率的方法。 QUACH等人[20]黃等人[21]提出結合這些概念的方法。瓜達等。結合卷積神經網路和自動編碼器來利用相鄰點之間的冗餘並增強參考文獻中的編碼適應性。 [22]。最近,王等人。 [23]提出了一種基於變分自動編碼器的點雲壓縮方法,透過學習超先驗並減少算術編碼的記憶體消耗來提高壓縮率。上述方法利用神經網路編碼器捕捉點雲的高階隱向量、熵模型機率以及擬合較好的邊緣機率,從而減少算術編碼的記憶體消耗。整體而言,單幀點雲幾何壓縮的研究相對成熟,但仍有兩個挑戰。空間相關性尚未有效利用,大多數方法沒有對點雲資料的相關性進行徹底、有效率的編碼。此外,由於上下文數量龐大,熵編碼的機率模型的計算顯得漫長而艱鉅。
  2. 多幀點雲壓縮
    多幀點雲常用於即時3D沉浸式網真、互動式VR、3D自由等場景 view點播和自動駕駛。與單幀點雲壓縮不同,多幀點雲壓縮優先使用時間相關性以及運動估計和補償。現有的多幀點雲壓縮方法可分為兩大類:2D投影和3D去相關。
    影像和視訊壓縮領域非常廣泛,並且在過去幾十年中得到了深入的探索。各種演算法將點雲轉換為影像,然後透過FFmpeg和H. 265編碼器等直接壓縮。屬性進行編碼。然而,這種方法會在映射過程中導致目標形狀發生變化,從而導致準確的幀間預測變得困難。因此,SCHWARZ 等人[24]和 SEVOM 等人[25]建議分別使用旋轉平面投影、立方體投影和基於面片的投影方法將點雲轉換為 26D 視訊。透過將相似的投影放置在相鄰影像中相同位置的相鄰幀中,視訊壓縮器可以完全消除時間相關性。在參考文獻中。 [2],幾何間預測是透過TSP進行的,它透過搜尋具有最接近平均值的區塊來計算相鄰區塊內區塊的一一對應關係。 MPEG於27年發布了針對動態點雲的基於視訊的點雲壓縮(V-PCC)技術[2019]。該框架將輸入點雲劃分為具有相似法向量和連續空間的小塊,然後透過立方體將它們轉換為平面,以記錄佔用影像和輔助資訊。所有產生的影像均由成熟的視訊編解碼器壓縮,所有位元流均組裝成單一輸出 file。已經進行了其他嘗試來提高這些方法的有效性。 COSTA等人[29]從打包演算法、資料打包環節、相關排序、定位指標的最佳化角度,探索了幾種新的補丁打包策略。此外,帕克等人。 [30]設計了一種資料自適應打包方法,根據結構相似性將相鄰幀自適應地分組到同一組中,而不影響V-PCC流的性能。由於點雲投影不可避免地會造成資訊損失,學者們開發了利用基於3D空間的運動補償技術來壓縮連續幀的點雲序列的有效技術。 KAMMERL 等人[31]提出了一種基於八叉樹的幾何編碼方法,透過執行相鄰幀之間的異或(XOR)差異來實現高壓縮效率。此方法不僅被流行的點雲庫(PCL)[32]所採用,而且被廣泛用於進一步的演算法研究。其他幀間方法將3D運動估計問題轉換為特徵匹配問題[33]或使用重建的幾何資訊[34]來預測運動向量並準確識別相鄰幀之間的對應關係。最近的爆炸性研究[35 36]表明,學習視訊壓縮比傳統視訊壓縮提供了更好的率失真性能,為點雲壓縮帶來了重要的參考意義。趙浩等[37]引入雙向幀間預測網路來進行幀間預測,並帶來空間和時間維度上相關資訊的有效利用。卡亞等人。 [38]設計了一種新的密集點雲序列幾何特徵編碼範式,優化CNN估計編碼分佈,實現密集點雲的無損壓縮。
    儘管多幀點雲模型的壓縮編碼技術取得了進展,但仍存在兩個問題。現有的多幀點雲壓縮方法主要依靠視訊編碼和運動補償,這不可避免地涉及映射和區塊邊緣不連續性引起的資訊遺失或失真。此外,由於幀間點雲幾何形狀的不一致,預測編碼的適用性較低。幀之間點的明顯偏移和不可避免的噪音增加了在幀間壓縮中有效使用預測編碼的難度。

提出的時空上下文引導無損幾何點雲壓縮方法

超過view
我們的時空上下文引導演算法的整體流程如圖 1 所示。然後,將點雲沿主軸分為單位厚度的切片層。接下來,我們設計了一個充分利用幀內和幀間的時間和空間相關性資訊的預測模式。我們透過旅行商演算法計算參考層(R層)點的最短路徑,然後使用R層的結果進行時空預測並對其餘點雲進行編碼,即預測層(P層) )。最後採用改進的熵編碼演算法得到壓縮後的二進位文件 file.中興通訊引導無損點雲幾何壓縮演算法- (2)

基於影像切片的層次劃分

  1. 預處理
    預處理模組包括體素化和尺度變換,以便更好地索引每個特定點。在體素化中,我們將空間劃分為大小為 N 的立方體,這對應於點雲的實際解析度。每個點都根據其位置分配一個唯一的體素。一個體素記為1;若被正佔用,則為0,否則為XNUMX。尺度變換可以透過縮小點雲(點之間的距離變小)來降低稀疏性,從而獲得更好的壓縮效果。我們使用縮放因子 s 聚合點雲座標(x,y,z),即中興通訊引導無損點雲幾何壓縮演算法- (3)
    為了確保無損壓縮,我們需要確保縮放因子s不會導致幾何損失,並且需要記錄在標頭中 file.
  2. 切片層劃分
    此模組的工作原理是沿其一個軸劃分 3D 點雲,創建多個僅包含佔用和非佔用資訊的單位切片層,這些資訊可以使用預測編碼器和算術編碼器進一步壓縮。此函數定義為:中興通訊引導無損點雲幾何壓縮演算法- (4)
    其中G指的是輸入點雲座標矩陣,axis指的是選擇的維度,S(a,b)是每層提取的2D切片。一般來說,我們對大量測試序列進行實驗,結果顯示沿著點雲空間變化最長軸的劃分產生最低的位元率,即中興通訊引導無損點雲幾何壓縮演算法- (5)
  3. 最小邊界框擷取
    在大多數情況下,佔用的體素通常是不可避免的,並且數量大大超過佔用的體素。因此,同時處理和編碼兩種類型的體素會增加壓縮演算法的計算複雜性和編碼速度。因此,我們採用定向邊界框(OBB)[39]來計算每個切片層的最小邊界框,確保各層邊界框的方向一致。在後續處理中,僅壓縮位於受限矩形內的體素。

空間上下文引導預測編碼

空間上下文引導預測編碼的目標是逐層編碼所有點。受 TSP 的啟發,我們設計了一種預測模式來探索每個切片層內的潛在順序和相關性。此模組由分區和最短路徑計算組成。
首先,我們對切片層進行分區並確定每個組的 R 層和 R 層。我們沿著選定的軸逐層遍歷點雲。當相鄰層之間的最小包圍盒主方向的長度相差指定單位長度時,記錄為同一組。否則,作為下一組的參考層,並且下一組中的每個點雲都使用相同的最短路徑。在本文中,我們將每組的第一層設定為R層,其他層設定為P層。我們也對大量測試序列進行了實驗,建議將此指定參數設為3個單位以獲得最佳壓縮效果。
然後,我們對R層進行最短路徑計算並記錄Player的殘差。根據各切片層點雲的分佈規律,基於TSP演算法對各切片層的不規則點雲進行最佳化排列。這使我們能夠有效地計算到 R 層點雲的最短路徑,然後記錄對應預測層的殘差。演算法 1 顯示了預測過程的偽代碼。

中興通訊引導無損點雲幾何壓縮演算法- (6)

首先,我們定義局部區域內點之間的距離計算規則,並以隨機選擇的點pc1初始化路徑狀態。在每次迭代中,每當新增一個新點 pci 時,就會透過狀態轉移方程式 path(P – i, i) 動態更新排列,直到所有新增的點都按照最短路徑的順序記錄在 P 中。過程基於最小距離準則逐漸修改。在總最短路徑中完成所有迭代後,我們計算最小值 中興通訊引導無損點雲幾何壓縮演算法- (8) 計算每個R層中的dist(pci, pcj ),傳回每個R層中點雲的最短路徑記錄表。為了進一步壓縮,我們計算同一組內 P 層與 R 層最短路徑的偏差,並將其記錄為預測殘差。最後,輸出Rlayer的最短路徑和每組殘差,並傳遞給熵編碼器以進一步壓縮預測殘差。

時空上下文引導預測編碼
空間上下文引導預測模式編碼
單獨的單幀點雲。然而,單獨對每個單幀點雲應用空間編碼可能會錯過多幀點雲的時間相關性所暴露的機會。考慮到多幀點雲端共享大量重疊,我們專注於使用時間冗餘來進一步提高壓縮效率。因此,基於所提出的空間上下文引導預測模式,我們可以透過識別跨幀的相鄰層之間的對應關係來壓縮多幀點雲。

  1. 幀間劃分
    為了增強幀間預測模式的有效性,確保相鄰層幀之間足夠的相似性至關重要。因此,我們需要對相鄰幀之間的群組進行劃分,並確定跨幀的 R 層和 P 層。透過基於 R 層的最短路徑估計 P 層的最短路徑,我們記錄預測殘差並透過熵編碼器進一步壓縮它們。演算法2顯示了幀間劃分的偽代碼。中興通訊引導無損點雲幾何壓縮演算法- (7)
    基於切片層方向對齊,我們依序實現了粗劃分和細劃分。對於粗劃分,我們根據劃分軸對應的座標從小到大對每個畫面的切片層進行排序。因此,每幀的每個切片層都有一個唯一的層編號,允許我們粗略地劃分相鄰幀之間具有相同編號的切片層。然後,我們計算具有相同數量的相鄰層的最小邊界框的主軸長度之間的差異。如果該值小於或等於指定的長度單位,則圖層將被分割到同一組中。否則,我們將相鄰幀對應層中最小邊界框的主方向軸長度與相鄰幀中指定層的編號前後的差值進行比較。然後將差異最小的層劃分到同一組。這樣就確保了相鄰層之間的精細劃分,從而實現了相鄰關係的精細劃分。
  2. 時空上下文引導預測模式
    基於分區,我們應用並擴展了3.3節中提到的預測模式。我們在過程中結合了幀間上下文,這意味著每組的第一層(充當 R 層)可能不一定會產生最佳預測結果。為了充分探索相鄰層之間的潛在相關性,我們需要公開最佳預測模式。
    首先,我們計算目前組中每個切片層用作 R 層時的預測殘差。透過比較所有情況下的預測殘差,我們選擇具有最小絕對殘差值的R層作為最佳預測模式。對於R層最短路徑計算,我們使用旅行商演算法來計算最佳預測模式下R層的最短路徑。此外,我們計算每組在各自最佳預測模式下的預測殘差。我們也記錄每組的佔用長度和R層訊息,以便在後續處理中進一步壓縮。在後續操作中,我們對上述資訊採用基於最佳上下文選擇的算術編碼來完成多幀點雲幾何壓縮演算法的整個過程。

基於上下文字典的算術編碼
點雲中的大量上下文在算術編碼計算複雜性方面顯著加重了整個壓縮方案的負擔。我們從以下兩個模組改進了算術編碼。 1)我們建立上下文字典,並根據熵估計選擇和更新全域最優值,然後2)我們採用自適應編碼器來有效計算機率的上下界。

  1. 上下文字典構建中興通訊引導無損點雲幾何壓縮演算法- (10)
  2. 我們建構一個表示三元組隊列的上下文字典,由每個切片層的點雲座標及其對應的非空上下文的整數表示組成。因此,我們將點雲中包含的體素與每層的最小邊界框及其非空上下文相關聯。為了清楚說明上下文字典的三元組隊列數組的構造,我們在圖2中給出直觀的解釋。沿著 x 軸和 y 軸的上下文貢獻分別記錄到兩個隊列 QX 和 QY 中。因此,上下文字典由 QX – 和 QY – 組成。具有相同座標的佇列元素被集合為一個三元組,其上下文整數表示被計算為合併的三元組的上下文貢獻總和。
    因此,每個體素的上下文可以計算為其上下文字典中佔用體素的獨立貢獻的總和。這種結構有助於確定是否應將體素添加到上下文字典中,而無需進行繁瑣的矩陣查找,從而顯著降低計算複雜性和運行時間。
  3. 機率計算
    為了計算熵機率,必須考慮序列的長度及其組成體素的上下文。在這個模組中,我們設計了一個自適應編碼器,它首先根據上下文字典估計每個組的累積機率上限和下限,然後對其進行編碼。首先,我們基於馬可夫鏈模型構造一棵二元樹。透過遍歷體素的佔用情況,我們分別為佔用體素和空體素分配值1和0,並根據樹結構計算機率。從根節點開始,當一個體素被佔用時,我們將左子節點記為1,否則將右子節點記為0,並進行下一步判斷和劃分。佔據體素的運行機率的計算公式可以在式(4)中找到。 (XNUMX)。

對於小於或等於n的遊程長度,可能有2n個表示體素的佔用狀態的樹節點。因此,任何占用體素的機率由遍歷從根開始到樹的任何無子節點結束的所有狀態的獨立聯合機率來表示。基於等式。 (4)、為了對體素序列的佔用進行算術編碼,需要序列的累積上、下機率,如式(5)所示。 (XNUMX)。中興通訊引導無損點雲幾何壓縮演算法- (11)

採用這種方法,我們可以利用算術編碼的自適應特性,根據最佳化的機率估計模型和當前符號序列中每個符號的頻率來調整每個符號的機率估計值。這使我們能夠計算佔用體素的累積機率的上限和下限並完成編碼過程。

實驗

實施細節

  1. 數據集。為了驗證我們提出的方法的效能,我們對 16 個點雲資料集進行了廣泛的實驗,這些資料集可以從參考文獻中下載。 [40],如圖3所示,其中,圖3(a)-3(l)是具有密集點的肖像,圖3(a)-3(l)是具有密集點的肖像。 3(m) – 3(p) 是具有稀疏點的架構。無花果。圖 3(a) – 3(h) 是從 Microsoft 獲得的兩種空間解析度的體素化上半身點雲資料序列。無花果。 8(i)– 3(l) 選自 3i 體素化全身點雲資料序列。圖 XNUMX 和 XNUMX 中剩餘的大規模稀疏點雲。 XNUMX(k)– XNUMX(p) 是靜態立面和建築資料集。
  2. 評估指標。所提出方法的性能以每點位數(BPP)來評估。 BPP是指該點所附帶的座標資訊所佔用的位數總和。值越低,性能越好。 中興通訊引導無損點雲幾何壓縮演算法- (12)其中Sizedig表示點雲資料的座標資訊所佔用的位數,k指原始點雲中的點數。
  3. 基準。我們主要將我們的方法與其他基準演算法進行比較,包括: PCL-PCC:PCL 中基於八叉樹的壓縮; G-PCC(MPEG幀內編碼器測試模型)和interEM(MPEG幀間編碼器測試模型)分別針對單一幀和多幀點雲壓縮; Silhouette 3D (S3D)[41] 和 Silhouette 4D (S4D)[42] 分別針對單幀和多幀點雲壓縮。
    對於 PCL,我們使用 PCL-v1.8.1 中的八叉樹點雲壓縮方法僅用於幾何壓縮。我們根據點精度和體素分辨率設定八叉樹分辨率參數。對於 G-PCC (TM13-v11.0),我們選擇無損幾何 中興通訊引導無損點雲幾何壓縮演算法- (13) 中興通訊引導無損點雲幾何壓縮演算法- (14)—無損屬性條件處於八叉樹預測模式,將參數保留為預設值。對於interEM(tmc3v3.0),我們使用無損幾何和無損屬性條件下的實驗結果作為比較[43]。對於S3D
    和S4D,我們遵循預設的條件和參數。
  4. 硬體.所提出的演算法使用 PCL-v1.8.1 的一些函數在 Matlab 和 C++ 中實作。所有實驗均在配備 Intel Core i7-8750 CPU @2.20 GHz、8 GB 記憶體的筆記型電腦上進行測試。

單幀點雲壓縮結果

  1. 密集點雲資料序列肖像的壓縮結果
    表 1 顯示了我們的空間上下文引導無損點雲幾何壓縮演算法與 PCL-PCC、G-PCC 和 S3D 方法在密集點雲資料序列肖像上的效能比較。從表1可以看出,對於相同序列的所有點雲,與其他方法相比,此方法實現了最低的壓縮BPP。我們的演算法相對於 S1.56D 的平均增益為 -0.02% 到 -3%,相對於 G-PCC 的平均增益為 -10.62% 到 -1.45%。表現出更明顯的優勢tage,即所提出演算法的壓縮性能增益範圍為-10.62%到-1.45%;對於 PCL-PCC,所提出的演算法在所有序列上顯示幾乎翻倍的增益,範圍從 -154.43% 到 -85.39%。
  2. 大規模稀疏點雲資料的壓縮結果
    由於S3D在這種情況下無法運作,因此我們僅在大規模稀疏點雲資料上將我們的空間上下文引導無損幾何點雲壓縮演算法與PCL-PCC和G-PCC方法進行比較。同樣,我們的演算法在 G-PCC 和 PCL-PCC 上取得了相當大的性能,如表 1 所示。對於PCL-PCC,我們提出的演算法顯示出更明顯的優勢tages,增益範圍為-34.69%至-23.94%。
  3. 概括
    為了更全面地比較單幀點雲壓縮結果,表 2 列出了我們的空間上下文引導壓縮方法和其他最先進的基準方法之間的平均結果。與 S3D 相比,我們提出的方法顯示平均增益範圍為 - 0.58% 到 - 3.43%。至於G-PCC和PCL-PCC,平均增益分別至少達到-3.43%和-95.03%。實驗分析表明,我們的空間上下文引導壓縮方法明顯優於目前的 S3D、G-PCC 和 PCL-PCC。因此,它可以滿足各種場景類型(例如密集或稀疏分佈)的點雲幾何的無損壓縮要求,並且我們的方法的有效性始終保持不變。
  4. 多幀點雲壓縮結果
    我們針對現有的壓縮演算法(例如 S4D、PCL-PCC、G-PCC 和 interEM)評估了我們提出的時空上下文引導點雲幾何壓縮演算法。本實驗僅使用密集點雲資料序列的肖像。結果如圖所示。

表 1. 我們的空間上下文引導壓縮演算法和基線方法的 BPP 比較。

中興通訊引導無損點雲幾何壓縮演算法- (15)

表 2. BPP 與單幀點雲資料上最先進的演算法進行比較。中興通訊引導無損點雲幾何壓縮演算法- (16)

表 3. 我們可以看到,經過預測模式和算術編碼器的最佳化,所提出的演算法在所有測試序列上都顯示出優越性。具體來說,與 interEM 和 G-PCC 相比,所提出的演算法顯示出顯著的增益,範圍分別為 -51.94% 至 -17.13% 和 -46.62% 至 -5.7%。與S4D相比,所提出的演算法顯示出從-12.18%到-0.33%的穩健改進。至於 PCL-PCC,我們提出的演算法幾乎將所有測試序列減半。
此外,我們總結了此方法在人像密集點雲資料序列上的壓縮結果和增益,如表4 所示。 % 之間先前提出的幾何壓縮演算法。此外,與 G-PCC 相比,它的平均增益高達 -11.5%,與 interEM 相比,平均編碼增益為 -2.59%。此外,與S19D和S24.55D相比,其平均增益分別超過-3%和-4%。整體實驗分析表明,時空上下文引導點雲壓縮方法可以充分利用幀內和幀間相鄰層的空間和時間相關性。我們還改進算術編碼器的全局上下文選擇和機率模型以獲得更低的位元率。所提出的方法超越了最先進演算法的效能,從而滿足動態肖像等多媒體應用場景中點雲幾何無損壓縮的要求。

表 3. 我們的時空上下文引導壓縮演算法和基線方法的逐點比較。中興通訊引導無損點雲幾何壓縮演算法- (17)

表 4. 與多幀點雲資料上最先進的演算法進行逐點比較。中興通訊引導無損點雲幾何壓縮演算法- (18)

消融研究
我們對 8i 體素化全身點雲資料序列的預測編碼進行消融研究,以證明分區的有效性。從表5可以看出,與非分區預測編碼相比,改進顯示多幀點雲壓縮穩定增益為-70%,單一幀點雲壓縮穩定增益為-60%。
接下來,我們對算術編碼進行消融實驗,以證明上下文字典的有效性。如表6所示,在我們的方法中觀察到,與沒有上下文字典的算術編碼相比,多幀點雲壓縮有-33%的穩健改進,單幀點雲壓縮有-41%的穩健改進。

中興通訊引導無損點雲幾何壓縮演算法- (19) 中興通訊引導無損點雲幾何壓縮演算法- (20)

時間消耗
我們測試時間消耗來評估演算法複雜性並將所提出的方法與其他方法進行比較。演算法複雜度由編碼器和解碼器獨立分析,如表7所示。雲端數據。與其他方法相比,它們在大規模稀疏點雲端資料中也表現良好。我們提出的演算法需要大約 10 秒和 5 秒來編碼和解碼肖像序列,對於立面和建築點雲資料甚至需要更多時間。比特率和壓縮速度之間需要權衡。與需要數百秒編碼的S60D和S15D相比,我們的耗時方法可以顯示優越性。
綜上所述,我們提出的方法的時間消耗在所有比較演算法中處於中等水平,但仍需要進一步改進。

結論

本文提出了一種時空上下文引導的無損點雲幾何壓縮方法。我們以單位厚度的切片點雲為輸入單元,採用基於旅行商演算法的幾何預測編碼模式,該模式適用於幀內和幀間。此外,我們充分利用全域上下文資訊和基於上下文快速更新的自適應算術編碼器來實現點雲的無損壓縮和解壓縮結果。實驗結果證明了我們方法的有效性及其相對於先前研究的優越性。對於未來的工作,我們計劃進一步研究演算法的整體複雜度,透過降低演算法複雜度來實現高速壓縮率和低碼率壓縮的結果。在各種類型的場景中都非常需要低位元率和即時/低延遲支援的方法。

參考

  1. 米XX,楊本生,董Z,等。使用 MLS 點雲自動 3D 道路邊界提取和向量化 [J]. IEEE 智慧交通系統交易,2022 年,23(6):5287 – 5297。
  2. 董Z,梁FX,楊本生,等。大型地面雷射掃描器點雲的配準:重新view 和基準[J]. ISPRS 攝影測量與遙感雜誌,2020,163:327–342。
  3. GRAZIOSI D、NAKAGAMI O、KUMA S 等。一個結束view 正在進行的點雲壓縮標準化活動:基於視訊(V-PCC)和基於幾何(G-PCC)[J]。 APSIPA 訊號與資訊處理交易,2020 年,9:e13
  4. DE QUEIROZ RL, CHOU P A. 使用區域自適應分層變換壓縮 3D 點雲 [J]. IEEE 影像處理交易,2016,25(8):3947–3956。 DOI:10.1109/TIP.2016.2575005
  5. 布萊特勒 A、帕揚 F、安東尼尼 M 等。利用深度圖進行點雲壓縮[J].電子成像,2016,2016(21):1–6
  6. MEKURIA R, BLOM K, CESAR P. 遠端沉浸式視訊點雲編解碼器的設計、實作與評估 [J]. IEEE 視訊技術電路與系統交易,2017 年,27(4):828 – 842。
  7. DE QUEIROZ RL, CHOU P A. 動態體素化點雲的運動補償壓縮[J]. IEEE 影像處理交易,2017 年,26 (8):3886–3895。 DOI:10.1109/TIP.2017.2707807
  8. CAO C, PREDA M, ZAHARIA T. 3D 點雲壓縮:一項調查 [C]// 第 24 屆 3D 國際會議 Web 技術。 ACM,2019:1-9。 DOI:10.1145/3329714.3338130
  9. GRAZIOSI D、NAKAGAMI O、KUMA S 等。一個結束view 正在進行的點雲壓縮標準化活動:基於視訊(V-PCC)和基於幾何(G-PCC)[J]。 APSIPA 訊號與資訊處理交易,2020 年,9(1):e13。 DOI:10.1017/atsip.2020.12
  10. 黃Y,彭建良,郭成傑,等。基於八叉樹的點雲漸進幾何編碼 [C]//第三屆 Eurographics/IEEE VGTC 基於點的圖形會議。 IEEE,3:2016–103
  11. 範YX,黃Y,彭J L。 IEEE,2014:1 – 7。
  12. DRICOT A,ASCENSO J.基於幾何的點雲編碼的自適應多層次三角湯[C]//第21屆多媒體訊號處理國際研討會(MMSP)。 IEEE,2019:1 – 6。
  13. 何超,冉麗清,王麗,等。基於形狀模式分析的點集曲面壓縮[J].多媒體工具與應用,2017,76(20):20545–20565。 DOI:10.1007/s11042-016-3991-0
  14. IMDAD U、ASIF M、AHMAD M 等。利用一階多項式進行三維點雲壓縮與解壓縮[J].對稱性, 2019, 11(2): 209. DOI: 10.3390/sym11020209
  15. 孫曉波,馬輝,孫玉新,等。一種基於聚類的點雲壓縮演算法[J]. IEEE 機器人與自動化快報,2019 年,4(2):2132–2139。 DOI:10.1109/LRA.2019.2900747
  16. DE OLIVEIRA RENTE P、BRITES C、ASCENSO J 等人。基於圖的靜態3D點雲幾何編碼[J]. IEEE 多媒體交易,2019,21(2):284–299。 DOI:10.1109/TMM.2018.2859591
  17. 國際標準化組織。基於幾何的點雲壓縮(G-PCC):ISO/IEC 23090-9 [S]。 2021年
  18. DRICOT A, ASCENSO J. 混合八叉樹平面點雲幾何編碼 [C]//第 27 屆歐洲訊號處理會議(EUSIPCO)。 IEEE,2019:1–5
  19. 張旭,高偉,劉書.點雲壓縮的隱式幾何劃分[C]//2020年資料壓縮會議(DCC)論文集。 IEEE,2020:73-82。 DOI:10.1109/DCC47342.2020.00015
  20. QUACH M, VALENZISE G, DUFAUX F. 學習有損點雲幾何壓縮的捲積變換 [C]//2019 年 IEEE 國際影像處理會議 (ICIP)。 IEEE,2019:4320–4324。
  21. HUANG TX, LIU Y. 深度學習中的3D點雲幾何壓縮[C]//第27屆ACM國際多媒體會議。 ACM,2019:890–898。 DOI:10.1145/3343031.3351061
  22. GUARDA AFR,RODRIGUES NMM,PEREIRA F。 IEEE,2020:1-5。 DOI:10.1109/PCS48520.2019.8954537
  23. 王建群,朱華,馬Z,等。學習點雲幾何壓縮[EB/OL]。 [2023-09-01]。 https://arxiv.org/abs/1909.12037.pdf
  24. AINALA K、MEKURIA RN、KHATHARIYA B 等人。一種基於平面投影近似的八叉樹點雲壓縮的改良增強層[C]//SPIE Optical Engineering+Applications。 SPIE,2016:223–231。
  25. SCHWARZ S、HANNUKSELA MM、FAKOUR-SEVOM V 等。體積視訊資料的 2D 視訊編碼 [C]//圖片編碼研討會 (PCS)。 IEEE,2018:61-65。 DOI:10.1109/PCS.2018.8456265
  26. FAKOUR SEVOM V, SCHWARZ S, GABBOUJ M. 用於基於投影的動態點雲編碼的幾何引導 3D 資料插值 [C]//第七屆歐洲視覺資訊處理研討會 (EUVIP)。 IEEE,7:2019-1。 DOI:6/EUVIP.0.1109
  27. KATHARIYA B、LI L、LI Z 等。具有相互補償和旅行商預測的無損動態點雲幾何壓縮[C]//資料壓縮會議。 IEEE,2018:414。
  28. 國際標準化組織。基於視覺體積視訊的編碼 (V3C) 和基於視訊的點雲壓縮:ISO/IEC 23090-5 [S]。 2021年
  29. PARK J、LEE J、PARK S 等。基於投影的佔用圖編碼的 3D 點雲壓縮 [J]. IEIE 智慧處理與計算交易,2020,9(4):293–297。 DOI:10.5573/ieiespc.2020.9.4.293
  30. COSTA A、DRICOT A、BRITES C 等。改進了 MPEG V-PCC 標準的補丁封裝 [C]//IEEE 第 21 屆多媒體訊號處理國際研討會 (MMSP)。 IEEE,2019:1 – 6。
  31. KAMMERL J、BLODOW N、RUSU RB 等人。點雲流的即時壓縮[C]//2012年IEEE機器人與自動化國際會議論文集。 IEEE,2012:778 – 785。
  32. PCL。點雲庫。 [EB/OL]。 [2023-09-01]。 http://pointclouds.org/
  33. THANOU D, CHOU PA, FROSSARD P. 基於圖的動態 3D 點雲序列壓縮 [J]. IEEE 影像處理交易,2016,25(4):1765–1778。 DOI:10.1109/TIP.2016.2529506
  34. LI L、LI Z、ZAKHARCHENKO V 等。基於視訊的點雲屬性壓縮的高階 3D 運動預測 [C]//資料壓縮會議 (DCC)。 IEEE,2019:498–507。 DOI:10.1109/DCC.2019.00058
    趙麗麗,馬康,林XH,等。使用雙向預測和範圍自適應浮點編碼的即時LiDAR點雲壓縮[J]. IEEE 廣播交易,2022 年,68(3):620 – 635。
  35. 林建平,劉德,李紅旗,等。 M-LVC:用於學習視訊壓縮的多幀預測 [C]//IEEE/CVF 電腦視覺和模式識別會議。 IEEE,2020:3543 – 3551。
  36. 楊 R、門澤爾 F、範古爾 L 等。學習具有分層品質和循環增強的視訊壓縮 [C]//IEEE/CVF 電腦視覺和模式識別會議。 IEEE,2020:6627–6636.DOI:10.1109/CVPR42600.2020.00666
  37. KAYA EC, TABUS I. 使用序列最佳化 CNN 模型對點雲序列進行無損壓縮 [J]. IEEE 訪問,2022 年,10:83678 –83691。 DOI:10.1109/ACCESS.2022.3197295
  38. 丁S, 馬曼南, POO A N. 自由曲面五軸加工中的定向包圍盒和基於八叉樹的全局干涉檢測[J].電腦輔助設計, 5, 2004(36): 13-1281
  39. ALEXIOU E、VIOLA I、BORGES TM 等。 MPEG點雲壓縮率失真性能綜合研究[J]. APSIPA 訊號與資訊處理交易,2019 年,8:e27。 doi:10.1017/ATSIP.2019.20
  40. PEIXOTO E. 使用二元分解進行點雲幾何的幀內壓縮 [J]. IEEE 訊號處理快報,2020 年,27:246–250。 DOI:10.1109/LSP.2020.2965322
  41. RAMALHO E, PEIXOTO E, MEDEIROS E. 具有上下文選擇的 Silhouette 4D:動態點雲的無損幾何壓縮 [J]. IEEE 訊號處理快報,2021 年,28:1660 – 1664。
  42. 國際標準化組織。 G-PCC 文件 N00106 的一般測試條件:ISO/IEC JTC 1/ SC 29/WG 7 MPEG [S]。 2021年

傳記

  • 張惠然 分別於2020年及2023年於中國武漢大學測繪與測繪學院及測繪遙感資訊工程國家重點實驗室取得學士及碩士學位。現任中國廣州市城市規劃設計勘察研究院測量師。她的研究興趣包括點雲資料處理和壓縮。參與遙感領域多個項目,在《武漢大學測繪與資訊科學》雜誌發表論文XNUMX篇。
  • 董震 (dongzhenwhu@whu.edu.cn)分別於2011年和2018年在中國武漢大學獲得遙感與攝影測量學士和博士學位。武漢大學測繪遙感資訊工程國家重點實驗室(LIESMARS)教授。他的研究興趣包括3D重建、場景理解、點雲處理及其在智慧交通系統、數位孿生城市、城市永續發展和機器人的應用。獲得國內外各類比賽獎項10餘項,在各類期刊及會議發表論文60餘篇。
    王明生 2001年畢業於吉林大學電腦科學與技術學院,獲學士學位;2004年畢業於華南理工大學電腦科學與工程學院,取得碩士學位。他的研究興趣包括電腦應用和軟體、地理和測量。獲得國家級各類競賽20餘項榮譽,在各類期刊及會議發表論文50餘篇。

DOI: 10.12142/ZTECOM.202304003
https://kns.cnki.net/kcms/detail/34.1294.TN.20231108.1004.002.html,於 8 年 2023 月 XNUMX 日線上發布
稿件收到時間:2023-09-11

文件/資源

中興通訊引導無損點雲幾何壓縮演算法 [pdf] 使用者指南
無損點雲幾何壓縮引導演算法, 引導, 無損點雲幾何壓縮演算法, 無損點雲幾何壓縮, 點雲幾何壓縮, 幾何壓縮

參考

發表評論

您的電子郵件地址不會被公開。 必填欄位已標記 *