Algoritmo guidato ZTE per la compressione della geometria delle nuvole di punti senza perdite
Specifiche:
- Nome del prodotto: Algoritmo spazio-temporale guidato dal contesto per la compressione della geometria della nuvola di punti senza perdita
- Autori: ZHANG Huiran, DONG Zhen, WANG Mingsheng
- Pubblicato: Dicembre 2023
- DOI: 10.12142/ZTECOM.202304003
Istruzioni per l'uso del prodotto
Introduzione:
Il prodotto è progettato per comprimere in modo efficiente i dati della nuvola di punti, affrontando le sfide legate alla capacità dello spazio di archiviazione e alla larghezza di banda di trasmissione della rete.
Caratteristiche principali:
- Modalità di previsione applicabile alle nuvole di punti intraframe e inter-frame utilizzando il problema del commesso viaggiatore esteso.
- Codificatore aritmetico adattivo con aggiornamento rapido del contesto per un calcolo efficiente delle probabilità e risultati di compressione.
Fasi di utilizzo:
Passaggio 1: divisione delle nuvole di punti
Dividere le nuvole di punti in strati unitari lungo l'asse principale.
Passaggio 2: modalità di previsione del progetto
Progetta una modalità di previsione utilizzando l'algoritmo del venditore ambulante per sfruttare le ridondanze spaziali e temporali.
Passaggio 3: codificare i residui
Scrivi i residui in flussi di bit utilizzando un codificatore aritmetico adattativo al contesto per la compressione.
Domande frequenti:
- D: Quali sono i principali vantaggi derivanti dall'utilizzo di questo prodotto?
A: Il prodotto consente una compressione efficiente dei dati della nuvola di punti, utilizzando correlazioni spaziali e temporali per risultati di compressione migliorati. - D: Questo prodotto è in grado di gestire nuvole di punti sia a fotogramma singolo che a fotogramma multiplo?
A: Sì, la modalità di previsione è applicabile sia alle nuvole di punti intraframe che inter-frame, consentendo scenari di utilizzo versatili.
ZHANG Huiran, DONG Zhen, WANG Mingsheng
- Guangzhou Urban Planning and Design Survey Research Institute, Guangzhou 510060, Cina;
- Guangdong Enterprise Key Laboratory for Urban Sensing, Monitoring and Early Warning, Guangzhou 510060, Cina;
- State Key Laboratory of Information Engineering in Surveying Map⁃ ping and Remote Sensing, Università di Wuhan, Wuhan 430079, Cina)
Astratto: La compressione delle nuvole di punti è fondamentale per implementare rappresentazioni 3D del mondo fisico come la telepresenza immersiva 3D, la guida autonoma e l'eredità culturaletage conservazione. Tuttavia, i dati delle nuvole di punti sono distribuiti in modo irregolare e discontinuo nei domini spaziali e temporali, dove i voxel ridondanti non occupati e le deboli correlazioni nello spazio 3D rendono il raggiungimento di una compressione efficiente un problema impegnativo. In questo articolo proponiamo un algoritmo spazio-temporale guidato dal contesto per la compressione della geometria della nuvola di punti senza perdite. Lo schema proposto inizia con la divisione della nuvola di punti in strati di spessore unitario lungo l'asse più lungo. Quindi, introduce un metodo di previsione in cui sono disponibili nuvole di punti sia intraframe che inter-frame, determinando le corrispondenze tra strati adiacenti e stimando il percorso più breve utilizzando l'algoritmo del commesso viaggiatore. Infine, i pochi residui di previsione vengono compressi in modo efficiente con tecniche di codifica aritmetica ottimale, guidate dal contesto e adattive. Gli esperimenti dimostrano che il metodo proposto può ottenere efficacemente una compressione senza perdita di bit rate basso delle informazioni geometriche della nuvola di punti ed è adatto per la compressione della nuvola di punti 3D applicabile a vari tipi di scene.
Parole chiave: compressione della geometria della nuvola di punti; nuvole di punti a fotogramma singolo; nuvole di punti multi-frame; codifica predittiva; codifica aritmetica.
Citazione (formato 1): ZHANG HR, DONG Z, WANG M S. Algoritmo spazio-temporale guidato dal contesto per la compressione della geometria della nuvola di punti senza perdita [J]. Comunicazioni ZTE, 2023, 21(4): 17–28. DOI: 10.12142/ZTECOM.202304003
Citazione (formato 2): HR Zhang, Z. Dong e MS Wang, "Algoritmo spazio-temporale guidato dal contesto per la compressione della geometria della nuvola di punti senza perdita", ZTE Communications, vol. 21, n. 4, pagine 17–28, dicembre 2023. doi: 10.12142/ZTECOM.202304003.
Introduzione
Con il miglioramento delle prestazioni delle apparecchiature di acquisizione multipiattaforma e multirisoluzione, la tecnologia LiDAR (Light Detection and Range) può simulare in modo efficiente oggetti o scene 3D con enormi insiemi di punti. Rispetto ai dati multimediali tradizionali, i dati delle nuvole di punti contengono più informazioni di misurazione fisica che rappresentano oggetti liberi viewpunti, anche scene con strutture topologiche complesse. Ciò si traduce in forti effetti interattivi e coinvolgenti che forniscono agli utenti un'esperienza di visualizzazione vivida e realistica. Inoltre, i dati delle nuvole di punti hanno una maggiore capacità antirumore e capacità di elaborazione parallela, che sembra aver guadagnato attrazione da parte dell'industria e del mondo accademico, in particolare per domini applicativi come il patrimonio culturaletage-conservation, telepresenza immersiva 3D e guida automatica[1–2].
Tuttavia, i dati delle nuvole di punti contengono solitamente da milioni a miliardi di punti in domini spaziali, comportando oneri e sfide per la capacità dello spazio di archiviazione e la larghezza di banda di trasmissione della rete. Ad esempio, una comune nuvola di punti dinamica utilizzata per l'intrattenimento comprende solitamente circa un milione di punti per fotogramma, che, a 30 fotogrammi al secondo, equivale a una larghezza di banda totale di 3.6 Gbit/s se lasciata non compressa[3]. Pertanto, la ricerca sugli algoritmi di compressione della geometria ad alta efficienza per le nuvole di punti ha un importante valore teorico e pratico.
Il lavoro precedente ha affrontato questo problema costruendo direttamente griglie o down-s su richiestaampling, a causa delle limitazioni nella potenza di calcolo del computer e nell'efficienza della raccolta delle nuvole di punti, che hanno comportato basse prestazioni di compressione spazio-temporale e perdita di informazioni sulle caratteristiche degli attributi geometrici. Studi recenti si basavano principalmente sulla grafica computerizzata e sulle tecniche di elaborazione del segnale digitale per implementare operazioni a blocchi sui dati della nuvola di punti[4 5] o sulla tecnologia combinata di codifica video[6 7] per l'ottimizzazione. Nel 2017, il Moving Picture Experts Group (MPEG) ha sollecitato proposte per la compressione delle nuvole di punti e ha condotto successive discussioni su come comprimere questo tipo di dati. Con i crescenti approcci alla compressione delle nuvole di punti disponibili e presentati, nel 13 sono stati rilasciati framework di compressione dei dati delle nuvole a due punti: TMC2 e TMC2018. La ricerca di cui sopra mostra che sono stati compiuti notevoli progressi nella tecnologia di compressione delle nuvole di punti. Tuttavia, il lavoro precedente si occupava principalmente della correlazione spaziale e temporale delle nuvole di punti separatamente, ma non era ancora stato sfruttato appieno il loro potenziale nella compressione delle nuvole di punti.
Per affrontare le sfide di cui sopra, introduciamo un metodo spazio-temporale guidato dal contesto per la compressione della geometria della nuvola di punti senza perdite. Per prima cosa dividiamo le nuvole di punti in strati unitari lungo l'asse principale. Progettiamo quindi una modalità di previsione tramite un algoritmo di venditore ambulante, adottando la correlazione spaziotemporale. Infine, i residui vengono scritti in flussi di bit con un codificatore aritmetico adattivo al contesto utilizzato. I nostri principali contributi sono i seguenti.
1) Progettiamo una modalità di previsione applicabile sia alla nuvola di punti intra-frame che inter-frame, tramite il problema del commesso viaggiatore esteso (TSP). Sfruttando le ridondanze spaziali e temporali delle nuvole di punti, la previsione della geometria può fare un uso migliore della correlazione spaziale e quindi consentire vari tipi di scenari.
2) Presentiamo un codificatore aritmetico adattivo con aggiornamento rapido del contesto, che seleziona il contesto 3D ottimale dal dizionario del contesto e sopprime l'aumento della stima dell'entropia. Di conseguenza, migliora l'efficienza del calcolo delle probabilità dei codificatori entropici e produce risultati di compressione significativi.
Il resto di questo documento è strutturato come segue. La sezione 2 fornisce uno schema del lavoro correlato sulla compressione della geometria della nuvola di punti. La sezione 3 presenta innanzitutto un overview del quadro proposto. Quindi, il metodo proposto viene descritto in dettaglio. I risultati sperimentali e le conclusioni sono presentati rispettivamente nelle sezioni 4 e 5.
In letteratura sono stati proposti numerosi algoritmi di compressione della geometria della nuvola di punti. CAO et al. [8] e GRAZIOSI et al. [9] condurre un'indagine e un riepilogo degli attuali metodi di compressione delle nuvole di punti, concentrandosi rispettivamente sulla tecnologia di compressione della dimensione spaziale e sui quadri di standardizzazione MPEG. Forniamo una breve riview dei recenti sviluppi in due categorie: compressione della nuvola di punti a fotogramma singolo e compressione della nuvola di punti multi-frame.
- Compressione della nuvola di punti a fotogramma singolo
Le nuvole di punti a fotogramma singolo sono ampiamente utilizzate nelle indagini ingegneristiche e nell'eredità culturaletage conservazione, sistemi di informazione geografica e altri scenari. L'octree è una struttura dati ampiamente utilizzata per rappresentare in modo efficiente le nuvole di punti, che può essere compressa registrando informazioni attraverso i nodi occupati. HUANG et al.[10] proporre un metodo basato su otto che suddivide ricorsivamente la nuvola di punti in nodi con le loro posizioni rappresentate dal centro geometrico di ciascuna unità. FAN et al.[11] migliorare ulteriormente questo metodo introducendo l'analisi dei cluster per generare una gerarchia del livello di dettaglio (LOD) e codificarla in un ordine di ampiezza. Tuttavia, questi metodi possono causare distorsioni dovute all’approssimazione del modello originale durante il processo iterativo.
Per affrontare queste limitazioni, gli studiosi hanno introdotto caratteristiche della struttura geometrica, come: il modello di superficie triangolare[12], il modello di superficie planare[13 14] e l'algoritmo di clustering[15], per la previsione interstrato e il calcolo dei residui . RENTE et al.[16] proporre un concetto di compressione progressiva a strati che utilizza prima la struttura a otto per la codifica a grana grossa e quindi utilizza la trasformata di Fourier del grafico per la compressione e la ricostruzione dei dettagli della nuvola. Nel 2019, MPEG ha rilasciato la tecnologia di compressione delle nuvole di punti basata sulla geometria (G-PCC) per nuvole di punti sia statiche che dinamiche, che viene implementata attraverso la trasformazione delle coordinate, la voxelizzazione, l'analisi della struttura geometrica e la codifica aritmetica passo dopo passo[17].
Poiché alcuni ottanti all'interno di un ottante possono essere scarsamente popolati o addirittura vuoti, sono stati proposti alcuni metodi per ottimizzare la struttura ad albero eliminando i sottonodi e quindi conservando l'allocazione di memoria. Per esample, DRICOT et al. [18] propongono una modalità di codifica diretta inferita (IDCM) per terminare la partizione a otto in base a condizioni predefinite di analisi di sparsità, che comporta la potatura della struttura a otto per risparmiare bit allocati ai nodi figli. ZHANG et al. [19] suggeriscono di suddividere lo spazio della nuvola di punti lungo le componenti principali e di adattare il metodo di partizione dall'albero binario, quadtree e octree. Rispetto al tradizionale partizionamento a otto, i modelli ibridi sopra menzionati possono effettivamente ridurre il numero di bit utilizzati per rappresentare punti sparsi, risparmiando quindi i nodi che devono essere codificati. Tuttavia, nel processo sono necessarie condizioni iperparametriche complesse e determinazione della modalità, rendendo difficile soddisfare i requisiti di autoadattamento e bassa complessità.
Con le reti neurali profonde che stanno facendo passi da gigante nella compressione di immagini e video, i ricercatori hanno esplorato modi per ridurre ulteriormente la velocità in bit sfruttando la guida super-precedente e la ridondanza dell'espressione dello spazio latente durante il processo di compressione. QUACH et al.[20] e HUANG et al.[21] proporre metodi che incorporino questi concetti. GUARDA et al. combinare reti neurali convoluzionali e autocodificatori per sfruttare la ridondanza tra punti adiacenti e migliorare l'adattabilità della codifica in Rif. [22]. Recentemente, WANG et al. [23] propongono un metodo di compressione della nuvola di punti basato sull'auto-codificatore variazionale, che migliora il rapporto di compressione apprendendo l'iperprior e riducendo il consumo di memoria della codifica aritmetica. I metodi sopra menzionati utilizzano codificatori di reti neurali per catturare il vettore nascosto di ordine superiore della nuvola di punti, le probabilità del modello entropico e le probabilità dei bordi che si adattano meglio, riducendo così il consumo di memoria della codifica aritmetica. In generale, la ricerca sulla compressione geometrica delle nuvole di punti a fotogramma singolo è relativamente matura, ma rimangono ancora due sfide. La correlazione spaziale non è stata utilizzata in modo efficace e la maggior parte dei metodi non codifica la correlazione dei dati della nuvola di punti in modo completo ed efficiente. Inoltre, il calcolo del modello probabilistico per la codifica entropica appare lungo e arduo a causa dell’enorme numero di contesti. - Compressione della nuvola di punti multi-frame
Le nuvole di punti multi-frame sono comunemente utilizzate in scenari quali telepresenza immersiva 3D in tempo reale, realtà virtuale interattiva, 3D free viewtrasmissione del punto e guida automatica. A differenza della compressione della nuvola di punti a fotogramma singolo, la compressione della nuvola di punti a più fotogrammi dà priorità all'uso della correlazione temporale, nonché alla stima e alla compensazione del movimento. I metodi esistenti per la compressione di nuvole di punti multi-frame possono essere suddivisi in due categorie: proiezione 2D e decorrelazione 3D.
Il campo della compressione di immagini e video è vasto ed è stato ben esplorato negli ultimi decenni. Vari algoritmi convertono le nuvole di punti in immagini e poi le comprimono direttamente tramite codificatori FFmpeg e H. 265, ecc. AINALA et al[24] introducono una modalità di codifica approssimativa della proiezione planare che codifica sia la geometria che gli attributi di colore attraverso la scansione raster sul piano . Tuttavia, questo metodo provoca cambiamenti nella forma del target durante il processo di mappatura, rendendo difficile una previsione accurata. Pertanto, SCHWARZ et al.[25] e SEVOM et al.[26] suggerire metodi di proiezione planare ruotata, proiezione cubica e proiezione basata su patch per convertire rispettivamente le nuvole di punti in video 2D. Posizionando proiezioni simili in fotogrammi adiacenti nella stessa posizione in immagini adiacenti, il compressore video può rimuovere completamente la correlazione temporale. Nel rif. [27], la previsione inter-geometrica viene condotta tramite TSP, che calcola la corrispondenza uno a uno degli intra-blocchi adiacenti cercando il blocco con il valore medio più vicino. MPEG ha rilasciato la tecnologia di compressione delle nuvole di punti basata su video (V-PCC) per le nuvole di punti dinamiche nel 2019[28]. Questo quadro divide la nuvola di punti di input in piccoli blocchi con vettori normali simili e spazio continuo, quindi li converte nella superficie planare attraverso cubi per registrare l'immagine di occupazione e le informazioni ausiliarie. Tutte le immagini risultanti vengono compresse da codec video maturi e tutti i flussi di bit vengono assemblati in un unico output file. Sono stati fatti altri tentativi per migliorare l'efficacia di questi metodi. COSTA et al.[29] sfruttare diverse nuove strategie di confezionamento delle patch dal punto di vista dell'ottimizzazione dell'algoritmo di confezionamento, dei collegamenti di confezionamento dei dati, del relativo ordinamento e degli indicatori di posizionamento. Inoltre, PARK et al. [30] progettano un metodo di compressione adattivo dei dati che raggruppa in modo adattivo i frame adiacenti nello stesso gruppo in base alla somiglianza strutturale senza influenzare le prestazioni del flusso V-PCC. A causa dell'inevitabile perdita di informazioni causata dalla proiezione della nuvola di punti, gli studiosi hanno sviluppato tecniche efficaci per comprimere la sequenza della nuvola di punti di fotogrammi consecutivi utilizzando la tecnologia di compensazione del movimento basata sullo spazio 3D. KAMMERL et al.[31] proporre un metodo di codifica geometrica basato su otto, che raggiunge un'elevata efficienza di compressione eseguendo le differenze OR esclusive (XOR) tra fotogrammi adiacenti. Questo metodo non è stato solo adottato nella popolare Point Cloud Library (PCL)[32], ma è stato anche ampiamente utilizzato per ulteriori ricerche sugli algoritmi. Altri approcci interframe convertono il problema della stima del movimento 3D in un problema di corrispondenza delle caratteristiche[33] o utilizzano informazioni geometriche ricostruite[34] per prevedere i vettori di movimento e identificare accuratamente la relazione corrispondente tra fotogrammi adiacenti. Recenti studi esplosivi[35] hanno dimostrato che la compressione video appresa offre migliori prestazioni di distorsione della velocità rispetto a quelle tradizionali, conferendo un significato di riferimento significativo alla compressione delle nuvole di punti. ZHAO et al.[36] introdurre una rete di previsione inter-frame bidirezionale per eseguire la previsione inter-frame e portare un utilizzo efficace delle informazioni rilevanti nelle dimensioni spaziali e temporali. KAYA et al. [37] progettano un nuovo paradigma per codificare caratteristiche geometriche di sequenze di nuvole di punti dense, ottimizzando la CNN per stimare la distribuzione di codifica per realizzare una compressione senza perdite di nuvole di punti dense.
Nonostante i progressi nella tecnologia di codifica della compressione dei modelli di nuvole di punti multi-frame, persistono due problemi. Gli attuali approcci di compressione delle nuvole di punti multi-frame si basano principalmente sulla codifica video e sulla compensazione del movimento, che inevitabilmente comportano perdita o distorsione di informazioni causata dalla mappatura e dalla discontinuità dei bordi del blocco. Inoltre, la codifica predittiva mostra una bassa applicabilità a causa dell'incoerenza della geometria della nuvola di punti tra fotogrammi. L'apparente spostamento dei punti tra i fotogrammi e l'inevitabile rumore aumentano la difficoltà di utilizzare efficacemente la codifica predittiva nella compressione tra fotogrammi.
Metodo di compressione della nuvola di punti con geometria senza perdita guidata dal contesto spazio-temporale proposto
Sopraview
La pipeline complessiva del nostro algoritmo spazio-temporale guidato dal contesto è mostrata in Fig. 1. Innanzitutto, preelaboriamo la nuvola di punti di input applicando la voxelizzazione e la trasformazione di scala. Quindi, la nuvola di punti viene divisa in strati affettati di spessore unitario lungo l'asse principale. Successivamente, progettiamo una modalità di previsione che sfrutta appieno le informazioni di correlazione temporale e spaziale sia all'interno che all'interno del frame. Calcoliamo il percorso più breve dei punti dei livelli di riferimento (livelli R) tramite algoritmi del commesso viaggiatore, e i risultati dei livelli R vengono quindi utilizzati per prevedere spaziotemporalmente e codificare il resto delle nuvole di punti, vale a dire i livelli previsti (livelli P ). Infine, vengono adottati gli algoritmi di codifica entropica migliorati per ottenere il binario compresso file.
Divisione gerarchica basata su sezioni di immagine
- Pre-elaborazione
Il modulo di pre-elaborazione include la voxelizzazione e la trasformazione della scala, per una migliore indicizzazione di ogni determinato punto. Nella voxelizzazione, dividiamo lo spazio in cubi di dimensione N, che corrisponde alla risoluzione effettiva della nuvola di punti. A ogni punto viene assegnato un voxel univoco in base alla sua posizione. Un voxel viene registrato come 1; se è occupato positivamente è 0 altrimenti. La trasformazione della scala può ridurre la scarsità per una migliore compressione riducendo la nuvola di punti, dove la distanza tra i punti diminuisce. Aggreghiamo le coordinate della nuvola di punti ( x, y, z) utilizzando un fattore di scala s, ovvero
Per garantire una compressione senza perdite, dobbiamo garantire che il fattore di scala s non possa causare perdita di geometria e debba essere registrato nell'intestazione file. - Divisione a strati
Questo modulo funziona dividendo la nuvola di punti 3D lungo uno dei suoi assi, creando diversi strati suddivisi in unità con solo informazioni occupate e non occupate che possono essere ulteriormente compresse utilizzando un codificatore predittivo e un codificatore aritmetico. La funzione è definita come:
dove G si riferisce alla matrice di coordinate della nuvola di punti di input, l'asse si riferisce alla dimensione selezionata e S (a, b) è la sezione 2D estratta da ciascun livello. In generale, conduciamo esperimenti su un gran numero di sequenze di test e i risultati suggeriscono che la divisione lungo l'asse più lungo della variazione spaziale della nuvola di punti produce il bitrate più basso, ovvero - Estrazione minima del riquadro di delimitazione
Nella maggior parte dei casi, i voxel occupati sono tipicamente inevitabili e superano notevolmente i voxel occupati. Di conseguenza, l'elaborazione e la codifica di entrambi i tipi di voxel gravano contemporaneamente sulla complessità computazionale e sulle velocità di codifica dell'algoritmo di compressione. Pertanto, adottiamo il riquadro di delimitazione orientato (OBB) [39] per calcolare il riquadro di delimitazione minimo per ogni strato affettato, garantendo che le direzioni dei riquadri di delimitazione siano coerenti tra gli strati. Nell'elaborazione successiva vengono compressi solo i voxel che si trovano all'interno del rettangolo ristretto.
Codifica predittiva guidata dal contesto spaziale
L'obiettivo della codifica predittiva guidata dal contesto spaziale è codificare tutti i punti strato per strato. Ispirandoci al TSP, progettiamo una modalità di previsione per esplorare i potenziali ordini e la correlazione all'interno di ogni strato suddiviso. Questo modulo è costituito dalla partizione e dal calcolo del percorso più breve.
Innanzitutto, partizioniamo gli strati affettati e determiniamo lo strato R e gli strati R per ciascun gruppo. Attraversiamo la nuvola di punti strato per strato lungo l'asse selezionato. Quando la lunghezza della direzione principale del riquadro di delimitazione minimo tra strati adiacenti differisce di una lunghezza unitaria specificata, viene registrato come lo stesso gruppo. Altrimenti, viene utilizzato come livello di riferimento del gruppo successivo e ciascuna nuvola di punti nel gruppo successivo utilizza lo stesso percorso più breve. In questo articolo impostiamo il primo strato di ciascun gruppo come strato R e gli altri come strati P. Effettuiamo anche esperimenti su un gran numero di sequenze di test e consigliamo di impostare questo parametro specificato su 3 unità per ottenere la migliore compressione.
Successivamente, effettuiamo il calcolo del percorso più breve sugli strati R e registriamo i residui dei giocatori. Secondo la regolazione della distribuzione della nuvola di punti di ogni strato di fetta, organizziamo in modo ottimale le nuvole di punti irregolari per ogni strato di fetta in base all'algoritmo TSP. Ciò ci consente di calcolare in modo efficiente il percorso più breve verso la nuvola di punti degli strati R e quindi di registrare i residui dei corrispondenti strati di previsione. L'algoritmo 1 mostra lo pseudocodice della procedura di previsione.
Innanzitutto definiamo la regola di calcolo della distanza tra punti nell'area locale e inizializziamo lo stato del percorso con un punto pc1 selezionato casualmente. In ogni iterazione, ogni volta che viene aggiunto un nuovo punto pci, la permutazione viene aggiornata dinamicamente attraverso il percorso dell'equazione di transizione di stato (P – i, i) finché tutti i punti aggiunti non vengono registrati in P nell'ordine del percorso più breve. Questo processo viene modificato gradualmente in base al criterio della distanza minima. Dopo che tutte le iterazioni sono state completate nel percorso più breve totale, calcoliamo il min dist(pci, pcj ) in ciascuno degli strati R e restituisce la tabella dei record del percorso più breve delle nuvole di punti in ciascuno degli strati R. Per un'ulteriore compressione, calcoliamo la deviazione degli strati P dal percorso più breve dello strato R all'interno dello stesso gruppo e li registriamo come residui predittivi. Infine, il percorso più breve dell'Rlayer e i residui di ciascun gruppo vengono emessi e passati al codificatore entropico per comprimere ulteriormente i residui di previsione.
Codifica predittiva spazio-temporale guidata dal contesto
La modalità di previsione spaziale guidata dal contesto codifica
nuvole di punti a fotogramma singolo individualmente. Tuttavia, l'applicazione separata della codifica spaziale a ciascuna nuvola di punti a fotogramma singolo può far perdere le opportunità esposte dalle correlazioni temporali nella nuvola di punti a fotogramma multiplo. Considerando che la nuvola di punti multi-frame condivide grandi porzioni di sovrapposizioni, ci concentriamo sull'utilizzo della ridondanza temporale per migliorare ulteriormente l'efficienza di compressione. Quindi, sulla base della modalità di previsione guidata dal contesto spaziale proposta, possiamo comprimere la nuvola di punti multiframe identificando una corrispondenza tra strati adiacenti attraverso i frame.
- Partizione tra i telai
Per migliorare l'efficacia della modalità di previsione tra fotogrammi, è fondamentale garantire un'adeguata somiglianza tra strati adiacenti di fotogrammi. Di conseguenza, dobbiamo suddividere i gruppi tra fotogrammi adiacenti e determinare gli strati R e P tra i fotogrammi. Stimando il percorso più breve degli strati P in base al percorso più breve degli strati R, registriamo i residui di previsione e li comprimiamo ulteriormente attraverso il codificatore entropico. L'algoritmo 2 mostra lo pseudocodice della partizione interframe.
Sulla base dell'allineamento dell'orientamento degli strati affettati, realizziamo successivamente la partizione grossolana e la partizione fine. Per la partizione grossolana, ordiniamo gli strati suddivisi di ciascun fotogramma in base alle coordinate corrispondenti agli assi di divisione, dal piccolo al grande. Di conseguenza, ogni strato di fetta di ciascun fotogramma ha un numero di strato univoco, consentendoci di suddividere grossolanamente gli strati di fetta con lo stesso numero tra fotogrammi adiacenti. Successivamente, calcoliamo la differenza tra le lunghezze degli assi principali dei riquadri di delimitazione minimi degli strati adiacenti con lo stesso numero. Se questo valore è inferiore o uguale a un'unità di lunghezza specificata, gli strati verranno suddivisi nello stesso gruppo. Altrimenti confrontiamo la differenza nella lunghezza dell'asse di direzione principale del riquadro di delimitazione minimo nello strato corrispondente del fotogramma adiacente con lo strato specificato prima e dopo il numero nel fotogramma adiacente. Lo strato con la differenza più piccola viene quindi suddiviso nello stesso gruppo. Ciò garantisce una partizione fine tra strati adiacenti e in modo da realizzare la partizione fine del rapporto adiacente. - Modalità di previsione spazio-temporale guidata dal contesto
In base alla partizione, applichiamo ed espandiamo la modalità di previsione menzionata nella Sezione 3.3. Incorporiamo il contesto inter-frame nel processo, il che significa che il primo livello di ciascun gruppo, che funge da livello R, potrebbe non necessariamente fornire il miglior risultato di previsione. Per esplorare completamente la potenziale correlazione tra strati adiacenti, dobbiamo esporre la modalità di previsione ottimale.
Innanzitutto, calcoliamo i residui di previsione per ogni strato affettato nel gruppo corrente quando utilizzato come strato R. Confrontando i residui di previsione in tutti i casi, selezioniamo lo strato R con il valore residuo assoluto più piccolo come migliore modalità di previsione. Per il calcolo del percorso più breve dello strato R, utilizziamo l'algoritmo del commesso viaggiatore per calcolare il percorso più breve degli strati R nella modalità di previsione migliore. Inoltre, calcoliamo i residui di previsione per ciascun gruppo secondo le rispettive modalità di previsione migliore. Registriamo anche la lunghezza di occupazione e le informazioni sullo strato R di ciascun gruppo per un'ulteriore compressione nell'elaborazione successiva. Nell'operazione di follow-up, utilizziamo la codifica aritmetica basata sulla migliore selezione del contesto per le informazioni di cui sopra per completare l'intero processo dell'algoritmo di compressione della geometria della nuvola di punti multi-frame.
Codifica aritmetica basata sul dizionario contestuale
L'enorme quantità di contesto nella nuvola di punti grava in modo significativo sullo schema di compressione complessivo in termini di complessità computazionale della codifica aritmetica. Miglioriamo la codifica aritmetica dei due moduli seguenti. 1) Impostiamo un dizionario contestuale e selezioniamo e aggiorniamo il valore ottimale globale in base alla stima dell'entropia, quindi 2) adottiamo codificatori adattivi per calcolare in modo efficiente i limiti superiore e inferiore delle probabilità.
- Costruzione del dizionario contestuale
- Costruiamo un dizionario di contesto che rappresenta una coda tripla, composta dalle coordinate della nuvola di punti su ogni strato affettato e dalla rappresentazione intera del suo corrispondente contesto non vuoto. Pertanto, associamo i voxel contenuti nella nuvola di punti al riquadro di delimitazione minimo di ogni strato con il suo contesto non vuoto. Per illustrare chiaramente la costruzione dell'array a tripla coda del dizionario di contesto, diamo una spiegazione intuitiva in Fig. 2. Per i due quadrati ombreggiati in Fig. 2, vengono considerate solo le posizioni della mappa di contesto pc1 e pc2. Il contributo del contesto lungo l'asse x e l'asse y viene registrato rispettivamente nelle due code QX – e QY. Pertanto il dizionario contestuale è composto da QX – e QY -. Gli elementi della coda con le stesse coordinate vengono integrati in una tripletta, la cui rappresentazione intera del contesto viene calcolata come la somma dei contributi di contesto della tripletta unita.
Pertanto, il contesto di ciascun voxel può essere calcolato come la somma dei contributi indipendenti dei voxel occupati nel suo dizionario contestuale. Questa struttura aiuta a determinare se un voxel deve essere aggiunto al dizionario contestuale senza noiose ricerche nella matrice, con conseguente riduzione significativa della complessità computazionale e del tempo di esecuzione. - Calcolo delle probabilità
Per calcolare la probabilità di entropia, è necessario prendere in considerazione sia la lunghezza della sequenza che il contesto dei suoi voxel costituenti. In questo modulo progettiamo un codificatore adattivo che prima stima i limiti di probabilità cumulativi superiore e inferiore per ciascun gruppo dal dizionario di contesto, quindi lo codifica successivamente. Innanzitutto costruiamo un albero binario basato sul modello della catena di Markov. Attraversando l'occupazione dei voxel, assegniamo i valori 1 e 0 rispettivamente ai voxel occupati e vuoti e calcoliamo la probabilità in base alla struttura ad albero. Partendo dal nodo radice, quando un voxel è occupato, registriamo il nodo figlio sinistro come 1. Altrimenti contrassegniamo il nodo figlio destro come 0 e procediamo alla fase successiva di giudizio e divisione. La formula di calcolo per la probabilità di esecuzione dei voxel occupati può essere trovata nell'Eq. (4).
Per lunghezze di percorso inferiori o uguali a n, possono esserci 2n nodi dell'albero che rappresentano gli stati di occupazione dei voxel. Pertanto, la probabilità di qualsiasi voxel occupato è rappresentata dalla probabilità congiunta indipendente di attraversare tutti gli stati iniziando dalla radice e terminando in qualsiasi nodo senza figli dell'albero. Sulla base dell'Eq. (4), per eseguire la codifica aritmetica sull'occupazione della sequenza voxel, abbiamo bisogno delle probabilità cumulative superiore e inferiore della sequenza, come mostrato nell'Eq. (5).
Utilizzando questo approccio, possiamo utilizzare le proprietà adattative della codifica aritmetica per regolare il valore di stima della probabilità di ciascun simbolo in base al modello di stima della probabilità ottimizzato e alla frequenza di ciascun simbolo nella sequenza di simboli corrente. Ciò ci consente di calcolare i limiti superiore e inferiore della probabilità cumulativa di voxel occupati e completare il processo di codifica.
Sperimentare
Dettagli di implementazione
- Set di dati. Per verificare le prestazioni del metodo proposto, sono stati condotti esperimenti approfonditi su set di dati di nuvole di 16 punti che possono essere scaricati dal Rif. [40], come mostrato in Fig. 3, in cui le Figg. 3(a)– 3(l) sono ritratti con punti densi e le Figg. 3(m) – 3(p) sono architetture a punti sparsi. Fichi. 3(a) – 3(h) sono sequenze di dati di nuvole di punti della parte superiore del corpo voxelizzate di due risoluzioni spaziali ottenute da Microsoft. Fichi. 3(i)– 3(l) sono scelti da 8i sequenze di dati di nuvole di punti di corpi interi voxelizzati. Le rimanenti nuvole di punti sparse su larga scala nelle Figg. 3(k)– 3(p) sono set di dati statici di facciata e architettura.
- Metriche di valutazione. Le prestazioni del metodo proposto vengono valutate in termini di bit per punto (BPP). Il BPP si riferisce alla somma dei bit occupati dalle informazioni sulle coordinate allegate al punto. Più basso è il valore, migliori saranno le prestazioni.
dove Sizedig rappresenta il numero di bit occupati dalle informazioni sulle coordinate dei dati della nuvola di punti e k si riferisce al numero di punti nella nuvola di punti originale.
- Punti di riferimenti. Confrontiamo principalmente il nostro metodo con altri algoritmi di base, tra cui: PCL-PCC: compressione basata su octree in PCL; G-PCC (modello di test intra-codificatori MPEG) e interEM (modello di test inter-codificatori MPEG) mirano rispettivamente alla compressione della nuvola di punti a fotogramma singolo e multi-fotogramma; Silhouette 3D (S3D)[41] e Silhouette 4D (S4D)[42] mirano rispettivamente alla compressione di nuvole di punti a fotogramma singolo e multi-fotogramma.
Per PCL, utilizziamo l'approccio di compressione della nuvola di punti a otto in PCL-v1.8.1 solo per la compressione della geometria. Impostiamo i parametri di risoluzione dell'octree dalla precisione del punto e dalla risoluzione del voxel. Per G-PCC (TM13-v11.0), scegliamo una geometria senza perdite—condizione degli attributi senza perdite in modalità predittiva a otto, lasciando i parametri come predefiniti. Per interEM (tmc3v3.0), utilizziamo come confronto i risultati sperimentali in condizioni di geometria e attributi senza perdite[43]. Per S3D
e S4D, seguiamo le condizioni e i parametri predefiniti. - Hardware. L'algoritmo proposto è implementato in Matlab e C++ utilizzando alcune funzioni del PCL-v1.8.1. Tutti gli esperimenti sono stati testati su un laptop con CPU Intel Core i7-8750 a 2.20 GHz con 8 GB di memoria.
Risultati della compressione della nuvola di punti a fotogramma singolo
- Risultati di compressione di ritratti di sequenze di dati di nuvole di punti dense
La tabella 1 mostra le prestazioni dei nostri algoritmi di compressione della geometria della nuvola di punti senza perdita di dati guidati dal contesto spaziale rispetto ai metodi PCL-PCC, G-PCC e S3D su ritratti di sequenze di dati di nuvole di punti dense. Dalla Tabella 1 si può vedere che per tutta la nuvola di punti delle stesse sequenze, il metodo proposto raggiunge il BPP di compressione più basso rispetto ad altri metodi. Il nostro algoritmo offre guadagni medi da −1.56% a −0.02% contro S3D e guadagni da −10.62% a −1.45% contro G-PCC. Mostra un vantaggio più evidentetage, cioè, i guadagni in termini di prestazioni di compressione dell'algoritmo proposto vanno da −10.62% a −1.45%; Per PCL-PCC, l'algoritmo proposto mostra un guadagno quasi raddoppiato su tutte le sequenze, compreso tra −154.43% e −85.39%. - Risultati della compressione di dati di nuvole sparse su larga scala
Poiché S3D non può funzionare in questo caso, confrontiamo solo il nostro algoritmo di compressione della nuvola di punti con geometria senza perdita, guidato dal contesto spaziale, con i metodi PCL-PCC e G-PCC su dati di nuvole di punti sparsi su larga scala. Ancora una volta, il nostro algoritmo raggiunge prestazioni considerevoli con G-PCC e PCL-PCC, come mostrato nella Tabella 1. I risultati hanno mostrato che i guadagni medi di BPP che vanno da -8.84% a -4.35% vengono catturati rispetto a G-PCC. Per PCL-PCC, il nostro algoritmo proposto mostra vantaggi più evidentitages, con guadagni che vanno dal −34.69% al −23.94%. - Riepilogo
Per fornire un confronto più comprensibile dei risultati della compressione della nuvola di punti a fotogramma singolo, la Tabella 2 presenta i risultati medi tra il nostro metodo di compressione spaziale guidato dal contesto e altri metodi di benchmark all'avanguardia. Rispetto a S3D, il metodo da noi proposto mostra guadagni medi che vanno da -0.58% a -3.43%. Per quanto riguarda G-PCC e PCL-PCC, i guadagni medi raggiungono rispettivamente almeno il -3.43% e il -95.03%. L'analisi sperimentale rivela che il nostro metodo di compressione spaziale guidata dal contesto supera gli attuali S3D, G-PCC e PCL-PCC con un margine significativo. Pertanto, può soddisfare i requisiti di compressione senza perdite della geometria della nuvola di punti per vari tipi di scene, ad esempio distribuzioni dense o sparse, e l'efficacia del nostro metodo rimane costantemente. - Risultati della compressione della nuvola di punti multi-frame
Valutiamo il nostro algoritmo di compressione della geometria della nuvola di punti guidata dal contesto spazio-temporale proposto rispetto agli algoritmi di compressione esistenti come S4D, PCL-PCC, G-PCC e interEM. In questo esperimento vengono utilizzati solo ritratti di sequenze di dati di nuvole dense di punti. I risultati sono illustrati in.
Tabella 1. Confronti BPP del nostro algoritmo di compressione spaziale guidato dal contesto e dei metodi di base.
Tabella 2. Confronto BPP con algoritmi all'avanguardia su dati di nuvole di punti a fotogramma singolo.
Tabella 3. Come possiamo vedere, dopo le ottimizzazioni nella modalità di previsione e nel codificatore aritmetico, l'algoritmo proposto mostra superiorità su tutte le sequenze di test. Nello specifico, rispetto a interEM e G-PCC, l’algoritmo proposto mostra guadagni significativi che vanno rispettivamente dal −51.94% al −17.13% e dal −46.62% al −5.7%. Rispetto a S4D, l’algoritmo proposto mostra un netto miglioramento che va dal −12.18% allo −0.33%. Per quanto riguarda PCL-PCC, il nostro algoritmo proposto si è quasi dimezzato in tutte le sequenze di test.
Inoltre, riassumiamo i risultati della compressione e i guadagni del metodo proposto sulle sequenze di dati della nuvola di punti densa del ritratto, elencati nella Tabella 4. In media, fornisce guadagni tra −11.5% e −2.59% rispetto alla nuvola di punti guidata dal contesto spaziale algoritmo di compressione della geometria proposto in precedenza. Inoltre, mostra guadagni medi superiori del -19% rispetto a G-PCC e ha raggiunto un guadagno medio di codifica del -24.55% rispetto a interEM. Inoltre, rispetto a S3D e S4D, guadagna in media rispettivamente più del −6.11% e del −3.64%. L'analisi sperimentale complessiva mostra che il metodo di compressione della nuvola di punti guidato dal contesto spaziotemporale può sfruttare appieno sia la correlazione spaziale che temporale degli strati adiacenti all'interno di intra-frame e inter-frame. Miglioriamo anche la selezione del contesto globale e il modello di probabilità del codificatore aritmetico per ottenere un bit rate inferiore. Il metodo proposto supera le prestazioni degli algoritmi all'avanguardia, in modo da soddisfare i requisiti di compressione senza perdita della geometria della nuvola di punti in scenari di applicazioni multimediali come i ritratti dinamici.
Tabella 3. Confronti bit per punto del nostro algoritmo di compressione spazio-temporale guidato dal contesto e dei metodi di base.
Tabella 4. Confronto bit per punto con algoritmi all'avanguardia su dati di nuvole di punti multi-frame.
Studio sull'ablazione
Eseguiamo studi di ablazione sulla codifica predittiva su sequenze di dati di nuvole di punti dell'intero corpo voxelizzati 8i per dimostrare l'efficacia della partizione. Dalla Tabella 5 si può vedere che il miglioramento mostra un guadagno stabile del −70% sulla compressione della nuvola di punti multiframe e del −60% sulla compressione della nuvola di punti a frame singolo rispetto alla codifica predittiva senza partizione.
Successivamente, eseguiamo un esperimento di ablazione sulla codifica aritmetica per dimostrare l'efficacia del dizionario contestuale. Come mostrato nella Tabella 6, nel nostro metodo si osserva un netto miglioramento del -33% sulla compressione della nuvola di punti multi-frame e quello del -41% sulla compressione della nuvola di punti a fotogramma singolo rispetto alla codifica aritmetica senza dizionario di contesto.
Consumo di tempo
Testiamo il consumo di tempo per valutare la complessità dell'algoritmo e confrontare i metodi proposti con altri. La complessità dell'algoritmo viene analizzata indipendentemente dai codificatori e dai decodificatori, elencati nella Tabella 7. Come possiamo vedere, G-PCC, interEM e PCL-PCC possono raggiungere un tempo di codifica inferiore a 10 s e un tempo di decodifica inferiore a 5 s per dati di nuvole di punti densi di ritratti. Si comportano bene anche con dati di nuvole sparse su larga scala rispetto ad altri. Gli algoritmi da noi proposti impiegano circa 60 s e 15 s per codificare e decodificare le sequenze di ritratti, ancora di più sui dati delle nuvole di punti di facciata e architettura. Esiste un compromesso tra bitrate e velocità di compressione. Rispetto a S3D e S4D, che impiegano centinaia di secondi per la codifica, il nostro metodo, che richiede molto tempo, può mostrare una superiorità.
In sintesi, il consumo di tempo dei metodi da noi proposti è medio tra tutti gli algoritmi confrontati, ma è comunque necessario migliorarlo ulteriormente.
Conclusioni
In questo articolo, proponiamo un metodo spaziotemporale guidato dal contesto per la compressione della geometria della nuvola di punti senza perdite. Consideriamo la nuvola di punti affettata di spessore unitario come unità di input e adottiamo la modalità di codifica predittiva della geometria basata sull'algoritmo del commesso viaggiatore, che si applica sia all'intra-frame che all'inter-frame. Inoltre, facciamo pieno uso delle informazioni sul contesto globale e del codificatore aritmetico adattivo basato sull'aggiornamento rapido del contesto per ottenere risultati di compressione e decompressione senza perdite delle nuvole di punti. I risultati sperimentali dimostrano l’efficacia dei nostri metodi e la loro superiorità rispetto agli studi precedenti. Per il lavoro futuro, prevediamo di studiare ulteriormente la complessità complessiva dell'algoritmo, riducendo la complessità dell'algoritmo per ottenere un tasso di compressione ad alta velocità e risultati di compressione a basso bit rate. Un bit rate basso e un metodo supportato in tempo reale/basso ritardo sono altamente desiderati in vari tipi di scene.
Riferimenti
- MI XX, YANG BS, DONG Z, et al. Estrazione e vettorizzazione automatizzata dei confini stradali 3D utilizzando nuvole di punti MLS [J]. Transazioni IEEE sui sistemi di trasporto intelligenti, 2022, 23(6): 5287 – 5297. DOI: 10.1109/TITS.2021.3052882
- DONG Z, LIANG FX, YANG BS et al. Registrazione di nuvole di punti laser scanner terrestri su larga scala: un review e punto di riferimento [J]. Rivista ISPRS di fotogrammetria e telerilevamento, 2020, 163: 327– 342. DOI: 10.1016/j.isprsjprs.2020.03.013
- GRAZIOSI D, NAKAGAMI O, KUMA S, et al. Un oltreview delle attività di standardizzazione in corso della compressione delle nuvole di punti: basata su video (V-PCC) e basata su geometria (G-PCC) [J]. Transazioni APSIPA sull'elaborazione di segnali e informazioni, 2020, 9: e13
- DE QUEIROZ RL, CHOU P A. Compressione di nuvole di punti 3D utilizzando una trasformazione gerarchica adattativa alla regione [J]. Transazioni IEEE sull'elaborazione delle immagini, 2016, 25(8): 3947–3956. DOI: 10.1109/TIP.2016.2575005
- BLETTERER A, PAYAN F, ANTONINI M, et al. Compressione della nuvola di punti utilizzando mappe di profondità [J]. Imaging elettronico, 2016, 2016(21):1–6
- MEKURIA R, BLOM K, CESAR P. Progettazione, implementazione e valutazione di un codec a nuvola di punti per video tele-immersivi [J]. Transazioni IEEE su circuiti e sistemi per tecnologia video, 2017, 27(4): 828 – 842. DOI: 10.1109/ TCSVT.2016.2543039
- DE QUEIROZ RL, CHOU P A. Compressione con compensazione del movimento di nuvole di punti voxelizzate dinamiche [J]. Transazioni IEEE sull'elaborazione delle immagini, 2017, 26 (8): 3886–3895. DOI: 10.1109/TIP.2017.2707807
- CAO C, PREDA M, ZAHARIA T. Compressione della nuvola di punti 3D: un'indagine [C]// La 24a Conferenza Internazionale sul 3D Web Tecnologia. ACM, 2019: 1–9. DOI: 10.1145/3329714.3338130
- GRAZIOSI D, NAKAGAMI O, KUMA S, et al. Un oltreview delle attività di standardizzazione in corso della compressione delle nuvole di punti: basata su video (V-PCC) e basata su geometria (G-PCC) [J]. Transazioni APSIPA sull'elaborazione di segnali e informazioni, 2020, 9(1): e13. DOI: 10.1017/atsip.2020.12
- HUANG Y, PENG JL, KUO CJ et al. Codifica geometrica progressiva basata su Octree delle nuvole di punti [C]//La terza conferenza Eurographics/IEEE VGTC sulla grafica basata sui punti. IEEE, 3: 2016–103
- FAN YX, HUANG Y, PENG J L. Compressione della nuvola di punti basata sul clustering di punti gerarchici [C]//Vertice e conferenza annuale dell'Associazione per l'elaborazione dei segnali e delle informazioni dell'Asia-Pacifico. IEEE, 2014: 1 – 7. DOI: 10.1109/APSIPA.2013.6694334
- DRICOT A, ASCENSO J. Zuppa triangolare multilivello adattiva per la codifica di nuvole di punti basata sulla geometria [C]//Il 21° workshop internazionale sull'elaborazione dei segnali multimediali (MMSP). IEEE, 2019: 1 – 6. DOI: 10.1109/ MMSP.2019.8901791
- HE C, RAN LQ, WANG L, et al. Compressione della superficie impostata su punti basata sull'analisi del modello di forma [J]. Strumenti e applicazioni multimediali, 2017, 76(20): 20545–20565. DOI: 10.1007/s11042-016-3991-0
- IMDAD U, ASIF M, AHMAD M, et al. Compressione e decompressione tridimensionale della nuvola di punti utilizzando polinomi di grado uno [J]. Simmetria, 2019, 11(2): 209. DOI: 10.3390/sym11020209
- SOLE XB, MA H, SOLE YX, et al. Un nuovo algoritmo di compressione della nuvola di punti basato sul clustering [J]. Lettere IEEE su robotica e automazione, 2019, 4(2): 2132–2139. DOI: 10.1109/LRA.2019.2900747
- DE OLIVEIRA RENTE P, BRITES C, ASCENSO J, et al. Codifica della geometria delle nuvole di punti 3D statiche basate su grafici [J]. Transazioni IEEE sui contenuti multimediali, 2019, 21(2): 284–299. DOI: 10.1109/TMM.2018.2859591
- ISO. Compressione della nuvola di punti basata sulla geometria (G-PCC): ISO/IEC 23090-9 [S]. 2021
- DRICOT A, ASCENSO J. Codifica ibrida della geometria della nuvola di punti a otto piani [C]//La 27a conferenza europea sull'elaborazione del segnale (EUSIPCO). IEEE, 2019: 1–5
- ZHANG X, GAO W, LIU S. Partizione geometrica implicita per la compressione della nuvola di punti [C]//Atti della conferenza sulla compressione dei dati del 2020 (DCC). IEEE, 2020: 73–82. DOI: 10.1109/DCC47342.2020.00015
- QUACH M, VALENZISE G, DUFAUX F. Apprendimento delle trasformazioni convoluzionali per la compressione della geometria della nuvola di punti con perdita [C]//La conferenza internazionale IEEE 2019 sull'elaborazione delle immagini (ICIP). IEEE, 2019: 4320– 4324. DOI: 10.1109/ICIP.2019.8803413
- HUANG TX, LIU Y. Compressione della geometria della nuvola di punti 3D sull'apprendimento profondo [C]//La 27a conferenza internazionale ACM sulla multimedialità. ACM, 2019: 890–898. DOI: 10.1145/3343031.3351061
- GUARDA AFR, RODRIGUES NMM, PEREIRA F. Codifica della nuvola di punti: adozione di un approccio basato sull'apprendimento profondo [C]//Picture Coding Symposium (PCS). IEEE, 2020: 1–5. DOI: 10.1109/PCS48520.2019.8954537
- WANG JQ, ZHU H, MA Z, et al. Compressione della geometria della nuvola di punti appresa [EB/OL]. [2023-09-01]. https://arxiv.org/abs/1909.12037.pdf
- AINALA K, MEKURIA RN, KHATHARIYA B, et al. Un livello di miglioramento migliorato per la compressione della nuvola di punti basata su otto con approssimazione di proiezione piana [C]//SPIE Optical Engineering+Applications. SPIE, 2016: 223–231. DOI: 10.1117/12.2237753
- SCHWARZ S, HANNUKSELA MM, FAKOUR-SEVOM V, et al. Codifica video 2D di dati video volumetrici [C]//Picture Coding Symposium (PCS). IEEE, 2018: 61–65. DOI: 10.1109/PCS.2018.8456265
- FAKOUR SEVOM V, SCHWARZ S, GABBOUJ M. Interpolazione di dati 3D guidata dalla geometria per la codifica di nuvole di punti dinamiche basate sulla proiezione [C]//Il 7° workshop europeo sull'elaborazione delle informazioni visive (EUVIP). IEEE, 2019: 1–6. DOI: 0.1109/EUVIP.2018.8611760
- KATHARIYA B, LI L, LI Z, et al. Compressione dinamica senza perdite della geometria della nuvola di punti con intercompensazione e previsione del commesso viaggiatore [C]// Conferenza sulla compressione dei dati. IEEE, 2018: 414. DOI: 10.1109/ DCC.2018.00067
- ISO. Codifica visiva volumetrica basata su video (V3C) e compressione di nuvole di punti basata su video: ISO/IEC 23090-5 [S]. 2021
- PARCO J, LEE J, PARCO S, et al. Codifica della mappa di occupazione basata sulla proiezione per la compressione della nuvola di punti 3D [J]. Transazioni IEIE su elaborazione e calcolo intelligenti, 2020, 9(4): 293–297. DOI: 10.5573/ieiespc.2020.9.4.293
- COSTA A, DRICOT A, BRITES C, et al. Miglioramento del patch pack per lo standard MPEG V-PCC [C]//IEEE 21st International Workshop on Multimedia Signal Processing (MMSP). IEEE, 2019: 1 – 6. DOI: 10.1109/ MMSP.2019.8901690
- KAMMERL J, BLODOW N, RUSU RB, et al. Compressione in tempo reale dei flussi di nuvole di punti [C]//Atti della conferenza internazionale IEEE 2012 sulla robotica e l'automazione. IEEE, 2012: 778 – 785. DOI: 10.1109/ICRA.2012.6224647
- PCL. Libreria di nuvole di punti. [EB/OL]. [2023-09-01]. http://pointclouds.org/
- THANOU D, CHOU PA, FROSSARD P. Compressione basata su grafici di sequenze dinamiche di nuvole di punti 3D [J]. Transazioni IEEE sull'elaborazione delle immagini, 2016, 25(4): 1765–1778. DOI: 10.1109/TIP.2016.2529506
- LI L, LI Z, ZAKHARCHENKO V, et al. Previsione avanzata del movimento 3D per la compressione degli attributi della nuvola di punti basata su video [C]//Conferenza sulla compressione dei dati (DCC). IEEE, 2019: 498–507. DOI: 10.1109/DCC.2019.00058
ZHAO LL, MA KK, LIN XH, et al. Compressione della nuvola di punti LiDAR in tempo reale utilizzando la previsione bidirezionale e la codifica in virgola mobile adattativa all'intervallo [J]. Transazioni IEEE sulla radiodiffusione, 2022, 68(3): 620 – 635. DOI: 10.1109/TBC.2022.3162406 - LIN JP, LIU D, LI HQ, et al. M-LVC: Previsione di fotogrammi multipli per la compressione video appresa [C]//Conferenza IEEE/CVF sulla visione artificiale e il riconoscimento di modelli. IEEE, 2020: 3543 – 3551. DOI: 10.1109/ CVPR42600.2020.00360
- YANG R, MENTZER F, VAN GOOL L, et al. Apprendimento per la compressione video con qualità gerarchica e miglioramento ricorrente [C]//Conferenza IEEE/CVF sulla visione artificiale e il riconoscimento di modelli. IEEE, 2020: 6627–6636.DOI: 10.1109/CVPR42600.2020.00666
- KAYA EC, TABUS I. Compressione senza perdita di sequenze di nuvole di punti utilizzando modelli CNN ottimizzati per sequenze [J]. Accesso IEEE, 2022, 10: 83678 –83691. DOI: 10.1109/ACCESS.2022.3197295
- DING S, MANNAN MA, POO A N. Riquadro di delimitazione orientato e rilevamento dell'interferenza globale basato su octree nella lavorazione a 5 assi di superfici a forma libera [J]. Progettazione assistita da computer, 2004, 36(13): 1281-1294
- ALEXIOU E, VIOLA I, BORGES TM, et al. Uno studio completo delle prestazioni di distorsione della velocità nella compressione della nuvola di punti MPEG [J]. Transazioni APSIPA sul trattamento dei segnali e delle informazioni, 2019, 8: e27. doi:10.1017/ ATSIP.2019.20
- PEIXOTO E. Compressione intra-frame della geometria della nuvola di punti utilizzando la decomposizione diadica [J]. Lettere sull'elaborazione del segnale IEEE, 2020, 27: 246–250. DOI: 10.1109/LSP.2020.2965322
- RAMALHO E, PEIXOTO E, MEDEIROS E. Silhouette 4D con selezione del contesto: compressione geometrica senza perdita di nuvole di punti dinamici [J]. Lettere di elaborazione del segnale IEEE, 2021, 28: 1660 – 1664. DOI: 10.1109/ lsp.2021.3102525
- ISO. Condizioni di test comuni per il documento G-PCC N00106: ISO/IEC JTC 1/ SC 29/WG 7 MPEG [S]. 2021
Biografie
- ZHANG Huiran ha conseguito i diplomi BE e ME presso la Scuola di Geodesia e Geomatica e il Laboratorio Statale di Ingegneria dell'Informazione in Survey Mapping e Remote Sensing, entrambi presso l'Università di Wuhan, in Cina, rispettivamente nel 2020 e nel 2023. Attualmente è geometra del Guangzhou Urban Planning and Design Survey Research Institute, Cina. I suoi interessi di ricerca includono l'elaborazione e la compressione dei dati delle nuvole di punti. Ha partecipato a diversi progetti legati al campo del telerilevamento e ha pubblicato un articolo in Geomatica e scienza dell'informazione dell'Università di Wuhan.
- DONGZhen (dongzhenwhu@whu.edu.cn) ha conseguito il titolo BE e il dottorato in telerilevamento e fotogrammetria presso l'Università di Wuhan, in Cina, rispettivamente nel 2011 e nel 2018. È professore presso lo State Key Laboratory of Information Engineering in Surveying, Mapping and Remote Sensing (LIESMARS), Università di Wuhan. I suoi interessi di ricerca includono la ricostruzione 3D, la comprensione della scena, l'elaborazione delle nuvole di punti e le loro applicazioni nei sistemi di trasporto intelligenti, nelle città gemellate digitali, nello sviluppo urbano sostenibile e nella robotica. Ha ricevuto oltre 10 riconoscimenti da vari concorsi nazionali e internazionali e ha pubblicato circa 60 articoli in varie riviste e convegni.
WANG Mingsheng ha conseguito la laurea BE in College of Computer Science and Technology presso l'Università di Jilin, Cina nel 2001, e la laurea ME in School of Computer Science and Engineering presso la South China University of Technology, Cina nel 2004. Attualmente è ingegnere senior presso Guangzhou Urban Planning & Design Survey Research Institute, Cina. I suoi interessi di ricerca includono applicazioni e software informatici, fisiografia e rilevamento. Ha ricevuto oltre 20 riconoscimenti da vari concorsi nazionali e ha pubblicato circa 50 articoli in varie riviste e convegni.
DOI: 10.12142/ZTECOM.202304003
https://kns.cnki.net/kcms/detail/34.1294.TN.20231108.1004.002.html, pubblicato online l'8 novembre 2023
Manoscritto ricevuto: 2023-09-11
Documenti / Risorse
![]() |
Algoritmo guidato ZTE per la compressione della geometria delle nuvole di punti senza perdite [pdf] Guida utente Algoritmo guidato per la compressione della geometria della nuvola di punti senza perdita, Guidato, Algoritmo per la compressione della geometria della nuvola di punti senza perdita, Compressione della geometria della nuvola di punti senza perdita, Compressione della geometria della nuvola di punti, Compressione della geometria |