Ivo Gasparini

TreeGPT: Generative Pre-trained Transformer per applicazioni forestali con nuvole di punti 3D

· Ivo
Nuvola di punti LiDAR di una foresta
Figura 1: Esempio di una nuvola di punti segmentata di un bosco nel Canton Neuchâtel usata per il pre-training.

📄 Master Thesis - TreeGPT


Per la mia tesi di master, ho affrontato una sfida che cattura il mio interesse da anni: sfruttare nuvole di punti LiDAR per generare inventari forestali automatizzati.

Ricordo quando studiavo scienze forestali che uno dei problemi ricorrenti nella pianificazione forestale era la mancanza di dati accurati sull’area forestale in questione. Come pianificare efficacemente la quota di taglio (Hiebsatz), il periodo di rotazione (Umtriebszeit), la composizione delle specie arboree (Baumartenzusammensetzung) e qualsiasi intervento selvicolturale senza un’accurata panoramica di ciò con cui stiamo lavorando? I dati in questo ambito derivano spesso dall’inventario forestale nazionale, la cui risoluzione risulta inadeguata quando si considerano singole aree boschive. In passato, inventari manuali a campione venivano organizzati sistematicamente dall’ente pubblico in maniera capillare, ma oggigiorno i costi sono diventati proibitivi per sforzi di tale portata.

La tecnologia LiDAR cattura in modo rapido ed economico un modello 3D digitale della superficie, discretizzato in singoli punti raccolti nelle cosiddette “nuvole di punti” (vedi Figura 1). Dato che, a seconda della risoluzione, siamo in grado di distinguere visualmente i singoli alberi, le loro componenti e di riconoscerne la specie dalle scansioni di aree boschive, la conclusione è evidente: teoricamente anche un computer dovrebbe essere in grado di farlo.

La computer vision su immagini 2D è un ambito largamente sviluppato e consolidato, mentre la sua applicazione a dati 3D è relativamente agli albori. In particolare, lavorare con nuvole di punti presenta diverse sfide legate alla loro irregolarità e alla sparsità e ridondanza dell’informazione spaziale in esse contenuta, complicando notevolmente gli aspetti computazionali.

L’idea di utilizzare il Self Supervised Learning (SSL), un paradigma in cui una rete neurale si auto-allena su dati non categorizzati, rappresenta lo sviluppo logico in questo ambito. La tecnica ha preso piede con il Generative Pre-Trained Transformer (GPT) nel campo del Natural Language Processing (NLP): applicandola su praticamente l’intero corpus di internet si è arrivati a ChatGPT e alla rivoluzione dell’IA. Pertanto, utilizzare PointGPT mi è sembrata una sfida stimolante e promettente per testare questo approccio applicato alla computer vision su nuvole di punti in ambito forestale.

Per circoscrivere la mole di lavoro, mi sono concentrato sul riconoscimento delle specie arboree. La confusion matrix è promettente (figura 2). Il pre-training ha richiesto interminabili sperimentazione e tentativi, per poi giungere finalmente ad un andamento piuttosto morbido (figura 3).

Auguro agli interessati una buona lettura. La tesi completa è disponibile per il download a inizio pagina.

Matrice di confusione
Figura 2: Risultati sul set di validazione.
Perdita di ricostruzione durante il pre-training
Figura 3: Andamento del loss sul set di validazione durante la fase di pre-training.