TreeGPT: Generative Pre-trained Transformer per applicazioni forestali con nuvole di punti 3D

Per la mia tesi di master, ho affrontato una sfida che cattura il mio interesse da anni: sfruttare nuvole di punti LiDAR per generare inventari forestali automatizzati.
Ricordo quando studiavo scienze forestali che uno dei problemi ricorrenti nella pianificazione forestale era la mancanza di dati accurati sull’area forestale in questione. Come pianificare efficacemente la quota di taglio (Hiebsatz), il periodo di rotazione (Umtriebszeit), la composizione delle specie arboree (Baumartenzusammensetzung) e qualsiasi intervento selvicolturale senza un’accurata panoramica di ciò con cui stiamo lavorando? I dati in questo ambito derivano spesso dall’inventario forestale nazionale, la cui risoluzione risulta inadeguata quando si considerano singole aree boschive. In passato, inventari manuali a campione venivano organizzati sistematicamente dall’ente pubblico in maniera capillare, ma oggigiorno i costi sono diventati proibitivi per sforzi di tale portata.
La tecnologia LiDAR cattura in modo rapido ed economico un modello 3D digitale della superficie, discretizzato in singoli punti raccolti nelle cosiddette “nuvole di punti” (vedi Figura 1). Dato che, a seconda della risoluzione, siamo in grado di distinguere visualmente i singoli alberi, le loro componenti e di riconoscerne la specie dalle scansioni di aree boschive, la conclusione è evidente: teoricamente anche un computer dovrebbe essere in grado di farlo.
La computer vision su immagini 2D è un ambito largamente sviluppato e consolidato, mentre la sua applicazione a dati 3D è relativamente agli albori. In particolare, lavorare con nuvole di punti presenta diverse sfide legate alla loro irregolarità e alla sparsità e ridondanza dell’informazione spaziale in esse contenuta, complicando notevolmente gli aspetti computazionali.
L’idea di utilizzare il Self Supervised Learning (SSL), un paradigma in cui una rete neurale si auto-allena su dati non categorizzati, rappresenta lo sviluppo logico in questo ambito. La tecnica ha preso piede con il Generative Pre-Trained Transformer (GPT) nel campo del Natural Language Processing (NLP): applicandola su praticamente l’intero corpus di internet si è arrivati a ChatGPT e alla rivoluzione dell’IA. Pertanto, utilizzare PointGPT mi è sembrata una sfida stimolante e promettente per testare questo approccio applicato alla computer vision su nuvole di punti in ambito forestale.
Per circoscrivere la mole di lavoro, mi sono concentrato sul riconoscimento delle specie arboree. La confusion matrix è promettente (figura 2). Il pre-training ha richiesto interminabili sperimentazione e tentativi, per poi giungere finalmente ad un andamento piuttosto morbido (figura 3).
Auguro agli interessati una buona lettura. La tesi completa è disponibile per il download a inizio pagina.

