Per decenni, comprendere suoni come clic, fischi e impulsi esplosivi dei delfini è stata una sfida scientifica. Ma cosa accadrebbe se potessimo non solo ascoltare, ma anche comprendere i loro complessi schemi di comunicazione e generare risposte realistiche?
In occasione della Giornata Nazionale del Delfino, Google ha collaborato con ricercatori del Georgia Tech e del Wild Dolphin Project (WDP) per annunciare DolphinGemma—un modello di intelligenza artificiale di base addestrato per apprendere la struttura acustica dei delfini e generare nuove sequenze sonore simili a quelle dei delfini. Questo rappresenta un passo significativo nel percorso della comunicazione interspecie, ampliando anche il potenziale di connessione tra esseri umani e il mondo oceanico.
Decenni di ricerca sociale sui delfini
Comprendere una specie richiede un contesto profondo—qualcosa che il WDP ha fornito. Dal 1985, hanno condotto il progetto di ricerca subacquea sui delfini più longevo al mondo, concentrandosi sui delfini maculati dell’Atlantico alle Bahamas. Utilizzano metodi non invasivi, registrando video e audio combinati con l’identità e il comportamento di ogni singolo delfino.
Alcuni suoni distintivi:
- Fischi di riconoscimento per le madri che chiamano i loro piccoli
- Impulsi esplosivi durante i conflitti
- Clic ronzanti durante il corteggiamento o quando inseguono squali
Presentazione di DolphinGemma
Google ha sviluppato DolphinGemma applicando la tecnologia audio SoundStream e un modello da 400 milioni di parametri che può funzionare direttamente sui telefoni Pixel. Questo modello riconosce, analizza sequenze sonore naturali e prevede il suono successivo—simile a come l’IA elabora il linguaggio.
DolphinGemma è stato utilizzato sul campo, aiutando a rilevare schemi ripetitivi, cluster di suoni e potenziali significati. I ricercatori hanno anche utilizzato suoni sintetizzati associati agli oggetti preferiti dei delfini per costruire un “vocabolario condiviso” per la comunicazione interattiva.
Utilizzo dei telefoni Pixel per la comunicazione subacquea
Il WDP sta anche sviluppando il sistema CHAT (Cetacean Hearing Augmentation Technology), in collaborazione con il Georgia Tech. Questo sistema utilizza suoni sintetizzati che rappresentano oggetti come alghe o asciugamani, aiutando i delfini a imparare a imitare i suoni per fare “richieste”.
Come funziona:
- Ascoltare accuratamente tra i rumori dell’oceano
- Identificare correttamente il suono imitato
- Notificare i ricercatori tramite cuffie a conduzione ossea
- Fornire l’oggetto corretto in risposta al delfino
È stato utilizzato Pixel 6 e Pixel 9 (previsto per l’estate 2025) sarà ulteriormente migliorato, integrando sia altoparlante/microfono che l’esecuzione simultanea del modello di IA, migliorando velocità e fluidità di risposta durante le interazioni.
Condividere DolphinGemma con la comunità di ricerca
Google renderà open source DolphinGemma quest’estate. Sebbene sia stato addestrato su dati di delfini maculati dell’Atlantico, il modello può comunque essere personalizzato per l’uso con altre specie come il tursiope o il delfino rotatore.
La combinazione di ricerca sul campo, ingegneria e tecnologia IA sta aprendo nuove porte per permettere agli esseri umani di acquisire una comprensione più profonda delle creature marine intelligenti.
Source: https://blog.google/technology/ai/dolphingemma/