Sai qual è la scorciatoia delle intelligenze artificiali?
La scorciatoia dell’AI moderna
Le intelligenze artificiali attuali, compresi i modelli di linguaggio come GPT-4, si basano principalmente sul concetto di correlazione ossia sull'identificazione di pattern e correlazioni nei dati su cui vengono addestrate ("pensiero veloce" di cui abbiamo parlato qui).
Nonostante i progressi nell'AI abbiano portato a sistemi capaci di eseguire compiti che sembrano richiedere una forma di comprensione, questi modelli non possiedono una reale comprensione nel senso umano del termine.
La correlazione è una proprietà molto diversa dalla comprensione: un esempio
Nei mesi estivi aumentano sia le vendite di gelato che i tassi di annegamento. A prima vista, potrebbe sembrare che il consumo di gelato sia in qualche modo correlato o addirittura causi un aumento degli annegamenti.
In realtà, la correlazione tra queste due variabili è spuria. Il fattore non considerato che influisce su entrambe è la temperatura: nei mesi più caldi, le persone sono più inclinate a comprare gelato per rinfrescarsi e, allo stesso tempo, sono più propense a fare il bagno in piscine, laghi o mari, aumentando il rischio di annegamento.
Nonostante la correlazione sia spuria, può essere utile per prevedere l'aumento della domanda di entrambi durante l'estate. I produttori di gelato possono aumentare la produzione in previsione dell'aumento della domanda, mentre le autorità locali e i bagnini possono prepararsi per un aumento della sorveglianza e delle misure di sicurezza nelle aree balneari.
La scorciatoia dell’AI moderna è quella di aver capito una semplice cosa: "Tutti i modelli sono sbagliati, ma alcuni sono utili” (George Box).
Tutti i modelli sono sbagliati, ma alcuni sono utili
Questa osservazione non ci deve stupire. Le leggi di Newton sono un caposaldo della fisica (anche moderna). Pur utili per molti problemi pratici, sono state messe in discussione dall'esperimento di Arthur Eddington del 1919, che ha fornito una conferma osservativa della teoria della relatività generale di Einstein. Durante un'eclissi solare totale, Eddington osservò che la luce delle stelle veniva deviata passando vicino al Sole, un fenomeno noto come deflessione gravitazionale della luce, previsto dalla relatività generale ma non dalla fisica newtoniana.
Le misurazioni effettuate confermarono la teoria di Einstein, mostrando che la posizione delle stelle era spostata in modo coerente con le sue previsioni, e non con quelle newtoniane. Questo esperimento ha segnato un punto di svolta nella fisica, evidenziando i limiti della teoria newtoniana e l'accuratezza della relatività generale in condizioni estreme.
Due esempi di due importanti casi di successo: ChatGPT e AlphaGo
ChatGPT è un modello di linguaggio sviluppato da OpenAI. È progettato specificamente per generare testo e rispondere a domande in modo conversazionale. ChatGPT viene addestrato su un vasto corpus di testo. Durante questa fase, il modello apprende la struttura della lingua, il contesto, le informazioni del mondo, le variazioni stilistiche e molto altro. Questo addestramento cerca semplicemente di prevedere la prossima parola in una frase data il contesto delle parole precedenti. Dopo questo addestramento, ChatGPT può essere ulteriormente addestrato su un set di dati più specifico o per compiti specifici. Questo aiuta il modello a specializzarsi o ad adattarsi meglio a specifici domini o stili di conversazione. Durante l'interazione con l'utente, ChatGPT riceve una domanda. Utilizza il contesto fornito e tutto ciò che ha imparato durante l'addestramento per generare una risposta pertinente e coerente. Il modello fa ciò generando una parola alla volta, cercando di prevedere la parola successiva basandosi sulle parole precedenti nel prompt e nella risposta che sta generando.
AlphaGo è un programma di intelligenza artificiale sviluppato da DeepMind Technologies, una sussidiaria di Alphabet Inc. (la società madre di Google). È stato progettato per giocare a Go, un antico gioco da tavolo strategico che è notoriamente complesso, con più configurazioni possibili di atomi nell'universo conosciuto (molto più complesso degli scacchi). AlphaGo ha guadagnato fama mondiale nel 2016 quando ha battuto il campione del mondo di Go, Lee Sedol, in una serie di partite. AlphaGo ha due componenti principali: un modello che valuta della posizione (che valuta le posizioni del tavolo da gioco) e uno di selezione delle mosse (che seleziona le mosse da fare). Questi modelli previsionali sono stati addestrati su milioni di partite di Go giocate da umani, apprendendo modelli e strategie di gioco. Successivamente, ha migliorato le sue capacità attraverso l'apprendimento per rinforzo, giocando milioni di partite contro se stesso e apprendendo dai risultati. Durante il gioco, AlphaGo utilizza un algoritmo di ricerca chiamato per decidere le sue mosse: esplora possibili mosse in un albero di decisione espandendosi in modo selettivo lungo i percorsi più promettenti, utilizzando previsionali per valutare e selezionare le mosse. Questo approccio consente ad AlphaGo di essere estremamente efficiente nel calcolare le mosse più promettenti da un numero astronomicamente grande di possibilità.
Cosa significa questo? Che l’AI moderna, sa semplicemente (!) costruire modelli previsionali sulla base di grandi moli di dati.
Un esempio previsionale di correlazione senza comprensione
Supponiamo di prendere tutti i pazienti di un ospedale con alcune informazioni (peso e pressione sanguigna) e il responso (sano malato):
Questo è un dato tabulare: ora rappresentiamo questi dati in un grafico:
È evidente che i sani (verdi) e i malati (rossi) possono essere separati dalla linea nera che rappresenta il nostro modello previsionale: dato un nuovo paziente possiamo prevedere il suo stato solo conoscendo la sua posizione rispetto al nostro modello previsionale.
Ora immaginate che le righe nella tabella precedenti siano milioni (o miliardi) e ugualmente per le colonne (e.g., nel nostro esempio tutta la cartella clinica, compreso referti e scansioni, del paziente e la sua anamnesi familiare). L’AI moderna è in grado di trovare il nostro modello previsionale (la linea nera) in modo efficace e efficiente in tutta questa grande mole di dati.
La scorciatoia!
Questi modelli non possiedono una reale comprensione nel senso umano del termine: semplicemente trovano un modello (correlazione) previsionale (e.g., per ChatGPT prevede la parola successiva, per AlphaGo la mossa successiva) in base a un'infinità di dati senza aver compreso nulla del fenomeno che stanno modellando.