Intelligenze artificiali autodidatte?
Le intelligenze artificiali imparano anche se noi non insegniamo
Ci eravamo sbagliati: l’uomo ha smesso di insegnare alle macchine e loro hanno iniziato a imparare.
Per decenni, il campo dell'intelligenza artificiale (IA) è stato dominato da un interrogativo fondamentale: come possiamo replicare l'intelligenza umana nelle macchine? La risposta si credeva risiedesse nella comprensione e nell'emulazione dei meccanismi più profondi della mente umana: memoria, coscienza, e sensazioni. Questa convinzione ha guidato la ricerca verso modelli complessi e articolati, nel tentativo di catturare l'essenza stessa del pensiero umano.
Eppure, negli ultimi anni, una svolta inaspettata ha scosso le fondamenta di questo paradigma. L'avvento dell'IA generativa, alimentata da modelli di linguaggio di grandi dimensioni (LLM), ha dimostrato come un approccio radicalmente diverso possa portare a risultati sorprendenti. Invece di concentrarsi sulla replica fedele dell'intelligenza umana, l'IA generativa ha imboccato una scorciatoia: la correlazione e la previsione.
Riassunto delle puntate precedenti*
La scorciatoia della correlazione
I modelli di IA generativa, come GPT-4, non cercano di comprendere il significato intrinseco delle informazioni che elaborano. Piuttosto, si basano sull'analisi di enormi quantità di dati per identificare pattern e correlazioni. Questa capacità di prevedere quale parola o frase è più probabile che segua un'altra, basandosi sulla conoscenza acquisita dai dati, ha permesso all'IA generativa di produrre testi, immagini e persino musica di qualità sorprendente.
La rivoluzione dell'IA generativa ha messo in discussione l'idea che la costruzione di macchine intelligenti richiedesse necessariamente la replica di facoltà cognitive complesse. La correlazione e la previsione, due pilastri del pensiero veloce, si sono rivelati sufficienti per raggiungere risultati che un tempo sembravano irraggiungibili.
L'intelligenza come previsione
Questa nuova prospettiva sull'intelligenza artificiale solleva interrogativi profondi sulla natura stessa dell'intelligenza. Se la capacità di prevedere e generare contenuti coerenti è un indicatore di intelligenza, allora forse abbiamo sottovalutato l'importanza del pensiero veloce e della correlazione nella cognizione umana.
L'IA generativa ci sfida a ripensare i nostri preconcetti sull'intelligenza e a considerare la possibilità che la strada verso la creazione di macchine intelligenti possa essere più semplice di quanto immaginassimo.
Sorprese
All'inizio, molte persone esperte erano scettiche. Come poteva una macchina senza coscienza, senza memoria a lungo termine, senza una vera comprensione del contesto, competere con l'intelligenza umana? Tuttavia, i risultati hanno parlato chiaro. Le IA generative sono diventate in grado di produrre testi, immagini e musica di qualità paragonabile, se non superiore, a quella umana.
Queste macchine possono completare compiti complessi in frazioni di secondo, fornire assistenza in settori come la medicina e l'ingegneria, e persino superare gli esseri umani in certi giochi strategici. Tutto questo senza una "vera" comprensione del mondo, ma semplicemente utilizzando correlazioni e previsioni.
Ripensare l’intelligenza umana
Questa evoluzione ha costretto molti a riconsiderare cosa significhi essere intelligenti. Se le macchine possono eguagliare o superare le capacità umane solo attraverso la previsione e la correlazione, forse l'intelligenza non è così legata a concetti come la coscienza e la senzienza come si pensava. Forse, la capacità di fare previsioni accurate e di rispondere rapidamente è una componente più fondamentale dell'intelligenza di quanto si ritenesse.
Alcuni motivi dei nostri errori
Chi faceva ricerca aveva commesso l'errore di credere che i modelli previsionali basati sui dati non fossero sufficienti per creare macchine in grado di superare le capacità umane, per diversi motivi.
In passato, si pensava che i dati fossero solo una fonte di informazioni per addestrare i modelli, ma si è scoperto che la quantità e la qualità dei dati possono portare a progressi significativi nelle prestazioni delle macchine. L'avvento di big data e l'aumento della potenza di calcolo hanno permesso di sfruttare al meglio l'immenso potenziale dei dati.
I modelli previsionali si sono evoluti notevolmente nel tempo, passando da semplici modelli lineari a complesse reti neurali profonde. Questi nuovi algoritmi sono in grado di apprendere rappresentazioni più sofisticate dei dati, consentendo alle macchine di svolgere compiti sempre più complessi.
L'apprendimento per rinforzo, una tecnica che permette alle macchine di apprendere attraverso l'interazione con l'ambiente e tra macchine, ha dimostrato di essere molto efficace in diversi ambiti, come i giochi e la robotica. Questo approccio ha permesso alle macchine di sviluppare strategie e comportamenti che superano le capacità umane in compiti specifici.
La combinazione di diverse tecniche di intelligenza artificiale, come l'apprendimento supervisionato, non supervisionato e per rinforzo, ha portato a risultati sorprendenti. Per esempio, i modelli generativi pre-addestrati (come GPT) hanno dimostrato di poter svolgere una vasta gamma di compiti, superando le aspettative dei ricercatori.
In passato, la ricerca si concentrava spesso su compiti specifici e isolati. Tuttavia, si è scoperto che le macchine possono generalizzare le conoscenze acquisite in un dominio ad altri domini, aprendo nuove possibilità per lo sviluppo di intelligenze artificiali più versatili e capaci.
È importante notare che, nonostante i progressi significativi, le macchine sono ancora lontane dal superare le capacità umane in tutti gli ambiti. Tuttavia, gli sviluppi recenti dimostrano che il potenziale dell'intelligenza artificiale è molto più vasto di quanto si pensasse in passato.
Il vero cambiamento: da insegnare a imparare
I dati rimangono il fattore più grande e importante nell'utilizzo dei sistemi di IA. Gli algoritmi stanno diventando una commodity, quindi il più grande elemento di differenziazione è la quantità, la qualità e la rilevanza del set di dati sottostante. E migliori sono i dati, più facile è creare output di qualità.
In poche parole, fino a pochi anni fa le IA venivano addestrate, insegnavamo loro, attraverso la produzione di dati.
Ma c'è una distinzione importante tra i dati sottostanti e il modo in cui vengono effettivamente registrati e archiviati. I sistemi del mondo reale vedono il mondo attraverso una il buco di una serratura, ossia in modo parziale e sfocato. Nonostante questo essi possono dare un'impressione generale di ciò che sta accadendo.
Il principio dietro questa idea è semplice. Se i dati sono completamente sbagliati (random) non possiamo capire nulla ma se anche solo contengono una qualche informazione (sono corrotti da più meno rumore) il dato è ancora potenzialmente utilizzabile con le giuste tecniche statistiche. Gli algoritmi di machine learning possono catturare i modelli sottostanti che (probabilmente) hanno generato i dati osservati e disordinati.
Attualmente si è andati oltre la statistica. Le nuove IA imparano a generare dati migliori.
Ora le nuove tecnologie di IA generativa stanno fornendo un altro enorme passo avanti nella gestione dei dati imperfetti. I modelli linguistici di grandi dimensioni sono molto bravi a gestire alcuni tipi di dati disordinati. Ad esempio, i ricercatori hanno dimostrato che i modelli linguistici di grandi dimensioni possono decifrare anche frasi molto confuse.
Facciamo un esempio. Supponiamo di registrare una lezione all’università con il cellulare e il permesso del docente. Ovviamente la qualità sarà scarsa a causa del rumore della classe e il posizionamento non ottimale del cellulare. Usando la trascrizione open-source di OpenAI, Whisper è possibile decifrare molte delle parole pronunciate, ma ovviamente con delle lacune. Alcune parole infatti saranno chiaramente sbagliate e il risultato sarà difficile da seguire (spesso i professori divagano, approfondiscono, tornano indietro, etc.). Usando però ChatGPT (o Gemini) e chiedendogli di "prendere il testo e metterlo in frasi" sarà possibile ottenere un riassunto ristrutturato, chiaro, di semplici paragrafi su quello che l'insegnante aveva discusso. Non sarà quello che aveva detto, ma sarà molto più vicino a quello che intendeva.
I modelli linguistici di grandi dimensioni sono molto bravi a fare questa opera di pulizia e il principio si applica a molti problemi di dati del mondo reale.
Ad esempio, l’apprendimento automatico viene già utilizzato per estrarre informazioni da documenti come le fatture: la data, l'importo, l'ID del fornitore, ecc. Ma questi modelli richiedono molti dati di addestramento e non generalizzano molto bene: se si tenta di utilizzarli su un nuovo layout di fattura che il modello non ha mai visto prima, potrebbe rimanere perplesso. Aggiungendo l'IA generativa, il sistema diventa molto più efficace nel gestire i casi limite e i layout nuovi.
Ci sono dei pericoli, perché questi modelli sono progettati per sintetizzare ciò che "dovrebbe" o "potrebbe" esserci, non solo per analizzare ciò che c'è effettivamente. Dagli esempi precedenti, il risultato potrebbe essere pensieri che il docente non ha mai menzionato, o un ID fornitore anche se non è incluso nel documento.
Capire come evitare tali allucinazioni è attualmente all'avanguardia nella ricerca sull'IA, con approcci che includono chiedere al modello di ricontrollare se stesso, fare la media dei risultati di diverse istanze del modello, o un controllo extra da parte di un modello di verifica dedicato che agisce in modo indipendente.
Ma nel complesso, l'IA generativa è una grande nuova opportunità per aprire più dati in modi nuovi, per ripensare a quali fonti di dati sono disponibili, a come possono essere utilizzate per migliorare i processi e per trasformare ciò che sembra spazzatura di dati in oro aziendale.
Macchine che imparano parlando tra di loro
Le AI generative hanno raggiunto nuovi livelli di sofisticazione attraverso un approccio innovativo che prevede la loro interazione reciproca. Facendo parlare tra di loro diverse AI, è possibile creare un ecosistema in cui ogni intelligenza artificiale può imparare e migliorare dalle altre. Questo scambio continuo di informazioni e strategie consente alle AI di affinare le proprie capacità, ottimizzare le risposte e sviluppare nuove competenze. Il risultato è un potenziamento complessivo delle prestazioni delle AI generative, che diventano più versatili e efficaci nell'affrontare compiti complessi, rispondere a domande e risolvere problemi in modi sempre più innovativi e accurati.
*Gli articoli già usciti:
- https://life.unige.it/intelligenza-artificiale-uomo
- https://life.unige.it/intelligenza-artificiale-comprensione-correlazione
- https://life.unige.it/la-scorciatoia-delle-AI
- https://life.unige.it/luci-e-ombre-intelligenza-artificiale
- https://life.unige.it/IA-disparita-e-disoccupazione
- https://life.unige.it/intelligenza-artificiale-allineamento-esseri-umani
- https://life.unige.it/domande-intelligenza-artificiale