Come apprende il cervello
L’apprendimento e le reti neurali
Ricordando che non esiste oggi una teoria generale che spieghi come funziona la mente, si può comunque partire dal presupposto che questa si costruisca attraverso processi di apprendimento. Come già accennato, il termine apprendimento è dotato di svariati significati che sottolineano aspetti differenti. In questi anni il modello su cui si è lavorato è quello di Annette Armiloff-Smith. Secondo quest’ ultima, il fulcro di questo processo parte dall’apprendimento di procedure molto rigide (procedure on-off): se non si parte dall’inizio, cioè dal punto che serve da interruttore della procedura, non si riesce ad avviare il processo. Pensiamo ad esempio ai bambini di prima elementare, che per fare 5+3 devono ricontare sempre tutto (1, 2, 3, 4, 5, 6…). Ognuno di noi possiede una capacità di transcodifica veloce e per questo le reti neurali hanno una funzione molto importante.
Le reti neurali sono modelli matematici del sistema nervoso e del comportamento, simulati tramite computer. Quest’ultime imitano alcune caratteristiche essenziali della struttura e del funzionamento del sistema nervoso, e i modi con cui rispondono agli stimoli provenienti dall’esterno vengono proposte come modello del comportamento dell’organismo. Una rete neurale è formata da un complesso di unità legate tra loro da connessioni unidirezionali; le unità emulano i neuroni, mentre le connessioni emulano le giunzioni sinaptiche tra i neuroni.
Le unità di una rete tipica si dividono in:
• unità di input, cioè unità con le quali la rete registra la situazione al suo esterno;
• unità interne, con le quali la rete elabora l’informazione che giunge dall’esterno;
• unità di output, con le quali la rete risponde all’informazione esterna.
Durante il funzionamento della rete, l’attivazione si propaga dalle unità di input a quelle di output attraversando le unità interne. In ogni ciclo le unità della rete hanno un livello di attivazione che corrisponde alla frequenza di emissione di impulsi nervosi da parte di un neurone.
Nelle unità di input, questo livello di attivazione dipende dall’ambiente esterno, diversamente per le unità interne e quelle di output, esso dipende dalle eccitazioni o inibizioni che arrivano ad un’unità dalle altre unità con cui essa è collegata. La somma algebrica delle eccitazioni e delle inibizioni che raggiungono una data unità, costituisce l’input netto dell’unità che viene trasformato attraverso una specifica funzione matematica (funzione di trasferimento), nel livello di attivazione dell’unità stessa.
La modalità con cui una rete neurale risponde all’input dipende sostanzialmente da due fattori: dalla sua architettura, cioè dallo schema delle interconnessioni, e dal peso di ciascuna connessione. Data una certa architettura e determinati pesi, la rete risponderà a uno stesso input producendo sempre lo stesso output. Ciononostante, sia l’architettura che i pesi possono mutare nel corso della vita dell’organismo, così che il modo in cui la rete risponde all’input, è soggetto a modifiche che imitano le fasi di sviluppo e di apprendimento dell’organismo. La distinzione tra sviluppo e apprendimento non è definita. Nello sviluppo, le modifiche che avvengono nell’organismo hanno un’importante base genetica, mentre nell’apprendimento i cambiamenti sono soprattutto risultati dell’esperienza dell’organismo. Una procedura di apprendimento solitamente utilizzata con le reti neurali è la procedura di retropropagazione dell’errore (error backpropagation). Nelle unità di input della rete vengono codificati i diversi pattern di attivazione, ma poiché all’inizio dell’apprendimento i pesi delle connessioni sono assegnati a caso, l’output generato in risposta a ciascuno di essi non sarà quello perseguito.
Una rete neurale, che ha imparato a rispondere nel modo desiderato ai pattern di input a cui ha esibito durante l’apprendimento (pattern di addestramento), è solitamente capace di rispondere nel modo auspicato anche a nuovi pattern a cui non è stata esposta durante l’apprendimento, ma che coinvolgono la stessa capacità (pattern di generalizzazione o di prova). La conferma che la rete ha acquisito davvero la capacità desiderata consiste proprio nella sua capacità di generalizzare. Rispondendo nel modo desiderato a pattern di input che non ha mai visto prima, la rete prova di aver inglobato le regolarità presenti nel compito dell’ apprendimento. La procedura di retropropagazione dell’errore consiste in un apprendimento supervisionato, si fonda cioè su un input di insegnamento alimentato dall’esterno con lo scopo di specificare, per ciascuna unità di output, quale sia il livello di attivazione desiderato, definendo nei dettagli alla rete neurale, il comportamento che ci si aspetta da essa.
Scrivi a Igor Vitale