Comunicazione non verbale: come il linguaggio del corpo influisce sul riconoscimento della voce

di Giulia Nocentini

ESPERIMENTO 3: INFLUENZA DEL LINGUAGGIO EMOTIVO DEL CORPO SUL RICONOSCIMENTO DELLA PROSODIA VOCALE

L’integrazione multisensoriale è da sempre considerata adattiva, perché riduce l’ambiguità dello stimolo (de Gelder & Bertelson, 2003). Precedenti studi hanno indicato che le espressioni facciali e il tono emotivo della voce (o prosodia emotiva) si influenzano a vicenda (de Gelder & Vroomen, 2000; Massaro & Egan, 1996). La prosodia emotiva si riferisce alle variazioni di melodia e di intonazione e alle pause e accenti del discorso; la durata e l’intonazione sono fattori che giocano un ruolo importante nella prosodia vocale di alcune emozioni: ad esempio, una frase felice ha una durata normale, con un tono alto e con ampia variazione di intonazione. Acusticamente, la paura è molto simile alla felicità: la durata è normale e il tono medio è elevato, ma il cambiamento di intonazione è minore. L’integrazione delle informazioni affettive provenienti da diversi canali sensoriali sembra essere essenziale per un rapido ed accurato riconoscimento delle emozioni.

In uno studio con espressioni facciali statiche e discorsi emotivi, de Gelder e Vroomen (2000) hanno osservato un effetto cross-modale delle informazioni affettive. Il riconoscimento delle espressioni vocali trasformate era distorto verso l’espressione del viso presentata simultaneamente, anche se i partecipanti erano stati esplicitamente istruiti ad ignorare gli stimoli visivi. Uno studio di follow-up suggerisce che questa integrazione è presente anche quando l’osservatore non è a conoscenza dell’espressione del viso, come riscontrato in un paziente con cecità corticale (de Gelder et al., 2005).

Indagini con ERP sul decorso di questa integrazione hanno indicato che l’informazione affettiva proveniente da diversi canali sensoriali viene combinata all’inizio del processo percettivo (de Gelder, Bocker, Tuomainen, Hensen & Vroomen, 1999); in particolare con stimoli audiovisivi emotivi questa avviene entro 110 ms dalla loro comparsa (Pourtois, de Gelder, Vroomen, Rossion & Crommelinck, 2000).

Vroomen, Driver e de Gelder nel 2001 hanno esaminato se per l’integrazione bimodale di volti e voci affettive fossero sufficienti risorse attentive limitate: i soggetti giudicarono se una voce esprimeva felicità o paura, mentre erano incaricati di ignorare l’espressione facciale statica contemporaneamente presentata e furono aggiunti ulteriori compiti, per manipolare il carico attentivo; l’effetto di distorsione era indipendente dal fatto che i soggetti avessero eseguito un compito attentivo impegnativo. Questi risultati dimostrano, quindi, che si ha un’integrazione cross-modale delle informazioni affettive indipendentemente dai fattori attenzionali e che questo processo è automatico.
Uno studio con registrazioni intracraniche nelle scimmie ha indicato un’integrazione dei segnali facciali e vocali nella corteccia uditiva primaria (Ghazanfar, Maier, Hoffman & Logothetis, 2005).

Scoperta molto importante è stata quella che la combinazione di un volto spaventato con un tono di voce impaurito aumenta l’attivazione dell’amigdala (Dolan, Morris & de Gelder, 2001); ciò indica che la fusione delle informazioni provenienti da diversi stimoli è guidata dalla percezione del significato associato, a prescindere dal mezzo attraverso il quale questo venga trasmesso.
Nell’esperimento che verrà qui di seguito riportato (Van den Stock et al., 2007) è stato utilizzata una metodologia simile a quella adottata da de Gelder e Vroomen nel 2000, ma è stato testato l’effetto delle espressioni emotive di tutto il corpo, invece che delle sole espressioni facciali.

fig9Come stimoli visivi sono state utilizzate le stesse espressioni di tutto il corpo impaurite e felici dell’esperimento 2, ma con i volti sfocati (FIG. 9). Gli stimoli uditivi consistevano in frasi parlate, create appositamente per esprimere diversi livelli di emozione su un continuum a 7 punti tra paura e felicità, per la modifica delle quali si è regolato la durata, la gamma di tonalità e il registro del tono. Per il presente studio, sono state usate solo le ultime quattro parole della frase utilizzata da de Gelder e Vroomen (“è arrivato in aereo”). Sono poi stati creati 14 stimoli audiovisivi finali, sfruttando l’associazione di ogni espressione del corpo con ciascuno degli stimoli uditivi: le sette espressioni vocali associate al corpo impaurito e le stesse sette a quello felice. Gli stimoli sono stati presentati ai 16 partecipanti di età media 32,9 anni sfruttando lo schermo di un computer e degli altoparlanti; il tempo massimo di risposta era 4.000 ms ed il compito era esplicitamente quello di classificare l’espressione emotiva della voce in un compito a scelta tra due alternative: impaurita o felice.

Per quanto riguarda i risultati, è da segnalare il fatto che i tempi di reazione sono aumentati quando l’espressione vocale diventava più ambigua (FIG. 10). È così possibile dedurre che ci sia una certa influenza dell’espressione percepita di tutto il corpo sul riconoscimento della prosodia vocale: infatti, quando gli osservatori hanno dato giudizi circa l’emozione trasmessa dalla voce, il riconoscimento risultava sbilanciato verso l’espressione di tutto il corpo percepita contemporaneamente (FIG. 11). Nonostante Il compito richiedesse di concentrarsi esclusivamente sulla voce, vi è comunque stata una influenza sistematica della espressione emotiva corporea, così come era avvenuto per le espressioni facciali.

fig10

fig11

“Nelle posture e nell’atteggiamento che assume in ogni suo gesto, il corpo parla un linguaggio che trascende l’espressione verbale.
Non è la mente che va in collera, né il corpo che colpisce: è l’individuo nella sua totalità che si esprime.”
(Alexander Lowen, Il Linguaggio Del Corpo, 1958)

Scrivi a Igor Vitale