Il tuo robot sa che sei deluso ma non gli importa

A quanto pare, un robot che recita “le mie più sincere scuse” con il giusto pizzico di contrizione digitale dopo aver fatto un disastro con il caffè mattutino, resta pur sempre un robot che vi ha appena battezzato la tastiera con del liquido bollente. Stiamo entrando in un’era in cui i nostri colleghi metallici vengono programmati per avere buone maniere, ma un nuovo e affascinante studio suggerisce che tutta la gentilezza del mondo non può nulla contro la semplice, pura incompetenza.

I ricercatori sono sempre più concentrati sulla complessa psicologia dell’interazione uomo-robot (HRI), consapevoli che, nel momento in cui i robot lasciano i capannoni industriali per entrare nelle nostre case e nei nostri uffici, la forza bruta e la precisione meccanica non bastano più. Devono capirci. Uno studio pubblicato recentemente su IEEE Robotics and Automation Letters affronta di petto questa sfida, addestrando un robot collaborativo a leggere le emozioni umane non solo dal volto, ma dall’intero contesto della situazione. I risultati rappresentano un bagno di realtà — e, onestamente, un risvolto piuttosto comico — per chiunque pensi che un robot empatico sia l’ultima frontiera dell’innovazione.

Insegnare a un bot a “leggere la stanza”

La ricerca, guidata da Seung Chan Hong durante i suoi studi alla University of Melbourne, ha deciso di mandare in pensione i vecchi e limitati metodi di rilevamento delle emozioni. Invece di limitarsi ad analizzare un’espressione facciale statica — che può facilmente scambiare una fronte corrugata per concentrazione con un segnale di rabbia — il team ha impiegato un Vision Language Model (VLM). Immaginatelo come un cugino di ChatGPT, ma dotato di occhi.

Hanno addestrato il VLM mostrandogli video di scambi di oggetti tra umani e robot, chiedendo a volontari in carne e ossa di etichettare le emozioni espresse. Fondamentalmente, questi volontari potevano vedere il quadro completo: l’oggetto che cadeva, il leggero sussulto di disappunto, il tamburellare impaziente delle dita. Questo addestramento ricco di contesto ha dato i suoi frutti. Messo a confronto con un sistema di IA convenzionale basato solo sull’analisi facciale, il VLM ha ottenuto risultati nettamente migliori, raggiungendo una somiglianza dello 0,86 con le valutazioni umane, contro lo 0,77 del modello precedente.

“Credo che [il VLM] sia stato in grado di allinearsi molto meglio a ciò che vedevano gli osservatori umani perché non guardava solo il viso della persona per un istante, ma osservava l’intera scena”, ha spiegato Hong in un’intervista a IEEE Spectrum.

Scuse impeccabili per prestazioni discutibili

Qui la faccenda si fa interessante. Il team ha organizzato un esperimento con 40 volontari. Ogni persona doveva collaborare con il robot potenziato dal VLM, programmato per commettere deliberatamente un errore. Dopo l’inevitabile pasticcio, il robot offriva una di due possibili scuse: una frase generica e preimpostata o una scusa “emotivamente adattiva”, cucita su misura sulla frustrazione percepita nell’umano.

I risultati sono stati netti: le persone hanno preferito di gran lunga il robot capace di leggere il loro fastidio e personalizzare il suo “mi dispiace”. Ben 31 partecipanti su 40 hanno favorito la risposta emotivamente sintonizzata. Sembra che una scusa personalizzata funzioni come un potente “lubrificante sociale”.

Ma ecco il colpo di scena. Quando è stato chiesto ai partecipanti quanto si fidassero del robot, i punteggi sono colati a picco su tutta la linea, indipendentemente da quanto gentilmente il robot si fosse scusato. La dura verità è che un robot può essere sensibile come un poeta, ma se non sa svolgere il suo unico compito, non otterremo mai la nostra fiducia. Come sottolinea Hong senza troppi giri di parole, le scuse “non possono riparare la fiducia persa a causa del fallimento del robot nel suo compito fisico”.

Non leggono nel pensiero, tirano solo a indovinare (bene)

Lo studio ha portato alla luce un altro limite critico. Sebbene il VLM fosse un discreto imitatore di un osservatore umano terzo, le sue capacità di indovinare le emozioni crollavano drasticamente se confrontate con ciò che i volontari provavano realmente (secondo i loro resoconti personali).

Questo rivela un divario fondamentale tra il percepire segnali sociali esteriori e il comprendere i sentimenti interiori. Il VLM poteva individuare una smorfia o una postura abbattuta e dedurre correttamente “infelicità”, ma non riusciva a cogliere le sfumature di delusione, frustrazione o tradimento che un utente poteva provare dentro di sé. “Sebbene il VLM sia un ottimo osservatore di segnali sociali esterni, non legge nel pensiero”, ha chiarito Hong.

Questo lavoro funge da monito vitale per l’intera industria della robotica. Sebbene la ricerca di macchine emotivamente intelligenti capaci di integrarsi perfettamente nelle nostre vite sia una missione nobile, non può andare a discapito dell’affidabilità fondamentale. Prima di avere un robot a cui piangere sulla spalla, assicuriamoci che non ci rovesci addosso il tè. Potete leggere lo studio completo, “Can Robots Read Your Mind? A User Study on Inferring Human Emotions in HRI”, su IEEE Xplore.