朝のコーヒーをこぼしたロボットが、いかにも申し訳なさそうなデジタルな声音で「誠に申し訳ございません」と謝罪したところで、あなたのキーボードが熱々のコーヒーに浸っている事実に変わりはありません。私たちは今、金属製の「同僚」たちに社会的なマナーを教え込む時代に突入していますが、最新の研究によれば、どれほど丁寧な言葉を並べても、単純な「無能さ」をカバーすることはできないようです。
研究者たちは今、ヒューマン・ロボット・インタラクション(HRI)という、一筋縄ではいかない科学に注力しています。ロボットが工場の床を離れ、私たちの家庭やオフィスに入り込むようになれば、単なる物理的な能力だけでは不十分だからです。彼らには、私たちを「理解」することが求められています。『IEEE Robotics and Automation Letters』に掲載された最近の研究は、この課題に真っ向から挑んでいます。共同作業を行うロボットに、顔の表情だけでなく、その場の「文脈」全体から人間の感情を読み取るよう学習させたのです。その結果は、感情豊かなロボットこそが最終フロンティアだと信じる人々にとって、冷静かつ(率直に言って)滑稽なほどの現実を突きつけるものでした。
「空気を読む」ロボットの訓練
University of Melbourne(メルボルン大学)の学部生時代にこの研究を主導したSeung Chan Hongは、使い古された従来の感情検知手法を捨てることにしました。単に静止した表情を分析する(これでは、集中して眉間にしわを寄せているのを「怒り」と誤認しやすい)代わりに、研究チームは**ビジョン言語モデル(VLM)**を採用しました。いわば、ChatGPTのいとこに「目」を授けたような存在です。
彼らは、人間とロボットが物を受け渡しするビデオをVLMに見せ、人間のボランティアがその時の感情をラベル付けすることで学習させました。重要なのは、ボランティアたちが「全体像」を把握していたことです。物を落とした瞬間、わずかに顔をしかめる様子、イライラして指で机を叩く仕草――。こうした文脈豊かなトレーニングが功を奏しました。顔の分析のみを行う従来のAIシステムと比較したところ、VLMの精度は大幅に向上し、人間の観察者との一致度は従来の0.77に対して0.86を記録しました。
「(VLMは)人間の観察者の視点により近づくことができたのだと思います。短時間だけ人の顔を見るのではなく、シーン全体を見ていたからです」と、HongはIEEE Spectrumのインタビューで語っています。
完璧な謝罪、不完全なパフォーマンス
ここからが面白いところです。チームは40人のボランティアを対象に実験を行いました。参加者はVLM搭載ロボットと協力して作業を行いますが、このロボットはあらかじめ「わざと失敗する」ようにプログラムされています。そして失敗の後、ロボットは2パターンの謝罪のうちどちらかを行います。1つは定型文通りの謝罪、もう1つは相手のフラストレーションを察知して言葉を選んだ「感情適応型」の謝罪です。
結果は一目瞭然でした。参加者の多くは、自分の苛立ちを読み取り、それに合わせて「ごめんなさい」をカスタマイズしてくれるロボットを圧倒的に支持しました。40人中31人という驚くべき数の参加者が、感情に寄り添った対応を好んだのです。パーソナライズされた謝罪は、強力な「社会的な潤滑油」として機能するようです。
しかし、ここにオチがあります。ロボットに対する「信頼度」を尋ねたところ、ロボットがどれほど殊勝に謝罪しようとも、参加者の評価は一様にガタ落ちしたのです。揺るぎない真実とは、ロボットがどれほど詩人のように繊細な心(プログラム)を持っていても、与えられた唯一の仕事をこなせなければ、私たちはそれを信頼しないということです。Hongがぶっきらぼうに指摘するように、謝罪は「物理的なタスクの失敗によって失われた信頼を修復することはできない」のです。
心を読んでいるわけではなく、推測が上手いだけ
この研究は、もう一つの重要な限界を浮き彫りにしました。VLMは「第三者の観察者」としての人間を模倣するのは得意でしたが、ボランティアが「実際に感じていたこと」(自己申告による感情)と比較すると、その推測精度は急落したのです。
これは、外見上の社会的な手がかりを察知することと、内面的な感情を理解することの間にある根本的な溝を示しています。VLMは、眉をひそめたり肩を落としたりする様子を見て「不幸せ」だと正しく推論することはできますが、その裏にある失望、焦燥、あるいは裏切られたような思いといった微細なニュアンスまでは掴みきれません。「VLMは外的な手がかりの優れた観察者ではありますが、読心術師ではないのです」とHongは説明します。
この研究は、ロボット産業全体に対する重要な警鐘となっています。私たちの生活にシームレスに溶け込む、感情豊かなマシンの探求は価値ある挑戦です。しかし、それが根本的な「信頼性」を犠牲にして成り立つものであってはなりません。ロボットに「泣きたい時に寄り添ってくれる肩」を期待する前に、まずは「お茶をこぼさない」という基本を徹底してもらおうではありませんか。
本研究の詳細は、論文「Can Robots Read Your Mind? A User Study on Inferring Human Emotions in HRI」として IEEE Xplore で公開されています。
