笑いを分かち合う: 科学者はいつユーモアのセンスを持つべきかをロボットに教えます

Neuroscience News logo for mobile.


概要: 研究者は、会話に共感を構築するために、人間の笑い声に反応する共有笑い AI システムを設計しました。

出典:京都大学

少なくともプラトンのように知性を探求して以来、哲学者や科学者は「何がそんなに面白いのか」という質問に頭を悩ませてきました。 ギリシャ人は、ユーモアの源を他人を犠牲にして優越感に帰した. ドイツの精神分析学者ジークムント・フロイトは、ユーモアは溜め込んだエネルギーを解放する方法だと信じていました。 米国のコメディアン、ロビン・ウィリアムズは、その不条理に怒りをぶつけて人々を笑わせました。

「何がそんなに面白いの!?」という質問に本当に同意できる人は誰もいないようです。 ロボットに笑い方を教えることを想像してみてください。 しかし、それはまさに、日本の京都大学の研究者チームが、共有された笑いのシステムを通じて手がかりを取る AI を設計することでやろうとしていることです。

科学者たちは、Frontiers in Robotics and AI 誌の最新号で、日本のアンドロイド「エリカ」の面白い骨を構築するための革新的なアプローチについて説明しています。

ロボットが笑い声を検出できないわけではなく、悪ふざけに対して笑い声を発することさえできないわけではありません。 むしろ、課題は、ロボットと人間の間の自然な会話を改善するために、AI システムのユーモアの人間のニュアンスを作成することです。

「対話型 AI の重要な機能の 1 つは、共感であると考えています」と、筆頭著者であり、京都大学大学院情報学研究科の知能科学技術部門の助教である井上浩司博士は説明しています。

「もちろん、会話はマルチモーダルであり、正しく応答するだけではありません。 そのため、ロボットがユーザーに共感できる 1 つの方法は、テキストベースのチャットボットではできない笑いを共有することであると判断しました。」

おかしなことが起こった

共有笑いモデルでは、人間は最初に笑い、AI システムは共感的な反応として笑いを返します。 このアプローチでは、3 つのサブシステムを設計する必要がありました。1 つは笑いを検出するサブシステム、もう 1 つは笑うかどうかを決定するサブシステム、3 番目は適切な笑いのタイプを選択するサブシステムです。

科学者たちは、スピード デートからの 80 以上の会話に注釈を付けることによってトレーニング データを収集しました。スピード デートとは、大勢の人々が短時間、1 対 1 で交流する社会的シナリオです。 この場合、お見合いマラソンには京都大学の学生とエリカが参加し、数人のアマチュア女優が遠隔操作しました。

「この研究における私たちの最大の課題は、共有された笑いの実際のケースを特定説(推定)することでした。これは簡単ではありません。ご存知のように、ほとんどの笑いは実際にはまったく共有されていないからです」と井上は言いました。 「分析に使用できる笑いを正確に分類する必要があり、どの笑いにも反応できると仮定するだけでは不十分でした。」

場合によっては、大声で鼻を鳴らすよりも丁寧な笑い方が適切な場合があるため、笑い方も重要です。 実験は社交的な笑いと陽気な笑いに限定されていました。

ロボットはそれを取得します

最終的に、チームはエリカの新しいユーモアのセンスをテストするために、新しい共有笑いシステムを使用して、ある人物とエリカの間で 2 ~ 3 分間の短い対話を 4 回作成しました。 最初のシナリオでは、彼女は社交的な笑い声だけを発し、2 回目と 3 回目のやりとりでは陽気な笑い声だけが続き、最後の会話では両方の種類の笑い声が組み合わされました。

チームはまた、ベースライン モデルとして、同様のダイアログの別の 2 つのセットを作成しました。 最初のものでは、エリカは決して笑わない。 2 つ目では、Erica は、他の 2 つのサブシステムを使用してコンテキストと応答をフィルター処理することなく、人間の笑い声を検出するたびに社交的な笑い声を発します。

研究員とエリカの会話例。 クレジット: 井上ら

研究者は合計 130 人以上をクラウドソーシングして、3 つの異なる条件 (共有笑いシステム、笑いなし、すべて笑い) で各シナリオを聞き、共感、自然さ、人間らしさ、理解に基づいて相互作用を評価しました。 笑いを共有するシステムは、どちらのベースラインよりも優れたパフォーマンスを示しました。

「この論文の最も重要な成果は、これら 3 つのタスクすべてを 1 つのロボットに組み合わせる方法を示したことです。 このような複合システムは、単に笑いを検出してそれに反応するだけでなく、適切な笑い行動に必要であると考えています」と井上氏は述べています。

古い友達のように

彼女がスタンドアップサーキットに出る準備が整う前に、エリカをモデル化して訓練するための笑いのスタイルは他にもたくさんあります. 「考慮すべき笑いの機能や種類は他にもたくさんありますが、これは簡単なことではありません。 共有されない笑いが最も一般的であるにも関わらず、モデル化を試みたことさえありません」と井上氏は述べています。

もちろん、笑いは、ロボットとの自然な人間のような会話の 1 つの側面にすぎません。

こちらもご覧ください

これはマクロンの箱を示しています

「ロボットは実際には明確な性格を持っている必要があり、笑い、視線、身振り、話し方などの会話行動を通じてそれを示すことができると考えています」と井上氏は付け加えました。 「これは決して簡単な問題ではないと考えています。ロボットと友人とのように気軽に会話できるようになるまでには、10 年から 20 年以上かかるかもしれません。」

このAI・ロボティクス研究ニュースについて

著者: Colm Gorey出典: 京都大学連絡先: Colm Gorey – Kyoto University画像: The image is credited to Inoue et al

原著:オープンアクセス「ロボットはあなたと一緒に笑うことができるか?: 共感的な会話のための共有笑いの生成」井上ら. ロボティクスと AI の最前線

概要

ロボットはあなたと一緒に笑うことができますか?: 共感的な会話のための共有笑いの生成

音声対話システムは、人間のユーザーとの自然なやり取りを実現するために、共感を表現できなければなりません。 ただし、笑いの生成には高度な対話理解が必要です。 したがって、会話型ロボットなどの既存のシステムに笑いを実装することは困難でした。

この問題を解決するための最初のステップとして、ユーザーの会話から笑いを生み出すのではなく、ユーザーがソロまたはスピーチの笑いを使用して笑い (最初の笑い)、システムが順番に笑う (応答の笑い) という「共有笑い」に焦点を当てています。 . 提案されたシステムは、1) 初期の笑いの検出、2) 共有された笑いの予測、3) 笑いの種類の選択の 3 つのモデルで構成されます。 人間とロボットのスピードデート対話コーパスを使用して、各モデルをトレーニングしました。

最初のモデルでは、再帰型ニューラル ネットワークが適用され、検出性能は 82.6% の F1 スコアを達成しました。 2 番目のモデルは、最初の笑い声の音響的特徴と韻律的特徴を使用し、ランダムな予測よりも高い予測精度を達成しました。 3 番目のモデルは、最初の笑いと同じ特徴に基づいて、システムの反応笑いのタイプを社会的笑いまたは陽気な笑いとして選択します。 次に、注意深いリスニング対話システムに完全共有笑い生成システムを実装し、対話リスニング実験を実施しました。

提案されたシステムは、笑いのない素朴なベースラインや、常に社交的な笑いだけで反応する反応システムと比較して、共感知覚などの対話システムの印象を改善しました。

私たちのシステムは、状況に応じたロボットの相互作用に使用できることを提案し、適切な共感的な笑いを会話型ロボットとエージェントに統合する必要性も強調します。



Source link