大学、専門学校や企業などの研究室を訪問し、研究テーマや実験の様子をレポート
第12回 Part.4第12回 対話型コンピュータの実現をめざす(4)
Part.4
異文化コミュニケーションを支援する
会話エージェント
理工学部情報科学科 中野 有紀子研究室
公開:
更新:
私たちの生活や仕事にはコンピュータが欠かせなくなってきた。しかし、あらためて考えてみると、コンピュータの操作にキーボードやマウスがほぼ必須なのは、いつまで経っても変わらない。近未来を舞台にした映画や小説のように、人間が話しかけるとコンピュータが返事をしてくれるようになる時代はまだ遠いのだろうか。今回は、アニメーションキャラクターなどを活用した、人間とコンピュータのより自然なインタラクション(相互のやりとり)の研究をしている成蹊大学理工学部情報科学科の中野有紀子先生の研究室を訪ねてみた。(Part.4/全5回)
これまで「異文化コミュニケーションを支援する会話エージェント」「没入型環境におけるガイドエージェント」について解説していただいたが、今回は「異文化コミュニケーションを支援する会話エージェント」について、どのようなものなのか、具体的な内容を教えていただこう。
異文化コミュニケーションを支援する会話エージェント(*1)情報科学、とくに人工知能の分野でよく使われる言葉。この言葉自体はもともと「代理人」とか「動作主」といった意味がある。は、ドイツのアウグスブルグ大学との共同研究で、現在も進行中だ。研究の目的や内容はどのようなものなのだろうか。
「この研究は、アウグスブルグ大学の研究者との共通の関心からスタートしたもので、本格的に取り組むようになったのは2年前からです。
人間のコミュニケーション行動は文化に影響される部分があり、言葉は理解できても、ちょっとした姿勢やジェスチャーの違いがコミュニケーションギャップを生む場合もあります。エージェントの研究を進めていくうえでは、そういう部分も明らかにする必要があるという思いから共同研究を進めることにしました。
異文化コミュニケーションは、文系の学問分野でさまざまな研究が行われていますが、私たちは、コミュニケーション行動を数値データとしてとらえ、各国の文化に適した姿勢やジェスチャーなどの身体表現ができるエージェントをつくりたいと考えているのです」
対話中の姿勢やジェスチャーを
ビデオに録画して分析
本格的な研究が始まった2007年度は、日本人とドイツ人のコミュニケーション時における行動の違いを探るため、日本とドイツで同じ設定の実験を行った。日本では会話中の姿勢、ドイツでは会話中のジェスチャーをそれぞれ分担して調べた。
「3つの状況を想定して、2人で会話をしてもらい、その様子をビデオで撮影しました。
1つ目は、初めて合う人同士という状況。2つ目は、海で遭難したときに持って逃げるアイテムを相談するという状況。3つ目は、2つ目の相談の結果を目上の人に評定されるという状況です。
会話は2人で進めますが、実は本当の被験者は1人ずつで、もう1人は俳優さんにお願いしました。日本では26組、ドイツでは21組が3つの状況ごとに会話をするので、完全に別々のペアだと、コミュニケーション行動のバラツキが大きくなる可能性があったからです。そこで、被験者の相手は俳優さんにして、それぞれの被験者に対して同じように振る舞ってもらいました」
撮影したビデオを分析した結果、ジェスチャーをする頻度については、日本人よりドイツ人のほうが断然高いことが分かった。姿勢を変化させる回数も、日本人よりドイツ人のほうが多かった。
「姿勢は、頭、足、腕について調べました。頭は向いている方向の変化、足は体重のかけ方や前後左右への動かし方、腕は腕全体と手の動かし方などを、それぞれ回数を含めて調べたのです。
頭と足の姿勢については、日本人とドイツ人でそれほど違いはなかったのですが、腕はかなり違っていました。日本人は、手を組むとか手首をつかむなど比較的小さな範囲での姿勢変化が中心ですが、ドイツ人は、腕を組む、肘を持つ、ポケットに手を入れるなど姿勢変化の範囲が大きいのです」
中野先生の説明を聞いて、すんなり納得できてしまうのは、実験結果が日本人の感覚と合致しているからだろうか。
姿勢やジェスチャーの特徴を国ごとに予測する方法を構築
2008年度は研究をさらに一歩進めて、コミュニケーション行動の特徴と文化的な特徴との相関関係を探り、そこから国によるコミュニケーション行動の違いをモデル化することに取り組んだ。
「文化的特徴については、ホフステードという人が世界50か国、7万人を対象に行った調査をもとに、各国の文化的特徴を5つの要素(*2)(1)権力格差が意志決定に与える影響(目上の人の発言を尊重する傾向が強い、など)、(2)個人主義的か集団主義的か、(3)男性らしさが高い社会か女性らしさが高い社会か、(4)不確実なものを回避したがるか、(5)長期的志向か短期的志向か。に分けて数値化したデータがあるので、それを使用しました。コミュニケーション行動の特徴は、前年度のビデオをあらためて分析し直して、数値化しました」
行動については、姿勢とジェスチャーの両方について調べた。回数で表せるものは数でカウント。姿勢やジェスチャーの継続時間は秒単位で計測。姿勢の変化の大きさや動きの硬さ(緊張しているかリラックスしているか)などは7段階評定で数値化した。
こうして得られた文化的特徴の数値とコミュニケーション行動の数値をもとに、「操作説明のためのヘルプエージェント」のところで触れたベイジアンネットワーク(*3)人工知能の一種で、データ同士の相互の関係から、近い将来にどのようなことが起こる可能性が高いかを推論するシステム。中野先生の研究では、マウスの動きを基にユーザーの現在の状態を把握しながら近い将来の行動を予測し、適切な対話を行えるようにしていった。による行動予測モデルを作成した。
これは、国を指定すると、文化的特徴とコミュニケーション行動との相関関係から、会話中にどのような姿勢やジェスチャーをしやすいか予測することができるもの。日本とドイツについては、ほぼイメージどおりの予測結果になることが確認されていて、アメリカや韓国も、一般的に抱くイメージに近い予測結果になっているそうだ。
この研究はまだ進行中だが、中野先生はコンピュータを使った語学学習システムなどへの応用を考えている。たとえば、日本人がドイツ語を学習するとき、画面にドイツ人の先生のキャラクターが出てきて、言葉だけでなくドイツ人らしい姿勢やジェスチャーまで理解できるようなシステムが想定されている。
【用語解説】
*1 エージェント:情報科学、とくに人工知能の分野でよく使われる言葉。この言葉自体はもともと「代理人」とか「動作主」といった意味がある。
*2 文化的特徴の5つの要素:(1)権力格差が意志決定に与える影響(目上の人の発言を尊重する傾向が強い、など)、(2)個人主義的か集団主義的か、(3)男性らしさが高い社会か女性らしさが高い社会か、(4)不確実なものを回避したがるか、(5)長期的志向か短期的志向か。
*3 ベイジアンネットワーク:人工知能の一種で、データ同士の相互の関係から、近い将来にどのようなことが起こる可能性が高いかを推論するシステム。中野先生の研究では、マウスの動きを基にユーザーの現在の状態を把握しながら近い将来の行動を予測し、適切な対話を行えるようにしていった。
《つづく》
●次回は「没入型環境におけるガイドエージェントについて」です。