ユーザ用ツール

サイト用ツール


hai-articles:haibookmarks

人工知能学会 私のブックマーク

3/24締め切り

擬人化メディアとHuman-Agent Interaction:「情熱」のあるやりとりを目指して

米澤朋子(関西大学 総合情報学部/ATR深層インタラクション総合研究所)

はじめに

擬人化メディアとは <導入>

Human-Agent Interactionという研究分野がここ15年から20年ほど特に賑わい、AI研究の発達とともに「人らしい」メディアとして多方面で取り上げられつつある。 擬人化システムの構成によるインタラクションデザイン、人間の社会的反応の分析、医療福祉への応用など、多々のトピックが幅広く議論されており、そのどれもが「人」の「人らしきもの」に対する感性ややりとりに関するトピックとなっている。 この分野は、ざっくりといえば、Human Robot Interactionの分野を内包しつつ、Human Computer Interactionに内包される分野内の一つでもあり(HCI ⊃ HAI ⊃ HRI)、コンピュータや人工物を擬人化することで人工的システムの受容性を高める効果が期待されている。

ここで、擬人化メディアとは、擬人化システムを含む擬人化対象(ぬいぐるみやキャラクタなども含む)により、「対象が、人や動物などのように、ものごとを感じたりする」と人に思わしめるメディアとする。擬人化システムは、何らかの機能を持つシステムに対し擬人化メディアを付すことで、システムの働きがその擬人化対象により行われている、と感じさせるシステム、とする。 キャラクタエージェントなど、物理的身体を持たない仮想的な存在を表す擬人化メディアを「仮想エージェント」と呼び、物理的な身体を持っている擬人化メディアを「ロボット/実体エージェント」と呼ぶ。 エンジニアリングの視点からは、上記の定義で述べていくことになるが、今後の擬人化メディアの更なる精緻化により、対象を擬人化して捉えさせるメディアというよりは本質的な心を持った存在になっていくと考えられる。

本稿では、擬人化メディア、擬人化システム、エージェント、仮想エージェント、ロボット(実体エージェント)という語を用いるため、混乱防止のために再度まとめると、1)擬人化メディアは、擬人化を用いた人間への提示をメインとするメディア(システムにっていないものも含む)、2)擬人化システムは、擬人化メディアを付与されたなんらかの機能を持つシステム、3)エージェントは、擬人化システムのエージェンシーを重視した呼び名、4)仮想エージェントは、ディスプレイやスピーカの中にのみ表現されるエージェント、5)ロボット(実体エージェント)は、物理的身体と動作機構を持つエージェント、をそれそれ示す。

HAI分野におけるエージェントは、人間という外界とインタラクションをもつ自律システムや自律にみせかけるシステム(書籍 人とロボットの〈間〉をデザインする)とされ、人工知能の分野で扱われる自律的な知的エージェントとは異なり、AIを内包するシステムとも言える。 この書籍では、エージェントの三種の定義として、ロボット(実体エージェント)、仮想エージェント、人間と定義されている。このように、人間も精緻な擬人化メディアを有するエージェントであり、人間同士のコミュニケーションもHAI研究の範囲に含まれることがわかる。

擬人化メディアの位置付けと現状 <夢・社会的影響>

擬人化メディアは、AIの入れ物ともいうことができる。AIが賢いメディアであると思われてきたのに対し、情緒的な機能を有するよう徐々に開発が進む今、擬人化メディアは、これらの機能を内包することで、人間の社会的充足感を与えたり、社会的欲求によって人間の行動変容を実現するメディアとして注目されている。 人工的な存在に対し、人間や動物のような頭の働きを実現するには、知覚認知にあたる認識システムや、知的な処理を行う知的システムが必要であると同時に、感情的な処理(c.f. Affective computing )を行うシステムも必要である。 さらに、人間や動物は本来生物であり、生理的身体状態と脳の内部の処理は無関係ではなく、相互に作用し合っている。このような生物的身体情動相互作用に関する仮説やその知見も、エージェントやロボット開発に導入されつつある。 このような「人や動物を模す」システムは、情報科学をはじめとする様々な学問の成果を用いて、さらに精巧に実現されつつある。

一方、擬人化メディアの中は、外観(外見およびその表現)の精巧さが異なるものが多々ある。 サービスやシステムに対し、音声のみもしくは簡潔な外観のみをインタフェースとしてシンプルに付すものは、知的サービスを提供する際に使われていることが多い。例えばSiriAlexaなどの音声対話サービスは、スマートホームの管理などのシステムにおいてユーザの指示入力をやりやすいように導入されている。また、キャラクタエージェントを表示する対話システムは情報提供などのシンプルなシステムにも導入されており、これまでの単純な入出力に対し、シンプルな擬人化メディアによるインタフェースが導入されていると言える。 反対に精巧な外観により、ユーザが捉えるシステムに対する「姿勢」を変えてしまう擬人化メディアもある。 例えば、ERICAGeminoid-HIGeminoid-Fなどのアンドロイドロボットや、ParoNecoroなどの動物的なペットロボットは、精巧な外見や触感や質感などにより、ふと見た瞬間には「本物」のように感じさせるほどである。

このようなロボットは、知的なサービスにとどまらず、ユーザの心に寄り添う他者の代理(代替他者)として、AI秘書や介護・教育の中など広い応用範囲で期待が寄せられている。 実際、様々な擬人化メディアの追求により、Orihimeのような自分の身代わりや、いなくなった人の代わり、およびそれ以外の他者の存在を代理させるような、代替他者としてのシステムの実現に手が伸びている状況といっても過言ではない。

一方で、HAIでは、インタラクションを高度化させる研究や擬人化メディアの認知的受容性に関わる考察など、多岐にわたるテーマが内包される。その分野内での体系化も現在は十分なされているとは言いがたく(HAIシンポジウム2021企画セッション「HAIの体系化」)、研究者間でもHAIに対する見方は異なると考えられる。 よって本稿では、あくまで著者自身の捉えるHAIと、擬人化メディアを用いたシステムに関するまとめを記す。

擬人化

擬人化の起源としくみの理論

そもそもの擬人化は、脅威などに対し畏敬の念を抱いて、対象に意思があると感じたり信じたりしながら生活をしてきたという原始からの宗教の流れにも存在していたと言われている。 History of Religion by Paul Kinsella)では若干風刺的な人間の信仰対象の変遷を表している。科学的には意思を持った存在ではないはずの対象に意思を見出す原始の人間の感じ方は擬人化の第一歩といえる(人とロボットの〈間〉をデザインする)。 一方で、子供が太陽や花などに顔を書いたり生きていると言うように子どもの見かた・大人の見かた、意思を掴めない対象を擬人化し意思を想定する行為であると言える。

また、原始時代の土偶のように、形を持ったものを作ることでその対象を擬人化するという、設計者による擬人化対象の制作が行われてきた。 現在でも、亡くなった人の代理となる位牌や遺影など、現実に存在していた人を投影する対象としてのメディアもある。 ロボットの設計においてロボットを人らしく捉えてもらうよう設計者が工夫し、擬人化して用いてもらうものもあるが、掃除機ロボットルンバのように、機能を優先して設計された対象にも、人間は時に心や意思を感じるという。

志向姿勢

このような人間の擬人化感受性機能について、哲学者・認知科学者・生物学者のダニエル・デネット書籍 志向姿勢の哲学において、人間が対象を見る時には、物理的現象によって動作するのみの対象であるという物理姿勢、設計された通りに動く対象であると言う設計姿勢、意思を持って行動しようとする対象であるという志向姿勢の見方・感じ方があるとしている(参考:Dennettの哲学的論考が指摘する3つのスタンスの存在の検証)。 例えば、原始的動物や植物が、生物的システムが設計された通りに動いているだけと見るのか(設計姿勢)、意思を持って生きようとしていると見るのか(志向姿勢・Intentional Stance)によって、擬人化が解釈者の中に起きているのかどうかが分かれる。

志向姿勢に関連する文献

人工のメディアに対する人間の志向姿勢とも言えるメディアの等式(Media Equation, Book: The Media Equation)では、メディアに表現される・起きていることを現実だと感じる人間の特性を示している。HAIにおけるメディアイクエージョンで触れられているように、HAIにおける志向姿勢は、チューリングテストのように人工物が人間かのように思い込ませる外観やインタラクションを提供するか否かにかかっていると言える。

アニマシー知覚と不気味の谷

ここで、志向姿勢における意思を持った対象として、「人間」から「生き物」に広げる。 対象に生き物だという感覚を持つことを、アニマシー知覚という。 動物的な志向姿勢を見出す知覚ということもできるだろう。 この感覚についてはHeider and Simmel が行ったAn experimental study of apparent behaviorにおいて示された、本当の生き物(動物)ではない対象に対する志向姿勢ということもできる。ビデオを見ると三角や丸といった単純な形状が棒線の周りで動くだけのムービーに、志向姿勢を持った対象を見出しその意図を推定することが実感できる。

アニマシー知覚に関する論文

このような人間(や他の動物など)の知覚は、外敵かどうかなど瞬時の判断を求められる脳の機能と考えられる一方、意思を持っている(擬人化して捉えるべき)対象かそうでない対象かの間で揺れ動くことで混乱することもある。 これに関係し、不気味の谷現象では、人間に類似してくるほど好感をもたらしつつもある段階から急激に気持ち悪さを感じるという事が起こるとされる。 この気持ち悪さが何によって引き起こされるかの議論では、連続的状態からカテゴリー知覚的(顔の表情や声など様々な刺激から人間が状態を分離的に知覚する現象)に扱う難しさに起因するという説もある(Categorization difficulty is associated with negative evaluation in the “uncanny valley” phenomenon,Categorical Perception)。 つまり、人工物が人間に似てくる時に起こる不気味の谷では、志向姿勢と設計姿勢の間でカテゴリー知覚的に揺れ動くと考えられる。

一方このような気持ち悪さやネガティブ感情は、予想を下回る実際の内部機能によっても引き起こされると考えられる。 この差を適応ギャップ(How Does the Difference Between Users’ Expectations and Perceptions About a Robotic Agent Affect Their Behavior?)と言い、予想する機能より実際の機能が上回る方が不快感を下げられる。 もちろん実際の機能に対する知覚は急激に起こるものではなく、エージェントとユーザの二者間で相互適応というインタラクションを通じた再帰的な対象理解が前提である。

不気味の谷関係

カテゴリー知覚(Categorical Perception)関係

相互適応(Mutual adaptation, co-adaptation)/適応ギャップ(Adaptation gap)関係

心の知覚と身体(生理)

人間が持っている心の知覚として、計算したり理解するなどの知能としての冷たい(賢い)心、および、他者との関わりや自身の感情などの温かい心(情動)、の2軸があると考えられている。 Semantic Differential Scale Method Can Reveal Multi-Dimensional Aspects of Mind Perceptionでは、SD法による因子分析によりEmotion軸とIntelligence軸の知覚が示され、これは心の感じ方に関する先行研究Dimension of Mind PerceptionにおけるExperience軸とAgency軸(下図)を肯定すると言える。

science.sciencemag.org_content_sci_315_5812_619_f1.large.jpg

このようにagency / intelligence と experience / emotionの値は様々なエージェントにより異なると考えられており、適応ギャップはそれぞれの軸に対して存在していると考えると、弱いロボットはこの中のexperience / emotion軸において正の適応ギャップ(期待以上)となりつつagency / intelligence軸において負の適応ギャップがあるとも言える。 (なお弱いロボットは、HCI分野では不便益仕掛学書籍)などにおける人間の行動変容デザインにも関連する。)

実際にはこの2軸が完全に独立かどうかは不明である。 例えばソマティックマーカー仮説[ The somatic marker hypothesis and the possible functions of the prefrontal cortex]では、人間は本来生物であり、生理的身体状態と脳の内部の処理は無関係ではなく、相互に作用し合っているとしている。本能的な心は知能・理性の対極として捉えられるが、身体との相互作用のある心が experience / emotion にあたり、独立的な知性の心が agency / intelligence と考えることもできる。 ソマティックマーカ仮説は、情動だけでなく、意思決定をする知能・理性にも身体状態(およびそれと相互作用のある情動)が影響するという考えだといえる。

一方著者らは このような身体と切り離せない心を持つかのようにふるまうエージェントデザインとして、 呼吸や心拍(Physiological Expression of Robots Enhancing Users' Emotion in Direct and Indirect Communication)、鳥肌(Involuntary expression of embodied robot adopting goose bumps)といった、本能に基づく生理的な現象を表すロボティクスに取り組んでいる。

弱いロボットの書籍・文献

ソマティックマーカー仮説関連の文献

共感と擬人化

人間が他者に共感するとき、ミラーニューロン(他者の行動を見たときと自分の行動の両方て反応する脳の賦活)の働きが作用しているとされる[ The 'shared manifold' hypothesis. From mirror neurons to empathy ]。 一方情動伝染(Emotional Contagion)は他者の情動を見ることが自分の情動に影響するという現象で、行動や状況に応じて間接的に共感するのとは異なり、より直接的に共感している状況とも言える。 他者の情動が視覚的には顔表情、聴覚的には音声韻律から読み取られ、情動伝染が起こりその情動が表出されることで表情模倣が起こる。 表情模倣を利用してユーザの心的状況を変化させる扇情的な鏡は自身の顔画像をベースとしているため、他者に対する共感とは異なるが、エージェントの情動伝染効果を示すものと言える。

情動伝染や表情模倣関連の研究

擬人化システムの構成

擬人化システムは、冒頭で述べた通り、擬人化メディアを付与されたなんらかの機能を持つシステムで、エージェンシー:ユーザに対しエージェントを想起させユーザの社会的反応を誘発するシステムのふるまい(ヒューマンエージェントインタラクションから見る人工物・人工システムのエージェンシー)を有効活用し、ユーザの受容性(Design for acceptability: improving robots' coexistence in human society)や理解度を高めていくことが望ましい。

つまり、擬人化システムを作る際は、ユーザに社会的反応を誘発させるための仕組みとして、あらゆる「人らしい」機構が備わっていることが必要であり、「人工のヒト」を作ると言っても過言ではない。 そのためここでは、HAI研究における擬人化システムの開発を大きく分けて、身体性・知能(知覚認知システム/内部状態/社会性)の視点から、代替他者を果たしていくために考慮すべきデザインのポイントや、これまでの研究例を取り上げる。 偏りはあるかもしれないが、筆者の考える擬人化システムのデザインでは下記のように分類する。

  • 架空の存在の外観をデザインすること: 身体性のデザイン
    • 髪型・顔・体型などの外見
    • 動き方,視線,声などのふるまい(表現)
  • 架空の存在の機能をデザインすること : 対話性・自律性のデザイン
    • 知覚,認知などの認識
    • 性格,興味,理解度,考え方などの知能
    • 人間関係やその関係性形成などの社会性
  • デザインに伴うセンサ系・アクチュエータ系の設計
    • 上記が実現する感受性(センサ系)と、その表現を行う駆動システム(アクチュエータ系)

HAI研究における基礎的な擬人化システムに関する文献

身体性としての外観(表出機構)

ロボットは実体を持ち我々と同じ空間に存在している。 一方仮想エージェントはディスプレイなどを通して垣間見えるバーチャルな世界に存在している。 このようなエージェントたちには、身体性(Embodiment)がある。 身体性により、ユーザが志向姿勢でエージェントを捉え、社会的反応を引き起こしやすくなる。 また一方で身体性の中でも物理的身体性を持つことは、外界の理解や物理的接触を可能とする[ 身体性とは ]。 特にHAI研究で扱う身体性は、視覚的/聴覚的/物理的な具現化によりエージェント自身の意図や意思に伴った行動を示し、ユーザの社会的反応を引き起こす。冒頭で述べた用語の定義としては身体性=擬人化メディアであり、人間とのインタフェースを司る。 つまり、後述する機能(知覚認知システム/内部状態/社会性)への入力と出力(表出)を担う器官となる、擬人化システムの要である。

身体性のないエージェントとしてELIZAなどテキスト対話エージェントも存在するが、音声対話エージェントは声の特徴により老若男女のキャラクタを聴覚的に具現化することでその身体の存在と心や内部機構の存在を想定させる。 また、 視覚的な身体性を持つ仮想エージェントおよびロボットは、外見とふるまいが具現化されることにより身体を伴う表現をすることが可能であり、老若男女に限らず様々なキャラクタの外見を表示したり、人間が視覚的に提示するような顔表情や身体動作を実現できる。 中でもロボットは、物理的な身体性を持つことでその存在性を強めたり接触などの物理的インタラクションを可能とする。

上記のようにエージェントの身体性には複数の要素があるが、実在ロボット/遠隔で表示されるロボット/仮想エージェントを比較した研究The benefit of being physically presentでは、実在ロボットと遠隔で表示されるロボットの間では存在性(presence)が異なり、遠隔で表示されるロボットと仮想エージェントの間では物理的身体性(physical embodiment)が異なるとしている。 ars.els-cdn.com_content_image_1-s2.0-s107158191500004x-gr1.jpg

聴視覚的身体性を持つエージェントは、表情やジェスチャなど様々なモダリティを活用して表現を行うことができる(マルチモーダル表現/マルチモーダル・インタフェース)。 また複数のモダリティの組み合わせによる相互作用(クロスモーダル表現)により様々な効果を狙うこともできる。

前述の適応ギャップで述べた通り、外観の精巧さと擬人化システムに求める機能には相関があるとも言えるが、必ずしもこの外観が精巧であればよい訳ではない。 ロボットデザイナー(ex. 園山隆輔書籍 ロボットデザイン概論松井龍哉 etc.) は、様々なロボットの実用シーンにおけるニーズを把握しながらその身体性をデザインする職業の方達である。 ロボットや仮想エージェントの設計では、外見(Appearance)とふるまいとしての動作(Expressive motions)は切っても切り離せない関係であるため、それらのふるまいを考慮しながら技術的設計者とデザイナーがその外観をデザインしていく。

ロボットの身体性に関する文献

人間や動物に似せた顔を持つエージェントにはその視線や顔表情による感情表出表現がある。仮想エージェントでは3Dまたは2D表現によりこれらを構成することができるためロボットに比べ容易であるが、ロボットではkismetiCat: an animated user-interface robot with personalityのように顔の上のパーツを物理的に制御するものやMaskbotLOVOTのように顔表情や目の表現のみディスプレイに頼るもの、瞳孔表現をするものもあり、リアリティとコストが比例する中で研究目的に応じてミニマルデザインされる傾向がある。

ロボットの物理的身体性には、空間共有状況下でMeet me where I'm gazing: How shared attention gaze affects human-robot handover timingなど指さしやMeet me where I'm gazing: How shared attention gaze affects human-robot handover timingなど視線による空間情報を伴ったインタラクションを実現することができる[リアルなロボットの視線。仮想エージェントには一般的には不可能だが、一部エージェントユーザ視点位置に応じた描画エージェントを用いた実空間内注視コミュニケーションの検証ではVRと裸眼立体視を用いた擬似3D空間を現実空間の座標系に接続することで空間共有インタラクションの実現を狙っている。 一方、仮想エージェントには物理的な接触が不可能である。ロボットにおける接触を伴うHAI研究として、The hug: an exploration of robotic form for intimate communicationなどソーシャルタッチに関する研究が広がりつつある[ソーシャルタッチの研究プロジェクト]。 人間に似せた触感のシリコン皮膚を持つアンドロイドにも将来的にこのような機能が搭載される可能性もあるが、どのような表現やふるまいがユーザにどのように解釈されるかについての議論がまだ必要な段階である。

一方、ふるまいの中に含まれる聴覚的身体性としての音声表現がある。 感情音声(感情音声合成音声からの感情の認識)や個人性音声合成・認識など様々な研究によりText-to-speechからよりパラ言語要素の含まれたリッチな音声表現が実現しつつある。歌声合成[ 歌声合成とその応用 ]を用いたバーチャルアイドル初音ミクなどは表現力をユーザの創造性に寄与させる製品としてもリリースされている。ここでは様々なパラ言語要素(イントネーション・プロソディなど)や言語的表現についてはそれぞれ音声研究や言語研究の分野で詳しく扱われているため割愛する。

指差し・表情・視線・目の表現関係の文献

身体接触表現関連の文献

知能(内部/AIデザイン)

人間が持っている情報処理機構はAI技術の中で語られるため、ここでは人間らしい情報処理のための基礎的構造に簡潔に触れるのみとする。

外部センシング(知覚認知システム)

人間を含む動物は様々な感覚器でリアルタイムに外的状況を獲得する。視覚情報、聴覚情報を処理する機能に関する画像処理技術、音声処理技術はDeep Learning技術でさらに発展しつつある。ロボット聴覚など、エージェントの状況に応じた信号処理技術に関する分野も発展している。

一方触覚センシングは筆者がAnalyses of Textile Pressure-map Sensor Data of a Stuffed Toy for Understanding Human Emotional Physical Contactで処理技術を検討したが、視聴覚に比べ研究例や技術の充実は弱い。Topography of social touching depends on emotional bonds between humansのように人間の間で行われる接触に関する分析をベースに今後発展していくと考えられる。

外界理解においては、要素を認識していくことだけでなく、上位レベルとして様々な社会的状況理解や他者の心理的状況理解までを実現することが、共感や社会的行動につながる重要な認知機構となると考えられる。

内部状態

人間に起こる内部状態や内部処理の機構に関し、特にHAIにおいては他者との関係に関わる知能に焦点が当てられている。 人間は認識により得られた外部状態が自らに良い状況かに応じ、身体に直結した本能的情動や感情が起こる。 例えば他者からの情動伝染は他者とのインタラクションを通じた感情理解による内部状態の変化である。 Russellが提唱した感情円環モデルではこの感情状態をpleasure軸(快不快)とarousal軸(覚醒度)の2軸において連続的に表すことができる。一方Ekmanは感情を 不連続なカテゴリに分けて扱った。

エージェントをデザインし実装する際に、このいずれのモデルに基づくかにより性格特性のデザイン手法も異なる。例えばEkmanの不連続なカテゴリをベースとして、マルコフ過程の状態遷移を用いた遷移確率の調整を行うことで、悲しみやすい性格や喜びやすい性格などの性格特徴を再現できる。Russellの連続性のあるモデルであれば、パラメータの比重をキャラクタごとに変更するなどにより実現するだろう。 また、理性的な性格は、内部の感情状態が判断を鈍らせない程度の勾配で変化するにとどまったりリミッターがある状態を作ればよいと考えられる。

感情関連の文献

次に、何らかの判断をしたり実行に移すなどの行動を引き起こす欲求として、内発的動機と外発的動機が必要である。 外発的動機は外部の状況により行動が引き起こされるが、内発的動機はエージェント自身が持つ動機とされる。 このような動機を持つことで「欲しいけど我慢」といった様々な内部状態を持つエージェントが実現可能になる。

内発的動機関係の文献

自然言語処理分野における対話システム研究はAI研究の一端として広がりを見せているが、特に他者とのつながりを重視した雑談などの対話は、目的や正解のみがある情報提供型対話とは異なり、HAI研究に関係するゴールを持っている。 対話知能学はこれらの知能を統合したインタラクティブなエージェントの高度化を目指すプロジェクトと言える。

社会性

エージェントの社会性は、人間ユーザである他者を理解する機能、および、自らの立ち位置を決定したり変化させたりする機能ともいえる。 例えば、教室や雑談などの会話の中でどのように参加しているかという立場(参与構造多人数会話における参与構造分析 Participating with limited communication means: Conversation analytical perspectives on the interactional management of participation structures)やその立場に応じた適切な表現・発言に関わる話者交替話者交替・発話交替Turn-takingなど、他者とのコミュニケーションを行う際の発言に関わる立ち位置は3人以上のコミュニケーションにおいて非常に重要である。

一方、コミュニケーションを行う際の重要な文脈の一つとして、社会的関係性がある。複数の人間が対話を行う前提として相手の存在をテンポラリに位置付けるのが上記の参与構造であるならば、バランス理論は、長期的関係性と、他者と他者の関係性が及ぼす影響に関わる、他者の長期的位置付けといえるだろう。 バランス理論では、単純化した一対一の関係性が複数存在する3人以上の関係において、 下図のようなそれぞれの間柄における複数の関係性が Unbalancedな状態にあると、Balancedな状態を目指して関係性が変化しやすいことを表している。

ソシオン理論に基づいたクラス内のいじめと同調方略のモデル化などの下記文献では、ソシオン理論とこのバランス理論を用いた人間関係の変遷のモデル化を検討している。 ソシオン理論は1990年の関西大学社会学部紀要において発表された。ニューラルネットワークにおける素子がニューロンであることからソーシャルネットワークの素子をソシオンと名付け、社会の中の参加者それぞれに対人関係のモデルが存在している。

長期的に変動する人間関係や、各個人が持つプロパティに応じて、これらのモデルにも影響があると考えられ、エージェントが人間以上に人間関係を理解したり、弱い立場にあえてなっておくことで人間社会を円滑にするなど、更なる研究の発展が望まれる。

バランス理論関係の文献

ソシオン理論関係

フィールド応用と発展、製品

HAI研究を様々なフィールドで応用するシーンが増えてきている。 一方で新たな応用の可能性は、当然ながらシーンとターゲットユーザの選定を行った上で検討される。 HAI研究分野でよく取り扱われるフィールドとしては、教育(教室環境幼児障がい)、介護支援(施設/自宅)、商用施設(スーパーショッピングモールなど)、家庭内、などが挙げられる。 教室環境では、人間の社会関係の分析とそれに応じたエージェントのふるまいによる人間関係の改善や個々の支援、商用施設では、デジタルサイネージにおける情報提供にあたる機能やさりげない買い物支援など店員の代替、など、人間の社会に入り込むHAI研究の応用が望まれる。その一方、介護シーンでは、高齢認知症患者の社会的ひきこもりに対するコミュニケーションの機会の創生、家庭内では、孤独の解消や娯楽、など、個人ユーザに向けたパーソナライズドなサービス、 医療・トレーニングなどの福祉分野では、医療者やトレーナーを代替するエージェントが求められる。

家庭内個人向けの擬人化システムは長い間取り組まれてきた(Aibo etc.)結果として、製品化されたものが多い。ぬいぐるみに対話機能を付与するPechatQooboLOVOTなどの愛玩系ロボットは近年リリースされた愛着を持たせるデザインの家庭用ロボットシステムである。個人の利用シーンに応じた価格帯と外界理解や内部処理のレベルは、今後も更なるバリエーションをもって多数の製品がリリースされると考えられる。 その一方、医療福祉分野で現在リリースされている製品は、物理的な歩行トレーニング支援介護支援といった作業支援ロボットが目立つ状況となっており、個人用のロボットにおけるHAIの浸透状況とは異なる。このような現状を踏まえ、各フィールドにおいて必要なHAI技術の実用が急がれる。

HAIにおける状況

他分野との相互作用、およびHAI研究の体系化の難しさ

上記のように認知科学や心理学、神経科学、脳科学、言語学などの分野から得られた知見や理論や仮説を、人工知能(情報科学)をベースにしつつ擬人化システムに組み込んで、工学的に擬人化システムを改良したり、構成論的に検証するなど、HAIは多くの分野にまたがる研究分野である。 また、発達心理学・神経科学・医学などとも関係があり(計算論的神経科学計算論的精神医学研究室)、エージェントの心を構成したり人間の心の仕組みを取り入れたりするなどの点で他分野との相互作用が大きい。 HAIにおける外観や身体のデザインや製品化においてはロボット工学、美学、デザイン学も関係しており、応用シーンとしても医学、看護学、教育学、介護福祉学、経済学など、複数の分野に波及効果がある。

HAIの基礎に関連するトピックを取り上げると、擬人化という心理的状態の分析解明が多く取り扱われることとなり、実際、HAI分野の研究においては認知科学者の占める割合は大きいが、今後はHAIからのアウトプットに関連する他分野におけるHAIの取り組みが増えることが期待される。

このようなHAI研究のトピックを鑑みると、他分野に広がるテーマであるがゆえに、HAI研究という学問を体系化する難しさに対面する。 HAIシンポジウム2021企画セッション「HAIの体系化」では、研究者ごとに体系化への提言が異なっており、HAI学という学問を考えるときの像が不確定さを維持しているといえる。 立場の違いによりHAI研究の追求ポイントも異なる。例えば、人間の心の仕組みや反応にさほど根ざさない、システムとしての提案も多々あるが、HAIにおける学術的な議論は最終的に認知科学や心理学的側面なしには語ることができない。するとシステムとしての議論をする土壌が少なく、工学的な議論を他のコミュニティに任せてしまう側面もある。 一方で、構成論的立場やデザイン学的立場など様々な研究者が集うため、相互に刺激を受け新しい研究テーマが立ち上がるなど、学際的領域ならではの創造性にも満ちている。

一つ一つの研究のオリジナリティのあり方は議論の余地が多いが、HAI研究におけるオリジナリティも参考にされたい。

HAIにおける課題

〜ロボット・仮想エージェント、および、人間の解明と発達〜

HAIでは、擬人化メディアとのやりとりにおいて人間ユーザが感じる様々な課題や、擬人化メディアの改善に向けた人間と人間のコミュニケーションのしくみ自体の研究など、広く扱われている。 擬人化メディアを用いたインタラクションデザインとしてのHAIには多々の課題がある。 擬人化メディアを構成する上での課題や対話性能や認識性能といった知的な問題解決とは別に、インタフェースの観点や実用の観点から下記が挙げられる。

・インタフェースとしての必然性

玩具菓子(食玩)におけるおまけのおもちゃと菓子の関係では、菓子自体を楽しむためのツールとしておもちゃが存在しているとは限らない。同様に、システムにとってユーザインタフェースとして擬人化メディアが必然性を持っているとは限らない。 初音ミクユニティちゃんのようなバーチャルアイドルの擬人化メディアが、歌声合成や3Dゲーム開発へのモチベーションを高め、ユーザ人口を増やすことに貢献するのも一つの効果として認められている。擬人化メディアの適用にはこのような効果が期待されていることも、今後さらにHAI技術が求められることを示していると言える。

一方で、音声対話システムに対しビジュアルの外観を付与することで、対面対話エージェント(Galateaシステム)にして対話性を高めるなど、擬人化メディアの必然性が高いシステムがある。これは、システム自体を利用する際、対象に人格があると思いながらやりとりするほうがスムースな場合である。 特に、ユーザの心に寄り添ったり、対話的にサービス提供するようなシーンを想定すると、操作的に扱うのではなく、擬人化して扱うほうが望ましい。 HAIでは、この親和性をできるだけ利用し、ミスマッチを防ぎながらシステムを構成していくことが求められる。

・受容性に向けた自然さや精巧さ

自然であることは、人間がシステムを受け入れる(Acceptability)ための一つの重要なファクターとなる。 そのために、様々な擬人化メディアを精巧にしたり、精巧さには一方で不気味の谷(Uncanny valley effect)問題がある[ Wiredの不気味の谷を検証するロボット ]。これは、できるだけ自然に本物に近づけようとして人間に似せていくと、本物に近いポイントで気味が悪いという感覚を引き起こすという説である。前述の通りこの現象を説明する説としてカテゴリー知覚的に引き起こされるという説もあり( Burleighらによる「A reappraisal of the uncanny valley: categorical perception or frequency-based sensitization?」)、知覚認知の機構と擬人化が大きく関わることを示す。 受容性に向けた自然さやリアリティおよびデフォルメは、ユーザ特性や相性を鑑みながら、外見だけでなくふるまいや性格にも求められていくと考えられる。

・人間や動物自体、およびそれらのインタラクションのしくみ解明

前述の自然さや精巧さを細緻に実現する中で、HAIの設計において、擬人化システムが外界をどのように認知・情報処理するべきかという課題に対する一つのアプローチとして、人間や動物が実際にどのように他者とのインタラクションを実現しているかを解明する研究課題もある。 例えば、工学的に問題解決する新規のアルゴリズムを考案することと並行し、ヒューリスティクス的に人間が行う情報処理を再現することで、それらの強みを鑑みたシステムが作られるように、HAIの研究課題の中には「人間自体を対象とした」研究も多く含まれる。

その中にはゲームのルール内においてどのように人間が反応/行動するかを細緻に調査する研究がある。例えば、書籍 人狼知能:だます・見破る・説得する人工知能のように、人間との騙し合いにおいて、心があるふりをする人工知能が人間にどのように捉えられるかを検証する研究や、人間とエージェントの発話交替(Turn-taking)の態度表示による 発話交代シミュレーションゲームなど、マルチモーダルな表示による人間の社会的反応の解明を目指す研究もある。

・人間と擬人化メディアの立場のギャップ

人間に対し擬人化メディアを用いたシステム、その存在(エージェント)の社会的な立場をどのように設定するかという課題がある。 例えばマネージャーエージェントであれば対等より発言力を強めることになるし、秘書エージェントはユーザの支援をする立場で、ユーザがよほどの規範逸脱を犯さない限りは支援し続けることになる。営業エージェントであれば客先における姿勢は丁寧でなければならない一方で、自己開示姿勢によるユーザの軟化を求めることも必要となる。 この問題はグループエージェントを扱う際により複雑になる。また、複数ユーザに対応する際はそのユーザ感の関係性理解が重要となる。

また、下記の倫理的課題にも関係するが、映画AIに出てくるような、立場の乗っ取り問題を危惧する視点もある。これは、擬人化システムに自律性や自己愛、社会性などを備えていった結果として、人間に大切に扱われていないなどによる不快さが元となって、人類全体に対する対抗心が生まれてしまうケースを予想したものと考えられる。

・倫理的課題

受容性の向上に向けて、仮想エージェントやロボットのインタラクションデザインを精巧にするなどにより、擬人化メディアが心の拠り所であるパートナーになることで、人間の信頼を得ていくことになる。 すると、そのメディア自体をデザインできてしまうことによる危うさが発生する。 ロボット倫理学wiki(参考:ロボット倫理学の現在)は、ロボットにおけるこのような危うさを取り扱う分野の研究で、ロボット三原則(参考:ロボット三原則+AI七原則)から広がり発展していく擬人化メディアの設計指針に、重要な指南を与える分野となっている。

擬人化メディアには、ロボットに限らず、ユーザが心の存在を信じてしまう危うさがある一方、ロボットは物理的身体により物理的危険をもたらすリスクがある。これらを鑑みて下記のような課題に対し包括的にHAI倫理学が構成されていくことが望ましい。 実際、それぞれの課題に対し、人工知能を含むテクノロジーの進化に対応しながら哲学、心理学、工学などさまざまな分野から検討されてきている。

  1. 架空と実際の違い:架空の出来事を演出できてしまう仮想エージェントによる、ユーザの現実認識のズレにどのように対応するか
  2. ロボットなどの人格っぽいものを持ったものの行動規範と制限:ユーザに対して不快感や危険を与えないなどの行動規範はいかにあるべきか
  3. 責任の所在:誰がその指示を出したのか??エージェント自身なのか、設計者なのか、ユーザとのインタラクションの中で決定したことか
  4. エージェント自体の権利(人権??ロボット権??):その擬人化システムが不快に思ったり危険を感じたりするような状況は人工物だから許容されるべきなのか。人間ユーザから見ても不快な事なのではないか

エージェントが他者を思いやる規範を持ちふるまうことと、エージェント自身の自由や多様性の保障は、人間が法律、社会などにおいてそうであるようにトレードオフでもある。 よって、今後のロボットや仮想エージェントを含む擬人化システムでは、システム自身が「意識」していくべき規範や倫理を、現状の周辺環境や社会情勢に応じて流動的に解釈しつつ、逸脱行為を避ける仕組みが必要である。

文献としてはロボットからの倫理学入門などがわかりやすいと思われる。

・応用フィールドにおける課題

HAIを適用した応用は様々なフィールドで行われている。教育・介護・看護・トレーニングなど、エージェントからの様々な働きかけがユーザに「相手の心」を感じさせ、行動変容をもたらすことを狙っている。 これらに共通して言えるのは、HAI技術によって、誰がどのように助けられるか、という明確な目的・ビジョンが必要である点である。 そして、他者の存在が必要なのに存在できない/しにくいシーンを選定し、人材不足を解消することになる。 しかし、ユーザの個人性は様々で、求めるエージェントの性質は異なるため、応用製品などを画一的デザインでリリースすることは望まれない。また、周辺の環境やユーザの社会状況を鑑みた包括的最適解デザインのエージェントが、もっとも受容性を高めるといえる。 このような多目的最適化のような取り組みは未だ多くないため、市場へのHAI技術の浸透に向けて取り組まれたいテーマの一つとも考えられる。

また、介護施設や商用施設などプライバシーの問題を抱えるフィールドにおける研究の実施はそれ自体が難しく、取得データのプライバシー考慮における制限やデータ処理の必要性、および特殊で自動認識の難しいデータにはラベリングの必要がある。 エージェントの導入に対する受容性の問題から対照実験を行うのも倫理的課題として容易ではない。 よって、HAI研究自体への世の中の受容性を高めながらフィールド実証実験と商品化などの実用を両輪で進めることが必要不可欠であると考えられる。

HAIに関連する学術コミュニティ

会議系

HAIに関連する国際会議や国内会議のコミュニティが存在している。最たるものが下記のHAIとHAIシンポジウムと言える。しかし多岐にわたる分野に関連しながら発展しているコミュニティであるため、いくつかのコミュニティとその特徴などを述べる。

  • HAI: Human-Agent Interactionのコミュニティは、国内の HAIシンポジウム を発端にエージェント関係の会議の中ではトップカンファレンスに連なる重要国際会議となった。2013年から開始され、2021年には9回目となる今年、Covid-19により昨年に引き続きオンライン開催となるか3月末時点では未定であるが、日本国内、名古屋での開催が予定されている。採択率は40%以下で、参加国も年々広がっており、国内でのHAIシンポジウムと連動しながらも、HRIコミュニティや心理学・神経科学など多岐にわたる研究者が参加し、多様なワークショップも併催されている。ACM系。本稿はこのコミュニティをメインとする著者が筆しているため、下記のリンクは参考までにつけているが、どれも重要で関連深いと言える。
  • HAIシンポジウム: 上記の通り、HAIの国際会議と深くリンクする国内シンポジウム。2006年から開催され2021年で15回目の開催。(HAIシンポジウムの過去開催分までのリンクのあるプロシーディングス
  • HRI: Human Robot Interactionは、2006年からACMの国際会議として開始している。HAIと類似分野でありつつ毛色が違うのは、ロボットが実世界に身体を持つエージェントであるがゆえの、制御動作に応じた空間を介したインタラクションや、実世界の我々の生活を物理的に支援するシステムなど、新規の実世界インタラクションに踏み込む研究や、それらが人間の認知や解釈に与える影響に関する検証が多く含まれる点である。
    • RO-MAN: IEEE系、30回目。広くRobot and Human Interactive Communicationを扱う。
    • ICSR: Social Roboticsの国際会議。
  • CHI: 言わずと知れたACM SIGCHI。1982年から開催されている老舗会議で超難関。デバイス構成からインタラクション分析まで広く取り扱うため、参考研究を見つけるには良い。また、HAI分野からの投稿・採録もある。
  • ICMI Multimodal Interfaceの難関国際会議。2021年で23回目になる。マルチモーダル情報による人間の状態認識がメインであったが、近年はエージェントやロボティクスに関する投稿もある。
  • その他ロボット系
    • ICRA: Robotics and Automationの分野、超難関。
    • IROS: Intelligent Robots and Systems。1988年からの老舗会議。非常に分野が広く、参加件数が多いため、国際会議の中でも全国大会のような雰囲気もある。
    • RSJ: (IEEE、日本ロボット学会)系。
      • 国内ではロボット学会が広くロボットを扱うメインの学会。全国大会など様々な発表の機会がある。
  • Agent系: IVA: ACM。2007年から開催、21回目。2005年までは隔年開催だった。Second Lifeなど仮想世界でのやりとりを多く扱ってきている。
  • IEEE VR: IEEE。1993年にシンポジウムとして開始したのち、1999年から国際会議になっている。仮想エージェント関連でVRに関する国際会議にも複数目を引く研究がある。他にもVR系国際会議は接触に絞ったものなど多岐にわたるが、ここでは省略する。
  • その他
    • AIVR(AIVRはArtificial Intelligence and Virtual Reality): などもAIとVRという点では関わりが深い。
    • AAMAS Autonomous Agents and Multiagent Systems. AI的側面多かったが徐々にHAI的なコンテンツも増えている

ジャーナル(本稿の論文リンク先ジャーナルなど下記のほか多数)

その他国内会議や研究会などローカル系

上記の他にも国内の会議や研究会などのコミュニティがある。HAIにのみフォーカスを当てる研究会は存在していないが、多岐にわたる分野が関わっていることを一部のリンクにより示す。これら以外にも関連するコミュニティがあるため、追記や編集をしていくべき箇所といえる。

(基):基礎的なHAI構成に関わる、(応):応用フィールド、(展):発展および転回的フィールド

  • HAIシンポジウム(基)(応)(展) 前述したとおりHAI分野における国内で網羅分野が最もフィットしている。
    • コミュニケーション支援(SIG-CE) (基)(応)
    • 複合現実感、仮想都市、デバイスメディアおよび一般(SIG-DeMO) (展)
    • 高齢者・障害者支援技術(SIG-ACI) (応)
    • ユーザエクスペリエンス・サービスデザイン(SIG-UXSD) (展)

研究プロジェクト・組織系

大型予算を取っている研究プロジェクトは全国に数々存在しているが、HAIに関わる特徴的なな視点を持つ研究シリーズとして成果をおさめているものがあるため、ここに新旧いくつかを取り上げる。

研究室など(高校生・受験生向け)

おわりに

本稿ではHuman-Agent Interactionにおけるトピックの整頓や関連する研究コミュニティの紹介を行った。 シンギュラリティがAI分野で一時期強く取り上げられたが、情報技術のインタラクションデザインにおいては、知的支援と情緒的共感の2方向に分かれた研究開発ののち合流していくと考えている。その際にある脅威を強く感じる人も多いが、人間の情緒的・社会的QOLを高めていく希望でもあり、SDGs的にそのQOLを様々な人に保障する技術的革新をもたらす可能性もある。

人間の代替としてのエージェントと人間以上の人間を求めるような高度化とは別に、いかにユーザの生活を豊かにするかという観点を持ち続けることで、脅威のリスクに向き合うこともできる。 人間ユーザの「情」を満たすメディアとして、さらに、擬人化メディア自身の「情」を含みつつそれも満たすメディアとして、人間だけでなく人工物のQOLも向上させるような共生的未来を、研究者や開発者全員が真剣にデザインし続けることが、HAI分野において今後必要不可欠となるだろう。

最後に、文献/リンク類はあくまで抜粋であり、HAI関連分野が非常に広いことを鑑みつつヒントとしていただけることを願う。

謝辞

本研究は科研費19H04154、19K12090、18K11383、JST,CREST JPMJCR18A1、および2019年関西大学研修員研修費の助成を一部受け実施したものです。 執筆に際して有意義な資料やコメントを下さった大澤博隆先生(筑波大学)、共同研究者で筆者の研究室所属学生の頃より本研究内容に長く従事してくださっている吉田直人先生(名古屋大学)、ロボット実装で長く共同研究に携わってくださり本稿にコメント下さった山添大丈先生(兵庫県立大学)、HAI研究分野のプロジェクトについてコメントいただいた塩見昌裕室長(ATR深層インタラクション総合研究所)に深くお礼申し上げます。この機会を与えてくださった人工知能学会誌編集委員会に心より感謝申し上げます。


戻る

hai-articles/haibookmarks.txt · 最終更新: 2021/03/29 09:09 by yone

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki