AIの「記号着地」問題を解決するには、脳が持つ「身体化認知」の考え方が有効か?

2010年代半ばから、コンピューターの性能向上などにより、AI技術の一種であるディープラーニング技術が大きく進展。今では、画像認識などにおいてはヒトの能力を超えたといわれ、さまざまな場面で活躍しつつある。

しかし、そうしたAIは1分野に特化した専門型しかなく、今のところヒトのようなあらゆる分野に対応可能な”汎用型“は存在しない。ヒトの場合、医者で自動車免許を持っていて、趣味で楽器も弾けて絵も描けるなどというヒトはいるが、それを単体でこなせるAIはないのである。

汎用型AIを実現するに際して、技術的に大きな壁として立ちはだかっているのが、「記号着地」の問題だ。それはどのような問題かというと、カップを例に挙げてみよう。現代のAIであれば、それを画像認識技術でかなりの高確率でそれがカップであると結論づけることは可能だ。そして、ロボットハンドでカップをつかむこともできる。しかし、それが(主に熱い)飲み物を飲むために利用するための食器(道具)であることに始まって、その正しい使い方や間違えた使い方を教え込むのは非常に手間がかかる。

(AIが液体を飲めるロボットボディを持っているとして)まず、カップの中の飲み物を飲むためには、こぼさないようにして口元まで運ぶ必要があるのはいうまでもない。しかし、この「飲み物をこぼさない」ということについては、その先に「飲み物が液体である」、「液体は入れ物に入れて運べるが入れ物を斜めにするとこぼれる」といったカップだけでなく中味の飲み物(液体)についての情報も教える必要がある。

そしてカップも、「テーブルなどに戻す際には斜めに置くと倒れて中味が残っていればこぼれてしまう可能性がある」ことや、「床の上に落としたら割れてしまう」といった正しくない(してはいけない)使い方も教える必要がある。ヒトなら、ある程度言葉を理解できる年齢に達していれば、「飲み物を飲むための入れ物」といった説明を与えれば、カップを始めて見る子どもでも使い方を想像できるはずだが、AIではそれができないのである。

カップ1つをとってもこの状況であり、現在の技術では、ヒトと同じ環境で一緒に生活するような汎用的なAI(を搭載したロボット)を作ろうとした場合、身の回りの物に対してありとあらゆる状況をヒトがあらかじめ想定してプログラムを組む必要がある。それは実際のところ不可能な話であり、これがAI研究の世界において記号を現実世界に対応づける「記号着地」の問題である。

ヒトが記号着地をどのように実現しているのかについては、認知心理学・認知科学においては、「身体化認知」という考え方が提案されている。これは、具体的な事物を表す言葉の意味が、身体と環境との相互作用を通して表されるという考え方だ。これまで、身体化認知の考え方を支持する証拠は集められてはいるが、(1)身体の動きを一時的に拘束したとき、言葉の意味を扱う脳の部位における活動は変化するのか、(2)またそのとき、言葉の意味の処理は実際に阻害されるのか、という2点は検証されていなかったという。

そこで大阪公立大学大学院現代システム科学研究科の牧岡省吾教授らの研究チームは、「手で動かせる物を表す言葉」に対して、手の動きが自由な状態と拘束した状態で、脳がどのような反応を示すのかという実験を、機能的近赤外分光分析法(fNIRS)を用いて実施。その結果を2022年8月8日に、学術誌「Scientific Reports」に発表した。

人工知能の分野でも注目 身体化認知のはたらきと脳内メカニズムを実証 ~手を拘束すると言葉の記憶成績が低下~|大阪公立大学
大阪公立大学の公式Webサイト。2022年4月に大阪市立大学と大阪府立大学が統合し開学した国内最大規模の公立総合大学です。

実験の結果では、実施道具などに関する意味処理を司る左脳の「頭頂間溝」と「下頭頂小葉」の活動が、有意な影響を受けることがわかったとする。また同時に、意味処理をさせるための問いを与えてから口頭反応までに要する時間の計測も行われた。口頭反応の速さも有意な影響を受け、手の拘束によって手で操作可能な物体に対する口頭反応が阻害されることも確認されたという。

これらは、手の動きを拘束することが、脳内の意味処理に影響することを示している。この結果に対し、牧岡教授らは言葉の意味を処理するとき、身体の動きを含めて記憶しているという身体化認知の考え方を裏付ける結果となったとした。

今回の研究成果は、「手を動かして学ぶ」ことの有効性が確認されたともいえる。ヒトは、幼児期から親など周囲の大人から教えられるのと同時に、身の回りのさまざまな物に触れることでさまざまなことを学んでいく。つまり、手で操作することは、物の意味を学ぶ上でも重要だと考えられるという。

一方、人間にとっての意味が身体の動きと関連することが示されたことは、AIが意味を学習する際にも身体化認知の考え方が有効であることを示唆しているとする。以前より、AIにもロボットの身体を与えることが有効とする考え方はあったが、今回はそれを後押しする結果となったといえるだろう。記号着地は、汎用的なAIを実現するために越えなければならない大きな壁の1つだが、牧岡教授らは、今回の研究成果はその解決の方向性を示したともいえるとしている。

サイエンスライター:波留久泉(D)
(画像出典元:大阪公立大2022年8月18日プレスリリース)