眼が無くても世界は視える──アフォーダンスの概念──

認知科学の基本となる考え方にアフォーダンス(affordance)と呼ばれる概念がある。既に何十年も前に確立された理論であるにも関わらず、人の直感に反するためか、今日でもアフォーダンス以前の古典的な解釈が幅を利かし、ネット上でも誤った解釈に基づく記述をよく見かけるのが現状だ。本エントリでは、佐々木正人著『アフォーダンス──新しい認知の理論』を参照して、アフォーダンスの基本的な考え方を紹介する*1。本エントリで扱う図も本書からの孫引用だが、オリジナルは脚注で示している。アフォーダンスは、なぜ世界がこのように見えるのか、をまったく新たな視点で説明する。

視覚において網膜は重要ではない

人が奥行きを知覚するために、水晶体や眼筋の緊張、両眼の視線の方向差(両眼視差)などが決定的な役割を果たしていると説明されてきた。しかし、網膜の小ささを考えると、両眼視差は対象が数十メートルも離れると無効になる。両眼視差が無効になる数百メートル離れた対象物の大きさを答えさせる試験において、空軍パイロットは極めて良い成績を収めるが、両眼視差で説明されてきた数メートル先の点刺激に基づく奥行き知覚実験結果は一般人と変わらない。網膜に映る点刺激に両眼視差などの奥行きの手がかりが加わり三次元知覚が成立するという古典的解釈では、彼らの優れた空間知覚は説明できないのだ。

我々は網膜で物を見ていると信じている。外界の光がレンズによって集積され網膜に像を結び、像を解析することによって視覚が形成されていると信じている。しかし、生物全体を見回してみると、視覚器官は実に多様であり、たとえば昆虫が持つ凸状の眼にはレンズや網膜のような感覚面が存在せず、像を結ぶことがない。実際、焦点を結ぶ像をつくる仕組みを備えた眼は希少で、ヒトの眼は手元の細かな物を見るために進化した霊長類特有の器官であることがわかる。

すなわち、網膜に映る像に基づく伝統的な視覚の説明は、霊長類以外の生物の視覚を説明できないため誤りである。実際には、網膜もそこに結ぶ像も、視覚を説明する上でそれほど重要ではない。我々は眼で見ているわけではないのだ*2

包囲光配列と不変項

アフォーダンス理論における基本となるのは、生態光学(ecological optics)と呼ばれる光についての考え方だ。視覚において決定的な役割を担う光は、網膜に結像するものではなく、放射光が環境中の無数の面に反射して錯乱し、環境に充満した包囲光(ambient light)である。

次の図に示すように、観察する位置を包囲する光には、環境を構成する面によって形作られた構造がある。この包囲光の異質性は包囲光配列(ambient array)と呼ばれる。観察者が動くと、包囲光配列が変化する。その場で少し立ち上がったり、首を上下・左右に振ってもらいたい。包囲光配列を構成する立体角が観察点の変化に従って変化することが分かるだろう。観察点の移動に伴う包囲光配列の変化が視覚において決定的な役割を果たすのだ*3



包囲光配列とその変化

重要なのは観察者の視線の動き、もしくは対象物の動きだ。たとえば目の前にあるモニタを見てみよう。視点を変えるとモニタを構成する矩形は多様な四角形に変化するが、その中にあっても四角形の角と辺の間には、常に変化しない一定の比率が存在する。この不変な比率がモニタの形を特定する。この変形から明らかになる不変なものを不変項(invaliant)と呼ぶ。

観察者は動きを見ることによって包囲光配列から不変項を抽出している。たとえば右の図に示すように十数個の光点を人間の関節に付け、光点だけを観察者に提示してみる*4。光点が静止している時には、無意味に並んだ光点が知覚されるだけだが、光点が動いた途端、光点が人の身体に装着されていること、その人の性別、おおよその年齢まで手に取るようにわかる。人が物を持っていればその重さ、物を投げればそれが飛ぶ距離、移動すればその速度や床の材質までもが結構な精度で分かる。光点により構成されるプリミティブな包囲光配列の変形だけからでも、こうした不変項が抽出されるのだ。

不変項はさらに2つに分けられる。1つは構造不変項と呼ばれるもので、対象の種類や性別を特定する同一性の知覚を可能にする不変項である。そしてもう一つは、変形不変項と呼ばれる対象の変化を特定する不変項で、対象が歩いているのか、走っているのかを知覚する。犬を見て、構造不変項によりそれが犬だと分かり、変形不変項によりそれが走っているのか、座っているのか知ることができる。

アフォーダンス

我々の周囲の環境には「持続と変化」が満ちている。従来の情報処理の考え方では、ヒトは環境から刺激を入力し、中枢で加工処理を行うことによって「情報」を得ると考えられていた(コンピュータによる画像認識はこの方式をとる)。しかし、実際には環境には「情報」が満ちており、実際我々が行っているのはその「情報」を探索することなのだ。

環境の「持続」は「面の配置」として知覚される。まず、すべての基準となる地面があり、地面上の対象の形状、配置、構造、テクスチャは、多様な面の複雑なレイアウトにより構成される。これらの環境の事実は包囲光配列の構造から知覚される。一方、対象の運動、変位、転回、衝突、変形、出現、消失などの環境の「変化」は「面やその配置の変化」として知覚される。このように環境の「持続」と「変化」は、我々を包囲する光の中に情報として存在している。

もう一つ光の構造の中には、観察者自身に対する情報が含まれる。視野の境界があり、見えの変化は、自己の姿勢や移動の方向、速度や加速度の情報にもなる。音の聞こえは、音源に対する自己の顔の向きや、音源との距離の情報となる。環境を知覚することと自己を知覚することの相補性については、多くの実例が知られている。人が手や膝をつかずに足だけで登れると知覚する高さは、身長に関わらず、知覚者の股下の長さの0.88倍であり、人が肩を回さずにすり抜けられると知覚する隙間の幅は、知覚者の肩幅の1.3倍以下だ。手を使わずに座れる椅子の高さは、知覚者の脚の長さの0.9倍であり、大学生に7m先に提示されるバーの先に行くためにくぐるか跨ぐかを尋ねると、その答えは知覚者の脚の長さの1.07倍で切り替わる。これに関しては身長の低い人や老人では脚の長さよりも、全身の柔軟性の方が重視されるとの研究もある。こうした生き物を基準とした測定法は生態学的測定法(eco metrics)と呼ばれる。

これらの研究は、観察者が環境中から検索している「情報」は、観察者の身体にとっての「意味」や「価値」であることを示している。人が段の高さに見てとるものは、登れるか登れないかであり、隙間の広さに見てとるのはすり抜けられるかすり抜けられないかである。目の前にあるペンは手を伸ばせば届くだろうか?背もたれに背を付けたままでは無理かも知れないが、少し上体を倒せば届くかも知れない。これらの知覚には手の長さに加えて身体の柔軟性に関する情報が加味されている。ヒトが見る包囲光配列の変化の中には、環境中の情報だけではなく、観察者自身の情報も含まれているのだ。

「登れる段」、「すり抜けられる隙間」、「つかめる距離」はアフォーダンス(affordance)である。アフォーダンスとは環境が動物に与える(afford)「価値」のことである*5アフォーダンスは事物の物理的な性質ではなく、あくまでも動物にとっての環境の性質である。環境中のあらゆるものはアフォーダンスをもつ。動物は環境中からアフォーダンスを検索することができる。

たとえば、目の前に重そうな荷物がある。この荷物はあなたに持ち上げることをアフォードしているだろうか? あなたが筋骨隆々なスポーツマンならこの荷物は持ち上げることをアフォードしているかも知れない。また、紐で縛られ取っ手が付けられていれば、非力な人にでも持ち上げることがアフォードされるかも知れない。少し持ち上げてみると手や腕の筋肉の緊張、間接のきしみ、皮膚痛覚の分布、強さ等から対応する不変項が知覚される。椅子は通常座ることをアフォードしているが、あなたが200kgを越える巨漢ならば座ることをアフォードしないかもしれない。ちょっと座ってみると、椅子が立てる軋みの音や背中を通して感じられる椅子のたわみが、椅子のもつ座るアフォーダンスを伝える。

アフォーダンスは反射や反応を引き起こす刺激ではない。アフォーダンスは環境中にはじめから存在する情報であり、行動が伴わなくても存在する。椅子は座られなくても、座ることをアフォードする。また、アフォーダンスは主観的なものではない。人が疲れ切っていても、元気一杯であっても椅子は変わらず座ることをアフォードする。人は環境中のあらゆる事物が有する無限のアフォーダンスをピックアップして、世界を知覚するのだ。

無限のアフォーダンスのうち何をピックアップするかは、身体能力や経験によって高度に分化し、個性化した知覚システムによって決定される。知覚システムの個性により、ある人にピックアップされるアフォーダンスが、別の人には見つけられないということが起こる。

先天的な視覚障害者の中には、杖もつかずに自由に移動できる人がいるが、これは超能力でも何でもなく、視覚以外の受容器を使って世界を視て、情報をピックアップしているに他ならない。特に重要なのは聴くシステムと触るシステムであり、健常者が気付くことの出来ないアフォーダンスを知覚して、対象の接近や後退、ルートの転回点などの情報を得ていると考えられる。眼はあくまで知覚システムの一部であり、眼で見ることによってピックアップされる情報の代わりの多くの部分はシステムの他の要素によってもピックアップできるのだ。

環境はアフォーダンスに満ちている。世界を視るのは眼では無く、全身の受容器のネットワークが作る知覚システムである。個人毎に分化した知覚システムは環境の中からアフォーダンスをピックアップし、世界を知覚するのである。

参考文献

*1:アフォーダンスコンピュータサイエンスの分野ではUIに関する用語として良く使われるが、若干意味が異なるので、その用法に関しては別エントリで扱いたい。というか元々そちらが本題だったのだが、まずアフォーダンスについて説明しないと分かり難いと気付いた次第だ。

*2:もちろん、細かな文字を読んだりするためには網膜を持つ眼が必要なのは言うまでもない。あくまで一般的な生物が行動するために必要とする視覚の話である。

*3:James Jerome Gibson: The Senses Considered as Perceptual Systems, Houghton Mifflin (1966).

*4:C. F. Michaels and C. Carello: Direct Perception, Prentice-Hall (1981).

*5:James Jerome Gibson: The Ecological Approach to Visual Perception, Lawrence Erlbaum Assoc Inc (1979). 邦訳:J.J.ギブソン著, 古崎敬訳: 生態学的視覚論―ヒトの知覚世界を探る, サイエンス社 (1986).