行動主義・認知主義とロボット・強化学習

今回は、行動主義や認知主義についてロボットや強化学習という視点で考えてまとめました。

行動主義とは

入力とそれに対する出力としての行動に注目した心理学のアプローチの一つです。提唱者の名前(John Broadus Watson)にちなみ、 ワトソン主義といわれます。目に見えない心を対象とするのは意味がなく、刺激に対する行動がどうかですべてが語れるという考え方です。

実際に人間は刺激が入力されたら、内面的な心だったり、感情だったり様々思考して行動を起こしますが、そればブラックボックスであり、行動に現れるため、刺激に対する行動のみを考えればよいのだという心理学アプローチですね。

※IBMの質問応答システムのワトソンはThomas John Watsonからきているため、行動主義提唱者のワトソンとは関係ないです。

行動主義に対する疑問

でも行動がすべてだという考え方に対する疑問がわきますよね。たとえば、いくら刺激をもらっても、強い意志で絶対に行動を変えないなんてことも人間ありますよね。となると、やはりブラックボックスをブラックボックスのままとして語るには限界が見えてくるのです。

認知主義とは

認知主義は行動主義においてブラックボックスとした知能の内面的なものにアプローチします。つまり、人間の情報処理がどのように行われて、その行動が行われたのかという内面的な過程を重視する心理学アプローチといえます。

ロボットの視点から

最近では人工知能の発展により、以前のロボットほどは行動主義ではありませんが、やはりまだ行動主義寄りだと思います。多くのロボットは、呼びかけに対して、決められた動作を行うものが多いですよね。例えば入力として言葉を受け取ったとき、その言葉を解析し、それをデータベースと照合して適切な行動をするといった感じです。まだ、入力と行動が対応する行動主義的な面の色が濃いでしょう。

では、技術的に不可能だからかというと、そうでもないように感じます。製品で出回るロボットに野放しのような機能はつけられないですよね。責任問題が大きいです。柔軟な対応を可能にするには、人間が一つ一つ行動をプログラムしていてはキリがありません。人工知能に自動で学習してもらうことが相応しいです。しかし、人工知能ですべて学習させたとおりに動かしたらどうなるでしょう?ロボットが予期せぬ動作を覚えたり、行ったりしたら、企業の責任問題は大きいのではないでしょうか。研究という点では認知主義的なロボットも多く存在すると思いますが、世に売り出すものとなれば、やはり行動が管理可能な、つまり、入力と行動がしっかり対応するロボットにならざるを得ないのかもしれません。

強化学習の視点から

強化学習とは、受動的な教師あり学習などとは反対に、能動的に試行錯誤しながら行動し、その行動に対して報酬を得ることでその過程を学習していきます。人間の脳の、大脳基底核という部位は強化学習を行っているのではないかともいわれています。

重要なのは行動にたいする報酬という指標を持って内面的な過程を学習するという点です。入力に対する動作を人間がプログラミングするのは異なります。

強化学習ではニューラルネットワークが使用されますが、ニューラルネットワークはブラックボックスの代名詞ではないかという疑問をもたれる方がいるかもしれませんが、ニューラルネットワークというモデルをしている時点で、ブラックボックスではありません。

そして、ニューラルネットワークは学習したものに対してほぼ正確に出力します。似たデータに関しては学習で得たものを参考に、出力を行います。強化学習を題材にとりましたが、機械学習では、学習機の構造を考えている点で、全く意思決定過程は考慮しなくてよいという行動主義的なものとはことなり、認知主義に近いものがあります。

まとめ

自分の勉強も兼ねて、行動主義や認知主義についてロボットや強化学習の視点で考えてみましたが、ここまでを簡単にまとめると、人工知能を積んでいない、刺激と行動が対応してプログラムされたロボット(つまり反射的なロボット)は行動主義、人工知能を積んでいて刺激に対する何らかの思考判断を下し、行動を行うものは認知主義的なロボットと考えることができると思います。

Follow me!