ほめますか,叱りますか ―強化と罰―

中崎 崇志

ほめる? 叱る? 先日おこなわれた赤川次郎氏の文学部特別講義。現代の社会情勢と犯罪の関係の話の中で、ある映画監督の書かれたものを引用して、こんな趣旨の話をされました。
 「罰を与えるのではなく、幸福を与えなければ、社会は変わらない」
 聴いていた皆さんはいろいろと感想をお持ちでしょうが、今回はこの言葉を導入に使ってみようと思います。

 我々ヒトを含め、動物の行動は大きく分けていくつかの要因に支配されています。最もプリミティブなものから挙げていくと、走性→反射→本能→学習・推理のようになります(デシーア・ステラ, 1962)。例えば、夜、街灯や誘蛾灯に虫が集まるのは、光に対する走性=走光性があるからです。
 行動は、高等な生物になっていくほど、より上位の要因が支配するようになります。ヒトの行動には、走性に支配されるものはありません。そのほとんどを学習(と推理)が支配しています。心理学では、学習を「経験(練習)によって生じる比較的永続的な行動の変容」と定義しています。

 ソーンダイクという心理学者は、『ネコの問題箱』研究で、学習の基礎過程を調べました。紐を引っ張ると扉が開く仕掛けの問題箱 puzzle box にネコを入れ、その行動を観察しました。ネコは、初めは箱の中をうろうろして嗅ぎ回ったりしているのですが、そのうち偶然紐を引っ張って外に出ます。これを繰り返すうち、箱に入れられてから外に出てくるまでの時間が短縮されていきます。無駄なことはせず、すぐに紐を引っ張るようになるのです。
 ソーンダイクは、このことから、学習は試行錯誤の過程を持ち、満足な行動(=効果のある反応)が強められ、不満足な行動(=無効な反応)は弱められるという『効果の法則 law of effect』を提唱しました。

 ソーンダイクの研究は、やがてオペラント条件づけ(道具的条件づけ)の研究へとつながっていきます。
 オペラント条件づけでは、『強化 reinforcement』を重視します。強化とは、『ある行動に後続して与えられ、その行動の生起確率(生起頻度)を高める』ものと定義されます。与えられた結果『快』な状態になる強化を『正の強化』、与えられた結果『不快』な状態から脱して『快』な状態になる強化を『負の強化』と呼びます。『勉強してテストでいい点を取り、ごほうびをもらった』は正の強化、『頭痛で気分が悪いとき“A”という薬を飲んだら治った』は負の強化です。前者の場合は、次のテストのときも勉強するようになるでしょうし、後者の場合は、次に頭痛に苦しんだときも同じ薬を飲んでみようと思うようになるでしょう。これが『生起確率を高める』ということです(ただし、強化の与え方によっては別の問題が生じる可能性があるのですが、それは次回筆者が担当するコラムで紹介します)。逆に、ある薬を飲んでも頭痛が治らなければ、別の薬を飲んだり他の方法を探したりします。これが、無効な反応が弱められるということです。
 ソーンダイクの問題箱実験では、実は箱に入れられるネコは空腹状態で、箱から出ると餌が用意してありました。したがって、ネコの行動は、外に出れば『餌を食べられる(=空腹が満たされる=強化)』ので、餌をもらう直前の『箱から出るために有効な行動』をおこなうようになる、と分析できます。
 もちろん、強化は食べ物ばかりがその素材になるわけではありません。ヒトの場合はもっと複雑です。ほめ言葉や課題の達成感、満足感など、多岐にわたります。

 一方、強化とは反対に『ある行動に後続して与えられ、その行動の生起確率(生起頻度)を抑制する』ものがあります。これは『罰 punishment』と呼ばれます。
 例えば、子供がベッドの上で飛び跳ねて暴れているとき、母親は子供を「やめなさい」と叱ります。「ベッドを壊したら、今日は床の上にそのまま寝なさい」ぐらいは言うかもしれません。叱られれば、子供はもう飛び跳ねなくなるでしょう。しかし、母親はしばらく後に、再び子供を叱ることになります。またベッドの上で飛び跳ねるからです。
 罰の問題は、そこにあります。罰の持つ行動抑制効果は、一時的であることがすでに明らかになっています。一方、強化の効果は、学習の源の一つですから、永続的です。
 ただし、すぐに危険が迫るような行動は、叱ることによって停止させられますから、その点では罰も有効です。例えば、子供がライターをいたずらしているような場合です。その場で叱ってやめさせて、ライターを取り上げてから危険性を説いて聞かせる。その後は親がライターの管理を徹底すれば、それで問題はありません。

 さて、冒頭の赤川氏の特別講義の話に戻ります。
 「罰を与えても社会は変わらない」ことをオペラント心理学的に分析すれば、つまり「罰の効果」に永続性がないからだ、ということになります。単に永続性がないだけならまだしも、与える罰を厳しくすると、ヒトは概ね逃避や回避と呼ばれる行動に向かいます(これも次の機会に取り上げます)。まったく行動しなくなる(無気力化する)か、抜け道を探すか、隠れてやるか、いずれにしてもあまりいい結果にはなりません。最も悪いケースは『バレなければ大丈夫』という考えを持ってしまうことでしょう。
 そして「幸福を与える」ことは、とりもなおさず『強化』に相当します。ヒトがある場面で選べる行動の選択肢は一つです。ある行動に強化を与えれば、その他の選択肢の生起頻度を抑え込める。どの行動を強化するか、それが与え方の”コツ”です。

 バランスよくほめたり叱ったりすること。それが「社会を変える」のかもしれません。

ソーンダイクの問題箱 外に出ようとするネコ
ソーンダイク(1898)の問題箱(Box A)
他にもいくつかのタイプがある。
(今田・宮田・賀集(編), 2003より転載)
別のタイプの問題箱から出ようとしているネコ。
(デシーア・ステラ, 1962より転載)
 

 

参考文献

デシーア, V. G., ステラ. E. 日高敏隆(訳) 1962 「動物の行動(現代生物学入門7)」 岩波書店
  (Dethier, V. G., & Stellar, E. 1961 Animal Behavior. Prentice Hall.)
 金沢学院大学の図書館にも所蔵されています。

Comments are closed.