回帰分析の語源

投稿日:

 ニフティのギャグ満載ポータル「デイリーポータルZ」の、13年ほど前の記事によれば──って、13年前って言うと、インターネット界隈では老舗中の老舗だわな。だって、その頃、Facebookなんて影も形もなかったんだから──、「単に『エクセルでまとめる』に過ぎないことを、妙にビジネスっぽく言って韜晦(とうかい)すると、『回帰分析』という言葉になる」のだそうだが、まあ、そこまで回帰分析と言う手法をこき下ろすこともあるまい。

 で、あらためてこの「回帰分析」とは何かと言うと、これは、一般的には最小自乗法などを使って離散事象の傾向を数理化して把握し、今後の予測などに役立てると言うもので、経営科学の基本中の基本である。

 ところが、なぜこのメソッドに「回帰」──まわって、かえってくる──という言葉を当てるのか、誰に聞いてもわからない。最小自乗で近似式を作る、つまりこれが「仮説」であるが、この仮説を相関係数などで評価して「仮説検証」するのが、手っ取り早く言った「回帰分析」である。だが、このように説明したところで、何が「まわって、かえってくる」なのだか、よくわからない。

 そんな疑問を(くすぶ)らせつつ日々を送っていたのだが、ある日突然、この語源を知ることとなった。感ずるところが大きいので、ここに書き留めておきたい。

 左掲の本によれば、「回帰分析」の語源は罪深い。なんとなれば、それが優生学の分野から生まれたからである。

 この本によると、ダーウィン(C.R.Darwin, 1809-1882)の弟子ゴルトン(F.Galton, 1822-1911)は、優生学の分野に数学的手法を導入しようとした。それは、「子の背の高さは親の背の高さに関係があるはず」という着想によっていた。これは、直観的には正しく、長身の親に長身の子がある例、またその逆の例も、世間にはよく見かけることだからだ。ゴルトンは、これを数理的に整理しようとした。

 まずゴルトンは親子の身長のデータを幾千も集めた。そして、親の背の高さをx軸に、子の背の高さをy軸にとって散布図を描いた。

回帰の語源 ゴルトンは、背の高い親からは親と同じくらい背の高い子が生まれると考えた。また、逆に背の低い場合もそうだろう、と考えた。ところが、「平均」のため、背が高いはずである場合には「平均」のほう、すなわち背の低い方へ向かって値が「帰って」いき、また、背が低いはずである場合にも「平均」のほう、すなわち背の高い方へ向かって値が「帰って」いった。

 値がある傾向へ帰っていくことから、ゴルトンはこのグラフに引いた直線を「そこへ帰ってくる直線」ということで、「回帰直線 regression line」と名付けたのであった。

 これが、「回帰分析 regression analysis」という言葉の由来である。

 ここには、「この親にしてこの子あり」という遺伝学的、優生学的なものへの信仰にも近い思い込みが、数理的に、つまり自然によって、ひいては神仏によって(ただ)され、学者がそれに深い感動と畏敬を覚えた、という一つのドラマが見て取れる。

コメントを残す

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください