【心の理屈メルマガ】登録はこちらから!

2013年11月13日

統計:直線回帰分析 linear regression analysis


統計学が最強の学問である


記述統計において

大事なツールの一つに直線回帰分析というのがあります。

直線回帰分析は、独立変数(予測変数)と従属変数(基準変数)の関係を表すものです。

分析において独立変数が1つ以上あるとき、複数直線回帰と呼ばれます。

一般的に回帰分析は

「○○を予測するには、何がベストな予測値となるか?」

という問いかけに答えてくれるものです。



例えば、肥満症(肥満度指数から計算)の原因を考えているとしましょう。

ここでは人の肥満度指数を予測するのに、

どういった指標が最も有効化を考えます。

一週間の内に

ファーストフードを食べる頻度、

テレビを見る合計時間、

運動する合計時間、

両親の肥満度指数など。

こういったときに直線的回帰分析が有効です。




回帰方程式

もし一つの独立変数について回帰分析をするなら

回帰方程式は Y = a + b*X となり、

Y が従属変数

X が独立変数、

a が定数(切片)

b が線の傾きを表します。

例えば、GPA(アメリカで使われる学校の成績指標。4点満点)が

1 + 0.02 * IQ

という回帰方程式で最も予測できるとしましょう。

ある生徒のIQが130の場合、

1 + 0.02 * 130 で GPAは3.6となります。


独立変数を1つ以上服務回帰分析をするときは、

回帰方程式は

Y = a + b1 * X1 + b2 * X2 + … + bp*Xp

となります。


もしより多くの変数をGPA分析に含みたければ、

モチベーションや自己コントロールなどを変数として入れることができます。





決定係数(R-Square, coefficient of determination)

決定係数はモデルが回帰方程式にどれだけあてはまるかを表す数字です。

つまり、従属変数が、独立変数を予測するのにどれだけ有効か?を表す数字。

決定係数は0.0から1.0に渡り、

100を掛けることで、分散の度合いをパーセントで表すことができます。

先例のGPAを1つの独立変数から予測する

回帰方程式の決定係数が0.4だったとしましょう。

これはつまり、GPAの分散のうち40%は

IQから説明できる、ということを意味します。

そして、2つの変数(モチベーションと自己コントロール)を足したところ

決定係数が0.6になったとすると、

IQとモチベーション、自己コントロールの3つの従属変数が合わさると

GPAの分散のうちの、60%を説明できる、ということになります。



こういったことはSPSSやSASといった

統計ソフトウェアで計算することが可能です。




回帰係数を理解する

回帰方程式で b は線の傾きを表し

独立係数と従属変数の関連性の

強さと方向性を表します。

例えば、GPAとIQの回帰方程式では

1 + 0.02 * 130 = 3.6

であり、0.02 が変数IQの回帰係数だと言えます。

正の数なので、関係性はポジティブだと言えます。

もしこの数が負の数ならば、ネガティブだと言えます。



仮定

直線回帰分析をするために

データについて確認すべき仮定があります。

直線性・・・独立変数と従属変数の関係は直線だという仮定。

この仮定は完全に確認することはできませんが、

分散図に描いていくとこういった直線を描くことができます。

もし曲線にしないといけないのであれば、

変数を変えるか、曲線として関係性を考える必要があります。


公平性・・・変数の残渣は公平に分布していると仮定します。

つまり、従属変数Yを予測するのに生じたエラーは

標準分布を描くと考える、ということです。

ヒストグラムや正規確率プロットを見ることで

変数や残差値の分散を調べることができます。

独立・・・Yを予測する上で生じたエラーは

独立している、つまり互いに影響していないと仮定します。

等分散性・・・回帰線の分散は

独立変数の全ての値と同じだと仮定します。


参照

http://sociology.about.com/od/Statistics/a/Linear-Regression-Analysis.htm



不透明な時代を見抜く「統計思考力」 (日経ビジネス人文庫)
posted by ヤス at 01:12| Comment(0) | TrackBack(0) | 研究 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック