単回帰分析を行う[sklearn][LinearRegression][iris]

2016年4月12日

iris(あやめ)データを利用して、単回帰分析を行いmatplotlibで結果を表示させてみます。

 

irisデータには、setosa(セトナ)、versicolor(バーシクル)、virginica(バージニカ)の3種類のirisそれぞれにおいて、sepal length(がく片の長さ「単位cm」)、sepal width(がく片の幅)、petal length(花びらの長さ)、petal width(花びらの幅)のデータが収められています。

 

今回はsetosaのsepal lengthとsepal widthに焦点をしぼり単回帰分析を行い、単回帰式を表示させてみます。

 

関連ページ

pandasを利用して基本統計量を出力する[iris]

 

 

スポンサーリンク

 

 

開発環境

Mac(OS X EL Captin/10.11.3)
Python 3.5.1 :: Anaconda 2.5.0 (x86_64)
jupiter 4.0.6    scikit-learn 0.17
pandas 0.18.0   matplotlib 1.5.1
numpy 1.10.4

 

単回帰分析の大まかな流れは以下のようになります。

2変数のデータの関係を可視化(散布図)し、相関係数を確認する。

単回帰式(y=a+bx)を求める。

aが切片、bが偏回帰係数。
xを説明変数、yを目的変数。

単回帰分析に値を代入し、予測する。

 

 

 正の相関があることを確認できます。

散布図と単回帰式

 

 

切片、偏回帰係数等は以下のようになります。

 

 

参照文献


第4章 Pythonによる機械学習 早川敦士

 

Chapter05 未知のデータを予測する

 

LINEで送る
Pocket

Copyright © 2019 思考の葉 All Rights Reserved.  プライバシーポリシー