• 追加された行はこの色です。
  • 削除された行はこの色です。
*はじめに [#gc93c04a]

『Rによるバイオインフォマティクスデータ解析』の7.17節LASSOを参考にして,回帰分析をします.

#html{{
<iframe src="http://rcm-jp.amazon.co.jp/e/cm?t=tohgoroh-22&o=9&p=8&l=as1&asins=4320057082&ref=tf_til&fc1=444B4C&IS2=1&lt1=_blank&m=amazon&lc1=444B4C&bc1=FFFFFF&bg1=FFFFFF&f=ifr" style="width:120px;height:240px;" scrolling="no" marginwidth="0" marginheight="0" frameborder="0"></iframe>
}}

LASSO回帰の前に,線形回帰と最小二乗法をやります.


*準備 [#e708ecca]

まずは,標準で使用できるirisデータを使います.

このデータは,ユリの種類(Species)を花びらの長さ(Sepal.Length),幅(Lepal.Width),がくの長さ(Petal.Length),幅(Petal.Width)によって分類する問題です.
長さと幅は連続値,種類はsetosa, versicolor, virginicaのいずれかをとる離散値です.

#geshi(sh){{
> data(iris)
> names(iris)
[1] "Sepal.Length" "Sepal.Width"  "Petal.Length" "Petal.Width"  "Species"     
}}

ここでは,がくの長さ(Petal.Length)を被説明変数(目的変数)として,花びらの長さ(Sepal.Length)を説明変数としてモデルを学習します.

この関係をプロットすると次のようになります.

#geshi(sh){{
> plot(iris$Sepal.Length, iris$Petal.Length)
}}

#ref(iris_rawdata.png);



*最小二乗法 [#aac422ee]





*線形回帰 [#s1fe6159]

まずは,線形モデルによる回帰を行います.


ここでは,線形回帰,LASSO回帰,Ridge回帰を行います.

LASSO回帰はglmnetパッケージに含まれています.
glmnetパッケージは
そこで,glmnetパッケージをインストールして,使用します.

#geshi(sh){{
> install.packages("glmnet")
> library(glmnet)
}}

データは,標準で使えるiris,glmnet

トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS