- バックアップ一覧
- 差分 を表示
- 現在との差分 を表示
- ソース を表示
- バイオ・データ・マイニング/Rで相関分析する へ行く。
- 1 (2013-11-14 (木) 16:51:27)
- 2 (2013-11-14 (木) 17:05:58)
- 3 (2013-11-15 (金) 08:10:20)
- 4 (2013-11-19 (火) 10:59:00)
- 5 (2013-11-19 (火) 16:04:51)
- 6 (2013-11-21 (木) 08:56:55)
- 7 (2015-11-11 (水) 12:51:57)
- 8 (2016-11-16 (水) 14:24:21)
- 9 (2016-11-16 (水) 14:24:21)
- 10 (2016-11-16 (水) 14:24:21)
- 11 (2016-11-16 (水) 14:24:21)
- 12 (2019-10-04 (金) 17:52:06)
はじめに †
Rを使って相関係数を求め,統計的有意性を検定します.
準備 †
Rのインストールについては,次のページを見てください.
最初は,標準で使用できるirisデータセットを使います.
data(iris)
このデータセットは,アヤメの種類(Species)を花びらの長さ(Sepal.Length),幅(Lepal.Width),がくの長さ(Petal.Length),幅(Petal.Width)によって分類する問題です. 長さと幅は連続値,種類はsetosa, versicolor, virginicaのいずれかをとる離散値です.
このデータセットには,setosa, versicolor, virginicaという3種類のアヤメについて,それぞれ50個ずつ,合計150個のデータが含まれています. ランダムに10個のデータを選択して,見てみましょう.
iris[sort(sample(1:150,10)),]
相関係数 †
[math]x[/math] と [math]y[/math] の相関係数は,[math]x[/math] と [math]y[/math] の共分散を [math]x[/math] の標準偏差と [math]y[/math] の標準偏差の積で割ったものです.
共分散については,以下の記事を読んでください.
この記事はまだ書きかけです.