はじめに

Rを使って相関係数を求め,統計的有意性を検定します.

準備

Rのインストールについては,次のページを見てください.

最初は,標準で使用できるirisデータセットを使います.

data(iris)

このデータセットは,アヤメの種類(Species)を花びらの長さ(Sepal.Length),幅(Lepal.Width),がくの長さ(Petal.Length),幅(Petal.Width)によって分類する問題です. 長さと幅は連続値,種類はsetosa, versicolor, virginicaのいずれかをとる離散値です.

このデータセットには,setosa, versicolor, virginicaという3種類のアヤメについて,それぞれ50個ずつ,合計150個のデータが含まれています. ランダムに10個のデータを選択して,見てみましょう.

iris[sort(sample(1:150,10)),]

相関係数

[math]x[/math] と [math]y[/math] の相関係数は,[math]x[/math] と [math]y[/math] の共分散を [math]x[/math] の標準偏差と [math]y[/math] の標準偏差の積で割ったものです.

共分散については,以下の記事を読んでください.

この記事はまだ書きかけです.

トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS