バイオ・データ・マイニング/Rで統計分析する
をテンプレートにして作成
開始行:
*はじめに [#w5ae99c9]
ここでは、Rを使って平均、分散、標準偏差を求めます。
『Rによるバイオインフォマティクスデータ解析』の3.3節「基...
#html{{
<iframe style="width:120px;height:240px;" marginwidth="0"...
}}
*準備 [#q96ce9c2]
Rのインストールについては、次のページを見てください。
-[[MacでRを使う>機械学習/MacでRを使う]]
-[[WindowsでRを使う>機械学習/WindowsでRを使う]]
ここでは、標準で使用できる''irisデータセット''を使います。
#geshi(rsplus){{
data(iris)
}}
このデータセットは、アヤメの種類(Species)をがく片の長さ...
長さと幅は連続値、種類はsetosa, versicolor, virginicaのい...
このデータセットには、setosa, versicolor, virginicaという...
ランダムに10個のデータを選択して、見てみましょう。
#geshi(rsplus){{
iris[sort(sample(1:150,10)),]
}}
#geshi(rsplus){{
> iris[sort(sample(1:150,10)),]
Sepal.Length Sepal.Width Petal.Length Petal.Width ...
4 4.6 3.1 1.5 0.2 ...
22 5.1 3.7 1.5 0.4 ...
65 5.6 2.9 3.6 1.3 ver...
97 5.7 2.9 4.2 1.3 ver...
100 5.7 2.8 4.1 1.3 ver...
108 7.3 2.9 6.3 1.8 vi...
116 6.4 3.2 5.3 2.3 vi...
122 5.6 2.8 4.9 2.0 vi...
136 7.7 3.0 6.1 2.3 vi...
146 6.7 3.0 5.2 2.3 vi...
}}
論文に使用するグラフはカッコイイ方がいいので、グラフ作成...
#geshi(rsplus){{
install.packages("ggplot2")
library(ggplot2)
}}
*記述統計 [#ea97832a]
標本を要約し、標本の情報をわかりやすく記述することを''記...
ここでは、散布図、ヒストグラム、ボックスプロット(箱ひげ...
**散布図 [#xdbe2fbc]
横軸と縦軸にそれぞれ別の量をとり、測定値を点として表した...
2つの値を同時に測定し、[math]n[/math] 個の測定値の組を [m...
散布図を作成するには、''plot関数''を使います。
#geshi(rsplus){{
plot(x=iris$Petal.Length, y=iris$Petal.Width,
xlab="Petal.Length", ylab="Petal.Width")
}}
#ref(scatter.png,nolink)
ggplot2で散布図を作成するには、''ggplot関数''と''geom_poi...
#geshi(rsplus){{
ggplot(data=iris, aes(x=Petal.Length, y=Petal.Width))+
geom_point()+
theme(aspect.ratio=1)
}}
#ref(ggplot2_scatter_bw.png,nolink)
近似直線を追加するには、''geom_smooth関数''を加えます。
#geshi(rsplus){{
ggplot(data=iris, aes(x=Petal.Length, y=Petal.Width))+
geom_point()+
geom_smooth(method="lm")+
theme(aspect.ratio=1)
}}
#ref(ggplot2_scatter_bw_lm.png,nolink)
種(Species)ごとに色と形を変えるには、''aes関数''の''col...
#geshi(rsplus){{
ggplot(data=iris, aes(x=Petal.Length, y=Petal.Width, colo...
geom_point()+
theme(aspect.ratio=1)
}}
#ref(ggplot2_scatter.png,nolink)
**ヒストグラム [#wa8f8e55]
測定値が存在する範囲をいくつかの区間に分け、各区間とその...
度数分布を表すグラフをヒストグラムといい、底辺の長さが各...
ヒストグラムを作成するには、''hist関数''を使います。
#geshi(rsplus){{
versicolor <- iris[51:100,]
hist(versicolor$Petal.Length, xlab="Petal.Length", main="")
}}
#ref(histogram.png,nolink)
ggplot2でヒストグラムを作成するには、''ggplot関数''と''ge...
#geshi(rsplus){{
versicolor <- iris[51:100,]
ggplot(data=versicolor, aes(x=Petal.Length))+
geom_histogram()+
theme(aspect.ratio=1)
}}
#ref(ggplot2_histogram_bw.png,nolink)
種(Species)ごとに色を変えるには、''aes関数''の''fill''...
#geshi(rsplus){{
ggplot(data=iris, aes(x=Petal.Length, fill=Species))+
geom_histogram(position="identity", alpha=0.8)+
theme(aspect.ratio=1)
}}
#ref(ggplot2_histogram.png,nolink)
**ボックスプロット(箱ひげ図) [#a5452015]
ヒストグラムの他に、測定値の分布やばらつき具合を表すグラ...
長方形の箱とその両端から伸びるひげで標本の統計量を表しま...
箱の両端は、''第一四分位数''(最小値から全体の1/4のところ...
ひげの表し方には2種類あり、一つはひげの両端が最小値と最大...
もう一つは、ひげの両端が''箱の両端から第三四分位数と第一...
後者の場合、ひげの両端よりも外側にある測定値を''特異値''...
#geshi(rsplus){{
setosa <- iris[1:50,]
versicolor <- iris[51:100,]
verginica <- iris[101:150,]
boxplot(setosa$Petal.Length, versicolor$Petal.Length, vir...
names=c("Setosa", "Versicolor", "Virginica"), yla...
}}
#ref(boxplot.png,nolink)
ggplot2でボックスプロットを作成するには、''ggplot関数''と...
#geshi(rsplus){{
ggplot(data=iris, aes(x=Species, y=Petal.Length))+
geom_boxplot()+
theme(aspect.ratio=1)
}}
#ref(ggplot2_boxplot_bw.png,nolink)
種(Species)ごとに色を変えるには、''aes関数''の''fill''...
#geshi(rsplus){{
ggplot(data=iris, aes(x=Species, y=Petal.Length, fill=Spe...
geom_boxplot()+
geom_jitter(size=0.5, alpha=0.8)+
theme(aspect.ratio=1)
}}
#ref(ggplot2_boxplot.png,nolink)
**棒グラフ [#k3c837d7]
棒グラフを作成するには、''barplot関数''を使用します。
まず''aggregate関数''を使って平均を集計し、それを棒グラフ...
#geshi(rsplus){{
aggr <- aggregate(iris$Petal.Length, by=list(iris$Species...
barplot(aggr$x, names=aggr$Group.1)
}}
#ref(barplot.png,nolink)
ggplot2で棒グラフを作成するには、''ggplot関数''と''geom_b...
ここでは、エラーバーを表示するために、''stat_summary関数'...
#geshi(rsplus){{
ggplot(data=iris, aes(x=Species, y=Petal.Length))+
geom_bar(stat="summary", fun.y="mean")+
stat_summary(fun.data="mean_se", geom="errorbar", width...
theme(aspect.ratio=1)
}}
#ref(ggplot2_bar_bw.png,nolink)
ボックスプロットと同様に、種(Species)ごとに色を変えるに...
#geshi(rsplus){{
ggplot(data=iris, aes(x=Species, y=Petal.Length))+
geom_bar(stat="summary", fun.y="mean")+
stat_summary(fun.data="mean_se", geom="errorbar", width...
theme(aspect.ratio=1)
}}
#ref(ggplot2_bar.png,nolink)
*推定統計 [#r4e375a0]
標本から母集団の情報を推定することを推定統計といいます。
**平均 [#ee0baa35]
''母平均''は、母集団の値の合計を母集団の大きさ [math]N[/m...
\[ \mu(X) = \frac{1}{N} \sum_{i=1}^N x_i \]
''標本平均''は、標本の値の合計を標本の大きさ [math]n[/mat...
\[\overline{X} = \frac{1}{n} \sum_{i=1}^{n} x_i \]
標本平均を求めるには、''mean関数''を使います。
#geshi(rsplus){{
setosa <- iris[1:50,]
versicolor <- iris[51:100,]
virginica <- iris[101:150,]
mean(setosa$Petal.Length)
mean(versicolor$Petal.Length)
mean(virginica$Petal.Length)
}}
#geshi(rsplus){{
> mean(setosa$Petal.Length)
[1] 1.462
> mean(versicolor$Petal.Length)
[1] 4.26
> mean(virginica$Petal.Length)
[1] 5.552
}}
標本平均の期待値は母平均に等しいため、標本平均を求めるこ...
**分散 [#ded26716]
測定値の標本平均からのズレを''偏差''といいます。
''分散''は、値の偏差の二乗の総和を集団の大きさ [math]N[/m...
\[\sigma(X)^2 = \frac{1}{N} \sum_{i=1}^{n} (x_i - \mu(X))...
''不偏分散''(標本不偏分散)は、標本に含まれる値の偏差の...
\[ s(X)^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \overline...
不偏分散を求めるには、''var関数''を使います。
#geshi(rsplus){{
var(setosa$Petal.Length)
var(versicolor$Petal.Length)
var(virginica$Petal.Length)
}}
#geshi(rsplus){{
> var(setosa$Petal.Length)
[1] 0.03015918
> var(versicolor$Petal.Length)
[1] 0.2208163
> var(virginica$Petal.Length)
[1] 0.3045878
}}
不偏分散の期待値は母集団の分散に等しいため、不偏分散を求...
**標準偏差 [#t6948fa7]
''標準偏差''は、分散の平方根です。
\[ \sigma(X) = \sqrt{\sigma(X)^2} = \sqrt{\frac{1}{N} \su...
''不偏標準偏差''(標本不偏標準偏差)は、不偏分散の平方根...
\[ s(X) = \sqrt{s(X)^2} = \sqrt{\frac{1}{n-1} \sum_{i=1}^...
不偏標準偏差を求めるには、''sd関数''を使います。
#geshi(rsplus){{
sd(setosa$Petal.Length)
sd(versicolor$Petal.Length)
sd(virginica$Petal.Length)
}}
#geshi(rsplus){{
> sd(setosa$Petal.Length)
[1] 0.173664
> sd(versicolor$Petal.Length)
[1] 0.469911
> sd(virginica$Petal.Length)
[1] 0.5518947
}}
不偏標準偏差の期待値は母集団の標準偏差に等しいため、不偏...
**不確かさ [#u9f3ffa9]
「平均 [math]\mu(X)[/math]、標準偏差 [math]\sigma(X)[/mat...
不偏標準偏差 [math]s(X)[/math] を標本の大きさの平方根 [ma...
\[ u(X) = \frac{s(X)}{\sqrt{n}} \]
標準不確かさに''包含係数'' [math]k[/math] をかけたものを'...
\[ U(X) = k \times u(X) \]
測定値が正規分布に従っていて、測定値が11個以上あるとき、...
この95%のことを''信頼水準''といいます。
1993年にISOを含む7つの国際機関が策定した「計測における不...
-[math]x = \overline{X}[/math]、標準不確かさは [math]u(X)...
-[math]x = (\overline{X} \pm U(X))[/math]、ただし記号 [ma...
標準不確かさを求めるには、標本標準偏差を求める''sd関数''...
#geshi(rsplus){{
sd(setosa$Petal.Length) / sqrt(50)
sd(versicolor$Petal.Length) / sqrt(50)
sd(virginica$Petal.Length) / sqrt(50)
}}
#geshi(rsplus){{
> sd(setosa$Petal.Length) / sqrt(50)
[1] 0.0245598
> sd(versicolor$Petal.Length) / sqrt(50)
[1] 0.06645545
> sd(virginica$Petal.Length) / sqrt(50)
[1] 0.0780497
}}
これを用いて、SetosaのPetal.Lengthの測定値を「長さ [math]...
**95%信頼区間 [#m62d681f]
計測における不確かさの表し方が分野によってバラバラなのは...
''95%信頼区間''は、母集団の平均が95%の確率で含まれると推...
標本の平均と母集団の平均の偏差を標準不確かさで割ったもの...
\[ t(X) = \frac{\overline{X} - \mu(X)}{u(X)} \]
t値は、自由度 [math]n - 1[/math] の''t分布''(自由度が大...
そこで、この分布において上側の面積の割合が2.5%になるt値 [...
つまり、母平均の95%信頼区間は次のように表されます。
\[ \overline{X} - t_{n-1,2.5\%} \times u(X) \le \mu \le \...
計測の不確かさを表すのに95%信頼区間を用いるとき、測定値は...
-[math]\overline{X}[/math](95%信頼区間 [math]\overline{X...
95%信頼区間を求めるには、''t.test関数''を使います。
#geshi(rsplus){{
t.test(setosa$Petal.Length)
}}
#geshi(rsplus){{
> t.test(setosa$Petal.Length)
One Sample t-test
data: setosa$Petal.Length
t = 59.528, df = 49, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
1.412645 1.511355
sample estimates:
mean of x
1.462
}}
95%信頼区間 (''95 percent confidence interval'') のところ...
そこで、SetosaのPetal.Lengthの測定値を「長さは [math]1.46...
*演習 [#t115f943]
Sepal.LengthとSepal.Widthの関係を表す散布図、Versicolorの...
Setosa, Versicolor, VirginicaのSepal.Lengthについて、それ...
*参考文献 [#zf4d0948]
-樋口千洋: ''Rによるバイオインフォマティクスデータ解析 第...
#html{{
<iframe style="width:120px;height:240px;" marginwidth="0"...
}}
終了行:
*はじめに [#w5ae99c9]
ここでは、Rを使って平均、分散、標準偏差を求めます。
『Rによるバイオインフォマティクスデータ解析』の3.3節「基...
#html{{
<iframe style="width:120px;height:240px;" marginwidth="0"...
}}
*準備 [#q96ce9c2]
Rのインストールについては、次のページを見てください。
-[[MacでRを使う>機械学習/MacでRを使う]]
-[[WindowsでRを使う>機械学習/WindowsでRを使う]]
ここでは、標準で使用できる''irisデータセット''を使います。
#geshi(rsplus){{
data(iris)
}}
このデータセットは、アヤメの種類(Species)をがく片の長さ...
長さと幅は連続値、種類はsetosa, versicolor, virginicaのい...
このデータセットには、setosa, versicolor, virginicaという...
ランダムに10個のデータを選択して、見てみましょう。
#geshi(rsplus){{
iris[sort(sample(1:150,10)),]
}}
#geshi(rsplus){{
> iris[sort(sample(1:150,10)),]
Sepal.Length Sepal.Width Petal.Length Petal.Width ...
4 4.6 3.1 1.5 0.2 ...
22 5.1 3.7 1.5 0.4 ...
65 5.6 2.9 3.6 1.3 ver...
97 5.7 2.9 4.2 1.3 ver...
100 5.7 2.8 4.1 1.3 ver...
108 7.3 2.9 6.3 1.8 vi...
116 6.4 3.2 5.3 2.3 vi...
122 5.6 2.8 4.9 2.0 vi...
136 7.7 3.0 6.1 2.3 vi...
146 6.7 3.0 5.2 2.3 vi...
}}
論文に使用するグラフはカッコイイ方がいいので、グラフ作成...
#geshi(rsplus){{
install.packages("ggplot2")
library(ggplot2)
}}
*記述統計 [#ea97832a]
標本を要約し、標本の情報をわかりやすく記述することを''記...
ここでは、散布図、ヒストグラム、ボックスプロット(箱ひげ...
**散布図 [#xdbe2fbc]
横軸と縦軸にそれぞれ別の量をとり、測定値を点として表した...
2つの値を同時に測定し、[math]n[/math] 個の測定値の組を [m...
散布図を作成するには、''plot関数''を使います。
#geshi(rsplus){{
plot(x=iris$Petal.Length, y=iris$Petal.Width,
xlab="Petal.Length", ylab="Petal.Width")
}}
#ref(scatter.png,nolink)
ggplot2で散布図を作成するには、''ggplot関数''と''geom_poi...
#geshi(rsplus){{
ggplot(data=iris, aes(x=Petal.Length, y=Petal.Width))+
geom_point()+
theme(aspect.ratio=1)
}}
#ref(ggplot2_scatter_bw.png,nolink)
近似直線を追加するには、''geom_smooth関数''を加えます。
#geshi(rsplus){{
ggplot(data=iris, aes(x=Petal.Length, y=Petal.Width))+
geom_point()+
geom_smooth(method="lm")+
theme(aspect.ratio=1)
}}
#ref(ggplot2_scatter_bw_lm.png,nolink)
種(Species)ごとに色と形を変えるには、''aes関数''の''col...
#geshi(rsplus){{
ggplot(data=iris, aes(x=Petal.Length, y=Petal.Width, colo...
geom_point()+
theme(aspect.ratio=1)
}}
#ref(ggplot2_scatter.png,nolink)
**ヒストグラム [#wa8f8e55]
測定値が存在する範囲をいくつかの区間に分け、各区間とその...
度数分布を表すグラフをヒストグラムといい、底辺の長さが各...
ヒストグラムを作成するには、''hist関数''を使います。
#geshi(rsplus){{
versicolor <- iris[51:100,]
hist(versicolor$Petal.Length, xlab="Petal.Length", main="")
}}
#ref(histogram.png,nolink)
ggplot2でヒストグラムを作成するには、''ggplot関数''と''ge...
#geshi(rsplus){{
versicolor <- iris[51:100,]
ggplot(data=versicolor, aes(x=Petal.Length))+
geom_histogram()+
theme(aspect.ratio=1)
}}
#ref(ggplot2_histogram_bw.png,nolink)
種(Species)ごとに色を変えるには、''aes関数''の''fill''...
#geshi(rsplus){{
ggplot(data=iris, aes(x=Petal.Length, fill=Species))+
geom_histogram(position="identity", alpha=0.8)+
theme(aspect.ratio=1)
}}
#ref(ggplot2_histogram.png,nolink)
**ボックスプロット(箱ひげ図) [#a5452015]
ヒストグラムの他に、測定値の分布やばらつき具合を表すグラ...
長方形の箱とその両端から伸びるひげで標本の統計量を表しま...
箱の両端は、''第一四分位数''(最小値から全体の1/4のところ...
ひげの表し方には2種類あり、一つはひげの両端が最小値と最大...
もう一つは、ひげの両端が''箱の両端から第三四分位数と第一...
後者の場合、ひげの両端よりも外側にある測定値を''特異値''...
#geshi(rsplus){{
setosa <- iris[1:50,]
versicolor <- iris[51:100,]
verginica <- iris[101:150,]
boxplot(setosa$Petal.Length, versicolor$Petal.Length, vir...
names=c("Setosa", "Versicolor", "Virginica"), yla...
}}
#ref(boxplot.png,nolink)
ggplot2でボックスプロットを作成するには、''ggplot関数''と...
#geshi(rsplus){{
ggplot(data=iris, aes(x=Species, y=Petal.Length))+
geom_boxplot()+
theme(aspect.ratio=1)
}}
#ref(ggplot2_boxplot_bw.png,nolink)
種(Species)ごとに色を変えるには、''aes関数''の''fill''...
#geshi(rsplus){{
ggplot(data=iris, aes(x=Species, y=Petal.Length, fill=Spe...
geom_boxplot()+
geom_jitter(size=0.5, alpha=0.8)+
theme(aspect.ratio=1)
}}
#ref(ggplot2_boxplot.png,nolink)
**棒グラフ [#k3c837d7]
棒グラフを作成するには、''barplot関数''を使用します。
まず''aggregate関数''を使って平均を集計し、それを棒グラフ...
#geshi(rsplus){{
aggr <- aggregate(iris$Petal.Length, by=list(iris$Species...
barplot(aggr$x, names=aggr$Group.1)
}}
#ref(barplot.png,nolink)
ggplot2で棒グラフを作成するには、''ggplot関数''と''geom_b...
ここでは、エラーバーを表示するために、''stat_summary関数'...
#geshi(rsplus){{
ggplot(data=iris, aes(x=Species, y=Petal.Length))+
geom_bar(stat="summary", fun.y="mean")+
stat_summary(fun.data="mean_se", geom="errorbar", width...
theme(aspect.ratio=1)
}}
#ref(ggplot2_bar_bw.png,nolink)
ボックスプロットと同様に、種(Species)ごとに色を変えるに...
#geshi(rsplus){{
ggplot(data=iris, aes(x=Species, y=Petal.Length))+
geom_bar(stat="summary", fun.y="mean")+
stat_summary(fun.data="mean_se", geom="errorbar", width...
theme(aspect.ratio=1)
}}
#ref(ggplot2_bar.png,nolink)
*推定統計 [#r4e375a0]
標本から母集団の情報を推定することを推定統計といいます。
**平均 [#ee0baa35]
''母平均''は、母集団の値の合計を母集団の大きさ [math]N[/m...
\[ \mu(X) = \frac{1}{N} \sum_{i=1}^N x_i \]
''標本平均''は、標本の値の合計を標本の大きさ [math]n[/mat...
\[\overline{X} = \frac{1}{n} \sum_{i=1}^{n} x_i \]
標本平均を求めるには、''mean関数''を使います。
#geshi(rsplus){{
setosa <- iris[1:50,]
versicolor <- iris[51:100,]
virginica <- iris[101:150,]
mean(setosa$Petal.Length)
mean(versicolor$Petal.Length)
mean(virginica$Petal.Length)
}}
#geshi(rsplus){{
> mean(setosa$Petal.Length)
[1] 1.462
> mean(versicolor$Petal.Length)
[1] 4.26
> mean(virginica$Petal.Length)
[1] 5.552
}}
標本平均の期待値は母平均に等しいため、標本平均を求めるこ...
**分散 [#ded26716]
測定値の標本平均からのズレを''偏差''といいます。
''分散''は、値の偏差の二乗の総和を集団の大きさ [math]N[/m...
\[\sigma(X)^2 = \frac{1}{N} \sum_{i=1}^{n} (x_i - \mu(X))...
''不偏分散''(標本不偏分散)は、標本に含まれる値の偏差の...
\[ s(X)^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \overline...
不偏分散を求めるには、''var関数''を使います。
#geshi(rsplus){{
var(setosa$Petal.Length)
var(versicolor$Petal.Length)
var(virginica$Petal.Length)
}}
#geshi(rsplus){{
> var(setosa$Petal.Length)
[1] 0.03015918
> var(versicolor$Petal.Length)
[1] 0.2208163
> var(virginica$Petal.Length)
[1] 0.3045878
}}
不偏分散の期待値は母集団の分散に等しいため、不偏分散を求...
**標準偏差 [#t6948fa7]
''標準偏差''は、分散の平方根です。
\[ \sigma(X) = \sqrt{\sigma(X)^2} = \sqrt{\frac{1}{N} \su...
''不偏標準偏差''(標本不偏標準偏差)は、不偏分散の平方根...
\[ s(X) = \sqrt{s(X)^2} = \sqrt{\frac{1}{n-1} \sum_{i=1}^...
不偏標準偏差を求めるには、''sd関数''を使います。
#geshi(rsplus){{
sd(setosa$Petal.Length)
sd(versicolor$Petal.Length)
sd(virginica$Petal.Length)
}}
#geshi(rsplus){{
> sd(setosa$Petal.Length)
[1] 0.173664
> sd(versicolor$Petal.Length)
[1] 0.469911
> sd(virginica$Petal.Length)
[1] 0.5518947
}}
不偏標準偏差の期待値は母集団の標準偏差に等しいため、不偏...
**不確かさ [#u9f3ffa9]
「平均 [math]\mu(X)[/math]、標準偏差 [math]\sigma(X)[/mat...
不偏標準偏差 [math]s(X)[/math] を標本の大きさの平方根 [ma...
\[ u(X) = \frac{s(X)}{\sqrt{n}} \]
標準不確かさに''包含係数'' [math]k[/math] をかけたものを'...
\[ U(X) = k \times u(X) \]
測定値が正規分布に従っていて、測定値が11個以上あるとき、...
この95%のことを''信頼水準''といいます。
1993年にISOを含む7つの国際機関が策定した「計測における不...
-[math]x = \overline{X}[/math]、標準不確かさは [math]u(X)...
-[math]x = (\overline{X} \pm U(X))[/math]、ただし記号 [ma...
標準不確かさを求めるには、標本標準偏差を求める''sd関数''...
#geshi(rsplus){{
sd(setosa$Petal.Length) / sqrt(50)
sd(versicolor$Petal.Length) / sqrt(50)
sd(virginica$Petal.Length) / sqrt(50)
}}
#geshi(rsplus){{
> sd(setosa$Petal.Length) / sqrt(50)
[1] 0.0245598
> sd(versicolor$Petal.Length) / sqrt(50)
[1] 0.06645545
> sd(virginica$Petal.Length) / sqrt(50)
[1] 0.0780497
}}
これを用いて、SetosaのPetal.Lengthの測定値を「長さ [math]...
**95%信頼区間 [#m62d681f]
計測における不確かさの表し方が分野によってバラバラなのは...
''95%信頼区間''は、母集団の平均が95%の確率で含まれると推...
標本の平均と母集団の平均の偏差を標準不確かさで割ったもの...
\[ t(X) = \frac{\overline{X} - \mu(X)}{u(X)} \]
t値は、自由度 [math]n - 1[/math] の''t分布''(自由度が大...
そこで、この分布において上側の面積の割合が2.5%になるt値 [...
つまり、母平均の95%信頼区間は次のように表されます。
\[ \overline{X} - t_{n-1,2.5\%} \times u(X) \le \mu \le \...
計測の不確かさを表すのに95%信頼区間を用いるとき、測定値は...
-[math]\overline{X}[/math](95%信頼区間 [math]\overline{X...
95%信頼区間を求めるには、''t.test関数''を使います。
#geshi(rsplus){{
t.test(setosa$Petal.Length)
}}
#geshi(rsplus){{
> t.test(setosa$Petal.Length)
One Sample t-test
data: setosa$Petal.Length
t = 59.528, df = 49, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
1.412645 1.511355
sample estimates:
mean of x
1.462
}}
95%信頼区間 (''95 percent confidence interval'') のところ...
そこで、SetosaのPetal.Lengthの測定値を「長さは [math]1.46...
*演習 [#t115f943]
Sepal.LengthとSepal.Widthの関係を表す散布図、Versicolorの...
Setosa, Versicolor, VirginicaのSepal.Lengthについて、それ...
*参考文献 [#zf4d0948]
-樋口千洋: ''Rによるバイオインフォマティクスデータ解析 第...
#html{{
<iframe style="width:120px;height:240px;" marginwidth="0"...
}}
ページ名: