バイオ・データ・マイニング/Rでデータを読み込む
をテンプレートにして作成
開始行:
*はじめに [#b3c8dba1]
ここでは、Rにデータを読み込む方法を説明します。
この記事は、『Rによるバイオインフォマティクスデータ解析』...
Rにデータを読み込む方法は、この本の2.15節「入出力」に出て...
#html{{
<iframe style="width:120px;height:240px;" marginwidth="0"...
}}
*準備 [#t46fd7ed]
Rのインストールについては、次のページを見てください。
-[[MacでRを使う>機械学習/MacでRを使う]]
-[[WindowsでRを使う>機械学習/WindowsでRを使う]]
データ・ファイルはCSV形式とします。
つまり、項目はコンマ区切り、データは改行区切りとします。
Excelでデータを作成し、CSV形式で保存すればできます。
保存したファイルをテキスト・エディターで開いて確認してく...
ここでは、irisデータの一部である以下のようなファイルとし...
#geshi(txt){{
,Sepal.Length,Sepal.Width,Petal.Length,Petal.Width,Species
1,5.1,3.5,1.4,0.2,setosa
51,7.0,3.2,4.7,1.4,versicolor
101,6.3,3.3,6.0,2.5,virginica
}}
このCSVファイルは、1行目が列名、1列名がデータ名となってい...
ここから元のファイルがダウンロードできます。
-https://archive.ics.uci.edu/ml/datasets/Iris
*作業ディレクトリーの変更 [#gb8459dd]
まずは、作業ディレクトリーをCSVファイルが置いてあるディレ...
現在のディレクトリーを調べるには、getwd関数を使います。
#geshi(rsplus){{
getwd()
}}
作業ディレクトリーを変更するには、setwd関数を使います。
#geshi(rsplus){{
setwd("/Users/tohgoroh/Desktop")
}}
ここでは、作業ディレクトリーを /Users/tohgoroh/Desktop に...
*行列データの読み込み [#uf502a43]
CSVファイルを読み込んで行列を作成するには、''read.csv関数...
#geshi(rsplus){{
data <- read.csv("data.csv")
}}
デフォルトは1行目が列名(header=T)、データ名の列はなしで...
1列目がデータ名の場合、"row.names"オプションを指定します。
#geshi(rsplus){{
data <- read.csv("data.csv", row.names=1)
}}
1行目が列名でないとき、headerオプションの値をFにします。
#geshi(rsplus){{
data <- read.csv("data.csv", header=F)
}}
ここでは、1行目が列名、1列目がデータ名なので、次のように...
#geshi(rsplus){{
data <- read.csv("data.csv", row.names=1)
data
}}
#geshi(rsplus){{
Sepal.Length Sepal.Width Petal.Length Petal.Width ...
1 5.1 3.5 1.4 0.2 ...
51 7.0 3.2 4.7 1.4 ver...
101 6.3 3.3 6.0 2.5 vi...
}}
読み込まれたデータは、データフレームという構造になります。
*離散値のファクター化 [#k1842902]
カテゴリー変数やラベル(つまり離散値)はファクターになっ...
read.csv関数で離散値の属性を読み込むと自動でファクターに...
まず、その属性ベクトルだけを取り出し、ファクターになって...
#geshi(rsplus){{
data$Species
}}
#geshi(rsplus){{
[1] setosa versicolor virginica
Levels: setosa versicolor virginica
}}
このように、Levels: ... と表示されたらファクターになって...
もし、自動でファクターになっていない場合には、''factor関...
#geshi(rsplus){{
data$Species <- factor(data$Species)
}}
もう一度この属性ベクトルだけを取り出して、ファクターにな...
*参考文献 [#lb51dfcf]
#html{{
<iframe style="width:120px;height:240px;" marginwidth="0"...
}}
終了行:
*はじめに [#b3c8dba1]
ここでは、Rにデータを読み込む方法を説明します。
この記事は、『Rによるバイオインフォマティクスデータ解析』...
Rにデータを読み込む方法は、この本の2.15節「入出力」に出て...
#html{{
<iframe style="width:120px;height:240px;" marginwidth="0"...
}}
*準備 [#t46fd7ed]
Rのインストールについては、次のページを見てください。
-[[MacでRを使う>機械学習/MacでRを使う]]
-[[WindowsでRを使う>機械学習/WindowsでRを使う]]
データ・ファイルはCSV形式とします。
つまり、項目はコンマ区切り、データは改行区切りとします。
Excelでデータを作成し、CSV形式で保存すればできます。
保存したファイルをテキスト・エディターで開いて確認してく...
ここでは、irisデータの一部である以下のようなファイルとし...
#geshi(txt){{
,Sepal.Length,Sepal.Width,Petal.Length,Petal.Width,Species
1,5.1,3.5,1.4,0.2,setosa
51,7.0,3.2,4.7,1.4,versicolor
101,6.3,3.3,6.0,2.5,virginica
}}
このCSVファイルは、1行目が列名、1列名がデータ名となってい...
ここから元のファイルがダウンロードできます。
-https://archive.ics.uci.edu/ml/datasets/Iris
*作業ディレクトリーの変更 [#gb8459dd]
まずは、作業ディレクトリーをCSVファイルが置いてあるディレ...
現在のディレクトリーを調べるには、getwd関数を使います。
#geshi(rsplus){{
getwd()
}}
作業ディレクトリーを変更するには、setwd関数を使います。
#geshi(rsplus){{
setwd("/Users/tohgoroh/Desktop")
}}
ここでは、作業ディレクトリーを /Users/tohgoroh/Desktop に...
*行列データの読み込み [#uf502a43]
CSVファイルを読み込んで行列を作成するには、''read.csv関数...
#geshi(rsplus){{
data <- read.csv("data.csv")
}}
デフォルトは1行目が列名(header=T)、データ名の列はなしで...
1列目がデータ名の場合、"row.names"オプションを指定します。
#geshi(rsplus){{
data <- read.csv("data.csv", row.names=1)
}}
1行目が列名でないとき、headerオプションの値をFにします。
#geshi(rsplus){{
data <- read.csv("data.csv", header=F)
}}
ここでは、1行目が列名、1列目がデータ名なので、次のように...
#geshi(rsplus){{
data <- read.csv("data.csv", row.names=1)
data
}}
#geshi(rsplus){{
Sepal.Length Sepal.Width Petal.Length Petal.Width ...
1 5.1 3.5 1.4 0.2 ...
51 7.0 3.2 4.7 1.4 ver...
101 6.3 3.3 6.0 2.5 vi...
}}
読み込まれたデータは、データフレームという構造になります。
*離散値のファクター化 [#k1842902]
カテゴリー変数やラベル(つまり離散値)はファクターになっ...
read.csv関数で離散値の属性を読み込むと自動でファクターに...
まず、その属性ベクトルだけを取り出し、ファクターになって...
#geshi(rsplus){{
data$Species
}}
#geshi(rsplus){{
[1] setosa versicolor virginica
Levels: setosa versicolor virginica
}}
このように、Levels: ... と表示されたらファクターになって...
もし、自動でファクターになっていない場合には、''factor関...
#geshi(rsplus){{
data$Species <- factor(data$Species)
}}
もう一度この属性ベクトルだけを取り出して、ファクターにな...
*参考文献 [#lb51dfcf]
#html{{
<iframe style="width:120px;height:240px;" marginwidth="0"...
}}
ページ名: