はじめに

ここでは,Rにデータを読み込む方法を説明します.

この記事は,『Rによるバイオインフォマティクスデータ解析』を参考にしています. Rにデータを読み込む方法は,この本の2.15節「入出力」に出てきます.

準備

Rのインストールについては,次のページを見てください.

データ・ファイルはCSV形式とします. つまり,項目はコンマ区切り,データは改行区切りとします.

Excelでデータを作成し,CSV形式で保存すればできます. 保存したファイルをテキスト・エディターで開いて確認してください.

ここでは,irisデータの一部である以下のようなファイルとします.

,Sepal.Length,Sepal.Width,Petal.Length,Petal.Width,Species
1,5.1,3.5,1.4,0.2,setosa
51,7.0,3.2,4.7,1.4,versicolor
101,6.3,3.3,6.0,2.5,virginica

このCSVファイルは,1行目が列名,1列名がデータ名となっています.

作業ディレクトリーの変更

まずは,作業ディレクトリーをCSVファイルが置いてあるディレクトリーに変更します.

現在のディレクトリーを調べるには,getwd関数を使います.

getwd()

作業ディレクトリーを変更するには,setwd関数を使います.

setwd("/Users/tohgoroh/Desktop")

ここでは,作業ディレクトリーを /Users/tohgoroh/Desktop に変更しています.

行列データの読み込み

CSVファイルを読み込んで行列を作成するには,read.csv関数を使用します.

data <- read.csv("data.csv")

デフォルトは1行目が列名(header=T),データ名の列はなしです.

1列目がデータ名の場合,"row.names"オプションを指定します.

data <- read.csv("data.csv", row.names=1)

1行目が列名でないとき,headerオプションの値をFにします.

data <- read.csv("data.csv", header=F)

ここでは,1行目が列名,1列目がデータ名なので,次のようになります.

data <- read.csv("data.csv", row.names=1)
data

読み込まれたデータは,データフレームという構造になります.

参考文献

トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS