- バックアップ一覧
- 差分 を表示
- 現在との差分 を表示
- ソース を表示
- バイオ・データ・マイニング/Rの基本 へ行く。
はじめに †
『Rによるバイオインフォマティクスデータ解析』の第2章に従って,Rの基本をおさらいします.
対話モードでのR操作 †
Rは対話モードで操作を行います. コンソール画面(R Console)に
>
と表示されているときは,Rがコマンド入力を受け付けていることを表します. この「>」をコマンド・プロンプトと呼びます.
コマンド・プロンプトに「1+1」と入力してReturnキーを押します. すると,次のように計算結果が表示されます.
> 1+1 [1] 2 >
コマンドの途中でRetrunキーを押すと,改行されます. このとき,コマンド入力が継続していることを表す「+」の記号が行頭に表示されます.
たとえば,「1-」と入力してReturnキーを押すと,次のように表示されます.
> 1- +
これは,式がまだ完了していないので,コマンド入力を引き続き受け付けていることを表しています. 続けて「1」と入力してReturnキーを押すと,次のように表示されます.
> 1- + 1 [1] 0 >
今度は,式が完了しているので計算が行われ,計算結果の0が表示されました.
Rにはヒストリー機能があって,今までに実行したコマンドを覚えています. ↑(上矢印)キーを押すと,一つ前に実行したコマンドが表示されます. さらに↑キーを押すと,もう一つ前に実行したコマンドが表示されます. ↓(下矢印)キーを押すと,一つ後に実行したコマンドが表示されます.
Rの基本データ構造 †
ベクトル †
Rのデータはベクトルとして扱われます.
> 0 [1] 0 >
と入力すると,
> 51:100 [1] 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 [17] 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 [33] 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 [49] 99 100 >
と表示されます. この「[1]」は,0がベクトルの第1次元の値であることを表しています.
「:」(コロン)を用いると,交差1の等差数列ベクトルを表すことができます.
> c(10, 20, 30) [1] 10 20 30 >
ここで,「[1]」や「[17]」は,それぞれの行の最初のデータの次元番号を表しています. すなわち,51は第1次元,67は第17次元,83は第33次元,99は第49次元であることを示しています. 改行される位置は,ウィンドウの幅によって変わります.
文字列 †
また,標準で用意されているベクトル・データに,LETTERS(とletters)があります. 「LETTERS」と入力するとアルファベットの大文字が各次元に一文字ずつある26次元のベクトルが表示されます.
> LETTERS [1] "A" "B" "C" "D" "E" "F" "G" "H" "I" "J" "K" "L" "M" "N" "O" "P" [17] "Q" "R" "S" "T" "U" "V" "W" "X" "Y" "Z" >
ここで,「"A"」はダブル・クオーテーション(")で囲まれています. これは,これがAという文字列であることを表しています.
人間にとっては1も"1"も同じように思われますが,コンピューターにとっては値の1と文字列の"1"は全然違うものです. ですから,Rでは,「1+1」の計算はできますが,「"1"+"1"」の計算はできません.
> 1+1 [1] 2 > "1"+"1" 以下にエラー "1" + "1" : 二項演算子の引数が数値ではありません >
変数とオブジェクト †
オブジェクト †
複雑な計算をするときは,計算をいくつかの部分に分けて行い,その結果に対して計算を行うということがあります. このようなとき,いくつかの部分に分けられた計算の結果を覚えておく必要があります.
このような計算の途中結果,あるいは値や文字列などのデータを覚えておくため入れ物を変数またはオブジェクトと呼びます.
代入 †
計算の途中結果,値,データなどをオブジェクトに覚えさせることを,代入と呼びます. オブジェクトに代入するときは,不等号記号とマイナスの記号で「<-」という矢印を作ってこれを使います. これは,右辺の式を計算し,その結果を左辺のオブジェクトに代入します.
> a <- 1 > b <- 2 > c <- a+b > c [1] 3 >
向きが反対の「->」も使えます. こちらは,左辺の計算結果を右辺のオブジェクトに代入します.
表示と削除 †
オブジェクトのリストを表示するときは,lsコマンドかobjectsコマンドを使います.
> c <- a+b > (c <- a+b) [1] 3 >
lsというのは,listの省略形です.
たくさんのデータを格納したオブジェクトはコンピュータのメモリーをたくさん使用しますので,不要になったオブジェクトはrmコマンドを用いて削除します.
> ls() [1] "a" "b" "c" > objects() [1] "a" "b" "c"
rmというのは,removeの省略形です.
演算子 †
コンピューターで計算することを演算といい,演算の命令に使う記号を演算子といいます.
演算には加算や減算などの算術演算と,論理和や論理積などの論理演算があります.
算術演算子 †
演算子 | 処理 |
+ | 加算(たし算) |
- | 減算(ひき算) |
* | 乗算(かけ算) |
/ | 除算(わり算) |
%/% | 除算の整数部(わり算の整数部) |
%% | 剰余(わり算の余り) |
%*% | 行列の内積 |
%%o% | 行列の外積 |
この記事はまだ書きかけです.