バイオ・データ・マイニング/RでNaïve Bayesを使うのバックアップ(No.2)

バックアップ一覧
差分を表示
現在との差分を表示
ソースを表示
バイオ・データ・マイニング/RでNaïve Bayesを使うへ行く。
- 1 (2013-11-28 (木) 10:39:25)
- 2 (2013-11-28 (木) 10:49:37)
- 3 (2013-11-28 (木) 18:34:24)
- 4 (2013-11-29 (金) 01:30:16)
- 5 (2013-12-23 (月) 10:00:14)
- 6 (2013-12-23 (月) 10:00:14)

この記事はまだ書きかけです．

はじめに †

RでNaïve Bayesを使います．

準備 †

Rのインストールについては，次のページを見てください．

今回のデータには，kernlabパッケージに含まれているspamデータを用います．そこで，kernlabパッケージをインストールします． install.packagesコマンドを実行すると，パッケージをダウンロードするサーバーを聞かれますので，リストからJapanのどれかを選択します．

install.packages("e1071")
library("e1071")

このデータは，4601個のメールを1813個のスパムと2788個のスパムでないものに分けたデータです．

data(iris)

↑

Naïve Bayes †

Naïve Bayes（ナイーブ・ベイズ）はスパム・メール・フィルターなどで用いられている機械学習の手法です．

Naïve Bayesでは，それぞれの特徴が独立に出現することを仮定して，Bayes（ベイズ）の定理に基づいて分類規則を生成します．

文書分類にNaïve Bayesを用いるときは，文書を単語の集合とみなし，それぞれの単語が独立に出現することを仮定することになります．

バイオ・データ・マイニング/RでNaïve Bayesを使う のバックアップ(No.2)

はじめに †

準備 †

Naïve Bayes †

バイオ・データ・マイニング/RでNaïve Bayesを使うのバックアップ(No.2)