- バックアップ一覧
- 差分 を表示
- 現在との差分 を表示
- ソース を表示
- バイオ・データ・マイニング/RでNaïve Bayesを使う へ行く。
- 1 (2013-11-28 (木) 10:39:25)
- 2 (2013-11-28 (木) 10:49:37)
- 3 (2013-11-28 (木) 18:34:24)
- 4 (2013-11-29 (金) 01:30:16)
- 5 (2013-12-23 (月) 10:00:14)
この記事はまだ書きかけです.
はじめに †
RでNaïve Bayesを使います.
準備 †
Rのインストールについては,次のページを見てください.
今回のデータには,kernlabパッケージに含まれているspamデータを用います. そこで,kernlabパッケージをインストールします. install.packagesコマンドを実行すると,パッケージをダウンロードするサーバーを聞かれますので,リストからJapanのどれかを選択します.
> install.packages("e1071") > library("e1071")
このデータは,4601個のメールを1813個のスパムと2788個のスパムでないものに分けたデータです.
> data(iris)
Naïve Bayes †
Naïve Bayes(ナイーブ・ベイズ)はスパム・メール・フィルターなどで用いられている機械学習の手法です.
Naïve Bayesでは,それぞれの特徴が独立に出現することを仮定して,Bayes(ベイズ)の定理に基づいて分類規則を生成します.
文書分類にNaïve Bayesを用いるときは,文書を単語の集合とみなし,それぞれの単語が独立に出現することを仮定することになります.