- バックアップ一覧
- 差分 を表示
- 現在との差分 を表示
- ソース を表示
- バイオ・データ・マイニング/RでNaïve Bayesを使う へ行く。
この記事はまだ書きかけです.
はじめに †
RでNaïve Bayesを使います.
準備 †
Rのインストールについては,次のページを見てください.
今回のデータには,kernlabパッケージに含まれているspamデータを用います. そこで,kernlabパッケージをインストールします. install.packagesコマンドを実行すると,パッケージをダウンロードするサーバーを聞かれますので,リストからJapanのどれかを選択します.
install.packages("e1071") library("e1071")
このデータは,4601個のメールを1813個のスパムと2788個のスパムでないものに分けたデータです.
data(iris)
Naïve Bayes †
Naïve Bayes(ナイーブ・ベイズ)はスパム・メール・フィルターなどで用いられている機械学習の手法です.
Naïve Bayesでは,それぞれの特徴が独立に出現することを仮定して,Bayes(ベイズ)の定理に基づいて分類規則を生成します.
文書分類にNaïve Bayesを用いるときは,文書を単語の集合とみなし,それぞれの単語が独立に出現することを仮定することになります.