この記事はまだ書きかけです.

はじめに

RでNaïve Bayesを使います.

準備

Rのインストールについては,次のページを見てください.

今回のデータには,kernlabパッケージに含まれているspamデータを用います. そこで,kernlabパッケージをインストールします. install.packagesコマンドを実行すると,パッケージをダウンロードするサーバーを聞かれますので,リストからJapanのどれかを選択します.

> install.packages("e1071")
> library("e1071")

このデータは,4601個のメールを1813個のスパムと2788個のスパムでないものに分けたデータです.

> data(iris)

Naïve Bayes

Naïve Bayes(ナイーブ・ベイズ)はスパム・メール・フィルターなどで用いられている機械学習の手法です.

Naïve Bayesでは,それぞれの特徴が独立に出現することを仮定して,Bayes(ベイズ)の定理に基づいて分類規則を生成します.

文書分類にNaïve Bayesを用いるときは,文書を単語の集合とみなし,それぞれの単語が独立に出現することを仮定することになります.

トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS