この記事はまだ書きかけです.
*はじめに [#gbf213f4]
Rでは全てのデータをメモリー上で処理するため,大規模なデータに対して機械学習を行うとすぐに「allocMatrix において,指定された要素数が多すぎます」というメッセージが出て処理が停まってしまいます.
そこで,Rで大規模メモリーを扱う方法についてメモしておきます.
*ダウンロードとインストール [#c7b43c9f]
#geshi(rsplus){{
> options(CRAN = "http://cran.r-project.org")
> install.packages("bigmemory")
}}
この後,ダウンロードするサーバーを聞かれますので,日本のサーバーを選択します.
*データの読み込み [#d6518a0f]
まだぜんぜん書けていませんが,時間がなくなりました.
続きはまたいつか.
*参考情報 [#md559887]
-[[MacでRを使う>機械学習/MacでRを使う]] | とうごろうぃき
-[[RでRandom Forestを使う>機械学習/RでRandom Forestを使う]] | とうごろうぃき
-[[RでRandom Forestを使う>バイオ・データ・マイニング/RでRandom Forestを使う]] | とうごろうぃき
-[[Rにおける大規模データ解析:http://www.slideshare.net/sfchaos/rbigmemory-tokyowebmining10]] | [[@sfchaos:http://twitter.com/sfchaos]] | SlideShare