この記事はまだ書きかけです.
はじめに †
Rでは全てのデータをメモリー上で処理するため,大規模なデータに対して機械学習を行うとすぐに「allocMatrix において,指定された要素数が多すぎます」というメッセージが出て処理が停まってしまいます.
そこで,Rで大規模メモリーを扱う方法についてメモしておきます.
ダウンロードとインストール †
> options(CRAN = "http://cran.r-project.org") > install.packages("bigmemory")
この後,ダウンロードするサーバーを聞かれますので,日本のサーバーを選択します.
データの読み込み †
まだぜんぜん書けていませんが,時間がなくなりました. 続きはまたいつか.
参考情報 †
- MacでRを使う | とうごろうぃき
- RでRandom Forestを使う | とうごろうぃき
- Rにおける大規模データ解析 | @sfchaos | SlideShare