機械学習/Rで大規模データを扱う のバックアップ差分(No.2)


  • 追加された行はこの色です。
  • 削除された行はこの色です。
この記事はまだ書きかけです.

*はじめに [#gbf213f4]

Rでは全てのデータをメモリー上で処理するため,大規模なデータに対して機械学習を行うとすぐに「allocMatrix において,指定された要素数が多すぎます」というメッセージが出て処理が停まってしまいます.

そこで,Rで大規模メモリーを扱う方法についてメモしておきます.


*ダウンロードとインストール [#c7b43c9f]

#geshi(R){{
#geshi(rsplus){{
> options(CRAN = "http://cran.r-project.org")
> install.packages("bigmemory")
}}

この後,ダウンロードするサーバーを聞かれますので,日本のサーバーを選択します.


*データの読み込み [#d6518a0f]

まだぜんぜん書けていませんが,時間がなくなりました.
続きはまたいつか.


*参考情報 [#md559887]

-[[MacでRを使う>機械学習/MacでRを使う]] | とうごろうぃき
-[[RでRandom Forestを使う>機械学習/RでRandom Forestを使う]] | とうごろうぃき

-[[Rにおける大規模データ解析:http://www.slideshare.net/sfchaos/rbigmemory-tokyowebmining10]] | [[@sfchaos:http://twitter.com/sfchaos]] | SlideShare


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS