Rで大規模データを扱う

| Topic path: Top / 機械学習 / Rで大規模データを扱う

この記事はまだ書きかけです.

*はじめに [#gbf213f4]

Rでは全てのデータをメモリー上で処理するため,大規模なデータに対して機械学習を行うとすぐに「allocMatrix において,指定された要素数が多すぎます」というメッセージが出て処理が停まってしまいます.

そこで,Rで大規模メモリーを扱う方法についてメモしておきます.


*ダウンロードとインストール [#c7b43c9f]

#geshi(rsplus){{
> options(CRAN = "http://cran.r-project.org")
> install.packages("bigmemory")
}}

この後,ダウンロードするサーバーを聞かれますので,日本のサーバーを選択します.


*データの読み込み [#d6518a0f]

まだぜんぜん書けていませんが,時間がなくなりました.
続きはまたいつか.


*参考情報 [#md559887]

-[[MacでRを使う>機械学習/MacでRを使う]] | とうごろうぃき
-[[RでRandom Forestを使う>機械学習/RでRandom Forestを使う]] | とうごろうぃき
-[[RでRandom Forestを使う>バイオ・データ・マイニング/RでRandom Forestを使う]] | とうごろうぃき

-[[Rにおける大規模データ解析:http://www.slideshare.net/sfchaos/rbigmemory-tokyowebmining10]] | [[@sfchaos:http://twitter.com/sfchaos]] | SlideShare
トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS