機械学習/Rで大規模データを扱う のバックアップ(No.1)


この記事はまだ書きかけです.

はじめに

Rでは全てのデータをメモリー上で処理するため,大規模なデータに対して機械学習を行うとすぐに「allocMatrix において,指定された要素数が多すぎます」というメッセージが出て処理が停まってしまいます.

そこで,Rで大規模メモリーを扱う方法についてメモしておきます.

ダウンロードとインストール

> options(CRAN = "http://cran.r-project.org")
> install.packages("bigmemory")

この後,ダウンロードするサーバーを聞かれますので,日本のサーバーを選択します.

データの読み込み

まだぜんぜん書けていませんが,時間がなくなりました. 続きはまたいつか.

参考情報

  • MacでRを使う | とうごろうぃき
  • RでRandom Forestを使う? | とうごろうぃき
トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS