Rで大規模データを扱う

2011-02-28 (月) 15:05:35 (2276d) | Topic path: Top / 機械学習 / Rで大規模データを扱う

この記事はまだ書きかけです.

はじめに

Rでは全てのデータをメモリー上で処理するため,大規模なデータに対して機械学習を行うとすぐに「allocMatrix において,指定された要素数が多すぎます」というメッセージが出て処理が停まってしまいます.

そこで,Rで大規模メモリーを扱う方法についてメモしておきます.

ダウンロードとインストール

> options(CRAN = "http://cran.r-project.org")
> install.packages("bigmemory")

この後,ダウンロードするサーバーを聞かれますので,日本のサーバーを選択します.

データの読み込み

まだぜんぜん書けていませんが,時間がなくなりました. 続きはまたいつか.

参考情報

トップ   編集 凍結解除 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS