機械学習/MacでMahoutを使う のバックアップ(No.1)


この記事はまだ書きかけです.

はじめに

Apache MahoutはHadoopの上で動くスケーラブルな機械学習ライブラリーです.

この記事の内容は,Mac OS X 10.6.6, Hadoop 0.21.0, Maven 3.0.2, Mahout 0.40で確認しました.

ダウンロード

Hadoop

Hadoop CommonのDownloadにあるDownload a realease now!からミラー・サーバーのリストに行き,その中のどれかからhadoop-0.21.0.tar.gzをダウンロードします.

Maven

Downloadのところにあるapache-maven-3.0.2-bin.zipをダウンロードします. 今回はtar.gzがうまくダウンロードできなかったのでzipにしましたが,基本的にはどちらでも同じです.

Mahout

download mahoutにあるOfficial Releaseからミラー・サーバーのリストに行き,その中のどれかから"mahout-distribution-0.4.tar.gz''をダウンロードします.

Hadoopのインストール

まずはダウンロードしたhadoop-0.21.0.tar.gzをダブル・クリックして展開します.

展開したhadoop-0.21.0を/usr/local/に移動します. また,/usr/local/hadoopというリンクを作成します.

$ sudo mv hadoop-0.20.2 /usr/local/
$ sudo ln -s /usr/local/hadoop-0.20.2 /usr/local/hadoop

つぎに,環境変数を設定します. 今回の設定は,実行したシェルだけで有効です.

export JAVA_HOME=/System/Library/Frameworks/JavaVM.framework/Versions/1.6/Home
export PATH=$JAVA_HOME/bin:$PATH
export HADOOP_HOME=/usr/local/hadoop
export PATH=$HADOOP_HOME/bin:$PATH

動作確認します.

$ hadoop -version
java version "1.6.0_22"
Java(TM) SE Runtime Environment (build 1.6.0_22-b04-307-10M3261)
Java HotSpot(TM) 64-Bit Server VM (build 17.1-b03-307, mixed mode)

Mavenのインストール

Apache Mavenはソフトウェア・プロジェクト管理ツールで,Hadoopをビルドするのに必要です.

まず,ダウンロードしたapache-maven-3.0.2-bin.zipをダブル・クリックして展開します.

展開したapahce-maven-3.0.2 を/usr/local/に移動します. また,/usr/local/mavenというリンクを作成します.

$ sudo mv apache-maven-3.0.2 /usr/local/
$ sudo ln -s /usr/local/apache-maven-3.0.2 /usr/local/maven

つぎに,環境変数を設定します. Hadoopのときと同様に,今回の設定は,実行したシェルだけで有効です.

export MAVEN_HOME=/usr/local/maven
export PATH=$MAVEN_HOME/bin:$PATH

動作確認します.

$ mvn -version
Apache Maven 2.2.1 (r801777; 2009-08-07 04:16:01+0900)
Java version: 1.6.0_22
Java home: /System/Library/Java/JavaVirtualMachines/1.6.0.jdk/Contents/Home
Default locale: ja_JP, platform encoding: SJIS
OS name: "mac os x" version: "10.6.6" arch: "x86_64" Family: "mac"

Mahoutのインストール

いよいよApache Mahoutをインストールします.

まず,ダウンロードしたmahout-distribution-0.4-src.tar.gzをダブル・クリックして展開します.

展開したmahout-distribution-0.4を/usr/local/に移動します. また,/usr/local/mahoutというリンクを作成します.

$ sudo mv mahout-distribution-0.4 /usr/local
$ sudo ln -s /usr/local/mahout-distribution-0.4 /usr/local/mahout

/usr/local/mahoutディレクトリーへ移動し,Mavenでのインストールを行います.

$ cd /usr/local/mahout
$ sudo mvn install

この処理にはかなり時間がかかりますので,気長に待ちます.

処理が終わったら,環境変数を設定します.

export MAHOUT_HOME=/usr/local/mahout
export PATH=$MAHOUT_HOME/bin:$PATH

参考情報

トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS