MacでNamazuを使う

2009-10-09 (金) 14:59:09 (5303d) | Topic path: Top / テキスト・マイニング / MacでNamazuを使う

はじめに

Namazu」はNamazu Projectによって開発されている日本語全文検索システムです.

次の環境で確認しました.

  • Mac OS X 10.6.1
  • Namazu 2.0.20
  • nkf 2.0.7
  • MeCab 0.98
  • gettext 0.17

必要なもの

  • nkf
  • MeCab
  • MeCab-Perl
  • gettext
  • make
  • gcc

ダウンロード

nkf207.tar.gzをダウンロードします.

gettext-0.17.tar.gzをダウンロードします.

namazu-2.0.20.tar.gzをダウンロードします.

mecab-perl-0.98.tar.gzをダウンロードします.

インストール

MeCabのインストールについては「[[MacでMeCabを使う>テキスト・マイニング/MacでMeCabを使う」を参照のこと.

nkf

ターミナルでnkf207.tar.gzを展開したディレクトリーに移動して次を実行します.

make
sudo cp nkf /usr/local/bin/
make perl
cd NKF.mod
perl Makefile.PL
make
sudo make install

この時点での最新版はnkf 2.0.9でしたが,Perlモジュールのコンパイルに失敗するのでnkf 2.0.7を使用しています.

gettext

ターミナルでgettext-0.17.tar.gzを展開したディレクトリーに移動して次を実行します.

./configure
make
sudo make install

Namazu

ターミナルでnamazu-2.0.20.tar.gzを展開したディレクトリーに移動します.

まず,File-MMagicをインストールします.

cd File-MMagic
perl Makefile.PL
make
sudo make install
cd ..

つぎに,Namazuをインストールします.

./configure
make
sudo make install

MeCab-Perl

ターミナルでmecab-perl-0.98.tar.gzを展開したディレクトリーに移動し,次を実行します.

perl Makefile.PL
make
sudo make install

使い方

インデックスの作成

インデックスを作成するファイルがdirというディレクトリーにおいてあるとして,次を実行します.

mknmz dir

このとき,空白を含むパスのディレクトリーでは実行できません.

メッセージはEUCで表示されるので,実行する前にターミナルの環境設定の詳細で文字エンコーディングを「日本語(EUC)」にしておきます.

検索

インデックスがindexdirというディレクトリーにおいてあるとして,次を実行します.

manazu term indexdir

メッセージはUTF-8で表示されるので,実行する前にターミナルの環境設定の詳細で文字エンコーディングを「Unicode (UTF-8)」に戻しておきます. ただし,これでも一部は文字化けします.

トップ   編集 凍結解除 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS