テキスト・マイニング/MacでMeCabを使う
をテンプレートにして作成
開始行:
*はじめに [#j3720ff8]
「[[MeCab:http://mecab.sourceforge.net/]]」は京都大学とNT...
「すもももももももものうち」という文を「すもも/も/もも/も...
Mac OS X 10.9とMeCab 0.996とNAIST-jdic 0.6.3b-20111013で...
*必要なもの [#z87110e9]
-辞書
-make
-gcc
MeCabには辞書が付いていません——というか,自分...
一般的な辞書で構わない人は,MaCabと一緒に配布されている辞...
ここでは,MeCabのサイトで推奨されている「IPA辞書」の後継...
makeとgccはXcodeに含まれています.
Mac OS X Snow LeopardのインストールDVDの「オプション・イ...
*ダウンロード [#y15cdf49]
-MeCab: Yet Another Part-of-Speech and Morphological Anal...
http://mecab.sourceforge.net/
mecab-0.996.tar.gzをダウンロードします.
-NAIST Japanese Dictionary~
http://sourceforge.jp/projects/naist-jdic/wiki/FrontPage
mecab-naist-jdic-0.6.3b-20111013.tar.gzをダウンロードしま...
*インストール [#u71281a1]
**MeCab [#ta6f47da]
mecab-0.996.tar.gzをダブル・クリックして展開し,ターミナ...
文字コードをUTF-8と指定し,コンパイルします.
#geshi(bash){{
./configure --enable-utf8-only
make
make check
sudo make install
}}
**NAIST-jdic [#o2ccf167]
mecab-naist-jdic-0.6.3b-20111013.tar.gzをダブル・クリック...
文字コードをUTF-8と指定し,コンパイルします.
#geshi(bash){{
./configure --with-charset=utf-8
make
sudo make install
}}
辞書を指定するため,/usr/local/etc/mecabrcファイルの
#geshi(Make){{
dicdir = /usr/local/lib/mecab/dic/ipadic
}}
という行を
#geshi(Make){{
dicdir = /usr/local/lib/mecab/dic/naist-jdic
}}
に変更します.
*使い方 [#hf3fd640]
MeCabを実行し,標準入力に解析したいテキストを入力してCtrl...
#geshi(bash){{
/usr/local/bin/mecab
すもももももももものうち
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ,,
も 助詞,係助詞,*,*,*,*,も,モ,モ,,
もも 名詞,一般,*,*,*,*,もも,モモ,モモ,,
も 助詞,係助詞,*,*,*,*,も,モ,モ,,
もも 名詞,一般,*,*,*,*,もも,モモ,モモ,,
の 助詞,連体化,*,*,*,*,の,ノ,ノ,,
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ,,
EOS
}}
テキスト・ファイルを引数として実行することもできます.
*参考情報 [#g56b438c]
-[[IPADIC(IPA辞書)とはなにものか? - ぱらめでぃうす:htt...
終了行:
*はじめに [#j3720ff8]
「[[MeCab:http://mecab.sourceforge.net/]]」は京都大学とNT...
「すもももももももものうち」という文を「すもも/も/もも/も...
Mac OS X 10.9とMeCab 0.996とNAIST-jdic 0.6.3b-20111013で...
*必要なもの [#z87110e9]
-辞書
-make
-gcc
MeCabには辞書が付いていません——というか,自分...
一般的な辞書で構わない人は,MaCabと一緒に配布されている辞...
ここでは,MeCabのサイトで推奨されている「IPA辞書」の後継...
makeとgccはXcodeに含まれています.
Mac OS X Snow LeopardのインストールDVDの「オプション・イ...
*ダウンロード [#y15cdf49]
-MeCab: Yet Another Part-of-Speech and Morphological Anal...
http://mecab.sourceforge.net/
mecab-0.996.tar.gzをダウンロードします.
-NAIST Japanese Dictionary~
http://sourceforge.jp/projects/naist-jdic/wiki/FrontPage
mecab-naist-jdic-0.6.3b-20111013.tar.gzをダウンロードしま...
*インストール [#u71281a1]
**MeCab [#ta6f47da]
mecab-0.996.tar.gzをダブル・クリックして展開し,ターミナ...
文字コードをUTF-8と指定し,コンパイルします.
#geshi(bash){{
./configure --enable-utf8-only
make
make check
sudo make install
}}
**NAIST-jdic [#o2ccf167]
mecab-naist-jdic-0.6.3b-20111013.tar.gzをダブル・クリック...
文字コードをUTF-8と指定し,コンパイルします.
#geshi(bash){{
./configure --with-charset=utf-8
make
sudo make install
}}
辞書を指定するため,/usr/local/etc/mecabrcファイルの
#geshi(Make){{
dicdir = /usr/local/lib/mecab/dic/ipadic
}}
という行を
#geshi(Make){{
dicdir = /usr/local/lib/mecab/dic/naist-jdic
}}
に変更します.
*使い方 [#hf3fd640]
MeCabを実行し,標準入力に解析したいテキストを入力してCtrl...
#geshi(bash){{
/usr/local/bin/mecab
すもももももももものうち
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ,,
も 助詞,係助詞,*,*,*,*,も,モ,モ,,
もも 名詞,一般,*,*,*,*,もも,モモ,モモ,,
も 助詞,係助詞,*,*,*,*,も,モ,モ,,
もも 名詞,一般,*,*,*,*,もも,モモ,モモ,,
の 助詞,連体化,*,*,*,*,の,ノ,ノ,,
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ,,
EOS
}}
テキスト・ファイルを引数として実行することもできます.
*参考情報 [#g56b438c]
-[[IPADIC(IPA辞書)とはなにものか? - ぱらめでぃうす:htt...
ページ名: