Ubuntuに形態素解析(ChaSen,Mecab)をインストール
形態素解析も扱いたくなったのでインストール
Chasen、MeCab、Igoやら色々あるけれど、
Chasen の方が MeCabより早い(?)
いや、でもMeCabの方が早いって書いてあるし…こことか
もう両方インストールしておく。
$ apt-cache search chasen
で、chasenが含まれるパッケージ検索できるっぽい。
たくさんでるけど、
$ sudo apt-get install chasen
で必要なもの一式はインストールされるようだ。
次、MeCab
$ sudo apt-get install mecab libmecab-dev
mecab(0.97-1)が入った。
辞書データ(utf8の)もいれる
$ sudo apt-get install mecab-ipadic-utf8 mecab-jumandic-utf8
上記Mecabインストールを全部まとめて
$ sudo apt-get -y install mecab libmecab-dev mecab-ipadic-utf8 mecab-jumandic-utf8
でもいいかもしれない。
Mecabを試す
$ echo あなたも私もポッキー | mecab あなた 名詞,代名詞,一般,*,*,*,あなた,アナタ,アナタ も 助詞,係助詞,*,*,*,*,も,モ,モ 私 名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ も 助詞,係助詞,*,*,*,*,も,モ,モ ポッキー 名詞,一般,*,*,*,*,ポッキー,ポッキー,ポッキー EOS
おぉ、動いてるぞ。
-
- -
※0.97→0.98を頑張ったけどできなかったヨ
どうやらMecabの最新版は(0.98)のようなので、0.97からアップデートしたい。
まず古いverのアンインストール
$ sudo apt-get remove mecab-ipadic-utf8 libmecab-dev mecab
ちょっと心配だが、このまま新しい方をインストールしてみる。
$ wget http://sourceforge.net/projects/mecab/files/mecab/0.98/mecab-0.98.tar.gz $ tar zxvf mecab-0.98.tar.gz $ cd mecab-0.98 $ ./configure --enable-utf8-only $ make $ sudo make install
http://sites.google.com/site/casualconcj/yutiriti-puroguramu/mecab-ruby-wo-insutoru-suru#TOC-MeCab-Ruby-
↑
こちらに書いてある
ちなみに、OS がインストールされているドライブ以外でこの作業をすると、エラーが出ます。
これね…やっと気がついた。
/home/pubuntu/mecab
なんかに入ろうとしてるからみすってるっぽい。
makefileかどこかを書き換える必要がありそう。