taoru's memo

Objective-c,cocos2d,など開発についてのメモ(andoroidも少しだけ)

Ubuntuに形態素解析(ChaSen,Mecab)をインストール

形態素解析も扱いたくなったのでインストール
ChasenMeCab、Igoやら色々あるけれど、

Chasen の方が MeCabより早い(?)
いや、でもMeCabの方が早いって書いてあるし…こことか

もう両方インストールしておく。

$ apt-cache search chasen

で、chasenが含まれるパッケージ検索できるっぽい。

たくさんでるけど、

$ sudo apt-get install chasen

で必要なもの一式はインストールされるようだ。


次、MeCab

$ sudo apt-get install mecab libmecab-dev

mecab(0.97-1)が入った。

辞書データ(utf8の)もいれる

$ sudo apt-get install mecab-ipadic-utf8 mecab-jumandic-utf8

上記Mecabインストールを全部まとめて

$ sudo apt-get -y install mecab libmecab-dev mecab-ipadic-utf8 mecab-jumandic-utf8

でもいいかもしれない。


Mecabを試す

$ echo あなたも私もポッキー | mecab
あなた	名詞,代名詞,一般,*,*,*,あなた,アナタ,アナタ
も	助詞,係助詞,*,*,*,*,も,モ,モ
私	名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ
も	助詞,係助詞,*,*,*,*,も,モ,モ
ポッキー	名詞,一般,*,*,*,*,ポッキー,ポッキー,ポッキー
EOS

おぉ、動いてるぞ。


    • -

※0.97→0.98を頑張ったけどできなかったヨ

どうやらMecabの最新版は(0.98)のようなので、0.97からアップデートしたい。

まず古いverのアンインストール

$ sudo apt-get remove mecab-ipadic-utf8 libmecab-dev mecab

ちょっと心配だが、このまま新しい方をインストールしてみる。

$ wget http://sourceforge.net/projects/mecab/files/mecab/0.98/mecab-0.98.tar.gz
$ tar zxvf mecab-0.98.tar.gz
$ cd mecab-0.98
$ ./configure --enable-utf8-only
$ make
$ sudo make install

http://sites.google.com/site/casualconcj/yutiriti-puroguramu/mecab-ruby-wo-insutoru-suru#TOC-MeCab-Ruby-

こちらに書いてある

ちなみに、OS がインストールされているドライブ以外でこの作業をすると、エラーが出ます。

これね…やっと気がついた。

/home/pubuntu/mecab
なんかに入ろうとしてるからみすってるっぽい。
makefileかどこかを書き換える必要がありそう。

QLOOKアクセス解析