studylog/北の雲

chainer/python/nlp

CaboCha(python)で辞書指定

mecabの辞書はほぼneologdに切り替えて使っているのだけど、久しぶりにCaboChaをpythonから使おうとしたら辞書の指定の仕方がわからなかったのでメモ。

#デフォルト辞書を使う時
cabocha = CaboCha.Parser("") 

#辞書指定する場合はこう(ディレクトリは各々の環境に変えてください)
cabocha = CaboCha.Parser("-d /usr/lib/mecab/dic/mecab-ipadic-neologd")

#解析
tree = cabocha.parse("北海道札幌市中央区")


デフォルト辞書だと
北海道 / 札幌 / 市 / 中央 / 区

neologdだと
北海道 / 札幌市中央区

と辞書を切り替えられていたことを確認。

タイトルと関係はないけれど結果treeのパースはこちらを参考。
shogo82148.github.io

おわり。