Blog::koyhoge – PostgreSQLで日本語全文検索 (文字コードはUTF-8)
NTTの寺本さんがつくられたkakasi tsearch2をベースにして、分ち書き部分をmecabに置き換えたものを先日作ってみました。一応UTF-8でちゃんと動作しているようです。
おお、男は黙ってLIKE ’foo’かと思ったらおれが知らないだけでポスグレでも色々あるんすね。
まとめてみると、
- tsearch2+(kakashi|mecab)—- 形態素解析
- Senna—- 形態素解析
- Rast—- N-gram
という感じでしょうか。MySQLと同じだ。
仕事での事例とかがすごい知りたい!