Blog::koyhoge – PostgreSQLで日本語全文検索 (文字コードはUTF-8)

NTTの寺本さんがつくられたkakasi tsearch2をベースにして、分ち書き部分をmecabに置き換えたものを先日作ってみました。一応UTF-8でちゃんと動作しているようです。

おお、男は黙ってLIKE ’foo’かと思ったらおれが知らないだけでポスグレでも色々あるんすね。
まとめてみると、

  • tsearch2+(kakashi|mecab)—- 形態素解析
  • Senna—- 形態素解析
  • Rast—- N-gram

という感じでしょうか。MySQLと同じだ。
仕事での事例とかがすごい知りたい!

Comments


Option