MySQLで日本語の全文検索を可能にするTritonnプロジェクト

オープンソースカンファレンス行って思いもよらぬ収穫があったのはTritonnプロジェクト! (`・ω・´)
どんなプロジェクトかというと、MySQLがデフォだと日本語の全文検索できなくていやんな所に、独自パッチを当てて日本語の全文検索出来る用にしちゃおうぜ!といった感じのプロジェクト。
てっきりなんかSQLで独自の関数を使うことで全文検索が〜とかいう物かと思ったら、むわったくの別物でした。


詳しい説明は

を読んでいただいた方が正確かつわかりやすいと思うので割愛しますが、基本的に必要ありそうなのは

  • Tritonnプロジェクトのパッチの当たっているMySQLのインストール
  • Sennaの設定をちょっとだけ意識した Create 文でのテーブル生成
  • 後は普通にデータインサートしてMySQLに組み込まれてる全文検索SQLなげるだけ


な感じだと把握してます。
ポイントは、テーブル生成部分だけちょっと気をつけてやれば、後はInsertとSelect処理を内部でフックしてる形になってる為、ほっとんど何も意識しなくとも日本語での全文検索が出来る事。
しかも、パフォーマンスとかの話も伺ったんですが普通に早い!
パフォーマンスの話は

に詳しく載ってますが、これは相当ありなスピードだと思いました、本気で (`・ω・´)


そしてTritonnのページ見てたら、僕が色々お話伺った方は id:mir さんっぽい・・・ m(_ _)m
歌詞検索サイト作るとしたらーとか、.sen.i ファイルって容量どの程度になります?とか、InsertとSelect部分でフックしてるというお話を伺ったり、ミニセミナーの後にもサポートするMySQLのバージョンはどれですか? とかとか質問攻めにしてしまったのにも関わらず快く色々と教えて下さって有り難う御座いましたー!