kiyokaのブログアーカイブ

Archive of old blog posts

Sekka辞書にdistributed-trieを利用する際の最適値を見付けた

Sekka辞書にdistributed-trieを利用する際の最適値を見付けた。

先日、曖昧文字列マッチングのindexをtrieにしたが、モッサリした動きになったと書いた。 「2012-04-23Sekka*KVS distributed-trieを使って曖昧文字列検索実装してみた感想」

今日はSekka 1.1.0はこれで行けるという最適値を見付けたのでメモしておく。 以下の設定でほぼリアルタイム(0.2秒間隔)で変換でき、ユーザー語彙登録中も1秒以内に変換レスポンスが返ってくる。 Sekka 1.0.xよりも少ないメモリ使用量で効率的に動けるようになり、前のように10秒以上レスポンスが返ってこない場面も無くなった。

最適な組みあわせ

  • KVSはTokyo Cabinetを使う。Redisは不要。
  • Tokyo Cabinetのキャッシュ設定を256MByteにする。 ( #xmsiz=256m )

やっと、distributed-trieの成果が現れてきたので嬉しい。