Sekka辞書にdistributed-trieを利用する際の最適値を見付けた

2012年04月26日

Sekka辞書にdistributed-trieを利用する際の最適値を見付けた。

先日、曖昧文字列マッチングのindexをtrieにしたが、モッサリした動きになったと書いた。「2012-04-23Sekka*KVS distributed-trieを使って曖昧文字列検索実装してみた感想」

今日はSekka 1.1.0はこれで行けるという最適値を見付けたのでメモしておく。以下の設定でほぼリアルタイム(0.2秒間隔)で変換でき、ユーザー語彙登録中も1秒以内に変換レスポンスが返ってくる。 Sekka 1.0.xよりも少ないメモリ使用量で効率的に動けるようになり、前のように10秒以上レスポンスが返ってこない場面も無くなった。

最適な組みあわせ

KVSはTokyo Cabinetを使う。Redisは不要。
Tokyo Cabinetのキャッシュ設定を256MByteにする。 ( #xmsiz=256m )

やっと、distributed-trieの成果が現れてきたので嬉しい。