kiyokaのブログアーカイブ

Archive of old blog posts

平仮名フレーズを辞書として持つのは失敗?

平仮名フレーズ辞書を含めた、[Sekka] 0.9.0をリリースして少し経つが、平仮名フレーズを辞書に持つのは良いことなのかわからなくなってきた。 img

平仮名のフレーズというのはあまりにパターンが多く、やはり普段使うフレーズ全てを辞書に収録するというのは無理がありそう。 平仮名フレーズ辞書の影響で、Sekkaが勝手にユーザの意図しないフレーズに引きこんでしまうという問題が結構ある。 例えば、上の文章に出てきた「ありそう」というフレーズ。 辞書には、「ありそうな」しか入っていないため、

arimsou

と入力すると、

第一候補「ありそうな」
第二候補「ありそう」

となり、ついつい第一候補で確定して見落してしまう。 第二候補に「ありそう」も存在しているのだけど、[Sekka]は第一候補でとりあえず確定するのが基本。 間違いがあれば、後で戻って修正するというユーザ・インタフェースになっているので間違いを見落としやすい。 結果として、ユーザの意図しない文章になってしまうのだ。

対策として、未知語(というか未知フレーズ)を見つけた時点でユーザが簡単に辞書登録できるユーザ・インタフェースを追加するという方法を考えている。 今のSekkaは単語登録処理が重いという課題もあるので、単語の登録頻度が上がれば、それがストレスになる可能性もあるが、長期的に見て、辞書が蓄積されていくと文章入力時のストレスは減る方向になるのでそこはトレードオフだと思う。

うーん。いろいろグダグダ書いたけど、実は日々使ってみて紆余曲折の末、問題が解決できたりするのは非常に楽しい。 これが自分でユーザ・インタフェース込みの日本語入力システムを作る楽しさなんじゃないかと思うのだ。 なんというか自分を発見するというか、使いやすいユーザ・インタフェースはどんなものかというような。 一緒に実験に参加させられているユーザはたまったものではないが(笑) そんなタイミングでSKKに戻っていったりするんだろうな〜(笑)


コメント by Auth:
Just the type of isnghit we need to fire up the debate.