kiyokaのブログアーカイブ

Archive of old blog posts

『パターン認識と学習の統計学―新しい概念と手法』を読む

『パターン認識と学習の統計学―新しい概念と手法』を読む

実際はゴールデンウィークにマーケティングの本といっしょに読みましたが、今頃書いています。 結論からいうと今開発中のSumibiの役に立ちそうなアイデア・手法は載っていませんでした。 この本に書いてある内容は、主に『学習データが少ない場合にどうやってパターン認識の性能を上げるか』ということに重点が置かれています。 一番の収穫は『学習データが沢山ある場合は別段工夫しなくてもある程度性能が出る』という事が分かったことです。 といっても、僕の知らない統計的学習の手法がたくさん紹介されていて面白かったです。 Sumibi の場合は力技アプローチを採用しているので、ある程度、変換性能が出るという事でしょう。 ところで、マーケティングの本と一緒に読むとなんか不思議な感じがします。 一見、共通点が無さそうな気がしますが、実はどちらも人間の無意識を扱うという点で共通点があります。 マーケティングは人間の無意識を解明し、人間の欲しいモノを作るというテーマですし、パターン認識の方は人間が無意識で行っている事を解明し機械にやらせるというのがテーマです。 最近、僕は無意識の解明・最大限の利用というテーマに興味があるようです。

グーグルCEO、同社のプライバシーポリシーを語る

この記事を読んでSumibi.orgも同じ深い問題を抱えているんだなあと改めて思いました。 現在のSumibi.org で提供している辞書は厳選したWebサイトだけを読みこんで作ったものなので良いのですが、今後も気を付けていきたいと思います。 Sumibi.orgのプライバシーポリシーも『邪悪なことはしない(当然)』です。