kiyokaのブログアーカイブ

Archive of old blog posts

Hadoop本を読む

Hadoop

著者: Tom White, 玉川 竜司, 兼田 聖士

翻訳者の玉川さんにいただいた本。 まだ全部読んでいない。 結構、分厚い本だ。 ある程度読み進んでは、実際に動かしてみてという繰返しで学習しないと、MapperとReducerの作りかたがパッと思い浮かぶまでにはならなさそう。 実際に、14章のケーススタディを読みながら手を動かして実験するのが学習が早そうに感じた。

個人でHadoopを使ってまで実験をしてみたいプロジェクトは無いけれども、そのうち仕事で使う日が来るのかも知れない。 プライベートで自然言語処理の実験をやるとすれば、1台のStandalone構成のHadoopで慣れておくというのも先行技術としてはありかな…? プライベートなプロジェクトであっても、お金をかける気さえあれば、Amazon EC2で数十インスタンス起動してみれる時代になったのは感慨深い。 [Sumibi.org]のような、楽しそうなプロジェクトに手をつける機会が有れば、一度は分散で統計処理を経験しておきたい。 その時にまた読み返そう。