NTTソフトウェアで行われた 第4回Jubatus 分散ハンズオンに参加してきました。
近年携帯の位置情報、カーナビの位置情報、スパム判定、広告配信などデータは爆発している。リアルタイムに分析する需要も大きくなってきている。Jubatusリアルタイムに学習・処理する基盤として利用できる。
説明資料を見返していると、ストリーム、クラスタとでてきていますが、リアルタイム分析の点からKinesisに似ている印象。
本日(ていうか昨日になっていますが)ハンズオンの流れは以下となっています。
- AWSアカウントの設定
- インスタンス生成×5
ここまで、AWSの環境設定でした。
- 単独構成で衛星の情報(CSV)をJubatusで処理する
- 分散構成で同じ情報をJubuatusで処理する
Jubuatusの今回の説明資料は以下で公開されています。
http://download.jubat.us/event/handson_04/jubatushandson4.pdf