『Hadoop徹底入門 第2版 オープンソース分散処理環境の構築』(太田 一樹,岩崎 正剛,猿田 浩輔,下垣 徹・著、翔泳社・出版)

2019.08.05

好評だった『Hadoop徹底入門』の第2弾。
Hadoopは、多数のコンピュータを束ねて極めて大きな処理ができるオープンソースの分散処理フレームワークで、多数のPCをつなぎ巨大な処理を短時間で可能にする。MapReduceというJavaフレームワークでプログラミングできるほか、標準入出力が使えるHadoopStreaming、フロー記述環境Pig、SQL風インターフェイスであるHiveなど多彩な環境を備えている。行指向DBのHBaseやログコレクタのFluentdの基盤としても利用できるなど、Hadoopには高い汎用性がある。また、システムの一部が壊れたとしても稼動し続けられるなど、高い耐障害性をもつことでも注目されている。
本書では、CDH 4ディストリビューション(=システムの現場で多く利用されている)を軸として、より現場での利用を意識したノウハウ(Hadoopの拡張や監視、メンテナンス方法など)をまとめた。分散キーバリューストアのHBaseの導入や、ログコレクタのFluentdとHDFSとの連携方法など、多くの最新トピックも盛り込み、初心者から実際にHadoopを使っている人までご利用いただける内容となっている。

【目次】
第1部 Hadoopの基礎
1 Hadoopの基礎知識
2 MapReduceアプリケーションの活用例
3 Hadoop の導入
4 HDFS(Hadoop Distributed File System)
5 MapReduceフレームワーク
6 Hadoopアプリケーションを動かす
7 Hadoopクラスタの構築
第2部 MapReduceアプリケーション開発
8 MapReduceプログラミングの基礎 -Javaによる開発(1)-
9 MapReduceプログラミングの応用 -Javaによる開発(2)-
10 MapReduce開発Tips -Javaによる開発(3)-
11 HadoopStreaming
12 データフロー型処理言語Pig
13 SQLライクインターフェイスHive
第3部 Hadoopクラスタの構築と運用
14 環境構築の効率化
15 可用性の向上
16 クラスタのモニタリング
17 クラスタのメンテナンス
18 複数のユーザーによるリソース制御
第4部 Hadoopを活用するための技術
19 Hadoopチューニング
20 分散型データベース HBase
21 Fluentdログコレクタ
22 YARN

詳しくはこちら

コメントを残す

メールアドレスが公開されることはありません。 *が付いている欄は必須項目です

関連記事

TOPICS

MORE