『ビッグデータ テクノロジー完全ガイド』(Michael Manoochehri・著、小林 啓倫・翻訳、マイナビ・出版)

2019.08.13

Google Cloud Platformチームに所属したデータハッカーである著者が、ビッグデータの分析システムを構築するためのツールやテクニック、ポイントについて、実践的にアドバイスする。
ビッグデータ・システムを成功させるためのガイドラインや、NoSQLや分散コンピューティング、CAP定理の基礎知識解説から始まり、HadoopやHiveを使った大規模な分析や、BigQueryを使ったリアルタイム分析の基礎にも触れる。さらには、MapReduceパイプラインやPig、Cascading、Mahoutを使った機械学習といった、より高度なトピックについてもカバー。最終的にはPythonとRを組み合わせたビッグデータを処理するツールチェーンの構築について解説する。
それぞれの解説と共にツール類を理解するのに役立つサンプルも収録し、ビッグデータの主要な課題に対して複数のテクノロジーを効率的に組み合わせ、コストを低く抑えるための最良の選択肢について伝授していく。
【目次】
第1章 データで成功するための4つのルール
第2章 テラバイト級ローデータの保管と共有
第3章 データ収集ウェブアプリをNoSQLベースで開発する
第4章 データのサイロ化に対抗する戦略
第5章  Hadoop, Hive, Sharkを利用して大規模なデータセットを分析する
第6章 BigQueryを利用してデータダッシュボードを構築する
第7章 大量データ分析におけるビジュアル化の戦略
第8章 処理を統合する― MapReduceデータパイプライン
第9章  PigとCascadingでデータ変換ワークフローを構築する
第10章 Mahoutを利用してデータ分類システムを構築する
第11章 Rで大量データを分析する
第12章  PythonとPandasを利用して分析ワーク
第13章 開発・購入・アウトソースの判断
第14章 未来を考える― データ技術のトレンド

詳しくはこちら

コメントを残す

メールアドレスが公開されることはありません。 *が付いている欄は必須項目です

関連記事

TOPICS

MORE