“Apache Hadoop (アパッチ・ハドゥープ)”

2018.08.16

Apache Hadoop(アパッチ・ハドゥープ)は大規模データの効率的な分散処理を支えるソフトウェア基盤(ミドルウェア)の一つ。Java言語でで書かれており、開発元のアパッチソフトウェア財団(ASF:Apache Software Foundation)がオープンソースソフトウェアとして公開している。
HadoopはApacheのトップレベルプロジェクトの1つであり、世界規模の開発貢献者コミュニティによって開発され、使用されている。
Hadoopはアプリケーションがこれまで困難とされていた数千ノードあるいはペタバイト級の大規模なデータを多数のストレージ装置に分散して保存したり、多数のコンピュータで分散して並列に解析処理を行ったりするためのソフトウェア基盤(フレームワーク)を提供する。
データを解析したい開発者は行いたい処理を記述するだけでよく、データの分配や結果の統合などをHadoopが自動的に行ってくれる。
Apache Hadoopの分散処理を支えているのは、「Hadoop Distributed File System (HDFS)」と「Hadoop MapReduc」という2つのモジュール。
Apache Hadoop導入には(1)可用性の向上に貢献(2)ユーザーは分散処理であることを意識する必要が無い(3)データ量の増大に対してスケールアウトで対応可能(4)低コストでビッグデータ処理を実現などのメリットがある。

詳しくはこちら

コメントを残す

メールアドレスが公開されることはありません。 *が付いている欄は必須項目です

関連記事

TOPICS

MORE