Spark

2018.08.16

巨大なデータに対して高速に分散処理を行うオープンソースのフレームワーク。インメモリ処理による高速化、「データの格納場所」に関する選択肢の広さ、プログラム手法に関する選択肢の広さ(SQLもサポート)などが特徴。 フォールトトレラントシステムで管理され、複数マシンのクラスタに分散されたデータ項目の読み取り専用多重集合RDD(resilient distributed dataset)のデータ構造を中心とするアプリケーションプログラミングインターフェイスを備えている。

詳しくはこちら

コメントを残す

メールアドレスが公開されることはありません。 *が付いている欄は必須項目です

関連記事

TOPICS

MORE