Apache Mahout(アパッチ・マハウト)

2018.08.16

Apache Mahout(マハウト)は、Apache Software Foundation(ASF)が公開している機械学習アルゴリズムのオープンソース・プロジェクト。
Apache ライセンスの下、無料で使用できるスケーラブルな機械学習アルゴリズムを作成することが基本的な目標であり、協調フィルタリングやクラスタリング、クラス分類に特化されたスケーラブルなアルゴリズムを実装している。
mahout は「象を飼う人」「象を使う人」の意味であり、Mahout プロジェクトが Apache Hadoop (ロゴは黄色い象) を使ってスケーラビリティーとフォルト・トレランスを実現していることに由来する。
大きく分けて3つの機械学習分野(1)「レコメンデーション(Recomendation)」、(2)「クラスタリング(Clustering)」(3)「分類(Classification)」を中心に実装されており、これらは、Hadoopプロジェクトで実装された分散プログラミング用APIである Map-Reduceを使って実装されているため、ビッグデータの分散処理を可能とするApache Hadoopのメリットを活かして、機械学習システムを構築する事が出来るのが特徴。
具体的な機能として用意されているのはK平均法、ファジィK平均法、Canopy、ディリクレ、平均シフトなどのMap-Reduce に対応するクラスタリング実装、分散型と補完型の単純ベイズ分類器、進化的プログラミングに使用する分散型適応度関数、行列とベクトルに関するライブラリなど。

詳しくはこちら

コメントを残す

メールアドレスが公開されることはありません。 *が付いている欄は必須項目です

関連記事

TOPICS

MORE