読み方 : クラスタリング
正式名称 : Clustering
クラスタリングとは、特定のルールに基づいていくつかのグループ(クラスタ)に分類しグループ化する操作や仕組みのことです。
IT分野では、複数のコンピューターを結合したシステムを指し、「クラスタシステム」または「クラスタコンピューティング」と呼び、処理能力の集約と高い可用性を実現します。このシステムでは、各コンピューターを「ノード」、ネットワークを「インターコネクト」と呼び、一部にトラブルが発生しても、コンピューターシステム全体が処理を継続できるため、災害時等の事業継続計画 (BCP) に役立ちます。
一方、データ解析では、機械学習の一種であり、データ間の類似度に基づいてデータをグループ分けしていく手法のことで「データクラスタリング」「クラスター分析」とも呼ばれます。
この機械学習は、事前にラベル付けされていないデータから潜在的なパターンや構造を抽出する技術です。例えば、顧客の購買行動やネットワークの異常検知、商品のおすすめ表示などに活用され、企業の効率的な戦略立案や意思決定を支援します。