マクロミル

統計解析・ビジュアライゼーション

多変量解析

クラスター分析

非階層クラスター分析

非階層クラスター分析

非階層クラスター分析のアルゴリズム

非階層クラスター分析のための手法は複数存在します。ここでは最もポピュラーな手法であり、マクロミルでも採用しているk-means法のアルゴリズムを紹介します。

ある集団を、身長と体重という2つの変数を基準にして、3つのクラスターにk-means法で分類します。

使用するデータは図1にプロットされています。非階層クラスター分析では、まず事前に分割したいクラスター数を入力する必要があります。

分割したいクラスター数を入力

図1

今回のクラスター数は3です。サンプルの中から分割したいクラスター数と同じ、3つのサンプルをランダムに選び出して水色で表示しました。この3つのサンプルはシード（seed=種）といい、それぞれのサンプルと3つのシードに対する距離を計算して、最も近いシードを求めます。そして、仮に、それぞれのサンプルを最も近いシードと同じクラスターに属すると決めます。

各サンプルとランダムに選び出した3つのシードに対する距離を計算して、最も近いシードを求める

図2

このようにオレンジ、水色、黄色の3つのクラスターを仮につくることができます。しかし、これでは明らかにクラスター分けされているとはいえません。非階層クラスター分析の目的は、同じクラスターの中に属するサンプルはなるべく似通っているように、異なるクラスターに属するサンプル間ではなるべく違いがはっきりするようにすることです。

オレンジ、水色、黄色の3つのクラスターを仮につくる

図3

そこで、3つのクラスターの重心をそれぞれ求めます。重心は、各クラスターの平均値をもとに算出します。オレンジのクラスターの重心をもとめるには、オレンジのクラスターの平均体重・平均身長をもとめます。3つのクラスターからもとめられた重心をひし形で表しました。

3つのクラスターの重心をそれぞれ求める

図4

次にこの重心を新しいシードとして、最初と同様にそれぞれのサンプルを最も近いシードと同じクラスターに属するよう、仮にクラスター分けします。2度目のクラスター分けの結果を示しました。オレンジのクラスターの2つが水色に、水色のクラスターのうちの1つが黄色のクラスターに移動しました。

重心を新しいシードとして、それぞれのサンプルを最も近いシードと同じクラスターに属するよう、仮にクラスター分け

図5

前ステップでもとめた新しいクラスターをもとに、新しい重心を求め、クラスター分けをし直しています。前ステップで図の上の方にあるサンプルを失ったオレンジのクラスターの重心が多少下方向に移動し、そのためさらにもう1つのサンプルを水色のクラスターに取られていることがわかります。

新しい重心を求め、クラスター分けをし直す

図6

また同じことを行ないます。水色のクラスターがオレンジのクラスターから左方向のサンプルを獲得したため、重心が左に移動し、黄色との境界線上のサンプルを失いはじめました。

新しい重心を求め、クラスター分けを繰り返す

図7

水色の重心がさらに右側へ移動し、もう1つのサンプルを黄色のクラスターに取られました。この時点できれいに分かれているように見えますが、実際いままで繰り返したステップをこれ以降何度繰り返しても、これ以上クラスターに変化はありません。

これ以上クラスターに変化がない時点までクラスター分けを繰り返す

図8

このように、重心をもとめ、クラスタリングをしなおすという手法を繰り返せなくなるまで続けることがk-means法の考え方です。

重心をもとめ、クラスタリングをしなおすというk-means法の考え方に基づくクラスター分け結果

図9

より深く知りたい方はこちら（関連リンク）

クラスター分析＞＞

階層クラスター分析＞＞

関連コンテンツ

2023年大人に人気のキャラクターランキング！男性の推し1位は映画大ヒット中の「ドラえもん」、女性の推し1位は「スヌーピー」

Twitterで話題になったり、「推し活」として応援されたりと、何かと話題になる「キャラクター」たち。世代を超…

時事・社会
エンターテインメント・サービス

ダウンロード

アンケート結果を分析する方法｜集計方法や分析の種類、実施する手順などを解説

アンケートを実施して得たデータは、分析してはじめて役立つものになります。知りたいデータに応じて適切な分析手法を…

エントリーコラム

コラム

クッキーレスとは？クッキーがマーケティング施策に及ぼす影響と対策を解説

インターネットの普及により生まれたクッキーという仕組みは、企業のマーケティング戦略に大きく貢献しています。この…

エントリーコラム

コラム

募集中のセミナー

動画配信

“本当の広告効果”測れていますか？広告効果測定の基礎から、実践に必要なアプローチの方法を徹底解説

#学習

動画配信

カテゴリーエントリーポイント

新しい市場を見つけるカテゴリーエントリーポイント調査

#学習

動画配信

マーケティングリサーチ基礎インタビュー調査編

マーケティングリサーチ基礎講座（インタビュー調査編）

#学習

生放送

【画像】インド市場開拓のためのカラーマーケティング

インド市場開拓のためのカラーマーケティング

#トレンド

動画配信

【画像】BtoBマーケティングリサーチ基礎講座・定量調査編

BtoBマーケティングリサーチ基礎講座・定量調査編 BtoB特有の購買プロセス、調査票設計からデータ活用まで体系的に解説

#学習

生放送

なぜ、あなたの企画は「無難」になってしまうのか？フレームワーク×データで「売れるコンセプト」を作る３ステップ

#学習

動画配信

マーケティングリサーチ基礎講座統計多変量編

有意差・サンプルサイズの考え方から、相関分析・回帰分析・クラスタ分析まで一挙解説！マーケティングリサーチ基礎講座 <統計・多変量解析編>

#学習

動画配信

マーケティングリサーチ基礎講座

#学習

もっと見る

その他のサービス

オンラインリサーチ
オフラインリサーチ
セルフ型アンケート
海外調査
デジタル&データマーケティング
コンサルティング
マーケティングプロモーション
ヘルスケアマーケティング

おすすめコンテンツ

メールマガジン

マーケティングに関するホットな話題やセミナーなどの最新情報をお届けします