非階層クラスター分析

非階層クラスター分析のアルゴリズム

非階層クラスター分析のための手法は複数存在します。ここでは最もポピュラーな手法であり、マクロミルでも採用しているk-means法のアルゴリズムを紹介します。

ある集団を、身長と体重という2つの変数を基準にして、3つのクラスターにk-means法で分類します。

使用するデータは図1にプロットされています。非階層クラスター分析では、まず事前に分割したいクラスター数を入力する必要があります。

分割したいクラスター数を入力

図1

今回のクラスター数は3です。サンプルの中から分割したいクラスター数と同じ、3つのサンプルをランダムに選び出して水色で表示しました。この3つのサンプルはシード(seed=種)といい、それぞれのサンプルと3つのシードに対する距離を計算して、最も近いシードを求めます。そして、仮に、それぞれのサンプルを最も近いシードと同じクラスターに属すると決めます。

各サンプルとランダムに選び出した3つのシードに対する距離を計算して、最も近いシードを求める

図2

このようにオレンジ、水色、黄色の3つのクラスターを仮につくることができます。しかし、これでは明らかにクラスター分けされているとはいえません。非階層クラスター分析の目的は、同じクラスターの中に属するサンプルはなるべく似通っているように、異なるクラスターに属するサンプル間ではなるべく違いがはっきりするようにすることです。

オレンジ、水色、黄色の3つのクラスターを仮につくる

図3

そこで、3つのクラスターの重心をそれぞれ求めます。重心は、各クラスターの平均値をもとに算出します。オレンジのクラスターの重心をもとめるには、オレンジのクラスターの平均体重・平均身長をもとめます。3つのクラスターからもとめられた重心をひし形で表しました。

3つのクラスターの重心をそれぞれ求める

図4

次にこの重心を新しいシードとして、最初と同様にそれぞれのサンプルを最も近いシードと同じクラスターに属するよう、仮にクラスター分けします。2度目のクラスター分けの結果を示しました。オレンジのクラスターの2つが水色に、水色のクラスターのうちの1つが黄色のクラスターに移動しました。

重心を新しいシードとして、それぞれのサンプルを最も近いシードと同じクラスターに属するよう、仮にクラスター分け

図5

前ステップでもとめた新しいクラスターをもとに、新しい重心を求め、クラスター分けをし直しています。前ステップで図の上の方にあるサンプルを失ったオレンジのクラスターの重心が多少下方向に移動し、そのためさらにもう1つのサンプルを水色のクラスターに取られていることがわかります。

新しい重心を求め、クラスター分けをし直す

図6

また同じことを行ないます。水色のクラスターがオレンジのクラスターから左方向のサンプルを獲得したため、重心が左に移動し、黄色との境界線上のサンプルを失いはじめました。

新しい重心を求め、クラスター分けを繰り返す

図7

水色の重心がさらに右側へ移動し、もう1つのサンプルを黄色のクラスターに取られました。この時点できれいに分かれているように見えますが、実際いままで繰り返したステップをこれ以降何度繰り返しても、これ以上クラスターに変化はありません。

これ以上クラスターに変化がない時点までクラスター分けを繰り返す

図8

このように、重心をもとめ、クラスタリングをしなおすという手法を繰り返せなくなるまで続けることがk-means法の考え方です。

重心をもとめ、クラスタリングをしなおすというk-means法の考え方に基づくクラスター分け結果

図9

より深く知りたい方はこちら(関連リンク)

クラスター分析 >>

階層クラスター分析 >>

関連コンテンツ

基礎から学べる!「マーケティングリサーチ超入門」その4:マーケティングリサーチの流れ 調査表の作成

社会や市場の激しい変化によって消費者の行動や価値観も多様化する今、マーケティング活動は欠かせないものとなっています。 そこで本記事では、無料お役立ち資料『マーケティングリサーチ超入門』4巻をご紹介いたします。 消費者理解 […]

  • アパレル・ファッション
  • エネルギー・住まい
  • エンターテインメント・サービス
  • ノウハウ
  • ヘルスケア
  • 人材・コンサル
  • 官庁・公共
  • 広告
  • 情報・通信
  • 旅行・観光・運輸
  • 流通・小売・飲食
  • 研究・教育(アカデミック)
  • 自動車・工業
  • 金融・保険
  • 雑貨・化粧品
  • 食品・飲料
市場調査レポート

新成人500名に調査!Z世代とまとめられる風潮に肯定・否定がともに3割。SNS利用率では新登場「BeReal」が躍進!

1月8日は、成人の日。マクロミルでは今年も新成人500名に調査を実施いたしました。 幼い頃からスマートフォンなどのデジタル機器に囲まれて育ったデジタルネイティブ、一般的に「Z世代」と呼ばれる今年の新成人。関心ごとや価値観 […]

  • 時事・社会
  • アパレル・ファッション
  • エンターテインメント・サービス
  • 人材・コンサル
  • 官庁・公共
  • 家電・電機
  • 市場調査レポート
  • 広告
  • 情報・通信
  • 旅行・観光・運輸
  • 流通・小売・飲食
  • 研究・教育(アカデミック)
  • 自動車・工業
  • 金融・保険
  • 雑貨・化粧品
  • 食品・飲料
市場調査レポート

ネットリサーチモニタの投票行動は世の中の縮図となり得るか ~衆議院選2017を振り返って~

マクロミル総合研究所では、所長の萩原雅之を中心に、2017年衆議院選挙において、投票行動に関する調査を実験的に行った。調査対象者は全国の男女18~69歳とし、人口構成比になるように割付して実施した(調査期間2017年10 […]

  • リサーチャーコラム
コラム

募集中のセミナー

オンデマンド

新しい市場を見つけるカテゴリーエントリーポイント調査

  • #学習
  • #今すぐ見られる

オンデマンド

2023年ヒット商品ランキング解説! ~『脱コロナ』の消費者行動の変化~

  • #トレンド
  • #今すぐ見られる

オンデマンド

新規事業を成功に導くマーケティング戦略〜オンライン・オフライン8つの施策と運用術〜

  • #学習
  • #今すぐ見られる

動画配信

グローバルリサーチ基礎講座

  • #学習

動画配信

DX時代の人材育成 データ分析の流れを理解する ~第1回「問いの明確化」と「仮説立案」の重要性~

  • #学習

動画配信

マーケティングリサーチ基礎講座

  • #学習

動画配信

マーケティングリサーチ基礎講座(定性調査編)

  • #学習

動画配信

有意差・サンプルサイズの考え方から、相関分析・回帰分析・クラスタ分析まで一挙解説!マーケティング・リサーチ基礎講座 <統計・多変量解析編>

  • #学習

その他のサービス

  • オンラインリサーチ
  • オフラインリサーチ
  • セルフ型アンケート
  • 海外調査
  • デジタル&データマーケティング
  • コンサルティング
  • マーケティングプロモーション
  • ヘルスケアマーケティング

おすすめコンテンツ

ナレッジブログ

マーケティングリサーチ有識者の見解を知る

コラム

マーケティングの基礎を学ぶ

マーケティング用語集

基礎的な用語を身に付ける

市場調査レポート・お役立ち資料

明日から使えるデータと活用術を手に入れる

メールマガジン

マーケティングに関するホットな話題やセミナーなどの最新情報をお届けします