階層クラスター分析のアルゴリズム

階層クラスター分析のためのアルゴリズムは複数存在しますので、実際にはそれらの中からデータの特性に最も相性のよい手法を選んで分析を進めていきます。

ここでは最もシンプルな最短距離法を例に、階層クラスター分析の基本的な考え方を解説します。

右図のように散布図に描くことができるデータを、階層クラスター分析によって分類します。
階層クラスター分析1
図1
まず全てのペア間の距離を求めます。その結果が右です。ここで最も距離が短いものを一番最初に結合します。2と3の距離が最も短いのでこれらを結合して、クラスターとします。
階層クラスター分析2
図2
2と3を結合してクラスターとしました。
階層クラスター分析3
図3
次に2と3のペアを除いて、最も近いペアを探します。1と3です。
階層クラスター分析4
図4
3はすでに2とクラスターを形成しているので、1を2・3のクラスターに組み込みます。1・2・3がクラスターを形成しました。
階層クラスター分析5
図5
ここまでの結合の過程をデンドログラムに表わすと右のようになります。デンドログラムの縦軸は距離となっており、2つのグループが結合した距離のところで線分が結合するようになっています。今回2と3は0.62の距離で、1と2・3グループが、0.65の距離です。
階層クラスター分析6
図6
次に近いペアは7と8なのでこれを結合します。
階層クラスター分析7
図7
クラスターができ、右のようになります。さらに、同様に進めていくと、次には3・4・5が1つのクラスターとしてまとまります。
階層クラスター分析8
図8
4・5・6を結合すると、クラスター分けができています。しかし、階層クラスター分析はデータ全てが一つのクラスターとなるまで続けます。
階層クラスター分析9
図9
すでに同じクラスターになっているペア間の距離(表のグレーの部分)は除いて、最も近いペアは4と8です。よって、4を含む4・5・6のクラスターと、8を含む7・8のクラスターが結合します。
階層クラスター分析10
図10
次のステップで、1・2・3が4~8のクラスターに組み込まれ、階層クラスター分析は終了です。このような形で、全てのデータが一つのクラスターとしてまとまるまで結合を繰り返します。
階層クラスター分析11
図11
階層クラスター分析12
図12

最終的なデンドログラムは以上のようになります。

お客さまの課題・ニーズを伺って
リサーチの企画・提案を行います。
各種資料・調査レポートのダウンロードもこちらから

関連コンテンツ

Myリサーチページログイン

ID

パスワード