Rで、サンプルデータ作製して、ヒートマップ表示と、k-medoids (pam) と Afiinity propagation含むいくつかのクラスタリング表示を作る機会がありました。せっかくなので、記載します。今回ようなデータの処理と目的では、k-means のような方法が適していました。DBSCAN などは他をご参考をいただけますようお願いします。ひたすら駆け足で、忘備録程度の内容です。 対象は、50人分、10種類の観測値のサンプルデータです。 目的は、ヒトごと、10種類の観測値ごとのそれぞれのクラスターを見付けることです。 平均値とSD の異なる正規分布で、50人分、10種類の観測値のサンプルデータを作ります。 A1=cbind( matrix(rnorm(50, -1, 1),nc=5), matrix(rnorm(50,0,1),nc=5) ) A2=cbind( matrix(rnorm(30,-0.5,1),nc=3), matrix(rnorm(50,0,2),nc=5), matrix(rnorm(20,-3,1),nc=2) ) A3=cbind( matrix(rnorm(20,0.5,2),nc=2), matrix(rnorm(30,-2,1),nc=3), matrix(rnorm(20,0.2,0.2),nc=2), matrix(rnorm(30,1,1),nc=3) ) A4=cbind( matrix(rnorm(10,2,0.8),nc=1), matrix(rnorm(40,1,0.7),nc=4), matrix(rnorm(10,-0.5,0.1),nc=1), matrix(rnorm(40,0,1),nc=4) ) A5=cbind( matrix(rnorm(10,-0.1,0.2),nc=1), matrix(rnorm(40,-2,1),nc=4), matrix(rnorm(10,2,1),nc=1), matrix(rnorm(40,0.4,1),nc=4) ) M_Example = rbind(A1,A2,A3,A4,A5) データを50人の個人をランダムに並べ変えます。 クラスタライングの為には...