多変量解析・機械学習の実装に便利な言語・ソフトやサンプルスクリプト、解析例を紹介します。
ヨーロッパ諸国の食料消費
※John Burkardt氏(フロリダ州立大学)のサイトのHARTIGAN Clustering Algorithm Datasetsにある"European foods"(file45.txt)をR入力用に整形して使用
※整形後のファイルはこちら。データはいくつかの食料品について、家庭での保有率(%)を示す(詳細は元データ参照)。
※データのオリジナルの出典は、John Hartigan,Clustering Algorithms,Wiley, 1975
cldata <- read.csv("efoods.csv", header=TRUE,
row.names=1) #食料のデータ読み込み cldis <- dist(cldata) #ユークリッド距離を計算 cl=hclust(d=cldis, method="ward.D2") #Ward法でクラスタリング plot(cl) #デンドログラムを表示 |