本例分享如何使用spss对数据进行聚类分析。
工具/原料
spss
raw data
建立数据指标及类型并输入数据
1、该步骤笔者已韦蛾拆篮经在《利用spss对数据进行回归分析》中详细分享,具体参见http://jingyan.baidu.com/article/eb9f7b6d8bd2aa869264e877.html
对数据进行无量纲化处理
1、因为数据量纲不同将影响聚类分析的结果,所以在分析之前要对数据进行无量纲化处理,无量纲化处理的方法有很多种,我们可以根据自己的实际需要进行选择。本经验示例较为简单,只需要对有序尺度数据进行无量纲化。对于有序尺度,可以采用数值编码的方式将其转换为间距型。 如:优、良、中、及格、不及格 5 4 3 2 1
2、首选将外语的数据类型改成数值型,然后将各个数据属性值改为“5”,“5”,“4”,“4”,“4”,“2”分别对应之前的优,优,良、良、良和及格。
对数据进行标准化处理
1、指标类型中有“极大型”、“极小型”、“居中型”和“区间型”指标,所以在聚类之前必须对指标的类型进行一致化处理。
2、本例一致化处理见附图。
对数据进行系统聚类分析
1、选择“分析”--》“分类”--》“系统聚类”进入系统聚类设置选项卡。
2、进入选项卡,将标准化后的墙绅褡孛数据作为变量。然后可以在当中选择聚类的各种方式方法及要生成的图标,这里我们勾选上树状图后其他默认。点击确定即可看到spss自动处理输出的结果。
3、根据spss输出的结果进行分析。