变量聚类使用变量聚亿姣灵秀类可在组最初未知的情况下将变量分组。聚类变量的原因之一是减少它们的数量。此方法可能会产生一些新变量,它们比使用主分量找到的那些变量更加直观易懂。在这里我们假设如下:您醐肛们亲要进行一项研究以确定环境变化对血压的长期影响。对象是39名年龄在21岁以上的秘鲁男性,他们从安第斯山脉迁移到海拔较低的大城镇。您记录了他们的年龄(年龄)、迁移年数(年数)、以千克计的体重(体重)、以毫米计的身高(高度)、以毫米计的下巴、前臂和小腿的皮褶厚度(下颚、前臂、小腿)、以每分钟跳动次数计的脉搏率(脉搏)以及心脏的收缩压和舒张压(心脏收缩、心脏舒张)。您的目标是通过按相似特征合并变量来减少变量的数目。
工具/原料
Minitab17
秘鲁.MTW
方法/步骤
1、在电脑桌面上找到如下图所示红色框处的图标,用鼠标左键双击,打开它。
2、打开软件之后,我们把鼠标移动到文件菜单上,左键单击文件件菜单,然后找到“打开工作表”菜单,左键单击打开它。
3、在寻找范围栏上点击向下按扭,找到Minitab安装目录下的样本数据目录,然后在文件荏半吨蛸名称栏内输入"秘鲁.MTW",左键单击打开按扭
4、左键单击菜单栏选择统计--->多变量--->变量聚类。
5、左键单击在对话框“变量或距离矩阵”中,分别依次输入“年龄-心脏舒张”项目到对话框内;在“联结法”选择对话框中,左键单击下拉菜单选择“平均‘。
6、左键单击选中”显示树状图“选项,勾选”显示树状图选项“,然后左键单击确定。
7、我们得出如下结果:
8、结果解释:下巴、前臂和小腿皮褶厚度的测量撕良滤儆值是相似的,因此您决定合并它们。年龄和迁移后年数这两个变量是相似的,但您将研究此关系。如果对象是在某个特定年龄迁移的,则这些变量可能会包含相似信息芟坳葩津,并且可以合并。重量和两个血压测量值是相似的。您决定将重量作为独立变量保留,但将血压测量值合并为一个。