一般来说,我们选择线性回归或逻辑回归通常以因变量的数据类型为连欹爸葛端续变量或分类变量作为依据,较少关注自变量的数据类型。但在数据分析中,当因变量为连续变量,自变量为分类变量或等级变量时,如果赶时縻橼直接将自变量纳入回归模型进行研究,则会使变量失去自身的意义,如性别,男性和女性本身没有大小、顺序或趋势的区分。此时,可以采用最佳尺度回归来解决类似问题。下面,我们就来具体谈谈最佳尺度回归的基本内涵及在SPSS中的具体操作步骤。
http://v.youku.com/v_show/id_XMzkyOTkyNjM4NA==.html
工具/原料
一台安装了SPSS的电脑
使用相关的数据
方法/步骤
1、打开SPSS软件,依次点击“分析——回归——最优标度”。
2、出现“分类回归”窗口。
3、将因变量“心率”放入“因变量”窗口,点击“定义标度”,出现“分类回归:定义标度”对话框,勾选“数字”。
4、将所以自变量放入“自变量”窗口,并依次选中“性别”,点击“定义标度”,出现“分类回归:定义标度”对话框,因性别为分类变量,因此勾选“名义”。
5、选中“身高”,点击“定义标度”,出现“分类回归:定义标度”对话框,因身高为连续数值型变量,因此勾选“数字”。
6、其他变量依次完成类似操作。选中“睡眠情况”,点击“定义标度”,出现“分类回归:定义标度”对话框,因睡眠情况为有序变量,因此勾选“有序”。
7、点击“选项”,出现“分类回归:选项”窗口,勾选“多个系统性起点”,并点击“继续”。
8、点击“保存”,出现“分类回归:保存”窗口,勾选“将转换后变量保存到活动数据集”,并点击“继续”。
9、点击“图”,出现“分亿姣灵秀类回归:图”窗口,将名义和有序变量放入右侧“转换图”框中,即将“性别、高血压家族史、是否吸烟、是否饮酒、睡眠情况”放入右侧“转换图”中。
10、首先查看“ANOVA”表,可以看到,构建的回归模型通过了方差检验,显著性值小于0.05,提示至少存在一个自变量对因变量心率有显著影响。
11、查看“模型摘要”表,调整R方值为0.187,解释值较低,符合实际调研情况。
12、查看“系数”釉涑杵抑表,可以看到体重、高血压家族史和睡眠情况都对因变量心率有显著影响,且构建模型所对应的系数值分别为0.4-0.178和-0.365芟坳葩津,反映的是对原始变量量化后的变量变化量。高血压家族史Beta*(无高血压量化值-有高血压量化值)=-0.178*(-0.72-1.40)=0.37736
13、回到数据视图,可以看到,各变量韦蛾拆篮经过最佳尺度变换,对分类或有序变量进行了数值量化后的数据列,各数据轨迹列由左往右,首列为因变量,其靓脘堤窳他列与自变量的顺序一致。结合查看“转换图”,以分类变量高血压家族史为例,其模型对应系数值为-0.178,无高血压对应量化值为-0.72分,有高血压对应量化值为1.40分,则可以得到无高血压与有高血压对心率的影响差值为: