问题:请教协方差分析调整协变量后,只看到了标准误,找不到标准差,怎么能得到调整以后的标准差,试过不同软件如SPSS、SAS都是如此,谢谢老师。
答案:在回答这个问题之前,首先应看看协方差分析的定义,协方差分析(analysis of covariance, ANCOVA/ MANCOVA)是把线性回归(linear regression)与方差分析(analysis of variance, ANOVA/ MANOVA)结合起来应用的一种方法,其目的是要把与因变量y值呈线性关系的自变量(independent variable)x值调整成相等以扣除其影响后,用于检验两个或多个校正平均值间有无差别的方法。通过协方差分析,能够校正和对比由于各组x值的不同所引起的偏倚,更恰当地评价各种处理的优劣。
从定义可见,这个方法更像线性回归计算标准差,即包含了连续自变量(协变量)和分组自变量(因子)的线性回归方法。经笔者测试计算标准差,不光SAS、SPSS的结果是均值的标准误,连Minitab也是。
下图为SPSS的结果(第142页):
下面用本公众号新书第178页中一个例子来解释一下(插入一个广告,下图为新书的封面,即将上架,请认准这个封面,其目录可查看:)
〖例7-27〗 为比较两个处理—缓慢释放的肥料(S)和快速释放的肥料(F),与对照(C)的一种标准的肥料对于花生米产量(克)的效应。每个处理有10次重复,试验在室温中进行。在开始试验时,研究者认识到这30株花生的健康水平与成长水平并不完全相同。因此,研究者在试验开始前记录下每株的高度(厘米)作为衡量植物健康与成长水平的标准。试进行协方差分析,问两个处理对花生的产量有无影响。(花生产量.MTW)
进行协方差分析后得到如下结果
【结果1】一般线性模型拟合了不同肥料的回归方程,从方程的常量可见,花生高度固定的情况下,缓慢释放组的产量最高,对照组次之,快速释放组最低。高度的回归系数(0.05581)为正值,可认为花生的高度越高,产量越高。
★结果得到三种不同肥料花生产量回归方程:
【结果2】扣除协变量影响后(校正高度=49.90cm),对照组、缓慢释放组和快速释放组的花生产量的最小二乘均值分别为12.31、15.89和9.17。如要进一步比较不同肥料组和对照组的差别,可进行均值的多重比较,详见例7-32。
★可见,最终调整平均值是将协变量(花生高度为49.90cm)分别代入上面的三个方程所得到的估计平均值。因此,估计平均值相当于因变量总体平均值的拟合值或预测值,并非根据实际测量数据计算的算术平均值,此时是不能计算标准差的,只能计算平均值的标准误。
至于平均值的标准误的定义,可参阅本公众号文章《统计基础:拟合值的标准误 (SE Fit)》。
拟合值的标准误 (SE Fit)
估计一组给定的预测变量值、因子水平或分量的估计平均响应中的变异,并用于生成预测的置信区间。标准误越小,估计的平均响应越精确。
例如,交货时间回归模型预测,特定的预测变量值组合(优先出货、中箱、500 英里)产生的预测(拟合)平均交货时间为 3.80 天,SE 拟合值为 0.08 天。
SE 拟合值可以与拟合值一起,用于创建此预测变量设置组合的预测平均响应的置信区间。例如,根据样本数量,95% 的预测置信区间将从预测均值向外展开大约 +/- 两个 SE 拟合值。对于此示例,预测平均响应的 95% 置信区间为 (3.64, 3.96) 天。总体均值落于此范围内的置信度为 95%。
本文主要内容摘自本公众号编著的《Minitab 统计分析方法及应用(第2版)》第178-179页。
统计咨询请扫下方的二维码
———END———
限 时 特 惠: 本站每日持续更新海量各大内部创业教程,一年会员只需98元,全站资源免费下载 点击网站首页每天更新
站 长 微 信: aiwo51889