给我的科研朋友们来杯mojito——冬天的第一堂统计课
今天给大家带来第六期刘岭教授的统计说说—卡方检验的具体应用。
好,闲话不多说,开课了。
在上一讲我们谈到“针对常用的基本统计学方法,一般而言说的就是t检验、单因素方差分析和卡方检验,这也是大家在写论文、阅读论文时经常遇到的统计学方法(几乎每篇文章都会涉及到这一种或几种方法)”,今天我们就来说一说这个卡方(χ2)检验。
χ2检验是反应变量和分组变量都为二分类变量或多分类(无序)变量时,分析两变量间关系的方法。
理论基础:χ2检验是以χ2分布为理论依据,用于判断样本的实际频数分布与某种假设或理想的频数分布是否相符的一种差异性检验方法,广泛应用于计数资料的统计分析。概括地说,χ2检验用于推断两个或两个以上分类变量间的独立性,主要用于检验率或构成比之间差异的显著性,以及两事物之间关联的显著性。(有点啰嗦,可略过)。
这一讲我们针对反应变量和分组变量都为二分类变量(即为四格表)的χ2检验。
一一
独立样本比较的卡方检验
对四格表资料而言,其检验目的是推断两个总体的率是否不等。完全随机设计四格表资料的χ2检验的应用条件是:①当样本总例数N≥40,所有理论频数T>5时,计算Pearson χ2值(SPSS软件结果看第一行);②当样本总例数N≥40,有一个理论频数140,可以计算Pearson χ2值(SPSS软件结果表3看第一行)。
(2) 例1的χ2检验表(表3)(此为最重要的表)
表3给出了例1的卡方检验结果,第1行为皮尔逊卡方检验结果,第2行为连续性修正卡方检验结果,第3行为似然比检验结果,第4行为费希尔精确概率法检验结果,第5行为线性关联检验结果。在备注中给出了卡方检验条件判断的信息。
结论:本例没有理论频数小于5的单元格,最小理论频数为15.2。所以,可以读取皮尔逊卡方检验结果。χ2=13.562,P=0.000,两组疗效间差异有统计学意义独立样本t检验spss的步骤,即肝炎灵注射液疗法治疗慢性乙型肝炎疗效优于常规疗法。
报告中卡方检验的表述形式:
肝炎灵注射液组的有效率(85.0%)和常规疗法组的有效率(52.9%)比较,采用卡方检验,差异有统计学意义(χ2=13.562,P=0.000),即肝炎灵注射液疗法治疗慢性乙型肝炎的疗效优于常规疗法。
二
配对样本的卡方检验
例2:有260份血清样品,每份样品一分为二,用两种不同的免疫学检测方法检验类风湿因子,结果如表4所示。试问这两种免疫学检验的结果差异有无统计学意义?
案例分析思考:
1.研究目的:分析两种不同免疫学检测方法(A法和B法)的检出率有无差异;
2.研究设计类型:同一受试对象(样品)一分为二,分别接受两种不同的处理(A法和B法),比较A法与B法的类风湿因子检出率,属于配对设计。
3.行变量:A法检出率属于计数资料(二分类:阳性和阴性);列变量也属于计数资料(二分类:阳性和阴性),形成的交叉表也称四格表(表1红框)
4. χ2检验的应用条件。
具体操作:
1. 数据格式 4行3列(频数变量:血样例数;行变量:A法1=阳性,2=阴性;列变量:B法1=阳性,2=阴性)(图6)
2. 操作步骤
(1) 定义频数变量:略,同例1。
(2) 配对χ2检验
分析(A)→描述统计(E)→交叉表(C)
弹出“交叉表”主对话框(图7)。
►行(O):选入行变量,本例为“A法”。
►列(C):选入列变量,本例为“B法”。
◇ 统计(S):点击“统计(S)”按钮,弹出“交叉表:统计”对话框(图8)。
选定“þ Kappa”和“þ麦克尼马尔(M)”。
点击“继续(C)”回到主对话框,点击“确定”。
3. 主要输出结果及分析
(1)例2的交叉表(列联表)(表5)
表5给出了例2的配对四格表资料。
(2)例5-6的配对四格表资料的χ2检验(表6)
表6给出了例6的配对χ2检验结果。结论:应用二项分布原理,计算双侧精确概率。本例P=0.503,差异无统计学意义,根据现有资料尚不能认为A、B两种检测方法的阳性率有差异。
(3)例2的Kappa系数检验表(表7)
表7给出了例2的配对资料的一致性检验结果,计算了Kappa系数及其P值。结论:κ系数为0.817,P=0.000,说明两种检验方法的吻合度较强。
报告中卡方检验的表述形式:
A法的阳性率180/260(69.23%)和B法的阳性率184/260(70.77%)比较,采用配对卡方检验,差异无统计学意义(P=0.503),根据现有资料尚不能认为A、B两种检测方法的阳性率有差异。采用Kappa检验,:κ系数为0.817独立样本t检验spss的步骤,P=0.000,说明两种检验方法的吻合度较强。
技术总结如下:
1. χ2检验由英国统计学家K.Pearson于1900年提出,以χ2分布为理论依据,常用于分类变量资料的统计推断,是一种应用范围很广的统计方法。
2.四格表的χ2检验主要有两种设计形式:独立样本χ2检验和配对样本χ2检验(或Kappa检验);
3.四格表的χ2检验涉及的资料类型是二分类计数资料;
4.独立样本四格表的χ2检验一定要看一下条件(特别是样本量不大或单格数据很小的时候)。一般来说Fisher确切概率使用场景:①N四格表Fisher确切概率的SPSS软件结果没有卡方值。
5.配对设计和独立样本的设计是不一样的,大家一定要区分开来,就例2的260份血清样品,用两种不同的免疫学检测方法检验类风湿因子,如果采用完全随机设计,得到的表格如下(表5):
对比配对设计的四格表,你们品一下,细品一下,是不是不一样了??!!!
6.配对设计的四格表常用有两种方法(检验目的不一样哦):①麦克尼马尔检验,用于两种方法检出率的比较;②Kappa检验:k系数,为吻合度测量系数,用以检验两观测者或两观测设备之间的吻合程度。取值在-1至+1之间,其值越大,说明吻合度越高。一般来讲,在Kappa系数有统计学意义的前提下(P
好了,最后将四格表的数据分析思路总结如下(图9)。
本节内容采用的是SPSS 23.0版本。
朋友们有不清楚的或者有什么问题欢迎留言哦,我们会请刘岭教授为大家解答,并在下一期公布出来。
撰稿:刘岭
———END———
限 时 特 惠: 本站每日持续更新海量各大内部创业教程,一年会员只需98元,全站资源免费下载 点击网站首页每天更新
站 长 微 信: aiwo51889