1 / 4
为什么用 χ
2
进行独立性检验?
——基于“独立性检验”教学的一些反思
王泽扬
(江苏省南京市金陵中学 210005)
在新一轮的课程改革中,原先部分江苏省不考、不教的内容,现在重新回到了广大师生
的面前,例如高中数学选修 2-3 教科书的第三章统计案例.在江苏 2008 年至 2020 年间的
高考改革试点中,高考不考察独立性检验的有关内容,导致这称为部分教师的知识“盲区”.
概念教学是高中数学教学中最重要的一环,作为新一轮课程改革中变化最多的一部分,
概率与统计是对教师们挑战最大的.如何在核心素养的指导下,让学生能够真正厘清知识的
来龙去脉,建立起知识的关联?
一、独立性检验的来龙去脉
独立性检验是分布的拟合检验的一种.分布的拟合检验是对总体分布的形式建立假设并
进行检验的过程.生物学中,有一个很著名的例子:19 世纪,孟德尔(Mendel)按颜色与形状
把豌豆分为四类:黄色圆粒、绿色圆粒、黄色皱粒与绿色皱粒.孟德尔根据遗传学原理判断这
四类的比例应为 9:3:3:1.为了进行验证,孟德尔在一次豌豆实验中随机收获了 n=566
个豌豆,其中这四类豌豆的个数分别为 315,108,101,32.该数据是否与孟德尔提出的比
例吻合?
这一例子是属于分类数据的检验问题,它的一般情形为:根据某项指标,总体被分为 r
类:A
1
,…,A
r
,此时我们最关心的是关于各类元素在总体中所占的比率的假设
H
0
:A
i
所占的比率是 p
i0
,i=1,2,…,r, (*)
其中 p
i0
已知,满足
i
=
1
r
∑p
i0
=1.
解决这一问题的根本,是弄清实验所得的观测值数据与理论上的预期值之间的差距究竟
有多大。要这一差距多大才算大?1900 年,英国数学家 K·皮尔逊(Karl Pearson)提出用统计
量
χ
2
=
类型
∑
(观测值-预期值)
2
预期值
(**)
来衡量观测值与估计值间的差异
[2]
.
(**)式提供了实际观测值与理论估计值接近程度的一个度量.当原假设 H
0
为真时,它
的值应该比较小,所以其拒绝域为{χ
2
≥c},其中 c 为待定的临界值.为了控制上述检验的第
一类错误,我们必须知道此检验统计量在原假设成立下的分布.K·皮尔逊已经证明:在各项
假设 H
0
成立时,对(**)的检验统计量 χ
2
按分布收敛于 χ
2
(r-1),其自由度为 r-1.因此,对
于假设(*),我们可以采用如下的显著性水平近似为 α 的显著性检验:检验统计量如(**)所示,
拒绝域为
W={χ
2
≥χ
1
-
α
2
(r-1)}
[2]
.
回到高中教学,课程标准要求,通过实例,理解 2×2 列联表的统计意义,了解 2×2 列
联表独立性检验及其应用
[1]
.在教学过程中,我们仅限于 2×2 列联表的独立性检验,掌握
运用 2×2 列联表的方法,解决独立性检验的简单实际问题.即便如此,对于学生而言,独
立性检验的完成流程还是难于理解的.
二、教学设计
教材分析与学情分析。《独立性检验》是苏教版普通高中教科书(实验)高中数学选修 2
-3 第三章的第 1 节内容.这部分内容是大学的统计学中统计推断的一部分内容,与高中知
本文系南京市教育科学规划第十一期个人课题“中英高中数学教科书中概率统计内容的比较研究”(市
规划个十一字第 0c3000 号)的阶段性研究成果.
本文发表于《全国优秀作文选·教师教育》2021(05).