1 / 5
§3 .1.2 独立性检验(2) 教学设计
南京市金陵中学 王泽扬
2021 3 9
教学目标:
1基于 2×2 列联表,过对典型案例的探究,解独立性检验的基本思想,掌握独立性检
验的基本步骤,会用独立性检验解决简单的实际问题,提升数据分析能力.
2.经历由实际问题建立数学模型的过程,体会其中的基本方法
教学重点:临界值表的理解、独立性检验的简单应用.
教学难点:对独立性检验的理解、独立性检验的简单应用.
教学过程:
复习回顾
上一节课,我们研究了两个分类变量之间的关系,我们以生活中的一个案例两个现象
患呼吸道疾病与吸烟之间是否有关进行了一些研究.让我们一起来回顾一下:同学们,我们
是怎么研究的?研究了什么呢?
【流程图 1环节 1首先,我们基于科学的手段合理的抽样收集了有关数据,对数据
做了一个统计,并形成了一张 2×2 列联表.
【流程图 2:环节 2根据这些数据,我们想知道:这两个现象患呼吸道疾病与吸烟
间究竟有没有关系呢?我们是如何研究的呢?
我们拿它跟一个理想状态下的情形做一个对比什么是理想状态呢?就是我们的假设 H
0
假设 H
0
:患呼吸道疾病与吸烟没有关系.
在假设两者无关的情况下,我们找到理想状态下的 2×2 列联表的,叫做估计值,我
想知道观测值与估计值之间,到底差距大还是不大,我们找到了用于比较观测值与估计值
间的一个“距离(distance)”这个“距离”最后就是我们找到的最科学的用于两个现象有没
有关系的统计量——χ
2
对于 2×2 列联表,χ
2
的计算公式
χ
2
(a
(ab)(ac)
n
)
2
(ab)(ac)
n
(b
(ab)(bd)
n
)
2
(ab)(bd)
n
(c
(cd)(ac)
n
)
2
(cd)(ac)
n
(d
(cd)(bd)
n
)
2
(cd)(bd)
n
χ
2
n(adbc)
2
(ab)(cd)(ac)(bd)
,其中 nabcd
上一节课我们已经知道,基于抽样的这组实际数据与理想数据之间的距离如果越大,
χ
2
越大,就说明两个现象有关的可能性越大;如果基于抽样的这组实际数据与基于假
独立的这组理想数据,他们之间的“距离”χ
2
越小,那么说明两个现象没有关系,即独立的
可能性更大.
那么究竟有多大的把握说这两个现象有关呢?我们需要进行判断.
我们应该如何判断呢?
下面我们就一起来探讨一下如何做出判断.
设计意图 回顾上节课的内容.由于独立性检验的知识较难理解,所以希望学生回忆上节课
的引例,结合引例,用自己的语言谈一谈对独立性检验的 3 个步骤的理解
下来的学生活动与数学建构,就围绕进行判断而展开.
数学建构
【流程图 3:环 3判断
上节课,我们根据基于抽样的这组实际观测数据,利用 χ
2
的计算公式,得到
2 / 5
χ
2
515×(37×274183×21)
2
220×295×58×457
11.8634 (1)
下面我们要进行判断:这个值是大还是小呢?大家觉得是大还是小?
实际上,在统计学中,就在大约 100 多年前,数学家们已经经历了严密且科学的研究,
得到了明确的结论:
在假设 H
0
成立的条件下,随机事件χ
2
6.635发生的概率约为 0.01,即
P(χ
2
6.635)0.01 (2)
这句话是什么意思呢?
也就是说,在假设 H
0
成立的条件下,对统计量 χ
2
进行多次测量基于抽样所得数据算
出的观测值超 6.635 频率约为 0.01
现在的 χ
2
11.8634,大于 6.635
(2)式可知,出现这样的观测值 χ
2
的概率至多为 0.01
所以至多有 1%的把握认为假设 H
0
是成立的,
即至多有 1%的把握认为患呼吸道疾病与吸烟无关.
所以,至少有 99%的把握认为患呼吸道疾病与吸烟有关系.
问题 2 在上述判断过程中,判断的依据是什么?
随机事件χ
2
某临界值 x
0
发生的概率,与对应的临界值 x
0
问题 3 一般地,要想至少 99%的把握认为两个现 I II 有关系,判断的依据是什么
这个把握的依据,就是
P(χ
2
6.635)0.01
P(χ
2
x
0
)
0.010
x
0
6.635
只要观测值 χ
2
6.635我们就有 1%的把握认为患呼吸道疾病与吸烟无关
从而有 99%的把握认为患病与吸烟有关.
设计意图 从特殊到一般,再从一般回到特殊,使学生理解判断的依据是什么.这里要将假
H
0
成立,转化为统计 χ
2
的值,而判断的依据,在于明确把握度是多少,从
而找到对应的临界值,将基于这组数据所得的 χ
2
的值与临界值 x
0
进行比较.学
生不易理解的难点.
问题 4 能否至少 99.9%的把握认为患病与吸烟有?判断的依据是什么?怎样做出判断?
需要找到一个新的临界值 x
0
,使得 P(χ
2
x
0
)0.1%,让 χ
2
与这个 x
0
比较.
数学家们又进行了科学的研究,得出
若随机事件“χ
2
x
0
”发生的概率 0.1%则临界值 x
0
约为 10.828
P(χ
2
x
0
)
0.010
0.001
x
0
6.635
10.828
这样,我们只要将观测值 χ
2
10.828 比较,就可以像前面那样,作出判断了
继续完成 问题 4 能否有 99.9%的把握认为患病与吸烟有关系?你的理由是什么?
χ
2
11.863 410.828
因为当 H
0
成立时,P(χ
2
10.828)0.001
所以至多有 0.1%的把握认为假设是成立的,
即至多有 0.1%的把握认为患病与吸烟无关
所以,至少有 99.9%的把握认为患病与吸烟有关
3 / 5
在许多社会学或科学问题中,有的时候把握可能不需要那么大,可能有时 99.5%97.5%
95%,甚至 90%就够了.
那么我们又该将观测值 χ
2
与哪些临界值 x
0
进行比较呢?
P(χ
2
x
0
)
0.10
0.05
0.025
0.010
0.005
0.001
x
0
6.635
10.828
数学家们将常用的把握的情形所对应的随机事件χ
2
x
0
发生的临界值 x
0
列成了一张
表,称为临界值表
临界值表
P(χ
2
x
0
)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x
0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
查对临界值表我们就能作出相应的判断:到底有多大的把握认为两个现象之间有关系.
设计意图 理解临界值表的含义,了解临界值表的意义与必要性,知道这是我们进行独立性
检验的依据与参照.临界值表的得出是无法通过目前现有知识让学生知悉缘由的,
需要今后在大学中学习、研究.
问题 5 小结:推断两个分类变量“Ⅰ和Ⅱ有关系”的一般步骤是什么?
第一步 基于科学的手段,合理地抽样、收集数据;
数学地整理数据——得到 2×2 列联表;
1
2
合计
A
a
b
ab
B
c
d
cd
ac
bd
abcd
第二步 提出假 H
0
:两个分类变量Ⅰ和Ⅱ没有关系;
第三步 根据 2×2 列联表和公式计算 χ
2
统计量:
χ
2
n(adbc)
2
(ab)(cd)(ac)(bd)
,其中 nabcd
第四步,查对临界值表,作出判断:
P(χ
2
x
0
)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x
0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
例如:
(1) χ
2
10.828则有 99.9%的把握认为“Ⅰ和Ⅱ有关系
(2) χ
2
6.635则有 99%的把握认为“Ⅰ和Ⅱ有关
(3) χ
2
2.706则有 90%的把握认为“Ⅰ和Ⅱ有关
(4) χ
2
2.706,则认为没有充分的证据显示有关系,但也不能作出结论H
0
成立,即没有关系
利用 χ
2
进行独立性检验,可以对推断的正确性的概率作出估计,观测数据 abcd
取值越大,效果越好.在实际应用中通常要求 abcd 均不小于 5这样近似的效果
可接受.
设计意图 回顾上节课的内容.由于独立性检验的知识较难理解,所以希望学生回忆上节课
的引例,结合引例,用自己的语言谈一谈对独立性检验的三个步骤的理解.接下
来的数学应用和学生活动,就围绕检验学生是否理解而展开.
三、数学应用
4 / 5
1 500 人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外 500
未用血清的人的感冒记录作比较,结果如表所示.问:能否有 99%的把握认为该种血清能
起到预防感冒的作用?
未感冒
感冒
合计
使用血清
258
242
500
未使用血清
216
284
500
合计
474
526
1000
参考公式:独立性检验统计量 χ
2
n(adbc)
2
(ab)(cd)(ac)(bd)
,其中 nabcd
下面的临界值表供参考:
P(χ
2
x
0
)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x
0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
分析 在使用该种血清的人中,
242
500
48.4%的人患过感冒;在没有使用该种血清的人中,
284
500
56.8%人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大.
直观上来看,使用过血清的人与没有使用过血清的人的患感冒的可能性存在差异.
提出假设
H
0
:感冒与是否使用该种血清没有关系.
由列联表中的数据,求得
χ
2
1000×(258×284242×216)
2
474×526×242×500×500
7.0756.635
因为当 H
0
成立时,“χ
2
6.635”的概率约为 0.01
所以至少 99%的把握认:该种血清能起到预防感冒的作用
设计意图 作为范例,使学生熟悉独立性检验的步骤,学会根据观测 χ
2
的值大于临界
x
0
,得出结论:有多大的把握认为与Ⅱ有关.
四、学生活动
数学建模与探究 现场调查:在高二 12 中的你,________________________吗?
合计
男生
女生
合计
根据表中数据,能否作出高二 12 班的同___________________与性别有关的结论?
设计意图 设计开放性的数学探究如果课上时间允许那么请同学们展开探究与讨论;
果时间不允许,那么留作课后探究任务.
五、回顾反思
本节课我们学习了:
1.独立性检验的思想方法及与反证法的关系、独立性检验的一般步骤.
第一步,提出假 H
0
:两个分类变量Ⅰ和Ⅱ没有关系;
第二步,写出 2×2 列联表
1
2
合计
A
a
b
ab
B
c
d
cd
5 / 5
合计
ac
bd
abcd
计算
χ
2
n(adbc)
2
(ab)(cd)(ac)(bd)
(其中 nabcd)
第三步,查对临界值表,作出判断.
2.经独立性检验,两个事件有关,并不一定说:一个事件发生,另一个事件也发生.
六、回顾与小结 通过本节课的学习,你有哪些收获?
我们知道:统计基本的思想是用样本估计总体.常见的有两种推断方法.
第一种是统计估计的推断方法:根据收集到的样本数据,我们可以用样本数据的均值和
方差,分别估计总体的均值与方差;利用最小二乘法的思想,估计一元线性回归模型中的参
数,求出线性回归方程,等等.
第二种基本而重要的推断方法就是假设检验.独立性检验是其中一种常用的方法.
想更进一步地了解这种方法的奥秘,数学将会在大学与你相遇.
七、课外作业:
P
93
习题 31——12
八、板书设计