独立性检验第一课时
南京市金陵中学 陈康康
生活中有很多现象,它们有关或无关。
例如:吸烟与患呼吸道疾病有关系吗?直观上,吸烟有害健康,为了你和家人的
健康,少吸烟。性别与阅读量有无关系?有人说无关,知识使人进步,我们都爱读书;
有人说有关,女生可能喜欢安静,更喜欢读书。
两个现象有无关系,多大关系?我们要进行数学研究。
比如,在研究吸烟与患呼吸道疾病的关系时,我们不能空口说白话,要用数据说话,要
进行抽样调查。
一. 收集数据,整理数据
根据上面的抽样调查,说一说你可以得到哪些数据.
患病
未患病
合计
吸烟
37
183
220
不吸烟
21
274
295
合计
58
457
515
二.直观判断,分析数据
问题 1 根据这些数据,能否判断吸烟与患病有关系。
1不能判断,样本不能代替整体。
点评:很好。在研究吸烟和患病有无关系的问题时,可能对每个人进行统计,只能依据样
本推测整体。取样本是一件非常重要,也是科学的事情数据的获取不准确,基于数据的
分析,所得结果就可能错误。数据的获取公平、公正科学合理,基于数据的分析应该会有
一定价值。
某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,调查了 515
个成年人,其中吸烟者 220 人,不吸烟者 295 人.调查结果是:吸烟 220 人中有 37
患呼吸道疾病(简称患病)183 人未患呼吸道疾病(称未患病);不吸烟的 295 人中有 21
人患病,274 未患病.
2 列联表
2在吸烟的人中,有
37
220
≈16.82%的人患病;在不吸烟的人中,
21
295
≈7.12%的人患病。
直观上吸烟群体和不吸烟群体患病存在差异,吸烟群体中患病的频率高。
点评:同学们认为有没有道理。很好。通过比例来研究。
什么情况下,吸烟群体和不吸烟群体患病的比例差不多呢
3吸烟与患病没有关系时,吸烟群体和不吸烟群体患病的比例差不多。
直观上,在吸烟和患病无关的条件下,计算并完成下表。
患病
未患病
合计
吸烟
25
183
220
不吸烟
33
274
295
合计
58
457
515
三.比较数据,感受过程
吸烟和患病是不是有关系呢?刚才同学们通过比例发现可能有关。在吸烟和患病无关的
件下,我们得到 11 的观测值的估计值,如表 12 所示.
11 12
与患病有无关系,就是要比较两张表格中数据的差异。差异越大,吸烟与患病相
关的可能性越大;差异越小,吸烟与患病相关的可能性越小。
问题 2 你能用数学式子来描述两张表格中数据的差异吗
学生 1(2537)(183195)(2133)(274262)
学生 2|2537||183195||2133||274262|
学生 3
|2537|
37
|183195|
195
|2133|
33
|274262|
262
学生 4
|2537|
25
|183195|
183
|2133|
21
|274262|
274
学生 5
(2537)
2
25
(183195)
2
183
(2133)
2
21
(274262)
2
274
……
数学上,统计学家用 χ
2
(2537)
2
25
(183195)
2
183
(2133)
2
21
(274262)
2
274
来研究两张表
格中数据的差异χ
2
越大,吸烟与患病相关的可能性越大χ
2
小,吸烟与患病相关的可能
性越小。
未患病
合计
吸烟
183
220
不吸烟
274
295
合计
457
515
未患病
合计
吸烟
195
220
不吸烟
262
295
合计
457
515
χ
2
比刚才的“比例”能更精确地描述吸烟与患病有没有关系。
四.特殊到一般,构建理论
假设在患病与吸烟无关(互独立)条件下,请完成下表
患病
未患病
合计
吸烟
(ab)(ac)
n
(ab)(bd)
n
ab
不吸烟
(cd)(ac)
n
(cd)(bd)
n
cd
合计
ac
bd
nabcd
上表中吸烟且患病人群的估计值,你是怎么得到的?
1比例。
2独立事件同时发生的概率等于概率之积,用频率近似估计概率。
χ
2
[a
(ab)(ac)
n
]
2
(ab)(ac)
n
[b
(ab)(bd)
n
]
2
(ab)(bd)
n
[c
(cd)(ac)
n
]
2
(cd)(ac)
n
[d
(cd)(bd)
n
]
2
(cd)(bd)
n
(adbc)
2
n
2
[
n
(ab)(ac)
n
(ab)(bd)
n
(cd)(ac)
n
(cd)(bd)
]
(adbc)
2
n
[
(bd)(ac)
(ab)(ac)(bd)
(bd)(ac)
(cd)(ac)(bd)
]
(adbc)
2
(cd)(ab)
(ab)(cd)(ac)(bd)
n(adbc)
2
(ab)(cd)(ac)(bd)
(其中 nabcd)
χ
2
越大,吸烟与患病相关的可能性越大;χ
2
小,吸烟与患病相关的可能性越小。
在假设吸烟与患病独立的条件下,用 χ
2
来研究吸烟与患病是否有关的问题,我们称独立
性检验依据样本所得的 χ
2
吸烟与患病有关或者无关的把握有多大呢?我们下节课继续
究。
患病
未患病
合计
吸烟
a
b
ab
不吸烟
c
d
cd
合计
ac
bd
nabcd