生 2:在吸烟的人中,有
37
220
≈16.82%的人患病;在不吸烟的人中,有
21
295
≈7.12%的人患病。
直观上吸烟群体和不吸烟群体患病存在差异,吸烟群体中患病的频率高。
点评:同学们认为有没有道理。很好。通过比例来研究。
师:什么情况下,吸烟群体和不吸烟群体患病的比例差不多呢?
生 3:吸烟与患病没有关系时,吸烟群体和不吸烟群体患病的比例差不多。
直观上,在吸烟和患病无关的条件下,计算并完成下表。
三.比较数据,感受过程
吸烟和患病是不是有关系呢?刚才同学们通过比例发现可能有关。在吸烟和患病无关的条
件下,我们得到表 1-1 中的观测值的估计值,如表 1-2 所示.
表 1-1 表 1-2
与患病有无关系,就是要比较两张表格中数据的差异。差异越大,吸烟与患病相
关的可能性越大;差异越小,吸烟与患病相关的可能性越小。
问题 2 你能用数学式子来描述两张表格中数据的差异吗?
学生 1:(25-37)+(183-195)+(21-33)+(274-262);
学生 2:|25-37|+|183-195|+|21-33|+|274-262|;
学生 3:
|25-37|
37
+
|183-195|
195
+
|21-33|
33
+
|274-262|
262
;
学生 4:
|25-37|
25
+
|183-195|
183
+
|21-33|
21
+
|274-262|
274
;
学生 5:
(25-37)
2
25
+
(183-195)
2
183
+
(21-33)
2
21
+
(274-262)
2
274
;
……
师:数学上,统计学家用 χ
2
=
(25-37)
2
25
+
(183-195)
2
183
+
(21-33)
2
21
+
(274-262)
2
274
来研究两张表
格中数据的差异。χ
2
越大,吸烟与患病相关的可能性越大;χ
2
越小,吸烟与患病相关的可能
性越小。