环球网校是美国纳斯达克上市企业欢聚时代(NASDAQ:YY)旗下品牌 | 住房和城乡建设部 建筑人才培训合作单位
您现在的位置在: > 财会考试 > 注册会计师 > 考试动态 >

同学们学习2×2列联表独立性检验有何感受?快来探讨

2025-06-15 来源:网络 作者:佚名

在学习“2×2列联表独立性检验,即卡方检验”的过程中,同学们或许会产生这样的疑问:这部分内容显得较为抽象,我们学习它究竟有何实际意义?今天,小编将和同学们一起深入探讨卡方检验的本质及其应用价值。 #

1 什么是卡方检验? #

在阐述卡方检验的概念之前,我们有必要先阐释一种统计学的核心观念——假设检验。这一过程的核心在于,通过分析样本数据,运用统计学手段对总体某一假设进行验证和评价。假设检验进一步细分为参数检验和无参数检验两大类,而联列表的独立性检验,亦即卡方检验,正是无参数检验的一种典型应用。在此,我们首要明确卡方检验的根本目标:

#

“卡方检验主要用于分析两个分类变量的相关关系.

#

分类变量是指那些只能取离散数值的变量,例如“性别”这一分类变量,其可能出现的值仅限于“男性”与“女性”。

#

例如,若需探究色觉异常与性别这两类分类指标之间是否存在关联,我们便可通过抽取人群样本,进而构建以下交叉列表: #

从表格中我们可以直接看出,男性色盲的比例显著高于女性,这一现象似乎为我们提供了一个合理的推测依据:色盲现象可能与性别存在某种关联。 #

英国数学家卡尔·皮尔逊是卡方检验的创始人,他提出有必要找到一种手段来衡量统计样本的实际观察数据与理论预测数据之间的契合度,即用来判断观察结果与预估结果差异的显著性。因此,他在1900年推出了这一著名的统计量。自卡方检验被提出以来,它得到了广泛的运用,并在现代统计理论中占据了至关重要的位置。

#

2 假设什么? #

研究者通常希望找到证据来否定原假设,而备择假设则是他们希望找到证据来证实的假设。因此,通常情况下,研究者会先假定这两个随机变量之间没有关联,即它们是相互独立的。

#

法律领域同样采纳了类似理念,其中“疑罪从无”的基本准则表明假设检验的目的,在缺乏确凿证据的情况下,不能认定某人犯罪。据此,我们通常设定一个初始假设:该人清白,若要证明其有罪,控诉方需提供充分的证据以驳斥这一假设。

#

依据这一准则,针对前面所提到的“色觉异常与性别关联”的案例,我们应当确立的初步假设是:

#

“H? :色盲与性别无关. #

3 如何检验?

#

已作出假设,紧接着便需探讨如何进行“验证”。以色盲与性别之间的关联为例,检验的根本原理在于依据原假设搜集数据,进而评估观测值与预估值之间的差异是否显著。因此,我们的预估值理应基于“色盲”与“性别”两个分类相互独立的情况得出,也就是说:这两个分类的交集概率应当能够通过独立事件的概率乘法法则来计算。 #

得到: #

具体而言,在这1000个人中,有: #

若要计算期望数值,仅需将上述四个概率各自与样本总量1000相乘,进而可得出理论频数表(括号内数据为观测值)。

#

显而易见,那四个单元格里的数据与括号中的数据存在一定的差异。若按照原假设来推断,它们之间的差距本应较小。那么,如何用具体的数据来衡量这种“较小”的差距呢?一个简单的方法是,通过计算每一列中观测值与预期值之差的平方和来加以描述。 #

然而,这会导致一个难题:该指标与每列的样本数量密切相关假设检验的目的,不同样本的基数各不相同。换句话说,此处所需的是相对数值而非绝对数值。因此,我们需对求和公式中的每个平方项进行除法运算,以除以该列的预期数值。 #

此处构建的是皮尔逊所提出的知名统计指标,亦即所谓的列联表卡方检验的计算公式。 #

根据这个公式,我们可以计算出上述案例的值:

#

那么,这个值该怎么用呢?

#

在此,我们应简要掌握卡方分布的相关知识,而对于其严谨的数学演绎过程,则需待同学们步入大学阶段后进行深入学习。

#

图中展示了卡方分布的概率密度函数曲线,其中所提到的自由度是指与自变量数量相关的参数。在本研究的列联表中,该自由度的数值设定为1。与正态分布的特性相似,卡方分布的概率密度曲线下所覆盖的面积总和亦为1。 #

现在给出分布分位点的概念:对于给定的正数,称满足条件 #

的点为分布的上分位点,称为显著性水平. #

好消息传来,统计学家们已经详尽地研究了各类上分位点的数值,因此我们只需查阅相关表格即可获得所需信息。

#

比如,对于显著性水平,自由度,有

#

该临界值的含义在于,在实验成立的情况下,数值超出此临界点的几率仅为0.05。然而,我们刚刚计算出的结果却表明,在单次实验中出现了低概率事件,这一现象与低概率原理相悖。换句话说,我们可以得出结论,认为“色盲与性别无关”这一说法成立的概率低于5%。进一步而言,我们有95%的信心拒绝这一说法,并坚信“色盲与性别有关”。

#

4 似曾相识的逻辑

#

聪明的同学们或许已经察觉到,卡方检验的原理实际上与反证法有着相似之处。

#

实际上,这两个概念既相互关联又存在差异。卡方检验首先假定两个变量之间是独立的,随后构建一个事件——具体而言,该事件指的是皮尔逊检验的统计量超过了在特定显著性水平下的临界值。在我们所提出的假设条件下,这个事件发生的概率极低。一旦在实际情况中观察到这一事件,便与小概率原理相悖,因此我们可以据此拒绝初始假设。这一过程与反证法的步骤具有相似性。 #

需留意的是,尽管小概率事件在单次实验中几乎不会出现,但这并不意味着它绝对不可能发生。因此,我们得出“拒绝原假设”的结论时,实际上存在一定的错误概率。此外,数学上的反证法只要逻辑无误,就能确保否定初始假设的命题。然而,卡方检验并非纯粹的反证法,而是一种结合了概率特性的反证法形式。

#

浙江大学出版的《概率论与数理统计》(第四版)由高等教育出版社于2008年发行。该书的作者包括张亚锦、胡典顺和姚本武。他们在2021年的《数学通讯》第859期第14卷中发表了关于概率与统计知识理解的卡方检验的相关内容,该文位于第1至4页以及第28页。

#

责编:admin 返回顶部  打印

关于我们联系我们友情链接网站声明网站地图广告服务帮助中心