Statistics 简明教程

Statistics - Goodness of Fit

正态分佈 Goodness of Fit 检验用于检验样本数据是否符合总体分佈。总体可能具有正态分布或威布尔分布。简而言之,这意味着样本数据正确地表示了我们期望从实际总体中发现的数据。统计人员通常使用以下检验:

  1. Chi-square

  2. Kolmogorov-Smirnov

  3. Anderson-Darling

  4. Shipiro-Wilk

Chi-square Test

卡方检验是最常用于检验拟合优度的检验,并且用于离散分布,如二项式分布和泊松分布,而Kolmogorov-Smirnov和Anderson-Darling 拟合优度检验用于连续分布。

Formula

其中——

  1. ${O_i}$ = 变量第 i 级的观测值。

  2. ${E_i}$ = 变量第 i 级的期望值。

  3. ${X^2}$ = 卡方随机变量。

Example

一家玩具公司制造足球运动员玩具。该公司声称 30% 的卡片是中场球员、60% 是后卫,10% 是前锋。考虑 100 个玩具的随机样本,其中有 50 个是中场球员、45 个是后卫,5 个是前锋。给定 0.05 的显著性水平,您可以为公司的主张辩护吗?

Solution:

Determine Hypotheses

  1. 零假设 $H_0$ - 中场球员、后卫和前锋的比例分别为 30%、60% 和 10%。

  2. *备择假设 $H_1$ * - 零假设中至少一个比例为假。

Determine Degree of Freedom

自由度 DF 等于分类变量的级别数 (k) 减 1:DF = k - 1。这里级别为 3。因此

Determine chi-square test statistic

Determine p-value

P 值是具有 2 个自由度的卡方统计量 $X^2$ 比 19.58 更极端的概率。使用卡方分布计算器找到 $P(X^2 \gt 19.58) = 0.0001$。

Interpret results

由于 P 值 (0.0001) 远小于显著性水平 (0.05),因此零假设无法接受。因此,公司的说法是无效的。