Statistics 简明教程
Statistics - Kolmogorov Smirnov Test
这种方法用于需要对观测样本分布和理论分布进行比较的情况。
K-S One Sample Test
此检验可用作拟合优度检验,且当样本量较小时很理想。它会针对指定分布的变量比较累积分布函数。零假设认为观察到的分布与理论分布之间不存在差异,检验统计量“D”的值计算如下:
Formula
其中——
-
${F_o(X)}$ = n 个观测值的随机样本的观察到的累积频率分布。
-
并且 ${F_o(X) = \frac{k}{n}}$ = (≤ X 的观察值数量)/(观察值的总数)。
-
${F_r(X)}$ = 理论频率分布。
${D}$ 的临界值可从 K-S 表中单样本检验的值中找到。
Acceptance Criteria: 如果计算值小于临界值,则接受零假设。
Rejection Criteria: 如果计算值大于表值,则拒绝零假设。
Example
Problem Statement:
在一项针对某所大学各个专业的 60 位学生进行的研究中,从每个专业抽取数量相等的学生,对他们进行了采访,并记录了他们加入大学戏剧俱乐部的意愿。
B.Sc. |
B.A. |
B.Com |
M.A. |
M.Com |
|
No. in each class |
5 |
9 |
11 |
16 |
19 |
预期每个班级的 12 位学生会加入戏剧俱乐部。使用 K-S 检验来找出学生班级在加入戏剧俱乐部的意愿方面是否存在差异。
Solution:
${H_o}$:不同专业学生在加入戏剧俱乐部的意愿方面不存在差异。
我们计算观察分布和理论分布的累积频率。
Streams |
有兴趣加入的学生人数 |
${F_O(X)}$ |
${F_T(X)}$ |
${ |
F_O(X)-F_T(X) |
}$ |
Observed (O) |
Theoretical (T) |
B.Sc. |
||||
5 |
12 |
5/60 |
12/60 |
7/60 |
B.A. |
9 |
12 |
14/60 |
24/60 |
10/60 |
B.COM. |
11 |
12 |
25/60 |
36/60 |
11/60 |
M.A. |
16 |
12 |
41/60 |
48/60 |
7/60 |
M.COM. |
19 |
12 |
60/40 |
60/60 |
60/60 |
Total |
n=60 |
检验统计量 ${|D|}$ 计算如下:
在 5% 显著性水平下的 D 表值为
由于计算值大于临界值,因此我们拒绝零假设,并得出结论:不同专业学生在加入戏剧俱乐部的意愿方面存在差异。