Statistics 简明教程
Statistics - Kurtosis
分布的尾数程度由峰度测量。它告诉我们该分布比正态分布在多大程度上更容易或不太容易出现异常值(更重或更轻的尾)。来自 Investopedia 提供的三种不同类型的曲线如下所示:
从密度图(左面板)中很难看出不同类型的峰度,因为所有分布的尾部都接近于零。但是,在正态分位数-分位数图(右面板)中很容易看出尾部差异。
正态曲线称为中峰度曲线。如果某个分布的曲线比正态分布或中峰度曲线更容易出现异常值(或更重),则它被称为厚尾分布曲线。如果某个曲线比正态分布更不容易出现异常值(或更轻),则它被称为扁尾分布曲线。峰度通过矩进行测量,由以下公式给出:
Formula
其中——
-
${\mu_4 = \frac{\sum(x- \bar x)^4}{N}}$
\beta_2 值越大,曲线越尖锐或越厚尾。正态曲线的数值为 3,厚尾分布的 \beta_2 大于 3,扁尾分布的 \beta_2 小于 3。
Example
Problem Statement:
给出某工厂 45 名工人的每日工资数据。使用围绕均值的矩计算 \beta_1 和 \beta_2。对结果发表评论。
Wages(Rs.) |
Number of Workers |
100-200 |
1 |
120-200 |
2 |
140-200 |
6 |
160-200 |
20 |
180-200 |
11 |
200-200 |
3 |
220-200 |
2 |
Solution:
Wages (Rs.) |
Number of Workers (f) |
Mid-pt |
m-${\frac{170}{20}}$ |
${fd}$ |
${fd^2}$ |
${fd^3}$ |
${fd^4}$ |
100-200 |
1 |
110 |
-3 |
-3 |
9 |
-27 |
81 |
120-200 |
2 |
130 |
-2 |
-4 |
8 |
-16 |
32 |
140-200 |
6 |
150 |
-1 |
-6 |
6 |
-6 |
6 |
160-200 |
20 |
170 |
0 |
0 |
0 |
0 |
0 |
180-200 |
11 |
190 |
1 |
11 |
11 |
11 |
11 |
200-200 |
3 |
210 |
2 |
6 |
12 |
24 |
48 |
220-200 |
2 |
230 |
3 |
6 |
18 |
54 |
162 |
${N=45}$ |
|
${\sum fd = 10}$ |
||
${\sum fd^2 = 64}$ |
${\sum fd^3 = 40}$ |
${\sum fd^4 = 330}$ |
由于这些偏差取自一个假设均值,因此我们首先计算围绕任意原点的矩,然后再计算围绕均值的矩。围绕任意原点“170”取矩