Statistics 简明教程

Statistics - Interval Estimation

区间估计是利用样本数据计算未知总体参数的可能(或可概)值区间,这与点估计不同,后者只有一个数字。

Formula

其中——

  1. ${\bar x}$ = mean

  2. ${Z_{\frac{\alpha}{2}}}$ = 置信系数

  3. ${\alpha}$ = confidence level

  4. ${\sigma}$ = standard deviation

  5. ${n}$ = sample size

Example

Problem Statement:

假设某个学生测量某一液体的沸点并得到 6 个不同液体的读数(以摄氏度为单位):102.5、101.7、103.1、100.9、100.5 和 102.2。他计算出样本均值为 101.82。如果他知道此过程的标准偏差为 1.2 度,他在 95% 置信水平下对总体均值进行区间估计是什么?

Solution:

该学生计算出沸点的样本均值为 101.82,标准偏差为 ${\sigma=0.49}$。95% 置信区间的临界值为 1.96,其中 ${\frac{1-0.95}{2}=0.025}$。未知均值的 95% 置信区间。

随着置信水平的降低,相应区间的长度将会减小。假设该学生对沸点的 90% 置信区间感兴趣。在这种情况下,${\sigma=0.90}$,${\frac{1-0.90}{2}=0.05}$。此水平的临界值等于 1.645,因此 90% 置信区间为

增加样本量将减少置信区间长度,而不会降低置信水平。这是因为标准偏差随着 n 的增加而减小。

Margin of Error

区间估计的误差范围 ${m}$ 定义为从样本均值中添加或减去的确定区间的长度的值:

假设在上面的示例中,该学生希望在 95% 置信度的情况下具有 0.5 的误差范围。将适当的值代入 ${m}$ 的表达式并求解 n 即可得到计算结果。

为了对总长度小于 1 度的平均沸点实现 95% 区间估计,该学生将不得不进行 23 次测量。