Statistics 简明教程

Statistics - Simple random sampling

简单随机样本被定义为总体中每个元素都有相等和独立的机会被选择的样本。对于具有 N 个单位的总体,以所有可能的 NCn 样本组合来选择 n 个样本单位的概率由 1/NCn给出,例如,如果我们有一个由五个元素(A、B、C、D、E)组成的总体,即 N 为 5,而我们想要大小为 n = 3 的样本,那么有 5C3 = 10 个可能的样本,并且任何单个单位成为样本成员的概率由 1/10 给出。

简单随机抽样可以用两种不同的方式进行,即“有放回”或“无放回”。当在选择下一个之前依次将单位选入样本后放回已选单位时,它是有放回的简单随机样本。如果所选单位在下次抽取前未被放回,并且连续单位的抽取仅从总体中剩余的单位中进行,则将其称为无放回的简单随机样本。因此,在前一种方法中,一次选定的单位可能会重复,而在后一种方法中,一次选定的单位不会重复。由于无放回的简单随机样本具有更高的统计效率,因此它是首选的方法。

可以通过抽签法或随机数表中的任一方法抽取简单的随机样本。

  1. Lottery Method - 在这种方法下,单位是根据随机抽取选择的。首先给总体中的每个成员或元素分配一个唯一的号码。在下一步中,这些号码写在物理上在形状、大小、颜色等方面完全相同的独立纸片上。然后将它们放在一个篮子里并充分混合。最后一步是在不看纸条的情况下随机取出纸条。抽取的纸条数等于所需的样本量。抽签法存在一些缺点。写入 N 个编号的纸条的过程很麻烦,而且当总体规模很大时,洗牌大量纸条很困难。此外,在选择纸条时也会有人为偏见。因此,可以使用另一种选择,即随机数。

  2. Random Number Tables Method - 它们由随机准备的数字列组成。有许多随机表可用,例如 Fisher 和 Yates 表、Tippets 随机数等。以下是 Fisher 和 Yates 表中的两位随机数序列:61、44、65、22、01、67、76、23、57、58、54、11、33、86、07、26、75、76、64、22、19、35、74、49、86、58、69、52、27、34、91、25、34、67、76、73、27、16、53、18、19、69、32、52、38、72、38、64、81、79 和 38。第一步是为每个成员分配一个唯一的编号人口,例如,如果人口由 20 人组成,那么所有个体都被编号从 01 到 20。如果我们要收集 5 个单位的样本,那么参考随机数表,选择 5 个两位数。例如,使用上表,具有以下五个数字的单位将组成一个样本:01、11、07、19 和 16。如果抽样没有放回,并且一个特定的随机数重复出现,那么它将不会再次被抽取,并且将选择符合我们标准的下一个数字。

因此,可以使用这两种程序中的任何一种来抽取简单的随机样本。然而,在实践中,人们发现简单随机样本需要大量的时间和精力,并且不切实际。