Statistics 简明教程

Statistics - Transformations

数据转换是指对数据集中的每一项应用一个函数。在这里,$ x_i $ 被其转换后的值 $ y_i $ 替换,其中 $ y_i = f(x_i) $。通常执行数据转换是为了使图表的外观更易于解释。

有四个主要函数用于转换。

  1. $ log x $ - 对数转换。例如,声音单位为分贝,并且通常使用对数转换来表示。

  2. $ \frac{1}{x} $ - 等效转换。例如,完成比赛/任务的时间使用速度表示。速度越高,所用时间越短。

  3. $ \sqrt{x} $ - 平方根转换。例如,使用半径来比较圆形地面的面积。

  4. $ {x^2} $ - 幂转换。例如,比较负数。

对正数使用对数和平方根转换,而对负数和正数则可以使用等效和幂转换。

下面的图表说明了如何使用对数转换来比较人口分布。

Before transformation

transformations

After transformation

log transformations