Seaborn 简明教程
Seaborn - Statistical Estimation
在大多数情况下,我们处理的是整个数据分布的估计。但是,当涉及到中心趋势估计时,我们需要一种特殊的方法来总结分布。均值和中位数是用于估计分布中心趋势的经常使用的方法。
在我们以上章节中学习的所有图中,我们对整个分布进行了可视化。现在,让我们讨论一下我们可以用它来估计分布中心趋势的图。
Bar Plot
barplot() 显示了分类变量和连续变量之间的关系。数据以矩形条表示,其中条的长度表示该类别中数据的比例。
条形图表示中心趋势的估计值。让我们使用“泰坦尼克号”数据集来学习条形图。
Example
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.barplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()
Output
在上例中,我们可以看到每节车厢男性和女性的平均存活人数。从图中我们可以得知,存活下来的女性人数多于男性。在男性和女性中,一等舱的存活人数较多。
条形图中的一个特例是显示每个类别中的观察次数,而不是计算第二个变量的统计量。为此,我们使用 countplot().