Seaborn 简明教程

Seaborn - Kernel Density Estimates

核密度估计 (KDE) 是一种估计连续随机变量的概率密度函数的方法。它用于非参数分析。

distplot 中将 hist 标志设置为 False 将会生成核密度估计图。

Example

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'],hist=False)
plt.show()

Output

curve

Fitting Parametric Distribution

distplot() 用于可视化数据集的参数分布。

Example

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'])
plt.show()

Output

bar

Plotting Bivariate Distribution

双变量分布用于确定两个变量之间的关系。这主要涉及两个变量之间的关系,以及一个变量如何相对于另一个变量而表现。

在 seaborn 中分析双变量分布的最佳方法是使用 jointplot() 函数。

Jointplot 创建一个多面板图,其中投射了两个变量之间的双变量关系,还投射了每个变量在不同轴上的单变量分布。

Scatter Plot

散点图是可视化分布的最便捷方法,其中每个观测值通过 x 和 y 轴表示在二维图中。

Example

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df)
plt.show()

Output

clubed

上图显示了鸢尾花数据中 petal_lengthpetal_width 之间的关系。该图中的一条趋势表示,被研究变量之间存在正相关。

Hexbin Plot

当密度中的数据稀疏时,即当数据非常分散且难以通过散点图进行分析时,双变量数据分析中会使用六角形分箱。

名为“kind”且值为“hex”的附加参数会绘制六角形图。

Example

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()
hexagon

Kernel Density Estimation

核密度估计是一种非参数方式,用于估计变量的分布。在 seaborn 中,我们可以使用 jointplot(). 绘制核密度估计。

将值“kde”传递给参数 kind 以绘制核图。

Example

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

Output

xray