Seaborn 简明教程
Seaborn - Importing Datasets and Libraries
在本教程中,我们将讨论如何导入数据集和库。我们从了解如何导入库开始。
Importing Libraries
我们首先导入 Pandas,这是一个用于管理关系型(表格格式)数据集的好库。处理数据帧时 Seaborn 非常方便,数据帧是数据分析中最常用的数据结构。
以下命令将帮助你导入 Pandas −
# Pandas for managing datasets
import pandas as pd
现在,我们导入 Matplotlib 库,它能帮助我们自定义绘图。
# Matplotlib for additional customization
from matplotlib import pyplot as plt
我们将使用以下命令导入 Seaborn 库 −
# Seaborn for plotting and styling
import seaborn as sb
Importing Datasets
我们已经导入了所需的库。在本节中,我们将了解如何导入所需的数据集。
Seaborn 库中附带了一些重要的数据集。安装 Seaborn 时,数据集会自动下载。
你可以使用任何这些数据集来进行学习。你可以借助以下函数加载所需的数据集
load_dataset()
Importing Data as Pandas DataFrame
在本节中,我们将导入一个数据集。该数据集默认加载为 Pandas 数据帧。如果 Pandas 数据帧中存在任何函数,则这些函数可在此数据帧上运行。
以下代码行将帮助你导入数据集 −
# Seaborn for plotting and styling
import seaborn as sb
df = sb.load_dataset('tips')
print df.head()
上述代码行将生成以下输出 −
total_bill tip sex smoker day time size
0 16.99 1.01 Female No Sun Dinner 2
1 10.34 1.66 Male No Sun Dinner 3
2 21.01 3.50 Male No Sun Dinner 3
3 23.68 3.31 Male No Sun Dinner 2
4 24.59 3.61 Female No Sun Dinner 4
要查看 Seaborn 库中所有可用的数据集,你可以按如下所示使用具有 get_dataset_names() 函数的以下命令 −
import seaborn as sb
print sb.get_dataset_names()
上述代码行将返回以下输出,即数据集列表
[u'anscombe', u'attention', u'brain_networks', u'car_crashes', u'dots',
u'exercise', u'flights', u'fmri', u'gammas', u'iris', u'planets', u'tips',
u'titanic']
DataFrames 以矩形网格的形式存储数据,通过这些网格可以轻松地概览数据。矩形网格的每一行都包含一个实例的值,而网格的每一列都是一个向量,其中包含特定变量的数据。这意味着数据帧的行不需要包含相同数据类型的值,它们可以是数字、字符、逻辑值等。Python 的数据框随 Pandas 库一起提供,并且它们被定义为具有不同类型的列的二维标签数据结构。
有关数据帧的更多详细信息,请访问我们 tutorial 上有关熊猫的内容。