Python Pandas 简明教程

Python Pandas - Panel

panel 是数据的 3D 容器。术语 Panel data 衍生自计量经济学并且部分负责熊猫名称 − pan(el)-da(ta) -s。

3 根轴的名称是为了给描述面板数据的操作赋予一些语义含义。它们是 −

  1. items − axis 0,每个项都对应内部包含的一个 DataFrame。

  2. major_axis − axis 1,它是每个 DataFrame 的索引(行)。

  3. minor_axis − axis 2,它是每个 DataFrame 的列。

pandas.Panel()

可以使用以下构造函数创建一个面板 −

pandas.Panel(data, items, major_axis, minor_axis, dtype, copy)

构造函数的参数如下:

Parameter

Description

data

数据采用各种形式,如 ndarray、序列、映射、列表、dict、常量,以及另一个 DataFrame

items

axis=0

major_axis

axis=1

minor_axis

axis=2

dtype

每列的数据类型

copy

Copy data. Default, false

Create Panel

可以使用多种方法创建面板,如 −

  1. From ndarrays

  2. From dict of DataFrames

From 3D ndarray

# creating an empty panel
import pandas as pd
import numpy as np

data = np.random.rand(2,4,5)
p = pd.Panel(data)
print p

它的 output 如下所示 −

<class 'pandas.core.panel.Panel'>
Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis)
Items axis: 0 to 1
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 4

Note − 观察空面板和上述面板的维度,所有对象都不同。

From dict of DataFrame Objects

#creating an empty panel
import pandas as pd
import numpy as np

data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p

它的 output 如下所示 −

Dimensions: 2 (items) x 4 (major_axis) x 3 (minor_axis)
Items axis: Item1 to Item2
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 2

Create an Empty Panel

可以使用 Panel 构造函数创建空面板,如下所示 −

#creating an empty panel
import pandas as pd
p = pd.Panel()
print p

它的 output 如下所示 −

<class 'pandas.core.panel.Panel'>
Dimensions: 0 (items) x 0 (major_axis) x 0 (minor_axis)
Items axis: None
Major_axis axis: None
Minor_axis axis: None

Selecting the Data from Panel

使用以下方法从面板中选择数据 −

  1. Items

  2. Major_axis

  3. Minor_axis

Using Items

# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p['Item1']

它的 output 如下所示 −

            0          1          2
0    0.488224  -0.128637   0.930817
1    0.417497   0.896681   0.576657
2   -2.775266   0.571668   0.290082
3   -0.400538  -0.144234   1.110535

我们有两项,并且我们检索了 item1。结果是一个带有 4 行和 3 列的 DataFrame,它们是 Major_axisMinor_axis 维度。

Using major_axis

可以使用方法 panel.major_axis(index) 访问数据。

# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.major_xs(1)

它的 output 如下所示 −

      Item1       Item2
0   0.417497    0.748412
1   0.896681   -0.557322
2   0.576657       NaN

Using minor_axis

可以使用方法 panel.minor_axis(index). 访问数据。

# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.minor_xs(1)

它的 output 如下所示 −

       Item1       Item2
0   -0.128637   -1.047032
1    0.896681   -0.557322
2    0.571668    0.431953
3   -0.144234    1.302466

Note − 观察维度中的变化。