Python Pandas 简明教程
Python Pandas - Panel
panel 是数据的 3D 容器。术语 Panel data 衍生自计量经济学并且部分负责熊猫名称 − pan(el)-da(ta) -s。
3 根轴的名称是为了给描述面板数据的操作赋予一些语义含义。它们是 −
-
items − axis 0,每个项都对应内部包含的一个 DataFrame。
-
major_axis − axis 1,它是每个 DataFrame 的索引(行)。
-
minor_axis − axis 2,它是每个 DataFrame 的列。
pandas.Panel()
可以使用以下构造函数创建一个面板 −
pandas.Panel(data, items, major_axis, minor_axis, dtype, copy)
构造函数的参数如下:
Parameter |
Description |
data |
数据采用各种形式,如 ndarray、序列、映射、列表、dict、常量,以及另一个 DataFrame |
items |
axis=0 |
major_axis |
axis=1 |
minor_axis |
axis=2 |
dtype |
每列的数据类型 |
copy |
Copy data. Default, false |
Create Panel
可以使用多种方法创建面板,如 −
-
From ndarrays
-
From dict of DataFrames
From 3D ndarray
# creating an empty panel
import pandas as pd
import numpy as np
data = np.random.rand(2,4,5)
p = pd.Panel(data)
print p
它的 output 如下所示 −
<class 'pandas.core.panel.Panel'>
Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis)
Items axis: 0 to 1
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 4
Note − 观察空面板和上述面板的维度,所有对象都不同。
From dict of DataFrame Objects
#creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p
它的 output 如下所示 −
Dimensions: 2 (items) x 4 (major_axis) x 3 (minor_axis)
Items axis: Item1 to Item2
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 2
Selecting the Data from Panel
使用以下方法从面板中选择数据 −
-
Items
-
Major_axis
-
Minor_axis
Using Items
# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p['Item1']
它的 output 如下所示 −
0 1 2
0 0.488224 -0.128637 0.930817
1 0.417497 0.896681 0.576657
2 -2.775266 0.571668 0.290082
3 -0.400538 -0.144234 1.110535
我们有两项,并且我们检索了 item1。结果是一个带有 4 行和 3 列的 DataFrame,它们是 Major_axis 和 Minor_axis 维度。
Using major_axis
可以使用方法 panel.major_axis(index) 访问数据。
# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.major_xs(1)
它的 output 如下所示 −
Item1 Item2
0 0.417497 0.748412
1 0.896681 -0.557322
2 0.576657 NaN
Using minor_axis
可以使用方法 panel.minor_axis(index). 访问数据。
# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.minor_xs(1)
它的 output 如下所示 −
Item1 Item2
0 -0.128637 -1.047032
1 0.896681 -0.557322
2 0.571668 0.431953
3 -0.144234 1.302466
Note − 观察维度中的变化。