Python Pandas 简明教程
Python Pandas - Series
Series 是一个一维的带标签阵列,它可以保存任何类型(整数、字符串、浮动、Python 对象等)的数据。轴标签统称为索引。
pandas.Series
可以使用以下构造函数创建 Pandas Series −
pandas.Series( data, index, dtype, copy)
构造函数的参数如下:
Sr.No |
Parameter & Description |
1 |
data data 采用 ndarray、list、constants 等各种形式 |
2 |
index 索引值必须是唯一的且可哈希的,长度应与数据相同。如果没有传递索引值,则使用默认 np.arrange(n) 。 |
3 |
dtype dtype 表示数据类型。如果为 None,则会推断数据类型 |
4 |
copy Copy data. Default False |
可以使用各种输入创建 series,如:
-
Array
-
Dict
-
Scalar value or constant
Create a Series from ndarray
如果 data 是一个 ndarray,则传入的索引的长度必须相同。如果没有传入索引,则默认的索引是 range(n) ,其中 n 是数组长度,即 [0,1,2,3…. range(len(array))-1].
Create a Series from dict
可以将一个 dict 作为输入,并且如果未指定索引,则会按照排序的顺序取字典作为密钥,以构造索引。如果传递了 index ,则会提取出与索引中标签相对应的 data 中的值。
Create a Series from Scalar
如果 data 是一个标量值,则必须提供一个索引。该值将会重复,以匹配 index 的长度
#import the pandas library and aliasing as pd
import pandas as pd
import numpy as np
s = pd.Series(5, index=[0, 1, 2, 3])
print s
它的 output 如下所示 −
0 5
1 5
2 5
3 5
dtype: int64
Accessing Data from Series with Position
可以通过类似于 ndarray. 中的方式访问 series 中的数据
Example 1
检索第一个元素。正如我们已经知道的那样,数组的计数从零开始,这意味着第一个元素存储在第零个位置,依此类推。
import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
#retrieve the first element
print s[0]
它的 output 如下所示 −
1
Retrieve Data Using Label (Index)
Series 就像一个固定大小的 dict ,因为你可以通过索引标签获取和设置值。
Example 1
使用索引标签值检索一个单独的元素。
import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
#retrieve a single element
print s['a']
它的 output 如下所示 −
1