Numpy 简明教程

NumPy - Data Types

NumPy 支持的数值类型比 Python 所支持的类型多得多。下表显示了 NumPy 中定义的不同标量数据类型。

Sr.No.

Data Types & Description

1

bool_ 以字节形式存储的是布尔值(真或假)

2

int_ 默认整数类型(与 C long 相同;通常是 int64 或 int32)

3

intc 与 C int 相同(通常是 int32 或 int64)

4

intp 用于索引的整数(与 C ssize_t 相同;通常是 int32 或 int64)

5

int8 Byte (-128 to 127)

6

int16 Integer (-32768 to 32767)

7

int32 Integer (-2147483648 to 2147483647)

8

int64 Integer (-9223372036854775808 to 9223372036854775807)

9

uint8 无符号整数(0 到 255)

10

uint16 无符号整数(0 到 65535)

11

uint32 无符号整数(0 到 4294967295)

12

uint64 无符号整数(0 到 18446744073709551615)

13

float_ Shorthand for float64

14

float16 半精度浮点数:符号位、5 位指数、10 位尾数

15

float32 单精度浮点数:符号位、8 位指数、23 位尾数

16

float64 双精度浮点数:符号位、11 位指数、52 位尾数

17

complex_ Shorthand for complex128

18

complex64 复数,由两个 32 位浮点数(实部和虚部组成)表示

19

complex128 复数,由两个 64 位浮点数(实部和虚部组成)表示

NumPy 数值类型是 dtype(数据类型)对象的实例,每个实例具有独特的特征。dtype 可用作 np.bool_、np.float32 等。

Data Type Objects (dtype)

数据类型对象描述了与数组相对应的固定内存块的解读,具体取决于以下几个方面:

  1. 数据类型(整数、浮点数或 Python 对象)

  2. Size of data

  3. 字节序(小端或大端)

  4. 如果为结构化类型,则包括字段的名称、每个字段的数据类型以及每个字段占据的内存块部分。

  5. 如果数据类型是子数组,则包括其形状和数据类型

通过在数据类型前面添加'<'或'>'来确定字节顺序。'<'表示编码是小端序(最小重要位存储在最小地址)。'>'表示编码是大端序(最大重要位存储在最小地址)。

dtype对象使用以下语法构造 -

numpy.dtype(object, align, copy)

参数是 -

  1. Object - 转换为数据类型对象

  2. Align - 如果为真,为字段添加填充以使其类似于C结构

  3. Copy - 创建dtype对象的新副本。如果为假,结果是对内置数据类型对象的引用

Example 1

# using array-scalar type
import numpy as np
dt = np.dtype(np.int32)
print dt

输出如下 −

int32

Example 2

#int8, int16, int32, int64 can be replaced by equivalent string 'i1', 'i2','i4', etc.
import numpy as np

dt = np.dtype('i4')
print dt

输出如下 −

int32

Example 3

# using endian notation
import numpy as np
dt = np.dtype('>i4')
print dt

输出如下 −

>i4

以下示例显示结构化数据类型的使用。此处,应声明字段名称和相应标量数据类型。

Example 4

# first create structured data type
import numpy as np
dt = np.dtype([('age',np.int8)])
print dt

输出如下 −

[('age', 'i1')]

Example 5

# now apply it to ndarray object
import numpy as np

dt = np.dtype([('age',np.int8)])
a = np.array([(10,),(20,),(30,)], dtype = dt)
print a

输出如下 −

[(10,) (20,) (30,)]

Example 6

# file name can be used to access content of age column
import numpy as np

dt = np.dtype([('age',np.int8)])
a = np.array([(10,),(20,),(30,)], dtype = dt)
print a['age']

输出如下 −

[10 20 30]

Example 7

以下示例定义一个名为 student 的结构化数据类型,该数据类型具有字符串字段’name',一个 integer field 'age’和一个 float field 'marks'。此dtype应用于ndarray对象。

import numpy as np
student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')])
print student

输出如下 −

[('name', 'S20'), ('age', 'i1'), ('marks', '<f4')])

Example 8

import numpy as np

student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')])
a = np.array([('abc', 21, 50),('xyz', 18, 75)], dtype = student)
print a

输出如下 −

[('abc', 21, 50.0), ('xyz', 18, 75.0)]

每个内置数据类型都具有唯一标识它的字符代码。

  1. 'b' − boolean

  2. 'i' − (signed) integer

  3. 'u' − unsigned integer

  4. 'f' − floating-point

  5. 'c' − complex-floating point

  6. 'm' − timedelta

  7. 'M' − datetime

  8. 'O' − (Python) objects

  9. 'S', 'a' − (byte-)string

  10. 'U' − Unicode

  11. 'V' - 原始数据(void)