NumPy入门教程

第一章 NumPy 介绍
第二章 ndarray的创建及其属性
第三章 ndarray的基本操作
第四章 ndarray的索引、切片和遍历
第五章 ndarray的重塑、组合和拆分
第六章 用于ndarray的文件操作
第七章 ndarray的赋值、视图、拷贝和广播



前言

上一章我们讲述了 ndarray 的基本操作。本节课我们来讲述 ndarray 的索引、切片和遍历。


一、索引

1.一维数组的索引

ndarray 的索引和列表的索引类似。下面我们通过例子来看:

>>> import numpy as np
>>>
>>> my_arr = np.arange(1, 10)
>>> my_arr[0]
1
>>> my_arr[1]
2
>>> my_arr[-1]
9
>>> my_arr[-3]
7

和列表一样,ndarray 不但支持正数索引,而且支持负数索引。和列表不同的是,ndarray 支持一次索引多个元素。例如:

>>> import numpy as np
>>>
>>> my_arr = np.arange(1, 10)
>>> my_arr[[0, 1, 5, 8]]
array([1, 2, 6, 9])

2.二维数组的索引

上面讲述的是一维数组的索引,下面来看下二维数组的索引。

>>> import numpy as np
>>>
>>> my_arr = np.arange(1, 10).reshape(3,3)
>>>
>>> my_arr[0, 1]
2
>>> my_arr[1, 2]
6

在对二维数组进行索引时,需要传入行和列,这里有点要注意的是,行和列的索引都是从 0 开始的。my_arr[0, 1] 访问的是第一行第二列的元素,my_arr[1, 2] 访问的是第二行第三列的元素。和一维数组的索引一样,我们也可以一次索引多个元素。例如:

>>> import numpy as np
>>>
>>> my_arr = np.arange(1, 10).reshape(3,3)
>>>
>>> my_arr[0, [1, 2]]
array([2, 3])
>>> my_arr[[0,1], 2]
array([3, 6])

3.布尔索引

ndarray 除了支持上面的索引之外,还支持布尔索引。我们来看一个例子:

>>> import numpy as np
>>>
>>> my_arr = np.random.random(9)
>>>
>>> my_arr < 0.5
array([ True, False,  True, False, False, False,  True, False,  True])

上面的代码会生成一个布尔型的 ndarray,我们可以使用这个布尔型的 ndarray 对原 ndarray 进行索引。例如:

>>> import numpy as np
>>>
>>> my_arr = np.random.random(9)
>>>
>>> my_arr[my_arr < 0.5]
array([0.16966731, 0.08083069, 0.1151559 , 0.05414959, 0.25727601,
       0.07006292, 0.30550372])

这样便会筛选出所有小于 0.5 的元素。上面 ndarray 中元素的类型为 float64,元素类型为字符串的 ndarray 同样可以使用布尔索引。例如:

>>> import numpy as np
>>>
>>> names = np.array(['Bob','Joe','Will','Bob'])
>>> names[names == 'Bob']
array(['Bob', 'Bob'], dtype='<U4')

上面的代码输出 ndarray 中所有为 Bob 的元素。布尔型索引不仅适用于一维数组,而且适用于多维数组,下面以二维数组为例来说明:

>>> import numpy as np
>>>
>>> my_arr = np.random.random((4, 4))
>>> my_arr[my_arr < 0.5]
array([0.2617775 , 0.46239725, 0.009333  , 0.25688413, 0.09284835,
       0.16338925, 0.4882334 , 0.10326217, 0.43232158, 0.00906559])

上面的代码会输出二维数组中所有小于 0.5 的元素,在这个例子中,我们使用二维的布尔型数组对二维数组进行过滤。我们还可以使用一维的布尔型数组对二维数组进行过滤。例如:

>>> import numpy as np
>>>
>>> my_arr = np.random.random((4, 4))
>>> names = np.array(['Bob','Joe','Will','Bob'])
>>>
>>> my_arr[names == 'Bob']
array([[0.40248078, 0.76931449, 0.87001029, 0.89284846],
       [0.80442521, 0.03651888, 0.48429973, 0.38389917]])

在使用一维布尔型数组对二维数组进行索引时,会把二维数组当成一个一维数组,一维数组的每个元素又是一个一维数组。所以上面的代码得到的是一个 2 行 4 列的二维数组。


二、切片

和列表类似,ndarray 同样支持切片操作,我们先来看一维数组。

>>> import numpy as np
>>>
>>> my_arr = np.arange(9)
>>>
>>> my_arr[1:5]
array([1, 2, 3, 4])
>>> my_arr[:]
array([0, 1, 2, 3, 4, 5, 6, 7, 8])
>>> my_arr[1:8:2]
array([1, 3, 5, 7])
>>> my_arr[::2]
array([0, 2, 4, 6, 8])
>>> my_arr[:5:2]
array([0, 2, 4])
>>> my_arr[:8:]
array([0, 1, 2, 3, 4, 5, 6, 7])
>>> my_arr[::-1]
array([8, 7, 6, 5, 4, 3, 2, 1, 0])

同样的,我们可以对二维数组进行切片。例如:

>>> import numpy as np
>>>
>>> my_arr = np.arange(9).reshape((3,3))
>>>
>>> my_arr[:]
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])
>>> my_arr[0, :]
array([0, 1, 2])
>>> my_arr[:, 0]
array([0, 3, 6])
>>> my_arr[:2, :1]
array([[0],
       [3]])
>>> my_arr[0:2, 0:2]
array([[0, 1],
       [3, 4]])
>>> my_arr[[0, 2], :]
array([[0, 1, 2],
       [6, 7, 8]])
>>> my_arr[::-1]
array([[6, 7, 8],
       [3, 4, 5],
       [0, 1, 2]])

针对上述代码,大家要对照每行代码的输出弄明白为什么会输出上述结果。为了方便大家的理解,使用更加形象化的图形方式来做个说明:
在这里插入图片描述


三、遍历

除了索引和切片之外,我们还可以对 ndarray 进行遍历操作。我们通过实例来看下 ndarray 的遍历。

>>> import numpy as np
>>>
>>> my_arr = np.arange(9)
>>> for i in my_arr:
...     print(i)
...
...
0
1
2
3
4
5
6
7
8

上面代码使用 for 循环对 ndarray 进行遍历,输出了 ndarray 中的所有元素。同样的,可以对二维数组进行遍历,例如:

>>> import numpy as np
>>>
>>> my_arr = np.arange(9).reshape((3,3))
>>> for r in my_arr:
...     print(r)
...
...
[0 1 2]
[3 4 5]
[6 7 8]

上述代码会把每行元素组成的一维数组作为一个二维数组的元素进行遍历。输出了三个一维数组。我们还可以使用一个二重循环来遍历二维数组中的每一个元素,例如:

>>> import numpy as np
>>>
>>> my_arr = np.arange(9).reshape((3,3))
>>> for r in my_arr:
...     for c in r:
...         print(c)
...
...
...
0
1
2
3
4
5
6
7
8

上述代码便遍历了二维数组中的每一个元素。除了使用二重循环外,我们还可以首先将二维数组进行平铺,然后使用一重循环进行遍历,例如:

>>> import numpy as np
>>>
>>> my_arr = np.arange(9).reshape((3,3))
>>> for i in my_arr.flatten():
...     print(i)
...
...
0
1
2
3
4
5
6
7
8

除了对二维数组进行平铺外,我们还可以使用 np.nditer() 函数,在使用 np.nditer() 时,可以指定行优先或者列优先,例如,首先来看行优先:

>>> import numpy as np
>>>
>>> my_arr = np.arange(9).reshape((3,3))
>>>
>>> # 行优先
>>> for i in np.nditer(my_arr, order='C'):
...     print(i)
...
...
0
1
2
3
4
5
6
7
8

列优先:

>>> import numpy as np
>>>
>>> my_arr = np.arange(9).reshape((3,3))
>>>
>>> # 列优先
>>> for i in np.nditer(my_arr, order='F'):
...     print(i)
...
...
0
3
6
1
4
7
2
5
8

总结

本章介绍了ndarray的索引、切片和遍历。
上一章 ndarray的基本操作
下一章 ndarray的重塑、组合和拆分

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐