20 数组高阶操作函数(下)

Numpy 提供了一系列针对数组操作的高阶函数,除了比较常见的合并,还有分割、追加、插入等操作。

1. 数组的分割

1.1 numpy.split 函数

numpy.split 函数将数组的副本沿指定轴划分为子数组。该函数的原型如下:

numpy.split(arr, indices_or_sections, axis=0)

参数说明如下:

参数 说明
arr 待拆分的输入数组
indices_or_sections 整数,表示要从输入数组创建的相等大小的子数组的数量。如果是1-D数组,则条目指示要创建新子数组的点。
axis 连接数组的轴的方向,默认值为0

案例

对于一维数组的情形,非常简单。创建1维数组:

arr_1 = np.array([12, 23, 34, 45, 56, 67, 78, 89, 100, 110, 120, 130])

利用numpy.split函数将arr_1等分为3块:

np.split(arr_1, 3)
out:
    [array([12, 23, 34, 45]), array([56, 67, 78, 89]), array([100, 110, 120, 130])]

当 indices_or_sections 参数为常数时,numpy.split 函数是讲数组进行等分。对于无法等分的情况,会报 ValueError 的错误。

当 indices_or_sections 参数为整数列表时,表示按照以整数为位置索引进行分割:

np.split(arr_1, [3, 6])
out:
    [array([12, 23, 34]), array([45, 56, 67]), array([ 78,  89, 100, 110, 120, 130])]

案例

对于多维数组的情形,将内层的数组视为整体,仅考虑最外层的大小进行切割:

arr_2 = arr_1.reshape(6,2)
arr_2
out:
    array([[ 12,  23],
       [ 34,  45],
       [ 56,  67],
       [ 78,  89],
       [100, 110],
       [120, 130]])

对 arr_2 进行切割:

np.split(arr_2, 3)
out:
    [array([[12, 23],[34, 45]]), 
     array([[56, 67],[78, 89]]), 
     array([[100, 110],[120, 130]])]

案例

可以通过指定 axis 来限制实际产生分割的维度。例如,对 arr_2 控制分割点在水平位置(axis=1):

np.split(arr_2, 2, axis=1)
out:
    [array([[ 12],
        [ 34],
        [ 56],
        [ 78],
        [100],
        [120]]), array([[ 23],
        [ 45],
        [ 67],
        [ 89],
        [110],
        [130]])]

需要注意比较 axis=1 和默认(axis=0)参数时的区别。

1.2 numpy.hsplit 函数

numpy.hsplit 是 split() 函数的一个特例,其中 axis 为 1 表示水平分割,与输入数组的维度无关。

案例

对上述指定 axis=1(水平分割)时的分割效果,可以用 numpy.hsplit 改写如下:

np.hsplit(arr_2, 2)
out:
    [array([[ 12],
        [ 34],
        [ 56],
        [ 78],
        [100],
        [120]]), array([[ 23],
        [ 45],
        [ 67],
        [ 89],
        [110],
        [130]])]

1.3 numpy.vsplit 函数

numpy.vsplit 是 split() 函数的一个特例,其中 axis 为 1 表示垂直分割,与输入数组的维度无关。

案例

对于上述指定 axis=0(默认参数)时的分割效果,可以用 numpy.vsplit 改写如下:

np.vsplit(arr_2, 3)
out:
    [array([[12, 23],[34, 45]]), 
     array([[56, 67],[78, 89]]), 
     array([[100, 110],[120, 130]])]

2. 数组追加

2.1 numpy.append 函数

numpy.append 函数可以在输入数组末尾,追加一个尺寸匹配的数组,与列表中 append 的操作类似。但是输入数组的尺寸必须匹配,否则将生成 ValueError。该函数的原型如下:

numpy.append(arr, values, axis)

参数说明如下:

参数 说明
arr 输入数组
values 待追加的数组,values在不包括附加轴的情况下,其形状需与arr保持一致
axis 附加操作的轴。如果没有给出,则两个参数会先折叠为一维

案例

以二维数组为例,对 arr_2 的 axis=0 方向追加数组:

np.append(arr_2, [[1, 2]], axis=0)
out:
    array([[ 12,  23],
       [ 34,  45],
       [ 56,  67],
       [ 78,  89],
       [100, 110],
       [120, 130],
       [  1,   2]])

案例

以二维数组为例,对 arr_2 的 axis=1 方向追加数组:

np.append(arr_2, [[1], [2], [3], [4], [5], [6]], axis=1)
out:
    array([[ 12,  23,   1],
       [ 34,  45,   2],
       [ 56,  67,   3],
       [ 78,  89,   4],
       [100, 110,   5],
       [120, 130,   6]])

案例

当不指定 axis 时,在追加动作产生前,会先把输入数组展平:

np.append(arr_2, [[1], [2], [3], [4], [5], [6]])
out:
    array([ 12,  23,  34,  45,  56,  67,  78,  89, 100, 110, 120, 130,   1, 2,   3,   4,   5,   6])

当不指定axis时,append结果为一维数组。

3. 数组的插入

3.1 numpy.insert 函数

numpy.insert 函数沿给定轴和给定索引之前在输入数组中插入值。该函数的原型如下:

numpy.insert(arr, obj, values, axis)

参数说明如下:

参数 说明
arr 输入数组
obj 待插入位置的索引
values 待插入的值数组
axis 要插入的轴。如果没有指定,则输入数组会先折叠为一维

案例

对于不指定 axis 的情形:

np.insert(arr_2, 2, [123, 456])
out:
    array([ 12,  23, 123, 456,  34,  45,  56,  67,  78,  89, 100, 110, 120, 130])

可以发现,对于 insert 函数,新插入的元素从指定的位置(索引为2)开始,其他元素往后平移。

案例

指定在 axis=0 的轴上插入新元素:

np.insert(arr_2, 2, [123, 456], axis=0)
out:
    array([[ 12,  23],
       [ 34,  45],
       [123, 456],
       [ 56,  67],
       [ 78,  89],
       [100, 110],
       [120, 130]])

案例

当指定插入的元素跟输入数组形状不一致时,可以通过广播规则进行传播补齐。当不满足广播规则,则会报 ValueError 的错误。

np.insert(arr_2, 2, [123], axis=0)
out:
    array([[ 12,  23],
       [ 34,  45],
       [123, 123],
       [ 56,  67],
       [ 78,  89],
       [100, 110],
       [120, 130]])

案例

指定在 axis=1 的轴上插入新元素:

np.insert(arr_2, 2, [1, 2, 3, 4, 5, 6], axis=1)
out:
    array([[ 12,  23,   1],
       [ 34,  45,   2],
       [ 56,  67,   3],
       [ 78,  89,   4],
       [100, 110,   5],
       [120, 130,   6]])

4. 小结

本节讲述了数组分割与追加的常用方法,其中append函数与insert函数在不指定操作轴的时候,函数会首先对输入数组进行展开操作。而hsplit和vsplit则是已经默认了计算方向,使用过程中注意区分。