在python&numpy中切片(slice)

上文说到了，在数据挖掘中使用的频率很高，而切片的操作同样是如此。在从文本文件或数据库中读取数据后，需要对数据进行预处理的操作。此时就需要对数据进行变换，切片，来生成自己需要的数据形式。

对于一维数组来说，python 原生的 list 和 numpy 的 array 的切片操作都是相同的。无非是记住一个规则

arr_name[start: end: step]

, 就可以了。

实例：

下面是几个特殊的例子：

```
[:]
```
表示复制源列表
负的 index 表示，从后往前。-1 表示最后一个元素。

相对于一维数组而言，二维（多维）数组用的会更多。一般语法是

arr_name[行操作, 列操作]

先随机产生一个 3*4 的数组。

in:arr = np.arange(12).reshape((3, 4)) 
out:
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

取行数据

arr[i, :] #取第i行数据
arr[i:j, :] #取第i行到第j行的数据

取列数据（注意数据格式）

in:arr[:,0] # 取第0列的数据，以行的形式返回的
out:
array([0, 4, 8])
in:arr[:,:1] # 取第0列的数据，以列的形式返回的
out:
array([[0],
       [4],
       [8]])

取一个数据块

# 取第一维的索引1到索引2之间的元素，也就是第二行 
# 取第二维的索引1到索引3之间的元素，也就是第二列和第三列
in:arr[1:2, 1:3] 
out: 
array([[5, 6]])
 # 取第一维的全部 
 # 按步长为2取第二维的索引0到末尾之间的元素，也就是第一列和第三列
in: arr[:, ::2]
out: 
array([[ 0,  2],
       [ 4,  6],
       [ 8, 10]])

参考文献

来源: http://www.cnblogs.com/Sinte-Beuve/p/6573246.html

与本文相关文章

暂无,快来抢沙发吧！