上文说到了,在数据挖掘中使用的频率很高,而切片的操作同样是如此。在从文本文件或数据库中读取数据后,需要对数据进行预处理的操作。此时就需要对数据进行变换,切片,来生成自己需要的数据形式。
对于一维数组来说,python 原生的 list 和 numpy 的 array 的切片操作都是相同的。无非是记住一个规则
, 就可以了。
- arr_name[start: end: step]
实例:
下面是几个特殊的例子:
表示复制源列表
- [:]
相对于一维数组而言,二维(多维)数组用的会更多。一般语法是
先随机产生一个 3*4 的数组。
- arr_name[行操作, 列操作]
- in:arr = np.arange(12).reshape((3, 4))
- out:
- array([[ 0, 1, 2, 3],
- [ 4, 5, 6, 7],
- [ 8, 9, 10, 11]])
- arr[i, :] #取第i行数据
- arr[i:j, :] #取第i行到第j行的数据
- in:arr[:,0] # 取第0列的数据,以行的形式返回的
- out:
- array([0, 4, 8])
- in:arr[:,:1] # 取第0列的数据,以列的形式返回的
- out:
- array([[0],
- [4],
- [8]])
- # 取第一维的索引1到索引2之间的元素,也就是第二行
- # 取第二维的索引1到索引3之间的元素,也就是第二列和第三列
- in:arr[1:2, 1:3]
- out:
- array([[5, 6]])
- # 取第一维的全部
- # 按步长为2取第二维的索引0到末尾之间的元素,也就是第一列和第三列
- in: arr[:, ::2]
- out:
- array([[ 0, 2],
- [ 4, 6],
- [ 8, 10]])
来源: http://www.cnblogs.com/Sinte-Beuve/p/6573246.html