python 列表 (list) 的使用技巧及高级操作

个人分类: python 数据分析 Python

1, 合并列表(extend)

跟元组一样, 用加号 (+) 将两个列表加起来即可实现合并:

In [1]: x=list(range(1, 13, 2))
In [2]: x + ['b', 'a']
Out[2]: [1, 3, 5, 7, 9, 11, 'b', 'a']

对于已定义的列表, 可以用 extend 方法一次性添加多个元素:

In [7]: x2=[3, 6, 1]
In [8]: x.extend(x2)
In [9]: x
Out[9]: [1, 3, 5, 7, 9, 11, 3, 6, 1, 3, 6, 1, 3, 6, 1]

需要说明的是: 加号 (+) 执行列表的合并是非常浪费资源的, 因为必须创建一个新列表并将所有对象复制过去, 而用 extend 将元素附加到现有列表 (尤其是在构建一个大列表时) 就会好很多.

因此, 在进行列表合并操作时, 尤其是对于大数据量的列表合并, 强烈建议使用 extend 函数.

2, 列表排序(sort)

列表的 sort 方法可以实现就地排序(无需创建新对象, 字符串按首字母进行排序):

In [10]: a=[1, 5, 3, -3, 0]
In [11]: a.sort()
In [12]: a
Out[12]: [-3, 0, 1, 3, 5]
In [13]: s=['a','ab','3e','z']
In [14]: s.sort()
In [15]: s
Out[15]: ['3e', 'a', 'ab', 'z']

sort 有几个很好用的选项, 一个是次要排序键, 即一个能够产生可用于排序的值的函数. 如可以通过长度对一组字符串进行排序:

In [16]: b=['a','nl','drz','mowgt','aa']
In [17]: b.sort(key=len)
In [18]: b
Out[18]: ['a', 'nl', 'aa', 'drz', 'mowgt']

再比如是否进行降序排列, 如下面通过对首字母进行降序排列的示例:

In [21]: b.sort(key= lambda x:x[0], reverse=True)
In [22]: b
Out[22]: ['nl', 'mowgt', 'drz', 'a', 'aa']

3, 二分搜索及维护有序列表(bisect)

内置的 bisect 模块实现了二分查找以及对有序列表的插入操作. bisect.bisect 可以找出新元素应该被插入到哪个位置以保持元列表的有序性, bisect.insort 则将新元素插入到那个正确的位置上.

In [23]: import bisect
In [24]: c=[1,2,1,-1,4,5]
In [25]: c.sort()
In [26]: bisect.bisect(c, 2)
Out[26]: 4
In [27]: bisect.insort(c, 4)
In [28]: c
Out[28]: [-1, 1, 1, 2, 4, 4, 5]

注意: bisect 模块的函数不会判断原列表是否有序, 因为这样做开销太大; 因此将他们用作无序列表时虽然不会出错, 但可能会导致不正确的结果. 基于此, 建议在使用 bisect 模块的函数前, 先对原列表执行排序的操作.

3, 切片 (索引运算符[] 及 start:stop)

可以对序列类型 (数组, 列表, 元组等) 进行切片操作, start 索引处元素被包括在切片的结果中, stop 索引处的元素未被包括在结果中, 元素数量为 stop-start.start 或 stop 都是可以省略的, 此时他们分别默认为序列的起始处和结尾处.

还可以在第二个冒号后加上步长(step), 比如每隔一位取一个元素:

In [35]: d=[x for x in range(10)]
In [36]: d
Out[36]: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
In [37]: e=d[:8:2]
In [38]: e
Out[38]: [0, 2, 4, 6]

可以巧妙的使用 -1 , 实现对列表或元素的反序, 如下:

In [40]: f=d[::-1]
In [41]: f
Out[41]: [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

4, 列表内置的序列函数

4.1 enumerate

enumerate 函数可以逐个返回序列的 (i, value) 元组, 如下示例:

In [43]: #for i value in enumerate(collection):
In [44]: #用 i, value 做一些事情
In [49]: slist=['qin', 'wang', 'wqc']
In [50]: mapping = dict((v, i) for i, v in enumerate(list))
In [51]: mapping
Out[51]: {
	'qin': 0, 'wang': 1, 'wqc': 2	
}
4.2 sorted

sorted 函数可以将任何序列返回为一个新的有序列表(注意: sort 函数是就地排序), 如下:

In [59]: sorted(['z', 'd', 'c', 'n'])
Out[59]: ['c', 'd', 'n', 'z']
In [60]: sorted('my name is chaogo')
Out[60]:
['',' ',' ','a','a','c','e','g','h','i','m','m','n','o','o','s','y']

常常将 sorted 和 set 结合起来使用以得到一个由序列中的唯一元素构成的有序列表:

In [61]: set(sorted('my name is chaogo'))
Out[61]: {
	'','a','c','e','g','h','i','m','n','o','s','y'}
In [62]: sorted(set('my name is chaogo'))
Out[62]: ['','a','c','e','g','h','i','m','n','o','s','y']
In [63]: set('my name is chaogo')
Out[63]: {'','a','c','e','g','h','i','m','n','o','s','y'	
}

上面的结果都是一样的, 什么原因呢? 这是因为:(1)set 和 sorted 是对序列进行操作, 当参数不是序列时, 会默认转换为列表;(2)set 默认会对元素进行排序.

4.3 zip

zip 用于将多个序列 (列表, 元组等) 中的元素 "配对", 从而产生一个新的元组列表; zip 可以接受任意数量的序列, 最终得到的元组数量由最短的序列决定; zip 最常见的用法是同时迭代多个序列, 还可以结合 enumerate 一起使用, 如下:

In [77]: seq1 = ['chao', 'qing', 'wq']
In [78]: seq2 = ['qin', 'wang', 'qc']
In [79]: for i , (a,b) in enumerate(zip(seq1, seq2)):
...: print('%d: %s %s' % (i, a, b))
...:
0: chao qin
1: qing wang
2: wq qc

对于 "已压缩的"(zipped)序列, zip 还有一个很巧妙的用法, 即对该序列进行解压(unzip, 用 * 表示). 其实就是将一组行转换为一组列, 如下:

In [86]: pitchers = [('a','b'), (1,2), ('tmd','bat')]
In [87]: one, two = zip(*pitchers)
In [88]: one
Out[88]: ('a', 1, 'tmd')
In [89]: two
Out[89]: ('b', 2, 'bat')
4.4 reversed

用于按逆序迭代序列中的元素, 如下:

In [92]: [x for x in reversed([1, 2, 5, 3, -1])]
Out[92]: [-1, 3, 5, 2, 1]

来源: http://www.bubuko.com/infodetail-2814436.html

与本文相关文章

暂无,快来抢沙发吧！