个人分类: python 数据分析 Python
1, 合并列表(extend)
跟元组一样, 用加号 (+) 将两个列表加起来即可实现合并:
- In [1]: x=list(range(1, 13, 2))
- In [2]: x + ['b', 'a']
- Out[2]: [1, 3, 5, 7, 9, 11, 'b', 'a']
对于已定义的列表, 可以用 extend 方法一次性添加多个元素:
- In [7]: x2=[3, 6, 1]
- In [8]: x.extend(x2)
- In [9]: x
- Out[9]: [1, 3, 5, 7, 9, 11, 3, 6, 1, 3, 6, 1, 3, 6, 1]
需要说明的是: 加号 (+) 执行列表的合并是非常浪费资源的, 因为必须创建一个新列表并将所有对象复制过去, 而用 extend 将元素附加到现有列表 (尤其是在构建一个大列表时) 就会好很多.
因此, 在进行列表合并操作时, 尤其是对于大数据量的列表合并, 强烈建议使用 extend 函数.
2, 列表排序(sort)
列表的 sort 方法可以实现就地排序(无需创建新对象, 字符串按首字母进行排序):
- In [10]: a=[1, 5, 3, -3, 0]
- In [11]: a.sort()
- In [12]: a
- Out[12]: [-3, 0, 1, 3, 5]
- In [13]: s=['a','ab','3e','z']
- In [14]: s.sort()
- In [15]: s
- Out[15]: ['3e', 'a', 'ab', 'z']
sort 有几个很好用的选项, 一个是次要排序键, 即一个能够产生可用于排序的值的函数. 如可以通过长度对一组字符串进行排序:
- In [16]: b=['a','nl','drz','mowgt','aa']
- In [17]: b.sort(key=len)
- In [18]: b
- Out[18]: ['a', 'nl', 'aa', 'drz', 'mowgt']
再比如是否进行降序排列, 如下面通过对首字母进行降序排列的示例:
- In [21]: b.sort(key= lambda x:x[0], reverse=True)
- In [22]: b
- Out[22]: ['nl', 'mowgt', 'drz', 'a', 'aa']
3, 二分搜索及维护有序列表(bisect)
内置的 bisect 模块实现了二分查找以及对有序列表的插入操作. bisect.bisect 可以找出新元素应该被插入到哪个位置以保持元列表的有序性, bisect.insort 则将新元素插入到那个正确的位置上.
- In [23]: import bisect
- In [24]: c=[1,2,1,-1,4,5]
- In [25]: c.sort()
- In [26]: bisect.bisect(c, 2)
- Out[26]: 4
- In [27]: bisect.insort(c, 4)
- In [28]: c
- Out[28]: [-1, 1, 1, 2, 4, 4, 5]
注意: bisect 模块的函数不会判断原列表是否有序, 因为这样做开销太大; 因此将他们用作无序列表时虽然不会出错, 但可能会导致不正确的结果. 基于此, 建议在使用 bisect 模块的函数前, 先对原列表执行排序的操作.
3, 切片 (索引运算符[] 及 start:stop)
可以对序列类型 (数组, 列表, 元组等) 进行切片操作, start 索引处元素被包括在切片的结果中, stop 索引处的元素未被包括在结果中, 元素数量为 stop-start.start 或 stop 都是可以省略的, 此时他们分别默认为序列的起始处和结尾处.
还可以在第二个冒号后加上步长(step), 比如每隔一位取一个元素:
- In [35]: d=[x for x in range(10)]
- In [36]: d
- Out[36]: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
- In [37]: e=d[:8:2]
- In [38]: e
- Out[38]: [0, 2, 4, 6]
可以巧妙的使用 -1 , 实现对列表或元素的反序, 如下:
- In [40]: f=d[::-1]
- In [41]: f
- Out[41]: [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
4, 列表内置的序列函数
4.1 enumerate
enumerate 函数可以逐个返回序列的 (i, value) 元组, 如下示例:
- In [43]: #for i value in enumerate(collection):
- In [44]: #用 i, value 做一些事情
- In [49]: slist=['qin', 'wang', 'wqc']
- In [50]: mapping = dict((v, i) for i, v in enumerate(list))
- In [51]: mapping
- Out[51]: {
- 'qin': 0, 'wang': 1, 'wqc': 2
- }
- 4.2 sorted
sorted 函数可以将任何序列返回为一个新的有序列表(注意: sort 函数是就地排序), 如下:
- In [59]: sorted(['z', 'd', 'c', 'n'])
- Out[59]: ['c', 'd', 'n', 'z']
- In [60]: sorted('my name is chaogo')
- Out[60]:
- ['',' ',' ','a','a','c','e','g','h','i','m','m','n','o','o','s','y']
常常将 sorted 和 set 结合起来使用以得到一个由序列中的唯一元素构成的有序列表:
- In [61]: set(sorted('my name is chaogo'))
- Out[61]: {
- '','a','c','e','g','h','i','m','n','o','s','y'}
- In [62]: sorted(set('my name is chaogo'))
- Out[62]: ['','a','c','e','g','h','i','m','n','o','s','y']
- In [63]: set('my name is chaogo')
- Out[63]: {'','a','c','e','g','h','i','m','n','o','s','y'
- }
上面的结果都是一样的, 什么原因呢? 这是因为:(1)set 和 sorted 是对序列进行操作, 当参数不是序列时, 会默认转换为列表;(2)set 默认会对元素进行排序.
4.3 zip
zip 用于将多个序列 (列表, 元组等) 中的元素 "配对", 从而产生一个新的元组列表; zip 可以接受任意数量的序列, 最终得到的元组数量由最短的序列决定; zip 最常见的用法是同时迭代多个序列, 还可以结合 enumerate 一起使用, 如下:
- In [77]: seq1 = ['chao', 'qing', 'wq']
- In [78]: seq2 = ['qin', 'wang', 'qc']
- In [79]: for i , (a,b) in enumerate(zip(seq1, seq2)):
- ...: print('%d: %s %s' % (i, a, b))
- ...:
- 0: chao qin
- 1: qing wang
- 2: wq qc
对于 "已压缩的"(zipped)序列, zip 还有一个很巧妙的用法, 即对该序列进行解压(unzip, 用 * 表示). 其实就是将一组行转换为一组列, 如下:
- In [86]: pitchers = [('a','b'), (1,2), ('tmd','bat')]
- In [87]: one, two = zip(*pitchers)
- In [88]: one
- Out[88]: ('a', 1, 'tmd')
- In [89]: two
- Out[89]: ('b', 2, 'bat')
- 4.4 reversed
用于按逆序迭代序列中的元素, 如下:
- In [92]: [x for x in reversed([1, 2, 5, 3, -1])]
- Out[92]: [-1, 3, 5, 2, 1]
来源: http://www.bubuko.com/infodetail-2814436.html