字典的简单介绍
字典 (dict) 是 python 中唯的个映射类型. 他是以 { } 括起来的键值对组成.
在 dict 中 key 是 唯的. 在保存的时候, 根据 key 来计算出个内存地址. 然后将 key-value 保存在这个地址中.
这种算法被称为 hash 算法, 所以, 切记, 在 dict 中存储的 key-value 中的 key 必须是可 hash 的, 如果你搞不懂什么是可哈希, 暂时可以这样记,
可以改变的都是不可哈希的, 那么可哈希就意味着不可变. 这个是为了能准确的计算内存地址规定的.
已知的可哈希 (不可变) 的数据类型: int, str, tuple, bool 不可哈希 (可变) 的数据类型: list, dict, set
语法:{'key1':1,'key2':2}
注意: key 必须是不可变 (可哈希) 的. value 没有要求. 可以保存任意类型的数据
# 合法
dic = {123: 456, True: 999, "id": 1, "name": 'sylar', "age": 18, "stu": ['帅
哥','美'], (1, 2, 3):'麻花藤'}
- print(dic[123])
- print(dic[True])
- print(dic['id'])
- print(dic['stu'])
- print(dic[(1, 2, 3)])
- # 不合法
- # dic = {
- [1, 2, 3]: '周杰伦'
- } # list 是可变的. 不能作为 key
- # dic = {
- {
- 1: 2
- }: "哈哈哈"
- } # dict 是可变的. 不能作为 key
- dic = {
- {
- 1, 2, 3
- }: '呵呵呵'
- } # set 是可变的, 不能作为 key
注意: dict 保存的数据不是按照我们添加进去的顺序保存的. 是按照 hash 表的顺序保存的. hash 表 不是连续的. 所以不能进切片作. 它只能通过 key 来获取 dict 中的数据
字典操作:
增
- dic = {
- }
- dic['name'] = '汪峰'
- dic['age'] = 18
- print(dic)
结果:
- {
- 'name': '汪峰', 'age': 18
- }
- # 如果 dict 中没有出现这个 key, 就会将 key-value 组合添加到这个字典中
- # 如果 dict 中没有出现过这个 key-value. 可以通过 setdefault 设置默认值
- s1 = dic.setdefault('王菲')
- print(s1)
- print(dic)
结果:
- None
- # 返回的是添加进去的值
- {
- '王菲': None
- }
- # 我们使用 setdefault 这个方法 里边放的这个内容是我们字典的健, 这样我们添加出来的结果
就是值是一个 None
- dic.setdefault('王菲', 歌手)
- # 这样就是不会进行添加操作了, 因为王菲在 dic 这个字典中存在
- # 总结: 当 setdefault 中第一个参数存在这个字典中就就不进行添加操作, 否则就添加
- dic1 = {
- }
- s2 = dic1.setdefault('王菲','歌手')
- print(s2)
- print(dic1)
结果:
歌手
{'王菲': '歌手'}
删
- dic = {
- '剑圣':'易','哈啥给':'剑豪','大宝剑':'盖伦'
- }
- s = dic.pop('哈啥给') # pop 删除有返回值, 返回的是被删的值
- print(s)
- print(dic) # 打印删除后的字典
- dic.popitem() # 随机删除 python3.6 是删除最后一个
- print(dic)
- dic.clear() # 清空
改
- dic = {
- '剑圣':'易','哈啥给':'剑豪','大宝剑':'盖伦'
- }
- dic['哈啥给'] = '剑姬' # 当哈啥给是字典中的健这样写就是修改对应的值, 如果不存在就是添加
- print(dic)
- dic.update({
- 'key':'v','哈啥给':'剑姬'
- })
- # 当 update 中的字典里没有 dic 中键值对就添加到 dic 字典中, 如果有就修改里边的对应的值
- print(dic)
查
- dic = {
- '剑圣':'易','哈啥给':'剑豪','大宝剑':'盖伦'
- }
- s = dic['大宝剑'] #通过健来查看, 如果这个健不在这个字典中. 就会报错
- print(s)
- s1 = dic.get('剑圣') #通过健来查看, 如果这个健不在这个字典中. 就会返回 None
- print(s1)
- s2 = dic.get('剑姬','没有还查你是不是傻') # 我们可以在 get 查找的时候自己定义返回的结果
- print(s2)
练习
dic = {'k1': "v1", "k2": "v2", "k3": [11,22,33]}
请在字典中添加一个键值对,"k4": "v4", 输出添加后的字典
请在修改字典中 "k1" 对应的值为 "alex", 输出修改后的字典
请在 k3 对应的值中追加一个元素 44, 输出修改后的字典
请在 k3 对应的值的第 1 个位置插入个元素 18, 输出修改后的字典
其他操作
- key_list = dic.keys()
- print(key_list)
结果:
- dict_keys(['剑圣', '哈啥给', '大宝剑'])
- # 一个高仿列表, 存放的都是字典中的 key
- value_list = dic.values()
- print(value_list)
结果:
- dict_values(['易', '剑豪', '盖伦'])
- # 一个高仿列表, 存放都是字典中的 value
- key_value_list = dic.items()
- print(key_value_list)
结果:
- dict_items([('剑圣', '易'), ('哈啥给', '剑豪'), ('大宝剑', '盖伦')])
- # 一个高仿列表, 存放是多个元祖, 元祖中第一个是字典中的键, 第二个是字典中的值
练习
循环打印字典的值
循环打印字典的键
循环打印元祖形式的键值对
- dic = {'剑圣':'易','哈啥给':'剑豪','大宝剑':'盖伦'}
- for i in dic:
- print(i)
结果:
易
剑豪
盖伦
- for i in dic.keys():
- print(i)
结果:
易
剑豪
盖伦
循环打印字典中的键
- dic = {'剑圣':'易','哈啥给':'剑豪','大宝剑':'盖伦'}
- for i in dic:
- print(dic[i])
结果:
易
剑豪
盖伦
- for i in dic.values():
- print(i)
结果:
易
剑豪
盖伦
循环打印字典中的值
- dic = {'剑圣':'易','哈啥给':'剑豪','大宝剑':'盖伦'}
- for i in dic.items():
- print(i)
结果:
- ('剑圣', '易')
- ('哈啥给', '剑豪')
- ('大宝剑', '盖伦')
循环打印元祖形式的键值对
解构
- a,b = 1,2
- print(a,b)
结果:
- 1 2
- a,b = ('你好','世界')
- print(a,b)
结果:
你好 世界
- a,b = ['你好','大飞哥']
- print(a,b)
结果:
你好 世界
- a,b = {
- '汪峰':'北京北京','王菲':'天后'
- }
- print(a,b)
结果:
汪峰 王菲
循环字典获取键和值
- for k,v in dic.items():
- print('这是键',k)
- print('这是值',v)
结果:
这是键 剑圣
这是值 易
这是键 哈啥给
这是值 剑豪
这是键 大宝剑
这是值 盖伦
字典的嵌套
- dic = {
- 'name':'汪峰',
- 'age':48,
- 'wife':[{'name':'国际章','age':38}],
- 'children':['第一个熊孩子','第二个熊孩子']
- }
获取汪峰的妻子名字
- d1 = dic['wife'][0]['name']
- print(d1)
获取汪峰的孩子们
- d2 = dic['children']
- print(d2)
获取汪峰的第一个孩子
- d3 = dic['children'][0]
- print(d3)
练习
- dic1 = {
- 'name':['alex',2,3,5],
- 'job':'teacher',
- 'oldboy':{'alex':['python1','python2',100]}
- }
1, 将 name 对应的列表追加个元素'wusir'.
2, 将 name 对应的列表中的 alex 字写.
3,oldboy 对应的字典加个键值对'男孩','linux'.
4, 将 oldboy 对应的字典中的 alex 对应的列表中的 python2 删除
小数据池
接下来我们学习下小数据池, 在学小数据池之前我们来看下代码块
根据提示我们从官方文档找到了这样的说法:
- A Python program is constructed from code blocks. A block is a piece of Python program text that is executed as a unit. The following are blocks: a module, a function body, and a class definition. Each command typed interactively is a block. A script file (a file given as standard input to the interpreter or specified as a command line argument to the interpreter) is a code block. A script command (a command specified on the interpreter command line with the '-c' option) is a code block. The string argument passed to the built-in functions eval() and exec() is a code block.
- A code block is executed in an execution frame. A frame contains some administrative information (used for debugging) and determines where and how execution continues after the code block's execution has completed.
上面的主要意思是:
Python 程序是由代码块构造的. 块是一个 python 程序的文本, 他是作为一个单元执行的.
代码块: 一个模块, 一个函数, 一个类, 一个文件等都是一个代码块.
而作为交互方式输入的每个命令都是一个代码块.
什么叫交互方式? 就是咱们在 cmd 中进入 Python 解释器里面, 每一行代码都是一个代码块, 例如:
而对于一个文件中的两个函数, 也分别是两个不同的代码块:
OK, 那么现在我们了解了代码块, 我们就来看看小数据池和代码块有啥关系,
id is ==
在 Python 中, id 是什么? id 是内存地址, 比如你利用 id()内置函数去查询一个数据的内存地址:
- name = 'meet'
- s_id = id(name) # 通过内置方法获取 name 变量对应的值在内存中的编号
- print(s_id) # 2055782908568 这就是 name 在内存中的编号
那么 is 是什么? == 又是什么?
== 是比较的两边的数值是否相等, 而 is 是比较的两边的内存地址是否相等. 如果内存地址相等, 那么这两边其实是指向同一个内存地址.
可以说如果内存地址相同, 那么值肯定相同, 但是如果值相同, 内存地址不一定相同, 如图:
这就很神奇了, 刚刚还不是一个内存地址呢, 现在怎么又是一个内存地址了, 其中神奇之处就是我们的小数据池
小数据池, 也称为小整数缓存机制, 或者称为驻留机制等等. 那么到底什么是小数据池? 他有什么作用呢?
注意: 小数据池, 只针对, 整数, 字符串, bool 值
官方对于整数, 字符串的小数据池是这么说的:
对于整数, Python 官方文档中这么说:
The current implementation keeps an array of integer objects for all integers between -5 and 256, when you create an int in that range you actually just get back a reference to the existing object. So it should be possible to change the value of 1. I suspect the behaviour of Python in this case is undefined.
对于字符串:
Incomputer science, string interning is a method of storing only onecopy of each distinct string value, which must be immutable. Interning strings makes some stringprocessing tasks more time- or space-efficient at the cost of requiring moretime when the string is created or interned. The distinct values are stored ina string intern pool. - 引自维基百科
在 python 中对 - 5 到 256 之间的整数会被驻留在内存中. 将定规则的字符串缓存. 在使 的时候, 内存中只会创建个该数据的对象. 保存在数据池中. 当使的时候直接从数据 池中获取对象的内存引. 不需要创建个新的数据. 这样会节省更多的内存区域.
优点:
能够提些字符串, 整数的处理速度. 省略的创建对象的过程.
缺点:
在'池'中创建或者插入新的内容会花费更多的时间.
对于数字:
-5~256 是会被加到数据池中的. 每次使都是同个对象.
对于字符串:
1. 如果字符串的度是 0 或者 1, 都会默认进缓存
2. 字符串度于 1, 但是字符串中只包含字, 数字, 下划线时才会缓存
3. 乘法的到的字符串.
1. 乘数为 1, 仅包含数字, 字, 下划线时会被缓存. 如果 包含其他字符, 度<=1 也会被驻存
2. 乘数于 1 . 仅包含数字, 字, 下划 线这个时候会被缓存. 但字符串度不能于 20 4. 指定驻留. 我们可以通过 sys 模块中的 intern()函数来指定要驻留的内容.
OK. 到前为. 我们已经了解了 python 的数据池的些基本情况了. 但是!!!!
还有最后 个问题. 数据池和最开始的代码块有什么关系呢?
同样的段代码在命令窗和在 py 件中. 出现的效果是完全不样的.
注意. 在 py 件中. 得到的结果是 True, 但是在 cmd 中就不是了.
在代码块内的缓存机制是不样的. 在执同个代码块的初始化对象的命令时, 会检 查是否其值是否已经存在, 如果存在, 会将其重.
换句话说: 执同个代码块时, 遇到初始 化对象的命令时, 他会将初始化的这个变量与值存储在个字典中, 在遇到新的变量时, 会先 在字典中查询记录,
如果有同样的记录那么它会重复使这个字典中的之前的这个值. 所以在 你给出的例中, 件执时(同个代码块) 会把 a, b 两个变量指向同个对象.
如果是不同的代码块, 他就会看这个两个变量是否是满数据池的数据, 如果是满 数据池的数据则会指向同个地址.
所以: a, b 的赋值语句分别被当作两个代码块执, 但是他们不满数据池的数据所以会得到两个不同的对象, 因 is 判断返回 False
集合(set)
set 集合是 python 的个基本数据类型. 般不是很常. set 中的元素是不重复的. 序的. 的元素必须是可 hash 的 (int, str, tuple,bool), 我们可以这样来记. set 就是 dict 类型的数据但 是不保存 value, 只保存 key. set 也{} 表
注意: set 集合中的元素必须是可 hash 的, 但是 set 本是不可 hash 得. set 是可变的.
- set1 = {
- '1','alex',2,True,[1,2,3]
- } # 报错
- set2 = {
- '1','alex',2,True,{
- 1:2
- }
- } # 报错
- set3 = {
- '1','alex',2,True,(1,2,[2,3,4])
- } # 报错
set 中的元素是不重复的, 且序的.
- s = {
- "周杰伦", "周杰伦", "周星星"
- }
- print(s)
结果:
{'周星星', '周杰伦'}
使这个特性. 我们可以使 set 来去掉重复
- # 给 list 去重复
- lst = [45, 5, "哈哈", 45, '哈哈', 50]
- lst = list(set(lst)) # 把 list 转换成 set, 然后再转换回 list
- print(lst)
set 集合增删改查
增加
- s = {
- "刘嘉玲", '关之琳', "王祖贤"
- }
- s.add("郑裕玲")
- print(s)
- s.add("郑裕玲") # 重复的内容不会被添加到 set 集合中
- print(s)
- s = {
- "刘嘉玲", '关之琳', "王祖贤"
- }
- s.update("麻花藤") # 迭代更新
- print(s)
- s.update(["张曼", "李若彤","李若彤"])
- print(s)
删除
- s = {
- "刘嘉玲", '关之琳', "王祖贤","张曼", "李若彤"
- }
- item = s.pop() # 随机弹出个.
- print(s)
- print(item)
- s.remove("关之琳") # 直接删除元素
- # s.remove("疼") # 不存在这个元素. 删除会报错
- print(s)
- s.clear() # 清空 set 集合. 需要注意的是 set 集合如果是空的. 打印出来是 set() 因为要和
dict 区分的.
print(s) # set()
修改
- # set 集合中的数据没有索引. 也没有办法去定位个元素. 所以没有办法进直接修改.
- # 我们可以采先删除后添加的式来完成修改操作
- s = {
- "刘嘉玲", '关之琳', "王祖贤","张曼", "李若彤"
- }
- # 把刘嘉玲改成赵本
- s.remove("刘嘉玲")
- s.add("赵本")
- print(s)
查询
- # set 是个可迭代对象. 所以可以进 for 循环
- for el in s:
- print(el)
常操作
- s1 = {
- "刘能", "赵四", ""}
- s2 = {"刘科", "冯乡", ""}
- # 交集
- # 两个集合中的共有元素
- print(s1 & s2) # {''}
- print(s1.intersection(s2)) # {''}
- # 并集
- print(s1 | s2) # {'刘科', '冯乡', '赵四', '', '刘能'}
- print(s1.union(s2)) # {'刘科', '冯乡', '赵四', '', '刘能'}
- # 差集
- print(s1 - s2) # {'赵四', '刘能'} 得到第个中单独存在的
- print(s1.difference(s2)) # {'赵四', '刘能'}
- # 反交集
- print(s1 ^ s2) # 两个集合中单独存在的数据 {'冯乡', '刘能', '刘科', '赵四'}
- print(s1.symmetric_difference(s2)) # {'冯乡', '刘能', '刘科', '赵四'}
- s1 = {"刘能", "赵四"}
- s2 = {"刘能", "赵四", ""
- }
- # 集
- print(s1 <s2) # set1 是 set2 的集吗? True
- print(s1.issubset(s2))
- # 超集
- print(s1> s2) # set1 是 set2 的超集吗? False
- print(s1.issuperset(s2))
set 集合本是可以发改变的. 是不可 hash 的. 我们可以使 frozenset 来保存数据. frozenset 是不可变的. 也就是个可哈希的数据类型
- s = frozenset(["赵本", "刘能", "", "跪"])
- dic = {
- s:'123'
- } # 可以正常使了
- print(dic)
这个不是很常. 了解下就可以了
来源: https://www.cnblogs.com/guobaoyuan/p/9824286.html