这里有新鲜出炉的Python3 Cookbook中文版,程序狗速度看过来!
起步
对于一些字符,python2和python3的md5加密出来是不一样的.
- # python2.7
- pwd = "xxx" + chr(163) + "fj"
- checkcode = hashlib.md5(pwd).hexdigest()
- print checkcode # ea25a328180680aab82b2ef8c456b4ce
- # python3.6
- pwd = "xxx" + chr(163) + "fj"
- checkcode = hashlib.md5(pwd.encode("utf-8")).hexdigest()
- print(checkcode) # b517e074034d1913b706829a1b9d1b67
按代码差异来将,就是在
中需要对字符串进行
- python3
操作,如果没有则会报错:
- encode
- checkcode = hashlib.md5(pwd).hexdigest()
- TypeError: Unicode-objects must be encoded before hashing
这是因为加密时需要将字符串转化为
类型,3默认编码是
- bytes
.所以我用utf-8进行解码.
- utf-8
分析
如果字符串中没有
,那么两个版本结果是一致的,也就是说问题出在这个
- chr(163)
中:
- chr(163)
- # python2.7
- >>> chr(163)
- '\xa3'
- # python3.6
- >>> chr(163)
- '\xa3'
在这里说明通过
得到的结果是一致的, 将它转为
- chr
类型看看:
- bytes
- # python2.7
- >>> bytes(chr(163))
- '\xa3'
- # python3.6
- >>> chr(163).encode()
- b'\xc2\xa3'
python3中,在
的时候,使用
- num<128
得到的是
- chr(num).encode('utf-8')
字符的ascii十六进制,而
- 一个
的时候,使用
- num>128
得到的是
- chr(num).encode('utf-8')
字节的ascii十六进制.
- 两个
解决
改用
编码进行解码:
- latin1
- # python3.6
- pwd = "xxx" + chr(163) + "fj"
- checkcode = hashlib.md5(pwd.encode("latin1")).hexdigest()
- print(checkcode) # ea25a328180680aab82b2ef8c456b4ce
额外
为什么是
编码呢.答案还是挺有意思的.
- latin1
先说chr函数,通过
可以查看:
- help(chr)
- chr(...)
- chr(i) -> Unicode character
- Return a Unicode string of one character with ordinal i; 0 <= i <= 0x10ffff.
意思是它返回Unicode编码中指定位置的一个字符.python3内部也是用Unicode表示左右字符,即str类型.而通过
后会编码成
- encode
类型.
- bytes
ascii编码中每个字符编码是一个byte,但只有1-127. 超过的部分128-255则属于
,python3 中默认的ascii中不包含这部分,所以如果执行 chr(163).encode("ascii") 就会报错 'ascii' codec can't encode character '\xa3' in position 3: ordinal not in range(128)
- Extended ASCII
因此需要一个含有128-255中的部分字符的编码,且采用1个Byte固定大小编码,比如
,也就是
- ISO 8859-1
.当然还有其他编码如
- latin1
也包含这些字符的.
- cp1252
来源: http://www.phperz.com/article/17/1023/351359.html