Unicode(统一码,万国码)是一种在计算机上使用的字符编码.它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由 16 位来表示(2 个字节),即:2**16 = 65536.
UTF-8,是对 Unicode 编码的压缩和优化,它不再使用最少 2 个字节,而是将所有的字符和符号进行分类:ASCII 码中的内容用 1 个字节保存,欧洲的字符用 2 个字节保存,东亚的字符用 3 个字节保存......
来源: http://www.bubuko.com/infodetail-2475182.html