这篇文章主要介绍了 escape 编码与 unescape 解码汉字出现乱码的解决方法, 需要的朋友可以参考下
Javascript 是一种由 Netscape 的 LiveScript 发展而来的原型化继承的基于对象的动态类型的区分大小写的客户端脚本语言,主要目的是为了解决服务器端语言,比如 Perl,遗留的速度问题,为客户提供更流畅的浏览效果。
今天的项目中遇到需要用 javascript 的 escape 编码汉字再用 unescape 解码的情况,测试代码段的时候出现了乱码的情况。
具体情况如下:
首先,用 EditPlus 打开测试页面 test.html,编辑如下 html 代码:
- <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
- <html xmlns="http://www.w3.org/1999/xhtml">
- <head>
- <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
- <title>
- unescape测试
- </title>
- </head>
- <body>
- <script>
- var teststr = escape("phperz");
- document.write(teststr);
- </script>
- </body>
- </html>
页面打印输出:
- �ű�֮��
此时可以看出情况不对,单从汉字对应的字符数量上来说已经不对了!
再使用如下代码测试 unescape 解码后的汉字:
- var relstr=unescape("�ű�֮��");
- document.write(relstr);
出现了乱码:�ű�֮��
解决方法:
用 Dreamweaver 打开 test.html 文件,发现了问题所在!
原先的那段
- var teststr=escape("phperz");
变成了
- var teststr=escape("ű֮");
可见是编辑器的初始编码造成的!
在 Dreamweaver 中将汉字改回来,重新运行 test.html,得到了对应的编码:
- 脚本之家
此时再用 unescape 解码:
- var relstr=unescape("脚本之家");
- document.write(relstr);
就得到了原先正确的汉字:phperz!
来源: