数组去重复是一个常见的需求,我们暂时考虑同类型的数组去重复。主要是理清思路和考虑下性能。以下方法,有各人总结也有网上热心网友的方法,这里简单地总结一下。
Javascript 是一种由 Netscape 的 LiveScript 发展而来的原型化继承的基于对象的动态类型的区分大小写的客户端脚本语言,主要目的是为了解决服务器端语言,比如 Perl,遗留的速度问题,为客户提供更流畅的浏览效果。
面试前端必须准备的一个问题:怎样去掉 Javascript 的 Array 的重复项。据我所知,百度、腾讯、盛大等都在面试里出过这个题目。 这个问题看起来简单,但是其实暗藏杀机。 考的不仅仅是实现这个功能,更能看出你对计算机程序执行的深入理解。
我总共想出了三种算法来实现这个目的:
- Array.prototype.unique1 = function()
- {
- var n = []; //一个新的临时数组
- for(var i = 0; i < this.length; i++) //遍历当前数组
- {
- //如果当前数组的第i已经保存进了临时数组,那么跳过,
- //否则把当前项push到临时数组里面
- if (n.indexOf(this[i]) == -1) n.push(this[i]);
- }
- return n;
- }
- Array.prototype.unique2 = function()
- {
- var n = {},r=[]; //n为hash表,r为临时数组
- for(var i = 0; i < this.length; i++) //遍历当前数组
- {
- if (!n[this[i]]) //如果hash表中没有当前项
- {
- n[this[i]] = true; //存入hash表
- r.push(this[i]); //把当前数组的当前项push到临时数组里面
- }
- }
- return r;
- }
- Array.prototype.unique3 = function()
- {
- var n = [this[0]]; //结果数组
- for(var i = 1; i < this.length; i++) //从第二项开始遍历
- {
- //如果当前数组的第i项在当前数组中第一次出现的位置不是i,
- //那么表示第i项是重复的,忽略掉。否则存入结果数组
- if (this.indexOf(this[i]) == i) n.push(this[i]);
- }
- return n;
- }
其中第 1 种和第 3 种方法都用到了数组的 indexOf 方法。此方法的目的是寻找存入参数在数组中第一次出现的位置。很显然,js 引擎在实现这个方法的时候会遍历数组直到找到目标为止。所以此函数会浪费掉很多时间。 而第 2 中方法用的是 hash 表。把已经出现过的通过下标的形式存入一个 object 内。下标的引用要比用 indexOf 搜索数组快的多。
为了判断这三种方法的效率如何,我做了一个测试程序,生成一个 10000 长度的随机数组成的数组,然后分别用几个方法来测试执行时间。 结果表明第二种方法远远快于其他两种方法。 但是内存占用方面应该第二种方法比较多,因为多了一个 hash 表。这就是所谓的空间换时间。 就是这个测试页面,你也可以去看看。
根据 hpl 大牛的思路,我写了第四种方法:
- Array.prototype.unique4 = function()
- {
- this.sort();
- var re=[this[0]];
- for(var i = 1; i < this.length; i++)
- {
- if( this[i] !== re[re.length-1])
- {
- re.push(this[i]);
- }
- }
- return re;
- }
这个方法的思路是先把数组排序,然后比较相邻的两个值。 排序的时候用的 JS 原生的 sort 方法,JS 引擎内部应该是用的快速排序吧。 最终测试的结果是此方法运行时间平均是第二种方法的三倍左右,不过比第一种和第三种方法快了不少。
第五种方法
最近在做【搜索历史记录】功能也用到,开始用了 indexOf 方法,该方法在 ECMA5 才有支持,对于 IE8- 就不支持了。
我们可以自己写一个函数 (Array 对象的方法都是定义在原型对象上的),如下:
- Array.prototype.unique = function() {
- var length = this.length;
- if (length <= 1) {
- return this;
- }
- if (!Array.prototype.indexOf) {
- Array.prototype.indexOf = function(item) {
- var l = this.length,
- i = 0,
- r = -1;
- if (l <= 0) {
- return - 1;
- }
- for (; i < l; i++) {
- if (this[i] === item) {
- r = i;
- }
- }
- return r;
- }
- }
- var result = []; //去重数组
- for (var i = 0; i < length; i++) {
- if (result.indexOf(this[i]) === -1) {
- result.push(this[i]);
- }
- }
- return result;
- }
第六种方法
Array 类型并没有提供去重复的方法,如果要把数组的重复元素干掉,那得自己想办法:
- function unique(arr) {
- var result = [],
- isRepeated;
- for (var i = 0,
- len = arr.length; i < len; i++) {
- isRepeated = false;
- for (var j = 0,
- len = result.length; j < len; j++) {
- if (arr[i] == result[j]) {
- isRepeated = true;
- break;
- }
- }
- if (!isRepeated) {
- result.push(arr[i]);
- }
- }
- return result;
- }
总体思路是把数组元素逐个搬运到另一个数组,搬运的过程中检查这个元素是否有重复,如果有就直接丢掉。从嵌套循环就可以看出,这种方法效率极低。我们可以 用一个 hashtable 的结构记录已有的元素,这样就可以避免内层循环。
来源: