当前位置：

首页
/
IT
/
程序
/
Java
/
Java 集合 HashSet 的原理及常用方法

Java 集合 HashSet 的原理及常用方法

一. HashSet 概述

二. HashSet 构造

三. add 方法

四. remove 方法

五. 遍历

六. 合计合计

先看一下 LinkedHashSet

在看一下 TreeSet

七. 总结

一. HashSet 概述

HashSet 是 Java 集合 Set 的一个实现类, Set 是一个接口, 其实现类除 HashSet 之外, 还有 TreeSet, 并继承了 Collection,HashSet 集合很常用, 同时也是程序员面试时经常会被问到的知识点, 下面是结构图

public class HashSet<E>
    extends AbstractSet<E>
    implements Set<E>, Cloneable, java.io.Serializable
{}

二. HashSet 构造

HashSet 有几个重载的构造方法, 我们来看一下

private transient HashMap<E,Object> map;
// 默认构造器
public HashSet() {
    map = new HashMap<>();
}
// 将传入的集合添加到 HashSet 的构造器
public HashSet(Collection<? extends E> c) {
    map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
    addAll(c);
}
// 明确初始容量和装载因子的构造器
public HashSet(int initialCapacity, float loadFactor) {
    map = new HashMap<>(initialCapacity, loadFactor);
}
// 仅明确初始容量的构造器 (装载因子默认 0.75)
public HashSet(int initialCapacity) {
    map = new HashMap<>(initialCapacity);
}

通过上面的源码, 我们发现了 HashSet 就 TM 是一个皮包公司, 它就对外接活儿, 活儿接到了就直接扔给 HashMap 处理了. 因为底层是通过 HashMap 实现的, 这里简单提一下:

HashMap 的数据存储是通过数组 + 链表 / 红黑树实现的, 存储大概流程是通过 hash 函数计算在数组中存储的位置, 如果该位置已经有值了, 判断 key 是否相同, 相同则覆盖, 不相同则放到元素对应的链表中, 如果链表长度大于 8, 就转化为红黑树, 如果容量不够, 则需扩容 (注: 这只是大致流程).

如果对 HashMap 原理不太清楚的话, 可以先去了解一下

HashMap 原理 (一) 概念和底层架构

HashMap 原理 (二) 扩容机制及存取原理

三. add 方法

HashSet 的 add 方法时通过 HashMap 的 put 方法实现的, 不过 HashMap 是 key-value 键值对, 而 HashSet 是集合, 那么是怎么存储的呢, 我们看一下源码

private static final Object PRESENT = new Object();
public boolean add(E e) {
    return map.put(e, PRESENT)==null;
}

看源码我们知道, HashSet 添加的元素是存放在 HashMap 的 key 位置上, 而 value 取了默认常量 PRESENT, 是一个空对象, 至于 map 的 put 方法, 大家可以看 HashMap 原理 (二) 扩容机制及存取原理.

四. remove 方法

HashSet 的 remove 方法通过 HashMap 的 remove 方法来实现

//HashSet 的 remove 方法
public boolean remove(Object o) {
    return map.remove(o)==PRESENT;
}
//map 的 remove 方法
public V remove(Object key) {
    Node<K,V> e;
    // 通过 hash(key) 找到元素在数组中的位置, 再调用 removeNode 方法删除
    return (e = removeNode(hash(key), key, null, false, true)) == null ? null : e.value;
}
/**
 *
 */
final Node<K,V> removeNode(int hash, Object key, Object value,
                           boolean matchValue, boolean movable) {
    Node<K,V>[] tab; Node<K,V> p; int n, index;
    // 步骤 1. 需要先找到 key 所对应 Node 的准确位置, 首先通过 (n - 1) & hash 找到数组对应位置上的第一个 node
    if ((tab = table) != null && (n = tab.length)> 0 &&
        (p = tab[index = (n - 1) & hash]) != null) {
        Node<K,V> node = null, e; K k; V v;
        //1.1 如果这个 node 刚好 key 值相同, 运气好, 找到了
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            node = p;
        /**
         * 1.2 运气不好, 在数组中找到的 Node 虽然 hash 相同了, 但 key 值不同, 很明显不对, 我们需要遍历继续
         *     往下找;
         */
        else if ((e = p.next) != null) {
            //1.2.1 如果是 TreeNode 类型, 说明 HashMap 当前是通过数组 + 红黑树来实现存储的, 遍历红黑树找到对应 node
            if (p instanceof TreeNode)
                node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
            else {
                //1.2.2 如果是链表, 遍历链表找到对应 node
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key ||
                         (key != null && key.equals(k)))) {
                        node = e;
                        break;
                    }
                    p = e;
                } while ((e = e.next) != null);
            }
        }
        // 通过前面的步骤 1 找到了对应的 Node, 现在我们就需要删除它了
        if (node != null && (!matchValue || (v = node.value) == value ||
                             (value != null && value.equals(v)))) {
            /**
             * 如果是 TreeNode 类型, 删除方法是通过红黑树节点删除实现的, 具体可以参考 [TreeMap 原理实现
             * 及常用方法]
             */
            if (node instanceof TreeNode)
                ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
            /**
             * 如果是链表的情况, 当找到的节点就是数组 hash 位置的第一个元素, 那么该元素删除后, 直接将数组
             * 第一个位置的引用指向链表的下一个即可
             */
            else if (node == p)
                tab[index] = node.next;
            /**
             * 如果找到的本来就是链表上的节点, 也简单, 将待删除节点的上一个节点的 next 指向待删除节点的
             * next, 隔离开待删除节点即可
             */
            else
                p.next = node.next;
            ++modCount;
            --size;
            // 删除后可能存在存储结构的调整, 可参考 [LinkedHashMap 如何保证顺序性] 中 remove 方法
            afterNodeRemoval(node);
            return node;
        }
    }
    return null;
}

removeTreeNode 方法具体实现可参考 TreeMap 原理实现及常用方法

afterNodeRemoval 方法具体实现可参考 LinkedHashMap 如何保证顺序性

五. 遍历

HashSet 作为集合, 有多种遍历方法, 如普通 for 循环, 增强 for 循环, 迭代器, 我们通过迭代器遍历来看一下

public static void main(String[] args) {
    HashSet<String> setString = new HashSet<> ();
    setString.add("星期一");
    setString.add("星期二");
    setString.add("星期三");
    setString.add("星期四");
    setString.add("星期五");
    Iterator it = setString.iterator();
    while (it.hasNext()) {
        System.out.println(it.next());
    }
}

打印出来的结果如何呢?

星期二

星期三

星期四

星期五

星期一

意料之中吧, HashSet 是通过 HashMap 来实现的, HashMap 通过 hash(key) 来确定存储的位置, 是不具备存储顺序性的, 因此 HashSet 遍历出的元素也并非按照插入的顺序.

六. 合计合计

按照我前面的规划, 应该每一块主要的内容都单独写一下, 如集合 ArrayList,LinkedList,HashMap,TreeMap 等. 不过我在写这篇关于 HashSet 的文章时, 发现有前面对 HashMap 的讲解后, 确实简单, HashSet 就是一个皮包公司, 在 HashMap 外面加了一个壳, 那么 LinkedHashSet 是否就是在 LinkedHashMap 外面加了一个壳呢, 而 TreeSet 是否是在 TreeMap 外面加了一个壳? 我们来验证一下

先看一下 LinkedHashSet

最开始的结构图已经提到了 LinkedHashSet 是 HashSet 的子类, 我们来看源码

public class LinkedHashSet<E>
    extends HashSet<E>
    implements Set<E>, Cloneable, java.io.Serializable
{
    public LinkedHashSet(int initialCapacity, float loadFactor) {
        super(initialCapacity, loadFactor, true);
    }
    public LinkedHashSet(int initialCapacity) {
        super(initialCapacity, .75f, true);
    }
    public LinkedHashSet() {
        super(16, .75f, true);
    }
    public LinkedHashSet(Collection<? extends E> c) {
        super(Math.max(2*c.size(), 11), .75f, true);
        addAll(c);
    }
    public Spliterator<E> spliterator() {
        return Spliterators.spliterator(this, Spliterator.DISTINCT | Spliterator.ORDERED);
    }
}

上面就是 LinkedHashSet 的所有代码了, 是不是感觉智商被否定了, 这基本上没啥东西嘛, 构造器还全部调用父类的, 下面就是其父类 HashSet 的对此的构造方法

HashSet(int initialCapacity, float loadFactor, boolean dummy) {
    map = new LinkedHashMap<>(initialCapacity, loadFactor);
}

大家也看出来, 和我们的猜测一样, 没有深究下去的必要了. 如果有兴趣可以看看 LinkedHashMap 如何保证顺序性

在看一下 TreeSet

public class TreeSet<E> extends AbstractSet<E>
    implements NavigableSet<E>, Cloneable, java.io.Serializable
{
    public TreeSet() {
        this(new TreeMap<E,Object>());
    }
    public TreeSet(Comparator<? super E> comparator) {
        this(new TreeMap<>(comparator));
    }
    public TreeSet(Collection<? extends E> c) {
        this();
        addAll(c);
    }
    public TreeSet(SortedSet<E> s) {
        this(s.comparator());
        addAll(s);
    }
}

确实如我们所猜测, TreeSet 也完全依赖于 TreeMap 来实现, 如果有兴趣可以看看 TreeMap 原理实现及常用方法

七. 总结

本来想三章的内容, 一章就算完了, 虽然 Set 实现有点赖皮, 毕竟他祖辈是 Collection 而不是 Map, 在 Map 的实现类上穿了一层衣服就成了 Set, 然后出于某种目的埋伏在 Collection 中, 哈哈, 开个玩笑, 本文主要介绍了 HashSet 的原理以及主要方法, 同时简单介绍了 LinkedHashSet 和 TreeSet, 若有不对之处, 请批评指正, 望共同进步, 谢谢!

来源: https://www.cnblogs.com/LiaHon/p/11257805.html

与本文相关文章

暂无,快来抢沙发吧！