Java中最大的数据结构——LinkedHashMap了解一下?

本人花费半年的时间总结的《Java面试指南》已拿腾讯等大厂offer,已开源在github ,欢迎star!

本文GitHub https://github.com/OUYANGSIHAI/JavaInterview 已收录,这是我花了6个月总结的一线大厂Java面试总结,本人已拿大厂offer,欢迎star

原文链接:blog.ouyangsihai.cn >> Java中最大的数据结构——LinkedHashMap了解一下?

点击上方“Java知音”,选择“置顶公众号”

技术文章第一时间送达!

作者:莫那鲁道 https://thinkinjava.cn

https://thinkinjava.cn

前言

Map 家族数量众多,其中 HashMap 和 ConcurrentHashMap 用的最多,而 LinkedHashMap 似乎则是不怎么用的,但是他却有着顺序。两种,一种是添加顺序,一种是访问顺序。

详情

LinkedHashMap 继承了 HashMap。那么如果是你,你怎么实现这两个顺序呢?

如果实现添加顺序的话,我们可以在该类中,增加一个链表,每个节点对应 hash 表中的桶。这样,循环遍历的时候,就可以按照链表遍历了。只是会增大内存消耗。

如果实现访问顺序的话,同样也可以使用链表,但每次读取数据时,都需要更新一下链表,将最近一次读取的放到链尾。这样也就能够实现。此时也可以跟进这个特性实现 LRU(Least Recently Used) 缓存。

如何使用?

下面是个小 demo


LinkedHashMapInteger, Integer map = new LinkedHashMap(16, 0.75f, true);
for (int i = 0; i  10; i++) {
  map.put(i, i);
}

for (Map.Entry entry : map.entrySet()) {
  System.out.println(entry.getKey() + ":" + entry.getValue());
}
map.get(3);
System.out.println();
for (Map.Entry entry : map.entrySet()) {
  System.out.println(entry.getKey() + ":" + entry.getValue());
}

打印结果:


0:0
1:1
2:2
3:3
4:4
5:5
6:6
7:7
8:8
9:9

0:0
1:1
2:2
4:4
5:5
6:6
7:7
8:8
9:9
3:3

首先构造方法是有意思的,比 HashMap 多了一个 accessOrder boolean 参数。表示,按照访问顺序来排序。最新访问的放在链表尾部。

如果是默认的,则是按照添加顺序,即 accessOrder 默认是 false。

源码实现

如果看 LinkedHashMap 内部源码,会发现,内部确实维护了一个链表:


/**
 * 双向链表的头,最久访问的
 */
transient LinkedHashMap.EntryK,V head;

/**
 * 双向链表的尾,最新访问的
 */
transient LinkedHashMap.EntryK,V tail;

而这个 LinkedHashMap.Entry 内部也维护了双向链表必须的元素,before,after:


/**
 * HashMap.Node subclass for normal LinkedHashMap entries.
 */
static class EntryK,V extends HashMap.NodeK,V {
    EntryK,V before, after;
    Entry(int hash, K key, V value, NodeK,V next) {
        super(hash, key, value, next);
    }
}

在添加元素的时候,会追加到尾部。


NodeK,V newNode(int hash, K key, V value, NodeK,V e) {
    LinkedHashMap.EntryK,V p =
        new LinkedHashMap.EntryK,V(hash, key, value, e);
    linkNodeLast(p);
    return p;
}

// link at the end of list
private void linkNodeLast(LinkedHashMap.EntryK,V p) {
    LinkedHashMap.EntryK,V last = tail;
    tail = p;
    if (last == null)
        head = p;
    else {
        p.before = last;
        last.after = p;
    }
}

在 get 的时候,会根据 accessOrder 属性,修改链表顺序:


public V get(Object key) {
    NodeK,V e;
    if ((e = getNode(hash(key), key)) == null)
        return null;
    if (accessOrder)
        afterNodeAccess(e);
    return e.value;
}

void afterNodeAccess(NodeK,V e) { // move node to last
    LinkedHashMap.EntryK,V last;
    if (accessOrder && (last = tail) != e) {
        LinkedHashMap.EntryK,V p =
            (LinkedHashMap.EntryK,V)e, b = p.before, a = p.after;
        p.after = null;
        if (b == null)
            head = a;
        else
            b.after = a;
        if (a != null)
            a.before = b;
        else
            last = b;
        if (last == null)
            head = p;
        else {
            p.before = last;
            last.after = p;
        }
        tail = p;
        ++modCount;
    }
}

同时注意:这里修改了 modCount,即使是读操作,并发也是不安全的。

如何实现 LRU 缓存?

LRU 缓存:LRU(Least Recently Used,最近最少使用)算法根据数据的历史访问记录来进行淘汰数据,其核心思想是“如果数据最近被访问过,那么将来被访问的几率也更高”。

LinkedHashMap 并没有帮我我们实现具体,需要我们自己实现 。具体实现方法是 removeEldestEntry 方法。

一起来看看原理。

首先,HashMap 在 putVal 方法最后,会调用 afterNodeInsertion 方法,其实就是留给 LinkedHashMap 的。而 LinkedHashMap 的具体实现则是根据一些条件,判断是否需要删除 head 节点。

源码如下:


void afterNodeInsertion(boolean evict) { // possibly remove eldest
    LinkedHashMap.EntryK,V first;
    if (evict && (first = head) != null && removeEldestEntry(first)) {
        K key = first.key;
        removeNode(hash(key), key, null, false, true);
    }
}

evict 参数表示是否需要删除某个元素,而这个 if 判断需要满足的条件如上:head 不能是 null,调用 removeEldestEntry 方法,返回 true 的话,就删除这个 head。而这个方法默认是返回 false 的,等待着你来重写。

所以,removeEldestEntry 方法的实现通常是这样:


public boolean removeEldestEntry(Map.EntryK, V eldest){    
   return size()  capacity;  
}

如果长度大于容量了,那么就需要清除不经常访问的缓存了。afterNodeInsertion 会调用 removeNode 方法,删除掉 head 节点 —— 如果 accessOrder 是 true 的话,这个节点就是最不经常访问的节点。

拾遗

LinkedHashMap 重写了一些 HashMap 的方法,例如 containsValue 方法,这个方法大家猜一猜,怎么重写比较合理?

HashMap 使用了双重循环,先循环外层的 hash 表,再循环内层的 entry 链表。性能可想而知。

但 LinkedHashMap 内部有个元素链表,直接遍历链表就行。相对而言而高很多。


public boolean containsValue(Object value) {
    for (LinkedHashMap.EntryK,V e = head; e != null; e = e.after) {
        V v = e.value;
        if (v == value || (value != null && value.equals(v)))
            return true;
    }
    return false;
}

这也算一种空间换时间的策略吧。

get 方法当然也是要重写的。因为需要根据 accessOrder 更新链表。

总结

雪薇的总结的一下:

LinkedHashMap 内部包含一个双向链表维护顺序,支持两种顺序——添加顺序,访问顺序。

默认就是按照添加顺序来的,如果要改成访问顺序的话,构造方法中的 accessOrder 需要设置成 true。这样,每次调用 get 方法,就会将刚刚访问的元素更新到链表尾部。

关于 LRU,在accessOrder 为 true 的模式下,你可以重写 removeEldestEntry 方法,返回 size() capacity,这样,就可以删除最不常访问的元素。

END

Java面试题专栏

【20期】你知道为什么HashMap是线程不安全的吗?

【19期】为什么Java线程没有Running状态?

【18期】Java序列化与反序列化三连问:是什么?为什么要?如何做?

【17期】什么情况用ArrayList or LinkedList呢?

【16期】你能谈谈HashMap怎样解决hash冲突吗

【15期】谈谈这几个常见的多线程面试题

【14期】你能说说进程与线程的区别吗

【13期】谈谈 Redis 的过期策略

【12期】谈谈项目中单点登录的实现原理?

【11期】分布式系统接口,如何避免表单的重复提交?

Java中最大的数据结构:LinkedHashMap了解一下?

我知道你 “在看Java中最大的数据结构:LinkedHashMap了解一下?

原文始发于微信公众号(Java知音):Java中最大的数据结构:LinkedHashMap了解一下?

本人花费半年的时间总结的《Java面试指南》已拿腾讯等大厂offer,已开源在github ,欢迎star!

本文GitHub https://github.com/OUYANGSIHAI/JavaInterview 已收录,这是我花了6个月总结的一线大厂Java面试总结,本人已拿大厂offer,欢迎star

原文链接:blog.ouyangsihai.cn >> Java中最大的数据结构——LinkedHashMap了解一下?


 上一篇
Java中的BigDecimal类你真的了解吗? Java中的BigDecimal类你真的了解吗?
点击上方“后端技术精选”,选择“置顶公众号” 技术文章第一时间送达! 作者:HikariCP www.jianshu.com/p/c81edc59546c www.jianshu.com/p/c81edc59546c 前言我
下一篇 
Java泛型背后是什么? Java泛型背后是什么?
点击上方“Java知音”,选择“置顶公众号” 技术文章第一时间送达! 作者:的一幕 www.jianshu.com/p/dd34211f2565 www.jianshu.com/p/dd34211f2565 这一节主要讲的内