ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

HashMap源码(一)

2020-02-02 12:06:59  阅读:296  来源: 互联网

标签:HashMap 16 初始值 initialCapacity 源码 0.75 loadFactor


本文主要是从学习的角度看HashMap源码

HashMap的数据结构

  • HashMap是一个数组+链表的结构(链表散列),每个节点在HashMap中以一个Node存在;

HashMap的初始化

    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
    // 这里的MAXIMUM_CAPACITY=1 << 30(问题一: 为什么是30?)
        if (initialCapacity > MAXIMUM_CAPACITY)
        // 如果传入初始值大于1<<30 则默认值为最大;
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        this.loadFactor = loadFactor;
        // 这里是根据传入的初始值算得 大于输入参数且最近的2的整数次幂的数
        this.threshold = tableSizeFor(initialCapacity);
    }
  • HashMap中初始化方法如上。
    • initialCapacity参数为初始化大小的值,默认为16,问题二:这里为什么为16?;
    • loadFactor参数我理解为扩容权重比,默认值为0.75,问题三:这里为什么是0.75?,就是当HashMap的容量达到HashMap的数组长度*loadFactor时就会进行扩容。也就是HashMap中的 resize 方法
  • 初始化方法代码不多,此处为了效率运用了很多的位运算;

    首先: 为什么HashMap的容量永远是2的整数倍?
    • 首先我们可以看源码知道HashMap中元素的位置计算是 hash & (n- 1),为啥要这么算我也不知道,反正这样的算法下 如果hashmap的长度刚好是2的倍数那么元素的分布相对来说是比较均匀的。减少元素碰撞的几率; 具体详细的可以看下这篇博文
    • 所以这也解释了问题二的初始值为16即2的四次方;至于为啥一定是16,我也不知道,可能我比较杠精;
    • 更新(12-11 ): 此处为什么是16在关于这个默认容量的选择,JDK并没有给出官方解释,我也没有在网上找到关于这个任何有价值的资料。(如果哪位有相关的权威资料或者想法,可以留言交流)
    • 更新(12-23):详见问题二
问题一:MAXIMUM_CAPACITY = 1 << 30
  • 首先这个值符合上面的原则,即大小为2的整数倍;而1<<30这个值我们可以尝试发现:
    java System.out.println(1<<30); // 1073741824 System.out.println(1<<31); // -2147483648 System.out.println(1<<32); // 1
  • 因为int类型是32位整型,1左移31位的为 16进制的0x80000000代表的是-2147483648, 所以最大值只能为1>>30;至于为什么初始值不用Integer.MAX_VALUE,其实在resize方法中有下面这段代码:
    java if (oldCap >= MAXIMUM_CAPACITY) { //若数组长度大于1>>30,这里则扩容Integer.MAX_VALUE; threshold = Integer.MAX_VALUE; return oldTab; }
问题二:initialCapacity初始值为16

因为在使用是2的幂的数字的时候,Length-1的值是所有二进制位全为1,这种情况下,index的结果等同于HashCode后几位的值。
只要输入的HashCode本身分布均匀,Hash算法的结果就是均匀的。
这是为了实现均匀分布。

问题三: loadFactor默认值0.75

JDK 1.7中:
As a general rule, the default load factor (.75) offers a good tradeoff between time and space costs. Higher values decrease the space overhead but increase the lookup cost (reflected in most of the operations of the HashMap class, including get and put). The expected number of entries in the map and its load factor should be taken into account when setting its initial capacity, so as to minimize the number of rehash operations. If the initial capacity is greater than the maximum number of entries divided by the load factor, no rehash operations will ever occur.

  • 翻译过来就是:
    作为一般规则,默认负载因子(0.75)在时间和空间成本上提供了很好的折衷。较高的值会降低空间开销,但提高查找成本(体现在大多数的HashMap类的操作,包括get和put)。设置初始大小时,应该考虑预计的entry数在map及其负载系数,并且尽量减少rehash操作的次数。如果初始容量大于最大条目数除以负载因子,rehash操作将不会发生。

  • 理想状态下,在随机哈希值的情况,对于loadfactor = 0.75 ,虽然由于粒度调整会产生较大的方差,桶中的Node的分布频率服从参数为0.5的泊松分布。

接下来我们会具体看下HashMap的resize方法

博文推荐:https://www.hollischuang.com/archives/4320 (掘金看见的,写的很好)

标签:HashMap,16,初始值,initialCapacity,源码,0.75,loadFactor
来源: https://www.cnblogs.com/heyouxin/p/12251577.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有