谈谈Hashmap的容量为什么是2的幂次问题-FinClip官网

谈谈Hashmap的容量为什么是2的幂次问题

网友投稿 545 2023-04-03

谈谈Hashmap的容量为什么是2的幂次问题

做为面试常考的问题之一，每次都答的模模糊糊，有必要了解一下，首先来看一下hashmap的put方法的源码

public V put(K key, V value) {

if (key == null)

return putForNullKey(value); //将空key的Entry加入到table[0]中

int hash = hash(key.hashCode()); //计算key.hashcode()的hash值，hash函数由hashmap自己实现

int i = indexFor(hash, table.length);//获取将要存放的数组下标

* for中的代码用于：当hash值相同且key相同的情况下，使用新值覆盖旧值（其实就是修改功能）

for (Entry e = table[i]; e != null; e = e.next) {//注意：for循环在第一次执行时就会先判断条件

Object k;

//hash值相同且key相同的情况下，使用新值覆盖旧值

if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {

V oldValue = e.value;

e.value = value;

//e.recordAccess(this);

return oldValue;//返回旧值

}

modCount++;

addEntry(hash, key, value, i);//增加一个新的Entry到table[i]

return null;//如果没有与传入的key相等的Entry，就返回null

}

/**

* "按位与"来获取数组下标

static int indexFor(int h, int length) {

return h & (length - 1);

}

hashmap始终将自己的桶保持在2的n次方，这是为什么？indexFor这个方法解释了这个问题

大家都知道计算机里面位运算是基本运算，位运算的效率是远远高于取余%运算的

举个例子：

2^n转换成二进制就是1+n个0，减1之后就是0+n个1，如16 -> 10000，15 -> 01111

那么根据&位运算的规则，都为1(真)时，才为1，那0≤运算后的结果≤15，假设h <= 15，那么运算后的结果就是h本身，h >15，运算后的结果就是最后四位二进制做&运算后的值，最终，就是%运算后的余数。

当容量一定是2^n时，h & (length - 1) == h PUEHQH% length

补充知识：HashMap容量和负载因子

HashMap底层数据结构是数组+链表，JDK1.8中还引入了红黑树，当链表长度超过8个时，会将链表转成红黑树，以提升其查找性能。那么，给出一个节点，HashMap是如何确定这个节点应该放在具体哪个位置呢？（以JDK1.8为例）

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,

boolean evict) {

Node[] tab; Node p; int n, i;

// HashMap没有被初始化，则先进行初始化

if ((tab = table) == null || (n = tab.length) == 0)

n = (tab = resize()).length;

// 节点所在index = (n - 1) & hash，该位置没有数据，则直接将新节点放在数组的index位置上

if ((p = tab[i = (n - 1) & hash]) == null)

tab[i] = newNode(hash, key, value, null);

else { // index上已经有节点了

Node e; K k;

// 如果新key与原来的key一样，则e指向原节点p（后面会用新value替换e所指向的value）

if (p.hash == hash &&

((k = p.key) == key || (key != null && key.equals(k))))

e = p;

// 如果该节点是树节点，则采用树的插入算法，插入新节点

else if (p instanceof HashMap.TreeNode)

e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value);

else { // 该节点是链表节点

for (int binCount = 0; ; ++binCount) {

// 将新节点插入到index所在链表的末端

if ((e = p.next) == null) {

p.next = newNode(hash, key, value, null);

// 链表节点超过8个，则进行链表转树处理

if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st

treeifyBin(tab, hash);

break;

}

// 同样的，如果key已经存在的话，则不进行插入操作，而是后面进行value替换

if (e.hash == hash &&

((k = e.key) == key || (key != null && key.equals(k))))

break;

p = e;

}

// e != null的情况，就是key已经存在了，这里统一进行了新值value，替换旧值e.value的操作

if (e != null) { // existing mapping for key

V oldValue = e.value;

if (!onlyIfAbsent || oldValue == null)

e.value = value;

afterNodeAccess(e);

return oldValue;

}

++modCount;

// 插入后数组size 大于阈值的话，需要进行扩容

if (++size > threshold)

resize();

afterNodeInsertion(evict);

return null;

}

看源码，节点落在数组中的index = （数组长度 - 1） & key的hashcode，如果该index上没有数据，则直接插到该index上，如果节点已经有数据了，则把新节点插入该index对应的链表中（如果链表节点大于8个，会进行链表转树，之后的插入算法就变成了树的插入算法）。

每次put之后，会检测一下是否需要扩容，size超过了总容量 * 负载因子，则会扩容。默认情况下，16 * 0.75 = 12个。

1、为什么初始容量是16

当容量为2的幂时，上述n -1 对应的二进制数全为1，这样才能保证它和key的hashcode做&运算后，能够均匀分布，这样才能减少hash碰撞的次数。至于默认值为什么是16，而不是2 、4、8，或者32、64、1024等，我想应该就是个折中处理，过小会导致放不下几个元素，就要进行扩容了，而扩容是一个很消耗性能的操作。取值过大的话，无疑会浪费更多的内存空间。因此在日常开发中，如果可以预估HashMap会存入节点的数量，则应该在初始化时，指定其容量。

2、为什么负载因子是0.75

也是一个综合考虑，如果设置过小，HashMap每put少量的数据，都要进行一次扩容，而扩容操作会消耗大量的性能。如果设置过大的话，如果设成1，容量还是16，假设现在数组上已经占用的15个，再要put数据进来，计算数组index时，发生hash碰撞的概率将达到15/16，这违背的HashMap减少hash碰撞的原则。

信创国产化如何推动技术自主创新与安全保障的未来发展

545 2023-04-03

谈谈Hashmap的容量为什么是2的幂次问题

信创国产化如何推动技术自主创新与安全保障的未来发展

信创国产化替换如何推动企业自主创新与市场竞争力提升

信创国产化政策如何推动企业技术转型与市场竞争力提升

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计