浅谈HashMap中7种遍历方式的性能分析-FinClip官网

浅谈HashMap中7种遍历方式的性能分析

网友投稿 646 2023-01-02

浅谈HashMap中7种遍历方式的性能分析

目录一、前言二、HashMap遍历2.1、迭代器EntrySet2.2、迭代器 KeySet2.3、ForEachEntrySet2.4、ForEach KeySet2.5、Lambda2.6、Streams API 单线程2.7、Streams API 多线程三、性能分析四、字节码分析五、EntrySet性能分析六、安全性测试6.1、迭代器方式6.2、For 循环方式6.3、Lambda 方式6.4、Stream 方式6.5、小结七、总结

一、前言

随着 JDK 1.8 Streams API 的发布，使得 HashMap 拥有了更多的遍历的方式，但应该选择那种遍历方式？反而成了一个问题。

本文主要内容如下图所示：

二、HashMap遍历

HashMap遍历从大的方向来说，可分为以下 4 类：

迭代器（Iterator）方式遍历；

For Each 方式遍历；

Lambda 表达式遍历（JDK 1.8+）;

Streams API 遍历（JDK 1.8+）。

但每种类型下又有不同的实现方式，因此具体的遍历方式又可以分为以下 7 种：

使用迭代器（Iterator）EntrySet 的方式进行遍历；

使用迭代器（Iterator）KeySet 的方式进行遍历；

使用 For Each EntrySet 的方式进行遍历；

使用 For Each KeySet 的方式进行遍历；

使用 Lambda 表达式的方式进行遍历；

使用 Streams API 单线程的方式进行遍历；

使用 Streams API 多线程的方式进行遍历。

接下来我们来看每种遍历方式的具体实现代码。

2.1、迭代器EntrySet

@Test

public void testIterator() {

// 创建并赋值 HashMap

Map map = new HashMap();

map.put(1, "java");

map.put(2, "JDK");

map.put(3, "Spring Framework");

map.put(4, "MyBatis framework");

map.put(5, "Oracle Database");

// 遍历

Iterator> iterator = map.entrySet().iterator();

while (iterator.hasNext()) {

Map.Entry entry = iterator.next();

System.out.println(entry.getKey() + ":" + entry.getValue());

}

运行结果：

2.2、迭代器 KeySet

@Test

public void testKeySet() {

// 创建并赋值 HashMap

Map map = new HashMap();

map.put(1, "Java");

map.put(2, "JDK");

map.put(3, "Spring Framework");

map.put(4, "MyBatis framework");

map.put(5, "Test KeySet");

// 遍历

Iterator iterator = map.keySet().iterator();

while (iterator.hasNext()) {

Integer key = iterator.next();

System.out.println(key + ":" + map.get(key));

}

运行结果：

2.3、ForEachEntrySet

@Test

public void testForEachEntrySet() {

// 创建并赋值 HashMap

Map map = new HashMap();

map.put(1, "Java");

map.put(2, "JDK");

map.put(3, "Spring Framework");

map.put(4, "MyBatis framework");

map.put(5, "Test ForEach EntrySet");

// 遍历

for (Map.Entry entry : map.entrySet()) {

System.out.println(entry.getKey() + ":" + entry.getValue());

}

运行结果：

2.4、ForEach KeySet

@Test

public void testForEachKeySet() {

// 创建并赋值 HashMap

Map map = new HashMap();

map.put(1, "Java");

map.put(2, "JDK");

map.put(3, "Spring Framework");

map.put(4, "MyBatis framework");

map.put(5, "Test ForEach KeySet");

// 遍历

for (Integer key : map.keySet()) {

System.out.println(key + ":" + map.get(key));

}

运行结果：

2.5、Lambda

@Test

public void testLambda() {

// 创建并赋值 HashMap

Map map = new HashMap();

map.put(1, "Java");

map.put(2, "JDK");

map.put(3, "Spring Framework");

map.put(4, "MyBatis framework");

map.put(5, "Test Lambda");

// 遍历

map.forEach((key, value) -> {

System.out.println(key + ":" + value);

});

}

运行结果：

2.6、Streams API 单线程

@Test

public void testStreamApi() {

// 创建并赋值 HashMap

Map map = new HashMap();

map.put(1, "Java");

map.put(2, "JDK");

map.put(3, "Spring Framework");

map.put(4, "MyBatis framework");

map.put(5, "Test Stream API");

// 遍历

map.entrySet().stream().forEach((entry) -> {

System.out.println(entry.getKey() + ":" + entry.getValue());

});

}

运行结果：

2.7、Streams API 多线程

@Test

public void testParallelStreamApi() {

// 创建并赋值 HashMap

Map map = new HashMap();

map.put(1, "Java");

map.put(2, "JDK");

map.put(3, "Spring Framework");

map.put(4, "MyBatis framework");

map.put(5, "Test Parallel Stream API");

// 遍历

map.entrySet().parallelStream().forEach((entry) -> {

System.out.println(entry.getKey() + ":" + entry.getValue());

});

}

运行结果：

三、性能分析

接下来我们使用 Oracle 官方提供的性能测试工具 JMH（Java Microbenchmark Harness，JAVA 微基准测试套件）来测试一下这 7 种循环的性能。

首先我们需要引入JMH框架，本次构建依赖使用工具为Gradle，引入配置如下：

implementation "org.openjdk.jmh:jmh-core:1.23"

implementation "org.openjdk.jmh:jmh-generator-annprocess:1.23"

如果使用Maven，可引入如下配置：

org.openjdk.jmh

jmh-core

1.23

org.openjdk.jmh

jmh-generator-annprocess

1.23

provided

编写性能测试代码如下：

//@BenchmarkMode(Mode.Throughput) // 测试类型：吞吐量

@BenchmarkMode(Mode.AverageTime) // 测试类型：平均消耗时间

//@OutputTimeUnit(TimeUnit.MILLISECONDS)

@OutputTimeUnit(TimeUnit.NANOSECONDS)

@Warmup(iterations = 4, time = 1, timeUnit = TimeUnit.SECONDS) // 预热 4 轮，每次 1s

@Measurement(iterations = 10, time = 3, timeUnit = TimeUnit.SECONDS) // 测试 10 轮，每次 3s

@Fork(1) // fork 1 个线程

@State(Scope.Thread) // 每个测试线程一个实例

public class HashMapTest {

static Map map = new HashMap() {

{

for(int var1 = 0; var1 < 2; ++var1) {

this.put(var1, "Kevin:" + var1);

}

};

public static void main(String[] args) throws RunnerException {

// 启动基准测试

Options opt = new OptionsBuilder()

.include(HashMapTest.class.getSimpleName()) // 要导入的测试类

.output("E:/IDEAWorkSpaces/Test/src/main/java/com/kevin/performance/jmh-map2.log") // 输出测试结果的文件

.build();

new Runner(opt).run(); // 执行测试

}

/**

* Iterator遍历 entrySet

@Benchmark

public void entrySet() {

// 遍历

Iterator> iterator = map.entrySet().iterator();

while (iterator.hasNext()) {

Map.Entry entry = iterator.next();

Integer k = entry.getKey();

String v = entry.getValue();

}

/**

* Foreach遍历 entrySet

@Benchmark

public void forEachEntrySet() {

// 遍历

for (Map.Entry entry : map.entrySet()) {

Integer k = entry.getKey();

String v = entry.getValue();

}

/**

* Iterator遍历 keySet

@Benchmark

public void keySet() {

Iterator iterator = map.keySet().iterator();

while (iterator.hasNext()) {

Integer k = iterator.next();

String v = map.get(k);

}

/**

* Foreach遍历 keySet

@Benchmark

public void forEachKeySet() {

for (Integer key : map.keySet()) {

Integer k = key;

String v = map.get(k);

}

/**

* Lambda遍历

@Benchmark

public void lambda() {

map.forEach((key, value) -> {

Integer k = key;

String v = value;

});

}

/**

* 单线程遍历

@Benchmark

public void streamApi() {

map.entrySet().stream().forEach((entry) -> {

Integer k = entry.getKey();

String v = entry.getValue();

});

}

/**

* 多线程遍历

public void parallelStreamApi() {

map.entrySet().parallelStream().forEach((entry) -> {

Integer k = entry.getKey();

String v = entry.getValue();

});

}

所有被添加了@Benchmark注解的方法都会被测试（由于 parallelStream 为多线程版本性能一定由于其他单线程，故不参与本次测试），测试结果如下：

其中 Units 为 ns/op 意思是执行完成时间（单位为纳秒），而 Score 列为平均执行时间，符号表示误差。从以上结果可以看出，两个entrySet的性能相近，并且执行速度最快，接下来是stream，然后是两个keySet，性能最差的是KeySet。

结论：

从以上结果可以看出entrySet的性能比keySet的性能高出了一倍之多，因此我们应该尽量使用entrySet来实现 Map集合的遍历。

四、字节码分析

要理解以上的测试结果，我们需要把所有遍历代码通过javac编译成字节码来看具体的原因。

编译后，我们使用 Idea 打开字节码，内容如下：

public class HashMapTest {

static Map map = new HashMap() {

{

for(int var1 = 0; var1 < 2; ++var1) {

this.put(var1, "Kevin:" + var1);

}

};

public HashMapTest() {

}

public static void main(String[] var0) {

entrySet();

keySet();

forEachEntrySet();

forEachKeySet();

lambda();

streamApi();

parallelStreamApi();

}

public static void entrySet() {

Iterator var0 = map.entrySet().iterator();

http:// while(var0.hasNext()) {

Entry var1 = (Entry)var0.next();

System.out.println(var1.getKey() + ":" + (String)var1.getValue());

}

public static void keySet() {

Iterator var0 = map.keySet().iterator();

while(var0.hasNext()) {

Integer var1 = (Integer)var0.next();

System.out.println(var1 + ":" + (String)map.get(var1));

}

public static void forEachEntrySet() {

Iterator var0 = map.entrySet().iterator();

while(var0.hasNext()) {

Entry var1 = (Entry)var0.next();

System.out.println(var1.getKey() + ":" + (String)var1.getValue());

}

public static void forEachKeySet() {

Iterator var0 = map.keySet().iterator();

while(var0.hasNext()) {

Integer var1 = (Integer)var0.next();

System.out.println(var1 + ":" + (String)map.get(var1));

}

public static void lambda() {

map.forEach((var0, var1) -> {

System.out.println(var0 + ":" + var1);

});

}

public static void streamApi() {

map.entrySet().stream().forEach((var0) -> {

System.out.println(var0.getKey() + ":" + (String)var0.getValue());

});

}

public static void parallelStreamApi() {

map.entrySet().parallelStream().forEach((var0) -> {

System.out.println(var0.getKey() + ":" + (String)var0.getValue());

});

}

//从结果可以看出，除了 Lambda 和 Streams API 之外，通过迭代器循环和 for 循环的遍历的 EntrySet 最终生成的代码是一样的，他们都是在循环中创建了一个遍历对象 Entry ，代码如下：

public static void entrySet() {

Iterator var0 = map.entrySet().iterator();

while(var0.hasNext()) {

Entry var1 = (Entry)var0.next();

System.out.println(var1.getKey() + ":" + (String)var1.getValue());

}

public static void forEachEntrySet() {

Iterator var0 = map.entrySet().iterator();

while(var0.hasNext()) {

Entry var1 = (Entry)var0.next();

System.out.println(var1.getKey() + ":" + (String)var1.getValue());

}

//而 KeySet 的代码也是类似的，如下所示：

public static void keySet() {

Iterator var0 = map.keySet().iterator();

while(var0.hasNext()) {

Integer var1 = (Integer)var0.next();

System.out.println(var1 + ":" + (String)map.get(var1));

}

public static void forEachKeySet() {

Iterator var0 = map.keySet().iterator();

while(var0.hasNext()) {

Integer var1 = (Integer)var0.next();

System.out.println(var1 + ":" + (String)map.get(var1));

}

从结果可以看出，除了 Lambda 和 Streams API 之外，通过迭代器循环和for循环的遍历的EntrySet最终生成的代码是一样的，他们都是在循环中创建了一个遍历对象Entry，代码如下：

public static void entrySet() {

Iterator var0 = map.entrySet().iterator();

while(var0.hasNext()) {

Entry var1 = (Entry)var0.next();

System.out.println(var1.getKey() + ":" + (String)var1.getValue());

}

public static void forEachEntrySet() {

Iterator var0 = map.entrySet().iterator();

while(var0.hasNext()) {

Entry var1 = (Entry)var0.next();

System.out.println(var1.getKey() + ":" + (String)var1.getValue());

}

而KeySet的代码也是类似的，如下所示：

public static void keySet() {

Iterator var0 = map.keySet().iterator();

while(var0.hasNext()) {

Integer var1 = (Integer)var0.next();

System.out.println(var1 + ":" + (String)map.get(var1));

}

public static void forEachKeySet() {

Iterator var0 = map.keySet().iterator();

while(var0.hasNext()) {

Integer var1 = (Integer)var0.next();

System.out.println(var1 + ":" + (String)map.get(var1));

}

所以我们在使用迭代器或是for循环EntrySet时，他们的性能都是相同的，因为他们最终生成的字节码基本都是一样的；同理KeySet的两种遍历方式也是类似的。

五、EntrySet性能分析

EntrySet之所以比KeySet的性能高是因为，KeySet在循环时使用了map.get(key)，而map.get(key)相当于又遍历了一遍 Map 集合去查询key所对应的值。为什么要用“又”这个词？那是因为在使用迭代器或者 for 循环时，其实已经遍历了一遍 Map 集合了，因此再使用map.get(key)查询时，相当于遍历了两遍。

而EntrySet只遍历了一遍 Map 集合，之后通过代码“Entry entry = iterator.next()”把对象的key和value值都放入到了Entry对象中，因此再获取key和value值时就无需再遍历 Map 集合，只需要从Entry对象中取值就可以了。

所以，EntrySet的性能比KeySet的性能高出了一倍，因为KeySet相当于循环了两遍 Map 集合，而EntrySet只循环了一遍。

六、安全性测试

从上面的性能测试结果和原理分析，我想大家应该选用那种遍历方式，已经心中有数的，而接下来我们就从「安全」的角度入手，来分析那种遍历方式更安全。

我们把以上遍历划分为四类进行测试：迭代器方式、For 循环方式、Lambda 方式和 Stream 方式，测试代码如下。

6.1、迭代器方式

Iterator> iterator = map.entrySet().iterator();

while (iterator.hasNext()) {

Map.Entry entry = iterator.next();

if (entry.getKey() == 1) {

// 删除

System.out.println("del:" + entry.getKey());

iterator.remove();

} else {

System.out.println("show:" + entry.getKey());

}

运行结果：

show:0

del:1

show:2

测试结果：迭代器中循环删除数据安全。

6.2、For 循环方式

for (Map.Entry entry : map.entrySet()) {

if (entry.getKey() == 1) {

// 删除

System.out.println("del:" + entry.getKey());

map.remove(entry.getKey());

} else {

System.out.println("show:" + entry.getKey());

}

运行结果：

测试结果：For 循环中删除数据非安全。

6.3、Lambda 方式

map.forEach((key, value) -> {

if (key == 1) {

System.out.println("del:" + key);

map.remove(key);

} else {

System.out.println("show:" + key);

}

});

运行结果：

测试结果：Lambda 循环中删除数据非安全。

Lambda 删除的正确方式：

// 根据 map 中的 key 去判断删除

map.keySet().removeIf(key -> key == 1);

map.forEach((key, value) -> {

System.out.println("show:" + key);

});

运行结果：

show:0

show:2

从上面的代码可以看出，可以先使用Lambda的removeIf删除多余的数据，再进行循环是一种正确操作集合的方式。

6.4、Stream 方式

map.entrySet().stream().forEach((entry) -> {

if (entry.getKey() == 1) {

System.out.println("del:" + entry.getKey());

map.remove(entry.getKey());

} else {

System.out.println("show:" + entry.getKey());

}

});

运行结果：

测试结果：Stream 循环中删除数据非安全。

Stream 循环的正确方式：

map.entrySet().stream().filter(m -> 1 != m.getKey()).forEach((entry) -> {

if (entry.getKey() == 1) {

System.out.println("del:" + entry.getKey());

} else {

System.out.println("show:" + entry.getKey());

}

});

运行结果：

show:0

show:2

从上面的代码可以看出，可以使用Stream中的filter过滤掉无用的数据，再进行遍历也是一种安全的操作集合的方式。

6.5、小结

我们不能在遍历中使用集合map.remove()来删除数据，这是非安全的操作方式，但我们可以使用迭代器的iterator.remove()的方法来删除数据，这是安全的删除集合的方式。同样的我们也可以使用 Lambda 中的removeIf来提前删除数据，或者是使用 Stream 中的filter过滤掉要删除的数据进行循环，这样都是安全的，当然我们也可以在for循环前删除数据在遍历也是线程安全的。

七、总结

本文我们讲了 HashMap 4 种遍历方式：迭代器、for、lambda、stream，以及具体的 7 种遍历方法，综合性能和安全性来看，我们应该尽量使用迭代器（Iterator）来遍历EntrySet的遍历方式来操作 Map 集合，这样就会既安全又高效了。

以上就是浅谈HashMap中7种遍历方式的性能分析的详细内容，更多关于HashMap 遍历性能分析的资料请关注我们其它相关文章！

小游戏运行如何与企业数字化转型息息相关

646 2023-01-02

浅谈HashMap中7种遍历方式的性能分析

小游戏运行如何与企业数字化转型息息相关

操作系统寒武纪 - 会让企业IT高兴吗？

手机插件管理：优化你的手机体验

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计