java map遍历方式方式及性能测试-mile米乐体育
1. 阐述
对于java中map的遍历方式,很多文章都推荐使用entryset,认为其比keyset的效率高很多。理由是:entryset方法一次拿到所有key和value的集合;而keyset拿到的只是key的集合,针对每个key,都要去map中额外查找一次value,从而降低了总体效率。那么实际情况如何呢?
为了解遍历性能的真实差距,包括在遍历key value、遍历key、遍历value等不同场景下的差异,我试着进行了一些对比测试。
2. 对比测试
一开始只进行了简单的测试,但结果却表明keyset的性能更好,这一点让我很是费解,不都说entryset明显好于keyset吗?为了进一步地进行验证,于是采用了不同的测试数据进行更详细的对比测试。
2.1 测试数据
2.1.1 hashmap测试数据
hashmap-1,大小为100万,key和value均为string,key的值为1、2、3……1000000:
mapmap = new hashmap (); string key, value; for (i = 1; i <= num; i ) { key = "" i; value = "value"; map.put(key, value); }
hashmap-2,大小为100万,key和value均为string,key的值为50、100、150、200、……、50000000:
mapmap = new hashmap (); string key, value; for (i = 1; i <= num; i ) { key = "" (i * 50); value = "value"; map.put(key, value); }
2.1.2 treemap测试数据
treemap-1,大小为100万,key和value均为string,key的值为1、2、3……1000000:
mapmap = new treemap (); string key, value; for (i = 1; i <= num; i ) { key = "" i; value = "value"; map.put(key, value); }
treemap-2,大小为100万,key和value均为string,key的值为50、100、150、200、……、50000000,更离散:
mapmap = new treemap (); string key, value; for (i = 1; i <= num; i ) { key = "" (i * 50); value = "value"; map.put(key, value); }
2.2 测试场景
分别使用keyset、entryset和values的多种写法测试三种场景:遍历key value、遍历key、遍历value的场景。
2.2.1 遍历key value
keyset遍历key value(写法1):
iteratoriter = map.keyset().iterator(); while (iter.hasnext()) { key = iter.next(); value = map.get(key); }
keyset遍历key value(写法2):
for (string key : map.keyset()) { value = map.get(key); }
entryset遍历key value(写法1):
iterator> iter = map.entryset().iterator(); entry entry; while (iter.hasnext()) { entry = iter.next(); key = entry.getkey(); value = entry.getvalue(); }
entryset遍历key value(写法2):
for (entryentry: map.entryset()) { key = entry.getkey(); value = entry.getvalue(); }
2.2.2 遍历key
keyset遍历key(写法1):
iteratoriter = map.keyset().iterator(); while (iter.hasnext()) { key = iter.next(); }
keyset遍历key(写法2):
for (string key : map.keyset()) { }
entryset遍历key(写法1):
iterator> iter = map.entryset().iterator(); while (iter.hasnext()) { key = iter.next().getkey(); }
entryset遍历key(写法2):
for (entryentry: map.entryset()) { key = entry.getkey(); }
2.2.3 遍历value
keyset遍历value(写法1):
iteratoriter = map.keyset().iterator(); while (iter.hasnext()) { value = map.get(iter.next()); }
keyset遍历value(写法2):
for (string key : map.keyset()) { value = map.get(key); }
entryset遍历value(写法1):
iterator> iter = map.entryset().iterator(); while (iter.hasnext()) { value = iter.next().getvalue(); }
entryset遍历value(写法2):
for (entryentry: map.entryset()) { value = entry.getvalue(); }
values遍历value(写法1):
iteratoriter = map.values().iterator(); while (iter.hasnext()) { value = iter.next(); }
values遍历value(写法2):
for (string value : map.values()) { }
2.3 测试结果
2.3.1 hashmap测试结果
单位:毫秒 | hashmap-1 | hashmap-2 |
keyset遍历key value(写法1) | 39 | 93 |
keyset遍历key value(写法2) | 38 | 87 |
entryset遍历key value(写法1) | 43 | 86 |
entryset遍历key value(写法2) | 43 | 85 |
单位:毫秒 | hashmap-1 | hashmap-2 |
keyset遍历key(写法1) | 27 | 65 |
keyset遍历key(写法2) | 26 | 64 |
entryset遍历key(写法1) | 35 | 75 |
entryset遍历key(写法2) | 34 | 74 |
单位:毫秒 | hashmap-1 | hashmap-2 |
keyset遍历value(写法1) | 38 | 87 |
keyset遍历value(写法2) | 37 | 87 |
entryset遍历value(写法1) | 34 | 61 |
entryset遍历value(写法2) | 32 | 62 |
values遍历value(写法1) | 26 | 48 |
values遍历value(写法2) | 26 | 48 |
2.3.2 treemap测试结果
单位:毫秒 | treemap-1 | treemap-2 |
keyset遍历key value(写法1) | 430 | 451 |
keyset遍历key value(写法2) | 429 | 450 |
entryset遍历key value(写法1) | 77 | 84 |
entryset遍历key value(写法2) | 70 | 68 |
单位:毫秒 | treemap-1 | treemap-2 |
keyset遍历key(写法1) | 50 | 49 |
keyset遍历key(写法2) | 49 | 48 |
entryset遍历key(写法1) | 66 | 64 |
entryset遍历key(写法2) | 65 | 63 |
单位:毫秒 | treemap-1 | treemap-2 |
keyset遍历value(写法1) | 432 | 448 |
keyset遍历value(写法2) | 430 | 448 |
entryset遍历value(写法1) | 62 | 61 |
entryset遍历value(写法2) | 62 | 61 |
values遍历value(写法1) | 46 | 46 |
values遍历value(写法2) | 45 | 46 |
3. 结论
3.1 如果你使用hashmap
- 同时遍历key和value时,keyset与entryset方法的性能差异取决于key的具体情况,如复杂度(复杂对象)、离散度、冲突率等。换言之,取决于hashmap查找value的开销。entryset一次性取出所有 key和value的操作是有性能开销的,当这个损失小于hashmap查找value的开销时,entryset的性能优势就会体现出来。例如上述对比测试中,当key是最简单的数值字符串时,keyset可能反而会更高效,耗时比entryset少10%。总体来说还是推荐使用entryset。因为当key很简单时,其性能或许会略低于keyset,但却是可控的;而随着key的复杂化,entryset的优势将会明显体现出来。当然,我们可以根据实际情况进行选择
- 只遍历key时,keyset方法更为合适,因为entryset将无用的value也给取出来了,浪费了性能和空间。在上述测试结果中,keyset比entryset方法耗时少23%。
- 只遍历value时,使用vlaues方法是最佳选择,entryset会略好于keyset方法。
- 在不同的遍历写法中,推荐使用如下写法,其效率略高一些:
for (string key : map.keyset()) { value = map.get(key); }
for (entryentry: map.entryset()) { key = entry.getkey(); value = entry.getvalue(); }
for (string value : map.values()) { }
3.2 如果你使用treemap
- 同时遍历key和value时,与hashmap不同,entryset的性能远远高于keyset。这是由treemap的查询效率决定的,也就是说,treemap查找value的开销较大,明显高于entryset一次性取出所有key和value的开销。因此,遍历treemap时强烈推荐使用entryset方法。
- 只遍历key时,keyset方法更为合适,因为entryset将无用的value也给取出来了,浪费了性能和空间。在上述测试结果中,keyset比entryset方法耗时少24%。
- 只遍历value时,使用vlaues方法是最佳选择,entryset也明显优于keyset方法。
- 在不同的遍历写法中,推荐使用如下写法,其效率略高一些:
for (string key : map.keyset()) { value = map.get(key); }
for (entryentry: map.entryset()) { key = entry.getkey(); value = entry.getvalue(); }
for (string value : map.values()) { }