oracle hash join原理及注意事项有哪些

网友投稿 410 2023-12-28

oracle hash join原理及注意事项有哪些

oracle hash join原理及注意事项有哪些,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法

oracle hash join原理及注意事项有哪些

7.3引入,仅用于CBO和等值连接,隐含参数_hash_join_enabled默认true,即使为false也可被use_hash覆盖;

Oracle依据hash_area_size/db_block_size/_hash_multiblock_io_count决定hash partition数量,hash表由若干hash partition组成,而每个partition都包含多个hash bucket

表small和big,前者会被选为驱动表,假定其结果集为s,后者为b;

构造驱动表

1 遍历s,对其每条记录按照连接列做hash运算;使用2个hash函数,暂称为func_1/func_2,其hash值为value1和value2;

2 按照value1分配bucket,把s和value2存入其中;只需查询列/连接列即可,不需要整行记录;构造hash partition时每个分区对应1个bitmap,标注该分区所属bucket是否有记录;

3 如果s > hash_area_size,将包含记录最多的partition存入temp,反复直至完成;

4 按记录数对hash partition排序,当s > hash_area_size,则尽量将较小的partition保留内存中;

构造被驱动表

5 遍历b,处理方式与步骤1一样;

6 按照value1匹配s的bucket,然后遍历其所有记录,并校验连接列是否相等;如果成功则返回记录;如果没有在内存中找到bucket,首先访问bitmap,若其记录数>0,暂将b中对应记录写入temp,若=0则直接跳过,即位图过滤;反复直至完成所有位于内存中的s和b的记录;

7 处理temp中的si和bj,分区号相等的结成对sn/bn,记录数较少的作驱动表,以value2构造hash table;反复直至完成

注意事项

1 驱动表连接列的选择性要高,若一个bucket的记录数过多,遍历时会严重消耗CPU且逻辑读不高(位于PGA中),可参照http://www.dbafan.com/blog/?p=151

2 驱动表应尽可能小,最好可全部装入内存hash_area_size

10104事件跟踪hash join,记录hash partition/bucket以及每个bucket多少条记录

Hint

use_hash(table_1 table_2) 与 use_hash(table_1) + use_hash(table_2)等价,即并不决定连接顺序;

no_swap_join_inputs(rowsource_alias)和swap_join_inputs(rowsource_alias) 可指定驱动表和被驱动表,后者不可swap;

select  /*+ leading(table_1 table_2) use_hash(table_2) no_swap_join_inputs(table_2) */ *

from    t1 table_1, t2 table_2

where   table_1.n1 = table_1.n1;

-----------------------------------------------------------

| Id  | Operation          | Name | Rows  | Bytes | Cost  |

-----------------------------------------------------------

|   0 | SELECT STATEMENT   |      | 45000 |    16M|    44 |

|*  1 |  HASH JOIN         |      | 45000 |    16M|    44 |

|   2 |   TABLE ACCESS FULL| T1   |  3000 |   547K|    14 |

|   3 |   TABLE ACCESS FULL| T2   |  3000 |   547K|    14 |

-----------------------------------------------------------

select  /*+ leading(table_1 table_2) use_hash(table_2) swap_join_inputs(table_2) */ *

from    t1 table_1, t2 table_2

where   table_1.n1 = table_1.n1;

-----------------------------------------------------------

| Id  | Operation          | Name | Rows  | Bytes | Cost  |

-----------------------------------------------------------

|   0 | SELECT STATEMENT   |      | 45000 |    16M|    44 |

|*  1 |  HASH JOIN         |      | 45000 |    16M|    44 |

|   2 |   TABLE ACCESS FULL| T2   |  3000 |   547K|    14 |

|   3 |   TABLE ACCESS FULL| T1   |  3000 |   547K|    14 |

-----------------------------------------------------------

关于oracle hash join原理及注意事项有哪些问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注行业资讯频道了解更多相关知识。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:常见的library cache lock产生的原因是什么
下一篇:怎么解析Cursor和绑定变量
相关文章

 发表评论

暂时没有评论,来抢沙发吧~