mysql中大表join小表怎么解决shuffle

时间：2024-11-06 11:22:22

rows代表这个步骤相对上一步结果的每缬方焱蜱一行需要扫描的行数，可以看到这个sql需要扫描的行数为35773*8134，非常大的一个数字。

方法/步骤

1、本来c和h表的记录条数分别为40000+和10000+，这几乎是两个表做笛卡尔积的开销了（select*fromc,h）。

2、于是我上网查了下MySQL实现join的原理，原来MySQL内部采用了一种叫做nestedloopjoin的算法。

3、NestedLoopJoin实际上就是通过驱动表的结果集箧咦切诏作为循环基础数据，然后一条一条的通过该结果集中的数据作为过滤条件到下一个表中查询数据，然后合并结果。

4、如果还有第三个参与Join，则再通过前两个表的Join结果集作为循环基础数据，再一次通过循环查询条件到第三个表中查询数据

5、如此往复，基本上MySQL采用的是最容易理解的算法来实现join。

6、所以驱动表的选择非常重要，驱动表的数据小可以显著降低扫描的行数。