温馨提示×

温馨提示×

您好，登录后才能下订单哦！

密码登录×

忘记密码？

登录注册×

获取短信验证码

其他方式登录

点击登录注册即表示同意《亿速云用户服务条款》

用户登录×

账户密码登录

请使用微信扫描上方二维码

使用帮助

请求超时！

请点击重新获取二维码

mysql关联查询如何优化

发布时间：2021-10-29 17:03:49 来源：亿速云阅读：553 作者：小新栏目：MySQL数据库

小编给大家分享一下mysql关联查询如何优化，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！

mysql中任何关联查询都是nest loop（嵌套循环）操作，nest loop是在驱动表中取出一条数据，然后从被驱动表中逐行比较，把符合规则的放入结果集中，然后再取下一行，依次循环，驱动表每返回一行，被驱动表就要扫描一次。
针对nest loop关联机制需要从下面几个方面着手优化：
1、减少nest loop循环次数，使用小结果集做驱动表，驱动大结果集。
2、被驱动表每次循环都要被扫描，所以要求关联键上一定要有索引，而且选择性要好。
3、如果第二条无法满足，可以通过调join_buffer_size来设置join buffer的大小，不过还是建议添加索引而不是纯粹的加大join_buffer_size

接下来通过下面的实验来了解mysql的nest loop
实验环境：Percona server5.6.27 大表bill、小表user，表上均有索引
mysql> select count(*) from bill;
+----------+
| count(*) |
+----------+
| 1966789 |
+----------+

mysql> select count(*) from user_tmp;
+----------+
| count(*) |
+----------+
| 36317 |
+----------+
一、执行计划：
mysql> explain select a.user_id,b.loan_info_id from bill b left JOIN user_tmp a on a.user_id=b.user_id;
+----+-------------+-------+--------+---------------+---------+---------+---------------+---------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+--------+---------------+---------+---------+---------------+---------+-------------+
| 1 | SIMPLE | b | ALL | NULL | NULL | NULL | NULL | 1912096 | NULL |
| 1 | SIMPLE | a | eq_ref | PRIMARY   | PRIMARY | 194 | CDM.b.user_id | 1 | Using index |
+----+-------------+-------+--------+---------------+---------+---------+---------------+---------+-------------+

左连接左表不管有多大总是驱动表，右表总是被驱动表

mysql> explain select a.user_id,b.loan_info_id from bill b INNER JOIN user_tmp a on a.user_id=b.user_id;
+----+-------------+-------+-------+------------------------------+------------------------------+---------+---------------+-------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+-------+------------------------------+------------------------------+---------+---------------+-------+-------------+
| 1 | SIMPLE | a | index | PRIMARY | PRIMARY | 194 | NULL | 35970 | Using index |
| 1 | SIMPLE | b | ref   | in_bill_user_id   | in_bill_user_id | 194 | CDM.a.user_id | 3 | NULL |
+----+-------------+-------+-------+------------------------------+------------------------------+---------+---------------+-------+-------------+
2 rows in set (0.00 sec)

内连接，mysql的优化器会根据统计信息自动选择小表user_tmp做驱动表，大家可以看到rows列值和我们刚开始统计的行数不一致，是因为统计信息和实际是有差异，所以有时候统计信息的不准确会导致执行计划不是最优的。内连接可以用STRAIGHT_JOIN按照顺序执行，即指定左表为驱动表

mysql> explain select STRAIGHT_JOIN a.user_id,b.loan_info_id from bill b inner JOIN user_tmp a on a.user_id=b.user_id;
+----+-------------+-------+--------+------------------------------+---------+---------+---------------+---------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+--------+------------------------------+---------+---------+---------------+---------+-------------+
| 1 | SIMPLE | b | ALL | in_bill_user_id    | NULL | NULL | NULL   | 1912096 | NULL |
| 1 | SIMPLE | a | eq_ref | PRIMARY | PRIMARY | 194 | CDM.b.user_id | 1 | Using index |
+----+-------------+-------+--------+------------------------------+---------+---------+---------------+---------+-------------+
这个时候mysql就不会根据统计信息把右边的小表当做驱动表

删除被驱动表bill索引
mysql> explain select a.user_id,b.loan_info_id from bill b INNER JOIN user_tmp a on a.user_id=b.user_id;
+----+-------------+-------+--------+---------------+---------+---------+---------------+---------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+--------+---------------+---------+---------+---------------+---------+-------------+
| 1 | SIMPLE | b | ALL | NULL | NULL | NULL | NULL | 1905575 | NULL |
| 1 | SIMPLE | a | eq_ref | PRIMARY | PRIMARY | 194 | CDM.b.user_id | 1 | Using index |
+----+-------------+-------+--------+---------------+---------+---------+---------------+---------+-------------+
mysql优化器是基于成本的，bill没有了索引，那么就要扫描35970次bill全表，成本高于扫描1905575次user_tmp索引，所以又改变了执行计划，变成了把大表做驱动表，进而降低了查询效率

二、执行效率（关联键都有索引）：
当小表是驱动表的时候
mysql> select a.user_id,b.loan_info_id from bill b INNER JOIN user_tmp a on a.user_id=b.user_id;
这里结果集有几万条，省略
耗时：0.202s
使用STRAIGHT_JOIN强制大表是驱动表的时候
mysql>select STRAIGHT_JOIN a.user_id,b.loan_info_id from bill b INNER JOIN user_tmp a on a.user_id=b.user_id
耗时：5.260s
由于两张表的相差几十倍，两种执行计划的效率也是显而易见的
注：如果大表的关联键索引选择性比较差（如重复数据多等），每次循环扫太多了，不如让大表做驱动表，上述实验是在大表的索引选择性好的情况下得出的结果

以上是“mysql关联查询如何优化”这篇文章的所有内容，感谢各位的阅读！相信大家都有了一定的了解，希望分享的内容对大家有所帮助，如果还想学习更多知识，欢迎关注亿速云行业资讯频道！

向AI问一下细节

推荐阅读：

免责声明：本站发布的内容（图片、视频和文字）以原创、转载和分享为主，文章观点不代表本网站立场，如果涉及侵权请联系站长邮箱：is@yisu.com进行举报，并提供相关证据，一经查实，将立刻删除涉嫌侵权内容。

上一篇新闻：
如何利用java-RMI进行大文件传输
下一篇新闻：
Mysql数据分组排名实现的示例分析

猜你喜欢

AI
助
手

产品服务

地区划分

专题活动

帮助支持

关于我们

售后咨询

7*24小时在线电话：400-100-2938

7*24小时在线 QQ：800811969

关注亿速云

亿速云公众号

手机网站二维码