1、业务逻辑及表介绍
数据库表介绍:
table_a:主表(小表,表数据不可重复)
table_b:流水表(大表,记录审核流水数据)
注:两表表结构大致一致,流水表增加一个审核状态的字段
业务逻辑:
主表保存唯一数据,流水表记录审核流水数据,用于后续展示,并在审核成功后插入主表,在插入流水数据时完成重复数据的覆盖。覆盖逻辑为先删后加,也就是在这里,出现了联表删除慢的问题。
2、优化思路
原联表删除SQL语句 :
delete from table_a where id in (SELECT id FROM table_b );
优化后的联表删除SQL语句(懒得继续看的,到这即可) :
delete from table_a where exists (SELECT t.id from (select a.id from table_a a,table_b b where a.id=b.id) t where a.id=table_a.id);
3、优化原理:
本次优化总结讲是将in ==》exists
a、那一定是exists比in语句的效率高吗?
mysql中的 in 语句是把外表和内表作hash 连接,而exists语句是对外表作loop循环,每次loop循环再对内表进行查询。所以可见,这种说法其实是不准确的。实际是要区分环境的:
- 如果查询的两个表大小相当,那么用in和exists差别不大。
- 如果两个表中一个较小,一个是大表,则子查询表大的用exists,子查询表小的用in。
- 此外,in与exists的索引使用情况为:in 前表索引,exists 后表索引,用上索引的快。
b、not in 和not exists的比较:
- not in 和not exists如果查询语句使用了not in 那么内外表都进行全表扫描,没有用到索引;
- not extsts 的子查询依然能用到表上的索引。
结论: 无论哪个表大,用not exists都比not in要快
c、in 与 = 的区别不大
验证过程略…(感兴趣的话自行验证哈(o-))文章来源:https://www.toymoban.com/news/detail-402874.html
4、记录一个优化过程中遇到的问题
sql: delete from table_a where exists (select a.idfrom table_a a,table_b b where a.id=b.id);
报错: You can’t specify target table ‘table_a’ for update in FROM clause(不能在FROM子句中为更新指定目标表)
解决方法: mysql 可以通过子查询得到要删除的记录条件,然后通过子查询得结果匹配要删除的记录。但是 mysql 不能直接删除子查询表中的数据,必须通过一个临时表来解决。文章来源地址https://www.toymoban.com/news/detail-402874.html
到了这里,关于MySQL 联表查询重复数据并删除(子查询删除记录) SQL优化的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!