如何避免Duplicate key在数据表插入中的应用

发布时间：2021-10-25 10:37:41 阅读：201 作者：柒染栏目：大数据

开发者测试专用服务器限时活动，0元免费领，库存有限，领完即止！点击查看>>

这期内容当中小编将会给大家带来有关如何避免Duplicate key在数据表插入中的应用，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。

在一个数据表中插入数据，防止有重复的数据插入，一般DBA大多的做法是

唯一索引，主键，在重复的数据插入的过程中，就通过数据库的唯一约束或检查，将这些重复的数据拒之门外。

而很多场合下，这样的作法并不合适，因为你遇到的程序员他可能不大会处理在数据拒绝插入的后续处理，这是比较尴尬的问题。如何能让他用很简单的SQL语句，来将这个问题解决，这需要 DBA 做点什么。

在SQL SERVER 中一般的情况是这样使用的,(看下面的语句)，通过在插入的过程中，进行判断，判断插入tbl_A 来自于 tbl_B的数据不应该和 tbl_A重复，也就是在插入的前边要来一次机遇标识键的过滤

INSERT tbl_A (col, col2) SELECT col, col2 FROM tbl_B WHERE NOT EXISTS (SELECT col FROM tbl_A A2 WHERE A2.col = tbl_B.col);

这样看着比较LOW 其实效率也一般。所以微软推荐的方法是下面的

Merge 功能，这个功能的在我工作的十几年的经历中，是比较少的，因为大多数的场景在现在的应用开发中，CRUD 的操作已经能覆盖大部分数据库操作的功能，大部分的计算和判断的功能大多是在应用层来做的，通过程序来实践，数据库越来越多变得像一个容器被使用，数据库只要做好MVCC，ISOLATE的事情就OK 了，所以MERGE 的功能比较少的被引用到数据库的使用中。

而何时要使用MERGE 功能，最近的一个项目的修改中，就遇到了，在原先的数据插入，使用了游标，这样的结果可想而知，一定是糟糕的，数据库使用游标本来就是下下的选择，如果一个程序员使用了游标，除非数据量很小，并且逻辑非常复杂，而且必须要用数据库 PROCEDURE 来做，否则游标应该被踢出数据库的语句层。

在修改后的存储过程中，已经没有了游标，这是一个可喜的事情，但不好的事情又发生了，程序的逻辑中，需要判断插入的数据是否已经在数据库中存在，如果存在，就不要插入，否则就插入。

当然要解决这个问题，其实方法很多，相应的每种方法的限制也不少。

1 唯一索引，联合唯一索引（被回绝，顾问提供的存储过程是不会使用这样的方法来处理那些中断，错误，使用这样的方法还是要程序报错，目的没有达到） PASS

2 insert into ....... select ...... where not exist (select .... ) 这个就不说了，上面已经有这样的语句了

3 本次的重点，merge into 语句，我们还拿上面的的语句改写成merge into 来实现。INSERT tbl_A (col, col2) SELECT col, col2 FROM tbl_B WHERE NOT EXISTS (SELECT col FROM tbl_A A2 WHERE A2.col = tbl_B.col);

如何避免Duplicate key在数据表插入中的应用