!--NEWSZW_HZH_BEGIN--
MYSQL里有五百万数据,但大多是反复的,真实的就180万,因而想怎样把这些反复的数据弄出来,在网上找了一圈,好多是用NOT IN这样的代码,这样效力很低,自己揣摩组合了一下,找到一个高效的处置方法,用这个方法,五百万数据,十来分钟就全体去除反复了,请各位参考。MYSQL里有五百万数据,但大多是反复的,真实的就180
!--NEWSZW_HZH_BEGIN--
MYSQL里有五百万数据,但大多是反复的,真实的就180万,因而想怎样把这些反复的数据弄出来,在网上找了一圈,好多是用NOT IN这样的代码,这样效力很低,自己揣摩组合了一下,找到一个高效的处置方法,用这个方法,五百万数据,十来分钟就全体去除反复了,请各位参考。MYSQL里有五百万数据,但大多是反复的,真实的就180