posts - 33,  comments - 11,  trackbacks - 0

数据库中有个大表,需要查找其中的名字有重复的记录id,以便比较。

如果仅仅是查找数据库中name不重复的字段,很容易

  1. SELECT min(`id`),`name`   
  2. FROM `table`   
  3. GROUP BY `name`;  

但是这样并不能得到说有重复字段的id值。(只得到了最小的一个id值)

查询哪些字段是重复的也容易

  1. SELECT `name`,count(`name`) as count   
  2. FROM `table`   
  3. GROUP BY `name` HAVING count(`name`) >1   
  4. ORDER BY count DESC;  

但是要一次查询到重复字段的id值,就必须使用子查询了,于是使用下面的语句来实现MySQL大表重复字段查询。

  1. SELECT `id`,`name`   
  2. FROM `table`   
  3. WHERE `name` in (   
  4.    SELECT `name`   
  5.    FROM `table`   
  6.    GROUP BY `name` HAVING count(`name`) >1  
  7. );  

但是这条语句在mysql中效率太差,感觉mysql并没有为子查询生成零时表。

于是使用先建立零时表

  1. create table `tmptable` as (  
  2.    SELECT `name`   
  3.    FROM `table`   
  4.    GROUP BY `name` HAVING count(`name`) >1  
  5. );  

然后使用多表连接查询

  1. SELECT a.`id`, a.`name`   
  2. FROM `table` a, `tmptable` t   
  3. WHERE a.`name` = t.`name`;  

结果这次结果很快就出来了。

用 distinct去重复

  1. SELECT distinct a.`id`, a.`name`   
  2. FROM `table` a, `tmptable` t   
  3. WHERE a.`name` = t.`name`;  
posted on 2012-05-25 14:15 方涛升 阅读(250) 评论(0)  编辑  收藏 所属分类: j2ee

只有注册用户登录后才能发表评论。


网站导航:
 
<2012年5月>
293012345
6789101112
13141516171819
20212223242526
272829303112
3456789

常用链接

留言簿(2)

随笔分类

随笔档案

文章分类

搜索

  •  

最新评论

阅读排行榜

评论排行榜