удаление дубликатов данных mysql
-
23-09-2019 - |
Вопрос
Это показывает мне все имена и фамилии, которые содержат ровно две идентичные записи
SELECT `firstname`,`lastname`,COUNT(*) AS Count
FROM `people`
GROUP BY `firstname`,`lastname`
HAVING Count = 2
Как мне превратить это в инструкцию DELETE FROM WHERE с ОГРАНИЧЕНИЕМ на удаление только одной из каждой записи и оставление другой?
хорошо, похоже, это технический подход, я просто собираюсь сделать это в цикле php while
Решение
Вы можете создать таблицу с 1 записью каждого из дубликатов:Затем удалите все дублирующие записи из таблицы people, а затем повторно вставьте дублирующие записи.
-- Setup for example
create table people (fname varchar(10), lname varchar(10));
insert into people values ('Bob', 'Newhart');
insert into people values ('Bob', 'Newhart');
insert into people values ('Bill', 'Cosby');
insert into people values ('Jim', 'Gaffigan');
insert into people values ('Jim', 'Gaffigan');
insert into people values ('Adam', 'Sandler');
-- Show table with duplicates
select * from people;
-- Create table with one version of each duplicate record
create table dups as
select distinct fname, lname, count(*)
from people group by fname, lname
having count(*) > 1;
-- Delete all matching duplicate records
delete people from people inner join dups
on people.fname = dups.fname AND
people.lname = dups.lname;
-- Insert single record of each dup back into table
insert into people select fname, lname from dups;
-- Show Fixed table
select * from people;
Другие советы
если у вас есть первичный ключ, такой как id, вы можете сделать:
delete from people
where id not in
(
select minid from
(select min(id) as minid from people
group by firstname, lastname) as newtable
)
Подзапрос select min(id)...
бит предоставляет вам уникальные (на основе идентификатора) строки для заданной комбинации имени и фамилии;и затем вы удаляете все остальные строки, т. е.ваши дубликаты.Вам нужно завершить свой подзапрос из-за ошибки в mysql, в противном случае мы могли бы сделать:
delete from people
where id not in
(
select min(id) as minid from people
group by firstname, lastname
)
лучше было бы:
delete people from
people left outer join
(
select min(id) as minid from people
group by firstname, lastname
) people_grouped
on people.first_name = people_grouped.first_name
and people.last_name = people_grouped.last_name
and people_grouped.id is null
чтобы избежать подзапроса.
Создайте новую таблицу и добавьте уникальный ключ (firstname,lastname).Затем вставьте строки из старой таблицы в новую таблицу.Затем переименуйте таблицы.
mysql> select * from t;
+-----------+----------+
| firstname | lastname |
+-----------+----------+
| A | B |
| A | B |
| X | Y |
+-----------+----------+
3 rows in set (0.00 sec)
mysql> create table t2 like t;
Query OK, 0 rows affected (0.00 sec)
mysql> alter table t2 add unique key name(firstname,lastname);
Query OK, 0 rows affected (0.00 sec)
Records: 0 Duplicates: 0 Warnings: 0
mysql> insert ignore into t2 select * from t;
Query OK, 2 rows affected (0.00 sec)
Records: 3 Duplicates: 1 Warnings: 0
mysql> select * from t2;
+-----------+----------+
| firstname | lastname |
+-----------+----------+
| A | B |
| X | Y |
+-----------+----------+
2 rows in set (0.01 sec)