Como faço para encontrar valores duplicados em uma tabela no Oracle?
-
09-06-2019 - |
Pergunta
O que uma simples instrução SQL que irá devolver os valores duplicados para uma determinada coluna e o número de suas ocorrências em uma tabela de banco de dados Oracle?
Por exemplo:Eu tenho um JOBS
tabela com a coluna JOB_NUMBER
.Como posso saber se tenho qualquer duplicados JOB_NUMBER
s, e como muitas vezes eles são duplicados?
Solução
SELECT column_name, COUNT(column_name)
FROM table_name
GROUP BY column_name
HAVING COUNT(column_name) > 1;
Outras dicas
De outra forma:
SELECT *
FROM TABLE A
WHERE EXISTS (
SELECT 1 FROM TABLE
WHERE COLUMN_NAME = A.COLUMN_NAME
AND ROWID < A.ROWID
)
Funciona bem (rápido o suficiente), quando é índice de column_name
.E é a melhor maneira para eliminar ou actualizar linhas duplicadas.
Mais simples que eu posso pensar:
select job_number, count(*)
from jobs
group by job_number
having count(*) > 1;
Você não precisa mesmo ter a contagem no devolvidos colunas se você não precisa saber o número real de duplicatas.exemplo:
SELECT column_name
FROM table
GROUP BY column_name
HAVING COUNT(*) > 1
Como sobre:
SELECT <column>, count(*)
FROM <table>
GROUP BY <column> HAVING COUNT(*) > 1;
Para atender o exemplo acima, seria mais ou menos assim:
SELECT job_number, count(*)
FROM jobs
GROUP BY job_number HAVING COUNT(*) > 1;
No caso em que várias colunas identificar única linha (e.g de relações de tabela ) lá você pode usar o seguinte
Utilizar o id de linha exemplo:emp_dept(empid, deptid, startdate enddate) suponha que empid e deptid são únicos e identificar a linha em que caso
select oed.empid, count(oed.empid)
from emp_dept oed
where exists ( select *
from emp_dept ied
where oed.rowid <> ied.rowid and
ied.empid = oed.empid and
ied.deptid = oed.deptid )
group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);
e se tal tabela de chave primária, em seguida, usar chave primária em vez de rowid, e.g id é pk, em seguida,
select oed.empid, count(oed.empid)
from emp_dept oed
where exists ( select *
from emp_dept ied
where oed.id <> ied.id and
ied.empid = oed.empid and
ied.deptid = oed.deptid )
group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);
Fazendo
select count(j1.job_number), j1.job_number, j1.id, j2.id
from jobs j1 join jobs j2 on (j1.job_numer = j2.job_number)
where j1.id != j2.id
group by j1.job_number
vai dar-lhe o duplicado linhas' ids.
SELECT SocialSecurity_Number, Count(*) no_of_rows
FROM SocialSecurity
GROUP BY SocialSecurity_Number
HAVING Count(*) > 1
Order by Count(*) desc
Eu normalmente uso Oracle Analítico função ROW_NUMBER().
Digamos que você queira verificar as duplicatas você ter a respeito de uma chave primary ou unique construído sobre colunas (c1
, c2
, c3
).Em seguida, você vai ir por este caminho, trazendo até ROWID
s de linhas, onde o número de linhas interposto por ROW_NUMBER()
é >1
:
Select * From Table_With_Duplicates
Where Rowid In
(Select Rowid
From (Select Rowid,
ROW_NUMBER() Over (
Partition By c1 || c2 || c3
Order By c1 || c2 || c3
) nbLines
From Table_With_Duplicates) t2
Where nbLines > 1)
Aqui está um SQL pedido para o fazer:
select column_name, count(1)
from table
group by column_name
having count (column_name) > 1;
Eu sei que é uma velha discussão, mas isso pode ajudar alguém.
Se você precisar imprimir outras colunas da tabela durante a verificação para o uso duplicado abaixo:
select * from table where column_name in
(select ing.column_name from table ing group by ing.column_name having count(*) > 1)
order by column_name desc;
também pode adicionar alguns filtros adicionais na cláusula where, se necessário.
1.solução
select * from emp
where rowid not in
(select max(rowid) from emp group by empno);
Também vc pode tentar algo como este para listar todos os valores duplicados em uma tabela dizer reqitem
SELECT count(poid)
FROM poitem
WHERE poid = 50
AND rownum < any (SELECT count(*) FROM poitem WHERE poid = 50)
GROUP BY poid
MINUS
SELECT count(poid)
FROM poitem
WHERE poid in (50)
GROUP BY poid
HAVING count(poid) > 1;