¿Cómo encuentro valores duplicados en una tabla en Oracle?

https://stackoverflow.com/questions/59232

09-06-2019
|

Pregunta

¿Cuál es la declaración SQL más simple que devolverá los valores duplicados para una columna determinada y el recuento de sus apariciones en una tabla de base de datos Oracle?

Por ejemplo:tengo un JOBS tabla con la columna JOB_NUMBER.¿Cómo puedo saber si tengo algún duplicado? JOB_NUMBERs, y ¿cuántas veces se duplican?

Solución

SELECT column_name, COUNT(column_name)
FROM table_name
GROUP BY column_name
HAVING COUNT(column_name) > 1;

Otros consejos

De otra manera:

SELECT *
FROM TABLE A
WHERE EXISTS (
  SELECT 1 FROM TABLE
  WHERE COLUMN_NAME = A.COLUMN_NAME
  AND ROWID < A.ROWID
)

Funciona bien (bastante rápido) cuando hay un índice activado column_name.Y es una mejor manera de eliminar o actualizar filas duplicadas.

Lo más simple que se me ocurre:

select job_number, count(*)
from jobs
group by job_number
having count(*) > 1;

Ni siquiera necesita tener el recuento en las columnas devueltas si no necesita saber el número real de duplicados.p.ej.

SELECT column_name
FROM table
GROUP BY column_name
HAVING COUNT(*) > 1

Qué tal si:

SELECT <column>, count(*)
FROM <table>
GROUP BY <column> HAVING COUNT(*) > 1;

Para responder al ejemplo anterior, se vería así:

SELECT job_number, count(*)
FROM jobs
GROUP BY job_number HAVING COUNT(*) > 1;

En caso de que varias columnas identifiquen una fila única (por ejemplo, tabla de relaciones), puede utilizar lo siguiente

Use la identificación de la fila, por ejemplo,Emp_Dept (Empid, DePTid, StartDate, End Date) Suponga

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.rowid <> ied.rowid and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

y si dicha tabla tiene una clave principal, utilice la clave principal en lugar de ID de fila, por ejemplo, la identificación es pk, entonces

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.id <> ied.id and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

Haciendo

select count(j1.job_number), j1.job_number, j1.id, j2.id
from   jobs j1 join jobs j2 on (j1.job_numer = j2.job_number)
where  j1.id != j2.id
group by j1.job_number

le dará los ID de las filas duplicadas.

SELECT   SocialSecurity_Number, Count(*) no_of_rows
FROM     SocialSecurity 
GROUP BY SocialSecurity_Number
HAVING   Count(*) > 1
Order by Count(*) desc

Yo suelo usar Analítica de Oracle función NUMERO DE FILA().

Supongamos que desea verificar los duplicados que tiene con respecto a un índice único o clave principal construida en columnas (c1, c2, c3).Entonces irás por este camino, criando ROWID s de filas donde el número de líneas traídas por ROW_NUMBER() es >1:

Select * From Table_With_Duplicates
      Where Rowid In
                    (Select Rowid
                       From (Select Rowid,
                                    ROW_NUMBER() Over (
                                            Partition By c1 || c2 || c3
                                            Order By c1 || c2 || c3
                                        ) nbLines
                               From Table_With_Duplicates) t2
                      Where nbLines > 1)

Aquí hay una solicitud SQL para hacer eso:

select column_name, count(1)
from table
group by column_name
having count (column_name) > 1;

Sé que es un hilo antiguo pero esto puede ayudar a alguien.

Si necesita imprimir otras columnas de la tabla mientras busca duplicados, utilice a continuación:

select * from table where column_name in
(select ing.column_name from table ing group by ing.column_name having count(*) > 1)
order by column_name desc;

También puede agregar algunos filtros adicionales en la cláusula donde si es necesario.

1.solución

select * from emp
    where rowid not in
    (select max(rowid) from emp group by empno);

También puedes probar algo como esto para enumerar todos los valores duplicados en una tabla, por ejemplo reqitem.

SELECT count(poid) 
FROM poitem 
WHERE poid = 50 
AND rownum < any (SELECT count(*)  FROM poitem WHERE poid = 50) 
GROUP BY poid 
MINUS
SELECT count(poid) 
FROM poitem 
WHERE poid in (50)
GROUP BY poid 
HAVING count(poid) > 1;

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow