Как эльминизировать ценности в таблице Oracle-SQL, которая означает то же самое?
Вопрос
У меня есть такой столик:
ID | Val1 | Val2
---------------------
1 | 1 | 2
2 | 1 | 3
3 | 2 | 1
4 | 2 | 3
5 | 3 | 1
6 | 3 | 2
Теперь моя проблема заключается в том, что 1 - 2 означает то же самое, что 2 - 1 (см. ID ID 1 и ID 3), и я хочу устранить все записи, где значение 1 - значение 2 означает то же самое, как значение 2 - значение1 (надежда Вы могли бы следовать моей логике здесь).
Решение
Как насчет этого:
DELETE t
WHERE ID IN
(SELECT t1.id
FROM t t1 JOIN t t2
ON (t1.val1 = t2.val2 AND
t1.val2 = t2.val1 AND
t1.id < t2.id));
Я произвольно держал ряд с наибольшей ценностью идентификатора.
Пример:
SQL> CREATE TABLE t (ID INTEGER, val1 INTEGER, val2 INTEGER);
Table created
SQL> INSERT INTO t VALUES(1,1,2);
1 row inserted
SQL> INSERT INTO t VALUES(2,1,3);
1 row inserted
SQL> INSERT INTO t VALUES(3,2,1);
1 row inserted
SQL> INSERT INTO t VALUES(4,2,3);
1 row inserted
SQL> INSERT INTO t VALUES(5,3,1);
1 row inserted
SQL> INSERT INTO t VALUES(6,3,2);
1 row inserted
SQL> INSERT INTO t VALUES(7,4,4);
1 row inserted
SQL> INSERT INTO t VALUES(8,4,4);
1 row inserted
SQL> SELECT * FROM t;
ID VAL VAL
--- --- ---
1 1 2
2 1 3
3 2 1
4 2 3
5 3 1
6 3 2
7 4 4
8 4 4
8 rows selected
SQL> DELETE t
2 WHERE ID IN (SELECT t1.id
3 FROM t t1 JOIN t t2 ON (t1.val1 = t2.val2 AND t1.val2 = t2.val1 AND t1.id < t2.id));
4 rows deleted
SQL> SELECT * FROM t;
ID VAL VAL
--- --- ---
3 2 1
5 3 1
6 3 2
8 4 4
SQL>
Легко адаптируемо, чтобы держать разные ряды, например,
DELETE t
WHERE ID IN
(SELECT t1.id
FROM t t1 JOIN t t2
ON (t1.val1 = t2.val2 AND
t1.val2 = t2.val1 AND
(t2.val1 < t1.val1 OR (t2.val1 = t1.val1 AND t2.id > t1.id))));
Обновление: не мог придумать действительно умный путь, поэтому вот метод грубой силы, чтобы ответить на вопрос в вашем комментарии:
CREATE TABLE t (ID INTEGER, val1 INTEGER, val2 INTEGER, val3 INTEGER);
INSERT INTO t VALUES (1, 1, 2, 3);
INSERT INTO t VALUES (2, 1, 3, 2);
INSERT INTO t VALUES (3, 2, 1, 3);
INSERT INTO t VALUES (4, 2, 3, 1);
INSERT INTO t VALUES (5, 3, 1, 2);
INSERT INTO t VALUES (6, 3, 2, 1);
INSERT INTO t VALUES (7, 1, 2, 4);
INSERT INTO t VALUES (8, 1, 3, 5);
INSERT INTO t VALUES (9, 1, 4, 2);
INSERT INTO t VALUES (10, 1, 1, 1);
INSERT INTO t VALUES (11, 1, 1, 1);
INSERT INTO t VALUES (12, 1, 3, 5);
SQL> select * from t order by id;
ID VAL VAL VAL
--- --- --- ---
1 1 2 3
2 1 3 2
3 2 1 3
4 2 3 1
5 3 1 2
6 3 2 1
7 1 2 4
8 1 3 5
9 1 4 2
10 1 1 1
11 1 1 1
12 1 3 5
12 rows selected
DELETE FROM t
WHERE ID IN (SELECT t1.ID FROM t t1 JOIN t t2 ON (t1.val1 = t2.val1 AND
t1.val2 = t2.val2 AND
t1.val3 = t2.val3 AND t1.id < t2.id)
UNION ALL
SELECT t1.ID FROM t t1 JOIN t t2 ON (t1.val1 = t2.val1 AND
t1.val2 = t2.val3 AND
t1.val3 = t2.val2 AND t1.id < t2.id)
UNION ALL
SELECT t1.ID FROM t t1 JOIN t t2 ON (t1.val1 = t2.val2 AND
t1.val2 = t2.val1 AND
t1.val3 = t2.val3 AND t1.id < t2.id)
UNION ALL
SELECT t1.ID FROM t t1 JOIN t t2 ON (t1.val1 = t2.val2 AND
t1.val2 = t2.val3 AND
t1.val3 = t2.val1 AND t1.id < t2.id)
UNION ALL
SELECT t1.ID FROM t t1 JOIN t t2 ON (t1.val1 = t2.val3 AND
t1.val2 = t2.val1 AND
t1.val3 = t2.val2 AND t1.id < t2.id)
UNION ALL
SELECT t1.ID FROM t t1 JOIN t t2 ON (t1.val1 = t2.val3 AND
t1.val2 = t2.val2 AND
t1.val3 = t2.val1 AND t1.id < t2.id));
select * from t order by id;
ID VAL VAL VAL
--- --- --- ---
6 3 2 1
9 1 4 2
11 1 1 1
12 1 3 5
Другие советы
Я не вспоминаю, если этот синтаксис действителен в Oracle или нет (в основном использование псевдонима для объекта удаления), но вы можете попробовать это:
DELETE
T1
FROM
My_Table T1
INNER JOIN My_Table T2 ON
T2.val1 = T1.val2 AND
T2.val2 = T1.val2 AND
WHERE
T1.val1 < T1.val2
Поскольку упорядочение столбцов, похоже, не имеет значения, я бы сделал произвольное решение, и я добавлю ограничение на стол, чтобы проверить, что Val1 <val2. Затем вы можете поставить уникальное ограничение на комбинацию двух столбцов (если у вас его еще нет) и убедитесь, что у вас не будет этой проблемы снова.
Конечно, вам также потребуется убедиться, что любое приложение или код, вставляющий строки в таблицу, знает, что Конвенция (VAL1 всегда должна быть наименьшим из двух значений) и следует за ним.
Если устранить средства не показывать, попробуйте это, это не вернет никаких строк для этих условий
select * from YourTable t1
where not exists (select * from YourTable t2
where t1.Val1 = t2.Val2
and t1.Val2 = t2.Val1)
delete from YourTable
where (Val1, Val2)
in (select Val2, Val1 from YourTable where Val1 > Val2)
Есть угловой чехол, который здесь не обрабатывается здесь. Это тот случай, когда VAL1 и VAL2 равны. Удаление все, кроме одного возникновения таких рядов немного сложнее. У кого-нибудь есть идеи?