Вопрос
У меня есть выбор, который вернет что -то вроде следующей таблицы:
start | stop | id ------------------ 0 | 100 | 1 1 | 101 | 1 2 | 102 | 1 2 | 102 | 2 5 | 105 | 1 7 | 107 | 2 ... 300 | 400 | 1 370 | 470 | 1 450 | 550 | 1
Где остановка = старт + n; n = 100 в этом случае.
Я хотел бы объединить перекрытия для каждого идентификатора:
start | stop | id ------------------ 0 | 105 | 1 2 | 107 | 2 ... 300 | 550 | 1
ID 1 не дает 0 - 550, потому что старт 300 после остановки 105.
Будут сотни тысяч записей, возвращенных первым запросом, и n могут подняться до десятков тысяч, поэтому, чем быстрее его можно обработать, тем лучше.
Используя PostgreSQL, кстати.
Решение
WITH bounds AS
(
SELECT *, ROW_NUMBER() OVER (PARTITION BY id ORDER BY start) AS rn
FROM (
SELECT id, LAG(stop) OVER (PARTITION BY id ORDER BY start) AS pstop, start
FROM q
UNION ALL
SELECT id, MAX(stop), NULL
FROM q
GROUP BY
id
) q2
WHERE start > pstop OR pstop IS NULL OR start IS NULL
)
SELECT b2.start, b1.pstop
FROM bounds b1
JOIN bounds b2
ON b1.id = b2.id
AND b1.rn = b2.rn + 1
Не связан с StackOverflow