Вопрос

Приведенный ниже запрос группирует результаты из first в 4 ячейки для дат, расположенные на равном расстоянии друг от друга, и суммирует среднее значение для the_value в каждом контейнере.

WITH first as(
SELECT
    extract(EPOCH FROM foo.t_date) as the_date,
    foo_val as the_value
FROM bar
INNER JOIN foo
ON
    foo.user_id = bar.x_id
    and
    foo.user_name = 'xxxx'
)
SELECT bin, round(sum(bin_sum) OVER w /sum(bin_ct) OVER w, 2) AS running_avg
FROM  (
   SELECT width_bucket(first.the_date
                     , x.min_epoch, x.max_epoch, x.bins) AS bin
        , sum(first.the_value) AS bin_sum
        , count(*)   AS bin_ct
   FROM   first
       , (SELECT MIN(first.the_date) AS min_epoch
               , MAX(first.the_date) AS max_epoch
               , 4 AS bins
          FROM  first
         ) x
   GROUP  BY 1
   ) sub
WINDOW w AS (ORDER BY bin)
ORDER  BY 1;

Я хотел бы иметь возможность рассчитать среднее значение только для самых низких, скажем, 20 the_valueэто в каждом мусорном ведре.Из других постов здесь, на Stackoverflow, я видел, что это возможно и что, возможно ORDER BY the_value и rank() это лучший способ добиться этого.Но моя проблема заключается в том, что я не уверен, где следует изменить мой текущий запрос, чтобы реализовать это.

Любое понимание было бы оценено по достоинству.

Postgres версии 9.3

Это было полезно?

Решение

Воспользуйся row_number() на каждом контейнере.
Сначала вычислите номер строки rn, затем примените WHERE rn < 21 на следующем шаге:

WITH first AS (
   SELECT extract(EPOCH FROM foo.t_date) AS the_date
        , foo_val AS the_value
   FROM bar
   JOIN foo ON foo.user_id = bar.x_id
           AND foo.user_name = 'xxxx'
   )
, x AS (
   SELECT MIN(the_date) AS min_epoch
        , MAX(the_date) AS max_epoch
   FROM  first
   )
, y AS (
   SELECT width_bucket(f.the_date, x.min_epoch, x.max_epoch, 4) AS bin, *
   FROM   first f, x
   )
, z AS (
   SELECT row_number() OVER (PARTITION BY bin ORDER BY the_value) AS rn, *
   FROM   y
   )
SELECT bin, round(sum(bin_sum) OVER w / sum(bin_ct) OVER w, 2) AS running_avg
FROM  (
   SELECT bin
        , sum(the_value) AS bin_sum
        , count(*)       AS bin_ct
   FROM   z
   WHERE  rn < 21   -- max 20 lowest values
   GROUP  BY 1
   ) sub
WINDOW w AS (ORDER BY bin)
ORDER  BY 1;

КТЕс y и z могут быть объединены.Аналогично first и x могут быть объединены.
Но так все понятнее.

Непроверенный, поскольку у нас нет тестовых данных.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top