Представление SQL-сервера:как добавить недостающие строки с помощью интерполяции
-
06-09-2019 - |
Вопрос
Столкнулся с проблемой.
У меня есть таблица, в которой хранятся значения ежедневной казны. кривая доходности.
Это довольно простая таблица, используемая для исторического поиска значений.
В таблице по годам заметны пробелы. 4
, 6
, 8
, 9
, 11-19
и 21-29
.
Формула довольно проста: для расчета года 4
его 0.5*Year3Value + 0.5*Year5Value
.
Проблема в том, как мне написать VIEW
что может вернуть пропавшие годы?
Вероятно, я мог бы сделать это в хранимой процедуре, но конечным результатом должно быть представление.
Решение
Приняв предположение Том Х. что вам действительно нужна линейная интерполяция, и тот факт, что не хватает не только лет, но и месяцев, вам нужно основывать каждый расчет на МЕСЯЦЕ, а не на ГОДЕ.
В приведенном ниже коде я предполагаю, что у вас есть две таблицы (одна из которых может быть вычислена как часть представления):
- Урожай:содержит реальные данные и хранится ПериодM в номере месяца, а не в названии.Если вы храните Имя периода там, вам просто нужно присоединиться к столу:
- Период (можно вычислить в представлении, как показано):хранит название периода и количество месяцев, которые он представляет
Следующий код должен работать (вам просто нужно создать на его основе представление):
WITH "Period" (PeriodM, PeriodName) AS (
-- // I would store it as another table basically, but having it as part of the view would do
SELECT 01, '1 mo'
UNION ALL SELECT 02, '2 mo' -- // data not stored
UNION ALL SELECT 03, '3 mo'
UNION ALL SELECT 06, '6 mo'
UNION ALL SELECT 12, '1 yr'
UNION ALL SELECT 24, '2 yr'
UNION ALL SELECT 36, '3 yr'
UNION ALL SELECT 48, '4 yr' -- // data not stored
UNION ALL SELECT 60, '5 yr'
UNION ALL SELECT 72, '6 yr' -- // data not stored
UNION ALL SELECT 84, '7 yr'
UNION ALL SELECT 96, '8 yr' -- // data not stored
UNION ALL SELECT 108, '9 yr' -- // data not stored
UNION ALL SELECT 120, '10 yr'
-- ... // add more
UNION ALL SELECT 240, '20 yr'
-- ... // add more
UNION ALL SELECT 360, '30 yr'
)
, "Yield" (ID, PeriodM, Date, Value) AS (
-- // ** This is the TABLE your data is stored in **
-- //
-- // value of ID column is not important, but it must be unique (you may have your PK)
-- // ... it is used for a Tie-Breaker type of JOIN in the view
-- //
-- // This is just a test data:
SELECT 101, 01 /* '1 mo'*/, '2009-05-01', 0.06
UNION ALL SELECT 102, 03 /* '3 mo'*/, '2009-05-01', 0.16
UNION ALL SELECT 103, 06 /* '6 mo'*/, '2009-05-01', 0.31
UNION ALL SELECT 104, 12 /* '1 yr'*/, '2009-05-01', 0.49
UNION ALL SELECT 105, 24 /* '2 yr'*/, '2009-05-01', 0.92
UNION ALL SELECT 346, 36 /* '3 yr'*/, '2009-05-01', 1.39
UNION ALL SELECT 237, 60 /* '5 yr'*/, '2009-05-01', 2.03
UNION ALL SELECT 238, 84 /* '7 yr'*/, '2009-05-01', 2.72
UNION ALL SELECT 239,120 /*'10 yr'*/, '2009-05-01', 3.21
UNION ALL SELECT 240,240 /*'20 yr'*/, '2009-05-01', 4.14
UNION ALL SELECT 250,360 /*'30 yr'*/, '2009-05-01', 4.09
)
, "ReportingDate" ("Date") AS (
-- // this should be a part of the view (or a separate table)
SELECT DISTINCT Date FROM "Yield"
)
-- // This is the Final VIEW that you want given the data structure as above
SELECT d.Date, p.PeriodName, --//p.PeriodM,
CAST(
COALESCE(y_curr.Value,
( (p.PeriodM - y_prev.PeriodM) * y_prev.Value
+ (y_next.PeriodM - p.PeriodM) * y_next.Value
) / (y_next.PeriodM - y_prev.PeriodM)
) AS DECIMAL(9,4) -- // TODO: cast to your type if not FLOAT
) AS Value
FROM "Period" p
CROSS JOIN "ReportingDate" d
LEFT JOIN "Yield" y_curr
ON y_curr.Date = d.Date
AND y_curr.PeriodM = p.PeriodM
LEFT JOIN "Yield" y_prev
ON y_prev.ID = (SELECT TOP 1 y.ID FROM Yield y WHERE y.Date = d.Date AND y.PeriodM <= p.PeriodM ORDER BY y.PeriodM DESC)
LEFT JOIN "Yield" y_next
ON y_next.ID = (SELECT TOP 1 y.ID FROM Yield y WHERE y.Date = d.Date AND y.PeriodM >= p.PeriodM ORDER BY y.PeriodM ASC)
--//WHERE d.Date = '2009-05-01'
Другие советы
Вы можете попробовать unpivot, чтобы получить годы и значения в списке.
Затем объедините это с отсутствующими годами выберите ГодНет , (выберите YearValue, где YearNo = YearNo-1) * 0,5 + (выберите YearValue, где YearNo = YearNo+1) * 0,5 AS YearValue из unpivotedlist где YearNo in (наш недостающий список лет)
Затем снова поверните его, чтобы получить нужный формат, и вставьте его в представление?
Я предполагаю, что вы хотите, чтобы кривая плавно перемещалась между двумя годами, если есть разрыв, поэтому, если пропущено более одного года, вам не нужно просто усреднять два ближайших года.Вот что я бы, вероятно, использовал:
SELECT
NUM.number AS year,
COALESCE(YC.val, YC_BOT.val + ((NUM.number - YC_BOT.yr) * ((YC_TOP.val - YC_BOT.val)/(YC_TOP.yr - YC_BOT.yr))))
FROM
dbo.Numbers NUM
LEFT OUTER JOIN dbo.Yield_Curve YC ON
YC.yr = NUM.number
LEFT OUTER JOIN dbo.Yield_Curve YC_TOP ON
YC.yr IS NULL AND -- Only join if we couldn't find a current year value
YC_TOP.yr > NUM.number
LEFT OUTER JOIN dbo.Yield_Curve YC_TOP2 ON
YC_TOP2.yr > NUM.number AND
YC_TOP2.yr < YC_TOP.yr
LEFT OUTER JOIN dbo.Yield_Curve YC_BOT ON
YC.yr IS NULL AND -- Only join if we couldn't find a current year value
YC_BOT.yr < NUM.number
LEFT OUTER JOIN dbo.Yield_Curve YC_BOT2 ON
YC_BOT2.yr < NUM.number AND
YC_BOT2.yr > YC_BOT.yr
WHERE
YC_TOP2.yr IS NULL AND
YC_BOT2.yr IS NULL AND
NUM.number BETWEEN @low_yr AND @high_yr
Вы можете переписать это, используя CTE вместо таблицы чисел (просто таблица последовательных чисел).Вы также можете использовать NOT EXISTS или подзапросы с MIN и MAX вместо LEFT OUTER JOIN в YC_BOT2 и YC_TOP2, если хотите.Некоторых этот метод сбивает с толку.
WITh cal(year) AS
(
SELECT 1 AS current_year
UNION ALL
SELECT year + 1
FROM cal
WHERE year < 100
)
SELECT CASE WHEN yield_year IS NULL THEN
0.5 *
(
SELECT TOP 1 yield_value
FROM yield
WHERE yield_year < year
ORDER BY
yield_year DESC
) +
0.5 *
(
SELECT TOP 1 yield_value
FROM yield
WHERE yield_year > year
ORDER BY
yield_year ASC
)
ELSE
yield_value
END
FROM cal
LEFT JOIN
yield
ON yield_year = year
Для отсутствующих лет этот запрос принимает среднее значение найденных ближайших лет.