il numero di SQL calcolare di giorni di residenza per mese, per utente, per posizione
-
27-09-2019 - |
Domanda
Sto lavorando su una query per un'organizzazione di riabilitazione dove gli inquilini (client / pazienti) vivono in un edificio appena arrivati, man mano che avanzano nel loro trattamento si trasferiscono in un altro edificio e mentre verso la fine del trattamento che sono in un terzo edificio.
Ai fini di finanziamento abbiamo bisogno di sapere quante notti un inquilino speso in ogni edificio in ciascun mese. Posso utilizzare DateDiff per ottenere il numero totale di notti, ma come faccio a ottenere il totale per ogni cliente in ogni mese in ogni edificio?
Per esempio, John Smith è nella costruzione di un 9 / 12-11 / 3; sposta Edificio B 11 / 3-15; si sposta verso Edificio C su ed è ancora lì: 11/15 - oggi
Che query restituisce un risultato che visualizza il numero di notti trascorse in: Costruire A in SEPTMEBER, ottobre e novembre. Buidling B nel mese di novembre Edificio C nel mese di novembre
Due tabelle contengono il nome del cliente, la costruzione di nome e spostare in data e il move-out
CREATE TABLE [dbo].[clients](
[ID] [nvarchar](50) NULL,
[First_Name] [nvarchar](100) NULL,
[Last_Name] [nvarchar](100) NULL
) ON [PRIMARY]
--populate w/ two records
insert into clients (ID,First_name, Last_name)
values ('A2938', 'John', 'Smith')
insert into clients (ID,First_name, Last_name)
values ('A1398', 'Mary', 'Jones')
CREATE TABLE [dbo].[Buildings](
[ID_U] [nvarchar](50) NULL,
[Move_in_Date_Building_A] [datetime] NULL,
[Move_out_Date_Building_A] [datetime] NULL,
[Move_in_Date_Building_B] [datetime] NULL,
[Move_out_Date_Building_B] [datetime] NULL,
[Move_in_Date_Building_C] [datetime] NULL,
[Move_out_Date_Building_C] [datetime] NULL,
[Building_A] [nvarchar](50) NULL,
[Building_B] [nvarchar](50) NULL,
[Building_C] [nvarchar](50) NULL
) ON [PRIMARY]
-- Populate the tables with two records
insert into buildings (ID_U,Move_in_Date_Building_A,Move_out_Date_Building_A, Move_in_Date_Building_B,
Move_out_Date_Building_B, Move_in_Date_Building_C, Building_A, Building_B, Building_C)
VALUES ('A2938','2010-9-12', '2010-11-3','2010-11-3','2010-11-15', '2010-11-15', 'Kalgan', 'Rufus','Waylon')
insert into buildings (ID_U,Move_in_Date_Building_A,Building_A)
VALUES ('A1398','2010-10-6', 'Kalgan')
Grazie per il vostro aiuto.
Soluzione
userei uno schema di database correttamente normalizzata, il vostro tavolo Edifici non è utile come questo. Dopo la divisione fino credo che ottenere la vostra risposta sarà piuttosto facile.
Modifica (e aggiornato): Ecco un CTE che avrà questa struttura della tabella strano e dividerlo in una forma più normalizzata, che visualizza l'ID utente, la costruzione di nome, si muovono in e uscire date. Raggruppando su quelli che si desidera (e usando DATEPART()
ecc) si dovrebbe essere in grado di ottenere i dati necessari in questo.
WITH User_Stays AS (
SELECT
ID_U,
Building_A Building,
Move_in_Date_Building_A Move_In,
COALESCE(Move_out_Date_Building_A, CASE WHEN ((Move_in_Date_Building_B IS NULL) OR (Move_in_Date_Building_C<Move_in_Date_Building_B)) AND (Move_in_Date_Building_C>Move_in_Date_Building_A) THEN Move_in_Date_Building_C WHEN Move_in_Date_Building_B>=Move_in_Date_Building_A THEN Move_in_Date_Building_B END, GETDATE()) Move_Out
FROM dbo.Buildings
WHERE Move_in_Date_Building_A IS NOT NULL
UNION ALL
SELECT
ID_U,
Building_B,
Move_in_Date_Building_B,
COALESCE(Move_out_Date_Building_B, CASE WHEN ((Move_in_Date_Building_A IS NULL) OR (Move_in_Date_Building_C<Move_in_Date_Building_A)) AND (Move_in_Date_Building_C>Move_in_Date_Building_B) THEN Move_in_Date_Building_C WHEN Move_in_Date_Building_A>=Move_in_Date_Building_B THEN Move_in_Date_Building_A END, GETDATE())
FROM dbo.Buildings
WHERE Move_in_Date_Building_B IS NOT NULL
UNION ALL
SELECT
ID_U,
Building_C,
Move_in_Date_Building_C,
COALESCE(Move_out_Date_Building_C, CASE WHEN ((Move_in_Date_Building_B IS NULL) OR (Move_in_Date_Building_A<Move_in_Date_Building_B)) AND (Move_in_Date_Building_A>Move_in_Date_Building_C) THEN Move_in_Date_Building_A WHEN Move_in_Date_Building_B>=Move_in_Date_Building_C THEN Move_in_Date_Building_B END, GETDATE())
FROM dbo.Buildings
WHERE Move_in_Date_Building_C IS NOT NULL
)
SELECT *
FROM User_Stays
ORDER BY ID_U, Move_In
Questa query eseguita sui dati di esempio produce seguente output:
ID_U Building Move_In Move_Out
-------- ----------- ----------------------- -----------------------
A1398 Kalgan 2010-10-06 00:00:00.000 2010-11-23 18:35:59.050
A2938 Kalgan 2010-09-12 00:00:00.000 2010-11-03 00:00:00.000
A2938 Rufus 2010-11-03 00:00:00.000 2010-11-15 00:00:00.000
A2938 Waylon 2010-11-15 00:00:00.000 2010-11-23 18:35:59.050
(4 row(s) affected)
Come si può vedere, da qui in poi sarà molto più facile isolare i giorni per paziente o da costruzione, e anche per trovare i record per mesi specifici e calcolare la corretta durata di permanenza in quel caso. Si noti che le CTE visualizza la data corrente per i pazienti che sono ancora in un edificio.
Modifica (di nuovo): Al fine di ottenere tutti i mesi compresi i loro inizio e di fine per tutti gli anni in questione, è possibile utilizzare un CTE in questo modo:
WITH User_Stays AS (
[...see above...]
)
,
Months AS (
SELECT m.IX,
y.[Year], dateadd(month,(12*y.[Year])-22801+m.ix,0) StartDate, dateadd(second, -1, dateadd(month,(12*y.[Year])-22800+m.ix,0)) EndDate
FROM (
SELECT 1 IX UNION ALL
SELECT 2 UNION ALL
SELECT 3 UNION ALL
SELECT 4 UNION ALL
SELECT 5 UNION ALL
SELECT 6 UNION ALL
SELECT 7 UNION ALL
SELECT 8 UNION ALL
SELECT 9 UNION ALL
SELECT 10 UNION ALL
SELECT 11 UNION ALL
SELECT 12
)
m
CROSS JOIN (
SELECT Datepart(YEAR, us.Move_In) [Year]
FROM User_Stays us UNION
SELECT Datepart(YEAR, us.Move_Out)
FROM User_Stays us
)
y
)
SELECT *
FROM months;
Quindi, dal momento che ora abbiamo una rappresentazione tabellare di tutti gli intervalli di date che possono essere di interesse, abbiamo semplicemente aderire a questo insieme:
WITH User_Stays AS ([...]),
Months AS ([...])
SELECT m.[Year],
DATENAME(MONTH, m.StartDate) [Month],
us.ID_U,
us.Building,
DATEDIFF(DAY, CASE WHEN us.Move_In>m.StartDate THEN us.Move_In ELSE m.StartDate END, CASE WHEN us.Move_Out<m.EndDate THEN us.Move_Out ELSE DATEADD(DAY, -1, m.EndDate) END) Days
FROM Months m
JOIN User_Stays us ON (us.Move_In < m.EndDate) AND (us.Move_Out >= m.StartDate)
ORDER BY m.[Year],
us.ID_U,
m.Ix,
us.Move_In
che alla fine produce questo risultato:
Year Month ID_U Building Days
----------- ------------ -------- ---------- -----------
2010 October A1398 Kalgan 25
2010 November A1398 Kalgan 22
2010 September A2938 Kalgan 18
2010 October A2938 Kalgan 30
2010 November A2938 Kalgan 2
2010 November A2938 Rufus 12
2010 November A2938 Waylon 8
Altri suggerimenti
- impostare le date per le quali il mese che si desidera
Declare @startDate datetime
declare @endDate datetime
set @StartDate = '09/01/2010'
set @EndDate = '09/30/2010'
select
-- determine if the stay occurred during this month
Case When @StartDate <= Move_out_Date_Building_A and @EndDate >= Move_in_Date_Building_A
Then
(DateDiff(d, @StartDate , @enddate+1)
)
-- drop the days off the front
- (Case When @StartDate < Move_in_Date_Building_A
Then datediff(d, @StartDate, Move_in_Date_Building_A)
Else 0
End)
--drop the days of the end
- (Case When @EndDate > Move_out_Date_Building_A
Then datediff(d, @EndDate, Move_out_Date_Building_A)
Else 0
End)
Else 0
End AS Building_A_Days_Stayed
from Clients c
inner join Buildings b
on c.id = b.id_u
Provare a utilizzare una tabella data. Ad esempio, è possibile creare uno in questo modo:
CREATE TABLE Dates
(
[date] datetime,
[year] smallint,
[month] tinyint,
[day] tinyint
)
INSERT INTO Dates(date)
SELECT dateadd(yy, 100, cast(row_number() over(order by s1.object_id) as datetime))
FROM sys.objects s1
CROSS JOIN sys.objects s2
UPDATE Dates
SET [year] = year(date),
[month] = month(date),
[day] = day(date)
Basta modificare la popolazione iniziale date per soddisfare le vostre esigenze (sul mio esempio di prova, le date sopra fruttati dal 2000/01/02 al 2015/10/26). Con una tabella di date, la query è piuttosto semplice, qualcosa di simile a questo:
select c.First_name, c.Last_name,
b.Building_A BuildingName, dA.year, dA.month, count(distinct dA.day) daysInBuilding
from clients c
join Buildings b on c.ID = b.ID_U
left join Dates dA on dA.date between b.Move_in_Date_Building_A and isnull(b.Move_out_Date_Building_A, getDate())
group by c.First_name, c.Last_name,
b.Building_A, dA.year, dA.month
UNION
select c.First_name, c.Last_name,
b.Building_B, dB.year, dB.month, count(distinct dB.day)
from clients c
join Buildings b on c.ID = b.ID_U
left join Dates dB on dB.date between b.Move_in_Date_Building_B and isnull(b.Move_out_Date_Building_B, getDate())
group by c.First_name, c.Last_name,
b.Building_B, dB.year, dB.month
UNION
select c.First_name, c.Last_name,
b.Building_C, dC.year, dC.month, count(distinct dC.day)
from clients c
join Buildings b on c.ID = b.ID_U
left join Dates dC on dC.date between b.Move_in_Date_Building_C and isnull(b.Move_out_Date_Building_C, getDate())
group by c.First_name, c.Last_name,
b.Building_C, dC.year, dC.month
Se non è possibile ristrutturare la tabella di costruzione è possibile creare una query che normalizzare per voi e per consentire i calcoli più semplici:
SELECT "A" as Building, BuidlingA as Name, Move_in_Date_Building_A as MoveInDate,
Move_out_Date_Building_A As MoveOutDate
UNION
SELECT "B", BuidlingB, Move_in_Date_Building_B, Move_out_Date_Building_B
UNION
SELECT "C", BuidlingC, Move_in_Date_Building_C, Move_out_Date_Building_C