Как использовать GROUP BY для объединения строк в SQL Server?
-
07-07-2019 - |
Вопрос
Как мне получить:
id Name Value
1 A 4
1 B 8
2 C 9
Для
id Column
1 A:4, B:8
2 C:9
Решение
Никакого CURSOR, цикла WHILE или определяемой пользователем функции не требуется..
Просто нужно проявить творческий подход к FOR XML и PATH.
[Примечание:Это решение работает только в SQL 2005 и более поздних версиях.В исходном вопросе не указана используемая версия.]
CREATE TABLE #YourTable ([ID] INT, [Name] CHAR(1), [Value] INT)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (1,'A',4)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (1,'B',8)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (2,'C',9)
SELECT
[ID],
STUFF((
SELECT ', ' + [Name] + ':' + CAST([Value] AS VARCHAR(MAX))
FROM #YourTable
WHERE (ID = Results.ID)
FOR XML PATH(''),TYPE).value('(./text())[1]','VARCHAR(MAX)')
,1,2,'') AS NameValues
FROM #YourTable Results
GROUP BY ID
DROP TABLE #YourTable
Другие советы
Если это SQL Server 2017 или SQL Server Vnext, SQL Azure, вы можете использовать string_agg, как показано ниже:
select id, string_agg(concat(name, ':', [value]), ', ')
from #YourTable
group by id
использование пути XML не будет идеально объединяться, как вы могли ожидать...он заменит «&» на «&», а также будет путаться с <" and ">
...может быть, еще что-то, не уверен...но ты можешь попробовать это
Я нашел обходной путь для этого...вам нужно заменить:
FOR XML PATH('')
)
с:
FOR XML PATH(''),TYPE
).value('(./text())[1]','VARCHAR(MAX)')
...или NVARCHAR(MAX)
если это то, что вы используете.
почему, черт возьми, нет SQL
есть конкатенатная агрегатная функция?это ПИТА.
Я столкнулся с парой проблем, когда пытался преобразовать предложение Кевина Фэйрчайлда для работы со строками, содержащими пробелы и специальные символы XML (&
, <
, >
), которые были закодированы.
Окончательная версия моего кода (которая не отвечает на исходный вопрос, но может быть кому-то полезна) выглядит так:
CREATE TABLE #YourTable ([ID] INT, [Name] VARCHAR(MAX), [Value] INT)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (1,'Oranges & Lemons',4)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (1,'1 < 2',8)
INSERT INTO #YourTable ([ID],[Name],[Value]) VALUES (2,'C',9)
SELECT [ID],
STUFF((
SELECT ', ' + CAST([Name] AS VARCHAR(MAX))
FROM #YourTable WHERE (ID = Results.ID)
FOR XML PATH(''),TYPE
/* Use .value to uncomment XML entities e.g. > < etc*/
).value('.','VARCHAR(MAX)')
,1,2,'') as NameValues
FROM #YourTable Results
GROUP BY ID
DROP TABLE #YourTable
Вместо использования пробела в качестве разделителя и замены всех пробелов запятыми, он просто добавляет запятую и пробел к каждому значению, а затем использует STUFF
чтобы удалить первые два символа.
Кодировка XML выполняется автоматически с помощью ТИП директива.
Другой вариант с использованием Sql Server 2005 и более поздних версий.
---- test data
declare @t table (OUTPUTID int, SCHME varchar(10), DESCR varchar(10))
insert @t select 1125439 ,'CKT','Approved'
insert @t select 1125439 ,'RENO','Approved'
insert @t select 1134691 ,'CKT','Approved'
insert @t select 1134691 ,'RENO','Approved'
insert @t select 1134691 ,'pn','Approved'
---- actual query
;with cte(outputid,combined,rn)
as
(
select outputid, SCHME + ' ('+DESCR+')', rn=ROW_NUMBER() over (PARTITION by outputid order by schme, descr)
from @t
)
,cte2(outputid,finalstatus,rn)
as
(
select OUTPUTID, convert(varchar(max),combined), 1 from cte where rn=1
union all
select cte2.outputid, convert(varchar(max),cte2.finalstatus+', '+cte.combined), cte2.rn+1
from cte2
inner join cte on cte.OUTPUTID = cte2.outputid and cte.rn=cte2.rn+1
)
select outputid, MAX(finalstatus) from cte2 group by outputid
Установите агрегаты SQLCLR из http://groupconcat.codeplex.com
Затем вы можете написать такой код, чтобы получить запрошенный результат:
CREATE TABLE foo
(
id INT,
name CHAR(1),
Value CHAR(1)
);
INSERT INTO dbo.foo
(id, name, Value)
VALUES (1, 'A', '4'),
(1, 'B', '8'),
(2, 'C', '9');
SELECT id,
dbo.GROUP_CONCAT(name + ':' + Value) AS [Column]
FROM dbo.foo
GROUP BY id;
SQL Server 2005 и более поздние версии позволяют создавать свои собственные пользовательские агрегатные функции, в том числе для таких вещей, как конкатенация — см. образец внизу связанной статьи.
Восемь лет спустя...Компонент Microsoft SQL Server vNext Database Engine наконец-то улучшил Transact-SQL для прямой поддержки объединения сгруппированных строк.Предварительный технический просмотр сообщества версии 1.0 добавил функцию STRING_AGG, а CTP 1.1 добавил предложение WITHIN GROUP для функции STRING_AGG.
Ссылка: https://msdn.microsoft.com/en-us/library/mt775028.aspx
Примером может быть
В Oracle вы можете использовать агрегатную функцию LISTAGG.
Оригинальные записи
name type
------------
name1 type1
name2 type2
name2 type3
SQL
SELECT name, LISTAGG(type, '; ') WITHIN GROUP(ORDER BY name)
FROM table
GROUP BY name
Результат в
name type
------------
name1 type1
name2 type2; type3
Подобные вопросы задаются здесь очень часто, и решение будет во многом зависеть от основных требований:
https://stackoverflow.com/search?q=sql+pivot
и
https://stackoverflow.com/search?q=sql+concatenate
Как правило, не существует способа сделать это только с помощью SQL без динамического SQL, определяемой пользователем функции или курсора.
Добавлю к тому, что сказал Кейд: обычно это вопрос внешнего отображения, и поэтому его следует обрабатывать там.Я знаю, что иногда проще написать что-то на 100% на SQL для таких вещей, как экспорт файлов или другие решения «только SQL», но в большинстве случаев эта конкатенация должна обрабатываться на уровне отображения.
Это всего лишь дополнение к посту Кевина Фэйрчайлда (кстати, очень умного).Я бы добавил это в комментарий, но у меня пока недостаточно баллов :)
Я использовал эту идею для представления, над которым работал, однако элементы, которые я объединял, содержали пробелы.Поэтому я немного изменил код, чтобы не использовать пробелы в качестве разделителей.
Еще раз спасибо за классный обходной путь, Кевин!
CREATE TABLE #YourTable ( [ID] INT, [Name] CHAR(1), [Value] INT )
INSERT INTO #YourTable ([ID], [Name], [Value]) VALUES (1, 'A', 4)
INSERT INTO #YourTable ([ID], [Name], [Value]) VALUES (1, 'B', 8)
INSERT INTO #YourTable ([ID], [Name], [Value]) VALUES (2, 'C', 9)
SELECT [ID],
REPLACE(REPLACE(REPLACE(
(SELECT [Name] + ':' + CAST([Value] AS VARCHAR(MAX)) as A
FROM #YourTable
WHERE ( ID = Results.ID )
FOR XML PATH (''))
, '</A><A>', ', ')
,'<A>','')
,'</A>','') AS NameValues
FROM #YourTable Results
GROUP BY ID
DROP TABLE #YourTable
Курсор не нужен...цикла while достаточно.
------------------------------
-- Setup
------------------------------
DECLARE @Source TABLE
(
id int,
Name varchar(30),
Value int
)
DECLARE @Target TABLE
(
id int,
Result varchar(max)
)
INSERT INTO @Source(id, Name, Value) SELECT 1, 'A', 4
INSERT INTO @Source(id, Name, Value) SELECT 1, 'B', 8
INSERT INTO @Source(id, Name, Value) SELECT 2, 'C', 9
------------------------------
-- Technique
------------------------------
INSERT INTO @Target (id)
SELECT id
FROM @Source
GROUP BY id
DECLARE @id int, @Result varchar(max)
SET @id = (SELECT MIN(id) FROM @Target)
WHILE @id is not null
BEGIN
SET @Result = null
SELECT @Result =
CASE
WHEN @Result is null
THEN ''
ELSE @Result + ', '
END + s.Name + ':' + convert(varchar(30),s.Value)
FROM @Source s
WHERE id = @id
UPDATE @Target
SET Result = @Result
WHERE id = @id
SET @id = (SELECT MIN(id) FROM @Target WHERE @id < id)
END
SELECT *
FROM @Target
Давайте очень просто:
SELECT stuff(
(
select ', ' + x from (SELECT 'xxx' x union select 'yyyy') tb
FOR XML PATH('')
)
, 1, 2, '')
Замените эту строку:
select ', ' + x from (SELECT 'xxx' x union select 'yyyy') tb
С вашим запросом.
не видел ответов на перекрестные заявки, а также нет необходимости в извлечении XML.Вот немного другая версия того, что написал Кевин Фэйрчайлд.Его быстрее и проще использовать в более сложных запросах:
select T.ID
,MAX(X.cl) NameValues
from #YourTable T
CROSS APPLY
(select STUFF((
SELECT ', ' + [Name] + ':' + CAST([Value] AS VARCHAR(MAX))
FROM #YourTable
WHERE (ID = T.ID)
FOR XML PATH(''))
,1,2,'') [cl]) X
GROUP BY T.ID
Вы можете значительно повысить производительность следующим образом, если группа по содержит в основном один элемент:
SELECT
[ID],
CASE WHEN MAX( [Name]) = MIN( [Name]) THEN
MAX( [Name]) NameValues
ELSE
STUFF((
SELECT ', ' + [Name] + ':' + CAST([Value] AS VARCHAR(MAX))
FROM #YourTable
WHERE (ID = Results.ID)
FOR XML PATH(''),TYPE).value('(./text())[1]','VARCHAR(MAX)')
,1,2,'') AS NameValues
END
FROM #YourTable Results
GROUP BY ID