SQL Server에서 커서를 사용하는 것이 나쁜 습관으로 간주되는 이유는 무엇입니까?

https://stackoverflow.com/questions/58141

09-06-2019
|

문제

SQL 7 시절부터 몇 가지 성능상의 이유를 알고 있었지만 SQL Server 2005에도 동일한 문제가 여전히 존재합니까?개별적으로 작업하려는 저장 프로시저에 결과 집합이 있는 경우 커서는 여전히 잘못된 선택입니까?그렇다면 왜 그렇습니까?

해결책

커서는 메모리를 차지하고 잠금을 생성하기 때문입니다.

당신이 실제로 하고 있는 일은 집합 기반 기술을 집합 기반이 아닌 기능에 강제 적용하려는 것입니다.그리고 공평하게 말하면 커서가 하다 용도가 있지만 집합 기반 솔루션을 사용하는 데 익숙하지 않은 많은 사람들이 집합 기반 솔루션을 파악하는 대신 커서를 사용하기 때문에 눈살을 찌푸립니다.

그러나 커서를 열면 기본적으로 해당 행을 메모리에 로드하고 잠그고 잠재적인 블록을 생성하게 됩니다.그런 다음 커서를 순환하면서 다른 테이블을 변경하고 커서의 모든 메모리와 잠금을 계속 열어 둡니다.

이 모든 것은 다른 사용자에게 성능 문제를 일으킬 가능성이 있습니다.

따라서 일반적으로 커서는 눈살을 찌푸립니다.특히 그것이 문제를 해결하면서 도달한 첫 번째 해결책이라면 더욱 그렇습니다.

다른 팁

SQL이 집합 기반 환경이라는 위의 설명은 모두 사실입니다.그러나 행별 작업이 유용한 경우도 있습니다.메타데이터와 동적 SQL의 조합을 고려해보세요.

아주 간단한 예로, 복사/자르기/무엇이든 원하는 테이블 이름을 정의하는 100개 이상의 레코드가 테이블에 있다고 가정해 보겠습니다.어느 것이 가장 좋나요?필요한 작업을 수행하기 위해 SQL을 하드코딩합니까?아니면 이 결과 집합을 반복하고 동적 SQL(sp_executesql)을 사용하여 작업을 수행하시겠습니까?

집합 기반 SQL을 사용하면 위의 목표를 달성할 수 있는 방법이 없습니다.

그렇다면 커서나 while 루프(의사 커서)를 사용하려면 어떻게 해야 할까요?

올바른 옵션을 사용하는 한 SQL 커서는 괜찮습니다.

INSENSITIVE는 결과 집합의 임시 복사본을 만듭니다(의사 커서에 대해 직접 이 작업을 수행할 필요가 없음).

READ_ONLY는 기본 결과 집합에 잠금이 유지되지 않도록 합니다.기본 결과 집합의 변경 사항은 후속 가져오기에 반영됩니다(의사 커서에서 TOP 1을 가져오는 것과 동일).

FAST_FORWARD는 최적화된 정방향 전용, 읽기 전용 커서를 생성합니다.

모든 커서를 악한 것으로 판단하기 전에 사용 가능한 옵션에 대해 읽어보세요.

필요할 때마다 사용하는 커서에 대한 해결 방법이 있습니다.

ID 열이 포함된 테이블 변수를 만듭니다.

작업에 필요한 모든 데이터를 여기에 삽입하세요.

그런 다음 카운터 변수로 while 블록을 만들고 ID 열이 카운터와 일치하는 select 문을 사용하여 테이블 변수에서 원하는 데이터를 선택합니다.

이렇게 하면 아무것도 잠그지 않고 메모리를 훨씬 적게 사용하며 안전합니다. 메모리 손상이나 그와 유사한 것으로 인해 아무것도 잃지 않을 것입니다.

그리고 블록코드는 보기도 쉽고 다루기도 쉽습니다.

이것은 간단한 예입니다:

DECLARE @TAB TABLE(ID INT IDENTITY, COLUMN1 VARCHAR(10), COLUMN2 VARCHAR(10))

DECLARE @COUNT INT,
        @MAX INT, 
        @CONCAT VARCHAR(MAX), 
        @COLUMN1 VARCHAR(10), 
        @COLUMN2 VARCHAR(10)

SET @COUNT = 1

INSERT INTO @TAB VALUES('TE1S', 'TE21')
INSERT INTO @TAB VALUES('TE1S', 'TE22')
INSERT INTO @TAB VALUES('TE1S', 'TE23')
INSERT INTO @TAB VALUES('TE1S', 'TE24')
INSERT INTO @TAB VALUES('TE1S', 'TE25')

SELECT @MAX = @@IDENTITY

WHILE @COUNT <= @MAX BEGIN
    SELECT @COLUMN1 = COLUMN1, @COLUMN2 = COLUMN2 FROM @TAB WHERE ID = @COUNT

    IF @CONCAT IS NULL BEGIN
        SET @CONCAT = '' 
    END ELSE BEGIN 
        SET @CONCAT = @CONCAT + ',' 
    END

    SET @CONCAT = @CONCAT + @COLUMN1 + @COLUMN2

    SET @COUNT = @COUNT + 1
END

SELECT @CONCAT

SQL 초보자가 커서를 발견하고 "안녕 for 루프구나!"라고 생각하기 때문에 커서의 이름이 좋지 않은 것 같습니다.난 그걸 어떻게 사용하는지 알아요!" 그런 다음 그들은 계속해서 그것을 모든 일에 사용합니다.

설계된 목적대로 사용한다면 나는 그것에 대해 결점을 찾을 수 없습니다.

SQL은 집합 기반 언어입니다. 이것이 바로 SQL이 가장 잘하는 일입니다.

제한된 상황에서 커서의 사용을 정당화할 만큼 커서에 대해 충분히 이해하지 않는 한 커서는 여전히 나쁜 선택이라고 생각합니다.

내가 커서를 좋아하지 않는 또 다른 이유는 명확성 때문입니다.커서 블록은 너무 보기 흉해서 명확하고 효과적인 방법으로 사용하기가 어렵습니다.

말한 모든 것이 거기에 있습니다. ~이다 커서가 실제로 가장 좋은 경우는 일반적으로 초보자가 커서를 사용하려는 경우가 아닙니다.

수행해야 하는 처리의 특성상 커서가 필요한 경우도 있지만, 성능상의 이유로 가능하면 항상 집합 기반 논리를 사용하여 작업을 작성하는 것이 더 좋습니다.

커서를 사용하는 것을 "나쁜 습관"이라고 부르지는 않겠지만 커서는 (동등한 집합 기반 접근 방식보다) 서버에서 더 많은 리소스를 소비하며 필요하지 않은 경우가 더 많습니다.이를 감안할 때 커서를 사용하기 전에 다른 옵션을 고려하는 것이 좋습니다.

커서에는 여러 유형이 있습니다(정방향 전용, 정적, 키 세트, 동적).각각은 서로 다른 성능 특성과 관련 오버헤드를 가지고 있습니다.작업에 올바른 커서 유형을 사용하고 있는지 확인하십시오.정방향 전용이 기본값입니다.

커서 사용에 대한 한 가지 주장은 특히 좋은 고유 키가 없는 데이터 세트의 경우 개별 행을 처리하고 업데이트해야 하는 경우입니다.이 경우 커서를 선언할 때 FOR UPDATE 절을 사용하고 UPDATE로 업데이트를 처리할 수 있습니다.현재 위치.

"서버 측" 커서는 ODBC 및 OLE DB에서 널리 사용되었지만 ADO.NET은 이를 지원하지 않으며 AFAIK도 지원하지 않습니다.

@ Daniel P -> 커서를 사용할 필요가 없습니다.집합 기반 이론을 사용하여 쉽게 이를 수행할 수 있습니다.예:SQL 2008 사용

DECLARE @commandname NVARCHAR(1000) = '';

SELECT @commandname += 'truncate table ' + tablename + '; ';
FROM tableNames;

EXEC sp_executesql @commandname;

위에서 말한 대로만 하면 됩니다.Sql 2000에서도 동일한 작업을 수행할 수 있지만 쿼리 구문은 다릅니다.

그러나 내 조언은 가능한 한 커서를 피하는 것입니다.

가암

커서 사용이 정당화되는 경우는 매우 적습니다.관계형 집합 기반 쿼리보다 성능이 뛰어난 경우는 거의 없습니다.때로는 프로그래머가 루프 측면에서 생각하는 것이 더 쉽지만, 예를 들어 테이블의 많은 행을 업데이트하는 등의 집합 논리를 사용하면 SQL 코드 줄이 훨씬 줄어들 뿐만 아니라, 하지만 훨씬 더 빠르게 실행되는 경우가 많습니다. 몇 배의 규모 더 빠르게.

SQL Server 2005의 빨리 감기 커서도 집합 기반 쿼리와 경쟁할 수 없습니다.성능 저하 그래프는 집합 기반에 비해 n^2 연산처럼 보이기 시작하는 경우가 많습니다. 이는 데이터 집합이 매우 커질수록 더 선형적인 경향이 있습니다.

커서는 그 자리를 차지하지만 주로 단일 select 문으로 결과 집계 및 필터링을 제공하기에 충분할 때 커서가 자주 사용되기 때문이라고 생각합니다.

커서를 피하면 SQL Server가 쿼리 성능을 더욱 완벽하게 최적화할 수 있으며 이는 대규모 시스템에서 매우 중요합니다.

커서는 일반적으로 질병이 아니라 질병의 증상입니다.(다른 답변에서 언급했듯이) 세트 기반 접근 방식을 사용하지 않습니다.

이 문제를 이해하지 못하고 단순히 "악한" 커서를 피하면 문제가 해결될 것이라고 믿는 것은 상황을 더욱 악화시킬 수 있습니다.

예를 들어 커서 반복을 임시 테이블이나 테이블 변수로 데이터를 이동하는 등의 다른 반복 코드로 대체하여 다음과 같은 방식으로 행을 반복합니다.

SELECT * FROM @temptable WHERE Id=@counter

또는

SELECT TOP 1 * FROM @temptable WHERE Id>@lastId

다른 답변의 코드에 표시된 것처럼 이러한 접근 방식은 상황을 훨씬 더 악화시키고 원래 문제를 해결하지 못합니다.라는 안티 패턴입니다. 화물 컬트 프로그래밍:왜 뭔가가 나쁜지 모르고 이를 피하기 위해 더 나쁜 것을 구현하는 것입니다!최근에 이러한 코드(#temptable을 사용하고 ID/PK에 인덱스 없음)를 다시 커서로 변경했으며 10000개보다 약간 넘는 행을 업데이트하는 데 거의 3분이 아니라 1초밖에 걸리지 않았습니다.여전히 세트 기반 접근 방식(덜 악한 것)이 부족하지만 그 순간 제가 할 수 있는 최선을 다했습니다.

이러한 이해 부족의 또 다른 증상은 내가 때때로 "단일 개체 질병"이라고 부르는 것일 수 있습니다.데이터 액세스 계층이나 객체 관계형 매퍼를 통해 단일 객체를 처리하는 데이터베이스 애플리케이션입니다.일반적으로 다음과 같은 코드를 사용합니다.

var items = new List<Item>();
foreach(int oneId in itemIds)
{
    items.Add(dataAccess.GetItemById(oneId);
}

대신에

var items = dataAccess.GetItemsByIds(itemIds);

첫 번째는 일반적으로 각각에 대해 한 번의 왕복으로 수많은 SELECT로 데이터베이스를 넘치게 합니다. 특히 객체 트리/그래프가 작동하고 악명 높은 SELECT N+1 문제가 발생할 때 더욱 그렇습니다.

이는 T-SQL 또는 PL/SQL과 같은 절차적 데이터베이스 코드를 사용할 때 커서가 관계형 데이터베이스 및 집합 기반 접근 방식을 이해하지 못하는 애플리케이션 측면입니다.

내 생각에 기본적인 문제는 데이터베이스가 집합 기반 작업, 즉 데이터의 관계를 기반으로 한 번의 빠른 단계로 대량의 데이터를 선택, 업데이트 및 삭제하도록 설계되고 조정된다는 것입니다.

반면, 인메모리 소프트웨어는 개별 작업을 위해 설계되었으므로 일련의 데이터를 반복하고 잠재적으로 각 항목에 대해 서로 다른 작업을 순차적으로 수행하는 것이 가장 좋습니다.

루핑은 데이터베이스 또는 저장소 아키텍처의 목적이 아니며 SQL Server 2005에서도 기본 데이터 세트를 사용자 정의 프로그램으로 가져오고 메모리에서 루핑을 수행하면 얻을 수 있는 가까운 곳에서는 성능을 얻을 수 없습니다. , 가능한 한 가벼운 데이터 객체/구조를 사용합니다.

라이센스 : CC-BY-SA ~와 함께 속성

제휴하지 않습니다 StackOverflow