문제

최근에 나는 나 자신을 발견했는 데이터베이스에 얽힌 곳 관리 원하는 기능을 제거하는 데이터베이스에서 데이터,하지만 여전히 원하는 데이터를 나타나서 다른 장소입니다.예제:그들은 모두 제거하고 싶은 경우에는 제품의 whizbang 지만,그들은 여전히 whizbang 에 나타나는 판매를 보고합니다.(경우에는 그들이 달리는 하나 이전 날짜).

지금 나는 추가 필드는 말 is_deleted,는 것입니다 여부를 추적하는 제품이 삭제되었고,따라서 아직도 유지 내 모든 참조하지만,시간의 기간 동안,나는 잠재적인 주택이 많이 죽는 데이터입니다.(는 데이터는 결코 다시 액세스).이를 처리하는 방법은 나의 질문입니다.

저는 호기심을 알아보려면,당신의 경험에서 무엇입의 평균 수명은 데이터가?즉,평균적이 얼마나 살아있는 데이터는 좋은 얻기 전에 교체하거나 삭제됩니까?다는 것을 저는 이해 상대적인 데이터의 유형에 당신은 주택이지만,확실히 모든 데이터는 어떤 종류의 수명은?

도움이 되었습니까?

해결책

데이터는 영원히 산다 ... 또는 종종해야한다. 일반적인 관행 중 하나는 기록의 종료 및/또는 날짜를 시작하는 것입니다. 따라서 Whizbang의 경우 시작 날짜가 있습니다 (공식 출시 전에 판매 보고서에 표시되지 않음) 및 종료 날짜 (따라서 끝이 끝난 후 보고서가 중단됨). 적절한 날짜를보고 기준 및 응용 프로그램의 기준으로 사용하면 필요한시기를 제외하고는 Whizbang을 볼 수 없으며 데이터가 여전히 존재합니다 (이론적으로 무한대).

Koistya Navin이 언급 한 바와 같이, 특정 시점에서 데이터를 데이터웨어 하우스로 옮기는 것도 옵션이지만, 이는 '이전'데이터가 얼마나 큰지, 액세스 할 수있는 쉽게 사용할 수있는 시간에 따라 다릅니다.

다른 팁

많은 고객들이 2 년 동안 온라인으로 데이터를 유지합니다. 그 후 백업 디스크로 이동했지만 필요한 경우 온라인으로 배치 할 수 있습니다.

"만료"또는 "유효 날짜"열을 추가하십시오. 이렇게하면 제품을 쓸모없는 것으로 표시 할 수 있지만 시간 범위가 충족되면 해당 제품을 반환합니다.

일반적으로 이러한 데이터를 Seporate 데이터베이스 (데이터베이스 창고)로 옮기고 데이터베이스를 계속 깨끗하게하는 것이 좋습니다. 데이터웨어 하우스에서는 응용 프로그램에 영향을 미치지 않고 수년간 데이터를 유지할 수 있습니다.

참조: 데이터웨어 하우스 Wikipedia에서

나는 항상 지배 기관이 찾고있는 것을 겪었습니다. 예를 들어 IRS는 7 년간의 역사를 유지하거나 보안상의 이유로 3 년간의 로그 정보를 유지하기를 원합니다. 따라서 두 가지 작업을 수행 할 수 있다고 생각합니다. 데이터의 수명이 3 년이라고 말할 수 있습니다. 그런 다음 IS_DELETED FLAG를 추가하여 날짜와 함께 일부 데이터를 표시하여 나중에 더 빨리 삭제할 수 있습니다.

예, 모든 데이터에는 수명이 있습니다. 그리고 그렇습니다. 그것은 당신이 가진 데이터 유형과 관련이 있습니다.

일부 데이터는 수명이 초 (예 : 인증 토큰), 일부 다른 데이터 가상 영원 (예 : 소유권 레코드와 같이 매체 및 형식보다)을 측정합니다.

당신은 당신이 계획하고있는 데이터의 유형에 대해 더 구체적이어야하거나, 일반적인 물건의 수명에 대해 자신의 조직에서 인구 조사를해야합니다.

우리의 특별한 맛은 다양합니다. 우리는 3 개월 후에 부실한 데이터 (대다수)를 가지고 있지만 나중에 부활 할 수 있습니다.

우리는 효과적으로 불멸의 다른 데이터가 있습니다.

실제로, 우리가 제공하는 대부분의 데이터는 신선하고 자주 산발적으로 사용되기 전에 몇 주, 대부분 몇 주 동안 자주 요청됩니다.

"많은 죽은 데이터"는 얼마입니까?

처리 능력과 데이터 저장소가 너무 저렴 해져서 정말 좋은 이유가 없다면 오래된 데이터를 제거하지 않을 것입니다. 또한 법적 의미를 고려해야합니다. 대규모 (및 소규모) 회사는 판사가 소환 할 때 수백만 달러를 절약 할 수있는 오래된 데이터에 대한 엄청나게 긴 보존 정책을 가질 수 있습니다.

나는 당신이 가지고있는 법률 부서를 확인하고 데이터를 얼마나 오래 저장 해야하는지 알아 보겠습니다. 그것이 가장 안전한 내기입니다.

또한 이전 데이터 제거의 이점이 무엇인지 스스로에게 물어보십시오. 유일한 이점은 더 젖은 데이터베이스입니까? 그렇다면 나는 그것을하지 않을 것입니다. 10 배의 성능이 증가 할 건가요? 그렇다면 할 것입니다. 이것은 실제로 복잡한 질문이며, 좋은 조언을 드리는 데 필요한 모든 정보를 갖기가 어렵습니다.

고객이 모든 역사적 데이터를 원하는 몇 가지 프로젝트가 있습니다 (19 년 이상 거슬러 올라갑니다). 정말 오래된 데이터가 잘못되었으며 새로운 시스템으로 가져 오는 악몽이 될 것입니다. 우리는 그들이 10 년 이상 거슬러 올라가는 기록이 필요하지 않다고 확신했지만, 당신이 말한 것처럼, 그것은 당신이 보유하고있는 데이터의 유형과 관련이 있다고 말했습니다.

참고로, 데이터 스토리지는 지금 매우 저렴하며, 응용 프로그램의 성능에 영향을 미치지 않으면 그대로 남겨 둘 것입니다.

[...]그러나 확실히 모든 데이터는 어떤 종류의 수명은?

지 않는 모든 종류의 수명은 우리는 이야기에 대해 의미 있게.많은 데이터를 쓸모로 만들거나 기록됩니다.이러한 데이터 삭제될 수 있습으로 즉시 효과가 없습니다.한편,일부 데이터가 충분히 가치 있는 것이 오래 살 현재 시스템을 호스팅하는니다.면 아마존을 완전히 바꾸는 현재의 인프라,고객사들이 저장되는 것은 대단히 가치가있다.

당신이 말했듯이,그것은 상대적이다.각 유형의 데이터는 그것의 자신의 삶의 범위는 관련이 없는 다른 형식의 데이터의 수명이 있습니다.거기에 아무 의미 있는"평균 수명의 데이터".

나는 많은 죽은 데이터를 주택 할 가능성이 있습니다. (다시는 액세스되지 않은 데이터).

그러나 그들은 그 보고서를 수행 할 때 해당 데이터에 액세스 할 것입니다.

그때까지 데이터를 어떤 형태로 유지해야합니다. 다른 테이블로 이동하거나 언급 한 것처럼 스위치가 있습니다.

어 ... 지나치게 단순화 될 위험에 처해 ... 비트 대신 데이트 레인드를 사용하는 것처럼 들리면 어떻게 해야하는지에 대한 문제가 해결 될 것입니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top