설정을 희미하고 사실에 대한 테이블 데이터 웨어하우스

https://stackoverflow.com/questions/417304

03-07-2019
|

문제

나는 임무를 만드는 데이터 웨어하우스에 대해 클라이언트입니다.관련된 테이블이 정말 하지 않에 따라 전통적인 예들이 사회(제품/주문),그래서 내가 도움이 필요합 시작됩니다.클라이언트가 기본적으로 처리센터의 경우(와 유사한 법률 경우).매일 새로운 경우에는 입력 DB 에서"의 경우"이다.각각의 열을 포함하는 일부 정보의 비트와 관련된 경우입니다.으로 케이스가 처리되는가 하는 많은 테이블을 채 이벤트와 관련된 경우입니다.꽤 몇 가지의 이러한 이벤트 테이블,예 테이블 수 있습니다:(케이스 열려있는 경우-dept1,케이스-dept2,케이스-dept3,etc.).이러한 각각의 테이블은 caseid 는지도 다시"의 경우"이다.거기에는 또한 몇 가지 검색 관련된 테이블을 뿐입니다.

현재,보고 요구 관련된 노출의 병목 현상을 다양한 단계 및 단위에서 시간 수준에 대한 특정 지역에 있습니다.

I 요구 될 수 있습니다 너무 많은 여기에,그러나 내가 찾는 몇 가지 방향으로 나가 어떻게 설정해야 내 희미하고 사실 테이블 또는 기타 제안 사항이 있을 수 있습니다.

해결책

나는 당신이 체크아웃님이 책을,특히 이, 을 가지고 있어야 하는 몇 가지 예를 얻을 당신이 생각하고 애플리케이션에 대한 자 세한 내용은 당신의 문제는 도메인입니다.

어떤 경우에,당신은 결정이 필요한 경우에는 차원 모델은 심지어는 적당하다.그것은 꽤 가능한 치료에 3NF 데이터베이스'엔터프라이즈 데이터 웨어하우스'서로 다른 색인이나 개요,또는 어떤 것이다.

을 보지 않고 현재는 스키마,그것은 정말 열심히 말한다.당신 같은 소리로 끝날 것이 여러 가지 성급 호텔 모델 일부 따른 크기로 묶는다.그래서 당신이 있는 경우 차원의 하나로서 따른 차원입니다.사실에서 각각 다른 테이블에 사실은 테이블을 모두 연결을 지켜 차원을 다른 차원을 적절한 사실,그래서 예를 들어,이 있는 경우 직원의 id 경우에는 열고,그에 대한 링크를 직원이 지켜 차원에서,경 엽-사실이다.이 따른 차원에 연결할 수 있습니다 몇 배에서의 여러 자회사 사실 테이블이 있습니다.

킴벌의 모델링 방법이 매우 간단하며,따를 수 있습니다 같은 조리법이다.필요하신 시작을 식별하여 귀하의 모든 사실,그룹으로 그들을 사실 테이블을 식별하는 개인 차원에서 각 사실이 테이블 그리고 그들을 그룹화로 적절한 차원으로 테이블의 유형을 식별하는 각 차원이다.

다른 팁

사실 테이블은 사례 이벤트이며 숫자 값이 없다는 점에서 '사실이 없습니다'. 차원은 시스템의 다른 데이터가 무엇인지에 따라 시간, 이벤트 유형, 케이스 및 일부일 수 있습니다.

이벤트 테이블을 '이벤트 유형'차원으로 표시된 단일 팩트 테이블로 통합해야합니다. 처리량/병목 현상 보고서는 주어진 경우 이벤트 유형의 특정 조합에 대한 이벤트 시간 간의 차이를 계산하고 있습니다.

보고서는 이벤트 이벤트 시간을 계산하여 히스토그램에 넣어야합니다. 특정 유형의 이벤트 조합에 레이블을 붙이고 관심있는 이벤트에 레이블을 적용 할 수도 있습니다. 이러한 이벤트는 시간을 기록 할 수 있으므로 OLAP 도구를 사용하여 Times에서 슬라이스 앤 다이 사업을 수행 할 수 있습니다.

수명주기 진행의 특정 단계를 벤치마킹하려면 케이스 유형, 이벤트 유형 1, 이벤트 유형 2, 벤치 마크 시간에 대한 테이블이 있습니다.

약간의 마사지를 사용하면 데이터 마이닝 툴킷 또는 간단한 회귀 분석을 사용하여 사례 속성과 이벤트 이벤트 시간 (YMMV) 간의 상관 관계를 발견 할 수 있습니다.

다른 개발 측면과 마찬가지로, 최종 요구 사항 ( "사용자 스토리")에서 문제에 접근해야합니다. 창고의 가장 보수적 인 접근 방식은 단순히 트랜잭션 데이터베이스의 사본을 나타내는 것입니다. 여기에서 요구 사항에 따라 특정 데이터 액세스 패턴의 성능을 향상시키기 위해 특정 최적화를 수행 할 수 있습니다. 그러나 이것들을 최적화로 보는 것이 중요하다고 생각하며 데이터웨어 하우스가 자동으로 모든 사실에 비해 가능한 모든 차원의 복잡한 폭발이어야한다고 가정하지 않습니다. 저의 경험은 대부분의 목적을 위해 직선 표현이 분석 쿼리의 90% 이상에 적합하거나 이상적이라는 것입니다. 나머지의 경우 먼저 인덱스, 인덱스 뷰, 추가 통계 또는 구조에 영향을 미치지 않고 만들 수있는 기타 최적화를 고려하십시오. 그런 다음 성능을 향상시키기 위해 집계 또는 기타 중복 구조가 필요한 경우, 원시 사실과 그 중복성 사이의 분리를 제공하는 "데이터 마트"(적어도 개념적으로)로 분리하는 것을 고려하십시오. 마지막으로, 요구 사항이 너무 유동적이고 집계가 이런 식으로 효율적으로 작동하기 위해 강력하게 요구되는 경우, 데이터 IE Star Schema의 도매 폭발을 고려할 수 있습니다. 다시 말하지만, 이것을 가능한 한 가장 작은 데이터의 단면으로 제한하십시오.

여기에 내가 본질적으로 생각해 낸 것입니다. thx nxc

사실 이벤트

EventId Timekey CaseId

희미한 이벤트

EventId EventDesc

희미한

타임 키

치수 영역

Regionid regiondesc

케이스

CaseId greaid

문제를 고려하기 전에 솔루션을 선택하는 경우 일 수 있습니다. 모든 Datawarehouses가 Star 스키마 모델에 적합한 것은 아닙니다. 여기에 데이터를 집계하고 있다는 것은 모르겠습니다. 지금까지 우리는 사실없는 사실 테이블과 적어도 하나의 빠르게 변화하는 차원 (케이스)을 가지고 있습니다.

내가 지금까지 본 것을 살펴보면이 데이터베이스의 중앙 엔티티가 사실이라고 생각합니다. 중간에 이벤트를 고수하는 것은 옳지 않은 것 같습니다. 다른 방법으로 살펴보십시오. 아마도 사례, 이벤트 및 사례 이벤트가 시작됩니다.

라이센스 : CC-BY-SA ~와 함께 속성

제휴하지 않습니다 StackOverflow