Pergunta

Implementei a detecção da Delta enquanto carrega o Data Warehouse de sistemas de transação usando uma coluna de identidade ou coluna de data-hora nas tabelas de transações de origem. Quando os dados precisam ser extraídos na próxima vez, o valor máximo de data de data extraído da última vez é usado no filtro da consulta de extração para identificar registros novos ou alterados. Isso foi bom o suficiente, exceto quando houve várias transações no mesmo mili segundo.

Mas agora temos alteração de captura de dados (CDC) com o SQL Server 2008 e fornece um novo material chamado LSN (número da sequência de log) que é binário de comprimento 10. Agora estou confuso. Quais dados devem ser armazenados para fins de janela, o LSN ou a data de data. É claro que o LSN elimina a necessidade de armazenar valores adicionais de data de data em grandes tabelas de transações, mas isso tem alguma desvantagem? Qual devo usar? Sinto, o mapeamento do LSN até o encontro e o armazenamento de data não é um método confiável. qual e sua OPINIAO?

PS: Para, não profissionais não-BI, desculpe.

Foi útil?

Solução 2

Depois de muita espera, não vejo mais respostas aqui. Eu usei o LSN no meu projeto atual para janelas e acho melhor do que os valores da hora da data, pois é mais preciso e o processo é simples. Eu recomendo usar o LSN. Se alguém por aí discordar, por favor me avise ...

Outras dicas

Ver Melhorando cargas incrementais com a alteração de captura de dados Para obter informações sobre o uso do CDC com SSIS.

Se você configurar o CDC, obterá uma tabela de sistemas adicionada ao seu banco de dados com o nome cdc.lsn_time_mapping para que você possa usar.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top