Pergunta

Alguém tem experiência em usar o PostgreSQL para uma configuração OLAP, usando cubos no banco de dados etc. Tendo encontrado várias idiossincracias ao usar o MySQL para OLAP, existem razões a favor do uso do PostgreSQL (supondo que eu queira ir o aberto rota de origem)?

Foi útil?

Solução

Existem vários fornecedores de software de data warehousing que são baseados no PostgreSQL (e contribuem com alterações relacionadas ao OLAP de volta ao núcleo regularmente). Verificação de saída https://greenplum.org/. Você descobrirá que o PG funciona muito melhor (para quase qualquer carga de trabalho, especialmente OLAP) do que o MySQL. O Greenplum e outras soluções semelhantes devem funcionar um pouco melhor que o PG, dependendo dos seus conjuntos de dados e casos de uso.

Outras dicas

O PGSQL é muito mais adequado para data warehousing em comparação com o MySQL. Inicialmente, pensamos em ir com o MySQL, mas ele tem um desempenho ruim em agregações se os dados crescerem para alguns milhões de linhas. O PGSQL tem um desempenho quase 20 vezes mais rápido em Caparison com o MySQL para 20 milhões de registros para uma única tabela de fatos na mesma configuração de hardware. Se, por algum motivo, você optar por ir com o MySQL, você deve usar o Myisam Storage Engine para tabelas de fatos, em vez de InnoDB; Você verá um desempenho um pouco melhor.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top