Pergunta

Estou procurando um armazenamento de dados eventualmente consistente e parece que pode estar chegando a Riak ou Cassandra. Alguém tem uma visão de uma visão sobre isso?

Foi útil?

Solução

Como você provavelmente sabe, ambos são arquitetamente fortemente influenciados pelo dínamo (eventualmente consistente, sem pontos de falha, etc.). Ambos também vão além do Dynamo para fornecer um modelo de dados "mais rico que o K/V Pure--no caso de Cassandra, fornecendo um modo columnfamily do tipo BigTable, no Riak's, orientado a documentos. Eu vi pessoas sãs escolherem os dois.

Eu acredito que pontos que favorecem Cassandra incluem

Pontos que favorecem Riak incluem

  • mapear/reduzir o suporte para fora da caixa

/Cassandra Dev, FWIW

Outras dicas

Riak é usado por

  • Fundação Mozilla
  • Ask.com Listagens patrocinadas
  • Comcast
  • Citigroup
  • Bet365

Eu acho que ambos passam no teste de clientes/usuários de referência credíveis.

Cassandra parece mais maduro e atualmente está se saindo melhor em benchmarks. Riak parece mais fácil adicionar um nó à medida que seu cluster cresce.

Para completude: uma comparação boa (provavelmente tendenciosa) entre os dois pode ser encontrada em http://docs.basho.com/riak/1.3.2/references/appendices/comparisons/riak-compared-to-cassandra/

Usar e download são diferentes. Melhor obter referências.

Talvez uma conversa privada possa ser realizada onde as referências de Riak nessas empresas poderiam ser compartilhadas? Não tenho certeza de como conseguir isso com Cassandra, mas há uma comunidade de empresas que apóiam Cassandra que parecem um bom lugar para começar. Como provavelmente têm participantes da comunidade no desenvolvimento de Cassandra, pode ser um lugar realmente razoável para começar.

Gostaria de ouvir a resposta de Riak para implantações recentes e grandes, onde os clientes estão felizes.

Eu também gostaria de ver o roteiro de cada produto. Cassandra é um pouco mais fácil de rastrear (http://wiki.apache.org/cassandra/) do que Riak, na minha opinião, enquanto o wiki de Cassandra discute limitações e coisas que provavelmente vão mudar daqui para frente, mas nem o futuro descreve os futuros. Eu conseguia entender isso de uma comunidade de código aberto ... talvez ... mas não posso para um produto pelo qual devo pagar.

Eu também sugeriria pesquisas do Cloudant, que tem o que parece ser uma camada muito agradável de capacidades. Também parece que está trazendo as capacidades em outros lugares da Apache Land. O CouchDB é a plataforma Apache na qual o Cloudant é baseado. Mas a indexação com o Lucene parece, mas a ponta do iceberg quando se trata de onde Cloudant poderia ir. Criar e gerenciar um índice é um processo muito sistemático, um tipo de pipeline de dados, que pode ser roteirizado usando outros ativos da comunidade Apache. E recursos como a PNL também podem ser adicionados através do Lucene indiretamente, ou talvez diretamente ao que é persistido.

Seria bom ver um roteiro do Cloudant proposto, especialmente porque a equipe poderia minerar as riquezas da comunidade Apache e integrar isso ao Cloudant. Provavelmente existe, pois existe um componente operacional no modelo de receita nuvem que o exigirá, se por nenhum outro motivo.

Outra área de interesse ... modelo de preços da Cloudant ... fica claro que o modelo de receita não se baseia no software, mas em serviço. Isso é bastante atraente e parece consistente com o ecossistema em torno de Cassandra também. Não sei se o pessoal do Basho conquistou o suficiente da comunidade NoSQL ainda ... não o vê de nenhum zumbido em torno de seu site ou produto.

Eu gosto desta página da Web Cloudant (https://cloudant.com/the-data-layer/). Fiquei surpreso ao ver a capacidade de Erlang incorporada ... Eu não sabia que Couchdb estava escrito em Erlang, pois isso me parece incomum na comunidade Apache (minha ignorância); O CouchDB parece ser mais antigo que outros produtos NoSQL que conheço (agora) a serem escritos em Erlang. Qualquer que seja sua estratégia, eles pelo menos contam a Amazon EC2 e o Microsoft Azure como parceiros de hospedagem, indicando uma apreciação do Microsoft e! lojas poderiam ter.

Finalmente, embora eu não conheça bem o quadro, a orientação de Andy Palmer parece que será valiosa. Ele pode trazer algumas orientações para os dados estruturados (através do VOLTDB) para um mundo que, com razão ou erro, pode ser injustamente marcado como tabelas de hash de KVP de dados não estruturados. A necessidade de estrutura e ecossistema em torno dos "bancos de dados" do NOSQL está sendo reconhecido ... Testemunhe os esforços do Google com o Spanner ... KVP/pouca estrutura/necessidade de capacidade de pesquisa motivou o investimento do Google no espaço de chave. Embora todos possamos não precisar de algo como Spanner, provavelmente precisamos de uma capacidade de gerenciamento e interoperabilidade "corporativa" melhorando e robustas nesses bancos de dados NOSQL para tornar razoável incorporá -los às arquiteturas de nuvem modernas. A estrutura necessária pode vir da facilidade de interoperabilidade e riqueza funcional. Ele também pode vir de novos recursos que suportam a conversão de dados não estruturados em dados estruturados (por exemplo, índices, uso de PNL para criar renderizações estruturadas e analisadas de coisas dentro de uma bolha de KVP e muitas outras coisas que, se colocadas em um roteiro e publicado, poderia atrair e aumentar uma base de usuários). Cloudant parece ter uma boa chance de sucesso ... Vou dar uma olhada mais de perto ...

E veja o que eu encontrei sobre o CouchDB ...

O CouchDB vem com um conjunto de recursos, como a transformação de documentos na voação e as notificações de mudança em tempo real, que tornam o desenvolvimento de aplicativos da Web uma brisa. Ele ainda vem com um console de administração da Web fácil de usar. Você adivinhou, servido diretamente do CouchDB! Nós nos preocupamos muito com a escala distribuída. O CouchDB é altamente disponível e tolerante a partição, mas também é consistente. E nos preocupamos muito com seus dados. O CouchDB possui um mecanismo de armazenamento tolerante a falhas que coloca a segurança dos seus dados em primeiro lugar.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top