Domanda

Sto cercando un archivio dati eventualmente coerente e sembra che si potrebbe arrivare fino a Riak o Cassandra. Qualcuno ha expereinces di una vista su questo?

È stato utile?

Soluzione

Come probabilmente sapete, sono entrambi architettonico fortemente influenzata dalla Dynamo (eventualmente coerente, non singoli punti di guasto, ecc). Sia anche esulano Dinamo nel fornire un "ricco di puro K / V" modello di dati - in caso di Cassandra, fornendo una modalità Bigtable simile ColumnFamily, in Riak di un documento orientato uno. Ho visto persone sane di mente scelgono entrambi.

Credo punti che favoriscono Cassandra includono

Punti che favoriscono Riak includono

  • mappa / ridurre il sostegno fuori dalla scatola

/ dev Cassandra, FWIW

Altri suggerimenti

Riak viene utilizzato da

  • Mozilla Foundation
  • Ask.com annunci sponsorizzati
  • Comcast
  • Citigroup
  • Bet365

Credo che entrambi superano il test di riferimento credibili clienti / utenti.

Cassandra sembra più maturo, ed è attualmente facendo meglio nei benchmark. Riak sembra più facile per aggiungere un nodo come cluster cresce.

Per completezza: Una buona (probabilmente di parte) il confronto tra i due può essere trovato alla http://docs.basho.com/riak/1.3.2/references/appendices/comparisons/Riak-Compared-to-Cassandra/

Usa e il download sono diversi. Meglio per ottenere i riferimenti.

Forse una conversazione privata potrebbe essere dovuto in cui i riferimenti Riak in queste società potrebbero essere condivisi? Non sai come ottenere tale con Cassandra, ma c'è una comunità di aziende che supportano Cassandra che sembrano come un buon punto di partenza. Dato che questi hanno probabilmente partecipanti della comunità nello sviluppo di Cassandra, può essere un posto davvero ragionevole per iniziare.

Mi piacerebbe sentire la risposta di Riak per implementazioni recenti e grandi dove i clienti sono felici.

Mi piacerebbe anche vedere la tabella di marcia per ogni prodotto. Cassandra è un po 'più facile tenere traccia (http://wiki.apache.org/cassandra/) rispetto Riak a mio avviso, come wiki di Cassandra discute le limitazioni e le cose che sono probabilmente andando a cambiare in futuro, ma nessuno dei futures contorno bene. Ho potuto capire che di una comunità open source ... forse ... ma non ci riesco per un prodotto per il quale devo pagare.

Vorrei anche suggerire la ricerca di Cloudant, che ha quello che sembra essere un bel stratificazione delle capacità. Sembra inoltre che si sta portando a sopportare le capacità altrove in territorio Apache. CouchDB è la piattaforma Apache su cui si basa Cloudant. MA l'indicizzazione con Lucene sembra, ma la punta di un iceberg, quando si tratta di dove Cloudant poteva andare. Creazione e gestione di un indice è un processo molto sistematico, una sorta di pipeline dei dati, che potrebbero essere script utilizzando altre attività della comunità Apache. E funzionalità come la PNL inoltre potrebbero essere aggiunte tramite Lucene indirettamente, o forse direttamente in quello che è persistito.

Sarebbe bello vedere una tabella di marcia Cloudant proposta, soprattutto perché la squadra potrebbe minare la ricchezza della comunità Apache e integrare tale in Cloudant. Tale probabilmente esiste in quanto v'è una componente operativa per il modello di entrate Cloudant che richiederà, se non altro.

Un'altra area di interesse ... modello di pricing di Cloudant ... è chiaro il loro modello di ricavi non si basa su un software, ma intorno servizio. Questo è molto attraente, e sembra coerente con l'ecosistema circostante troppo Cassandra. Non so se la gente Basho hanno conquistato abbastanza della comunità NoSQL ancora ... non si vede come da qualsiasi buzz intorno il loro sito web o di un prodotto.

Mi piace questa pagina web Cloudant (https://cloudant.com/the-data-layer/). Sono rimasto sorpreso di vedere la capacità di Erlang incorporato ... Non sapevo CouchDB è stato scritto in Erlang come questo sembra insolito per me nella comunità Apache (la mia ignoranza); CouchDB sembra essere più vecchio di altri prodotti NoSQL So che (ora) per essere scritto in Erlang. Qualunque sia la loro strategia, che almeno contano Amazon EC2 e Microsoft Azure in qualità di partner di hosting, che indica un apprezzamento della Microsoft e mondi Microsoft -! Tutto molto importante se riconoscere correttamente il potenziale valore di middleware (oltre le applicazioni di cache o di tabella hash) che questi tipi di dati negozi potrebbero avere.

Infine, mentre io non conosco bene la linea, la guida di Andy Palmer sembra che sarà prezioso. Egli può portare un po 'di orientamento vis-a-vis dati strutturati (attraverso VoltDB) per un mondo che a torto oa ragione può essere ingiustamente bollato come KVP tabelle hash dei dati non strutturati. La necessità per la struttura e l'ecosistema circostante "banche dati" NoSQL viene riconosciuta ... sforzi testimone di Google con la chiave ... KVP / piccola struttura / necessità di ricerca-abilità motivato l'investimento di Google nello spazio Chiave. Mentre noi tutti non possiamo bisogno di qualcosa come chiave, probabilmente abbiamo bisogno di un miglioramento e di una solida gestione "impresa" e capacità di interoperabilità in questi database NoSQL per renderlo ragionevole inserirli in moderne architetture cloud. La struttura necessaria può venire dalla facilità di interoperabilità e la ricchezza funzionale. Si può anche venire da nuove funzionalità che supportano la conversione dei dati non strutturati per dati strutturati (ad esempio indici, l'uso della PNL per creare strutturato e analizzato rendering di cose all'interno di un blob KVP, e un sacco di altre cose che, se messo in una tabella di marcia e pubblicato, potrebbe invogliare e far crescere una base di utenti). Cloudant sembra che ha una buona possibilità di successo ... mi prenderò uno sguardo più da vicino ...

E guarda cosa ho trovato su CouchDB ...

CouchDB è dotato di una suite di funzionalità, come ad esempio la trasformazione del documento on-the-fly e notifiche di modifica in tempo reale, che rende lo sviluppo web app un gioco da ragazzi. Si tratta anche con un facile da usare console di amministrazione web. Avete indovinato, servito direttamente da CouchDB! Ci prendiamo cura molto su scala distribuita. CouchDB è altamente disponibile e la partizione tollerante, ma è anche alla fine coerente. E ci preoccupiamo molto di dati. CouchDB ha un motore di storage fault-tolerant che mette al primo posto la sicurezza dei vostri dati.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top