Domanda

sono ci sono negozi NoSQL di qualità di produzione che posso usare su un sistema di produzione. Ho guardato cassandra, tokyodb, CouchDB, ecc, ma nessuno di loro sembrano essere pronti per le implementazioni sulla produzione come ambienti. Sto parlando migliaia di richieste al minuto e un sacco di letture / scritture / aggiornamenti. La mia unica preoccupazione è di velocità e di servizio volte. Qualcuno sa di sistemi di produzione che utilizzano i negozi NoSQL in modo efficace? Qualcuno sa di un negozio di NoSQL che è sostenuta da una grande impresa come Google / Yahoo / IBM?

È stato utile?

Soluzione

Cassandra gestisce migliaia di richieste (tra cui write-per lo più i carichi di lavoro) al secondo , per ogni macchina, e il suo ridimensionamento-by-aggiunta-macchine è lì dal giorno 1.

Ecco un thread su Cassandra uso nella produzione e nella produzione-presto al decine di società: http://n2.nabble.com/Cassandra-users-survey-td4040068.html#a4040068

Stiamo anche aggiungendo più documenti per tutto il tempo, come http://wiki.apache.org/ cassandra / Operazioni .

Altri suggerimenti

Credo che i sistemi di NoSQL sono una scelta eccellente se si 'solo' cura di velocità e tempo di servizio (e non o meno di cose come la consistenza e le transazioni). Facebook utilizza Cassandra.

"Cassandra viene utilizzato in Facebook come un sistema di ricerca e-mail contenente 25TB e oltre 100 caselle di posta." http://highscalability.com/product-facebooks-cassandra-massive-distributed- negozio

Credo CouchDB non è davvero veloce, forse è possibile utilizzare MongoDB: http: //www.mongodb.org/display/DOCS/Production+Deployments

Anche la pena di considerazione sta usando un RDBMS tradizionali come MySQL per memorizzare lo schema-less. Questo metodo ti dà la stabilità di un server di database come MySQL dimostrato con la flessibilità di una soluzione NoSQL.

questo post di blog su come FriendFeed fa questo.

BerkeleyDB è supportato da Oracle

Utilizzando l'interfaccia nativa C si può raggiungere quasi 1 milione di lettura richieste al secondo.

A proposito, quando si dice di migliaia di richieste al minuto, qualsiasi DB 'normale' dovrebbe essere in grado di gestire così facilmente anche.

Redis vale la pena dare una prova come Github utilizza Redis per gestire un pesante coda di processi in background .

Il mio primo istinto sarebbe quello BerkeleyDB, con ogni nodo applicazione su una rete SAMBA per facilitare la conformità ACID e l'uso della rete. E 'uno sport anche un'interfaccia SQLite. Altro manifesto cita MemcacheDB avendo anche BDB all'interno.

Un'altra opzione unica sarebbe OrientDB, ha anche un'interfaccia SQL, un sacco di funzioni di rete e di cluster.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top