Y a-t-il des ores de données NoSQL stables et de la production?
-
19-09-2019 - |
Question
Y a-t-il des magasins NOSQL de qualité de production que je peux utiliser sur un système de production. J'ai regardé Cassandra, Tokyodb, Couchdb, etc., mais aucun ne semble être prêt pour les déploiements sur des environnements de production. Je parle de milliers de demandes par minute et de nombreuses lectures / écritures / mises à jour. Ma seule préoccupation est la vitesse et les heures de service. Quelqu'un connaît-il des systèmes de production qui utilisent efficacement les magasins NOSQL? Quelqu'un connaît-il un magasin NoSQL qui est soutenu par une grande entreprise comme Google / Yahoo / IBM?
La solution
Cassandra gère des milliers de demandes (y compris les charges de travail en écriture) par deuxième, par machine, et sa mise à l'échelle des machines d'adding est là depuis le premier jour.
Voici un fil sur l'utilisation de Cassandra dans la production et la production en production dans des dizaines d'entreprises: http://n2.nabble.com/cassandra-users-survey-td4040068.html#a4040068
Nous ajoutons également plus de documents tout le temps, comme http://wiki.apache.org/cassandra/Operations.
Autres conseils
Je pense que les systèmes NOSQL sont un excellent choix si je vous `` soucie '' seulement de la vitesse et du temps de service (et pas ou pas ou moins de choses comme la cohérence et les transactions). Facebook utilise Cassandra.
"Cassandra est utilisée dans Facebook comme système de recherche par e-mail contenant 25 To et plus de 100 m de boîtes aux lettres." http://highscalability.com/product-facebooks-cassandra-massive-distributed-store
Je pense que CouchDB n'est pas vraiment rapide, peut-être que vous pouvez utiliser MongoDB: http://www.mongodb.org/display/docs/production+deployments
Berkeleydb est soutenu par Oracle
En utilisant l'interface C native, on peut atteindre près de 1 million de demandes de lecture par seconde.
Soit dit en passant, lorsque vous dites des milliers de demandes par minute, toute base de données «normale» devrait aussi être en mesure de gérer cela facilement.
Redis vaut la peine d'essayer comme Github utilise redis pour gérer une file d'attente lourde de emplois de fond.
Mon premier instinct serait BerkeleyDB, avec chaque nœud d'application sur un réseau Samba pour faciliter la conformité acide et l'utilisation du réseau. Il arbore également une interface SQLite. Une autre affiche cite Memcachedb qui a également du BDB à l'intérieur.
Une autre option unique serait OrientDB
, a également une interface SQL, de nombreuses fonctionnalités de réseau et de cluster.