¿Hay algún almacén de datos NoSQL de calidad estable y de producción estable?

https://stackoverflow.com/questions/1886650

19-09-2019
|

Pregunta

¿Hay tiendas NoSQL de calidad de producción que puedo usar en un sistema de producción? He mirado a Cassandra, Tokyodb, CouchDB, etc., pero ninguno de ellos parece estar listo para despliegues en entornos de producción. Estoy hablando de miles de solicitudes por minuto y muchas lecturas/escrituras/actualizaciones. Mi única preocupación son la velocidad y los tiempos de servicio. ¿Alguien sabe de los sistemas de producción que usan tiendas NoSQL de manera efectiva? ¿Alguien sabe de una tienda NoSQL respaldada por una gran empresa como Google/ Yahoo/ IBM?

Solución

Cassandra maneja miles de solicitudes (incluidas las cargas de trabajo más grandes) por segundo, por máquina, y sus máquinas de escalado por agregado han estado allí desde el día 1.

Aquí hay un hilo sobre el uso de Cassandra en la producción y la producción-soon en docenas de empresas: http://n2.nabble.com/cassandra-users-survey-td4040068.html#a4040068

También estamos agregando más documentos todo el tiempo, como http://wiki.apache.org/cassandra/operations.

Otros consejos

Creo que los sistemas NoSQL son una excelente opción si solo me importa la velocidad y el tiempo de servicio (y no o menos por cosas como la consistencia y las transacciones). Facebook usa Cassandra.

"Cassandra se usa en Facebook como un sistema de búsqueda por correo electrónico que contiene 25TB y más de 100 m buzones". http://highscalability.com/product-facebooks-cassandra-massive-distributedstore

Creo que CouchDB no es realmente rápido, tal vez puedas usar MongoDB: http://www.mongodb.org/display/docs/production+deployments

También vale la pena considerar un RDBMS tradicional como MySQL para almacenar sin esquema. Este método le brinda la estabilidad de un servidor de base de datos probado como MySQL con la flexibilidad de una solución nosql.

Verificar este Publicación de blog sobre cómo Proveedor de amigos Haz esto.

Berkeleydb está respaldado por Oracle

Usando la interfaz C nativa se puede alcanzar cerca de 1 millón de solicitudes de lectura por segundo.

Por cierto, cuando dice miles de solicitudes por minuto, cualquier DB 'normal' también debería poder manejar eso fácilmente.

Rehacer vale la pena intentarlo como Github utiliza Redis para manejar una gran cola de trabajos de fondo.

Mi primer instinto sería BerkeleyDB, con cada nodo de aplicación en una red Samba para facilitar la conformidad ácida y el uso de la red. También tiene una interfaz SQLite. Otro póster cita Memcachedb también con BDB adentro.

Otra opción única sería OrientDB, también tiene una interfaz SQL, muchas funciones de red y clúster.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow