Pregunta

Busco a un almacén de datos con el tiempo constante y parece que puede estar llegando a Riak o Cassandra. Alguien tiene expereinces de un punto de vista sobre esto?

¿Fue útil?

Solución

Como usted probablemente sabe, los dos son arquitectónicamente fuertemente influenciada por Dynamo (eventualmente consistentes, sin puntos únicos de fallo, etc.). Ambos también van más allá de Dynamo en la prestación de un "más rico que pura V K /" modelo de datos - en el caso de Cassandra, proporcionando un modo similar a Bigtable ColumnFamily, en Riak de, una orientada a documentos. He visto a la gente sana eligen ambos.

Creo puntos que favorecen Cassandra incluyen

Los puntos que favorecen Riak incluyen

  • mapa / reducir el apoyo fuera de la caja

/ dev Cassandra, fwiw

Otros consejos

Riak es utilizado por

  • Fundación Mozilla
  • Ask.com patrocinado anuncios
  • Comcast
  • Citigroup
  • Bet365

Creo que ambos pasan la prueba de referencia clientes / usuarios creíbles.

Cassandra parece más maduro, y lo está haciendo actualmente mejor en los puntos de referencia. Riak parece más fácil de añadir un nodo a que el clúster crece.

Para completar: Un buen (probablemente sesgada) comparación entre los dos se puede encontrar en http://docs.basho.com/riak/1.3.2/references/appendices/comparisons/Riak-Compared-to-Cassandra/

El uso y la descarga son diferentes. Es mejor conseguir referencias.

Tal vez una conversación privada podría ser tenido en donde se podían compartir referencias riak en estas empresas? No estoy seguro de cómo obtener este tipo con Cassandra, pero hay una comunidad de empresas que apoyan a Cassandra que se parecen como un buen lugar para comenzar. Ya que estos probablemente haga que los participantes de la comunidad en el desarrollo de Cassandra, puede ser un lugar muy razonable para empezar.

Me gustaría escuchar la respuesta de Riak a los despliegues recientes y grandes, donde los clientes están contentos.

También me gustaría ver el plan de trabajo para cada producto. Cassandra es un poco más fácil de seguir (http://wiki.apache.org/cassandra/) que Riak en mi opinión, como sostiene wiki limitaciones y cosas que probablemente van a cambiar el futuro de Cassandra, pero ninguno de los futuros de contorno bien. Podría entender que la de una comunidad de código abierto ... tal vez ... pero no puedo para un producto del que tengo que pagar.

También sugeriría la investigación de Cloudant, que tiene lo que parece ser una muy buena disposición en capas de las capacidades. También parece que se está haciendo valer las capacidades de la tierra Apache en otro lugar. CouchDB es la plataforma Apache en el que se basa Cloudant. Pero con la indexación Lucene parece que la punta del iceberg cuando se trata de dónde podría ir Cloudant. Creación y gestión de un índice es un proceso muy sistemática, una especie de tubería de datos, que podrían ser escrito usando otros recursos de la comunidad Apache. Y capacidades como la PNL también podrían añadirse a través Lucene indirectamente, o tal vez directamente en lo que se persistido.

Sería agradable ver una hoja de ruta Cloudant propuesto, sobre todo porque el equipo podría mina de las riquezas de la comunidad Apache e integrar este tipo en Cloudant. Tal probablemente existe, ya que es un componente operacional a la modelo de ingresos Cloudant que requerirá que, si no por otra razón.

Otra área de interés ... modelo de precios de Cloudant ... está claro su modelo de ingresos no se basa en el software, sino en todo el servicio. Eso es bastante atractivo, y parece consistente con el ecosistema circundante Cassandra también. No sé si la gente Basho han ganado más de lo suficiente de la comunidad nosql aún ... no ven como de cualquier bullicio en torno a su sitio web o producto.

Me gusta esta página web Cloudant (https://cloudant.com/the-data-layer/). Me sorprendió ver la capacidad de Erlang incrustado ... No sabía CouchDB fue escrito en Erlang ya que parece inusual para mí en la comunidad Apache (mi ignorancia); CouchDB parece ser mayor que otros productos NoSQL Sé que (ahora) a ser escrito en Erlang. Sea cual sea su estrategia, que al menos cuenta de Amazon EC2 y Microsoft Azure como alojamiento socios, lo que indica una apreciación de los mundos de Microsoft y Microsoft - muy importante si reconocer adecuadamente el potencial valor de middleware (más allá de las aplicaciones de caché o tabla hash) que estos tipos de datos tiendas podrían tener.

Por último, aunque no sé bien el tablero, las miradas de orientación de Andy Palmer como que va a ser valiosa. Él puede traer un poco de orientación vis-a-vis los datos estructurados (a través de VoltDB) a un mundo que correcta o incorrectamente pueden ser de marca injustamente como tablas hash KVP de datos no estructurados. se reconoce la necesidad de una estructura y ecosistema circundante nosql "bases de datos" ... esfuerzos testigo de Google con la llave inglesa ... KVP / poca estructura / necesidad de capacidad de búsqueda motivado la inversión de Google en el espacio de la llave inglesa. Mientras que todos puede que no necesitemos algo así como la llave inglesa, que probablemente necesitamos una capacidad de interoperabilidad mejora y sólida gestión "empresa" y en estas bases de datos NoSQL para que sea razonable para incorporarlos en modernas arquitecturas de nube. La estructura necesaria puede venir de la facilidad de la interoperabilidad y la riqueza funcional. También puede venir de nuevas capacidades que la conversión de soporte de datos no estructurados a datos estructurados (por ejemplo, los índices, el uso de la PNL para crear estructurado y analizado sintácticamente representaciones de las cosas en el interior de una burbuja KVP, y un montón de otras cosas que, si se ponen en una hoja de ruta y publicada, podría atraer y crecer una base de usuarios). miradas Cloudant como que tiene una buena oportunidad de éxito ... Voy a echar un vistazo más de cerca ...

Y mira lo que encontré sobre CouchDB ...

CouchDB viene con un conjunto de características, tales como la transformación de documentos en la marcha y las notificaciones de cambios en tiempo real, que hace que el desarrollo de aplicaciones web una brisa. Incluso viene con un fácil uso de la consola de administración web. Lo has adivinado, servidos directamente de CouchDB! Nos importa mucho acerca de la expansión distribuida. CouchDB es altamente disponible y tolerante partición, pero también es consistente con el tiempo. Y nos importa mucho acerca de sus datos. CouchDB tiene un motor de almacenamiento tolerante a fallos que pone la seguridad de sus datos en primer lugar.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top