Существуют ли какие-либо стабильные хранилища данных nosql производственного качества?

https://stackoverflow.com/questions/1886650

19-09-2019
|

Вопрос

Существуют ли хранилища nosql производственного качества, которые я могу использовать в производственной системе?Я просмотрел cassandra, tokyodb, couchdb и т.д., Но ни один из них, похоже, не готов к развертыванию в производственных средах.Я говорю о тысячах запросов в минуту и множестве операций чтения / записи / обновлений.Меня беспокоит только скорость и время обслуживания.Кто - нибудь знает о производственных системах , которые эффективно используют хранилища nosql?Кто-нибудь знает о магазине nosql, который поддерживается таким крупным предприятием, как Google / Yahoo / IBM?

Решение

Cassandra обрабатывает тысячи запросов (включая рабочие нагрузки, связанные в основном с записью) в второй, на каждую машину, и его масштабирование с помощью добавляющих машин существует с первого дня.

Вот тема об использовании Cassandra в производстве и в ближайшее время в десятках компаний: http://n2.nabble.com/Cassandra-users-survey-td4040068.html#a4040068

Мы также постоянно добавляем новые документы, например http://wiki.apache.org/cassandra/Operations.

Другие советы

Я думаю, что системы NoSQL - отличный выбор, если вы "всего лишь" заботитесь о скорости и времени обслуживания (и ни в коей мере не о таких вещах, как согласованность и транзакции).Facebook использует Cassandra.

"Cassandra используется в Facebook как система поиска по электронной почте, содержащая 25 ТБ и более 100 млн почтовых ящиков". http://highscalability.com/product-facebooks-cassandra-massive-distributed-store

Я думаю, что CouchDB на самом деле не быстрый, может быть, вы можете использовать MongoDB: http://www.mongodb.org/display/DOCS/Production+Deployments

Также стоит рассмотреть возможность использования традиционной СУБД, такой как MySQL, для хранения без схемы.Этот метод обеспечивает стабильность работы проверенного сервера баз данных, такого как MySQL, при гибкости решения NoSQL.

Проверьте это публикация в блоге о том, как Френдфид делает это.

BerkeleyDB поддерживается Oracle

Используя собственный интерфейс C, можно получить около 1 миллиона запросов на чтение в секунду.

Кстати, когда вы говорите о тысячах запросов в минуту, любая "нормальная" база данных тоже должна быть способна легко с этим справиться.

Редис стоит попробовать, как Гитхаб использует redis для управления большой очередью фоновые задания.

Моим первым побуждением была бы BerkeleyDB, где каждый узел приложения находится в сети SAMBA, чтобы облегчить соответствие ACID и использование сети.Он также имеет интерфейс SQLite.Другой плакат ссылается на MemcacheDB, также имеющий BDB внутри.

Другим уникальным вариантом было бы OrientDB, также имеет интерфейс SQL, множество сетевых и кластерных функций.

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow