Существуют ли какие-либо стабильные хранилища данных nosql производственного качества?
-
19-09-2019 - |
Вопрос
Существуют ли хранилища nosql производственного качества, которые я могу использовать в производственной системе?Я просмотрел cassandra, tokyodb, couchdb и т.д., Но ни один из них, похоже, не готов к развертыванию в производственных средах.Я говорю о тысячах запросов в минуту и множестве операций чтения / записи / обновлений.Меня беспокоит только скорость и время обслуживания.Кто - нибудь знает о производственных системах , которые эффективно используют хранилища nosql?Кто-нибудь знает о магазине nosql, который поддерживается таким крупным предприятием, как Google / Yahoo / IBM?
Решение
Cassandra обрабатывает тысячи запросов (включая рабочие нагрузки, связанные в основном с записью) в второй, на каждую машину, и его масштабирование с помощью добавляющих машин существует с первого дня.
Вот тема об использовании Cassandra в производстве и в ближайшее время в десятках компаний: http://n2.nabble.com/Cassandra-users-survey-td4040068.html#a4040068
Мы также постоянно добавляем новые документы, например http://wiki.apache.org/cassandra/Operations.
Другие советы
Я думаю, что системы NoSQL - отличный выбор, если вы "всего лишь" заботитесь о скорости и времени обслуживания (и ни в коей мере не о таких вещах, как согласованность и транзакции).Facebook использует Cassandra.
"Cassandra используется в Facebook как система поиска по электронной почте, содержащая 25 ТБ и более 100 млн почтовых ящиков". http://highscalability.com/product-facebooks-cassandra-massive-distributed-store
Я думаю, что CouchDB на самом деле не быстрый, может быть, вы можете использовать MongoDB: http://www.mongodb.org/display/DOCS/Production+Deployments
BerkeleyDB поддерживается Oracle
Используя собственный интерфейс C, можно получить около 1 миллиона запросов на чтение в секунду.
Кстати, когда вы говорите о тысячах запросов в минуту, любая "нормальная" база данных тоже должна быть способна легко с этим справиться.
Редис стоит попробовать, как Гитхаб использует redis для управления большой очередью фоновые задания.
Моим первым побуждением была бы BerkeleyDB, где каждый узел приложения находится в сети SAMBA, чтобы облегчить соответствие ACID и использование сети.Он также имеет интерфейс SQLite.Другой плакат ссылается на MemcacheDB, также имеющий BDB внутри.
Другим уникальным вариантом было бы OrientDB
, также имеет интерфейс SQL, множество сетевых и кластерных функций.