Является ли использование Python для MapReduce для Cassandra глупым?
Вопрос
Поскольку в Cassandra еще не встроен MapReduce (я думаю, что он выходит в версии 0.7), глупо ли пытаться использовать MapReduce с моим клиентом Python или мне просто использовать CouchDB или Mongo или что-то в этом роде?
Приложение представляет собой сбор статистики, поэтому мне нужно иметь возможность суммировать значения с помощью группировки для увеличения счетчиков.Это не так, но представьте, что я создаю Google analytics, поэтому я хочу отслеживать, какие браузеры появляются, на какие страницы они перешли, и количество посещений в сравнениипросмотры страниц.
Я бы просто атомарно обновил свои счетчики при записи, но Cassandra тоже не очень хороша в счетчиках.
Может, Кассандра просто неподходящий выбор для этого?
Спасибо!
Решение
Cassandra поддерживает сокращение карты начиная с версии 0.6.(Текущая стабильная версия 0.5.1, но продолжайте и попробуйте новую функциональность map reduce в версии 0.6.0-beta3) Для начала я рекомендую взглянуть на пример сокращения карты подсчета слов в 'contrib/word_count'.
Другие советы
MongoDB имеет обновление на месте, поэтому MongoDB должен быть очень хорош со счетчиками. http://blog.mongodb.org/post/171353301/using-mongodb-for-real-time-analytics