Является ли использование Python для MapReduce для Cassandra глупым?

StackOverflow https://stackoverflow.com/questions/2527173

Вопрос

Поскольку в Cassandra еще не встроен MapReduce (я думаю, что он выходит в версии 0.7), глупо ли пытаться использовать MapReduce с моим клиентом Python или мне просто использовать CouchDB или Mongo или что-то в этом роде?

Приложение представляет собой сбор статистики, поэтому мне нужно иметь возможность суммировать значения с помощью группировки для увеличения счетчиков.Это не так, но представьте, что я создаю Google analytics, поэтому я хочу отслеживать, какие браузеры появляются, на какие страницы они перешли, и количество посещений в сравнениипросмотры страниц.

Я бы просто атомарно обновил свои счетчики при записи, но Cassandra тоже не очень хороша в счетчиках.

Может, Кассандра просто неподходящий выбор для этого?

Спасибо!

Это было полезно?

Решение

Cassandra поддерживает сокращение карты начиная с версии 0.6.(Текущая стабильная версия 0.5.1, но продолжайте и попробуйте новую функциональность map reduce в версии 0.6.0-beta3) Для начала я рекомендую взглянуть на пример сокращения карты подсчета слов в 'contrib/word_count'.

Другие советы

MongoDB имеет обновление на месте, поэтому MongoDB должен быть очень хорош со счетчиками. http://blog.mongodb.org/post/171353301/using-mongodb-for-real-time-analytics

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top