هل استخدام Python ل mapreduce لكاساندرا غبية؟
سؤال
نظرًا لأن Cassandra لا يوجد في MapReduce مدمجًا حتى الآن (أعتقد أنه سيأتي في 0.7) ، هل من الغبي أن نحاول أن أحاول MapReduce مع عميل Python الخاص بي أم يجب أن أستخدم Couchdb أو Mongo فقط أو شيء من هذا القبيل؟
التطبيق هو جمع الإحصائيات ، لذلك يجب أن أكون قادرًا على جمع القيم مع التجميع إلى عدادات الزيادة. أنا لست كذلك ، لكنني أدعي أنني أقوم بعمل Google Analytics ، لذا أريد تتبع المتصفحات التي تظهر ، أي صفحات ذهبوا إليها ، وزيارات مقابل Pageviews.
أود فقط تحديث عداداتي على الكتابة ، لكن كاساندرا ليست جيدة جدًا في العدادات أيضًا.
قد لا يكون كاساندرا هو الخيار الصحيح لهذا؟
شكرًا!
المحلول
يدعم Cassandra خريطة تقليل منذ الإصدار 0.6. (الإصدار المستقر الحالي هو 0.5.1 ، ولكن المضي قدما وجرب الخريطة الجديدة تقليل الوظائف في 0.6.0-beta3) للبدء ، أوصي بإلقاء نظرة على خريطة عدد الكلمات تقليل مثال في "Contrib/Word_Count".
نصائح أخرى
لدى MongoDB تحديث في مكانه ، لذلك يجب أن يكون MongoDB جيدًا جدًا مع العدادات. http://blog.mongodb.org/post/171353301/using-mongodb-for-real-time-analytics