Quelle est la meilleure façon d'expliquer ce qui est Hadoop et Map / Reduce?
Question
Il est très facile d'expliquer NoSQL à la vue de haut niveau - il est essentiellement le stockage « valeur clé ». Bien sûr, avec mille choses mineures et importantes, mais en général, il est juste le stockage des clés de valeur.
Quelle est la meilleure façon d'expliquer Hadoop et Map / Reduce? Peut-être quelques exemples du « monde réel », qui peut être facile de donner un comparer même pour les débutants? Merci!
La solution
J'ai récemment trouvé ce grand article décrivant la carte Réduire:
J'ai été la planification à écrire sur l'algorithme MapReduce de Google pour un peu de temps, mais je ne pouvais pas trouver un bon exemple pratique. Ensuite, nous avons eu un Utilisateurs de présentation Groupe C du Nord-Ouest par Steve Yegge et un suivi discussion et bières, et moi avons eu une peu épiphanie. Steve parlait à propos, entre autres, la construction processus. Et c'est juste un tas de algorithmes qui sont parfaits pour expliquant MapReduce.
Les exemples de code sont en C ++, mais le contenu est vraiment agnostique de la langue.
Autres conseils
Voici un tutoriel sur la carte / réduire en général, expliquant le contexte, les bases et les flux de données. Je trouve qu'il est utile d'expliquer la mise en œuvre App Engine de Google ainsi.