与流处理的查询到同一数据集时高效的MapReduce

题

我有一个巨大的，静态的数据集，我已经应用到它的功能。

f是在形式减少（图（F，数据集）），所以我会使用的MapReduce骨架。不过，我不希望在每个请求散射数据（理想我想利用索引，以加速比F）。还有的是，解决这个问题一般情况下，MapReduce的实现？

我已经采取了看看 IterativeMapReduce ，也许它的工作，但似乎解决稍微不同的情况下，以及将码还不可用。

解决方案

Hadoop的MapReduce的（和所有其它的映射简化骨架由谷歌启发）不散射的数据的所有时间。

许可以下： CC-BY-SA 和归因