我有一个巨大的,静态的数据集,我已经应用到它的功能。

f是在形式减少(图(F,数据集)),所以我会使用的MapReduce骨架。不过,我不希望在每个请求散射数据(理想我想利用索引,以加速比F)。还有的是,解决这个问题一般情况下,MapReduce的实现?

我已经采取了看看 IterativeMapReduce ,也许它的工作,但似乎解决稍微不同的情况下,以及将码还不可用。

有帮助吗?

解决方案

Hadoop的MapReduce的(和所有其它的映射简化骨架由谷歌启发)不散射的数据的所有时间。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top