与流处理的查询到同一数据集时高效的MapReduce
-
18-09-2019 - |
题
我有一个巨大的,静态的数据集,我已经应用到它的功能。
f是在形式减少(图(F,数据集)),所以我会使用的MapReduce骨架。不过,我不希望在每个请求散射数据(理想我想利用索引,以加速比F)。还有的是,解决这个问题一般情况下,MapReduce的实现?
我已经采取了看看 IterativeMapReduce ,也许它的工作,但似乎解决稍微不同的情况下,以及将码还不可用。
解决方案
Hadoop的MapReduce的(和所有其它的映射简化骨架由谷歌启发)不散射的数据的所有时间。
不隶属于 StackOverflow