我试图找出我怎么能在地图上减少操作的最终结果重复,所以我想一定是某种指数到地图降低的结果?

有帮助吗?

解决方案

有关的Hadoop的MapReduce从减少级的输出是通过键排序的文件。遍历从MapReduce工作在Hadoop中,你要么需要编写你自己的代码来读取这些文件,或使用其他MapReduce工作的结果。这将取决于你想要的结果做什么。

作业将创建的文件类型是可配置的,因此它可能是一个纯文本文件或序列文件。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top