题
我试图找出我怎么能在地图上减少操作的最终结果重复,所以我想一定是某种指数到地图降低的结果?
解决方案
有关的Hadoop的MapReduce从减少级的输出是通过键排序的文件。遍历从MapReduce工作在Hadoop中,你要么需要编写你自己的代码来读取这些文件,或使用其他MapReduce工作的结果。这将取决于你想要的结果做什么。
作业将创建的文件类型是可配置的,因此它可能是一个纯文本文件或序列文件。
不隶属于 StackOverflow
题
我试图找出我怎么能在地图上减少操作的最终结果重复,所以我想一定是某种指数到地图降低的结果?
解决方案
有关的Hadoop的MapReduce从减少级的输出是通过键排序的文件。遍历从MapReduce工作在Hadoop中,你要么需要编写你自己的代码来读取这些文件,或使用其他MapReduce工作的结果。这将取决于你想要的结果做什么。
作业将创建的文件类型是可配置的,因此它可能是一个纯文本文件或序列文件。