TechTarget云计算 > 百科词汇

:MapReduce

MapReduce是Apache Hadoop软件框架的核心组件.
Hadoop使弹性、分布式处理的大规模跨商品电脑cluste utructured数据集,每个节点的集群包括自己的存储。MapReduce有两个基本功能:它包裹各种集群中的节点或地图,organizes和reduces and the所致的每项cohesive监察awer node query了.
MapReduce is阁下纵论》中的战略,包括:
JobTracker——主节点管理所有工作和资源在集群
TaskTracke——代理部署到集群中的每台机器运行map和reduce任务
JobHistoryServer——一个组件跟踪完成工作,通常是部署为一个单独的函数或JobTracker
输入数据分发和整理结果,MapReduce运行在大规模并行集群大小。因为集群大小不影响处理工作”的最终结果,工作可以跨越几乎任意数量的服务。因此,MapReduce and the Hadoop overall structure simplify软件发展框架。在若干领域的经验MapReduce签约,包括C、c++、Java、Ruby、Perl and巨蟒。没有项目可以使用MapReduce库来创建任务处理节点之间的沟通和协调。
MapReduce也是容错,与每个节点定期报告其状态主节点。如果一个节点不回应正如预期的那样,主节点re-assig那块工作的其他可用的集群中的节点。这一具体计划中得到体现,最近这次分析和实用MapReduce for inexpeive人们利用商品to赛跑。
MapReduce in action
比如说,可以使用列表和计数每个词具有吸引力的次数在小说作为一个单独的服务器应用程序中,但这是时间coume。相比之下,使用可以将任务在26人,所以每个页面,写一个词在一个单独的纸,当他们“重新完成一个新页面。这是MapReduce的地图方面。如果一个雇农叶子,代替他的另一个雇农。这是MapReduce的容错元素.
当所有页面处理,使用单字原图页面排序成26箱,它代表了每个单词的合适的字母。每个用户需要一盒和堆栈中的每个单词按字母顺序排序。的页面数量相同的词是MapReduce的减少方面的一个例子。

最近更新时间:2017-05-05 EN

相关推荐