TechTarget云计算 > 百科词汇

Hadoop:Hadoop

Hadoop是一个免费的,基于Java的编程框架。它能在分布式计算环境下支持处理大型数据集。Hadoop是由Apache软件基金会赞助开发的Apache项目的一部分。

  Hadoop使用map-reduce编程模式,它可以将一个应用程序分解成许多小部分。这些小部分(也称为碎片或块)可以在集群中的任何节点上运行。Hadoop使应用软件能在有成千上万个节点和数千个太字节的系统中运行。分布式文件系统(DFS)有利于节点间快速的数据传输,并使系统在某个节点运行失败的情况下能不受干扰继续运行。即使相当数量的节点不运行,灾难性系统出故障的风险也很低。

  Hadoop框架的主要参与者包括谷歌,雅虎和IBM公司,它主要用于应用程序,包括搜索引擎和广告。Hadoop首选的操作系统是Windows和Linux,但它也可以在BSD和OSX中运行。Hadoop原来是填充毛绒玩具大象的名字,是由框架创建者的孩子,Doug Cutting,所取。

最近更新时间:2009-05-22 翻译:曾芸芸EN