关于Hadoop
资源
Hadoop is the popular open source implementation of MapReduce, a powerful tool designed for deep analysis and transformation of very large data sets. Hadoop enables you to explore complex data, using custom analyses tailored to your information and questions.

Hadoop 是 Apache组织下的一个开源项目,致力于开发一套分布式计算环境下的可靠、可扩展软件。其中包括:

Hadoop Core, 提供了一套分布式文件系统以及支持Map-Reduce的计算框架。

HBase,建立于 Hadoop Core之上提供一个可扩展的数据库系统。

Pig,建立于 Hadoop Core之上为并行计算环境提供了一套数据工作流语言和执行框架。

ZooKeeper,高可用的和可靠的分布式协同(coordination )系统。分布式应用可以使用ZooKeeper存取其关键状态。

最新动态

中国科学院计算技术研究所 网络科学与技术重点实验室